蛇年伊始,DeepSeek就如平地惊雷引发空前讨论,成为资本市场关注焦点,相关概念股节后表现强劲。DeepSeek不仅在技术上取得了显著突破,还在多个行业展现了巨大应用潜力,吸引一众云厂商、车企、手机企业官宣“接入”DeepSeek。
在此背景下,南方都市报“上岗了!AI”系列沙龙邀请到硅基智能创始人兼CEO司马华鹏,中国科学院科技战略咨询研究院研究员周城雄,以及闪极科技CTO潘欣参加了线上沙龙,针对DeepSeek冲击波可能造成哪些影响,以及DeepSeek是否为中国弯道超车美国重要节点,未来将对哪些行业、哪些职业带来新机遇和新挑战等问题进行了研讨。
打破算力迷信,DeepSeek火出圈
司马华鹏认为,DeepSeek的出圈预示着开源的胜利。“从OpenAI推出ChatGPT至今,你能看到所有公司都在追赶,追赶的方式既有开源也有闭源,这一次DeepSeek的火爆有点像是开源社区下大家一起推动出来的胜利,我觉得它是一种新的组织形态的胜利。”
硅基智能创始人兼CEO司马华鹏。
此前有公开报道曾指出,DeepSeek-V3的训练成本仅为GPT-4的1/20。在此次圆桌讨论中,谈及DeepSeek的出圈,多为嘉宾都提到了其成本效应。司马华鹏提到,在任何科技创新的前期研发中成本都比较高,后期一旦到达一个临界点会启发大量的应用,DeepSeek的横空出世就踏在这一临界点上,今年有望成为大模型大规模落地的节点。同时DeepSeek也戳穿了“唯大力出奇迹”“算力越强模型越好”的行业“成规”。
谈及DeepSeek的破圈因素时,潘欣则认为DeepSeek-R1是GPT-o1出来以后首个专攻模型推理阶段的标杆型开源模型。“你会看到目前关键的开源大模型有几个,包括Meta的LLaMA、阿里的通义千问。但和其他开源大模型不同的是,近期火爆的DeepSeek专攻的领域是模型推理阶段。GPT-o1出来以后,大家的关注重点已经从预训练逐渐往推理阶段转换,在这个转换的过程中,一直都没有一个标杆型的开源模型跑出来,包括LLaMA和通义千问也只是在对标预训练时代最好的成果而已。因此DeepSeek可以看作是新的技术范式下新的标杆型模型,在效果上已经达到了GPT-o1的水平。”
闪极科技CTO潘欣。
面对DeepSeek的爆火,中国科学院科技战略咨询研究院研究员周城雄表示,DeepSeek是算法和算力上的一次关键突破。“计算能力是科技水平的一个重要标志,计算速度越快、计算能力越强,人类的科技水平越高。从国家层面、人类社会层面来说都一样,当你能够处理的信息越多,说明科技水平就越高。”
中国科学院科技战略咨询研究院研究员周城雄。
DeepSeek成本效应促进应用侧爆发
DeepSeek的成本效应会带来哪些影响?司马华鹏认为,企业做大模型落地时一定会去考量模型的投入产出比,比如大家将珍贵的算力交给算法,生产出来的东西卖掉以后能不能覆盖掉最初的投入?此前有很多大模型应用都出现了算力投入大、产出低于投入的亏本情况。此次,DeepSeek让行业成本下降了80%-90%是一次里程碑事件,尽管当中有模型蒸馏带来的成本下降,但其将精力放在推理端而不是预训练端的强化学习上,也启发了不少从业者。
同时司马华鹏还指出,DeepSeek影响行业在算法算力上布局的同时,也加速了行业的开源,比如近期OpenAI就开放了一些免费选项,谷歌也做了不少开源。对于中国企业而言,DeepSeek的成本效应也让很多创业公司看到了希望。“现在卡住我们的不是算法而是算力,如果我们能把国产算力包括创业公司的GPU都能用上的话,那很可能是对美国非常大的一个挑战。”
潘欣认为,DeepSeek此次的应用改进,很明显会带来应用侧的爆发,这种爆发传递到算力侧,全球或也将迎来算力需求的井喷。“可以预想到,当单次推理的token成本降到一定阈值时,很多的应用就可以被解锁。比如一些偏社交类的应用、偏长时间开启的一些应用,像监控摄像头、自动驾驶、机器人等需要长时间推理的应用,都可以通过大幅的基础模型的成本降低来解锁,然后进一步促进AI应用市场的爆发;另外从开源的角度看,DeepSeek开源后大量的下游应用公司没有很好成本去做模型时,它也可以拿到原始的模型参数去做类似李飞飞50美金模型的微调,这也进一步促进应用的爆发。随着应用的爆发,总的对全球的算力需求可能也会增加。就像当年油和煤的开采成本下降了,反而导致总体的煤和油需求的井喷。”
另外周城雄提到,DeepSeek的成本效应具有商业优势,或会促进大规模商业化时代的到来。“其实商业的逻辑就是要成本竞争,我认为价格竞争就是商业竞争的终极逻辑,没有价格优势就不会有商业优势,同样的服务或同样的产品,价格优势就是最大优势,人类的科技进步和商业竞争多次证明了这一点。DeepSeek成本快速下降会导致消费者迅速增加,未来我们可以用极低的价格享受人工智能带来的好处。”
Deepseek让创新回归常识
过去近一个月间,经过媒体广泛报道与挖掘,一种重视创新、采用扁平化架构、采用顶尖人才战略的“Deepseek模式”逐渐呈现在大家面前。此前Deepseek创始人梁文峰在接受媒体采访时曾提到,Deepseek让硅谷惊讶的原因或来自于他们是一家中国公司,以创新贡献者的身份加入硅谷得到游戏中。“过去三十年,我们太强调商业化了,对创新有时候是忽视的。创新不完全是商业驱动的,还需要好奇心和创造欲。而中国企业创新缺的肯定不是资本,而是缺乏信心以及不知道怎么组织高密度的人才实现有效的创新。”
在“Deepseek模式”出圈后,行业重视商业化、轻研发创新的现状会改变吗?周城雄认为,当个别人这样做时可能是不理性的,但当这样做的人出现群体效应时,这可能是一个理性行为。“如果目前的创业环境中,变现比较快、离应用比较近企业才能存活下去,大家就会选择做这个事情。我认为归根结底还是科研生态的问题,目前的生态还有很大的改善和提升空间,改善和提升也还是需要时间,不是说DeepSeek出来后就能快速改变成个生态。”
潘欣表示,DeepSeek包括相关公司的创新将成本降下来、将基础模型开源出来后,为行业内的公司提供了更丰富的土壤和更好的机会。“比如我是做眼镜的,我觉得AI眼镜可能在今年也会有比较大的机会,我们把大模型的推理和智能体以及多模态进行结合。通过每个人平时佩戴的眼镜,能够让AI随时都陪伴在人的身边,随时给人提供辅助,帮助人记录,让每个人都能过目不忘。另外包括在软件开发层面,可能未来我们可以通过智能体AI的方式去构建新的下一代的软件。”
谈及Deepseek的创新,在圆桌中多位嘉宾还是提到了Deepseek能坚持创新,必不可少的是其雄厚资本能力,比如至今还没融资、很早就有几万张H100卡的储备等因素,这些都让Deepseek的续航焦虑得以缓解。但司马华鹏也提到,DeepSeek坚持将钱都应用到研发上,最终做成了这件事,这样的创业团队和氛围会让大家回归创新、创业的常识。
在DeepSeek首先破圈跑出来对标GPT-o1的深度思考模型后,不少人也在质疑为何大厂没有率先做到这件事。
潘欣认为,大厂的组织架构很难将人才和资源完全地聚焦。“AI研发特别是大模型研发是一个偏精英化的研发项目,它不是靠堆人去完成的,而且堆的人越多可能这个事情就做得越慢,它需要少量的核心的人去拍板技术路线和做决策,像OpenAI也是靠很少量的高手去把这个东西做出来。如果要在互联网大厂里去做这种团队的精英化聚焦,可能需要从大厂的各个部门调派过来、经过多个层级的层层决策,很难做到这样的扁平组织化。另外再比如说可能还会有算力的审批,比如大厂里有20个团队都想做AI,那么算力也需要审批和给每个团队分。但你会看到DeepSeek可以直接高效地聚焦资源,比如优先先去做文本类的聚焦,不会把资源分散到语音识别、文生视频等方面。”
司马华鹏提到,大厂的预算和财务模型一定会使它更支持非常大的市场,而那些短期看不到的市场则会被在决策中被放弃。“比如说开源这件事情,不是所有的大厂都愿意去做的。但开源精神现在已经成为中国的大转折点,后续可能会有大量的创业公司脱颖而出。后续也期待大家能继续把中国最先进的东西推到全世界,让全世界都受益于中国崛起所带来的这种知识平权、科技平权。而不是让每一个知识和科技最后都被垄断,让少数公司来实现巨额利润的模式。”
周城雄也认为,大厂到了一定体量后做创新的成本决策和效率都非常低,而小公司拥有“船小好调头”的优势,同时它们会不断生产消灭促进生态往前发展,在这个过程中总会跑出来一些企业。
同时他还提到,DeepSeek的成功并不是其单个公司的成功,而是硅谷式科研金融产业生态模式的成功。“我相信在硅谷有很多类似DeepSeek这样相对小规模低成本、聚焦很多优秀年轻人的公司在做这样的事情。中国未来要诞生更多像DeepSeek这样的公司,在科技金融方面多借鉴硅谷模式可能是一个突破方向。”
是弯道超车美国重要节点吗?谨慎乐观
尽管DeepSeek在近期引起了强烈关注,被不少网友称为“国产之光”,但多位嘉宾在圆桌讨论中皆指出,要说这就是中国弯道超车美国人工智能行业的重要节点,可能还为时尚早。
潘欣提到,在模型的成本上,DeepSeek花的钱比硅谷的公司要少很多,比Google、OpenAI等花的钱是数量级地更少,这背后的原因是,不少硅谷的创业公司可能走在更前沿的探索中。“当你站在全球最前沿的时候,你的前面是没有答案的,所以你需要做海量的实验和试错。现在这部分成本其实是被美国硅谷的公司给覆盖掉的,他们走在前面,这里面可能有相对上百倍甚至上千倍更多的成本的消耗,但大量的实验可能就是无用的,最终才找到某几个可以走的路径。目前,国内的情况是在硅谷大创新基础上做了小创新,这样还把效果做到了比较逼近的程度,应该说,当前的状态是紧跟硅谷一线的水平。”
要做到弯道超车,潘欣认为目前还要解决算力和资本方面的问题。“如果你想超车,你必然要走到前面,走到前面必然要付出更大的算力成本去做很多试错,这样的话就要求能够算力的自主可控和成本下降,这可能还是更大的一个卡脖子的点;另外在资本上,其实前沿技术比如AI现在还是一种‘大力出奇迹’的情况,在资本的加持下去做创新和实验还是不可或缺的。”
司马华鹏认为,目前中美在人工智能领域中并不是互相赶超,而是一种齐头并进,这对于整个世界领域来讲,是一种良性竞争。他还提到,未来真正的竞争并不发生在中美之间,而有可能出现在硅基生命与碳基生命之间。“我觉得真正人类的威胁最后是硅基生命的威胁。未来真正的AI造出来会对人类造成什么影响?大家也看过美国好莱坞有像《黑客帝国》这样的电影,包括很多这些机器人造反的电影。未来AI实现自我进化和自我意识以后,对我们人类而言不再是带来简单的文化影响,而是一种新的文明的影响,比如今天DeepSeek让人震撼的是它回答的时候带有非常多人格化的特征,就像是你周围一个非常聪明的朋友。”
周城雄提到,DeepSeek进一步提升了人类信息处理能力,并不意味着中国就能一直处于领先地位。“人类社会知识在不断迭代,计算能力也肯定不断进步的。就像我们算乘法除法的算式,人类可能用了几十年或者说上百年,要是没有算盘出现、没有计算激活,我们的计算方法还是处在列竖式的水平。但你不可能用一次的进步一直处于领先地位,目前DeepSeek的算法是先进,但在开源的情况下,新算法的出现速度可能也会快很多。”
开发AI的程序员可能最先被取代
司马华鹏认为,大模型或者人工智能产业的核心是知识传递,医疗、教育、金融、咨询等以知识传递为核心的行业可能会受到很大的冲击,它们在知识的不对称上变成了被冲破的堡垒。“我们说工业革命是让普通女性能穿上女王才有的丝袜,今天大模型的革命是让每个人拥有服务,比如以前领导才有人帮忙写稿子,今天我有了AI私人助理;以前有钱人才有私人健康顾问,现在我也有AI帮我做这件事。”
潘欣认为,像DeepSeek-R1、GPT-o1这样的思考推理能力更强的AI出来后,偏思考相关、重逻辑推理的行业会首先受到冲击。“其中最典型的应该是开发这些东西的程序员,我们会真切地感受到,三五年前需要十个人开发的项目,今天可能一两个人就能够解决了,这个感受还会进一步加强,也可能延伸到相关行业,比如AI之前只能帮大家润色文章,现在已经可以帮人写研报了,思考推理模型可以不断从网上搜素资料、调研分析、进一步搜索、进一步迭代,所以文字岗位也会有很大的风险。”
周城雄认为,像DeepSeek这样的AI大模型产品,主要是基于编码化知识的基础上形成的,最容易替代的是对显性知识进行组合或搬运的工作者,目前一些隐性知识的工作者还比较难被替代。另外依靠高强度高密度计算思考的科研工作者也会受到影响。
同时多位嘉宾还提到,新的工作机会也会出现。周城雄表示,更多来自服务业的机会或将被催生。“未来人们需要劳动动脑的时间少了,可能需要享受服务的时间也会增加,服务业的需求也许也会更多。就像在前几次工业革命之后,发达国家实现了工业化、自动化后,服务业占GDP的比重会上升。”
司马华鹏也坚信,DeepSeek这样的模型出现后会进一步促进信息平权。“其实我们去年到今年做了非常多专家模型,像经济学家任泽平被我们用大模型学习出来,他的私有知识也授权被我们训练成一个模型,你可以实现随时跟任泽平博士实时地视频聊天或对话,这就是一种知识平权,就算是来自孟加拉国偏远地区的孩子,都可以通过AI和学者、经济学家交流。而DeepSeek又加剧了这件事情,因为它的整个表达能力、推理能力和逻辑能力都使得这件事被进一步加深了。”
潘欣提到,AI本质上是提高整个社会化的生产力,当整个社会的生产力提高了,很多好的商品服务也会变得更廉价便宜。另外,一些人和人交互的有温度的服务其实很难被取代。“过年期间我出去旅游,很明显地感觉其实很多旅游服务业,它其实不是那么好被AI取代的,比如说我去出海去一个海岛玩,然后我的导游的服务等。在职业选择上,可能下一代人跟我们这一代人会有很大的不同,可能没有那么多的工作需要去做一些思考逻辑推理了,但还是有更多机会在其他行业和赛道上涌现。”
策划/统筹:甄芹
执行:南都记者 林文琪 田爱丽
主持人:南都政商数据新闻部记者 林文琪
直播统筹:陈蓓蕾
导播:阮增豪
设计:尹洁琳
下一篇:假如诸葛亮来到和氏