奥特曼在中国春节期间,感受到了极大压力。
外国好学生,终于在中国学霸的战斗力前,有了“战五渣”之感。
宛如怪兽一般的学习能力,奥特曼出现了“这道题我不会做”之感。
这两天,中国人工智能初创公司深度求索(DeepSeek)成为全球科技圈热议的主角。
就在刚刚过去的24小时内,DeepSeek AI智能助手同时登顶中美iOS免费应用排行榜第一,刷爆国内外社交平台,应用更是多次被“挤”到宕机。
就在昨日(1月28日除夕)凌晨,DeepSeek在GitHub平台发布了Janus-Pro多模态大模型,进军文生图领域。
这简直就是让全球互联网科技圈一起过上中国年。
前谷歌首席执行官埃里克·施密特在28日的文章里说:DeepSeek的崛起标志着全球人工智能竞赛的“转折点”,证明中国可以用更少的资源与大型科技公司竞争。
同日,OpenAI首席执行官山姆·奥特曼在社交平台X上表示,DeepSeek“令人印象深刻”,尤其是考虑到以这个价格提供的功能。
他表示OpenAI“当然会推出更好的模型”,有新的竞争对手也确实令人振奋。
山姆·奥特曼同时也是“ChatGPT之父”。
美国媒体报道称,这是人工智能领域的一场“地震”,“从华盛顿到华尔街再到硅谷都感受到了震动”。
美国总统特朗普则称DeepSeek的出现“给美国相关产业敲响了警钟”。
震荡也一度惊呆了股市。
27日,据外媒报道,道琼斯市场数据显示,当地时间周一的“市场大屠杀”总共使股市市值蒸发了约1万亿美元。
其中,欧美科技股重挫。AI龙头英伟达暴跌16.97%,单日市值蒸发5890亿美元,创史上最大单日个股市值蒸发纪录。
DeepSeek可谓是用最少的钱,干最多的事。
其推出的模型,在性能上和世界目前顶尖的GPT-4o等大模型不相上下。
但在成本上,OpenAI训练ChatGPT-4花费的成本高达7800万美元,还可能达到1亿美元。
而DeepSeek大模型训练成本不到600万美元,仅为同性能模型的5%到10%。
新模型训练方法大幅度降低了大模型行业的入局门槛,大规模预训练不再是科技巨头的专利。
DeepSeek由梁文峰于2023年5月创立,他曾领导中国对冲基金幻方(High-Flyer Quant)。
由于幻方完全承销了DeepSeek,这家初创公司可以自由地进行雄心勃勃的AI研究,而不会受到产生短期回报的压力。
DeepSeek位于中国杭州,聚集了一支由中国大学顶尖毕业生组成的年轻团队,强调强大的技术技能而非传统的工作经验。
从第一天起,DeepSeek就以两个核心目标为导向:以透明、开源的方式推动通用人工智能(AGI);通过激进的定价和成本效益高的技术,使先进的AI更容易获得。
据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。
尤其是在,在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。
这群杭州小伙,凭什么击败奥特曼,震撼全世界?
对此,时代周报记者庞宇和书乐进行了一番交流,本猴以为:
好学生和学霸的鸿沟,才是这一波人工智能震撼中的关键。
在仅有极少标注数据的情况下,极大提升了模型推理能力,这就是学霸的学习方法。
这就相当于是说,它(DeepSeek-R1)生成的内容不仅仅依靠已经标注给它的数据,而是它可以根据标注内容去思考、反向标注更多的东西。
DeepSeek实际上提供了一个思路,就是人工智能如何完成从“好学生”到“学霸”的突破。
我们之前的人工智能就像一个“好学生”,通过深度学习,对资料进行反复的消化吸收,然后生成答案。
这些资料就相当于是课本,好学生一旦遇到课本之外的超纲题就不会做了。
而DeepSeek就像掌握了课本里方法论的“学霸”,能够举一反三,通过学习课外读物,扩大知识面,而这些课外读物不一定是标注好的。
DeepSeek的成功起到示范作用,它证明了AI初创公司确实能够在大模型上打破大厂垄断的局面,甚至超越国内外巨头。
这才是最刺激人心的东西,所以导致了科技股的震荡。
作者 张书乐,人民网、人民邮电报专栏作者,中经传媒智库专家,资深产业评论人