春节击败奥特曼，杭州学霸凭啥震撼全球

奥特曼在中国春节期间，感受到了极大压力。

外国好学生，终于在中国学霸的战斗力前，有了“战五渣”之感。

宛如怪兽一般的学习能力，奥特曼出现了“这道题我不会做”之感。

这两天，中国人工智能初创公司深度求索（DeepSeek）成为全球科技圈热议的主角。

就在刚刚过去的24小时内，DeepSeek AI智能助手同时登顶中美iOS免费应用排行榜第一，刷爆国内外社交平台，应用更是多次被“挤”到宕机。

就在昨日(1月28日除夕)凌晨，DeepSeek在GitHub平台发布了Janus-Pro多模态大模型，进军文生图领域。

这简直就是让全球互联网科技圈一起过上中国年。

前谷歌首席执行官埃里克·施密特在28日的文章里说：DeepSeek的崛起标志着全球人工智能竞赛的“转折点”，证明中国可以用更少的资源与大型科技公司竞争。

同日，OpenAI首席执行官山姆·奥特曼在社交平台X上表示，DeepSeek“令人印象深刻”，尤其是考虑到以这个价格提供的功能。

他表示OpenAI“当然会推出更好的模型”，有新的竞争对手也确实令人振奋。

山姆·奥特曼同时也是“ChatGPT之父”。

美国媒体报道称，这是人工智能领域的一场“地震”，“从华盛顿到华尔街再到硅谷都感受到了震动”。

美国总统特朗普则称DeepSeek的出现“给美国相关产业敲响了警钟”。

震荡也一度惊呆了股市。

27日，据外媒报道，道琼斯市场数据显示，当地时间周一的“市场大屠杀”总共使股市市值蒸发了约1万亿美元。

其中，欧美科技股重挫。AI龙头英伟达暴跌16.97%，单日市值蒸发5890亿美元，创史上最大单日个股市值蒸发纪录。

DeepSeek可谓是用最少的钱，干最多的事。

其推出的模型，在性能上和世界目前顶尖的GPT-4o等大模型不相上下。

但在成本上，OpenAI训练ChatGPT-4花费的成本高达7800万美元，还可能达到1亿美元。

而DeepSeek大模型训练成本不到600万美元，仅为同性能模型的5%到10%。

新模型训练方法大幅度降低了大模型行业的入局门槛，大规模预训练不再是科技巨头的专利。

DeepSeek由梁文峰于2023年5月创立，他曾领导中国对冲基金幻方（High-Flyer Quant）。

由于幻方完全承销了DeepSeek，这家初创公司可以自由地进行雄心勃勃的AI研究，而不会受到产生短期回报的压力。

DeepSeek位于中国杭州，聚集了一支由中国大学顶尖毕业生组成的年轻团队，强调强大的技术技能而非传统的工作经验。

从第一天起，DeepSeek就以两个核心目标为导向：以透明、开源的方式推动通用人工智能（AGI）；通过激进的定价和成本效益高的技术，使先进的AI更容易获得。

据DeepSeek介绍，其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。

尤其是在，在数学、代码、自然语言推理等任务上，性能比肩OpenAI o1正式版。

这群杭州小伙，凭什么击败奥特曼，震撼全世界？

对此，时代周报记者庞宇和书乐进行了一番交流，本猴以为：

好学生和学霸的鸿沟，才是这一波人工智能震撼中的关键。

在仅有极少标注数据的情况下，极大提升了模型推理能力，这就是学霸的学习方法。

这就相当于是说，它（DeepSeek-R1）生成的内容不仅仅依靠已经标注给它的数据，而是它可以根据标注内容去思考、反向标注更多的东西。

DeepSeek实际上提供了一个思路，就是人工智能如何完成从“好学生”到“学霸”的突破。

我们之前的人工智能就像一个“好学生”，通过深度学习，对资料进行反复的消化吸收，然后生成答案。

这些资料就相当于是课本，好学生一旦遇到课本之外的超纲题就不会做了。

而DeepSeek就像掌握了课本里方法论的“学霸”，能够举一反三，通过学习课外读物，扩大知识面，而这些课外读物不一定是标注好的。

DeepSeek的成功起到示范作用，它证明了AI初创公司确实能够在大模型上打破大厂垄断的局面，甚至超越国内外巨头。

这才是最刺激人心的东西，所以导致了科技股的震荡。

作者张书乐，人民网、人民邮电报专栏作者，中经传媒智库专家，资深产业评论人

玩酷网