这个春节,“国产大模型之光”DeepSeek(深度求索)又一次出圈,他们的推理大模型DeepSeek-R1重现了DeepSeek-V3的英姿,用更少的成本、更短的时间,在能力上却实现了比肩OpenAI的推理模型o1。如果说DeepSeek-V3还只是一个偶然,那么DeepSeek-R1就是把偶然变成了必然。
如果说对于DeepSeek的吹捧仅限于中文互联网也就罢了,被视为AI技术领跑者的美国同样也反应巨大。例如特朗普就把DeepSeek称为“a stark wake-up call”,OpenAI则宣称正在调查DeepSeek可能对其模型进行不当“蒸馏”的迹象,Claude母公司Anthropic的创始人Dario Amodei干脆一边论证DeepSeek-R1并不先进,一边呼吁对中国公司禁售AI芯片。
最重磅的消息,则是美国国会提出《2025年美国人工智慧能力与中国脱钩法案》,试图禁止美国人协助中国推动AI,并禁止美国人下载或使用DeepSeek,否则将被定性为犯罪,最高可判处20年监禁及处以100万美元的罚款。《邪不压正》里头的那句经典台词是怎么说的来着,“传说归传说,这可是皇军的官方认证。”
那么,为什么DeepSeek会被“围剿”呢?单纯从技术层面来说,DeepSeek的推理大模型DeepSeek-R1顶多证明了中国AI行业已经从“追赶”到“并跑”。相信用过DeepSeek-R1的朋友会有类似的感受,那就是初次使用时会惊为天人,与ChatGPT习惯于打太极的输出方式截然不同,但随着使用程度的加深,就会很快认识到它的局限性,即逻辑范式单一。
真正改变这个局面的其实是DeepSeek在相关论文中表示,DeepSeek-V3仅用了2048个英伟达H800 GPU,并花费两个月的时间训练完成,训练成本不到600万美元,仅为同性能模型的5%到10%。而在DeepSeek此次出圈之前,海量的算力成本和各路“天才少年”才是AI厂商的标配。
低廉的训练和部署成本无疑才是DeepSeek改变游戏规则的关键,这一点不仅仅体现在DeepSeek-V3的训练成本只有OpenAI GPT-4的1/20,更体现在DeepSeek-R1的API调用价格更是只有OpenAI o1的3%左右。这也是摩根士丹利在相关报告中大幅调低英伟达目标股价的原因,其预测2025年英伟达GB200的出货量会从此前的3万-3.5万大幅下调至2万-2.5万。
要知道,在大年三十,也就是DeepSeek风头最劲的时候,国内海外无数人都高呼同一个词“思科时刻”。思科路由器之于互联网就好比英伟达的GPU之于AI,与如今AI大模型需要英伟达的GPU来提供训练和推理的算力一样,三十年前互联网的普及也使得路由器、交换机等网络设备的需求暴涨。因此也就有了1月28日英伟达股价重挫14%,市值蒸发近5000亿美元。
那么问题就来了,照理说DeepSeek打击的是“卖铲子”的英伟达,可卖力攻击他们的却并非英伟达,而是OpenAI和Anthropic这两大AI独角兽。不仅如此,英伟达更是将DeepSeek-R1接入了自己的NVIDIA NIM平台,微软、AWS也纷纷选择拥抱DeepSeek。
拨开迷雾,在这一轮围绕DeepSeek的舆论风波中,抛开美国政府,上蹿下跳得最厉害的其实是美国的大模型厂商。OpenAI、Anthropic会破防的原因其实很简单,因为被冠以“低成本AI大模型算力范式”的DeepSeek,证明了两者选择的道路未必正确。而OpenAI则一直在强调开发AGI需要更多资金,为此也在努力将自身从非营利组织转变为营利性公司。
如果没有DeepSeek,那么关于如何发展AI大模型、如何实现AGI的解释权,就是掌握在OpenAI和Anthropic手中,而后者也靠着这个“释经权”实现了公司估值的大幅膨胀,所以DeepSeek的存在已经开始妨碍OpenAI、Anthropic的价值。而微软、AWS等云计算平台也陆续回过神来,毕竟DeepSeek的出现对于他们其实是件好事。
此前,微软Azure方面宣布已将DeepSeek-R1正式纳入Azure AI Foundry,成为该企业级AI服务平台的一部分。AWS方面也已宣布,企业和开发者可以在Amazon Bedrock和Amazon SageMaker AI中部署DeepSeek-R1模型。
同样都是搞AI,大厂与独角兽在面对DeepSeek这个搅局者时的态度完全不同,前者固然有反应迟缓的弊病,但他们也是真的家大业大,尽管DeepSeek对现有大模型厂商是利空,可对于云服务提供商来说则是彻彻底底的利好。对于云服务提供商来说,可以通过引入多个模型供应商,避免“将鸡蛋放在同一个篮子里”这个问题,使得客户可以根据成本、场景等需求灵活切换模型。
有了DeepSeek,微软Azure就有了制衡OpenAI的手段,AWS也有Anthropic之外的选项。别看好像美国AI圈如今一幅围剿DeepSeek的架势,但真正出力的不多,暗地里伸出橄榄枝的也不少。