近一个月来,DeepSeek颠覆了科技界。人工智能专家表示,这么说有充分理由的。他们还表示,我们现在可能还只是看到这家中国科技初创公司在AI领域影响力的一个开始。
DeepSeek在1月下旬凭借其R1 AI模型登上了头条新闻。该公司表示,该模型的性能可以与Open AI的o1模型大致相媲美,而成本只是其中的一小部分。随着DeepSeek短暂取代ChatGPT成为Apple App Store的顶级应用,美国科技股暴跌。

这一成就促使美国科技巨头质疑美国在与中国的人工智能竞赛中的地位,以及这些努力背后花费的数十亿美元。虽然美国副总统JD Vance周二在巴黎人工智能行动峰会(Artificial Intelligence Action Summit)上的讲话中没有提到DeepSeek或中国的名字,但他确实强调了美国领导该行业的优先事项。
“美利坚合众国是人工智能的领导者,我们的政府计划保持这种状态,”他说,尽管“美国希望与其他国家合作”。
但这不仅仅是DeepSeek的效率和功能就能引发的震撼效果。专家表示,DeepSeek R1通过推理和“思考”答案以提供高质量结果的方式,以及该公司决定公开其技术的关键部分,也将推动该领域向前发展。
虽然人工智能长期以来一直用于科技产品,但由于ChatGPT和其他生成式AI服务的兴起,它在过去两年中达到了一个爆发点,这些服务重塑了人们的工作、交流和查找信息的方式。它使芯片制造商英伟达(Nvidia)等公司成为华尔街的宠儿,并颠覆了硅谷巨头的轨迹。因此,任何有助于构建更强大、更高效的模型的开发都肯定会受到密切关注。
“这绝对不是炒作,”艾伦人工智能研究所(Allen Institute for Artificial Intelligence)前首席执行官奥伦·埃齐奥尼(Oren Etzioni)说,“但同时,这是一个发展非常快的世界。”
AI的TikTok时刻
技术领导者对DeepSeek的崛起做出了迅速的反应。据 CNBC 报道,谷歌DeepMind首席执行官德米斯·哈萨比斯(Demis Hassabis)称,围绕DeepSeek的炒作“夸大其词”,但也表示其模型“可能是我见过的最好的中国作品”。
Microsoft首席执行官Satya Nadella在公司1月份的季度财报电话会议上表示,DeepSeek有一些“真正的创新”,而苹果首席执行官蒂姆·库克(Tim Cook)在这家iPhone制造商的财报电话会议上表示,推动效率的创新是一件好事。
但人们的关注并不全是积极的。半导体研究公司 SemiAnalysis 对DeepSeek声称的训练成本仅为560万美元的说法表示怀疑。OpenAI告诉英国《金融时报》,它发现有证据表明DeepSeek使用这家美国公司的模型来训练自己的竞争对手。
“我们注意到并审查了DeepSeek可能不恰当地提炼了我们的模型的迹象,并将在我们了解更多时分享信息”,OpenAI发言人在给CNN的评论中说。
据美联社和 ABC新闻报道,两名美国立法者已经呼吁禁止该应用在政府设备上使用。流行的社交媒体应用程序 TikTok 也引起了类似的担忧,它必须出售给美国所有者,否则将面临在美国被禁止的风险。
他们说,“DeepSeek是(大型语言模型)的 TikTok”。
科技界对DeepSeek印象深刻
科技巨头已经在考虑DeepSeek的技术如何影响他们的产品和服务。
“DeepSeek给我们的基本上是技术报告形式的配方,但他们没有给我们透露其他更重要的关键技术信息,”为开发人员提供工具的AI平台Hugging Face的高级研究科学家刘易斯·坦斯托尔(Lewis Tunstall)说。
Tunstall正在以完全开源DeepSeek的R1 模型领导Hugging Face的工作。虽然DeepSeek提供了一篇研究论文和模型的参数,但它没有透露代码或训练数据。
纳德拉在Microsoft的财报电话会议上表示,Windows Copilot+ PC或按照特定规格构建以支持AI模型的PC将能够在本地运行从DeepSeek R1提炼出来的AI模型。
移动芯片制造商高通周二表示,从DeepSeek R1提炼出来的模型在一周内就可以在由其芯片驱动的智能手机和PC上运行。
AI研究人员、学者和开发人员仍在探索DeepSeek对AI发展的意义。
DeepSeek的模型并不是唯一的开源模型,也不是第一个能够在响应之前对答案进行推理的模型。OpenAI去年的o1模型也可以做到这一点。
DeepSeek之所以重要,是因为它可以推理和学习其他模型,而且AI社区可以看到幕后发生的事情。在DeepSeek应用程序中使用R1模型的人还可以看到它在回答问题时的 “思考” 过程。
“你可以看到机器内部的轮子在转动,”高通公司高级副总裁兼技术规划和边缘解决方案总经理Durga Malladi对CNN说。
Tunstall认为,在不久的将来,我们可能会看到一波可以像DeepSeek一样推理的新模型。随着科技巨头竞相构建AI代理,这可能至关重要,硅谷普遍认为这是聊天机器人的下一步发展以及消费者与设备交互的方式——尽管这种转变尚未完全发生。
Grok 3是社交媒体平台X上聊天机器人的下一个迭代,其所有者埃隆·马斯克(Elon Musk)周四在世界政府峰会期间的视频中表示,它将具有“非常强大的推理能力”。
目前,AI社区将继续修补DeepSeek所提供的功能。也就是说,直到下一个突破出现。
“我当然预测,在未来12个月里,它将被其他东西所取代,”马斯克说,“但这是一个非常真实的进步。”