(财富)美国创新,中国迭代。这句格言——或者不那么恭维的版本“中国模仿”——在关于世界第一大和第二大经济体相对实力的众多讨论中占据主导地位。这种说法认为,美国处于技术前沿,创造出引领世界经济进程的突破性产品和服务。中国吸收了这些想法,并在此基础上进行改进,推出了更便宜——甚至可能更差的版本。
在人工智能领域,多年来,这种陈词滥调似乎都是事实,因为中国公司一直在努力跟上资金雄厚、人才济济的美国科技巨头。但今年 1 月,一家中国初创公司打破了这种说法。
总部位于杭州的DeepSeek严格来说甚至不算是一家科技公司,而是 High-Flyer 对冲基金的一个分支。该公司发布了 R1,这是一种“推理”大型语言模型 (LLM),其性能堪比几个月前刚刚发布的 OpenAI o1。R1 不仅看似横空出世,而且创新性十足,成本低得惊人。DeepSeek 称,其前身 V3 的最后一次“训练运行”仅花费了 600 万美元——用特斯拉前 AI 科学家 Andrej Karpathy 的话来说,“预算简直是笑话”,而一些美国竞争对手则花费了数千万甚至数亿美元。
一消息的影响是巨大的:随着 R1 飙升至最受欢迎下载榜首,大型科技投资者陷入恐慌,Nvidia 和 Microsoft 等科技股市值蒸发超过 1 万亿美元。OpenAI 首席执行官 Sam Altman 等领导者在公开场合苦恼不已,并考虑转向开源—就像 DeepSeek 所做的那样,使其模型公开可用且可修改,从而降低使用成本。
乔治华盛顿大学政治学助理教授、ChinAI 新闻通讯作者 Jeffrey丁表示:“包括我在内的很多人都误解了中国开发这些尖端突破的能力。”
美国的不安与中国的喜悦形成鲜明对比。DeepSeek 创始人梁文峰在2 月份与阿里巴巴创始人马云和华为创始人任正非等知名人士一起出席座谈会。电动汽车制造商比亚迪和家电制造商美的等中国主要公司正争相将 DeepSeek 的模式融入自己的产品中。
这给悲观情绪笼罩的中国带来了一丝乐观。“DeepSeek 可以独自以政府永远无法想象的方式推动经济发展,”咨询公司 DGA–Albright Stonebridge Group 的技术政策主管 Paul Triolo 表示。
但 DeepSeek 只是中国蓬勃发展的人工智能领域的一家参与者,而许多美国首席执行官对此却浑然不知。阿里巴巴和字节跳动(TikTok 的母公司)等大型科技公司正在发布在推理基准上击败西方产品的人工智能模型。而新一波规模较小的“人工智能龙”正在通过移动应用程序、人工智能代理和机器人将中国廉价高效的人工智能应用于现实世界。
与此同时,投资者纷纷涌入中国科技股。追踪在香港上市的科技公司的恒生科技指数今年迄今已上涨 35%,领涨的股票包括阿里巴巴、创造了文本转视频 AI 模型 Kling 的快手,以及帮助华为生产 AI 芯片的中国“国家冠军”芯片制造商中芯国际。
尽管投资者对 DeepSeek 的到来感到吃惊,但长期观察中国经济的人士却并不感到惊讶。人工智能可能成为众多行业中最新的一个,在这些行业中,作为“快速跟随者”帮助中国实现了平局,甚至占据主导地位。中国的太阳能电池板和风力涡轮机已经为世界向可再生能源的转型提供了动力。中国的电动汽车帮助中国成为世界上最大的汽车出口国——甚至非中国的电动汽车也由中国的电池驱动。而在无人机、机器人和生物技术等领域,中国公司也处于全球领先地位。
一些西方首席执行官对这些成就不屑一顾,将其归咎于政府补贴、知识产权盗窃、走私和违反出口管制。但事实证明,让中国在各种技术竞赛中保持领先地位的因素既持久又强大:庞大的制造业基础;模仿外国竞争对手的热情;人才济济;以及能够充当支持者和啦啦队的政府。
《新中国策略》一书的作者、经济学家金刻羽认为,中国的创新者可能更注重“量身定制的解决问题方法”,而不是美国的“突破性、系统性思维”。但这种有针对性的“足够好”的创新方式使中国能够大规模生产价格合理的技术,即使像 DeepSeek 这样接近前沿的技术。当西方商界领袖担心如何为人工智能的发展买单时,中国可能很快就会出售世界其他国家想要的东西。
——快速反弹
就在两年前,中国似乎注定要在人工智能领域远远落后。2020 年,北京开始大规模遏制中国科技行业,一些人认为该行业既过于强大,又过于不负责任。随着北京对数据隐私实施更严格的规定,曾经稳定的中国科技 IPO 潮也逐渐枯竭。
OpenAI 于 2022 年推出的 ChatGPT 使人工智能差距更加明显。随后发布的中国制造的LLMs通常表现不如 ChatGPT——即使在使用中文的情况下也是如此。与此同时,美国的出口管制阻止了中国公司收购 Nvidia 的人工智能芯片,而这些芯片是培训和运行LLMs的关键。
丁指出,2024 年秋季将是叙事发生转变的时候。“你开始看到差距缩小,”他说,特别是在开源领域,“中国公司开始优化可以更有效地训练的小型模型。”
与此同时,中国的人工智能领域也孵化出一批新的创业公司。首先是“小龙”,即SenseTime和 Megvii 等机器学习和计算机视觉公司,它们引起了全球关注。当人们的注意力转向生成式人工智能时,注意力又转移到“人工智能老虎”——百川、Moonshot、MiniMax 和智普。现在,它们被最新的“小龙”所掩盖:六家总部位于杭州的创业公司,包括 DeepSeek。
阿里巴巴的总部所在地杭州是中国人工智能创新的温床。人工智能咨询公司 Proem 的创始人 Grace Shao 解释说:“杭州的优势在于远离北京,可以避免各种官僚程序;靠近上海,可以接触到国际资本和人才;而且得益于阿里巴巴、网易等公司,杭州的人才库非常强大。”阿里巴巴本身也是开源创造者的推动者:在开源人工智能社区 Hugging Face 上,排名前 10 的LLMs都是在阿里巴巴的“统一金钱”模型上进行训练的。
这些备受关注的新创公司包括宇树科技,该公司的跳舞机器人在今年的春节联欢晚会上表演,吸引了数亿中国观众观看;游戏科学工作室 (Game Science) 开发的《黑神话:悟空》是 2024 年最畅销的电子游戏之一;以及专注于 3D 渲染的“空间智能”公司 Manycore。
中国的人工智能行业为何能如此迅速地赶上?原因之一是中国真的很大。邵指出,当无处不在的微信平台运营商腾讯向其超过 10 亿用户提供 DeepSeek 的法学硕士学位时,DeepSeek 的用户群实现了重大飞跃——并立即使这家初创公司成为中国人工智能领域最知名的公司之一。
政府在决定如何利用这种规模方面发挥着关键作用。通过政策、法规和补贴,全国各地的官员创造了一个“国家协调”的创新体系,而私营部门往往会支持该体系的优先事项。特里奥洛说,政府扮演着“啦啦队”的角色。”实上,2 月份的那场高层会议引发了中国对 DeepSeek 的炒作:首先,中国电信公司接受并推广其LLMs,然后科技和消费公司也纷纷效仿,最后是地方官员。
讽刺的是,美国对半导体的出口管制可能加速了中国的创新。梁去年对中国媒体说:“钱从来都不是问题,问题在于对先进芯片的出口禁令。”多年来,中国芯片行业一直难以起步,因为制造商可以从海外购买更好的芯片。但经济学家金立表示,美国的贸易限制“动员了整个国家去追求尖端技术”。
电信巨头华为目前处于中国先进芯片供应链的最前沿。其 Ascend AI 芯片(尽管仍不如 Nvidia 的芯片强大)已被 DeepSeek 等初创公司用于“推理”,即在训练后的 AI 模型中在现实环境中运行。
最后一个要素是人才:中国的大学正在培养充满热情的工程师,人工智能初创公司可以利用这些工程师。虽然一些 DeepSeek 工程师受过西方教育,但 Triolo 指出,“梁文峰走出去招募了这些顶尖人才——没有西方经验、没有在麻省理工学院和斯坦福大学接受过培训的年轻人。”他补充说,首席执行官们“对中国二、三、四线大学培养的人才的素质感到震惊。在美国大学里,你找不到这么多这样的人才。”
一些观察人士还发现,中国“90后”创始人的态度发生了巨大变化。邵教授指出,老一辈的科技创始人认为“抄袭是可以的,但要做得更好”。“现在(企业家们)认为开源是一种哲学选择。中国可以创新,而不仅仅是抄袭。”
——需要清除的障碍
尽管 DeepSeek 的成功具有颠覆性,但它并不一定预示着中国将在人工智能领域取得目前在太阳能电池板或电动汽车等领域的主导地位。
除其他障碍外,中国科技初创公司缺乏资本化机会,无法为美国同行提供大量资金和明确的退出策略。2020 年代初中国本已低迷的风险投资领域几乎完全停滞。中国本土的风险投资公司很少,随着与美国的地缘政治紧张局势加剧,外国风险投资者纷纷撤出。值得注意的是,DeepSeek 没有风险投资支持,而是依靠其对冲基金母公司的雄厚资金。
中国证券交易所对未盈利的初创企业持悲观看法。有一段时间,中国的初创企业前往纽约进行 IPO,但华盛顿和北京的审查阻碍了这种流动。“资本市场太不发达、不成熟和缺乏流动性了,”特里奥洛说。“这是一个大问题。它让北京的人彻夜难眠。”
在三月份召开的两会上,北京公布了今年的经济重点,中国表示将启动“国家风险投资引导基金”,调动 1 万亿元人民币(1,380 亿美元)用于“硬科技”——这默认了私营部门需要政府的支持。
但正如 DeepSeek 的成就所表明的那样,中国人工智能初创公司可能不需要巨额资金就能在全球具有竞争力。中国官员现在支持相对廉价的人工智能模型开源开发,以鼓励更广泛地采用中国制造的技术。阿里巴巴等公司认为,开源模型将鼓励更多客户使用他们的生态系统。
在特朗普政府日益推崇保护主义的背景下,新兴的人工智能模型可能不会在美国得到广泛采用。但它们可能会赢得世界其他地区的客户。DeepSeek 对效率和开放性的关注可能比昂贵的 OpenAI 式专有技术更适合新兴市场,因为新兴市场需要独创性,但缺乏计算能力和资本。
中国公司已经展示了他们能够通过廉价但可靠的太阳能电池板、廉价电动汽车和廉价手机在国外市场取得的巨大进展。如果像 DeepSeek 和阿里巴巴这样的公司能够继续降低对最昂贵计算能力的需求,那么所谓的全球南方国家很可能会放弃世界上最好的人工智能,转而选择他们能负担得起的最好的人工智能。
