国外出现一个明显的变化,一切都发生的太快! 今年1月底,特朗普说:“中国AI大模型的横空出世为美国敲响了警钟。”这番话不难看出,对于美国而言,当时的中国AI只是刚刚被引起重视。 全球最大的AI开源社区HuggingFace更新了最新一期大模型榜单,阿里巴巴最新开源的通义千问3向量模型Qwen3-Embedding直接登顶了榜首,成了当下最受欢迎的开源大模型。 其实,中国AI的崛起早就有迹可循。今年1月,中国初创公司深度求索(DeepSeek)推出的低成本、高效能AI模型R1,就在全球科技界引起了震动。 这个模型以极低的成本实现了与OpenAIo1相当的性能,训练成本连后者的零头都不到。而且,DeepSeek采用开源模式,公布了相关论文,整个过程可复现,这让很多国际机构都纷纷成功复现了该模型,复现成本甚至低至几十美元。 这还不算完,人工智能领域的衍生品,如电力供应商也受到重创。美国联合能源公司股价下跌21%,Vistra的股价下跌29%。CNN、《纽约时报》、《华盛顿邮报》等美国主流媒体纷纷用《中国名为DeepSeek的人工智能技术正在导致美国股市暴跌》、《由于投资者担心中国的AI进展,股市下跌》等标题对DeepSeek“现象级”的崛起进行报道。 紧接着,阿里巴巴也坐不住了。4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3,参数量仅为DeepSeek-R1的三分之一,成本大幅下降。在LiveCodeBench大语言模型评测榜单中,千问3模型性能全面超越R1、OpenAI-o1等全球顶尖模型,登顶全球最强开源模型。 千问3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强,创下了所有国产模型及全球开源模型的性能新高。在奥数水平的AIME25测评中,千问3斩获81.5分,刷新开源纪录;在考察代码能力的LiveCodeBench评测中,千问3突破70分大关,表现甚至超过Grok3;在评估模型人类偏好对齐的ArenaHard测评中,千问3以95.6分超越OpenAI-o1及DeepSeek-R1。 更厉害的是,千问3的部署成本实现了大幅下降,仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。此外,千问3是国内首个“混合推理模型”,将“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,大大节省算力消耗。 到了6月,阿里巴巴再次发力。6月6日,阿里开源通义千问3全新的向量模型系列Qwen3-Embedding。该模型以千问3为底座,专门为文本表征、检索和排序等核心任务进行优化训练,性能较上一版本可提升40%,在MTEB等权威专项榜单中超越了谷歌、OpenAI、微软等公司的顶尖模型。 千问3向量模型系列率先支持超100种语言,并涵盖多种编程语言,可实现强大的多语言、跨语言及代码检索能力。开发者可从中找到最符合需求的模型,自由组合模块,还可自定义向量或指令,实现特定任务、语言和场景的深度优化。 仅仅一个月后,6月11日,HuggingFace更新的榜单就显示,Qwen3-Embedding登顶榜首,成为近期最受欢迎的开源大模型。据了解,千问3开源一个月以来,下载量已突破1250万,广受开发者欢迎。 萨克斯还批评了拜登政府的“人工智能扩散规则”,认为该规则使“扩散”一词被附上了负面含义,而技术扩散本应是件好事。他表示,特朗普政府正起草自己的方案,可能转而与各国单独磋商,以加强美国在全球市场的主导地位,与中国竞争。 不过,美国科技界对政府的政策并不买账。英伟达首席执行官黄仁勋今年5月底表示,无论有没有英伟达芯片,中国都会继续前进。5月8日,OpenAI、超威等4家美国科技企业的高管在美国国会山出席听证会时也发出警告称,出口管制可能让美科技企业在竞争中失去优势。 与此同时,中国在AI开源领域的贡献也越来越大。6月12日,HuggingFace发布的最新AI开源贡献榜显示,阿里通义千问跻身全球第五、中国第一,DeepSeek位列第九,是前十中唯二的非美国机构。这表明中国在开源模型、数据集、开发者关注度、社区活跃度及全球影响力等方面都取得了显著进展。