玩酷网

华为犯的是“科技公司都会犯的错”:憋着大招不说,然后突然摊牌。 ​​​2025

华为犯的是“科技公司都会犯的错”:憋着大招不说,然后突然摊牌。

​​​2025年6月30日,华为一声不响把盘古72B混合专家模型挂上了开源平台。参数720亿,推理时却只激活160亿,单卡吞吐最高冲到1528 token/s。这感觉像什么?你买了个三室一厅,但每月只交一居室的电费。

这种“省电模式”设计,明显是针对企业降本需求,用昇腾芯片的优化能力把性价比榨到极致。

而盘古7B的“快思慢想”双模式切换,本质上是用算法智慧弥补参数规模劣势,像学霸考试时先做送分题再啃压轴题,硬是在70亿参数的体格下干翻了90亿参数的对手。

从行业角度看,华为这次开源最狠的不是技术参数,而是生态策略。把核心模型和昇腾推理代码一起开源,等于把自家AI生态的“地基”免费开放。

这种操作和当年安卓开源异曲同工。先用技术普惠吸引开发者,再通过昇腾芯片和云服务变现。

目前盘古72B在中文创作能力上已经冲到开源模型第一,但科学推理分数只有39.6分,暴露出华为在硬核技术领域的短板。不过这反而更显真实,毕竟企业用户要的是垂直场景的实用价值,不是学术榜单的虚名。

这种“精准刀法”背后是华为逆周期研发战略的体现。孟晚舟年初就说过要“压强式投入根技术”,现在看盘古模型就是典型产物,不追求盲目堆参数,而是用架构创新实现错位竞争。

比如分组混合专家模型(MoGE)这种设计,明显是针对中国制造业的碎片化需求,让工厂能用中端服务器跑出高端模型的性能。这种“接地气”的路线,比纯粹炫技更符合当下AI落地难的行业痛点。