华为犯的是“科技公司都会犯的错”：憋着大招不说，然后突然摊牌。 2025

华为犯的是“科技公司都会犯的错”：憋着大招不说，然后突然摊牌。

2025年6月30日，华为一声不响把盘古72B混合专家模型挂上了开源平台。参数720亿，推理时却只激活160亿，单卡吞吐最高冲到1528 token/s。这感觉像什么？你买了个三室一厅，但每月只交一居室的电费。

这种“省电模式”设计，明显是针对企业降本需求，用昇腾芯片的优化能力把性价比榨到极致。

而盘古7B的“快思慢想”双模式切换，本质上是用算法智慧弥补参数规模劣势，像学霸考试时先做送分题再啃压轴题，硬是在70亿参数的体格下干翻了90亿参数的对手。

从行业角度看，华为这次开源最狠的不是技术参数，而是生态策略。把核心模型和昇腾推理代码一起开源，等于把自家AI生态的“地基”免费开放。

这种操作和当年安卓开源异曲同工。先用技术普惠吸引开发者，再通过昇腾芯片和云服务变现。

目前盘古72B在中文创作能力上已经冲到开源模型第一，但科学推理分数只有39.6分，暴露出华为在硬核技术领域的短板。不过这反而更显真实，毕竟企业用户要的是垂直场景的实用价值，不是学术榜单的虚名。

这种“精准刀法”背后是华为逆周期研发战略的体现。孟晚舟年初就说过要“压强式投入根技术”，现在看盘古模型就是典型产物，不追求盲目堆参数，而是用架构创新实现错位竞争。

比如分组混合专家模型（MoGE）这种设计，明显是针对中国制造业的碎片化需求，让工厂能用中端服务器跑出高端模型的性能。这种“接地气”的路线，比纯粹炫技更符合当下AI落地难的行业痛点。

玩酷网