当OpenAI和阿里还在比拼参数规模时,小米却走了一条与众不同的路。4月30日,小米正式开源其首个专为推理任务设计的大模型XiaomiMiMo,仅用7B参数就在数学推理和代码竞赛中超越了OpenAI的o1-mini和阿里32B规模的QwQ-32B-Preview。这一突破不仅展现了小米在AI领域的实力,更揭示了"参数并非万能"的行业新思考。
XiaomiMiMo在数学推理(AIME24-25)和代码竞赛(LiveCodeBenchv5)两项关键测评中表现出色,以7B的轻量级参数规模,性能超越了OpenAI闭源模型o1-mini和阿里Qwen的32B大模型。更令人惊讶的是,在相同强化学习训练条件下,MiMo-7B的表现甚至优于业界知名的DeepSeek-R1-Distill-7B和Qwen2.5-32B等模型。
这一成就打破了"参数越大性能越强"的传统认知,证明了通过优化训练方法和算法,小规模模型同样可以实现卓越性能。小米的成功不仅为行业提供了新思路,也为资源有限的研究者和企业开辟了一条高效AI发展路径。
MiMo的成功并非偶然,而是预训练和后训练两个阶段多层面创新的结果。在预训练阶段,小米团队重点挖掘富含推理模式的语料,合成了约200Btokens的推理数据,并通过三阶段逐步提升难度的训练策略,累计训练了25Ttokens,为模型打下了坚实的推理基础。
后训练阶段的创新更为关键。小米提出了"TestDifficultyDrivenReward"机制,有效解决了困难算法问题中奖励稀疏的难题;引入"EasyDataRe-Sampling"策略,显著提升了强化学习训练的稳定性;设计的"SeamlessRollout"系统更是将强化学习训练速度提升2.29倍,验证速度提升1.96倍。这些创新共同构成了MiMo高效推理能力的核心支撑。
MiMo的开源只是小米AI战略的冰山一角。据界面新闻报道,小米正在建设万卡级GPU集群,创始人雷军亲自领导这一重大项目。在人才方面,小米也积极引进顶尖AI专家,如DeepSeek-V2的关键开发者罗福莉已加入小米AI实验室,将领导大模型团队发展。
小米的这一系列动作表明,它正从硬件基础设施、核心技术研发到人才储备进行全面布局。正如知情人士所言:"在AI硬件这件事情上,最核心的是手机而不是眼镜,小米在这个领域不all in是不可能的。"MiMo的成功开源,正是小米AI战略迈出的重要一步。
在AI竞赛日趋白热化的今天,小米通过MiMo展示了其独特的技术路线和战略思考。这款7B参数模型超越更大规模竞品的表现,不仅为行业提供了新思路,也标志着中国AI企业在技术创新上的又一突破。随着技术细节的全面开源,MiMo有望成为推理领域的重要参考模型,推动整个AI生态的发展。