英伟达团队斩获AI奥数大赛冠军,14B小模型破解34题力压群雄

AI大模型聚合 2025-04-20 22:42:51

近日,第二届人工智能数学奥林匹克竞赛(AIMO2)结果正式揭晓。英伟达旗下团队NemoSkills凭借14B参数规模的小模型,成功破解34道奥数难题,以显著优势击败包括DeepSeek R1在内的竞争对手,荣登冠军宝座。这一成果不仅展现了小模型在复杂数学推理上的潜力,也为AI解决高难度学术问题提供了新思路。

赛事升级:题目更抗暴力破解,规则更严苛

编辑AIMO2由Kaggle平台主办,知名数学家陶哲轩担任顾问委员会成员。他在社交平台上透露,本届竞赛的50道测试题延续了首届“数值答案”的形式,但在设计上进一步提升了抗暴力破解的难度,要求AI必须通过深度推理而非简单计算得出答案。参赛团队需严格遵守两项核心规则:一是仅能使用开源大模型,二是在固定算力限制内完成解题。这些条件旨在公平评估模型本身的数学能力,而非依赖算力或数据优势。

英伟达团队表现亮眼,小模型实现突破在强约束条件下,英伟达团队NemoSkills提交的14B参数模型表现惊艳,成功解答34道题,远超首届冠军29题的纪录。相比之下,其他参赛模型如DeepSeek R1虽同样实力强劲,但未能突破这一成绩。陶哲轩特别指出,若放宽算力限制或采用更先进模型,成绩可能进一步提升,相关分析将在后续公布。这一结果验证了小模型通过优化训练和算法,同样能在复杂逻辑任务中取得卓越表现。

除了英伟达,还有哪些团队取得了精彩的表现?

清华拿下第二

第二名是来自清华和微软的三人团队,分别是清华大学研究助理教授Foxfi Ning、微软的高级研究员Zinan Lin以及清华学子yiyouyc。

编辑

AI奥赛:推动数学与人工智能的深度融合AIMO竞赛的设立初衷是探索AI在高等数学领域的应用边界。与常规编程竞赛不同,其题目需结合数学定理推导、符号运算与创造性思维,例如证明几何定理或求解数论问题。首届竞赛已吸引全球顶尖团队参与,而本届难度升级后,更成为检验AI“真智能”的试金石。组织方表示,未来将继续优化赛题设计,并考虑引入开放式证明题,进一步挑战AI的极限。

行业反响:开源生态与算力效率受关注NemoSkills的夺冠引发业界广泛讨论。一方面,其成功印证了开源模型在专业场景下的竞争力,可能加速相关技术共享;另一方面,小模型的高效表现也为优化算力分配提供了参考。部分专家认为,在特定领域“轻量化”模型或将成为趋势,尤其是在学术研究等资源受限的场景中。

随着官方最终认证的完成,AIMO2的详细技术报告及优胜方案将公开。这场竞赛不仅是一次技术比拼,更标志着AI向深层次认知能力迈进的又一里程碑。

0 阅读:14