近日,第二届人工智能数学奥林匹克竞赛(AIMO2)结果正式揭晓。英伟达旗下团队NemoSkills凭借14B参数规模的小模型,成功破解34道奥数难题,以显著优势击败包括DeepSeek R1在内的竞争对手,荣登冠军宝座。这一成果不仅展现了小模型在复杂数学推理上的潜力,也为AI解决高难度学术问题提供了新思路。
赛事升级:题目更抗暴力破解,规则更严苛
英伟达团队表现亮眼,小模型实现突破在强约束条件下,英伟达团队NemoSkills提交的14B参数模型表现惊艳,成功解答34道题,远超首届冠军29题的纪录。相比之下,其他参赛模型如DeepSeek R1虽同样实力强劲,但未能突破这一成绩。陶哲轩特别指出,若放宽算力限制或采用更先进模型,成绩可能进一步提升,相关分析将在后续公布。这一结果验证了小模型通过优化训练和算法,同样能在复杂逻辑任务中取得卓越表现。
除了英伟达,还有哪些团队取得了精彩的表现?
清华拿下第二
第二名是来自清华和微软的三人团队,分别是清华大学研究助理教授Foxfi Ning、微软的高级研究员Zinan Lin以及清华学子yiyouyc。
AI奥赛:推动数学与人工智能的深度融合AIMO竞赛的设立初衷是探索AI在高等数学领域的应用边界。与常规编程竞赛不同,其题目需结合数学定理推导、符号运算与创造性思维,例如证明几何定理或求解数论问题。首届竞赛已吸引全球顶尖团队参与,而本届难度升级后,更成为检验AI“真智能”的试金石。组织方表示,未来将继续优化赛题设计,并考虑引入开放式证明题,进一步挑战AI的极限。
行业反响:开源生态与算力效率受关注NemoSkills的夺冠引发业界广泛讨论。一方面,其成功印证了开源模型在专业场景下的竞争力,可能加速相关技术共享;另一方面,小模型的高效表现也为优化算力分配提供了参考。部分专家认为,在特定领域“轻量化”模型或将成为趋势,尤其是在学术研究等资源受限的场景中。
随着官方最终认证的完成,AIMO2的详细技术报告及优胜方案将公开。这场竞赛不仅是一次技术比拼,更标志着AI向深层次认知能力迈进的又一里程碑。