北京时间6月13日,2024阿里巴巴全球数学竞赛(简称“阿里数赛”)公布决赛名单,801人成功晋级,AI队伍未能达到决赛入围分数线,无缘最终角逐。
今年阿里数赛首创AI挑战赛,吸引了来自全球知名高校院所与企业的563支队伍报名,其中00后占比超50%。他们各显神通,使用模型调优、AI Agent、提示词工程等多种方式,试图推动AI构建更强大的数学能力。统计显示,参赛AI队伍的平均分已达到了人类选手平均水平,但离数学高手仍有较大差距。AI最高分仅为34分,无缘决赛。AI挑战赛前三名分别为来自上海建平中学的涂津豪、西南交通大学的特工宇宙团队、中国人民大学的SuperCarryMan团队。
据介绍,AI成绩不佳,核心还是由于基础模型的数学能力有限。虽然在面对解答题和证明题时,AI可以通过知识检索等方式拿到基础分,但一旦涉及到后续的深入分析,AI就开始出现“知识幻觉”。尤其是在面临选择题时,多数AI出现了“蒙题”的现象。不过,也有案例显示,提示词工程确实能够在一定幅度内提升AI的数学潜能,有选手请AI扮演一名数学竞赛大师,并许诺“想出更好回答奖励30万美元”,经比对验证,该方法可提高20%的得分率。阿里数赛组委会成员、达摩院决策智能实验室负责人印卧涛表示,“数学是人类智慧的皇冠,AI挑战赛是一项积极的尝试,有助于我们持续突破AI的能力上限,带来更多可能。”
公告显示,今年共有801名人类选手挺进决赛,遍布全球17个国家与地区,平均年龄22岁,主要来自北大、清华、麻省理工、剑桥等知名高校。江苏省涟水中等专业学校的17岁女生姜萍表现亮眼,从一众名校生中突围,拿到了93分的好成绩,全球排名12,是阿里数赛举办以来首位打进决赛的中专在读生。她专业是服装设计,对数学却十分着迷,花了两年自学偏微分方程,预选赛的两天里除了吃饭、睡觉都在答题,只为证明“女生学数学也可以挺棒的”。
全民参与是该项赛事一大特色,今年超过95%的大众选手止步预选赛,但不妨碍尽享答题过程的乐趣。他们来自千行百业,如监狱警察、医生、快递小哥等,每天为不同工作而奔波,都将数学视为心中的秘密花园。95后河南监狱警察吕致远连续三届参赛,他尝试把数学应用于工作中,比如给监狱报纸设计数学益智题,供服刑人员解谜,还定期举办数学兴趣班。他希望服刑人员即使最后没爱上数学,也更愿意相信思考的力量。
据悉,今年阿里数赛的决赛将于北京时间6月22日(周六)0:00至24:00举行,选手可在周期内选择任意连续的8小时作答,获奖者最终将分享400多万元奖金。由阿里巴巴公益、达摩院举办的阿里巴巴全球数学竞赛,以不设报名门槛、趣味十足著称,已连续举办六届,正持续激发全社会对于数学的热情。
附官网决赛入围名单链接:
https://damo.alibaba.com/events/32024060617176459249878092