玩酷网

Epoch AI开发的FrontierMath基准测试是受OpenAI资助的。且

Epoch AI开发的FrontierMath基准测试是受OpenAI资助的。且OpenAI可以访问其数据集。

FrontierMath是Epoch AI联合六十余位全世界的数学家,包括数学教授、IMO命题人、菲尔兹奖获得者共同推出的。包括数百个原创的、格外具有挑战性的数学问题,去年11月推出时六个前沿模型解题成功率都低于2%,后来o3大幅提升到了25%。不过这事爆出后这个成绩要引发争议了。