玩酷网

Epoch AI开发的FrontierMath基准测试是受OpenAI资助的。且

2025-01-20 10:39:48 蚁工厂科技

Epoch AI开发的FrontierMath基准测试是受OpenAI资助的。且OpenAI可以访问其数据集。

FrontierMath是Epoch AI联合六十余位全世界的数学家，包括数学教授、IMO命题人、菲尔兹奖获得者共同推出的。包括数百个原创的、格外具有挑战性的数学问题，去年11月推出时六个前沿模型解题成功率都低于2%，后来o3大幅提升到了25%。不过这事爆出后这个成绩要引发争议了。

阅读：0 点赞：0