OpenAI发布全新推理模型“o1”，挑战人类智慧极限

在长时间的猜测与期待之后，OpenAI终于推出了其先进推理模型项目Strawberry的生产版本，名为“o1”。此模型不仅拥有一个迷你版本，提供更快更响应式的互动体验，同时牺牲了对更大知识库的利用。

“o1”模型在技术上展现出诸多突破。它是OpenAI推理模型系列的一员，旨在通过类似人类的推断能力，比人类更快地回答关于科学、编程和数学等复杂问题。

在测试中，“o1”成功解答了国际数学奥林匹克竞赛的部分题目，正确率高达83%，远超其前身GPT-4o的13%。在Codeforces在线编程比赛中，“o1”更是达到了89%的高分。此外，“o1”还能应对之前模型无法解决的问题，如比较“9.11”和“9.9”的大小。然而，OpenAI明确表示，此次发布的只是该模型初级功能的预览。

据OpenAI研究主管Jerry Tworek介绍，“o1”采用了全新的优化算法和专门针对它的训练数据集进行训练。通过结合强化学习和“思维链”推理，“o1”据称提供了比其前任更准确的推断结果，并减少了幻觉现象。尽管如此，公司并未宣称已完全解决了幻觉问题。

从今天起，ChatGPT-Plus和Teams订阅者将有机会测试“o1”和“o1-mini”模型。预计下周企业级和教育订阅者将能使用这些新功能。OpenAI表示，“o1-mini”最终也将向免费用户开放，但未具体说明时间表。开发者将注意到，“o1”API的价格相较于GPT-4o显著增加，访问“o1”需要支付每百万输入令牌$15（而GPT-4o为$5），输出令牌则为每百万$60，是4o的四倍。

真正的疑问在于，“o1”是否会将“strawberry”一词中的“R”数量判断为两个或三个。

Post by Tom

玩酷网

OpenAI发布全新推理模型“o1”，挑战人类智慧极限

果粉人工智能