OpenAI发布全新推理模型“o1”,挑战人类智慧极限

果粉人工智能 2024-09-14 03:12:26

在长时间的猜测与期待之后,OpenAI终于推出了其先进推理模型项目Strawberry的生产版本,名为“o1”。此模型不仅拥有一个迷你版本,提供更快更响应式的互动体验,同时牺牲了对更大知识库的利用。

“o1”模型在技术上展现出诸多突破。它是OpenAI推理模型系列的一员,旨在通过类似人类的推断能力,比人类更快地回答关于科学、编程和数学等复杂问题。

在测试中,“o1”成功解答了国际数学奥林匹克竞赛的部分题目,正确率高达83%,远超其前身GPT-4o的13%。在Codeforces在线编程比赛中,“o1”更是达到了89%的高分。此外,“o1”还能应对之前模型无法解决的问题,如比较“9.11”和“9.9”的大小。然而,OpenAI明确表示,此次发布的只是该模型初级功能的预览。

据OpenAI研究主管Jerry Tworek介绍,“o1”采用了全新的优化算法和专门针对它的训练数据集进行训练。通过结合强化学习和“思维链”推理,“o1”据称提供了比其前任更准确的推断结果,并减少了幻觉现象。尽管如此,公司并未宣称已完全解决了幻觉问题。

从今天起,ChatGPT-Plus和Teams订阅者将有机会测试“o1”和“o1-mini”模型。预计下周企业级和教育订阅者将能使用这些新功能。OpenAI表示,“o1-mini”最终也将向免费用户开放,但未具体说明时间表。开发者将注意到,“o1”API的价格相较于GPT-4o显著增加,访问“o1”需要支付每百万输入令牌$15(而GPT-4o为$5),输出令牌则为每百万$60,是4o的四倍。

真正的疑问在于,“o1”是否会将“strawberry”一词中的“R”数量判断为两个或三个。

Post by Tom

0 阅读:6

果粉人工智能

简介:感谢大家的关注