继本月初正式推出全新推理模型o3-mini后,日前OpenAI方面宣布面向所有用户更新o3-mini的思维链(CoT),并为付费用户更新o3-mini-high思维链,从而更透明、详细地展示模型的推理步骤以及所得出答案的方式。此前,OpenAI没有完全公开o3-mini及其前身(o1和o1-mini)的推理步骤,仅向用户提供推理摘要,甚至这些摘要有时并不准确。
![](http://image.uc.cn/s/wemedia/s/upload/2024/07ffaf564f26adafbb46592a3bdd142b.jpg)
在官方展示的例子中,当被问及“为什么今天(当地时间2025年2月6日)不是星期五”时,o3-mini首先判断出这是一个幽默的提问,并认为自己也应该给出机智的回答。在使用Zeller公式计算当天确实不是星期五,并对闰年的特殊情况做了二次检查后,o3-mini以调侃的方式回答称,“日历规定今天是星期四”,并安慰用户“忍耐一下,明天就离周未更近了”。
但需要注意的是有消息称,OpenAI此次仍未完全公开o3-mini的完整思维链。同时OpenAI研究员Noam Brown也发文表示,“这些虽然不是原始的思维链,但已经非常接近了。我很高兴我们能与世界分享这一体验”。
对此OpenAI公司发言人回应称,“为了提高清晰度和安全性,我们增加了一个额外的后处理步骤,其中模型审查原始思维链,移除任何不安全的内容,并对复杂概念进行适度简化。此外,这个后处理步骤使非英语用户能够以他们的母语接收思维链,创造一个更易于访问和友好的体验”。
OpenAI CEO Sam Altman也对此表示,“我们尝试整理原始的思维链,使其更易读,并在需要时进行翻译,但尽量保持其原始风格”。
![](http://image.uc.cn/s/wemedia/s/upload/2024/7073864b05132011db74a4482e7d9145.jpg)
对于OpenAI拒绝完全公开o3-mini思维链的原因,有观点认为,鉴于公开思维链可能会被竞争对手利用,比如通过蒸馏提取模型的推理逻辑,所以OpenAI此举或意在防止恶意竞争。据悉,不久前在AMA(Ask Me Anything)活动中,OpenAI首席产品官Kevin Weil就曾表示,“我们正在努力展示比现在更多的推理过程。这一变化很快就会到来。是否展示完整的思维链仍未确定,因为这涉及竞争问题。但我们也知道用户(尤其是高级用户)希望看到更多细节,所以我们会找到合适的平衡点”。
此外值得一提的是,继不久前在今年年初宣布联合软银和甲骨文等科技企业,共同成立一家名为“星际之门”(The Stargate Project)的合资企业,计划在未来四年投资5000亿美元用于建设AI相关基础设施后。日前OpenAI方面宣布,该公司正在评估美国哪些地区适合作为“星际之门”项目的数据中心所在地,并将该项目视为美国能否在全球AI竞赛中保持领先的关键事项。
据OpenAI首席全球事务官Chris Lehane透露,“随着有关DeepSeek的消息传出,这表明这是一场非常真实的竞争,而利害关系再大不过了。无论谁在这场竞争中胜出,都将真正塑造未来世界的模样”。此外他还透露,目前大约有16个州表示有兴趣为“星际之门”建设数据中心,而得克萨斯州是“旗舰”数据中心的所在地。