【环球网科技综合报道】2月17日消息,近日,OpenAI发布了关于推理模型在竞技编程中应用的研究论文报告《Competitive Programming with Large Reasoning Models》,文中放出了OpenAI三个推理模型:o1、o1-ioi、o3在IOI(国际信息学奥林匹克竞赛)和CodeForces(全球知名在线编程竞赛)中的成绩。
论文显示,在IOI 2024中,o3在严格规则下拿到395.64分,达成金牌成就,并且在CodeForces上的表现与人类精英选手相当。论文中特别提到,中国的DeepSeek-R1和Kimi k1.5通过独立研究显示,利用思维链学习(COT)方法,可显著提升模型在数学解题与编程挑战中的综合表现。R1、k1.5是DeepSeek和Kimi在1月20日同时发布的新型推理模型。
该论文通过强化学习(RL)训练的大型语言模型在复杂编码和推理任务上的性能提升,比较了通用推理模型与针对特定领域优化的系统在竞技编程中的表现。研究结果表明,增加强化学习训练计算和测试时计算可显著提升模型性能,使其接近世界顶尖人类选手,这些模型将在科学、编码、数学等领域的AI应用中解锁新的应用体验。(勃潺)
都没下文的,提DeepSeeK和Kini干吗?莫非还在领间谍工资?
美国人不想中国用上Al功能,Opcn早就叫停中国的业务,现在奥特曼后悔了,想重回中国,现在中国的Al人工智能多如牛毛!!!
谁先开源公布就是谁发明,想抢成果门都没有
论文已表明强化学习可提升模型性能接近人类顶尖选手。
GPT的逻辑链推理居然是用的中文。脸皮真厚。
论文写的不错,就是麻烦你的o3别抄袭了,好嘛?
强化学习能让模型在多领域表现更好,这就是性能提升。
根本没提到kimi,有这个钱做广告,就是不肯花钱做事情。就是个广告忽悠
坦白说,这个时候Kimi确实比ds好用