本文作者:董董
版式设计:姜姜
200多年前,第一次工业革命,以蒸汽机作为动力机被广泛使用为标志。
因此,改良了蒸汽机的瓦特,被认为是工业革命之父。但另一种观点则认为,这个名号,应归属于阿克莱特。
因为,同样改良了蒸汽机的他,所推动的规模化生产正是工业革命的本质。
但无论是瓦特还是阿克莱特,作为前瞻者的他们,在那个关键节点上,不谋而合。
200多年后,这样的不谋而合,再一次出现。
9月13日,OpenAI发布了具有推理能力的人工智能模型“o1”,它通过模仿人类的思维过程,强化学习和“思维链”技术,引导模型自主解决问题。
而在一个多月前,360集团创始人周鸿祎曾在ISC 2024大会上宣布,360将“用基于智能体的框架打造慢思考系统,从而增强大模型的慢思考能力”。
周鸿祎在近期,还多次强调,将“利用智能体框架,让大模型从快思考转成慢思考模式,把多个大模型组合起来解决业务问题”。
正如马克·吐温所说的那样:历史不会重复,但会押韵。
“思维链”和“慢思考”,也许,正是当下人工智能发展里程碑上,那个发音相同的韵脚。
而作为这场AI引发的科技变革的亲历者,OpenAI和360,在研判未来趋势的那条道路上,这一次,都瞄准了同一个方向,站在了同一条起跑线上。
1
周鸿祎和360,抢跑一个身位有意思的是,在这次比赛中,360,似乎抢跑了。
是的,当人们震惊于人工智能模型o1所展现出的强大推理能力时,早在2024年7月底,360首创的CoE(Collaboration-of-Experts,专家协同)架构中,就已经强化了推理的使用。
这一个身位的差距,似乎再一次证明了,在人工智能赛道上,以360为代表的中国队,和美国队的距离并没有想象中的那么大。
在解读o1时,周鸿祎就曾表示,GPT类大模型通过训练大量知识,主要学习的是快思考能力,这也是为什么GPT类大模型脱口而出的答案质量不够稳定,“就像人一样,不假思索出口成章而不出错非常难实现”。
而慢思考则是缓慢、有意识、有逻辑性,需要分很多步骤。周鸿祎解释,“这一次o1拥有了人类慢思考的特质,在回答问题前会反复地思考,拆解、理解、推理,可能会自己问自己1000遍,然后才能给出最终的答案。”这也就是为什么其“思维链(CoT)”能呈现出如此强大的效果的根本原因。
那么,“思维链(CoT)”是不是已经能满足当下的现实需求了呢?
显然,现在的它,还有很多不足。
有报道称,o1存在着像幻觉问题、运行速度较慢及成本高昂等问题,而这些问题最突出的表现,就是限制了其的应用范围。
而抢先一步的360,显然在应对这些问题上,已经找到了突破口。
360AI 对不同领域的问题使用不同模型进行回答
360首创的CoE架构,能让多个模型分工协作、并行工作,执行多步推理。并且,360将CoE架构和混合大模型的设计,应用在了360 AI搜索、360 AI浏览器等多款产品中,实现了对“慢思考”的落地实践。实践证明,这种方式可以在处理简单问题时,调动精准的小模型来提高回答的准确性,进而节约推理资源,加快响应速度。
以360AI搜索的“深入回答”模式为例,每一次启动,就会涉及7-15次的大模型调用。比如,可能会涉及1次意图识别模型调用,1次搜索词改写模型调用,5次搜索调用,1次网页排序调用,1次生成主回答调用,1次生成追问调用。
当一个用户想让360帮他把一首古诗词翻译成英文,路由模块就会调用起翻译、反思等多个模型,让这些模型分工配合、共同完成任务。
“柴多火焰高”,模型多,办法就好。
可见,这一步之遥,至少在落地应用上,360已经拉开了和OpenAI的差距。
2
仍存差距,但已具备弯道超车潜力作为人工智能领域里当之无愧的领头羊,OpenAI的技术实力在OpenAI o1上已经得到了足够的体现。
其首席执行官山姆奥特曼表示,o1是“迄今为止功能最强大,最具有一致性的模型。”
OpenAI宣称,o1系列模型可以推理复杂的任务并解决比以前的科学、编码和数学模型更难的问题。
让我们来看看其公布的一系列测试数据,其中,国际数学奥林匹克的资格考试(AIME)中,GPT4o准确率为13.4%,o1则是83.3%,成功进入了美国前500名学生的行列。
在代码竞赛中,GPT4o准确率为11.0%,o1则是89%。
面对博士级科学问题 (GPQA Diamond)时,GPT4o是56.1,人类专家水平是69.7,o1达到了恐怖的78%。
虽然与o1仍存在差距,但值得欣慰的是,有媒体报道近期已经有国内技术团队采用CoE协同工作模式,选择任意三个模型协同工作达到了和OpenAI o1-preview类似的反思决策效果。经过21道复杂逻辑推理题测试结果显示,其效果与OpenAI o1-preview相当,完全超越GPT-4o,有时还能超越o1-preview。这说明,360在大模型领域的持续创新和深度探索,已经并肩了当下的行业领军者。同时,360所呈现出的技术解决方案,以及其标准化的参考框架,也为国内的同行者们,提供了参考样本。
可见,中美在该领域的技术差距,并没有大到无法超越,而随着大模型技术的进一步升级,也许这点差距很快就会被赶超。
这也从侧面折射出,以360为代表的中国队已经具备了弯道超车的潜力。
1858年,“不谋而合”的达尔文和华莱士,共同完成了关于物种起源的论文。
一年之后,达尔文出版了震惊世界的《物种起源》。
前瞻者永远都不会只有一个。
OpenAI o1和360的“慢思考”模式,代表了人工智能技术发展的新方向。
“以后比的不是多快能给你答案,而是给的答案完不完整,这也会改变人工智能服务的业态,人工智能到最后,还是要参考人类大脑的组成来构造工作模式。”这是周鸿祎给出的解答。
以360为代表的中国企业,在人工智能领域上的不断坚持和突破,使得它们的脚步已经跟上、即将超越,那些曾经的“领头羊”们。
当下的“不谋而合”,最终,会分出哪个是未来的最优解。