近期,AI助手(AI Agent)备受热捧。
前有国内智谱AI智能体AutoGLM持续刷屏,最新消息OpenAI首个AI助手(Agent)产品或将于明年1月发布。
此外,微软、苹果、华为、小米等国内外头部厂商也正争先推出AI助手相关产品。
A股市场上,近期AI助手&应用相关热度持续高企,中科金财、豆神教育等持续大涨。
OpenAI“下一个重大突破”
或将是AI助手
据科创板日报报道,OpenAI正准备推出一款代号为“Operator”的全新AI助手产品,可以自动执行各种复杂操作,包括编写代码、预订旅行、自动电商购物等。
根据内部员工爆料,OpenAI领导层预计将在2025年1月发布该产品,首先作为研究预览版和开发工具推出,届时将为开发人员开放API接口。
资料显示,AI助手(AI Agent),是一种模拟人类智能行为的人工智能系统,以大型语言模型(LLM)作为其核心引擎,基于复杂多模态数据的处理能力,它们能够感知环境,做出决策,并执行任务以实现特定的目标。对于普通用户而言,AI助手最核心的功能是AI自主操作手机,辅助完成复杂推理任务。
OpenAI的CEO山姆奥特曼几周前在Reddit的“问我任何问题”(Ask Me Anything)论坛上表示:“我们将拥有越来越好的模型,但下一个重大突破将是AI助手。”
AI助手将进入大爆发期!
事实上,目前国内外头部厂商正争先推出AI助手产品。
10月25日,智谱AI推出自主智能体AutoGLM,只需接收文字/语音指令,就可以模拟人类操作手机,开启人机交互全新模式和应用新蓝海。具体来说,当你向AutoGLM发出指令后,它能够代替你在手机和网页上完成各种操作,比如写点评、电商下单、写摘要、点外卖、发微信等。
10月23日,Anthropic推出全新Claude 3.5 Haiku和升级版Sonnet。Sonnet能力不仅全面超过GPT-4o,更带来全新AI体验:计算机使用,可以像人类一样操作电脑。
与过去AI Agent直接通过代码/程序,后台联网搜索/操作应用不同的是,这一次Claude真正像人类一样去使用电脑:先看屏幕,再使用鼠标操作,再通过思考,重复以上步骤直到完成目的。在这个过程中,Claude每一次截图查看屏幕,移动光标/点选,并给出思考的全过程。
此外,据不完全梳理统计,
10月22日,微软宣布在Dynamics 365中集成10个自主AI Agent,支持OpenAI最新模型o1,具备自主学习能力,可自动执行跨平台复杂业务。微软近期还低调开源了AI工具OmniParser,其可帮助用户创建个性化智能体,以操作个人计算机。
谷歌计划在12月预览其大型动作模型“Project Jarvis”,该项目将帮助用户执行诸如“收集研究、购买产品或预订航班”等任务。
苹果选择将Siri与ChatGPT集成,实现更智能的人机交互。
华为则公布了一项可让AI像人类一样操作手机的新研究成果,相关团队提出一个手机控制架构:Lightweight Multi-modal App Control(轻量级多模态应用控制,简称LiMAC)。
德邦证券认为,2025年或进入全终端Agent爆发元年,Agent network有望初具规模,终端有望率先放量、其次是全行业落地应用,AI应用商业模式闭环或将形成。
此外,上个月OpenAI首席产品官Kevin Weil也曾表示:2025年将是Agent系统最终进入主流的一年!
Kimi重磅大动作
新模型媲美OpenAI最强模型
11月16日,正值国产大模型独角兽月之暗面Kimi Chat向全社会开放服务一周年之际,月之暗面正式发布其新一代数学推理模型k0-math,意在与OpenAI的o1系列相抗衡。
众所周知,此前9月12日,OpenAI发布了最新的大模型OpenAI-o1,新模型包括o1-preview和o1-mini两种版本。
按照OpenAI的说法,这是他们迄今为止最强、最一致的模型,对于复杂推理任务而言,新模型代表着人工智能能力的崭新水平,因此值得将计数重置为1,给它一个有别于“GPT-4”系列的全新名号。
与之前的版本相比,新模型最重要的一点就是使用了全新的“思维链模式”(Chain-of-Thought,CoT),一种“高阶推理的新范式”,擅长复杂任务推理,能在科学、编程和数学等领域解决比以往模型更难的问题。
怎么理解这个“思维链模式”?
打个比方,有点儿类似于丹尼尔·卡尼曼在书《思考,快与慢》中提出的人类大脑的两个思考系统,即依赖直觉和经验、快速且无意识的系统1和深思熟虑、谨慎且有意识的系统2。
o1模型的发布,意味着大模型从运用系统1发展到了运用系统2,表现在使用过程中,即为大模型不再是对问题做出即刻响应,而是先进行一定时间的思考,生成解释推理过程的内部思维链。
而月之暗面最新发布的k0-math能力如何呢?
据基准测试显示,目前在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中,k0-math初代模型成绩超过了OpenAI o1系列的o1-mini和o1-preview模型;在两个难度更大的竞赛级别的数学题库OMNI-MATH和AIME基准测试中,k0-math初代模型的表现分别达到了o1-mini最高成绩的90%和83%。
月之暗面创始人杨植麟在接受采访时表示,“如果说长文本是月之暗面登月的第一步,那么提升模型深度推理能力则是第二步。
其指出,大模型需要提升思考能力。
“AI最重要的是思考和交互这两个能力,思考的重要性远大于交互,不是说交互不重要,交互是一个必要条件,但思考会决定上限。因此,接下来很重要的一件事是让AI具备思考的能力。”
而最适合让AI锻炼思考的能力,无疑是数学场景,伽利略曾说过,宇宙是由数学这门语言书写而成的,它是整个宇宙的基石,很多规律只是通过数学来刻划的。而且好处是并不需要跟外界进行交互,相对来说比较严密的自成一体,它自己可以成为一个体系,这让数学成为AI学习这种思考能力的一种非常好的场景。”
Scaling laws依然有效
强化学习是重点
自ChatGPT发布后,通过增加更多数据和计算能力来“扩大”当前模型,便能持续改进模型的能力,即所谓的Scalinglaw(尺度定律)几乎成为业内共识。
但OpenAI原首席科学家Ilya Sutskever日前公开表示,扩大预训练的结果已经达到了平台期,每个人都在寻找下一个东西。
Scaling laws是否依然有效?
月之暗面创始人杨植麟认为,Scaling laws依然有效,但需更好的方法。预训练大模型还有迭代空间,预计还有半代到一代的模型的空间会在明年释放出来,明年业内领先的模型会把预训练做到一个比较极致的阶段,接下来最重点的东西会在“强化学习”上,但它还是Scale,只是用不同的方式去Scale。”
其同时提到,AI的发展就像在荡秋千,在两种状态之间来回切换:
一种是算法、数据准备好了,但算力不够,从Transformer架构诞生到GPT4的出现,更多的矛盾在于如何扩大规模(Scale),在算法和数据上不存在本质问题。
但到了今天,规模已经到达了一定的程度,会发现再加更多的算力,也不一定能解决问题,其中核心问题是没有高质量的数据,这时要做的事便是改变算法,突破瓶颈。现在这是他所在的公司乃至整个行业都面临的共同问题,好的算法能够释放Scaling的潜力,让模型持续变得更好,强化学习是接下来很重要的一个趋势。
杨植麟同时提到,目前kimi每月使用人数已达到3600万,而且数据在持续增长,当下月之暗面最核心的任务就是提升用户留存率。
关于AI助手,Kimi,AI大模型,大家还有啥想法?怎么看?欢迎评论区讨论交流呀~
免责声明(上下滑动查看全部)
任何在本文出现的信息(包括但不限于个股、评论、预测、图表、指标、理论、任何形式的表述等)均只作为参考,投资人须对任何自主决定的投资行为负责。另,本文中的任何观点、分析及预测不构成对阅读者任何形式的投资建议,亦不对因使用本文内容所引发的直接或间接损失负任何责任。投资有风险,过往业绩不预示未来表现。财经早餐力求文章所载内容及观点客观公正,但不保证其准确性、完整性、及时性等。本文仅代表作者本人观点。