Manus突然刷屏,这款新的中国人工智能代理(AI Agent)凭借其处理复杂现实任务的能力,迅速吸引了舆论的关注。目前,Manus仅以邀请制的网络预览形式推出。在其官网manus.im的演示视频中,展示了Manus通过逐步流程创建定制网站的能力。这款由Monica.im团队研发的新产品究竟是什么?AI Agent又有什么独特之处?

与传统AI助手不同,Manus不仅仅是一个聊天机器人,而是一个能够执行实际任务的AI代理。根据官方介绍:"Manus是一个通用人工智能代理,它连接思想与行动:它不仅思考,还能交付成果。"
Manus的官网称,其专注于处理复杂的现实任务,例如为去日本旅行制定行程、深入分析特斯拉的股票、为中学教师创建互动课程、比较不同保险政策以及协助企业对企业供应商的采购。

用户可以看到Manus将分析需求并把任务链清晰写在一个单独的文档上,一步步去执行,在这个过程中可能会调用大量搜索数据,也可能唤醒一个浏览器由Agent去模拟人在网页上互动和探索,最后整理并分析且输出成用户想要的格式。最吸引人的是,Manus可以直接交付可视化的最终结果,而不仅仅是文字答案。它可以输出多种形式的成果,包括简单的文档、表格、App、网页、PPT等。
Manus还声称,根据第三方通用人工智能助手评估标准——GAIA基准测试,其表现优于OpenAI的Deep Research。GAIA是一个用于评测通用AI助手的标准测试,衡量它们在不同难度级别(Level 1、Level 2、Level 3)的表现。Manus AI在所有三个难度级别上都取得了最新的SOTA结果,特别是在最复杂的Level 3任务上的表现显著优于其他AI助手。

Manus系统采用由多个独立模型驱动的多签名(multisig)方法,开发人员计划在今年晚些时候开源模型的部分内容,特别是推理组件。据业内人士从技术角度分析,Manus被描述为"DeepResearch + Operator + Claude Computer Use的有机结合体",也是"compute use + 虚拟机 + artifacts + 内置一批agent的综合产物"。
通用人工智能代理(AI Agent)能够与环境互动、收集数据,并自主处理任务以实现预设目标,被广泛视为人工智能应用的未来。Manus发布之际,正值主要AI公司越来越多地投资于AI Agent,其领域快速发展的关键时期,甚至有人称2025年为AI Agent元年。就在昨天,OpenAI宣布其医生级别的AI Agent每月定价为2万美元,目标行业包括金融、医疗保健和制造业。