Manus一夜爆火,我却被一直“闷头干”的Noumena吸引了

未来图灵 2025-03-07 13:43:19

3月7日中午,未来图灵发现,近日大火的AI应用Manus的官方X(原推特)账号于7日上午被冻结,平台提示该账号违反相关规则。截至目前,Manus官方尚未对此事作出公开回应,账号被冻结的具体原因也暂不明确。

图片来源:Manus AI社交平台X的主页截图

此前3月6日下午,Manus AI合伙人张涛在即刻平台发文称,“目前采取邀请码机制,是因为此刻服务器容量确实有限,不得已而为之,团队也熬夜搞了一整天了。希望在接下来的时间里能让更多处在Waitlist(等待名单)中的用户优先体验Manus。”张涛表示,“恳请大家对一家几十人的创业公司多一点包容和理解,团队正在全力输出,让大家早日体验上更好的产品。”

图片来源:张涛于即刻平台发布的帖子截图

Manus提供了“通用的手”

3月5日晚22点左右,来自中国的创业公司Monica正式对外发布通用型AI Agent产品Manus。

图片来源:ManusAI于X平台发布的帖子截图

据团队介绍,Manus在GAIA基准测试中取得了SOTA(State-of-the-Art)的成绩,显示其性能超越OpenAI的同层次大模型。据悉,这是全球首款真正意义上的通用AI Agent,从官网展示的案例可以看到,它能够独立思考、规划并执行复杂任务,直接交付完整成果。官方宣称,Manus不仅仅是一个只会聊天的对话式AI工具,而是一个真正的自主智能体(Agent)。

图片来源:ManusAI于X平台发布的帖子截图

从介绍来看,相较于目前的大模型产品,作为通用型Agent,Manus定位于一位性能强大的通用型助手,对于用户不仅仅是提供想法,而是能将想法付诸实践,真正解决问题。

Manus发布后,官网一度被挤爆。不少同行也对其爆火的营销“垂涎欲滴”。

目前,试用Manus需要输入邀请码,导致其一码难求。未来图灵通过查阅二手交易平台闲鱼APP发现,有多个卖家自称掌握Manus内测邀请码,且售价数千元至几万元不等。其中,有卖家称,如果是假的可以直接对其进行举报。

此外,Manus目前采用邀请码机制虽在产品推广初期引发了关注与讨论,但也被质疑为饥饿营销手段。与DeepSeek等产品通过深耕开发者社区、真诚开源形成口碑的方式不同,Manus的传播更多依赖社交媒体上的营销操作,在海外科技论坛和社交媒体上的讨论热度远不及国内,有“自嗨”之嫌。

有网友直接在社交媒体上评论:“Manus就是一个套壳缝合怪,没有自己核心的技术创新,所谓的超越OpenAI只是营销话术。”

对此情况,张涛于3月5日在即刻平台回应称,未开设任何付费获取邀请码的渠道;从未投入任何市场推广预算;内测期间系统容量有限,我们将优先保障现有用户的核心体验,并逐步有序释放邀请。

图片来源:张涛于即刻平台发布的帖子截图

不过,鲜为人知的是,在Manus火爆之前,未来图灵就发现了一家名为Noumena(物自体)的AI公司,他们的技术有着相似之处。3月6日,小编还与Noumena(物自体)CEO裴沵思以及首席科学家及产品负责人赵欢进行了第二次深入沟通。

Manus“当天炒作当天收割”?

据了解,物自体(上海)科技有限公司的名字源于康德哲学中的“物自体”(thing-in-itself),象征着独立于人类感知之外的纯粹实体,代表对于深度思考和根本真理的执着追求。公司于2023年8月成立,并在2024年初完成一轮融资。

其班底成员大多毕业于港科、上交、哈工大、北邮、北理工、东北大学等高校,其中一半以上是投身AI方向研究的硕士与博士,他们在算法到架构方面已经合作多年。Noumena使命是通过尖端的AI技术及其他前沿技术如大数据、云计算,赋能创意和生产力,未来想要成为自媒体人最首选的创作辅助工具,致力于探索和解锁知识的深层次结构,追求技术的纯粹和实用。

Noumena的CEO是裴沵思(James Pei)。据公开资料显示,裴沵思于2019年7月1日加入第四范式并担任总裁职务。裴沵思在进入第四范式前为SAP全球副总裁,有近25年在企业级服务领域的从业经历,其服务的领域广泛,覆盖能源、制造、公共事业部、建安、地产、运输物流、金融服务、体育娱乐等行业,帮助企业用数字化思维实现更好的经营管理。

未来图灵了解到Manus的CTO季逸超是前第四范式的员工,与裴沵思和赵欢都是朋友关系。据裴沵思了解,Manus核心点是大模型做虚机的业务,能让大模型以更自如的方式更好地控制计算机,以浏览器为核心,包括设置一些权限。在完成大家指定任务的时候,自己控制计算机,他认为这是Manus想做的本质。

对于近日社交媒体上有言论称Manus属于“当天炒作当天收割”,以及说其团队“之前是做私域微商的”,比较擅长做(关键意见领袖)方面的营销,自媒体对此一片火热属于内部媒体的自热行为等表述,裴沵思并不认同。

他表示,对于Monica整个团队他不太熟,但对季逸超特别熟。季逸超曾在第四范式被称为“小天才”,对大模型和产品有比较深刻的洞察,做这个产品绝不是炒作逻辑,而是真心认为在AI Agent层面上,Manus现在走的路值得探讨和深入研究,在效率以及产品交互层面上能给客户带来更多价值,在产品设计中有着技术极客的思维逻辑。

也有观点认为,Manus属于套壳AI中比较成功的一种,裴沵思对此表示,如果从当下DeepSeek这波开源趋势来看,大模型更像是Linux(操作系统内核),在其之上构建的应用某种程度上都可看作是“套壳”。不能单纯将“套壳”视为贬义词,虽然其价值可能没有大模型本身高,但绝对是在探索和创造价值。

Noumena提供了“落地的手”

据裴沵思介绍,Manus的核心是用大模型做虚拟机的事情,将大模型代入了一个新的时代,用大模型控制计算机,调用各种资源和信息,帮助人类完成具体的任务。从这个意义上说,Noumena在底层思考上跟Manus完全类似。

赵欢认为,不同之处在于,Manus定义在一个更通用的、给所有人用的逻辑上,而Noumena先定位在一门业务上,思考在这门业务里,大模型极致发挥能力所需要的“脚手架”。重新组合机器与人,形成高效工作流。

赵欢进一步解释,以小红书周边业务为例,大模型在处理相关业务时,需要大量时间浏览小红书等网络平台。从技术实现上,Noumena并没有直接采取网络爬虫技术,而是基于GUI Agent(用户界面智能体,这里的 GUI泛指PC、Web与移动APP的操作界面)的技术,训练AI自己操作浏览器,理解网页布局与内容,根据业务需求去选择最适合的网站搜集内容:包括用户信息、商品推荐、营销文案等。如在找KOL的业务中,AI不仅能够理解品牌方各种奇奇怪怪的要求,还会导入执行中多方沟通的记录进行策略调整,从而更好地给品牌和合作伙伴解决问题。在实际的To B业务场景中,大量场景在每个节点都需要人机互动,不是单纯的聊天逻辑,而是要建立全新的人机互动工作流,大模型做其擅长之事,人做擅长之事,二者重新配合。

Noumena从创业开始,就围绕着在小红书业务上提效这一目标进行分解,已经做了一年时间。

图片来源:摄图网

赵欢表示,DeepSeek 这一波是把推理大模型带火,但其实这个技术路线最早在2023年9月12日OpenAI推出的O1这一系列中就有体现。DeepSeek出圈后,大家发现大模型的推理能力比绝大部分人强。Manus的核心理念是把整个任务规划部分交给大模型,为大模型提供足够多的环境脚手架,统一归为上下文(浏览器、虚拟机、能写代码的能力),让AI自主调用这些工具。这个是现在Manus在Usecase(使用案例)中所展现的产品交互方式以及界面。在代码领域除了闭源的Devin之外,还有开源工具OpenHands之前在编码领域也做了类似事情,而Manus将其扩展到了通用领域。

“我们会把业务中涉及到的非数字化优化部分,如客户的BD(Business Development),业务执行过程中的表现与反馈,人与人的沟通交流等无法通过API(应用程序编程接口)直接获取到的信息(比如需要人作为工具,去收集这些信息),然后详细地输入给AI,作为整个决策过程中的业务context(上下文)。”赵欢说。

通俗来讲,Manus作为C端产品,用户只需简单输入,然后期待产品输出符合期望的结果,其核心关注点在于产品输出结果是否能满足用户需求。

和Manus不同,在Noumena的B端设计中,情况要复杂得多。整个小红书业务是一个人机紧密合作的模式,短期内完全依靠大模型独立完成业务是不现实的。因此,Noumena不仅要考虑员工在业务流程中的输入和输出,还要深入思考大模型在其中能够发挥的作用,以及如何实现大模型与其他业务环节的高效合作,在小红书内容营销与投放这一具体业务场景中,重新构建机器与人的高效工作流。

做泛化性强的“小众”业务

Noumena将小红书业务分成效率模型和创意问题两部分。在效率模型方面,包括 MCN 端和投流端,据介绍,其产品能力已经比一般员工提升了5倍到20倍,达到完全替代人且大幅超过人的能力水平;在创意端,是以工具形式深度参与工作,重构人机互动过程。并且在B 端应用中,Noumena会考虑品牌方的反馈,在找KOL过程中,产品会接收用户包括品牌方的多次反馈,引入人机交互形态。

在2024年大模型寻求落地的初期,业内人士都在关心企业是To B还是To C。Manus做的是To C领域,而Noumena则是聚焦To B领域,专注于小红书内容营销与投放的业务场景。据裴沵思介绍,Noumena不是针对具体业务做定制化,也不是在做通用的To B架构,它和Manus一样是做AI Agent,只是场景更加聚焦。它提供的是在具体的业务场景中(目前是小红书内容营销与投放的业务场景),机器和人重新组合成一个更高效的工作流。

裴沵思认为现在通用的To C应用,很难解决To B的所有问题。Noumena选择像小红书这种泛化性强的业务,具体业务本质上泛化性提升有难度,但小红书业务相对来说有较好的迁移性,因为小红书这门业务泛化性是非常强的。

赵欢表示,传统定制化往往是针对单个客户进行一对一的服务,属于上一代AI服务模式。

“我们更多地是聚焦于营销业务领域,以小红书平台的营销业务为例,这一业务从品牌方开始,历经4A公司、代理公司、策划公司、MCN 执行团队等多个环节,已经形成了一套复杂且成熟的业务流程和上下游协作体系。”赵欢说。

鉴于大模型强大的推理能力,Noumena对该业务的认知有了全新的视角,基于大模型重新定义了整个业务流,这是区别于传统AI模式之处。Noumena在重新定义业务流的基础上,构建了一套机制。它相当于为模型搭建了一个“脚手架”,让其能够获取来自不同客户、不同来源的数据,并调用各类工具。之后,推动模型自主解题,甚至给予反馈指导其解题,而不是沿用过去为每个客户单独定制的老思路。

DeepSeek爆火后,行业内众多公司都在采用接入DeepSeek等方式开展定制化服务,针对各个公司的特定需求打造单独的DeepSeek形态。Noumena提出的新业务形态是未来的趋势么?

对此,裴沵思表示,在小红书业务中,存在一个关键要点,即定制化的边界问题。

小红书业务具有公域数据远大于私域数据的特性。这意味着小红书业务的本质并非在于数据的呈现形式,而是对小红书平台本身的深刻理解。这也是Noumena一直强调导入类业务的原因,一方面大模型在这类业务中泛化能力强,另一方面其私域数据相对简单,更有利于Noumena基于大模型构建创新的业务模式,打造适用于小红书内容营销与投放的业务场景的机器与人高效工作流。

当然,深度绑定小红书一家,也容易引来疑虑,毕竟这相当于自家公司的发展前景要“仰小红书鼻息”。

如何找到“正确”的赛道?

裴沵思回忆,公司在成立后的这一年内多经历了非常痛苦的过程。

据介绍,Noumena目前还在第二轮蜕变中。第一轮转化是团队成员从擅长模型算法和工程,到深入理解小红书业务,从调研、开发流程工具到亲自运营业务,花了大量时间精力下场实践。现在进入第二阶段,随着DeepSeek发布,开启重构业务产品阶段,思考如何在小红书业务里更充分利用模型推理能力解决复杂有价值的业务,以及以模型为核心时人员如何配合工作,构建Agentic System(智能体系统),在小红书内容营销与投放的业务场景中让业务在Agent驱动下运转,实现机器与人的高效协作。

图片来源:摄图网

那么,接下来AI场景落地的发展走向会是怎样?

对此,裴沵思的看法是,从大厂的视角来看,实现场景通用落地的核心在于锤炼私有数据解析能力。大厂往往需要同时涉足银行、零售、快消、金融等多个不同领域的业务,这就要求他们对私域数据体系具备强大的处理能力,只有如此,才能从繁杂且独特的私域数据中挖掘出有价值的信息,进而支撑起通用的AI场景落地,这是一种追求最大公约数的解题思路。

然而,还有像Noumena这样专注于特定赛道的参与者。在内容平台营销领域,我们发现无需在私域或定制化层面投入过多资源,便能够显著提升业务的智能化水平。通过精心构建和优化业务流程,我们得以将各个环节更有效地串联起来,形成一个有机且高效的整体。这两种截然不同的To B思路,代表了行业内不同主体的发展策略,大厂凭借雄厚的资源和广泛的业务覆盖走通用路线,而创业公司则通过聚焦特定赛道发挥自身灵活和专业的优势。

以内容平台市场规模为例,中国约40万亿的消费中,线上消费占20万亿,其中广告费用占比10%,约为2万亿,而小红书在这之中占据了近三五千亿的份额,如此庞大的市场规模,为专注于该领域的企业提供了巨大的发展潜力,有望在这单一大市场中脱颖而出。

此外,随着Manus这类产品的出现,人机互动框架的基础设施不断完善。Manus的意义并非局限于其To C的体验,更重要的是它在大模型操作计算机方面展现出了实际成效,促使相关资源迅速汇聚。

大模型在具备推理能力(即“脑子”)的基础上,逐渐发展出执行能力(即“手”),能够进行实际的操作工作。进一步来看,大模型要实现更全面的发展,关键在于处理好外部数据和内部数据,通过对这些数据的深度理解,包括自身状态、过往经历以及所处环境等信息,从而不断完善自身功能,在AI场景落地的进程中持续演进 。

AI Agent的竞争终将回归商业本质:能否在真实场景中创造可量化的价值。

当Manus在通用市场验证技术可行性时,Noumena已在垂直领域初步试水了变现模型。这场“手”的较量没有输家,它或许预示着一个更理性的AI时代。技术理想主义与商业现实主义的交织,将催生出真正改变产业的“无形之手”。为此,出身“豪门”、符合“精英创业”的裴沵思及其不事张扬的团队,或许已经准备好了。

0 阅读:59

未来图灵

简介:智能共创,共建未来