几个月前,DeepSeek的发布,的确让国内的AI领域有一种瞬间“万马齐喑”的感觉,特别是多年重度投入AI的大厂们更是受到了重重追问——你们还跟不跟,怎么跟?
带着文心4.5 Turbo和文心X1 Turbo这两个具有很强竞争优势的新模型回归,百度用这种方式表达了自己的生存哲学。
百度AI的生存哲学,核心是竞争与创新。你可以理解为,百度视AI核心业务的发展为一个非常长期的竞争过程,而技术创新是其生存竞争优势得以存在的重要保证。
这种价值观是符合历史唯物主义的,一如人类社会在生产力优势作用下得到演进,其发展过程就是一个斗争和变革的过程——在AI语境下,则表现为在与各种困难持续的斗争中,不断的变革(也就是创新),最终在长期主义的引领下取得成绩。
如果你看到这里还觉得莫衷一是,本文就试图解释——百度为何是AI头部俱乐部里,那个几乎永久把自己“焊”在了牌桌上的选手。
——导语
01六力要素在本系列的第一部分中,我们曾经和多位业内的AI科学家和投资人沟通,并且在当时的维度下总结了“谁能稳稳的进入AI竞争的第一梯队”这个问题的四个要素。
然而,承接第一部中间提出的方法论,随着接触的专家学者越来越多,我们也对此前的逻辑有所升维——我们倾向于认为,目前在中国,要进入AI研发的第一梯队,要持续的坐在牌桌上,至少要具备6个要素,简称“六力要素”,它们分别是:
1.有基础大模型的底层研发能力;
2.有不断被超过然后又反超的能够追赶潮流的持续应变能力;
3.要有亿级日活的C端应用支撑;
4.要有客观利他的宏大生态;
5.要有toB的AI生产力布局;
6.充足持续的现金流;
简言之,“六力要素”是总体评估一家企业能否留在头部牌桌上的要素分析。
但有趣的是,虽然进入我们视野的那五六家企业,似乎每条都具备。但仔细研究起来就发现,其优势分布非常的不均衡,进而出现某一项特别强而某一项相对弱的情况。
但也正是因为如此,AI行业的发展才精彩,正是因为这种种的不同优势和相对的劣势的交互作用,使得我们能观察到不同的创新演进路程。
甚至说的更大一点——这些企业中的每一家,都可以看作是一条中国AI成为全球创新策源地过程中的护城河,那么“每条河”都有自己的差异化优势,这种叠加就会产生一种类似于“复合式装甲”的效果,让国际竞争者很难用一种方法打得透、压得住。
而不同禀赋的企业之间的竞争pk,又使得创新能够全面展开于基础研究领域和应用落地领域,进而能够快速推进AI融入社会实务的发展,这是中国为全球AI一极的另一个重要要素。
在中国这样的国家搞AI,也是一种福气。
02百度为何能够一直把自己焊在头部玩家的牌桌上?在详解百度为何能一直留在AI竞争的前排这个问题之前,我想略提一点“六力要素”之外的因素——那就是百度公司的人格和意志。
当然,百度公司的人格不能简单的等于李彦宏的人格,但李彦宏的人格一定是百度的性格和意志的重要一部分。
我认为对于AI这件事来说,百度最核心、最潜意识的意念就是“舍我其谁”。
舍我其谁,并不是排它,更不是看不起友商,而是对自己的一种持续的自信和无法被压抑的使命担当。
我想起拜访中国新时代的高性能计算之父、中国工程院院士李国杰院士的时候,他提出一个“背负十字架”的命题,他说——我们那一代人有一种强烈的负重感,就是有一种把一切有价值的底层技术搞明白、把握在手里的使命感、责任感,不是当工具用用就好了,一定要吃透底层逻辑。有人说我们这样很累,这可能就是我们那一代知识分子的精神十字架。
百度之于AI,也有一种“背负中国AI崛起的重任”的类似情结,它可能是百度“一直在前排”的第七要素。
说回这次的Create 2025,重点是发布了文心大模型4.5 Turbo和文心大模型X1升级版,主打三大特性:多模态、低幻觉、低成本。
更具体一点说,文心4.5 Turbo在图片理解、视频理解等多模态能力上有明显进步,在去幻觉、逻辑推理和代码能力上整体增强;文心大模型X1升级版深度思考能力更强,具备更长思维链,擅长中文知识问答、文学创作、逻辑推理等,多模态能力进一步增强。
但更重要的是,文心大模型4.5 Turbo(源自文心4.5,是效果更好、成本更低的多模态大模型),每百万token的输入价格仅为0.8元,输出价格3.2元。相比文心4.5,价格下降80%。,仅为DeepSeek-V3的40%。
而基于文心4.5 Turbo,X1升级到X1 Turbo,性能提升的同时,具备更先进的思维链,但每百万token的输入价格为1元,输出价格4元,仅为DeepSeek-R1的25%。
上一个回合被deepseek在成本上赶超,这个版本就要扳回来——这就是百度。
但是你千万不要把百度的这种努力理解为一种简单的竞争欲望,百度每做一件事都是有高度理性的底层逻辑的。
正如李彦宏所说——为什么我们要不断把大模型的成本降下来?因为开发者做AI应用的一个很大阻碍就是成本高,用不起。而创新的本质往往就是成本下降。
这其实才是百度的追求——在认定“应用”是目前的头等大事后,百度可以说方方面面的努力都是服务于“应用”。但这种“服务”的本质,是苦心经营自己的底层核心竞争力、提升自家基础大模型的核心能力和成本优势后,对行业能够更好、更便宜的去应用AI资源的一种最好的支持。
兼具有宏观追求与微观理性考量,百度的这种心态,才适合AI赛道的长跑。
人类通向AGI的道路是一场马拉松,每个置身其间的头部玩家,都需要经历无数次的赶超和被赶超,甚至还会面临deepseek这种跨越式竞争者的暴击。所以,只有经得起被赶超的压力,和具备反超越的恒心的企业才能留下来,这是目前可见唯一的“留在牌桌上”的办法。
百度正是这样做的——通过持续的技术迭代和开源战略,形成了“技术升级—用户增长—成本降低”的良性循环。其文心大模型从4.0到4.5再到未来的演进,展示了多维度能力的跨越式提升。
必须指出,所谓的“超强韧性,反复赶超”,并不是一腔血气之勇就可以实现,还要多层次的能力建设。其中,最核心的就是要保留强大的底层大模型的基础研发团队。有了全自研大模型的底层能力,对企业抓住应用的窗口期很重要,也对不断的赶超和反赶超很重要。
举个例子就像我们的大飞机C919,现在最大的考验就是能不能成功的用国产的长江1000发动机替代目前的进口发动机,如果这个替代顺利进行,中国民机的复兴之路就不可阻挡了。
正是有了基础大模型的能力,李彦宏才能很轻松的这样鼓励开发者——你只要找对场景,选对基础模型,有时候还要学一点调模型的方法,在此基础上做出来的应用是不会过时的。
这话看似说得很轻松,但却满是对自己基础模型的信心,尤其是在文心也开源后。
我还必须谈一下,除了“意志”、“韧性”这些要素,百度还是目前国内几乎独此一家的——不仅有基础模型研发能力,还有业界罕见的四层架构俱全的AI企业。
所谓的四层俱全,就是硬件层、框架层、模型层和应用层,这是一个完全能够端到端的体系,这个架构花了百度无数心血,甚至也受到过外界的许多质疑——因为这个架构发挥作用的机制,并不是每个人都看得懂。
但可以类比一下,华为手机业务为何王者归来?就是因为解决了从芯片到上层应用的全栈自研,把所有的发展要素都置于可控、可优化的状态。
百度也是,我一直认为,百度当年一定要搞这个四层架构,实在是因为李彦宏的内心深处是按一家世界级的AI公司的要求来自我规划的,所以把每个基础都打得特别牢。也许这其中的投入非常奢侈,但它的底层能力使得百度始终稳居头部,这就是练好了内功再学招式,和没有练好内容就学招式在境界上的区别。
03你打你的 我打我的大模型之战,很容易让人觉得是一场互相赶超的pk战,是一个又一个新版本之间的对决。但其实,并不尽然。
尤其是,头部大厂的做法和DeepSeek这样的新创企业是不同的,大厂不介意行业里突然跳出某个特别优秀的版本,只要行业发展的基本范式不变,那么它最好的办法,就是按自己既定的节奏向前碾压式的平推。
不是不抬头看路,而是一边看路,脚下同时要稳。
以百度为例,不管外部环境如何变化,百度文心大模型在2023-2025年间实现了多次大版本级的重大升级,每次迭代均针对其自我核心能力做了再突破,这就是“我打我的,持续平推”。
在更底层,目前百度点亮了国内首个全自研3万卡集群,可以同时承载多个满血版DeepSeek这样千亿参数大模型的全量训练,支持1000个客户同时做百亿参数的大模型精调。
回答这些是如何做到的,可能会比较枯燥,但一个基本的思路是,这种努力不是没有靶点的——只要有利于技术创新,有利于应用生态中的开发者去更好的挖掘AI技术应用潜力的领域,百度就会格外重视。
例如,MCP现在大行其道,而百度在做的就是从模型、云平台到应用,帮助开发者全面拥抱MCP。
在很多业者对MCP还是在“有兴趣”的阶段的时候,百度下手极快——千帆平台已全面兼容MCP,提供大量第三方MCP Sever,支持创建发布MCP Server;百度搜索正在构建MCP Server的发现平台,可以索引全网优质Server,帮助开发者便捷找到所需的服务;文心快码,是国内首家支持MCP Server的Coding Agent智能代码助手;文库、网盘、地图等应用全面对外提供MCP Server服务。
这一次,都源自李彦宏的洞察,他的原话是——MCP让AI更懂外部世界,更容易获得信息,更自由地调用工具,是AI发展的一大步。现在基于MCP开发智能体,就像2010年开发移动APP。
这只是一个小切口,一个让我们看到百度结合“研发+方向把握-应用导向”的过程中,是如何进行创新评估的切口。但这个切口里,我们总可以看到一种观念——那就是百度总是把自己放置于推进中国社会对AI红利的应用和接受的这个市场教育者的角度上,总是认为自己对于生态里的、甚至暂时还不是生态里的开发者有一种道义上也是技术上的责任。
这并不是单纯意义上的宏大叙事,它贯穿在每一个细节里,它的目的不是炫技,而是为真实世界创造价值。
04为真实世界创造价值好的头部企业,一定考虑的不完全是技术层面的事儿,而是为真实世界创造价值。
而要创造价值,靠自己是不够的,那么就要看三点:
——应用的落地
百度选择在智能体上布局,具有前瞻性。
按照OpenAI公司提出的AGI进化五层次,在“推理”后就是“智能体”。现在推理模型已经有不少了,百度抓住智能体的机会来饱和攻击,在策略、时点的选择上都是无可挑剔的。
而且百度做的是非常复杂的智能体——多智能体协作应用“心响”。
百度是一家对起名字很在意的公司,心响的意思就是——帮助每个人在生活中都能做到“心有所想,必有回响”。
通用超级智能体,不是豪言壮语,是自己对自己的定义。
简单说,单一的智能体很难足够强大,这就有点类似所谓的战斗机领域的“忠诚僚机”计划——下一阶段,每个具有超态势感知能力的战斗机,都可以协同2-4架无人驾驶的僚机来联合完成更为复杂的任务。
这很形象的映射了,未来的AI应用,不只能回答问题(那是对话和推理的活儿),还要能完成任务。而任何复杂任务的交付,都需要多智能体的协作。
心响基于先进的大模型技术和多智能体协作能力,只要一句话,心响就可以自动解析需求、分拆任务、调度资源、规划执行、交付结果。
我深度的试用了“心响”来规划一次五一期间对假日旅行的规划,以前我也用deepseek干这事儿。
第一个感觉,是“心响”默认用户是很懒的。
事实上,对于小白用户来讲,“需求表达能力有限”、“主动探索欲有限”是一个符合心理学的大趋势,说白了就是懒得问、懒得写。
对话机器人的能力中没有任务意识,你问的少,它也就答得简单。而智能体不同,它默认你是懒得、不善于提问的,所以要想尽办法来帮你。
比如,我输入时就提了“全家五一去浙南”这几个字。
以前,用deepseek干这个,它也会给我一份像模像样的“攻略”,但实际用的时候会发现,有些意见相当的大而无当,比如“建议品尝当地特色”就很空。
心响完全不一样,它不但从“全家”这个词里猜出了这次旅游有亲子属性,还顺带“自作主张”的以“轻松适度”来定下了整个日程的节奏;更关键的是,它不给方向性的意见,而是直接给出结果——比如它推荐我吃当地土菜,就一定会给出餐馆,给出的餐馆一定是电话打得通的,或者是百度地图上能搜得到的,这就叫“完成任务”。
用专业性的话说就是,用极简的产品设定降低用户学习成本 ,同时构建人机协作的可解释性桥梁。
在教育领域,一个老师一天顶多能做出十来个解题视频,用“心响”只需要在输入框输入一道题,立刻就能生成完整的解题视频;在健康领域,则实现了基于多名医生的AI分身进行联合会诊的功能——可以通过结构化的问卷,高效梳理健康症状和相关信息,帮助医生的AI分身给出更具有针对性的健康咨询和建议……
但更多意义上,百度做“心响”是为做通用超级智能体“打样”,就好像谷歌开始推广安卓时也要自己下场做手机一样,目的不仅仅在于产品本身,而是要告诉大家“好的产品应该向这个方向努力”。
一如李彦宏所说,百度不是要推出一个“超级应用”,而是要不断地帮助更多人、更多企业打造出数百万“超级有用”的应用。
——toB的生产力建设
toC的业务,比较容易让一般人有较强的体感,但将来起决定性作用的一定是toB的AI能力。
OpenAI提出AGI的第五层目标是“社会化大生产组织者”,这个目标的实现,也一定不是一蹴而就的,它会先在比较容易落地的领域落地,形成示范效应,牵引相关产业价值,并通过这种成就推动能力建设,给行业巨大信心和反哺,无数个单点的AI应用落地后,才有实现“社会化大生产的条件”
所以,我们就看到了这次的高说服力数字人。
所谓的高说服力,是指此前常见的数字人,动作神情较为呆板,文案枯燥、动作很少、机器音很重。
而借助大模型在文本生成、图像生成、视频生成等强大的多模态能力,能够让生成的数字人更加逼真,也更有“灵魂”,可以与用户更自然、智能的交互。
举个例子吧,2021年的时候,英伟达通过纪录片宣布了其CEO黄仁勋在当年4月的发布会演讲视频中,介绍英伟达发布的首款CPU时,有15秒视频画面为非真人演示。
为了生成这15秒的视频,英伟达租用了一辆装载数百个数码相机的卡车,停靠在黄仁勋的住宅门口,通过多角度拍摄数千张照片,对黄仁勋和他的经典皮衣进行3D建模。还雇佣一名专门的演员模仿黄仁勋的演讲动作,进行8小时的动作捕捉……最后整体费用为数百万美元。
想想,那是2021年,是离现在很近的时间。然而,就在这几年时间后,百度慧播星数字人平台在文心4.5 Turbo和文心X1 Turbo的基础上,通过视频生成、剧本驱动多模匹配、高感染力TTS等能力建设,打造出了一种超拟真、会思考、能协同的数字人,实现数字人超越真人的体验,而其未来的制作周期会缩小到小时级,制作成本也降低至千元、百元级别甚至免费。
这是投向内容行业的一枚重磅炸弹,而归根结底它还是百度大模型能力的一种外化和应用创新。
——生态建设
让更多的合作伙伴从中获益,生态就一定要有足够的客观利他属性。在这方面,百度有中国开发者使用最广的飞桨开源框架——截至 2024年11月,飞桨文心开发者数量已达1808万,服务了43万家企业,创建了101万个模型。
05结语Create2025让我们感到,百度之所以一直稳坐在头部玩家的牌桌上,除了战略的坚定性和百度的技术信仰以外,还有一路上的良性反馈闭环与企业社会责任感。这些东西有的虚,有的实,但最终的结果是——百度的耕耘从来没有白费,所有的努力都化作了今天的竞争力的底气。在头部top3的玩家里,百度始终有一席之地,就是这种宏观上的笃信和微观上的韧性结合的结果,它是先进生产力总会超越落后生产力的这个终极追求下,无数百度人努力和笃信的结果。