对大企业来说,保守不单单是因循守旧,更多时候,则是无法与昨日成功的自己,奋力作别。可面对未来,百度还在持续张开怀抱。2月28日,百度官方公众号宣布,将于3月16日发布文心大模型4.5,继续自身开放的战略转轨,并且,一些更加明朗且积极的信号,也在该事件中悄然传出。按照百度的说法,即将全面开放的文心大模型4.5,将是百度最强的下一代大模型。尤其在基础模型能力上,文心大模型4.5将迎来大幅提升,且具备原生多模态、深度思考等能力。到了今年的6月30日,该模型还将正式开源,这或将带给用户更好的体验,以及对GPT-4.5发起全面挑战。不仅如此,算上此次文心大模型4.5推出,以及DeepSeek横空出世后,百度接连宣布文心一言免费和上线深度搜索功能,加上旗下搜索、地图、小度等相继接入了 DeepSeek,可以说,百度近期打出了系列“开放”的组合拳,无疑正以一种开放的姿态,直面行业的剧烈变化。而这一切,看似是战略的转变,实则,更是一种技术积淀的必然回响。
百度让Open Ai脸红心跳?
在DeepSeek掀起行业开放浪潮之时,百度,无疑是国内响应最为迅捷的企业之一。这一次,即将在3月16日发布的文心大模型4.5,或也将为行业聚光灯下,对百度“大模型”的期中大考。不过,据百度方面透露,文心大模型4.5在基础模型能力上已经有了大幅提升,且具备原生多模态、深度思考等能力,号称百度最强大模型。为此,百度的RAG,可在大模型理解用户需求阶段,不断对知识点进行拆解,细化问题。到了检索阶段,又可向大模型展开搜索排序优化,并将搜索返回的异构信息统一表示,送给大模型。到了最终的生成阶段,百度RAG还可综合不同来源的信息独自判断,尤其加上百度实时和全面的搜索生态后,基于大模型逻辑推理能力,就可一举解决信息冲突等问题,从而生成准确率高、时效性好的答案。事实上,自文心一言发布初,百度便一直强调检索增强,随后经过近两年技术沉淀,百度的检索增强能力不断提升的同时,也让该能力的价值,受到业界一致认可。并且,百度即将推出的文心大模型4.5,更在百度自研的iRAG等技术加持下,可将百度搜索的亿级图片资源与自身强大的基础模型能力相结合,从而生成种类繁多的真实图片。甚至,iRAG可以做到在生成特定物品、特定人物以及特定人物与任意背景结合的图像时,在准确率、真实性上都有显著突破,极大减少幻觉。其呈现的整体效果,将会远远超过文生图原生系统,不仅能够去掉了Ai味儿,而且成本很低,在使用场景上,不论是影视作品、漫画作品,还是连续画本、海报制作等领域,无疑带给用户留有大量施展才华的空间。一个可以预见的例子是,在文心大模型4.5正式上线后,用户如果有品牌宣传的需求,则可以借助iRAG技术下,在几乎0成本操作中,像素极复刻以往大片宣传海报动辄需要一二十万,甚至大几十万成本的图片。此外,文心一言还将上线的深度搜索功能,可为用户提供专家级内容回复,实现多模态输入与输出。不仅如此,深度搜索功能下,还能提供多项工具调用,包含了高级联网、文档问答、图片理解等功能,在用户处理多场景任务中,效能无疑将得到极大提升。值得注意的是,先前的2月27日,百度准备发布文心大模型4.5消息一经公布,2月28日的凌晨,OpenAi则迅速发布了GPT-4.5模型。似乎,双方正在暗自较劲。不过,OpenAi的发布或许略显仓促。据报道,OpenAi前员工安德烈·卡帕西,曾提前体验了GPT-4.5后,认为GPT-4.5主要提升在非推理密集型任务上的改进,这些任务多与情商有关,而在数学、代码等领域,GPT-4.5并不拥有最强的能力。当然,GPT-4.5与文心大模型4.5双方具体表现如何,仍有待进一步验证。不过,从先前文心一言和ChatGPT对比来看,文心一言在中文语境与本土化上,往往有着GPT难以比拟的优势:尤其在问答准确性、实时性上,文心一言的幻觉较少,对时事的反应也更加迅捷。从这点上说,百度的文心大模型4.5的深度思考能力,加上自身极强的多模态功能,对中国用户而言,或许在未来能有更好的体验。例如,从RAG能力实测来看,在国内外主流大模型中,百度文心一言综合表现一直属于第一梯队。即使是春节档电影细节、春晚节目等内容,文心一言都可以准确回答,做到文能对题,相比之下,OpenAi虽能检索到信源,却无法生成准确回答。更重要的是,文心一言将于4月1日全面免费,PC端和App端用户均可体验。与之相对的是,GPT-4.5虽接入API,但OpenAi计划逐步转向GPT-5的免费基础版(额度受限),付费用户需升级至Plus/Pro版本。从这点上说,免费且开源的文心大模型4.5,起码在普惠性上,将带给用户更多的诚意。
开放,不仅仅是一种姿态
DeepSeek横空出世后,浪潮风波席卷全球。对此,百度却没有故步自封,反而动作频频,持续以一种开放的姿态,直面变化。“技术”如何打败“故事”?
“过去,我们谈论摩尔定律时,每18个月,性能水平或价格都会减半。但是今天,当我们谈论大语言模型时,增加的成本基本上降低了,可以在12个月内降低90%以上”百度CEO李彦宏在世界政府峰会上,曾如此说道。事实上,能够在DeepSeek冲击中迅速调整船头,而不一味固守“闭源”,这既是百度战略转折的勇气,也离不开百度长年以来技术沉淀的支撑。