百度的开放，不仅仅是种姿态

对大企业来说，保守不单单是因循守旧，更多时候，则是无法与昨日成功的自己，奋力作别。可面对未来，百度还在持续张开怀抱。2月28日，百度官方公众号宣布，将于3月16日发布文心大模型4.5，继续自身开放的战略转轨，并且，一些更加明朗且积极的信号，也在该事件中悄然传出。按照百度的说法，即将全面开放的文心大模型4.5，将是百度最强的下一代大模型。尤其在基础模型能力上，文心大模型4.5将迎来大幅提升，且具备原生多模态、深度思考等能力。到了今年的6月30日，该模型还将正式开源，这或将带给用户更好的体验，以及对GPT-4.5发起全面挑战。不仅如此，算上此次文心大模型4.5推出，以及DeepSeek横空出世后，百度接连宣布文心一言免费和上线深度搜索功能，加上旗下搜索、地图、小度等相继接入了 DeepSeek，可以说，百度近期打出了系列“开放”的组合拳，无疑正以一种开放的姿态，直面行业的剧烈变化。而这一切，看似是战略的转变，实则，更是一种技术积淀的必然回响。

百度让Open Ai脸红心跳？

在DeepSeek掀起行业开放浪潮之时，百度，无疑是国内响应最为迅捷的企业之一。这一次，即将在3月16日发布的文心大模型4.5，或也将为行业聚光灯下，对百度“大模型”的期中大考。不过，据百度方面透露，文心大模型4.5在基础模型能力上已经有了大幅提升，且具备原生多模态、深度思考等能力，号称百度最强大模型。

具体而言，此次文心大模型4.5，具有当前行业内几乎最强的RAG（检索增强生成）能力，而该能力，也是衡量大模型优劣的重要标准之一。

为此，百度的RAG，可在大模型理解用户需求阶段，不断对知识点进行拆解，细化问题。到了检索阶段，又可向大模型展开搜索排序优化，并将搜索返回的异构信息统一表示，送给大模型。到了最终的生成阶段，百度RAG还可综合不同来源的信息独自判断，尤其加上百度实时和全面的搜索生态后，基于大模型逻辑推理能力，就可一举解决信息冲突等问题，从而生成准确率高、时效性好的答案。事实上，自文心一言发布初，百度便一直强调检索增强，随后经过近两年技术沉淀，百度的检索增强能力不断提升的同时，也让该能力的价值，受到业界一致认可。并且，百度即将推出的文心大模型4.5，更在百度自研的iRAG等技术加持下，可将百度搜索的亿级图片资源与自身强大的基础模型能力相结合，从而生成种类繁多的真实图片。甚至，iRAG可以做到在生成特定物品、特定人物以及特定人物与任意背景结合的图像时，在准确率、真实性上都有显著突破，极大减少幻觉。其呈现的整体效果，将会远远超过文生图原生系统，不仅能够去掉了Ai味儿，而且成本很低，在使用场景上，不论是影视作品、漫画作品，还是连续画本、海报制作等领域，无疑带给用户留有大量施展才华的空间。一个可以预见的例子是，在文心大模型4.5正式上线后，用户如果有品牌宣传的需求，则可以借助iRAG技术下，在几乎0成本操作中，像素极复刻以往大片宣传海报动辄需要一二十万，甚至大几十万成本的图片。此外，文心一言还将上线的深度搜索功能，可为用户提供专家级内容回复，实现多模态输入与输出。不仅如此，深度搜索功能下，还能提供多项工具调用，包含了高级联网、文档问答、图片理解等功能，在用户处理多场景任务中，效能无疑将得到极大提升。值得注意的是，先前的2月27日，百度准备发布文心大模型4.5消息一经公布，2月28日的凌晨，OpenAi则迅速发布了GPT-4.5模型。似乎，双方正在暗自较劲。不过，OpenAi的发布或许略显仓促。据报道，OpenAi前员工安德烈·卡帕西，曾提前体验了GPT-4.5后，认为GPT-4.5主要提升在非推理密集型任务上的改进，这些任务多与情商有关，而在数学、代码等领域，GPT-4.5并不拥有最强的能力。当然，GPT-4.5与文心大模型4.5双方具体表现如何，仍有待进一步验证。不过，从先前文心一言和ChatGPT对比来看，文心一言在中文语境与本土化上，往往有着GPT难以比拟的优势：尤其在问答准确性、实时性上，文心一言的幻觉较少，对时事的反应也更加迅捷。从这点上说，百度的文心大模型4.5的深度思考能力，加上自身极强的多模态功能，对中国用户而言，或许在未来能有更好的体验。例如，从RAG能力实测来看，在国内外主流大模型中，百度文心一言综合表现一直属于第一梯队。即使是春节档电影细节、春晚节目等内容，文心一言都可以准确回答，做到文能对题，相比之下，OpenAi虽能检索到信源，却无法生成准确回答。更重要的是，文心一言将于4月1日全面免费，PC端和App端用户均可体验。与之相对的是，GPT-4.5虽接入API，但OpenAi计划逐步转向GPT-5的免费基础版（额度受限），付费用户需升级至Plus/Pro版本。从这点上说，免费且开源的文心大模型4.5，起码在普惠性上，将带给用户更多的诚意。

开放，不仅仅是一种姿态

DeepSeek横空出世后，浪潮风波席卷全球。对此，百度却没有故步自封，反而动作频频，持续以一种开放的姿态，直面变化。

此前的2月13日，文心一言就正式宣布，将于4月1日起全面免费，所有PC端和App端用户均可体验文心系列最新模型，以及超长文档处理、专业检索增强、高级Ai绘画等功能，一举引起社会广泛讨论。一天后的2月14日，百度接着宣布，将在未来几个月陆续推出文心大模型4.5系列，以及在6月30日起正式开源。两天的2月16日，百度的开放，也延续到了对DeepSeek态度上：彼时，百度将全面接入DeepSeek和文心大模型最新的深度搜索功能。并且，搜索用户可免费使用DeepSeek和文心大模型深度搜索功能。在百度全面转向开源、开放的战略转轨下，百度旗下的搜索、地图、小度等也相继接入 DeepSeek，由此，Ai浪潮引发产品升级的红利，也不断分享到了更多百度系的用户。从大模型到搜索，百度的开源、免费，共同打出了一套开放“组合拳”。从这点上说，在李彦宏带领下的百度，无疑正展开了一场自我变革，此时，决心和勇气缺一不可。更重要的是，在这场开放过程中，又将会带给用户、公司、乃至整个行业哪些真正的价值？对此，先前李彦宏曾谈到，开源4.5系列的决策，源自于对技术领先地位的坚定信心，开源将进一步促进文心大模型的广泛应用，并在更多场景中扩大其影响力：“我想强调的是，无论开源闭源，基础模型只有在大规模解决现实问题时，才具备真实价值。”可以说，大模型烈火烹油的两周后，以OpenAi、百度等为首的头部玩家，已将这场大模型的竞争，步步进逼，终于向应用层面全面进击。此时，百度也在用一种更加开放的策略，试图去占据大模型第二场的主动权。而在这场竞争中，更多应用层面的创新，无疑将惠及全球范围内，越来越多的用户。

“技术”如何打败“故事”？

“过去，我们谈论摩尔定律时，每18个月，性能水平或价格都会减半。但是今天，当我们谈论大语言模型时，增加的成本基本上降低了，可以在12个月内降低90%以上”百度CEO李彦宏在世界政府峰会上，曾如此说道。事实上，能够在DeepSeek冲击中迅速调整船头，而不一味固守“闭源”，这既是百度战略转折的勇气，也离不开百度长年以来技术沉淀的支撑。

李彦宏曾谈到：“不仅在Ai领域或IT行业，回顾过去几百年的历史，大多数创新都与降低成本有关。如果成本降低一定比例，生产力也随之提高同样比例，这就是创新的本质。在今天，创新速度比以往都快得多。”事实上，Ai行业发展至今，“技术实力”正在取代“故事性”，逐渐成为该行业的核心竞争力。从这点上说，当下，能够撑起百度文心大模型强功能、快更迭、免费开源的根本，则源于百度在技术上的底气。其中，百度在大模型上训练成本的持续降低，也离不开百度昆仑芯和百舸平台的助力。近期，百度智能云成功点亮昆仑芯三代万卡集群，这也是国内首个正式点亮的自研万卡集群。据悉，百度智能云将进一步点亮三万卡集群。值得注意的是，昆仑芯万卡集群具有极强的规模效应，大规模集群可以通过任务并行调度、弹性算力管理等方式，提高计算资源利用率，避免算力闲置，提高单任务的计算效率，降低整体算力成本，最终实心可大幅提高资源利用率。这也意味着，在昆仑芯万卡集群规模效应的作用下，百度大模型的推理和训练所需的计算量一直在持续减少，从而直接降低算力成本。不仅如此，百度的百舸平台，还能对大规模集群进行高效的部署管理。例如，为解决大模型训练时高通信带宽的需求，百度不仅建设了超大规模HPN高性能网络，还可通过优化的拥塞控制算法、集合通信算法策略，提升了通信效率，将带宽有效性提升到90%以上。同时，由于万卡集群的能耗极高，常规的散热方案能耗可达十兆瓦或更高，这将提升企业进行模型训练的电力成本，为此，百舸还采用了创新性散热方案，可以有效降低能耗，进一步降低模型训练成本。此外，为提升GPU 的有效利用率（通常用MFU来表示GPU的有效利用率），百舸还在持续优化并完善模型的分布式训练策略，通过高效并行化任务切分策略，将训练主流开源模型的集群MFU提升至58%。以及，为了保证大规模集群执行训练任务的稳定性，百舸提供全面的故障诊断手段，可快速自动侦测到导致训练任务异常的节点故障。加上百度自研的BCCL，目前已经将故障恢复时间从小时级降低到分钟级，保障集群有效训练率达到98%。于是，当以上技术形成源源不断的合力后，到了24年初的财报电话会上，李彦宏则表示，文心大模型的推理成本，已经已降低至一年前的1%。此次文心大模型4.5能够迅速推出，最大的原因之一，或许源于推理成本不断降低。对此，有观点指出，百度在模型推理部署上的优势，尤其是在飞桨深度学习框架的支持下，其中并行推理、量化推理等都是飞桨在大模型推理上的自研技术。受此影响，飞桨和文心的联合优化，则可以实现推理性能提升，推理成本降低。而面对机遇与风险并存的未来，人们可以预见的是，文心大模型4.5的推出以及近期百度频频开放的动作，远远不是终点——“我们仍需对芯片、数据中心和云基础设施进行持续投入，来训练更好、更智能的下一代模型。”李彦宏曾谈到。

玩酷网

百度的开放，不仅仅是种姿态

银杏科技