百度文心4.5将至,大模型应用赛按下提速键

BT财经 2025-03-01 19:23:19

2月28日百度官方宣布将在3月16日发布文心大模型4.5。

在百度官宣前一天,路透社爆料了百度文心4.5将在3月中旬发布的消息,28日凌晨,OpenAI发布了GPT-4.5模型,OpenAI发布GPT-4.5的时间节点恰巧是路透社的爆料第二天。于是业内人士分析OpenAI仓促发布GPT-4.5重要原因可能是来自中国的竞争加剧。

但略显仓促发布的GPT-4.5性能被业内评价差强人意。而据百度方面介绍,文心大模型4.5不仅在基础模型能力上有大幅提升,且具备原生多模态、深度思考等能力。此前在DeepSeek大火时,百度也在2月中旬宣布,文心一言将于4月1日0时起,全面免费,所有PC端和APP端用户均可体验文心系列最新模型,并在6月30日起开源文心大模型4.5系列。

百度即将在4月和6月对文心一言“免费”和“开源”等一系列大动作,体现了百度的自信,也引发市场对文心大模型4.5的关注和期待。

文心大模型4.5定档,百度史上最强模型将至

从2019年3月百度率先开始训练大模型,并在2023年3月16日正式推出文心一言大模型,目前百度拥有超过5500亿条知识的自研知识图谱融入到文心大模型的预训练中,结合深度学习和海量的行业数据,如今已应用于百度搜索、信息流、智能驾驶、百度地图等多款产品。

百度此后每年都会进行模型迭代。百度文心大模型矩阵再添“力作”,全家桶更加丰富。在时隔两年后,百度再度发布新款大模型。据了解,3月16日发布的文心大模型4.5将具备多模态和深度思考能力,尤其是深度思考能力成为市场期待的焦点。

文心大模型4.5到底有哪些能力值得期待?

百度创始人、董事长兼首席执行官李彦宏在2月18日的财报电话会上透露,文心大模型4.5将是百度有史以来最强大的大模型,“希望客户和用户能比之前更方便地体验这款模型”。

近期文心一言上线了“深度搜索”功能,具备专家级问答能力,RAG能力突出,尤其是专业领域问答幻觉率低已经降至最新水平,以及去年百度发布自研iRAG技术,这或是李彦宏对“史上最强大模型”的信心源泉。

而OpenAI最新推出的GPT-4.5不具备多模态推理能力,还是主打写作等文本生成。相较于OpenAI 的 ChatGPT、谷歌的 Bard ,作为扎根在中国市场下的本土大语言模型是目前市面上最适合中国人使用的语言模型。

研发投入1700亿

大模型火爆至今已有三年,为什么头部玩家依然只有那些实力雄厚的大公司?根本原因在于大模型非常烧钱,不是一般企业能够玩得转。其主要成本包括硬件、电力、数据、研发团队等多个方面。

大模型的算力需求巨大,训练大模型需要高性能计算集群,单卡成本可达数万美元。以GPT-3为例,训练需约1万块GPU,训练耗时数周,仅训练成本就高达数千万美元甚至上亿美元。这还不包括高负载运行导致硬件寿命缩短,维护和更新成本。

公开数据显示,GPT-4单次训练成本约6300万美元,年运营成本超10亿美元。Google PaLM(5400亿参数):训练成本约2000万-3000万美元。即便百亿参数级模型训练成本通常在数百万美元级别。

百度能在大模型上取得让OpenAI不得不仓促发布新品的成绩根源在于舍得“砸钱”搞研发。财报显示,2019年至2024年,百度的研发费用分别为183.5亿元、195.1亿元、249.4亿元、233.2亿元、241.9亿元和221.3亿元,近4年的研发费用均超过220亿元,研发费用占总营收的比例一度在全球互联网巨头中坐二望一。2021年,在全球互联网巨头中,百度的研发占比高于谷歌和亚马逊,位居全球第二位。

目前百度的研发占比始终保持在20%左右,而全球互联网行业研发占比的平均值为3%-6%之间,比如小米研发占比4%左右,联想研发占比2.5%左右,京东研发占比1.6%左右,百度和华为成为目前国内互联网企业中研发占比超过10%的唯二两家。

财报数据显示,百度投入AI十年来累计研发投入1700亿元。在大模型领域的巨大投入,才让百度成为全球大模型的领跑者。

AI行业大震动——接连开源、免费,百度更加开放

大模型现在进入到了一个新的阶段。通过开源路线普及模型的基础,进而带动模型应用的爆发。

李彦宏在财报电话会上专门对百度即将开源进行了解读,李彦宏表示,开源4.5系列的决策源自于对技术领先地位的坚定信心,开源将进一步促进文心大模型的广泛应用,并在更多场景中扩大其影响力,“但我想强调的是,无论开源闭源,基础模型只有在大规模解决现实问题时,才具备真实价值”。未来,百度将加速推动文心大模型的性能升级与成本降低。

开源作为技术领域的核心协作模式,其价值体现在技术、经济、社会等多个维度,技术驱动层面,‌提升软件质量与安全性,‌开源代码的透明性允许全球开发者共同审查和修复漏洞,形成持续优化的技术迭代机制。开源打破了技术垄断,开发者可基于现有成果快速迭代,‌加速了技术创新。最为重要的一点是开源可以降低行业整体成本,李彦宏在谈DeepSeek时表示“历史上的创新都来自于成本降低,大模型成本每年降低90%以上”,这其中开源占据绝大部分作用。

互联网投资人史保刚对百度开源表示了赞赏,“百度在技术提速的情况下,为推动行业整体的发展,推出了免费和开源,从接入DeepSeek也体现了百度兼容和开放,这样能让百度占据大模型竞争的主动权,根源还是源于百度对自身技术的自信。”

史保刚认为百度直接将行业拉入“免费+开源”的新阶段,将大模型的使用门槛拉到极致,无疑将助推大模型应用爆发。在推动行业发展的同时也带动百度自身大模型的发展,对百度和对行业都有极大的推动作用。

使用场景和产品体验为王的时代

无论是百度文心一言还是ChatGPT-4,大模型的使用场景和产品体验设计都是决定其技术价值能否转化为实际商业或社会价值的关键。大模型的技术能力是基础,但产品体验决定了用户是否愿意持续使用,也是决定该大模型能否通过市场检验的基础。现在第一轮百模大战接近尾声,接下来是应用大战,如何让大家都有机会接入最先进的技术,落地使用场景是各大头部玩家的追求目标。

目前,百度文心大模型技术正经历从‌“能力展示”到“价值交付”‌的关键跃迁。未来三年,具备‌场景理解深度‌、‌交互友好度‌、‌价值可量化‌特征的产品,将在医疗、金融、制造等领域持续释放变革能量‌。这一进程中,技术普惠与伦理规范的双轨并行,将定义智能时代的新型生产关系。

在使用场景和产品体验为王的时代,百度文心大模型的众多场景体验已经通过市场检验,实现了“应用落地”,代表着中国大模型领域的最新技术和发展路线。这次李彦宏携“百度史上最强大模型”自信而来,在使用场景不断丰满以及应用场景真正做到落地的情况下,也让市场对百度最新力作拥有更多期待。

前有DeepSeek春节出圈,后有百度接连开源、免费,中国大模型赶超美国提速。中国在以百度为代表的企业在算法方面的巨大投入产生的强大的基础大模型是护城河,目前来看,OpenAI被“逼出”GPT-4.5的背后,是中国大模型在不断提升能力赶超美国的印证。

该文为BT财经原创文章,未经许可不得擅自使用、复制、传播或改编该文章,如构成侵权行为将追究法律责任。

作 者 | 梦萧

0 阅读:3

BT财经

简介:专业媒体,立足中国,全球视野