日前,百度正式发布新一代原生多模态基础大模型文心大模型4.5(以下简称为文心4.5),以及首个能够自主运用工具的深度思考模型文心大模型X1(以下简称为文心X1)。同时百度方面表示,"2025是大模型技术全面迭代的一年,我们将在AI、数据中心、云基础设施上更大胆地投入,打造更好、更智能的下一代模型"。
据了解,通过多个模态联合建模实现协同优化,文心4.5具备优秀的多模态理解能力,能对文字、图片、音频、视频等内容进行综合理解,同时文心4.5的理解、生成、逻辑、记忆,以及逻辑推理、代码等能力均有所提升。据悉在多项测试中,文心4.5的表现已优于GPT-4.5。

据百度方面透露,文心4.5能力显著增强,与FlashMask动态注意力掩码、 多模态异构专家扩展技术、时空维度表征压缩技术、基于知识点的大规模数据构建技术等技术相关。以FlashMask动态注意力掩码为例,该技术能够加速大模型灵活注意力掩码计算,有效提升长序列建模能力和训练效率,优化长文处理能力和多轮交互表现。
而文心X1则具备更强的理解、规划、反思、进化能力,并支持多模态,号称在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现“尤为出色”。据悉,作为首个能自主运用工具的大模型,文心X1目前已支持高级搜索、文档问答、图片理解、AI绘图、代码解释器、网页链接读取、TreeMind树图、百度学术检索、商业信息查询、加盟信息查询等多款工具。
据了解,目前这两款模型均已在文心一言官网上线,并免费向用户开放。同时,百度搜索、文小言App等百度旗下产品,也将陆续接入文心4.5和文心X1,为用户带来更多元的体验。
目前,文心4.5已上线百度智能云千帆大模型平台,后续文心X1也即将在上线该平台。价格方面,文心4.5输入价格为0.004元/千tokens,输出价格为0.016元/千tokens,约为GPT-4.5价格的1%,文心X1输入价格为0.002元/千tokens,输出价格为0.008元/千tokens,约为DeepSeek-R1价格的50%。