文小言官宣:支持多模型调度,升级全新语音大模型、图片问答能力

未来图灵 2025-03-31 18:29:29

3月31日,在新一期百度AIDAY上,百度旗下的文小言正式宣布完成品牌焕新与功能升级,以崭新的姿态进军AI应用市场,为用户带来更为智能、高效的使用感受。此次升级不仅体现在品牌视觉形象的焕然一新,更聚焦于模型开放与功能创新,通过支持多模型融合调度,升级全新语音大模型、图片问答、AI生图生视频等多项核心能力,为用户构建了一个全方位、多层次的AI交互体系。

图片来源:未来图灵拍摄

百度AI产品创新业务负责人薛苏强调:“AI的未来不再是单纯的技术参数比拼,而是如何通过多模型协同,真正为用户创造价值。文小言希望通过开放生态,整合顶尖模型能力,打造出更强大、更易用的AI产品。”

多模型融合,铸就AI“超级大脑”

据介绍,文小言此次升级的核心亮点在于“多模型融合调度”。它整合了百度自研的文心X1、文心4.5等顶尖模型,并接入DeepSeek-R1、可灵等第三方优质模型,实现了多模型间的智能协同。用户只需选择“自动模式”,文小言就能依据用户的需求和问题特性,智能匹配并一键调用最优模型组合;用户也可根据自身对模型的了解及特定任务需求,灵活选择单一模型执行任务,大幅提升响应速度与任务处理能力。

在实际应用中,文小言的多模型融合调度展现出强大的优势。当用户提出“设计三种风格的南偏东客厅效果图”的需求时,文小言能够迅速精准解析装修风格差异,调用文心X1完成深度推理,从空间布局、色彩搭配到家具选择等多个维度进行构思,最终生成三幅风格迥异但视角一致的装修效果图,满足用户对多样化设计的需求。而当用户随手拍摄一张茅台镇的照片并询问相关信息时,文小言可调用文心4.5的多模态分析能力,精准识别出照片中的地理位置、当地产业、建筑风格等详细信息,为用户提供全面且深入的解读。

功能升级,解锁AI应用新场景

除了多模型融合调度这一核心升级外,文小言在功能层面也实现了全面突破,进一步提升了全新语音大模型、图片问答、AI生图生视频等能力,全方位优化用户体验。

全新语音大模型为用户带来了前所未有的交互体验。该模型支持方言对话,无论是重庆话的火辣热情、广西话的独特韵味,还是河南话、广东话、山东话等各具特色的方言,文小言都能流畅识别并进行回应,让用户在与AI交流时感受到浓厚的地域亲切感。

同时,它还能应对复杂知识问答,无论是科学难题、历史典故还是文化艺术等方面的问题,文小言都能凭借强大的知识储备和智能分析能力给出准确解答。此外,用户在交流过程中可以随时打断,进行趣味角色扮演,如模拟与名人对话、进行故事接龙等。

百度语音首席架构师贾磊透露,该模型是百度在业界首个推出、基于全新互相关注意力(Cross-Attention)的端到端语音语言大模型。

在语音场景满足一定交互指标下,大模型调用成本比行业平均降低50%-90%,推理响应速度极快,将语音交互等待时间压缩至1秒左右,极大提升了交互流畅性。同时,在大模型加持下,实现了流式逐字的LLM驱动的多情感语音合成,情感饱满、逼真、拟人,交互听感也得到极大提升。

图片问答功能同样是此次升级的一大亮点。用户可以通过拍摄或上传图片,以文字或语音提问的方式直接获取深度解析。

在教育领域,学生拍摄一道数学题,文小言可实时生成解题思路与视频解析,帮助学生理解题目背后的知识点和解题方法,就像拥有一位随时在线的专属辅导老师。在购物场景中,用户上传多款商品图,文小言能快速对比参数、价格,辅助购物决策,帮助用户挑选到性价比最高的商品。对于设计师而言,拍摄杯子设计图后,AI可自动解析风格并生成同款手机壳、支架等周边产品,为设计灵感的拓展和产品衍生提供了便捷途径。

值得一提的是,新增的“图个冷知识”功能更富趣味性。用户可预设“历史学者”“科技达人”等人设视角,为同一图片赋予多维解读。当用户询问“猫窗探秘,为何猫爱窗边的科学真相?”时,文小言能从狩猎本能、能量获取、领地意识等多个角度给出独特解读。

薛苏在现场表示,模型竞争之上是产品竞争,再之上是营销竞争。就当前大模型领域来看,模型竞争最为激烈,其次是产品竞争,最上层是营销竞争。由于模型和产品发展迅猛,其实最好的营销就是模型本身的技术实力,传统营销手段虽有作用,但会被模型与技术发展弱化。所以,文小言格外关注模型侧和产品侧进展。

他认为,模型侧呈现几个趋势,一是模型愈发强大,像传统推理模型、知觉模型的通用大模型都在变强,多模态模型也越来越多且性能提升。而在应用层、产品层,还有很多可做的事。如何利用好新模型,真正解决用户实际问题,是产品层当下重要之事。

“百度在模型层和产品层都在发力。一方面,我们有更好的自研模型,也在合理调度外部模型。作为AI创新产品负责人,我们团队核心精力聚焦于产品创新,要把综合模型更好地应用起来,在模型基础上构建最好的应用是我们接下来的重点。今天谈到的应用只是开端,未来我们会致力于做好应用,为大家提供真正好用的产品,也请大家期待我们未来更多更好的产品。”薛苏说道。

0 阅读:1

未来图灵

简介:智能共创,共建未来