去年号称大模型技术元年,智能座舱的演进进入了新阶段:大语言模型上车。
智能座舱通过运用大模型,将提供千人千面的语音识别、娱乐信息,以及驾驶辅助的个性化定制服务,让座舱具有了深度进化的能力。
新能源、电动化、大模型就这样把智能座舱推向了新阶段,其中大语言模型更成为车企推动座舱交互的重要技术手段,借助AI,很多智能汽车都号称座舱中拥有了一个更懂你的虚拟助理。
AI的强大一定会来带座舱交互的强大吗?如今的智能座舱,尤其是语音交互是否真的带来了颠覆式的体验?同时,随着车企们力推大模型上车,新技术加持下的不同车型,如何来实现智能座舱的差异化?
你的车机可能没有想象中懂你随着大语言模型上车,很多车企在用户体验层面,也更注重座舱的语音交互以及多屏互动能力,这其中,大语言模型发挥的作用就是,以其知识储备及语义理解能力进行拟人交互,提升座舱交互,尤其是与车机对话的体验。
所以在如今的新车中,我们也可以发现,可见即可说、连续交互能力、个性化的娱乐信息已经成为智能座舱交互的新卖点。
但是很多调研中都显示,用户对自家汽车的座舱交互仍然有诸多不满意。
比如,随着更多新车开始配备副驾屏、后排屏,用户与屏幕的交互体验并没有显著提升。
比如,对于基于用户的个性化信息生成能力,很多车型并没有因为大模型上车而增强。
目前,借助车内语音助手,很多用户频繁使用的功能主要集中在车辆控制,和简单的问答。而与车机的深度对话能力,很多用户在体验几次后就放弃了。
交互内容不够丰富、语义理解能力不够,娱乐推荐不够个性化,随着汽车进入大模型元年,距离用户期待的定制化座舱体验,似乎并没有一步到位。
一方面,很多车企的大语言模型训练数据是基于固定的通用语料库,这意味着大模型在训练后无法实时更新信息,也就是说,很多大模型本身的基座模型,其训练语料依然停留在某一个版本的节点,而非实时更新。
对于在线实时更新信息的训练,现阶段的大语言模型仍然是匮乏的。
另一方面,大语言模型上车,并不意味着就能带来足够的内容专业性。
如今家庭用车市场火爆,在一家人出行的场景中,经常会遇到一个问题,热爱提问的小朋友总是随时提问,很多问题家长也不能马上解答。
这种场景如果发生在车上,就非常考验语音助手的能力了。
在大语言模型的研究中就有专业人员提到,大语言模型本质上只是文本生成器,如果文本不是表现的最佳形式或不是表达的任务,大语言模型的表现就会受到限制。
这时候就要借助“外挂”的帮助,而联网智能体,在此时就能很好地发挥作用。
图源:火山引擎
联网智能体可以补充大模型在线知识,拓展大语言模型的能力。
当语音助手可以调用足够的内容信息,再基于自己的能力去理解回答,此时的语音助手才会更加强大。
其实燃油车的座舱交互并不一定都拉垮随着新能源、智能化的深入,在技术层面我们已经了解到,电动车架构为整车智能打下了技术基础,让新能源汽车成为了汽车智能化的急先锋。
在这种对比之下,燃油车就成了智能汽车时代的“落后分子”。
而事实上,所谓的传统车企并没有放弃智能化,目前市场上一些燃油车型的座舱交互能力也不比新能源汽车差。
比如最近改款的某豪华车品牌的新车型,最大的变化就在智能座舱层面。
该豪华品牌车型不但升级了8295芯片、第三代智能交互系统,还可以支持AI生成场景和个性化场景。比如,升级后的读心语音助理,让这样一款老牌儿燃油车的座舱,也具备了基于用户习惯的专属场景模式。
该豪华品牌在座舱层面的软硬件迭代,让其座舱得到了“重生”。
燃油车们在努力补强智能化短板的同时,如今市场上很多号称搭载8295芯片、大模型上车的新能源汽车,在座舱交互层面的能力表现差异依然很大。
这是因为,当前的大模型技术依然没有充分挖掘出可利用的数据信息和服务场景,因此,它所提供的智能化水平和交互能力,在眼下还有很大的进阶空间。
如今车企都在积极拥抱大模型,并将智能座舱作为大模型的切入点。
并且,目前汽车市场中,新能源汽车与燃油车几乎各占一半市场份额。这也意味着,基于不同的细分市场和定位,燃油车同样在强化个性的智能化体验,借助数字化技术寻求升级。
图源:网络
新能源汽车则在挑战智能交互的新高度,在推动智能座舱快速渗透的同时,整个汽车行业在智能化层面,也进入了一个前所未有的激烈竞争中。
国泰君安的调研显示,2021年,中国市场智能座舱新车渗透率为50.6%,2024年中达到72.1%,2025年,其渗透水平预计将超过75%。
当然,我们比必须面对一个现实:
大模型赋能智能座舱虽然已经成为主流趋势,但是座舱多模态交互与个性化内容体验在短时间内并不会因此被拉到新的高度。
大模型生态,推动人机交互更进一步虽然没有先天的架构优势,但是该豪华车品牌擅长利用生态圈资源。
8月,该豪华车品牌与火山引擎签署战略合作备忘录,双方计划在大模型、生成式人工智能(AI)和大数据等前沿技术领域展开深入合作,目的在于重点提升智能座舱的多个核心功能。
实际上,在过去火山引擎与该豪华车品牌的合作中,就通过结合车辆驾驶特性、便捷性,激发用户探索兴趣,提升车上用车体验,完成车+生活端的基础打通。这样做,一方面提升了该豪华车品牌在家庭场景形象、智能交互体验、激发驾驶探索乐趣;同时能够扩大该豪华车的品牌议价,通过开启生活的新终端,为后续车上服务提供接口,植入生活、旅行等新场景提供可能。
联网智能体为该豪华车品牌带来了符合其品牌调性的座舱交互场景。实际上,它的能力还有很多。
火山引擎联网智能体通过提供互联网内容,可以帮助大语言模型扩展其实时信息获取能力,实时搜索网络并生成答案,实现实时性更高、更新、更全面的回答,从而提升用户体验和回答效果。
火山引擎联网智能体演示
那么,首先当然要清楚,火山引擎联网智能体的资源来自于哪里。实际上,这一联网智能体背靠整个抖音集团内容生态,比如抖音、西瓜视频、头条,这些都是音视频领域头部且不可复制的内容资源。
另一层面,我们也需要知道,大模型时代,联网智能体能起到什么作用。
基于内容资源优势,联网智能体能够提升大模型能力的信息增强和交互增强。其中包括:提供大模型自身无法获取的信息,提升回答效果;同时,在C端展示内容卡片,并视频化解读用户问题,升级交互体验。
也就是说,除了文本式的常规回答,联网智能体还可以进行视频解读,比如展示一道菜的做法,推荐有趣的地方。
这对于目前很多定位为家庭用车、配备了副驾屏、后排娱乐屏的多屏幕车型来说,就可以利用屏幕,丰富交互的场景化。
火山引擎联网智能体在与车企的合作中,也会基于车型来及其用户定位,来进行定制化调整。
一方面,借助联网智能体更为丰富的信息,以及其本身的大模型推理能力,先将内容经过预选分类梳理,检索过程垂直内容知识场景,让内容信息更精准。在人与语音助手的交互中,在通用泛化的问答场景里,给出最优组合答案。
同时,这种交互不但提升了与车内语音助手的交流能力,也能改变车载端人找内容的传统模式,通过大模型加持的助理场景建立内容触达的新模式。
内容层面,火山引擎联网智能体主要是聚焦三个车主需求:查询问题、娱乐消费、出行决策。这也是如今智能座舱中需求最高但难以被充分满足的场景。
如今,大模型上车已经成为很多车企推动智能化转型的新趋势,与此同时,智能座舱作为核心功能,在加速向汽车市场渗透的同时,也是用户最为关心的体验之一。
如何带来更高层次、更具差异化的智能座舱交互体验,火山引擎联网智能体提供了一个可行性路径,对于致力于大模型探索的车企,更能起到事半功倍的效果。
** 头图由豆包 AI 生成,提示词:大语言模型,AI,智能座舱,语音交互