大模型上车,是智能汽车下半场的关键抓手。
2024年10月24日,第七届世界声博会暨2024科大讯飞全球1024开发者节成功举办,会上焕新了讯飞星火大模型的底座能力。
其中,讯飞星火在汽车行业的落地,令外界尤为关注。
当前讯飞星火大模型已落地六大车企量产车,率先开启大模型落地汽车场景的步伐。本届大会上发布的星火多语言大模型、端侧星火大模型,有望进一步推动大模型在汽车场景落地,并加速中国汽车的出海战略。
首发语音视觉虚拟人交互“三合一”,打开汽车交互想象空间
讯飞星火,越来越能打了。
国内外14项主流中英文测试集中,正式发布的讯飞星火4.0 Turbo,在其中9项测试集中实现超越。
更为重要的是,科大讯飞首发多模态视觉和超拟人数字人,在多模态上又往前迈出一大步,从现场生动的交互和逼真的超拟人交互来看,星火为大模型的落地打开了新的想象空间。
大模型时代,讯飞星火看到了万物互联和传统人机交互场景重构的机遇,在远场高噪、全双工、多语种多方言能力上,在业界率先推出了语音视觉虚拟人交互“三合一”,多模态视觉、超拟人数字人正重新定义万物智联时代的多模AIUI交互标准。
超拟人数字人,说话不再是冷漠的朗读腔,而是宛如真人般亲切,可轻松识别外部信息,情景感知能力更为全面,实现语音、视频、图文的全部联动的多模态交互。
科大讯飞研究院院长刘聪现场和超拟人数字人玩了个“角色扮演”游戏,无论是扮演孙悟空还是小猪佩奇,数字人反应都惟妙惟肖。现场,刘聪还给超拟人数字人打了个“视频电话”,他不断调整道具“孙悟空”“奥特曼”“怪兽”的摆放位置,无需拍照,超拟人数字人看视频说话,马上回应:“奥特曼和孙悟空停止了打斗,正在联合对抗怪兽 ”。
简而言之,多模态的交互,从超拟人的语音迭代为超拟人的数字人,通过语音、视频、图文全部联动交互,让AI看见“世界”。
此背景下,讯飞星火开拓汽车等领域有了更大的想象力。
随着多模态、数字人的融入,可以让汽车的理解能力、交互能力更强,同时具备超拟人、情感化的多模态表达能力,让汽车交互更有温度,让汽车延伸成为高质量的生活空间。
此外,讯飞启动了国产超大规模智算平台“飞星二号”。
讯飞星火是唯一基于全国产算力训练的完全自主知识产权大模型,不惧“卡脖子”的风险,从“飞星一号”走向“飞星二号”,可以进一步夯实国产化大模型的算力底座,让大模型生长在更加自主可控的底座之上。
首发星火多语言大模型,助力车企高质量出海
多模态之外,讯飞星火还升级了多语言能力。
行业首发了星火多语言大模型,支持英语、俄语、日语、阿语、韩语、法语、西语、葡语、德语共9种外语,涵盖了全球主流语种。
其能力整体达到GPT-4o 96%的水平,在汽车、家电、办公、翻译等行业的任务场景应用效果超过了GPT-4o。
“讯飞作为中国唯一的认知智能全国重点实验室承建单位,我们有使命有责任要做多语言大模型”,科大讯飞董事长刘庆峰表示,讯飞星火底座能力要不断提升,对标全球最好水平,同时还要针对真实应用场景做到全球最好,不断扩大多语种范围,在多语种上为世界提供第二种选择。
2023年中国汽车出海成为世界第一,多语种技术也在成为中国汽车出海的重要助力。艾媒咨询的数据显示,2023年中国汽车出海十强企业,上汽集团、奇瑞控股、长安汽车、长城汽车、吉利汽车、比亚迪、江淮汽车、东风汽车、北汽集团、中国重汽,有8家在与科大讯飞合作。
目前,讯飞智能车载语音系统已覆盖23个主要语种,搭载车型已销往亚洲、欧洲、中东、南美等地的60多个国家与地区,让海外用户体验来自中国的智能用车服务。
由此可见,坚持从技术中来,到产品中去,讯飞星火实现了技术创新与应用落地的正循环,正成为中国汽车出海的最佳拍档。
奇瑞控股集团董事长尹同跃曾在接受媒体采访时表示:“高度智能化是现在中国汽车在全球最鲜明的形象标签,也是攻占中国乃至全球市场的核心‘利器’之一。”
事实上,科大讯飞一直是奇瑞出海最坚实的伙伴。
过去二十一年,奇瑞汽车连续位居中国乘用车品牌出口第一名,背后离不开科大讯飞多语种的助力:聚焦奇瑞出海的重点区域,针对性研发英语、阿语、俄语、葡语等智能语音交互产品,成功助力奇瑞风靡全球。
如今,双方合作进一步深化。
在新款奇瑞星纪元ET上,融合星火大模型最新能力,星火情景智能座舱能够深度理解用户的自由聊天、复合指令、知识类提问等需求,实现多语种多方言免切自由交互、多情感多模态超拟人交互以及多模态状态感知等能力。
此次星火多语言大模型的发布,更好的交互体验、更优的理解能力,或将进一步推动中国汽车出海,也将推动大模型在汽车场景快速落地。
落地六大车企量产车,首发汽车端侧星火大模型
为了在车端拥有更快捷、体验更优的交互,讯飞星火行业首发了汽车端侧星火大模型,或有望加速大模型在汽车行业落地。
相比云端大模型,端侧1.3B大模型效果损失≤1%,端侧首次响应时间40ms,端云融合交互时间低至1.3s;基于汽车端侧硬件,在无网环境下也能使用。
2024年第四季度起,汽车端侧星火大模型,将率先在奇瑞、广汽、长城的车型中陆续搭载上市开售。
众所周知,大模型追求的是“端侧响应快、云侧算力强”。
响应快之外,隐私保护是另外一个端侧的优势,如若没有严格的隐私数据保护,即使大模型能力再强悍,也毫无意义。
一名业内人士告诉《电脑报》:“一个安全、可靠的大模型,必须打牢隐私地基,才有长远的发展空间,端云结合的确是最优解。”
端云结合之外,讯飞星火也在联合开发伙伴一起打造智能体生态。
智能体是最受青睐的AI应用发展方向,制作门槛虽然不高,可要抢占汽车用户的心智却并非易事,必须解决真正的“痛点”。
以星火用车助手为例,其是基于讯飞星火的智能体,结合车辆运行的行车场景与实时监测数据,可以给出专业的用车建议,堪比老司机。
譬如,遇到暴雨等低能见度路况,部分司机习惯打开双闪行车,然而这并非正确操作,星火用车助手提示“建议打开前后雾灯,不要长时间开启危险警报灯行车”。
自研智能体之外,讯飞汽车智能体平台已对接多家生态信源伙伴,涉及QQ音乐的音乐达人、爱奇艺的影视达人、支付宝的咖啡伙伴、高德地图的AI向导等,不断丰富智能体的种类,繁荣了智能体生态。
以上可见,讯飞星火推动智能交互走向智能服务,通过提供优质服务增加用户黏性,从而不断做大基本盘。
在今年1024开发者节的科博展上,讯飞星火落地的六大车企的量产车也来到现场,奇瑞星途星纪元ET、广汽埃安V霸王龙、长城蓝山、长安启源A07、大众与众ID.UNXY、江淮RF8等的亮相,也让用户真切感受到讯飞星火在汽车行业的真切落地,率先开启大模型落地汽车的步伐。