阶跃星辰与吉利宣布联合开源两款多模态大模型

金羊网汽车 2025-02-18 14:23:38

金羊网讯   2月18日,阶跃星辰和吉利汽车集团联合宣布:将双方合作研发的两款阶跃 Step 系列多模态大模型向全球开发者开源。其中,包含目前全球范围内参数量最大、性能最好的开源视频生成模型阶跃Step-Video-T2V,以及行业内首款产品级开源语音交互大模型阶跃Step-Audio。

据了解,从2023年开始,吉利便与阶跃星辰在预训练大模型、垂直领域大模型、应用场景设计、工程开发等方面展开了深度合作。其中,吉利牵头了场景设计、模型测评、工程开发等业务,阶跃星辰主导了模型预训练等业务。

阶跃Step-Video-T2V大模型参数量达到300 亿,可以直接生成 204 帧、540P 分辨率的高质量视频。阶跃Step-Audio大模型能够根据不同的场景需求,生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地高质量对话,是行业内首个产品级的开源语音交互模型。

而吉利星睿AI大模型中的AI Drive大模型,则具备强大场景生成与规划能力,能够根据雨雪等不同天气光照条件、道路结构、拥堵路况、立体车库和不常见的交通目标,构建出真实驾驶中的极端驾驶场景。基于真实的驾驶视频数据去优化阶跃Step-Video-T2V,可以将它变成一个自动驾驶数据合成器。星睿AI大模型正在探索将这些丰富的合成场景转换成“以假乱真”的训练数据,相当于自动驾驶系统打造了一个丰富的"虚拟驾考考场",从而显著提升车辆在智驾行驶时面对各种路况的应变能力。

具备了阶跃Step-Audio大模型超强交互功能后,吉利星睿AI大模型可以大幅提升语音指令响应速度,以及交互过程的情感理解与表达能力。当用户说“导航,快迟到了”的时候,系统会自动规划更快路线,还会主动询问是否需要播放轻音乐缓解情绪。同时,系统可识别粤语、四川话等丰富的方言,同时会支持个性化声音定制,用户既可以选择系统提供的人声音色,也能录制孩子的笑声制作专属提示音。

目前,基于“智能汽车全域AI”技术体系打造的AI银河精灵、Flyme Auto 智能座舱、无界空间、AI云动力、AI绘本、AI哨兵等一系列AI应用,已在银河E8、银河E5、银河星舰7EM-i等车型上搭载。今年3月初,吉利还将对外发布AI智能化战略。

(文/晓航 图/官方提供)

0 阅读:14

金羊网汽车

简介:华南地区权威汽车资讯发布平台