2025年2月18日,中国大模型创业公司阶跃星辰与吉利汽车集团联合宣布,面向全球开发者开源两款多模态大模型——Step-Video-T2视频生成模型与Step-Audio语音交互模型。这一举措不仅标志着DeepSeek在开源AI领域的领先地位进一步巩固,也将显著促进大模型技术的共享与创新,推动人工智能的普惠发展。
参数规模:300亿
视频质量:可生成204帧、540P分辨率的高质量视频
技术特点:在运动流畅性、画面一致性及多语言指令理解等方面表现卓越
Step-Audio语音交互模型
技术特点:支持多方言、多语种及情感化语音生成
性能表现:在LlaMAQuestion、WebQuestions等五大主流公开测试集中性能卓越,尤其在HSK-6(汉语水平考试六级)评测中表现突出。
对DeepSeek的意义
DeepSeek通过与阶跃星辰的合作,不仅增强了自身的技术实力和市场竞争力,也进一步巩固了其在开源AI领域的领先地位。此次开源的两款大模型,将进一步丰富DeepSeek的应用场景和服务能力,为用户提供更加智能和多样化的体验。
这两款大模型的开源,将促进全球开发者之间的交流与合作,推动大模型技术的共享与创新。同时,也将有助于降低AI技术的使用门槛,推动人工智能技术在更多领域的应用和发展。