腾讯推出全新开源视频模型“浑元视频-I2V”

在腾讯向开发者推出全新开源的“浑元视频-I2V”模型后，国内人工智能视频生成技术领域的竞争愈发激烈。

该图像转视频模型以腾讯去年12月推出的开源浑元视频基础模型为依托，用户仅需通过简短的文字提示，就能将静态照片转化为最高129帧（即5秒）、分辨率达720像素的高清晰视频片段。

腾讯通过GitHub和HuggingFace等在线开发者平台，大力推广了这一全新模型。

据腾讯介绍，用户不仅能运用浑元视频-I2V生成视频，还可以在视频中添加对口型配音和背景音效。在腾讯发布的一段演示视频中，爱因斯坦吃苹果的画面栩栩如生，还伴有清脆的咬苹果声音效果。

一年多前，ChatGPT的创建者OpenAI凭借Sora文本转视频模型，令全球开发者为之震撼。如今，中国本土AI视频生成产品领域正变得日益拥挤。这一领域涵盖了快手、字节跳动以及阿里云推出的极具竞争力的产品。

去年12月，浑元视频免费向企业和个人用户开放时，腾讯宣称其是全球最大的开源视频生成模型，拥有超过130亿个参数——这一参数是衡量人工智能系统在训练过程中变量数量的重要指标。

玩酷网