
在腾讯向开发者推出全新开源的“浑元视频-I2V”模型后,国内人工智能视频生成技术领域的竞争愈发激烈。
该图像转视频模型以腾讯去年12月推出的开源浑元视频基础模型为依托,用户仅需通过简短的文字提示,就能将静态照片转化为最高129帧(即5秒)、分辨率达720像素的高清晰视频片段。
腾讯通过GitHub和HuggingFace等在线开发者平台,大力推广了这一全新模型。
据腾讯介绍,用户不仅能运用浑元视频-I2V生成视频,还可以在视频中添加对口型配音和背景音效。在腾讯发布的一段演示视频中,爱因斯坦吃苹果的画面栩栩如生,还伴有清脆的咬苹果声音效果。
一年多前,ChatGPT的创建者OpenAI凭借Sora文本转视频模型,令全球开发者为之震撼。如今,中国本土AI视频生成产品领域正变得日益拥挤。这一领域涵盖了快手、字节跳动以及阿里云推出的极具竞争力的产品。
去年12月,浑元视频免费向企业和个人用户开放时,腾讯宣称其是全球最大的开源视频生成模型,拥有超过130亿个参数——这一参数是衡量人工智能系统在训练过程中变量数量的重要指标。