总部位于北京的生数科技表示,其人工智能文本转视频工具Vidu现可通过组合图像来生成视频。
Vidu已允许全球用户根据书面提示制作8秒视频。尽管OpenAI在2月份透露其AI模型 Sora可以根据文本生成一分钟的视频,但尚未公开发布。
生数科技表示,Vidu新AI功能可将三张图片(例如一件衬衫、一个人和一辆轻便摩托车)组合成一段视频,视频中,一个人穿着衬衫,骑着轻便摩托车穿过某个场景。
相比之下其他平台声称可以采用人工智能将文本或图像转换为视频,但输出质量参差不齐。生数声称的突破是能够拍摄三张独特的图像并将它们以视觉一致性整合到人工智能生成的视频中。
“我们很早就发现(视觉一致性)是个问题,并希望很好解决这个问题。”生数首席技术官鲍凡表示。
Vidu于4月推出,其将两张个人资料照片转换成栩栩如生的拥抱视频的功能在TikTok上走红。
据称这款AI视频生成器已盈利,生数科技联合创始人兼首席执行官唐家渝表示,为了解决版权问题,公司可能会与艺术家签订协议,允许人工智能模仿艺术家的绘画风格来制作广告。
生数科技成立于去年,其支持者包括百度风投、阿里旗下蚂蚁集团、智谱AI、启明创投;唐家渝表示,Vidu人工智能依靠国内外租用的云服务器运行。