智谱AI也杀进了视频生成之战

市界噗柔说 2024-07-31 01:19:09

Open AI在今年年初发布的Sora,毫无疑问带来了AI大模型的全新玩法。它是一个文本到视频模型(即文本生成视频),AI可以基于任意的文字生成视频,将大模型应用也带到了一个全新的高度。

对标Sora,国内卷起了视频生成大战。像快手就推出了视觉生成大模型可灵、可图,大模型赛道看到了新的“弯道超车”可能。 在Sora还没有向公众开放时,国内也已经有了抢先面向公众、瞄准2C领域的玩家。

7月26日,在智谱AI开放日活动上,智谱AI首席执行官张鹏正式发布了AI生成视频模型“清影”(Ying),即日起面向所有C端用户开放AI文生视频、图生视频能力,杀入了这一领域。在清影上输入一段文字后(俗称Prompt),用户可以选择自己想要生成的风格,包括卡通3D、黑白、油画、电影感等,配上清影自带的音乐,就生成了充满AI想象力的视频片段。

除此之外,用户也可以在清影上玩“图片生成视频”,功能中包括表情包梗图、广告制作、剧情创作、短视频创作等。同时,基于清影的“照片动起来”小程序也同步上线,用户只需一步上传照片,AI就能让照片变得灵动起来。

据「市界」了解,清影(Ying)的付费方案是:在首发测试期间,所有用户均可免费使用,不限次数。此后,付费 5 元可解锁一天(24 小时)的高速通道权益,付费 199 元可解锁一年的付费高速通道权益。

“清影底座的视频生成模型是CogVideoX,它能将文本、时间、空间三个维度融合起来,参考了Sora的算法设计,它也是一个DiT架构,通过优化,CogVideoX 相比前代(CogVideo)推理速度提升了6倍。我们将继续努力迭代,在后续版本中,陆续推出更高分辨率、更长时长的生成视频功能。”张鹏表示。

至于为什么要做多模态这件事,张鹏称,放到整个技术和产品发展路线当中来看,“我们认为它是AGI必须走的路径”。而一直以2B作为主要商业模式的智谱AI,也在2C业务上逐步做出尝试。此前,智谱AI已经打造了人工智能助手清言APP。智谱方面也表示,大模型能真正让用户用上,才更加“大有可玩”。

智谱AI正在商业化道路上狂飙。同时,它也正开始加速投资大模型创业者,扩大自己的“朋友圈”。仅在今年,其已投资了生数科技、硅基流动等大模型企业。今年7月,据天眼查信息,智谱AI、星连肇基、京成燕北三方共同出资2.6亿元,成立一支新投资基金——北京星连鼎森股权投资基金合伙企业(有限合伙)。

据了解,清影的研发得到北京市的大力支持。当前,北京正在打造人工智能产业高地,海淀区是智谱AI总部所在地,为智谱AI开展大模型研发提供了产业投资、算力补贴、应用场景示范、人才等全方位支持。清影的研发算力支持则来自于亦庄集群。北京亦庄着眼打造人工智能之城,目前,北京亦庄人工智能公共算力平台已建成。(文|杨洁,编|孙春芳)

0 阅读:5

市界噗柔说

简介:感谢大家的关注