OpenAI打出王炸，Sora视频AI太猛了

“正版 Sora” 震撼发布

等了将近10个月，OpenAI终于给大家带来了旗下视频生成大模型Sora的消息。

就在今天（12月10日）凌晨，OpenAI再次震惊世界，以一场直播宣布了正式向用户开放其人工智能视频生成模型Sora。

图源：直播截图

Sora直播发布会的嘉宾由OpenAI CEO山姆·奥特曼（Sam Altman）、Sora团队负责人比尔·皮布尔斯（Bill Peebles）和阿迪亚·拉梅什（Aditya Ramesh）三人组成，共进行了一场约20分钟的直播。

在这场直播中，他们不仅详细介绍了Sora的新功能，更是展示了AI技术在视频创作上的无限可能。

据直播介绍，此次推出的 Sora 不同于 2 月份的演示版本，而是更高级的新版本Sora Turbo；

该版本称较2月版本生成速度显著加快，并且可以生成最长达20秒的视频，还能提供这些视频的多种变体。

据悉，新版Sora具有替换、删除或新增元素、重新剪辑、扩展及合并视频等功能。

具体操作中，OpenAI把他们分成了多个“按钮”。

比如，Remix（重混）功能允许用户替换、删除或重构视频中的元素，为视频创作提供了更多的灵活性。

Re-cut（重新切割）功能则能够让用户找到最佳的一帧视频，并在此基础上进行延展，创造出全新的视频内容。

图源：OpenAI直播

Loop（混合）功能则可以将两个视频进行无缝合并剪辑，创造出流畅的视频过渡效果。

Storyboard（故事板剪辑）功能则允许用户精准指定每个帧的输入，为视频创作提供了更高的精确度。

而Style presets（风格预设）功能则允许用户预设视频的风格，一键生成具有特定风格的视频内容……

Sora一经发布，OpenAI的服务器瞬间就被“挤爆”，官方网站（Sora.com）甚至直接崩溃，停止一切注册登录。

而已经开始使用的网友也发现了在发布会直播结束后，Sora的视频生成速度开始明显变慢。

对此，Altman 急忙出面安抚用户：“由于需求超出预期，我们将不得不间歇性地关闭新用户注册，并且生成内容的速度会在一段时间内减慢。我们正在全力以赴！”

图源：X

回顾今年2月，OpenAI首次发布有关Sora的预告，声称Sora是一项理解和模拟现实的基础性AI技术，是开发能够与物理世界互动模型的重要一步。

然而，在早期测试中，Sora却表现出了一些明显的局限性。

例如，在物理模拟方面，模型对物体运动的理解还不够深入，常常出现动作不协调、一些物体突然消失等问题。

此外，还有信息透露在某一次测试中，Sora存在“多余肢体”的问题，生成的生物不是多一只手指就是少一只眼睛。

另一方面，此次Sora的发布可以说只是OpenAI为期12天的产品直播活动的其中一个部分。

上周，OpenAI刚推出了更昂贵的ChatGPT Pro订阅选项，可无限制访问OpenAI最强大的AI模型。

至于Sora的收费方面，官方介绍显示：即日起，Sora Turbo已向订阅OpenAI Plus和Pro的会员开放全部功能，无需额外付费。

不过，不同的会员所拥有的使用额度则不太一致。

图源：ChatGPT官网

据悉，官方页面显示，每月付费20美元的OpenAI Plus会员，单月共有50次视频生成额度（1000积分），生成的视频分辨率最高为720p，单条视频时长为5秒；

而每月付费200美元的Pro会员，单月可慢速无限次生成视频，加速生成视频500次（10000积分），并且Pro会员可同时生成5条视频，分辨率最高可达到1080p，时长则提升到20秒。

Altman自己也发文宣传：“初期Sora的使用仍然受限，ChatGPT Plus订阅用户可以每月生成50个低分辨率视频，而ChatGPT Pro订阅用户则可以无限制地‘较慢’生成高分辨率视频，以及500个快速生成的视频。”

简单来说，就是会员通用，购买了ChatGPT的会员也可以使用对应的Sora Turbo。

此外，有不少朋友可能注意到了，或许是受其他竞品的启发，此次OpenAI对Sora采用了灵活的积分制定价策略。

据了解，如果你已是 ChatGPT Plus 和 Pro 会员，那么当你需要生成一个 480p、5s 的视频只需要消耗 25 个积分；

生成 480p、20s 的视频则需要 150 个积分；

生成所需积分 | 图源：ChatGPT官网

此外，当你使用Re-cut、Remix、Blend或者Loop这些功能或生成的作品超过5s时，需要支付额外积分，功能用得越多、时长越长扣得也越多。

额外所需积分 | 图源：ChatGPT官网

因此，纵使Sora带来了许多颠覆性的AI功能，想要注意体验也需要付出一定的代价。

有些用过多家视频AI的用户则表示，Sora是他们用过最贵的文生视频大模型。

“对标 Sora”成为现实

随着Sora Turbo的正式发布，“对标Sora”的话题又一次引起了关注。

自2月份Sora预告发布以来，Sora一度销声匿迹，OpenAI对外界也一直保持沉默。

与此同时，国内市场上却涌现出了众多文生视频大模型，如快手可灵AI、智谱清影AI、海螺AI等。

在这些国产视频AI发布时，不少科技媒体第一时间将它们广泛地与Sora进行对比，并打上了“对标Sora”、“国产Sora”等标签。

但一些业内人士对此并不认同，他们始终认为，这些AI与Sora并非同一概念，之间有着本质上的差别。

如今，随着更高级的Sora Turbo正式亮相，是时候通过具体的效果展示为这场"对标"争论画一个句号。

那就先来聚焦官方的直播演示。

在长达数十分钟Sora的功能展示中，OpenAI通过直播向外界展示了Sora的强大能力：

能够生成最高1080p分辨率、最长20秒、支持16:9/1:1/9:16等多种画面比例的视频。

图源：Sora官网

用户可以输入文字或上传图像，利用全新上线的UI界面对生成的视频进行修改、创建、扩展、循环、混合，甚至完全基于文本生成全新的内容。

OpenAI强调，Sora无法实现一键生成一段故事片，而是需要不断优化。

例如，如果用户需要生成一段较长的视频，则需要打开分镜（Storyboard）功能，该功能打开后将在页面上展示四个视频，用户可以从不同视角了解视频细节。

图源：OpenAI直播

点击分镜中的视频，用户可以在描述框输入具体的提示词，也可以设置风格、画面比例、时长、分镜个数、分辨率等元素。

一切就绪后，一条完整的视频随即就能生成。

如果说听上去依然很空洞，别着急，接下来给大家展示OpenAI直播中演示的具体案例。

直播中，OpenAI团队在描述框中输入了“一只黄尾白鹤站在小溪里”的提示词，并把生成出的视频放在了时间轴的前面部分；

随后，他们又在新的描述框中输入提示词“这只鹤将头探入水中并叼出一条鱼”，并把这段视频放在了同一个时间轴的后半部分。

两段视频并不连续，但Sora可以自行生成中间的过渡片段，使之成为一段完整的视频。

图源：OpenAI直播

在另一个演示中，OpenAI展示了如何用Remix工具改变视频中的物体，从而优化你想要的视频。

例如，在前面分镜部分的演示中，OpenAI给出的提示词为“长毛猛犸象走过沙漠景观”；

而在后续的优化提示框中，可以直接输入“把猛犸象变成「机械猛犸」”，就得到了下面这样一条视频。

图源：OpenAI直播

更多奇妙的功能等待着用户们自行去探索，这里不做过多赘述。

小编更希望聊一聊的是，Sora是否真的“远远超越”咱们国产自己的视频AI。

事实上，好奇这一点的网友非常多，在短短不到一天的体验中，外网就爆出了不少Sora的不足之处：

在用户输入提示词“一只鹈鹕沿着俯瞰港口的沿海小径骑自行车”后，Sora对应生成了一段视频，但在该视频画面中，鹈鹕却像突然吃了云南菌子一样，在中途莫名其妙地变为向相反的方向骑行。

图源：网易新闻

还有外网网友爆料，Sora对于性别的概念比较模糊，当提示词过长的时候，会出现把“一男一女”生成为“两个女孩”的画面。

不过，当我们把同一段提示词交给各家AI进行生成时，它们各自的问题也随之暴露。

据了解，有用户反馈，当提示词为“维京演员的情感表演。当演员皱眉时，镜头推到脸上”，Sora、快手可灵、MiniMax海螺表现各有不同。

具体来说，Sora的视频镜头氛围出色，粗看有电影大片风范，但无法体现“演员皱眉”、“镜头推到脸上”。

图源：Sora

快手可灵AI的表现则较为严谨，基本一比一根据提示词生成视频，但画面也相对较为死板。

图源：可灵AI

而MiniMax海螺生成的视频也有好有坏，亮点在于表情变化更加明显，缺点则是运镜提示词完全理解错误，变成了“镜头逐渐拉远”。

图源：海螺AI

总的来说，这些视频大模型都具有各自的优势，当然也存在属于它们自己的不足等待被解决。

随着Sora Turbo的正式发布，国内外视频AI的竞争将更加激烈。

哪怕是OpenAI，也需要继续学习与进步，让技术优势变成真正的产品优势。

作者 | 刘峰

玩酷网

OpenAI打出王炸，Sora视频AI太猛了

科技事心爱心