正式版Sora发布:史上最实用的AI视频生成模型来了!

知危 2024-12-10 10:38:10

终于!大的终于来了!刚刚,OpenAI 在本轮 “ 12 天每天直播发布一个新品 ” 的活动中发布了视频生成模型 Sora 的正式版。

Sora 已经在视频直播发布会结束后正式上线,登录网址为 Sora.com,仅有订阅账号才能体验功能,其中:· Plus 会员账号有 50 条/月的快速生成机会,每条视频长度最多 5 秒,最高清晰度为 720p 。

·Pro 会员账号有 500 条/月快速生成机会以及无限次的慢速生成机会,每条视频长度最多 20 秒,最高清晰度为 1080p,并且可同时提交 5 个生成任务,另外还可以将视频进行无水印下载。

所以,话不多说,知危编辑部珍藏已久的 Plus 账号启动!

然而,启动失败了。

事情并没有编辑部想象的那么美好,Sora 的官网被挤爆了,高强度尝试了近 1 个小时后我们依然没有登录成功,输了账号密码之后会被告知“ 流量过大,暂时不接受新用户加入,我们正努力尽快恢复,请稍后再来 ”。。。

从登录失败页网址中的 “ onboarding ” 可以判断账号被卡在了新手引导阶段无法进入。

所以,我们暂时只能通过官网的介绍以及直播内容先跟大家讲解一下正式版 Sora,虽然不是实测,但还是非常惊艳的!

我们先说结论,正式版的 Sora 产品是整个 AI 视频生成领域前所未见的一个产品,它更像是一个在线创作剪辑软件,它不像其他 AI 视频生成工具那样根据提示词傻傻的生成,而是真正给人一种建立了 “ AI 视频创作工作流 ” 的感觉,它更接近我们对 AI 生产力工具的最终期望,说是史上最实用的 AI 视频生成工具也不为过。

首先,Sora 的首页更像是一个 “ 创作灵感广场 ”,在这个 “ 灵感广场 ” 中,铺满了很多其他艺术家创作并分享的视频,你可以点开视频查看详情,详情附带了生成提示词等任何细节,你可以从他们生成视频的细节中去学习该如何去生成一个好的、你想要的视频,无论提示词还是灵感都可以。

如果你想创作一个视频,最简单的方式是提供一段提示词并且选择一些预设选项,你可以选择:

①视频的尺寸,包含 16:9( 横屏 )、1:1( 方屏 )、9:16( 竖屏 )三种模式;

②视频的清晰度,包含 480p、720p、1080p 三种模式;

③视频时长,包含 5 秒、10 秒、15 秒、20 秒四种模式可选;

④“ 多变种 ” 模式,这是一个有趣的概念,因为模型可能对同一个提示词有不同的理解方式,所以你可以选择同时生成 1 个、2 个或者 4 个视频,以便在同一个提示词中找出自己最喜欢的一条。

⑤模版,Sora 提供了一些预设的风格化模板,你可以直接通过这些预设模版来定义视频的风格。

多变种模式,同时生成四条视频

不同模版风格切换演示

说完这些看起来比较常规的,惊艳的功能来了:故事板( Storyboard )。

你可以像在 PR 或是 Final Cut 这样的剪辑软件的时间线工作流里一样创作 AI 视频。

在时间线工作流里,你可以先添加一段画面描述的提示词,然后选择几秒之后在时间线上添加另一段提示词描述接下来的场景,达到生成一个有剧情的短片的目的。

在直播中,OpenAI 工作人员先是添加了一段 “ 一只黄尾巴的美丽白鹤站在小溪里 ” 的提示词,随后在时间线后半部分添加了一个 “ 鹤把头扎进水中,叼起一条小鱼 ” 的提示词。

将这个任务提交之后,你就会的一个理解了情节、前后连贯、一致性比较好的视频。( 不过还是轻微翻车了,因为鱼没叼到,直播演示里切换了另一个版本,最后鹤嘴里也没有鱼,大家尴尬一笑 )

虽然轻微翻车,但是瑕不掩瑜,这个视频的效果已经可以说是非常强了,而在此基础之上,视频还支持 “ 在线重新剪辑 ”( Re-cut )。

你可以在时间轴里任意选择你想留下来的视频的某一部分,并且依据留下来的部分继续扩展或是重新添加故事来更改视频的效果和剧情的走向,这样当生成的某个视频中某一小段部分你不满意的时候,你可以完整保留你满意的部分并对不满意的部分进行修改。

除了通过重新剪辑功能对视频进行段落式的修改,你还有更酷更惊艳的视频修改方式,那就是 “ 视频重混 ” ( Remix )功能。

举个例子,在直播演示中,OpenAI 的员工生成了一个 “ 毛茸茸的猛犸在沙漠中行走 ” 的视频,效果如下:

当你想保留其他场景但是你突然不想让猛犸出镜的时候,你可以通过视频重混功能对 Sora 写提示词说 “ 把猛犸象替换成机器人 ”,替换的效果非常经验丝滑,并且参考了之前的视频保持了非常高的一致性,具体效果如下:

这个功能只能说:强到无需多言,文字的形容略显苍白。

与此同时,视频重混功能还支持强度调节,有 “ 轻度 ”、“ 中等 ”、“ 强悍 ” 三挡以及 “ 手动 ” 模式,这方便你根据视频中需要改动的元素的是否较大来调整,比如可能你只是单纯想让机器猛犸少一只但又不想视频其他部分有改动时,你就可以选择轻量级的重混强度 。

怎么说呢。。。这才是真正被当做生产力工具来开发的 AI 视频生成工具,太强了!

那么提到生产力工具,对于艺术短片的创作,无限循环是必不可少的元素,很多短片艺术家会创作魔性的无限循环视频,所以 Sora 也是很懂事儿的提供了 “ 循环 ”( Loop )功能。

你只要在时间线里选择从开头和结尾的哪部分开始进入循环,Sora 就会自己帮你搞定,并且这个循环的强度也可以调节,如果你视频的开头和结尾差距很大,你可以让 Sora 插入更多的帧来让视频进行循环,如果开头和结尾本来就比较相似,你可以选择让他插入比较少的帧来进行循环。

下面放一个带有远近景、转场前后差距较大的官方循环示例:

最后,也是最天马行空、能做一些奇妙艺术创造的功能是:视频融合( Blend )。

这个功能可以让你将两个视频丝滑的融合在一起,直播演示中可以看到两个视频会在工作流里进行时间线轨道并列。

直播没有给出具体的融合细节,但直播中的演示画面,我们可以看到有一个 “ 融合曲线 ”( Blend curves )的概念。

这看起来很像是 PS 中调节亮度的曲线,不过我们不知道效果到底是什么。

从官网在直播后更新的 Sora 说明来看,这个融合的效果似乎是让一个视频丝滑的过渡到另外一个视频:

我们可以看到,融合功能可以让左侧的雪花飘落丝滑的过渡到右侧的花瓣飘落视频,那么前面提到的 “ 融合曲线 ” 功能,似乎应该就是调整视频融合过度渐入渐出时间以及过度强度的手段。

好了,正式版 Sroa 的全部功能就介绍到这里了,可以说是强到我不知道该用什么形容词来形容它,“ 强 ” 这个字我已经说麻了。。。

我再重复一遍文章开头下的定论:正式版 Sora 看起来是一个真正建立了 “ AI 视频创作工作流 ” 的生产力工具,说是史上最实用的 AI 视频生成工具也不为过。

不过,在这里还是要强调一下,这毕竟还不是实测,截至稿件发出前,距离直播发布会结束已经有 3 个小时过去了,Sora 官网依旧是被挤烂登不进去的状态。。。

当然,知危编辑部后续会派人 24 小时值守高强度尝试登录,一旦登录成功第一时间进行实测后写文章发给大家看,记得不要错过哦~

0 阅读:0

知危

简介:提供敏锐、独到的商业信息与参考