引言
12月10日,OpenAI终于发布了备受期待的AI视频生成模型SORA。这款模型在年初首次亮相时,就为AI视频生成领域注入了一剂强心针,展示了DiT架构的无限潜力。然而,随着SORA的正式发布,许多自媒体博主纷纷大肆吹捧,称其为“最激动人心的产品”、“AI变天了”等等,让人感觉仿佛中了一个亿。但事实真的如此吗?本文将通过一系列详尽的测试,来探究SORA的真实实力。
1. SORA的使用方式
1.1 独立域名与登录
目前,SORA拥有自己的独立域名,即sora.com。用户登录时,可以选择谷歌登录方式。
1.2 会员计划
当前,SORA提供两种会员计划:PLUS和PRO。PLUS会员每月费用为20美元,可生成50个5秒视频,最高支持720P分辨率。而PRO会员每月费用为200美元,可生成500个20秒视频,最高支持1080P分辨率。作为一位勤俭节约的好少年,我首先使用PLUS会员进行测试,如果效果令人满意,再考虑是否开通PRO会员。
2. 文生视频测试
2.1 测试提示词
我们选择了经典的“熊猫炒菜”提示词进行测试,以便与市场上其他AI视频生成工具进行对比。测试时,我们选择了16:9的横屏比例,720P的分辨率,视频时长为5秒。
2.2 测试结果
第一次生成的视频效果令人失望,不仅不符合描述,甚至连基本的运镜都没有。为了确保测试的公正性,我们再次提交相同的提示词,但结果依然不尽如人意。将这些视频与市场上其他工具生成的视频进行对比,可以明显看出,即使在几个月前,其他工具的生成效果也远胜于SORA。
3. 图生视频测试
3.1 上传图片
我们首先尝试上传一张包含人物的图片,但系统提示不支持包含人物的媒体。于是,我们选择上传一张熊猫的图片,比例改为1:1,提示词留空。
3.2 生成结果
视频生成后,效果一般,但熊猫确实动了一下。为了进一步测试,我们在提示词中加入了“熊猫抬起手对着镜头打招呼”,再次生成视频。结果虽然有所改善,但依然存在明显的不自然之处。
3.3 写实风格测试
为了更全面地测试SORA的图生视频能力,我们上传了一张猫的图片,提示词为“猫咪向远方走去”。生成的视频效果较好,猫确实向前走了,但硬切的过渡效果仍有待改进。
4. 视频重绘测试
4.1 上传视频
我们上传了一段狗在车上的视频,但系统提示视频格式不支持。经过格式转换后,视频成功上传。
4.2 重绘功能
我们选择了“remix”重绘功能,提示词为“将视频中的狗换成猫”,重绘强度选择默认的7级。生成的视频效果非常出色,不仅保留了宠物的围巾,车窗外一闪而过的单词也保持一致。这表明SORA在视频重绘方面确实表现出色。
5 视频混合测试
5.1 生成卡通效果
为了测试“blend”混合功能,我们将刚刚生成的猫视频上传到domoAI,选择日本动漫5.0风格模型,生成5秒的视频。结果非常稳定,重绘效果也相当不错。
5.2 SORA混合功能
回到SORA,我们尝试将猫视频混合成卡通效果。通过调整曲线,修改视频过渡的平滑度,生成的视频效果自然,但PLUS会员生成的循环时间较短。
6. 故事板功能测试
6.1 简单故事板
我们进入SORA的故事板功能,选择720P分辨率,写了一个简单的5秒故事板:女孩在沙滩上跑步,三秒后捡起贝壳。生成的视频虽然写实感较强,但人物动作明显不自然,尤其是最后几帧,看起来像是捡了一根屎。
6.2 重新编辑
我们使用“re-cut”功能重新编辑视频,去掉了不自然的跑步镜头和最后几帧的“捡屎”镜头。生成的视频效果有所改善,但依然存在明显的鬼畜现象。
7. 测试总结
7.1 文生视频与图生视频
当前,SORA在文生视频和图生视频的效果上,确实处于第二梯队的水平。虽然有一定的写实感和人物统一性,但人物动作明显不自然,且生成效果的成品率较低。
7.2 视频重绘与混合
然而,SORA在视频重绘和混合功能上表现出色,效果绝对是最强的。无论是整体的和谐度还是细节的保留,都做得非常好。
7.3 价格与价值
从价格上来看,SORA的PLUS会员每月20美元,虽然包含在GPT会员中,但生成效果并不令人满意。而PRO会员每月200美元,虽然效果更佳,但价格过高,且主要优势在于人物类的重绘,对于普通用户来说,性价比不高。
结论
SORA作为OpenAI的最新产品,虽然在某些方面表现出色,但在文生视频和图生视频的效果上仍有待改进。如果你对视频重绘和混合有较高需求,且不介意较高的费用,可以考虑开通PRO会员。但对于大多数用户来说,目前的PLUS会员计划并不值得推荐。