这两天,想必哥几个的首页已经被 Sora 的各种动态刷屏了吧。
运气好已经用上了的,已经开始一顿输出了,但也有运气不好的,到现在还搁外边儿排队呢,就比如差评君。
我跟大伙儿一样好奇,这 Sora 跟咱们国内的视频生成应用相比,到底谁更胜一筹?
结果您猜怎么着,老外比咱还着急, Sora 发布当天就迫不及待拉了个横评,把 Sora 和 HailuoAI 对比了一波。
这个 HailuoAI ,就是咱们熟知的海螺 AI 海外版,背靠国内 “AI 六小龙 ” 之一的 MiniMax 。
有一说一,这确实让差评君有些意外。
倒不是质疑实力,而是没想到 Sora 前脚刚上线,后脚就有人拿海螺 AI 来打擂台,这怎么不算是一种自信呢?
而差评君也去查了些资料,发现海螺 AI 在海外是真挺吃香。
数据显示,自打 8 月底推出视频模型以来, HailuoAI 连续在 9 月、 10 月拿下了 AI 产品榜 · 全球增速榜的 Top1 。
我顺手又在 X 上多翻了翻,发现关于 HailuoAI 的话题讨论非常活跃,时不时就有老哥把自己在 HailuoAI 上生成的大作发出来。
甚至还有人因为挤不进 Sora ,感叹还好有 HailuoAI 可以用。
我已经不止一次见到过,来自欧洲和英国的用户说虽然 Sora 用不了,但是有 HailuoAI 就很好。
千言万语汇成一句 HailuoAI nb
所以差评君有了一个非常大胆的想法。
既然 Sora 是暂时用不上了,那咱不如借着海螺 AI 的视角,看看国产视频模型跟 Sora 之间,到底能过个几招。
恰巧,前几天 MiniMax 刚给自己的视频模型进行了一波增强操作,估计早就等不及要跟 Sora 碰上一碰了。
为了防止还有人不清楚海螺 AI 的实力,差评君在这先给大伙儿预热一波。
这个视频是我从海螺 AI 的官方那找的,画面质感和连贯性没得说,视频里的人物和背景也基本看不到扭曲、变形和卡顿的情况。
特别是小丑由远到近,人物和背景焦点的转化看着也很丝滑。
当然,官方精选出来的咱也不能全信,所以我又随机找了几个路人老哥做的视频。
真不是我瞎吹,海螺 AI 的视频模型很擅长生成人物的面部细节,包括肌肉动作、表情甚至是情绪,都处理得很到位。
不过我也发现在这个视频里,女人的下巴在最后几秒稍微抖动了那么一下,不仔细还看不太出来,刘海在低头的时候也没有很自然地往下垂,但总体瑕不掩瑜。
这段走廊跑步的视频更惊艳,跑动的动作自然流畅,人物一致性从头保持到尾,虽然只有短短几秒,但头发的甩动、光影变换这些细节该有的也都有了。
还有什么骷髅怪沙漠大片,这画面表现力都快赶上好莱坞大片儿了。
反正看了一圈海螺 AI 用户整出来的这些活儿,我算是明白为啥 Sora 出来之后,会有人第一时间就拿它俩比较了。
该说不说,海螺 AI 还是有实力的。
相信大伙儿也应该对海螺 AI 的视频模型,有个底儿了,那咱也不多废话,直接上手试一试。
开局, Sora 先使出了一招雪天双子塔。
prompt :吉隆坡,双子塔下起了大雪,周围的树上挂着厚厚的积雪
这画质真没得说,很像末日电影里的开头。
关于 “ 厚厚的积雪 ” 理解得也很到位,随着镜头的移动,两边的树枝没有出现一丁点的变形,空中飘落的雪细节拉满。
就是大片大片的枯树枝交叠在一起,让画面看起来有点杂乱。
而且最大的问题是,后面的 “ 双子塔 ” 不是双子塔。
塔顶部分的形状看起来更像是广州的小蛮腰,但连接处又是双子塔的设计。。。在语言的理解上, Sora 犯了太基础的错误,这是差评君没想到的。
再把同样的 prompt 喂给海螺 AI ,看看海螺 AI 是如何应对的。
出色的画面稳定性,还有对于细节的把控,比如树叶轻微的晃动,还有树叶的纹理感,海螺 AI 都完成得非常好。
最重要的是,海螺 AI 对 prompt 的理解更精准, Sora 连吉隆坡的双子塔长啥样都不清楚,这点扣大分。
再来看这组视频, prompt 其实挺抽象的,差评君提取了一些关键词大概是 “ 超现实主义风格建筑 ”“ 金属银色表面 ”“ 鲜艳的红色光泽几何图案 ”“ 柔和的散射光 ”“ 流畅线条、抛光纹理 ”
prompt :A hyperrealistic image of a futuristic building featuring metallic silver surfaces with vivid , glossy red geometric patterns.The structure's sleek lines and polished textures are emphasized under soft , diffused lighting , showcasing a sophisticated and innovative design .
这是 Sora 交上来的答案。
说实话如果没看过 prompt ,很难理解这到底是一个什么东西,但一一对照关键词,视频里的要素基本贴合,建筑结构也确实蛮超现实的。
相比之下,海螺 AI 的生成结果更有建筑的样子,该有的也都有。而且视频里,还有基于抛光纹理呈现出来的倒影,把上下对称的细节基本都照顾到了。
第三局, Sora 上来就是一场海上风暴。
Prompt :a storm is brewing overtop of an overcast ocean.the waves are dark and dramatic (一场暴风雨正在阴云密布的海洋上空酝酿,海浪黑暗而猛烈 )
如果忽略掉那道闪电从头到尾都没动过的话,这段视频能唬住不少人。
轮到海螺 AI ,虽说少了点暴风雨来临前的氛围,但波纹的明暗变化、海面的高低起伏刻画得很细腻,被掀起来的浪花也更有质感。
前面三组对比, Sora 的视频都是从 OpenAI 官网搬来的,其实对海螺 AI 来说不算特别公平,咱们再来看看网友们自发的比较。( 这部分视频是差评君手动搬运的,可能画质上没有原版那么清晰 )
同样都是文字生成的老太太面部特写镜头( 具体 prompt 网友没分享 ), Sora 和海螺 Al 在真实的皮肤纹理上都下了功夫,面部也没有因为镜头的移动而发生变形。
只不过在同样的 prompt 下, Sora 表达出来的是一个西方老太太。
而海螺 AI 生成的,更贴合亚洲面孔。
当然 AI 对于人种的理解也没啥好挑刺的,说实话,这波我觉得能打个平手。
如果非要选一个的话,那我个人还是更喜欢海螺 AI 的表达,生动些。
再来看这组古龙喝茶。
prompt :ancient dragon drinking tea
Sora 和海螺 AI 都不约而同地使用了卡通风格,不同的是, Sora 的龙是拿指尖固定住茶杯,而且 “ 喝茶 ” 的这个动作太奇怪了,直接把头往下怼,肉眼可见,头和茶杯重合的地方变形了。。。
海螺 AI 这边的龙,完胜。
优雅,端着茶杯的方式跟人似的,你甚至还能看到龙把茶嗦起来的那一条线。
总的看下来,差评君最大的感受就是:Sora 强还是有强的道理,但海螺AI 也给了我不少惊喜。
但咱今天也不是非要较个高下,目的还是想看看 Sora 到底有没有那么神,结果一比较,发现咱们其实也没被甩太远。毕竟,海螺 AI 的视频模型才上线不到半年,就已经能媲美 Sora 了。
而且在上周, MiniMax 又上新了图生视频模型 I2V-01-Live ,新模型革新了二维插画的动态呈现方式,让动画稳定性和细腻表现力有了大幅增强。
看看这丝滑的效果,人物更加灵动了。
不可否认的是, Sora 的产品形态确实领先一步,视频工作流的设计思路有值得国产 AI 产品借鉴的空间。
但海螺 AI 的路线,更偏向打好地基再建房,产品功能可以等生成能力稳定了再慢慢搭建。
最重要的是,海螺 AI 咱们国内就能用上,普通用户也可以免费体验,这性价比直接拉满了好吧。
要知道, MiniMax 的海螺 AI 不管是技术力还是产品力,妥妥的国内 AI 产品第一梯队,现在还能跟Sora打得有来有回,已经在海外有了一定分量。
随着多模态技术的越来越深入,差评君觉得趋势也会更加明显:即使海外有 Sora 坐镇,以 MiniMax 为代表的国内 AI 公司,同样也能为国产视频生成杀出一条生路来。