AI,开始自己讲故事了

趣唠科技不打烊 2024-07-23 02:01:04

文丨俊俊

就像美丽的演员会被人低估演技,炫目的技术也会让人忽视经典的好故事。

不少电影因为特效的加持,让我们目眩神迷。

比如电影《阿凡达》,座座云雾缭绕,悬空漂浮的巨山,男女主人公骑上的色彩艳丽的飞龙,整个星球的魔法感生态系统等,通过顶级的CG和3D特效技术加持,电影不断通过镜头传达着人类丰富的想象力。

电影《流浪地球2》中,光是高新科技产品就令人眼花缭乱,如直通方舟空间站、令人震撼不已的太空电梯,四足仿生机器狗、无人机战群、迭代量产的量子计算机等,这些极致的细节,展现着故事独特且宏大的世界观。

好在,特技的渲染确实丰富了故事的完整与想象,让我们在视觉冲击之中感悟到创作团队的精诚所至。故事的饱满流畅也通过特效而越发真实可信。

人类对故事的概念,从口头传播再到文本,再到影像,经历了漫长的跨越,而随着科幻题材带来的魔法加成,气势磅礴的特效场面所带来的视觉冲击,也将我们带向了更遥远的国度,我们对故事的传达与聆听也更加生动形象。

伟大的故事通过不同载体得以流传,穿越时空串联着人类文明,而讲故事的方式,却在不断演变。

Odyssey就决定用AI讲故事。

用AI,讲故事

7月9日,Odyssey从近一年的沉淀中脱颖而出,获得了来自GV(谷歌风投,Alphabet 的风险投资部门)的900万美元种子资金,DCVC、Air Street Capital以及十多位个人早期投资者和天使投资人也参与了投资。

Odyssey作为一款好莱坞级别的视觉AI技术,其AI软件在某些方面与OpenAI的Sora或Runway的Gen 3相似,都是将场景或镜头序列的文字描述转化为高质量的电影短片。

有趣的是,Odyssey是由一帮早前做自动驾驶的人组成。

Cruise前产品副总裁Oliver Cameron、Wayve前技术副总裁Jeff Hawke创立了Odyssey。Odyssey研究团队来自Cruise、Wayve、Waymo、特斯拉、Meta等公司,艺术家团队则由《沙丘》《哥斯拉》《复仇者联盟》等作品的幕后制作者组成。Odyssey以OpenAI、Runway和Metaphysic等公司为竞对,为专业电影制作人和动画师提供工具。

与其他依靠在互联网上搜索视频数据为AI软件提供素材的文字视频公司不同,在Cameron看来,出身自动驾驶汽车领域的经历让两位联合创始人深知收集人类真实世界数据集来训练模型的重要性,Odyssey正在现实世界中收集自己的三维数据集,并以此为模型提供素材。

自动驾驶汽车软件的核心是从二维输入中学习三维世界,而视觉特效则是将三维世界压缩成二维动态图像。Hawke在Wayve工作期间开发了一个名为GAIA的AI模型,可以根据初始视频帧生成整个逼真的街道级视频,并使用文本提示来塑造模拟世界。

而也正是自动驾驶汽车方面的经验,让他们对如何收集Odyssey所需的真实世界数据有了一些巧妙的想法,不过Cameron拒绝公开透露其方法。

用AI,讲好故事

低质AI生成内容正充斥着我们的生活!

如今,许多公司都在利用人工智能制作文字和图像,吸引人们的注意力。如果处理不当,AI视频生成也会朝着类似的方向发展,我们会被大量没有火花和内核的随机视频淹没。

Odyssey就反对这种短频快的低质视频接收,Odyssey的一个核心概念是:用AI更好地讲故事。

优秀的故事可以提供非常丰富的精神食粮。如果人们长时间沉迷于垃圾视频,就会忘记高质量的故事是什么样子。也许人类将沦为故事的观看者,而不是故事的讲述者。

基于强大人工智能,经过技术的进步和正确地构建,可以制作出令人惊叹的视频,更可以让脑海中的史诗故事走向大荧幕,讲出优秀故事。

Odyssey的野心,就是视觉效果对标好莱坞级。

要想让AI为好莱坞服务,它必须能够制作出高质量、无闪烁、震撼人心的视觉效果。

为了实现「好莱坞级」视觉效果的愿景, Odyssey正在开创好莱坞级别的视觉人工智能,在这里,美丽的场景、人物、光影和动作都可以生成和引导。

技术+故事,是Odyssey的重点。

Odyssey的AI软件能够将文字描述转化为高质量的电影级短片,提供给专业电影制作人和动画师前所未有地创作工具。这项技术不仅能够生成连贯的人物和背景,还能保证在整个视频序列中保持一致性,同时提供逼真的光影效果,同时也需要更深的技术层次。

Cameron说,Odyssey正在开发的软件不仅仅是一个从文字到视频的模型,而是一个模型家族。专门从事四项不同的任务:

生成三维图形渲染

生成材料效果(如水或布)

生成运动效果

最后生成光影效果

通过训练四个功能强大的生成模型,这些模型能够对视觉的每个层次进行微调控制,而不是训练一个模型,只能进行单一输入和单一不可编辑的输出。

Odyssey旨在让创作者对场景中的每个元素进行全面、微调的控制。从壮丽的山脉、茂密的植被、美丽的河流,到打光运用、人物运动等镜头故事都可以全方位操控。不少网友看完效果高呼:新时代皮克斯!

这是一种用AI颠覆电影、电视节目和视频游戏的全新制作方式。

4个模型协调运作,形成视频帧。因此,Odyssey能够生成集高质量的三维图形、逼真的材质、令人惊叹的光影和可控的运动为一体的高质量视频。

并且,每个模型的输入也不局限于文本,甚至包括人类创作者用手写笔绘画或静态数字图像。

更重要的是,Odyssey正在围绕这些模型建立专为高级用户量身定制的工作流程,并与好莱坞、游戏和其他领域使用的现有制作工作流程进行一流的集成。

这将使电影制片人和专业视觉特效师(他们是 Odyssey 软件的目标用户)对最终输出拥有极大的创作自由,而目前的文本到视频人工智能模型无法做到这一点。

此外,时间成本方面,Cameron以电影《阿凡达》为例,每部电影的制作时间都超过十年,涉及数百名视觉特效艺术家,耗资数亿美元。

Odyssey希望在不牺牲视觉质量的前提下,将时间和成本降低到一个五人团队花费五万美元、工作六个月。如果Odyssey能够市场应用,将对专业影像带来前所未有的推动。

Odyssey的出现是AI在电影制作领域的一个重要转折点,有潜力大幅降低电影制作的时间和成本。

这对于希望在视觉效果上保持高质量的专业电影制作人和动画师来说,无疑是一个巨大的福音。

0 阅读:0

趣唠科技不打烊

简介:感谢大家的关注