科技圈出新王炸:输入文字就能自动生成视频,又有行业要颠覆了?

互联网前瞻 2024-02-20 21:36:58

2022年春节,OpenAI推出的ChatGPT快速引爆了资本圈与AI圈,至此拉开了AI大航海的序幕。

今年春节,OpenAI悄咪咪又干了件大事:2月16日凌晨,在没有任何预兆和消息透露的情况下,它突然发布了自己的首个文生视频模型。

它能干什么事?

只要给它一段文字指令,它就能根据提示词,自动生成60秒一镜到底的逼真视频、基于一个提示词,它还能生成不同角度的视频,类似现实中的多机位拍摄。

较之图生视频、视频生视频,文生视频的难点在于,AI需要根据指令,从文字解码出视频的时空逻辑,同时保证在这一逻辑下,画面中所有物体的运动、变化,符合要求,符合现实世界规律。

来看一个例子就知道了。Sora官方网站上有这样一则demo,提示词为:“一名时尚女子走在充满霓虹灯和广告牌的标志性东京街头,她穿着黑色皮夹克、红长裙和黑靴子,拎着黑色手袋,戴着太阳镜,涂着红色口红,走路自信又随意。街道潮湿且反光,在灯光映射下形成镜面效果,行人走来走去。”

针对这一段提示词,Sora交出了这样的作业↓

人物脸上的黑痣粉刺,地面积水倒映的霓虹光影等等,其细节的精细度几乎已经做到了以假乱真。

官网公布的一段8秒的东京地铁车厢窗户视频也仿若真实拍摄。除了行车过程中,列车窗户上的反射外,视频中间人物倒影也非常逼真。

据内行人士透露,Sora生成的视频,就算是头部动画制作公司都需要数日时间完成,而Sora只需要几分钟搞定。

而且,Sora在同类AI产品中,也表现出了超强的性能优势:此前,市面上的 AI 视频生成始终停留在 2-4 s 的时长范围内——一旦超过了这个时长,视频的可控性和质量都将大大下降。而sora不仅直接将视频生成的时长一次性提升了15倍,在视频内容的稳定性上也有不小的提升。

Sora是如何实现这样的质量“大飞跃”的?

这就不得不提到大模型。

Sora 结合了 Transformer 和 Diffusion 两个过去几年最重要的模型。

火遍全球的ChatGPT是基于 Transformer 模型,它对词语进行标记,并生成下一个单词;Diffusion 模型则是“文生图”的代表。两者强强联合,让Sora同时有了理解文字、理解世界并且能够“文生图”的能力。

正是在大模型加持下,AI 已经快速迈过文生文、Chatbot 时期,大步进军视频生成领域。当下最火的短视频、短剧等赛道,都将迎接 AI 的到来。

不可否认,AI大模型已经已不可阻挡的趋势渗透进各行各业,再通过各行业落地应用,进一步影响到我们日常生活中的方方面面。

我们每天离不开的手机,也因为AI大模型的出现进入一个崭新的纪元:龙年春节假期后开工的第一天,OPPO创始人陈明永对于AI手机行业以及OPPO手机未来发展的道路发表了一些看法,他认为AI手机成为手机行业发展的第三阶段。

其实,从去年下半年开始,国内众多手机厂商都在加码冲进AI技术赛道、布局大模型相关。

而在引入AI技术上,OPPO走在前列。OPPO今天还专门召开了一个AI 战略发布会, 分享了他们在 AI 战略方面更为详细的规划。

发布会上,OPPO 首席产品官刘作虎也宣布 OPPO 将正式进入 AI 手机时代。OPPO还一并发布了 1+N 智能体生态战略,由AI超级智能体和AI Pro开发平台组成。OPPO 未来将在云端算力上持续投入,通过自建的 OPPO AI 滨海湾数据中心,部署 Titan、Turbo、Tiny 三个级别的模型对应不同应用场景,实现端云协同,高效部署,引领开启全民AI手机时代。

OPPO 还联合全球著名的市场研究机构 IDC发布了首个AI 手机白皮书,预测大模型技术将推动手机进入AI时代,到2027年中国市场AI手机份额将超过50%。

那么问题来了,什么样的手机才能被称之为AI手机?上月,OPPO正式发布旗下第一款AI手机OPPO Find X7系列,我们从中可以一窥趋势。

这款手机搭载全球首个端侧70亿大模型,在OPPO自主训练的AndesGPT大模型加持下,OPPO Find X7系列上搭载了很多实用功能,让更多普通用户能够在实际使用中感受到AI技术的魅力。

使用率最高的当属OPPO AI消除。谁手机里没几张舍不得删的废片?氛围、取景都到位了,偏偏有路人闯入,又或者是背景过于杂乱。

OPPO AI消除功能可以轻松拯救这些废片。大模型加持下,消除功能支持超过120类主体的识别与分割,还可以实现发丝级的分割、高达6个的多主体分离,以及超大面积图像的填充与自然生成。

实际使用起来,绝没有传统AI修图和填充的生硬之感,春节期间,所有人都快把这个功能玩坏了,春晚主持人们也不例外。一键消除疯狂“嘲笑”自己的任鲁豫,恐怕是小尼表演完魔术之后最想做的事情之一吧!

OPPO AI超清合影功能则是聚会大合照必备。这也是全球首个实现端侧 AI 人脸优化的合影功能,它让合影中的每一个人都获得主角般清晰生动的画质,再也不用担心合照C位不够分!

对于很多打工人来说,及时整理通话中的重要工作信息很重要。OPPO AI通话摘要功能直接帮我们从这一琐碎事项中解放出来:开启功能后,它就能够帮我们精准提取重点信息,生成摘要内容,完成记录,甚至还能自动生成待办事项。

新小布助手则宛如内置于手机之中的私人助理管家。

它能做的事情超乎我们想象:面对亲戚逼婚该怎么回答,直接找小布求个答案;春节菜谱、春节拜年文案、春联它也能帮我们创作,再也不用担心拜年信息千篇一律;假期想放松出门度个假,它也能帮我们做好攻略。

AI大模型正在改变我们的手机使用体验,也正在改变手机行业。

有人评价,如果说,2023年是云端AI大模型元年,那么2024,或许将成为AI终端元年。

以大模型为基础的生成式AI正在各行业、各领域催生创新应用,带来全新的机遇与挑战,手机行业不是第一个,也不会是最后一个。

不过,手机厂商们,尤其是OPPO拥抱AI技术的速度与态度值得其他行业学习:积极布局跟进新技术,与自身产品进行有效结合,打造此前无法实现或是想象的内容,一起去探索新的产品边界。

0 阅读:19

互联网前瞻

简介:分享科技知识,每天更新不同内容