今日凌晨,OpenAi突然发布了文生视频模型--Sora,而且支持生成一镜到底且长达一分钟的视频!
Sora官网
Sora不是首款文生视频的大模型了,例如此前的pika、Gen-2,但是这些都只能生成几秒钟的视频,如果需要制作较长视频,则需要多次生成并且将上一视频的最后一帧画面作为下一视频的第一帧,但是这样制作麻烦且视频脱节,远远没有一镜到底的视频效果,但是如今sora带来的长达60秒的视频生成,完全颠覆了现有的文生视频模型。
来源:sora官网
现在我们先来看看几个Sora官网提供的案例:
1.提示词:一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子,拎着黑色钱包。她戴着太阳镜,涂着红色口红。她走路自信又随意。街道潮湿且反光,在彩色灯光的照射下形成镜面效果。许多行人走来走去。
2.提示词:动画场景的特写是一个毛茸茸的小怪物跪在融化的红蜡烛旁边。艺术风格是 3D 和现实的,重点是灯光和纹理。这幅画的气氛是一种惊奇和好奇,怪物睁大眼睛、张开嘴巴凝视着火焰。它的姿势和表情传达出一种天真和俏皮的感觉,就好像它第一次探索周围的世界一样。暖色调和戏剧性灯光的使用进一步增强了图像的舒适氛围。
3.提示词:淘金热期间加利福尼亚州的历史镜头。
此外,官方一共提供了48个演示视频,包含了多种风格和类型的展示,官网称:“Sora是能够理解和模拟现实世界的模型的基础,我们相信这一功能将成为实现通用人工智能(AGI)的重要里程碑。”
sora演示
AI文字生成视频大模型代表了人工智能技术的最新进展,具有巨大的应用潜力。当然,在应用这种技术时需要注意平衡生成质量、多样性、速度和数据隐私等方面的考量,以确保模型能够在实际场景中发挥有效作用,同时AI文字生成视频大模型可能会带来以下一些社会影响:
改变媒体产业格局: 这种技术可能会改变媒体产业的格局,使得视频内容的生成更加自动化和智能化。这可能会导致传统的视频制作方式发生变化,从而影响到相关行业的就业情况。提升娱乐体验: AI文字生成视频大模型可以用于电影、电视剧等娱乐内容的创作,为观众提供更加丰富、多样化的娱乐体验。同时,这种技术也可能会推动虚拟现实(VR)和增强现实(AR)等新型娱乐形式的发展。挑战真实性和信任度: 由于生成的视频内容具有高度逼真性,这可能会带来一些挑战,如视频虚假信息、伪造视频等问题。这可能会影响到社会的真实性和信任度,需要采取相应的技术和法律手段来解决。个性化内容生成: 基于个人偏好和需求,AI文字生成视频大模型可以生成定制化的视频内容,从而提供更加个性化的媒体体验。这可能会改变传统媒体内容的传播方式和受众行为。促进教育和培训: 这种技术可以用于教育和培训领域,例如生成教育视频、模拟实验场景等,为学生提供更加生动、具体的学习体验,促进知识的传播和技能的培养。隐私和伦理考量: 使用这种技术时需要注意数据隐私和伦理问题,尤其是在涉及个人肖像权和信息安全的情况下。需要制定相应的法律和政策,保护用户的隐私和权益。总的来说,AI文字生成视频大模型的发展将对社会产生广泛的影响,既带来机遇也带来挑战。因此,需要综合考虑多方面因素,促进这种技术的健康发展,并最大程度地发挥其积极作用。