AI数字人又爆了?来不及了,快上车

懂科技的老葛 2024-03-13 03:59:01

大家好,开年AI领域又是各种火爆,前有OpenAI发布的AI视频生成模型Sora惊艳全网,今天又听说AI数字人领域又爆了——阿里巴巴发布EMO,一张照片+音频,就能实现你说任何话或唱任何歌曲的动态视频。

EMO简介

官方介绍:EMO(Emote Portrait Alive),一种富有表现力的音频驱动的肖像视频生成框架。输入单个参考图像和声音音频,例如说话和唱歌,该方法可以生成具有表情丰富的面部表情和各种头部姿势的声音头像视频,同时,我们可以根据输入视频的长度生成任意持续时间的视频。

直接看案例

我们来直接看一些案例,看看EMO到底牛在哪:

①表情丰富的动态渲染视频:采用EMO技术生成的视频,其表情自然而富有细腻的面部动作,能够捕捉到音频中情感的细微差别。高启强化身罗翔,给大伙儿普法,表情非常丰富自然!

②支持任意节奏:EMO能够处理任意节奏的音频,即便是快速的rap饶舌歌词或快语速说话,都能使生成的数字人像的动作与音频节奏保持同步。让kunkun唱rap,甚至毫无压力。

③多样的头部姿势变化:除了面部表情外,使用EMO生成的数字人视频,具有多样的头部姿势变化,使得生成的数字人更加具有真实感。由Sora生成的视频那个女主角,现在可以开口说话了,并且头部姿势变化非常自然。如果不跟你说,你会怀疑这个是AI?

总之就是,表情动作自然到位,支持任意语音、任意语速、任意图像,一键生成数字人!AI这个7*24小时不停发展的速度也太快了,而且最关键的是EMO宣布开源,但……却被骂惨了。

大家上去官方页面,发现GitHub上仍然是空仓,好家伙,吊胃口你是专业的。没事,趁着EMO还没开源,不如给其他产品一次机会。下面推荐一款,之前给大家介绍过的AI数字人开源项目SadTalker,着急的朋友,可以先玩玩。

SadTalker懒人包

SadTalker,一款著名的开源数字人项目,支持1个视频+1个音频,合成动作自然流畅的数字人。我已经制作了一款本地离线版,解压即可用。

只需要下载整合包(文末附下载),然后双击“一键启动.exe”,即可快速使用。之后会打开命令提示窗口,等待片刻,可以看到网址“http://127.0.0.1:7860”。

将网址复制一下,然后在浏览器打开,即可看到以下主界面:

使用教程可以查看往期内容,三步即可制作一个专属的数字人视频(合成语音+照片生成+视频合成):免费无限制作专属AI数字人

我试了下,生成的数字人视频速度要快一些,效果也比之前的版本更好一些~

今天就聊到这了,我是Glen,感谢你看我的文章,欢迎大家继续支持我,请点赞、收藏、分享三连走一波吧~

关注并私信回复【最新版AI数字人离线版】,免费获得本文资源~

12 阅读:5501
评论列表
  • 2024-03-24 06:31

    英文我不懂,说中文能看懂些,别叫我投资。

  • 2024-03-25 10:47

    [点赞][点赞][点赞]

  • 2024-03-21 09:07

    缅北:我都关门了你才推出

懂科技的老葛

简介:感谢大家的关注