自由行动的数字人是谁提出的?背后使用了哪些技术?

科技的那档子事 2024-08-15 19:36:45

随着数字人技术的不断发展,数字人系统所蕴含着的应用潜力和收益空间得以不断显现,连带着技术背后的研发者也备受关注。最典型的例子就是自由行动的数字人出现后,关于自由行动的数字人是谁提出的之类的问题在多个创业者和技术爱好者交流群中的多次“刷屏”。

从目前的讨论情况来看,绝大多数人的答案都集中于以百度和腾讯为代表的互联网大厂,毕竟,从网上出现的数字人视频来看,如此逼真的形象和自然的肢体动作也只有它们的研发团队能有能力实现。道理确实是这么个道理,但真相却并非如此。

相关资料显示,此次出现的能够自由行动的数字人虽然有着大厂的品质,但实际却是出自一家名为灰豚的数字人源码厂商之手。它通过其自主研发的灰豚MotionAI大模型让所生成的数字人从传统的静态播报转向了自由动作,从而增强它的交流感和真实感,弥补了传统静态数字人在提供情绪价值方面的不足。

至于大家所称赞的逼真形象和自然的肢体动作则是因为它在数字人制作过程中采用了三维重建、TTSA+音视频驱动技术、ARKit表情识别和AIGC等核心技术,进而让它所生成的数字人在基本外观和表情、情绪以及肢体动作等细节方面做到无限接近于真人的同时,也能依靠文本或语音完成驱动。

并且,从它之前所搭建的数字人系统上来看,在此次灰豚MotionAI大模型发布之前,它就已经拥有了照片克隆、AI数字人克隆系统、AI声音人克隆系统等多种数字人克隆技术和“1+N”数字人训练模式。正因如此,它所搭建的数字人系统,不仅能让用户自行选择静态数字人的克隆模式,还能让所生成的数字人具备更多的成长属性和行业属性。

在此前提下,数字人系统的拥有者无论是选择只部署它现有的AI绘画、AI文案、AI直播语音互动、数据分析、文生视频和AI复活等功能的源码,还是想要在此基础上根据自己的需求定制新的功能,都能够让整个数字人系统最大限度地展现出应用潜力和提高用户的使用体验。综合种种迹象来看,此次自由行走的数字人能够出自于它之手,并非全无预兆。

值得一提的是,根据艾媒咨询《2024年中国虚拟数字人产业发展白皮书》预测,到2025年,中国虚拟人带动产业市场规模和核心市场规模分别达到6402.7亿元和480.6亿元,其分析师也提出过虚拟人技术具有为用户提供高度智能化和个性化服务的潜力等专业论断,再加上它在数字人系统搭建完成后为客户企业配备的国内领先AI智能运营和公域平台引流方案、一对一保姆式帮扶、专业陪跑以及招商扶持等落地运营服务和上文所述的种种,整体上看,这些预测和论断似乎正在成为现实。

而目前,该项技术已经取得了中央网信办人工智能算法备案,并已同步应用至在其在私有化技术输出、OEM数字人系统、数字人源码部署之中,或许在不久的将来,自由行动的数字人及其背后数字人源码厂商将会给整个行业和用户带来不少惊喜!

0 阅读:9

科技的那档子事

简介:感谢大家的关注