11月15日,按照广播电视和网络视听行业标准制定程序和计划安排,国家广播电视总局组织相关单位编制《数字虚拟人技术要求》行业标准,并对已通过全国广播电影电视标准化技术委员会审查的报批稿予以公示。
广电总局公布的《数字虚拟人技术要求》报批稿,是国家广播电视总局按照广播电视和网络视听行业标准制定程序和计划安排,组织相关单位编制的一项行业标准。以下是对该报批稿的详细解读:
一、公示背景与目的公示时间:2024年11月15日至2024年11月24日
目的:对已通过全国广播电影电视标准化技术委员会审查的《数字虚拟人技术要求》行业标准报批稿进行公示,以广泛征求行业意见,确保标准的科学性和实用性。
二、数字虚拟人的定义与分类定义:数字虚拟人是通过计算机技术生成的,具有人类形象、行为和交互能力的虚拟实体。
分类:
按人物形象分类:2D数字虚拟人、3D数字虚拟人。
按交互模式分类:非交互式数字虚拟人、交互式数字虚拟人。
按驱动模式分类:算法驱动型数字虚拟人、真人驱动型数字虚拟人。
三、数字虚拟人的应用场景内容播报:包括新闻资讯播报、手语播报、电影/电视/专题片/纪录片介绍和直播带货等。
交互客服:包括虚拟客服、智能助手和交互问答等。
虚拟演播:包括综艺主持、虚拟演唱会、文娱活动和用户代理虚拟分身等。
内容创作:包括影视创作、视频创作、广告创作和游戏创作等。
四、数字虚拟人的技术架构与要求总体技术架构:包括数字虚拟人形象、算法驱动能力、真人驱动能力、平台能力和安全能力等。
形象要求:
符合场景的任务设定,在人物形象、表情、服饰等方面得体、美观。
支持全身、大半身、半身不同景别姿态。
形象完好,不存在扭曲、马赛克、跳帧、破损、音视频延时、口唇不一致等情况。
不存在侵犯第三方权利及法律法规禁止的其他情形。
2D数字虚拟人形象要求:
支持真人形象复刻,形象逼真自然,语音自然流畅。
支持通过照片、视频等方式生成形象,保证面部五官、肤色、牙齿、明暗等准确还原。
3D数字虚拟人形象要求:
支持通过3D建模或真人扫描等方式刻画形象,具有高度的真实感和细节表现。
支持对形象的美型、加工和风格化等。
支持不同角度、景别、姿态的灵活转换和丰富的动作类型。
算法驱动能力要求:
支持多种驱动方式,包括文本驱动、语音驱动、视频驱动等。
支持单一技术驱动和混合技术驱动的方式。
应支持的驱动范围包括口型、面部表情、肢体等。
合成能力技术要求:
语音合成效果自然,音质音效贴近真人。
实现字词级别的音量、时长的细粒度控制,以及多情感高表现力的可控语音合成效果。
平台与安全要求:
平台服务能力可选择云服务或者本地服务。
应为数字虚拟人应用提供安全保障,覆盖数据及算法安全和个人信息保护等。
五、结语《数字虚拟人技术要求》的发布,标志着我国在数字虚拟人领域的技术标准化迈出了重要一步。这将有助于推动数字虚拟人在广播电视和网络视听行业的广泛应用,提升行业的创新能力和竞争力。同时,也为数字虚拟人的研发、生产、应用等环节提供了明确的技术指导和规范。