12月9日晚,NCMMSC-CNVSRC 2023 学术研讨会在苏州召开的第十八届全国人机语音通讯学术会议(NCMMSC 2023)举办,会上公布了本次视觉语音识别竞赛 CNVSRC 2023 的最终结果,祝贺成者CZUR算法团队荣获第三名!
本次竞赛由 NCMMSC 2023组委会发起,由清华大学、北京邮电大学、海天瑞声、语音之家联合主办。竞赛的核心目的是验证当前视觉语音识别(或称唇语识别)技术在大词表连续识别场景下的性能。
本次竞赛共吸引了85支海内外队伍参赛。历经近三个月的角逐,来自西工大ASLP-理想汽车、内蒙古大学、红西瓜半导体、成者科技、北京邮电大学、同花顺等单位的参赛队伍获得佳绩。成者CZUR这是继10月信也科技杯算法大赛亚军后又一次获奖,感谢各方认可,再一次印证了成者CZUR视觉语音识别技术的实力。
视觉语音识别
视觉语音识别,也称唇语识别,是一项通过口唇动作来推断发音内容的技术。该技术在公共安全、助老助残、视频验真等领域具有重要应用。当前,唇语识别的研究方兴未艾,虽然在独立词、短语等识别上取得了长足进展,但在大词表连续识别方面仍面临巨大挑战。特别是对于中文而言,由于缺乏相应的数据资源,该领域的研究进展受到了限制。为此,清华大学在2023年发布了CN-CVS数据集[1],成为首个大规模的中文视觉语音识别数据库,为进一步推动大词表连续视觉语音识别 (LVCVSR) 提供了可能。
而成者CZUR的AI音视频技术为自主研发的核心技术,经过十年的技术沉淀,投入大量的研发成本,并获得各类专利47项,其中发明专利8项、实用新型专利15项,外观设计16项、GUI外观设计2项、美国专利4项、日本专利1项、韩国专利1项,PCT国际阶段2项等,最终形成了成者CZUR独有的技术优势。
成者StarryHub会议星投影式会议平板(一体机)的面世,凭着“AI+软件+硬件”三者合一的硬核配置,更好的体现出一台会议星=一间五星级会议室的极致体验感!其中正是深度融合了成者CZUR视觉语音识别技术,也是投影仪与会议平板品类间优势互补的一大创新特色。搭载成者临静™自研AI纯音技术,创造突破性拾音体验,让沟通更专注;坐不离席,超远拾音8-10米,轻松畅谈;高敏数字6麦圆形阵列,让拾音、降噪、声源定位功能最优化,360°全向无死角拾音,扩展拾音距离,覆盖更大范围,如此大师级AI音视频技术,再结合星光级超清AI摄像头+专业会议音响系统,真正做到为高效的远程视频会议而生。
不止于此,成者会议星满足从初创团队到大型企业的远程会议、本地讨论和来宾接待等需求,一体化集成专业音响/八爪鱼(拾音器)/投影仪/摄像头/笔记本电脑/录音笔/无线投屏器/会议转接线/手写白板/键盘鼠标等多功能于一身,并预装腾讯会议、钉钉、飞书、Zoom、WPS、央视新闻等工作、学习、娱乐类APP。
成者CZUR视觉语音识别技术在成者会议星这一创新产品上体现得淋漓尽致,而这也只是成者CZUR众多核心技术的其中之一。不同领域不同行业,都有着不同的办公需求,想要了解更多成者会议星强大功能,快来申请体验吧,现有企业免费试用活动,最快2小时上门。