文 | LT
在刚刚过去的2023年是AI产业全面爆发的一年。在AI爆发的背后是算力的需求极具攀升,而掌握全球80% GPU市场份额的英伟达去年赚了个盆满钵满。所以有人说,2023年AI爆发的背后,真正的赢家是英伟达。
北京时间1月9日0点英伟达举行“NVIDIA CES 特别演讲”。“如今,英伟达处于最新技术转型的中心——生成式 AI”,英伟达GeForce高级副总裁Jeff Fisher在CES特别演讲中开场说道。
这一次,英伟达推出了三款新型桌面级GPU可以让游戏玩家、设计师、工程师等等在个人电脑用就可以用上AI,而无需依赖互联网。
这三款基于Ada Lovelace架构的新品分别是:RTX 4080 SUPER、RTX 4070 Ti SUPER和RTX 4070 SUPER。
其中,新的GeForce RTX 4080 SUPER将获得更多的处理核心和更快的内存。在最新的生成式AI应用中,4080 SUPER运行Stable Diffusion XL图像生成软件的速度比RTX 3080 Ti快1.7倍,还支持通过计算单条光线的路径来构建图像,分辨率为4K。
让NPC活起来除了作为AI底座的显卡产品之外,英伟达在AI的领域相关服务也成为了本次英伟达演讲的重点。
在2022年,英伟达推出了基于云的AI模型和服务的集合平台NVIDIA Omniverse Avatar Cloud Engine(简称ACE),并在去年提出了ACE抢先体验计划,加入该计划的成员将获得NVIDIA AI微服务预发布版本的访问权限,以及为交互式虚拟形象应用程序开发云原生AI工作流所需的工具和文档。
此次演讲中,英伟达宣布推出ACE微服务,那就是利用Omniverse Audio2Face和英伟达Riva自动语音识别,使ACE平台利用生成式AI赋予数字化虚拟角色生命。
Omniverse Audio2Face可以用音频来创建3D动画的一项技术。而英伟达Riva是一款 GPU 加速的多语种语音和翻译 AI 软件开发套件,用于构建完全可定制的实时对话式 AI 流程,包括自动语音识别 (ASR)、文本转语音 (TTS) 和神经网络机器翻译 (NMT) 应用,可部署在云端、数据中心、边缘或嵌入式设备上。
在演讲中,英伟达高级产品经理Seth Schneider展示了它们的工作原理:
首先,语音输入被传送到英伟达的自动语音识别模型,将语音转换为文本。然后,文本被输入到一个LLM中,以生成角色的文本回应。
之后,文本回应将通过文本到语音模型进行语音化。AI 会自动操纵脸部、眼睛、嘴部、舌头和头部运动,以匹配定制的情绪范围和情绪强度水平,或自动从音频中推断情绪。
这项技术可以在交互式实时应用场景中使用,也可以将其用作传统的面部动画创作工具,然后渲染进游戏场景中。
在游戏领域,它使NPC(非玩家角色)能够展现出更加自然的反应,具备更深层次的互动能力,甚至能够学习和适应玩家的行为,从而极大地转变了游戏的体验。在这项技术的支持下,人与NPC摆脱了过去单一的,设定好的互动形式和内容。AI NPC能够根据玩家行为和游戏历史对玩家做出个性化适应,为不同的玩家带来更加个性化的游戏内容和道具。
“生成式AI技术几乎在改变我们的一切,游戏创作也不例外。”英伟达开发者关系部门副总裁Keita Iida认为,英伟达ACE技术为游戏开发者开辟了新的可能性,能给游戏世界带来更栩栩如生的虚拟角色。
同时,英伟达还宣布已经ACE合作的开发商包括了腾讯游戏、Convai、Charisma.AI、Inworld、miHoYo、网易游戏、Ourpalm、育碧和UneeQ。
除了游戏领域,这项技术还可以应用在教育领域。比如,智能NPC可以根据每个学生的学习情况、进度和理解能力,提供个性化的教学方案。这不仅可以使学生更好地掌握知识,还可以激发他们的学习兴趣。在一些技能或实验课程中,智能NPC可以模拟真实的环境,让学生在安全的环境中进行实践操作,如医学模拟手术、电子维修等。
对于语言学习,智能NPC可以提供互动式的课程,模仿真实的对话环境,提高学生的口语和听力技能。在心理健康教育中,智能NPC可以作为学生倾诉的对象,为学生提供心理支持,有助于减轻教师的负担,使教师有更多的精力关注学生的个性化需求。
智能NPC还可以协助教师完成一些日常任务,如课程安排、学生出勤记录等,使教师有更多的时间和精力投入到教学和关心学生上。
自动驾驶软硬兼施除了显卡和智能NPC,在本次演讲的最后还提到了英伟达在自动驾驶方面的相关进展。
在自动动驾驶平台方面,英伟达已经有了Omniverse和 NVIDIA DRIVE两大平台。NVIDIA Omniverse专注于3D设计和虚拟世界的创建及协作,而NVIDIA DRIVE则专注于自动驾驶汽车的技术和系统开发。两者对于自动驾驶汽车的开发和测试中起着互补和加强的作用,共同加速自动驾驶汽车的开发和测试、提高设计和工程的协作效率。
在硬件方面,2022年英伟达就发布了新一代芯片计算平台DRIVE Thor,它是英伟达Drive Orin芯片的升级版。根据公开信息,这颗SoC芯片内部拥有770亿个晶体管,可实现2000 TOPS的AI算力,计划2025年投入生产。
若从算力数据来看,Drive Thor是Drive Orin的近8倍,并包含了更大的野心。英伟达表示,DRIVE Thor是新一代集中式车载计算平台,其可在单个AI计算平台上集成自动驾驶、自动泊车、驾乘人员监控、AI座舱等多种智能功能。目前,全球许多顶级汽车制造商都已与英伟达展开合作,共同推进自动驾驶技术的发展。
最后,我们可以看到AI电脑,智能NPC,自动驾驶,英伟达正在通过软件和硬件全面布局AI相关产业,不断拓展其业务范围,深度参与AI改造和创造之中。
(以上图片全部来自英伟达官网)