在昨天骁龙 8 至尊版发布完之后,对高通技术公司手机、计算和XR事业群总经理阿力克斯·卡图赞(Alex Katouzian)先生有一个小小的群访,汇总了一些内容:
· 为什么今年没有更新骁龙 X Elite?今年骁龙 8 至尊版拥有可以比肩桌面级的性能,会不会以后移动和 PC 芯片会是同一个?因为之前骁龙也曾经这么做过。
Alex Katouzian:这种选择并不现实。因为PC内核在功耗分布方面的设计初衷就与手机的不同。对于手机而言,其功耗通常是在 2.5W-5W。一些时候,可能会达到 6-7W,仅此而已,然后就会降下来,因为你必须确保一整天的电池续航。而对于笔记本电脑来说,你需要同时兼顾功耗在 15-30w 的任务和功耗甚至超过 50W 的任务。这就是两款平台不能融合的原因之一。
另外一个原因,PC 芯片和手机芯片对于带宽的需求也不太一样。手机方面在设计时主要要考虑功耗高低、成本是多少;但对于 PC 而言,更多则是满足更丰富功能的需求。这也是手机和 PC 平台不能够进行合并的原因。
在发布会上,我们展示了骁龙 8 至尊版的 CPU 和 PC 竞品 CPU 的性能对比,这只是为了展示我们 CPU 设计的先进性。去年我们发布了骁龙 X Elite,今年我们带来了第二代 Oryon CPU,可以发现我们 CPU 的内核发展并不是停滞不前,而是逐年提升。明年此时,各位可以看到我们发布采用下一代 Oryon CPU 的新一代PC芯片,大家会发现我们在性能和功耗方面都会实现巨大提升。简而言之,我们的CPU会持续演进。
· (PC 平台)的更新频率是每两年更新一代吗?
Alex Katouzian:P C平台是每两年更新一代。
· Oryon CPU的更新频率是如何呢?
Alex Katouzian:Oryon CPU 是每年都会更新,因为 Oryon CPU 会应用在手机、汽车、PC 等各个领域(今天发布的两款车载芯片,包括骁龙座舱至尊版和 Snapdragon Ride 至尊版,也用的都是 Oryon 的 CPU)
· 提到骁龙 X Elite 的更新,明年会配备第三代 Oryon CPU 吗?
Alex Katouzian:我们目前无法透露,但可以肯定的是会配备全新的 CPU。
· 从第一代骁龙 8 到第三代骁龙 8,我们看到效率内核数量一直在下降,到骁龙 8 至尊版移动平台已经没有效率内核了,想问一下高通为什么会进行这样的设计?
Alex Katouzian:这次我们的性能内核具备很强的性能和很高的效率。实际上,特定市场的不同用例对于核心的需求是不同的,有些用例偏向于使用效率内核,有些用例则更偏向于使用性能内核,而我们的性能内核可以兼顾性能和效率方面的需求。
· 刚才有提到其实 PC 和手机的 CPU 很难融合,我们看到骁龙 8 至尊版的 CPU 主频超越了去年的 PC 平台的 CPU 主频,这样设计的意义是什么?
Alex Katouzian:骁龙 X Elite 采用的是 12 核设计,每个内核都在特定频率以多线程方式运行,能够实现很强的性能并完成很多任务。但在手机上运行的性能核数量会减少,只在需要强劲性能时进行调度。也就是说,PC 和手机运行多线程任务的方式是不同的:在手机上是尽可能压榨频率,以更少数量的核心支持多线程任务;而在 PC 上则会降低频率,同时引入更多数量的核心来支持多线程任务。
· 从芯片设计方面来看,高通收购 NUVIA 的意义是什么?
Alex Katouzian:我只能从产品层面来回答这个问题。我们的产品线正不断扩大并布局其他更多业务,在这一过程中,我们需要进行大量投入。高通之所以收购 NUVIA,是希望能够我们自己设计出适用于手机、PC、汽车等多个领域的 CPU 架构。
例如面向汽车的计算平台,需要具备很强的计算能力才能支持仪表盘上运行的多个应用负载;此外如果想要运行智能驾驶功能,也需要很强的 CPU 作为支撑。面向 PC 领域,我们带来了 CPU 性能方面的显著提升,因为 PC 很大程度上依赖于 CPU 去实现众多功能。一旦 CPU 的性能不行,PC 运行速度就会变得很慢,响应速度和流畅度也会下降,用户就无法获得很好的体验。在移动领域,我们的产品具有很强的竞争力,我们还和众多生态伙伴开展合作;而 PC 是我们进入的相对较新的领域,我们也希望为 PC 带来非常强劲的算力。
此外在汽车领域,我们的表现也很出色。实际上,目前高通已经成为了汽车生态系统的优选合作伙伴,但汽车对于算力的需求还在不断增长。这也是我们收购 NUVIA 的必要原因之一,我们希望具备面向多个业务提供高性能产品和解决方案的能力。
· 骁龙 8 至尊版的缓存是 24MB,其实是小于骁龙 X Elite 的 42MB,那么较小的缓存是不是会限制骁龙 8 至尊版性能的充分发挥?
Alex Katouzian:24MB 实际上是为移动应用量身定制的大小,但是 PC 不一样,PC 需要更大的缓存,对性能的要求也更高。但是针对移动领域,这个缓存大小是恰当的。
· 刚才也有提到每年都会有新的 Oryon CPU 发布,是否意味着每年都会有新的 CPU 微架构?第一代 CPU 和第二代 CPU 是否采用两个完全不同的微架构?
Alex Katouzian:这两者并非严格绑定的关系,两者可能会以各自的节奏推陈出新,但也取决于针对哪个产品线。比如说今年推出的第二代 Oryon CPU 就是专门为移动场景打造的。尽管它是基于第一代产品,但是在微架构上我们针对移动终端进行了重新设计,使其更加实用且具备更出色的能效,但两者的微架构并非完全不同。
· 所有的平台产品都使用自研 Oryon CPU 的重要性在哪里?
Alex Katouzian:至少在手机、PC、汽车业务领域,我们会开始在所有产品中使用Oryon CPU。至于说延伸到不同层级,目前我们的计划是将其应用于所有产品线的旗舰系列当中。从业务线来看,目前至少会覆盖手机、PC和汽车。
· 竞品(疑似指的是联发科)不久前也提到说他们不会一味追求主频参数,只要能与终端性能的需求相匹配,那么主频并不是重点。请问您如何看待这种说法?在芯片设计过程中,主频是否还是高通的重点方向?
Alex Katouzian:CPU 的频率其实非常重要,游戏、AI、影像等在移动平台上处理的任务愈加复杂;甚至人们的浏览网页的习惯和使用方式的复杂性都在变得越来越高。因此,我们认为,只要能够保证能效在合理范围内,就可以在设计 CPU 时通过提高频率来实现性能提升。如果提高频率会导致电池续航只有 3-5 小时,那么这就不是一个实用的设计。因此,当我们提高 CPU 频率时,总是会有与之相匹配的功耗降低,在延长电池续航的同时,实现性能增强。对我们来说,每瓦特性能比单纯的性能和频率更重要。
· 我了解到今年 NPU 标量和向量的核心增多了,想问张量核心在今年的设计上有些什么样的更新和特点?
Alex Katouzian:这取决于不同的场景。NPU拥有向量乘法(vector multiplier)和矩阵乘法(matrix multiplier)。有时,用户想使用的应用更适用于向量处理;有时,矩阵乘法的每瓦特性能更好。我们将两者综合考量,从中寻求平衡点怎样才是最适合实际用例的。也就是说,有时矩阵乘法越多,性能就越好;有时向量引擎越多就越好。但归根结底,我们所做的是研究各个市场中的实际用例,再据此设计NPU。有时我们使用更多的向量乘法,有时使用更多的矩阵乘法,这都取决于市场需求。
此外,如果操作系统开始越来越了解 AI 体验,就会将 AI 体验与硬件加速结合起来。硬件加速将根据操作系统所嵌入的用户体验而发生改变。正因如此,我们才可以像与微软合作那样,对整个软件栈进行优化。之后,架构就会形成,而向量和矩阵之间的分区也将根据我们所追踪的用户体验而改变。
· 今天早上在主题演讲中 CEO 提到“高通正在从一家专注无线连接的公司,发展为注重全新 AI 处理技术的智能计算公司。”那么是否有计划推出超过 100TOPS(每秒万亿次运算)的 NPU?
Alex Katouzian:如果我们把所有的注意力都放在 TOPS 上,来讨论每秒能够完成多少万亿的运算,意义不大。因为如果只讨论超高的性能,而不把功耗与之相关联起来,这是没有意义的。所以我们不仅提升 NPU 的性能,也要相应考虑合理的能效。
此外,当你想要用使用 AI 驱动的功能,举例来说,语言模型的准确性非常重要。在实际的使用中,需要将语言模型压缩,使得它在终端内存的范围之内可以运行,这个过程叫做量化。但问题在于,量化的过程会损失多少准确性?在这个过程中,我们会有各种不同的考量,包括浮点精度,比如 FP16、FP8;以及整数精度,比如 INT16、INT8、INT4 等不同的精度类型。最核心的问题是,不能丢失准确性,这是用 NPU 进行处理的前提。
TOPS 是衡量 NPU 性能的指标之一,在保证准确性的前提下,当 NPU 有越高的TOPS, token 生成的速度就会越快。但是如果没有准确性,空谈 100TOPS 就没有意义。当 NPU 性能达到 100TOPS,并且还能拥有 INT4 精度、拥有运行相关模型足够的内存带宽,将方方面面的参数都包含进去,这样的讨论才有意义。
骁龙 X Elite 达到 45TOPS,已经能够比其他同级别处理器表现更出色。
· 我们在去年的产品里出现的像第三代骁龙 8s 这样的产品是基于第三代骁龙 8 产品的特性进行下放,架构跟旗舰高度相同的。Oryon CPU 会不会下放到我们其他层级的产品中去?Oryon 这个英文名在中国市场会不会有一个中文翻译?
Alex Katouzian:您提了一个很好的建议,Oryon 现在还没有中文名字,我们会考虑。至于未来产品路线图,暂时没有更多信息可以分享。