Zen5TechDay:锐龙AI300系列处理器如何赋能AIPC?

测评看图文就够 2024-07-18 07:10:40

锐龙AI 300系列处理器是AMD面向移动平台推出的第三代AI PC处理器,采用Zen 5架构的处理器核心,XDNA2架构的NPU AI加速模块,RDNA 3.5架构的集显,可以说集AMD先进技术于一体,是AMD倾注大量心血的一款产品。

锐龙AI 300系列处理器的核心代号为“Strix Point”,除了采用多种先进架构,它的处理器核心还分别采用了两种核心,分别是Zen 5核心和Zen 5c核心,但AMD的两种核心有别于英特尔的“大小核”,AMD的两种核心是基于同一架构设计,拥有相同的核心设计和指令集,区别仅仅是在缓存、频率以及功耗方面。

我们分别来介绍锐龙 AI 300系列处理器的三种架构。首先是处理器架构,它最高支持12核24线程,其中有8个核心是Zen 5c架构(紫红色),4个核心是Zen 5架构(橘红色),因为他们的架构一致,所以都支持超线程设计。Zen 5c采用更先进的制程工艺,某种程度可以理解为是为能耗做的妥协,而非英特尔的混合架构;Zen 5架构与桌面处理器保持一致,同样使用4nm制程工艺设计。

RDNA 3.5架构主要是在RDNA 3架构的基础上对能效进行大幅度优化,提高笔记本的续航时间。

从AMD公布的数据看,RDNA 3.5架构的Radeon 890M在15W下的性能比Radeon 780M快了19%-32%。

XNDA 2架构最主要的改进在于运算单元(AI Engine Tiles)从原来的20组升级为32组,NPU算力从第一代的10TOPs提高到现在的50TOPs。

在AI运算里,灵活性显得至关重要。举个例子,当你需要AI应用进行辅助时,你可能需要它采集音频生成文字,可能还需要模糊视频会议的背景,还需要实时生成一些图片,并且需要它提供高速的反应速度以及处理能力。因此,XDNA 2架构的AI计算模块采用的是互联阵列结构,并通过DMA接口直接将数据输入和传出本地内存,以获得最大的灵活性和响应速度。

XDNA2架构还采用了一种全新的Block FP16的运算格式,拥有接近INT8的算力表现同时兼顾FP16的高精度需求,完整输出50TOPS的算力,无需开发者做额外的数据量化。

结合以上设计,XDNA 2可提供50 TOPs的算力,远超微软下一代Windows系统对NPU算力(40TOPs)的需求。

NPU的性能目前其实很难直观的对比,只能通过算力进行基础的性能对比。例如英特尔的酷睿Ultra 100系列处理器的NPU只有11TOPs左右的算力,锐龙AI 300系列处理器的NPU算力是50TOPs,所以性能是其的5倍。

在会议中,我们也和AMD交换了这方面的意见。客观来说,目前的AI应用属于百花齐放、万家争鸣的时代,没有一个统一的语言模型或是算法结构,就代表了没有基准线,所以很难对比实际性能。很有可能在某款应用上,A更快,但在另外一款应用上,B又更快。并且,目前AI语言模型的迭代速度非常快,可能过了几个月新模型又出来了,之前的测试也许又要重来,这也给AI性能的衡量增加了不小的难度。

不过,在会议现场,AMD给我们演示了不少即将发布或已经发布的AI应用,在锐龙AI 300平台上运行确实显得游刃有余。

搭载锐龙AI 300系列处理器的AI PC笔记本预计也会在7月31日前后推出,具体上市时间以笔记本厂商公布的产品上市时间为主。

0 阅读:0

测评看图文就够

简介:感谢大家的关注