高通自研CPU上新,骁龙8至尊版发布

论半导体谈人生 2024-11-07 05:09:41

今天,一年一度的高通骁龙峰会在夏威夷毛伊岛隆重举行。作为科技界的盛事,高通过去几年里都会在这个峰会上披露公司最新的旗舰芯片平台、应用和合作。过去九年里,高通也在这个盛会上带来了5G、XR、PC和汽车等技术热点和产品展示。

其中,自研Oryon CPU无疑是最近两年高通骁龙峰会的热点之一。在笔者看来,这是一款融合了高通过去在Arm CPU上积累与收购Nuvia所获得经验的产品。去年,该系列CPU的第一代也已经被官宣用到高通的PC芯片平台骁龙X Elite上。

在本届的骁龙峰会第一天,高通带来了第二代的Oryon CPU,并将其集成到了公司最新推出的,使用台积电第二代3nm工艺打造的“骁龙8 至尊版”(Snapdragon 8 Elite)上。值得一提的是,这是公司首次在移动平台上集成了自研Oryon CPU。

一个堪比桌面平台的CPU

过去一段时间里,AMD、英特尔和高通围绕着CPU有了不少的发布和对比,归根到底是因为苹果M系列芯片的发布,高通的强势杀入,引致大家对PC芯片效率、功耗和性能的竞争。

作为一家在Arm PC市场深耕多年的厂商,拥有了Oryon CPU的高通,面对这些PC老牌巨头,也有了不小的底气。尤其是在第二代发布以后,高通Oryon表现惊人。如下图所示,在与第一代产品,高通的第二代Oryon CPU无论在性能还是功耗上,都有了不少的提升。

高通甚至直言,其智能手机中的第二代 Oryon 核心比英特尔寄予厚望的Lunar Lake PC 处理器更快。

高通首席执行官Cristiano Amon表示,如果两款芯片以相同的功率运行,新的 Oryon 核心比 Core Ultra 7 Series 2 芯片快 62%。如果两款芯片以相同的功率运行,Core Ultra 所需的功率将是高通芯片的 190%。

为了应对AI带来的高性能需求,高通将新一代的Oryon CPU引入到了公司新推出的骁龙8 至尊版移动平台上。它将取代高通之前在移动芯片组中使用的 Kryo CPU。但和骁龙X elite的CPU配置不一样,高通针对移动平台的特性进行了改进,使其更满足终端功耗和性能的追求。

具体到骁龙8 至尊版上,其Oryon CPU使用了两个主核(prime)和六个性能核(performance)的设计。这也和上一代旗舰——骁龙8 Gen 3的“1+5+2”的设计有所不同。其中,主核的频率为4.21Ghz,性能核的主频3.53Ghz,再搭配高通为这个CPU搭配有足够竞争力的L1缓存(每个 Prime 核心有 192KB,每个 Performance 核心有 128KB)和L2缓存(每个集群 12MB 的 L2 缓存池),使其在处理各种应用的时候游刃有余。

据介绍,这是一个全新的微架构,具有“即时唤醒”(Instant wake)功能,可减少各个核心的频繁电源循环。按照高通所说,在过去,上电序列( power-up sequence)涉及重置代码,以使核心做好运行准备。而高通通过使用允许核心立即执行下一条指令的硬件消除了该序列,进一步提升了其效率。

高通在其网站中总结说,公司首款移动版 Qualcomm Oryon CPU 性能提升 45%,能效提升 44%,并拥有移动行业最大的共享数据缓存,其整体节能效果更是提高了 27%,这意味着手机游戏时间最多可延长 2.5 小时。

一款集成了40 多个组件的SoC

如上所述,在全新的骁龙8 至尊版上,高通集成了业界领先的第二代Oryon CPU。但除此以外,公司还在这款新的移动平台上还集成了全新的Modem、GPU、NPU和ISP等组件。据高通所说,在这款新的移动平台上,公司集成了超过四十个的组件,使其成为了一款极具竞争力的高集成SoC。

如下图所示,除了上述的主要部件外,高通在骁龙8 至尊版还集成了包括电源管理、无线、音频、指纹和RF等组件,这将进一步简化开发者的设计。

当然,和过往每一代的骁龙旗舰一样,在GPU、NPU、ISP和Modem上的升级,是高通旗舰迭代的重中之重。

首先看GPU方面,在全新的旗舰中,高通集成了不具名的新一代 Adreno GPU。据介绍,新Adreno GPU 采用了独特的切片(slice)架构——将着色器核心和其他固定功能块分成不同的切片。通过这种设计,可以允许更动态的资源分配、更高的时钟速度、更好的负载平衡,并且可能通过关闭切片来降低功耗。高通指出,与上一代相比,新GPU 性能提高了 40%,能效提高了 40%,光线追踪性能提高了 35%。

如图所示,切片的每个部分以 1.10GHz 的时钟速度运行。每个切片都有自己的专用内存(新的 GPU 拥有 12MB 的专用内存,减少了对 RAM 的调用),这意味着更流畅的性能、更长的电池寿命、更清晰的图形和更逼真的 3D 环境。

高通还表示,该 GPU 支持 Unreal Engine 5.3 和 Unreal Chaos Physics Engine、HDR 游戏(10-bit color和 Rec.2020)、OpenGL ES 3.2 和 Vulkan 1.3 以及硬件加速的 H.265、VP9 和 AV1 解码,这使其在提升游戏体验上,有了更多的支撑。

来到NPU方面,高通也针对AI需求进行了新的更新。

如图所示,新的Hexagon NPU拥有面向不同AI需求的6核向量(Vector)加速器、8核的标量(Scalar)以及Tensor加速器,再结合更快的内存吞吐量,这有助于 8 Elite 实现高达 45% 的 NPU 性能提升(具体取决于工作负载)。升级后的 NPU 还实现了 45% 的 AI 性能/瓦的功耗节省(这同样取决于正在运行的内容)。而在不具名的 LLM 上,高通的这个NPU可以获得每秒最多可输入 70 个token的性能表现。

首次引入的AI ISP则是高通新旗舰的又一个不得不提的亮点。按照外媒所说,从某种程度上看,高通在这个ISP上是一次彻底的重建。据介绍,借助新的AI ISP,现在更多的处理管道( processing pipeline )在 RAW 域中运行,这意味着当 ISP 自动校正白平衡、曝光等时,可以获得高质量的结果。

除此以外,在这个全新的旗舰芯片上,高通还在NPU和ISP上做了架构调整,借助一项名为Hexagon Direct Link的技术,将两者互联。而通过将 NPU 与成像管道集成,设备可以自动增强画面中的任何内容,包括色彩平衡、清晰度和亮度。高通也透露,直接 RAW 处理和与 NPU 的直接链接允许以 4K/60fps 进行实时 AI 增强,通过更新更快的图像分割技术 (Insight AI) 提供更多修饰照片的选项,以及 30fps 的视频对象移除,所有这些都在设备上运行。值得一提的是,这个ISP 现在支持三重 48MP 摄像头,可满足一些相当常见的设置,并且可以同时从所有三个传感器读取 30fps 4K 视频。

至于无线方面,X80 modem和WiFi/蓝牙的领先性,也让这个旗舰芯片成为了一个六边形战士。

据介绍,X80 是一款完整的 5G 调制解调器到天线模块,封装在单个芯片上,具有用于智能手机的六根天线、6x 载波聚合和基于 AI 的毫米波范围扩展器。其专用于 AI 的张量加速器可提高数据速度、减少延迟,并以较低的功率提高覆盖范围和定位精度;FastConnect 7900 则将Wi-Fi 7、蓝牙和超宽带集成到单个芯片中,为终端用户提供数字钥匙、物体定位和室内导航等解决方案。AI 可跟踪性能并根据需要进行调整以保持最佳连接。

高通表示,通过结合 6GHz 以下和 mmWave,5G 的下载速度最高可达 10Gbps,上传速度最高可达 3.5Gbps。即使在混凝土建筑物内,它也能提供 30% 的定位精度。得益于三频频谱支持(2.4GHz、5GHz、6GHz),使用该芯片的手机应该能够以 40% 的功耗使用 Wi-Fi,下载速度最高可达 5.8Gbps。

正是这些领先配置,让高通骁龙8至尊版获得了客户的高度认可。

据高通透露,华硕、荣耀、iQOO、摩托罗拉、努比亚、一加、OPPO、红魔、Redmi、真我realme、三星、vivo、Xiaomi和ZTE等领先OEM厂商和智能手机品牌将在未来几周发布搭载骁龙8至尊版的终端。

在高通看来,该平台也将开启终端侧生成式AI新时代,旨在无缝处理多模态AI复杂性。

0 阅读:0

论半导体谈人生

简介:感谢大家的关注