少即是更多英特尔酷睿Ultra200V的以退为进

科技有点奇谱 2024-09-05 17:47:03

生意场上不如意,使得英特尔在AI PC这个巨大机会面前,更加卖力地投入各种资源、开放各种合作,力求在产品、技术的基本盘上稳定OEM、ODM、ISV、IHV体系,进而稳定消费者对PC的信心,以谋东山再起。

面对AI PC如此大的机会,PC产业链上的哪个角色能不心动?各方一拍即合,“AI PC”瞬间成为各种议题的中心。

为了力拔头筹,英特尔不惜打乱产品节奏,去年12月推出一代酷睿Ultra产品、今年1季度才上市,此时第二代产品酷睿Ultra 200V就发布了,出手就是20几家OEM、80余款产品。

AMD更是直接将产品挂上了“AI”字眼,并宣称Ryzen AI 300系列已经是其第三代产品——Ryzen 7040为第一代、8040为第二代,节奏也是乱得了得。

高通这个PC市场的“多次”叩门者就更有意思,其基于ARM架构的产品因性能与兼容性不甚理想,一直只能与微软Surface系列的入门款产品打包卖Windows on ARM的便携特性。最新一代的骁龙X去年年底就发布了,半年无人问津。

直至微软跳出来,高调标定AI PC(Windows版)的NPU算力要大于40 TOPS,这下萝卜招聘的骁龙X终于硬了一把,在2023年年底的时间节点,唯有他能够满足这一要求——ARM也能讲性能领先了,这个世界好魔幻。而英特尔刚发布一代酷睿Ultra(34 TOPS),AMD Ryzen 8040甚至还未在CES 2024上亮相——那算力也不够——16 TOPS,你说这俩x86大佬心理阴影得多大。

于是,借这个时间空档,微软联手高通,在今年5月抢先祭出Windows 11 AI+ PC这一全新品类,高通也因此在PC市场腹地的Computex 2024上,扮演了一把行业领导者,其CEO安蒙甚至登上了主题演讲台——以往,通讯口的高通,和PC口的Computex,相互不鸟,如今成了高通主角。

Computex 2024上,意气风发的Lisa Su,再怎样Ryzen AI 300也只是发布;英特尔ITT台北(Computex 2024前夕),再怎样Lunar Lake也是Preview(预览)。面对十余款可以开售的骁龙X于AI PC独美,你说这俩x86大佬心里得问候多少次微软。

Lunar Lake不得有失!这并不是8月以来股价暴跌、大规模裁员,英特尔才有的上下认同。从激进的4年5节点制程迭代节奏提出以来,英特尔就已经意识到再不搏就将更远离移动计算,甚至连同整个PC产业一起边缘化。虽然英特尔不断宣布制程迭代按计划完成,但是仍旧赶不上Lunar Lake的饥渴与急迫。在这个不得有失的关键产品上,英特尔已经放下身段,将其所有tile代工都下放给了台积电,连不懂技术的人都能看出,英特尔在用这种方式抢回错过的时间窗口。

在台北,英特尔就已经非常细致地讲解了Lion Cove的P Core、Skymont的E Core的架构、负载和效率,性能倍增的Xe2架构GPU、历史可追溯4代的NPU,功能集大成SoC tile、优化调度设计的ITD,并不断强调的BF16、Int8甚至Int4性能与兼容性。打造全方位超越竞争对手的产品的急切心态可见一斑。

而最令指标党们惊愕的,还是Lunar Lake所做的减法:不增反降的核心数量、不高反低的运行频率、一代/半年游的LP E Core、曾经NB到天的超线程技术不再、L3 Cache容量近乎腰斩。难道这一切的减法,真的是因为核心能力+++了吗?上次许诺言犹在耳,今天的英特尔还是狼来了吗?无论是潘多拉效应还是墨菲定律,都要今天的英特尔拿出实际行动,用产品的实际表现而不是ppt加以证明。

在做减法的过程中,英特尔一反领导者的常态,开始摸着竞争对手成功的轨迹、小心地绕开竞争对手难言的痛点,打造出如今这个“硬指标”上平淡无奇、从始至终都在讲效率的核心架构。

英特尔宁可牺牲tile规模/核心数量,也要将Lunar Lake的P Core与E Core放在同一个compute tile里面,其他功能也分tile集成、整合Fabric接口,做法有别于多CCD/CCX+IOD的DIE粘合或大型DIE分区的传统设计,换来了不同(类型)核心间以及核心与内存间更低的数据交换延迟,这正是竞争对手难以名状的痛。再加上能效层面的因素,以及不同类型核心之间的数据延迟水平一致性优化,Lunar Lake没有把这一系列复杂问题丢给软件去优化,使得更多未经特殊改进的软件也能获得更低数据延迟的收益。

在核心使用方面,有着高频率、独立大缓存(L3 Cache)的P Core不再承担主要工作,也就是Windows不会再以优先用尽P Core物理核心为调度原则,转而让P Core平日里多闲着、关键时候去啃硬骨头,犹如特种部队般的存在。在这样的调度逻辑下,处理器日常工作所消耗的电力大幅度下降,而同时又有释放峰值性能的硬件储备——核心、频率、散热空间。因此在英特尔秀出的性能测试对比中,酷睿Ultra 9 288V这颗旗舰产品,有着大幅度超越竞争对手的单线程性能成绩。

相比新P Core的“保守”——代际IPC性能提升14%,新E Core可谓极度激进:上有拳打14代桌面处理器P Core的性能,下有压制前代酷睿Ultra处理器LE E Core的低功耗表现,代际IPC性能提升幅度高达68%。

要强调的是,虽然与前代同定位的型号相比,Lunar Lake的P Core和E Core最大睿频频率都有所降低,但是两个核心的基础运行频率都有1GHz甚至更大的提升,以E Core为甚。结合IPC的提升,就能很好地理解Lunar Lake为什么在减少核心数量后还能有更好的单线程和多线程性能表现了,毕竟最大睿频不是常态,高的有效运行频率结合高的IPC,完全能够弥补P Core减少以及取消超线程的负面影响,毕竟强有力的E Core数量未减。

上图的含义值得细细品味,在9W、17W和23W这几个常定义的负载节点上,Lunar Lake均有2倍以上的单线程性能提升——甜蜜点为17W,以及6%至22%的整体性能提升——功率点越低提升幅度越大。这样比较下来,Lunar Lake的Minimum Assured Power(最低保证功率)定在17W就非常值得玩味了。

此外,虽然每个P Core独占的L3 Cache容量仍是3MB,但是随着P Core数量减少以及与E Core簇共享的L3/L4 Cache取消,Lunar Lake整体的L3 Cache容量减少了很多,对降低功耗的贡献明显而直接。针对E Core,Lunar Lake为每4核组成的簇配备了2MB、总计4MB的更低延迟的L2 Cache,使E Core到E Core的数据延迟与P Core到P Core的数据延迟水平相同,极大地降低了由此造成的跨核调度的复杂性。

更加强调效能并定向精简后的Lunar Lake处理器,整体功耗降低了50%,这还是包括了直接集成在CPU上的16GB或32GB内存所产生的2W功耗后的结果。

因此,比整机及每线程性能提升更为耀眼的是基于Lunar Lake处理器平台的笔记本电脑的续航水平。英特尔的标称是20小时以上,而OEM厂商普遍能将75Wh配置机型的续航时间进一步优化至28甚至29小时水平!

以宏碁跨酷睿、锐龙和骁龙的同一设计、规格和尺寸的Swift 14系列产品为例,锐龙版SF14-61标称续航时间为27小时,骁龙版SFG14-01标称续航时间为28小时,酷睿Ultra 200V版SF14-51更进一步,达到29小时!

一款在性能、兼容性上更具优势的x86平台产品,在ARM最能吹嘘的续航时间上进行了超越,脸上几分烧,各自体会。

Lunar Lake集成的Xe2架构核显,是英特尔GPU的“下一代“架构,表述非常微妙。现实情况是,Lunar Lake之外,哪怕是发布时间更晚的产品,仍将使用“当代”的Xe架构。未来产品技术超前释放,奠定了平台图形性能的基础。

好吧,牛皮得让人家吹,谁叫它的表现真的更为出色呢!

结合CPU及GPU的AI特性,以及后者升级的XeSS2,AI插帧的效能提升比例更大,使用相对低精度的Full HD素材超分到2K乃至QHD分辨率,比直接使用高级别分辨率的更具使用性。而会否改变未来游戏分辨率设定及插帧技术的走向,让我们拭目以待。

在普通版之后,英特尔还基于Lunar Lake推出了新版本的Evo认证,进一步从性能、AI、续航、连接、扩展和环保角度对未来的轻薄产品提出了要求,细分出面向高品质需求的产品市场。

在另一对便携性有和性能有更高要求的掌机领域,Lunar Lake正在帮助微星提升Claw产品的吸引力,尤其是核显性能超越锐龙AI 300平台,盖过其早半代架构的锐龙Z1平台更是不在话下。清凉又高能,玩家怎能拒绝这样的新产品。

最后要放出的是酷睿Ultra 200V系列的产品及规格清单。随着内存容量这一参数的加入,这一产品线的组成更加复杂了,好在如何选择规格型号的问题是PC厂商的,消费者只要考虑兜里有多少钱就好。

目前,英特尔还未放出新产品的建议价格,而酷睿Ultra 7-185H价格高达640美元,其对应的新型号为酷睿Ultra 9-288V。受处理器价格影响,其终端笔记本电脑的价格着实不会太低。酷睿Ultra 7-165H标价为460美元,集成32GB DDR5X-8533的酷睿Ultra 7-268V价格恐超过500美元,耗子尾汁吧。

0 阅读:181

科技有点奇谱

简介:感谢大家的关注