Intel异构芯片Lakefielddieshot赏析-从3D封装到混合架构深度分析

启芯硬件 2024-06-18 19:09:47

一、背景介绍

Lakefield是英特尔于2019年推出的高性能低功耗3D微架构。

Lakefield瞄准低功耗市场,其TDP仅为7W,旨在与具有类似功耗范围的ARM产品竞争。

ARM 已经在十年前就已经部署了 big.Little,但英特尔和 AMD 此前一直坚持基于单 CPU 设计构建的多核 CPU。Lakefield 将 1 个 Ice Lake“大”CPU 核心与 4 个 Tremont“小”CPU 核心组合在一起。

Lakefield 是一种混合处理器,采用了两种不同的处理器微架构和使用 Foveros 的堆叠封装 Lakefield featured two different processor microarchitectures and a stacked package using Foveros. 该计算芯片采用英特尔10 纳米工艺制造,具有高性能和高能效。该芯片具有所有与计算相关的 IP。它包含一个Sunny Cove 大核心和一个由Tremont 小核心组成的四核集群。

该芯片还集成了 IPU 5.5、Gen11图形和媒体以及 Gen 11.5显示引擎和四信道(16 位)LPDDR4x 内存。IPU 5.5 支持最多 6 个 16 MP 连接摄像机,而 Gen 11.5 显示器支持 4 个管道和两个分辨率为 8K @ 60 Hz 或 4K @ 120 Hz 的显示器。

Lakefield是Intel首款量产的三维集成电路单ISA 五核异构多核架构。该 SoC 的计算芯片直接位于使用英特尔Foveros面对面 3D 集成技术的基础芯片上。然后, PoP内存位于通过焊线连接的计算芯片顶部。整个 SoC 是一个尺寸为 12 mm x 12 mm x 1 mm 的单一封装。

Lakefield 定位是满足台式机/笔记本电脑和智能手机的要求,包括高性能内核、始终在线功能、始终在线连接以及超低 2-3 毫瓦范围的待机功耗。

详细来说,Lakefield 主计算芯片采用英特尔10 纳米工艺制造,具有高功率和高效率功能,而基础芯片则采用该公司的22 纳米 (22FFL) 工艺制造,具有超低功耗功能。Lakefield 的待机功耗比上一代提高了 1/10,图形性能提高了 50%,核心总面积减少了 40%,其高度减少了 40%。

英特尔于 2019 年首次推出 Lakefield 和 Foveros 3D 封装。其设计类似于提拉米苏:两个 DRAM 层堆叠在计算芯片顶部,计算芯片依次堆叠在具有高速缓存和 I/O 的基础芯片顶部。最后,它们被堆叠到中介层上,通过硅通孔 (TSV) 在各层之间发送数据。

Lakefield 处理器规格

处理器

英特尔酷睿 i3-L13G4

英特尔酷睿 i5-L16G7

图形

英特尔超高清显卡

英特尔超高清显卡

核心/线程

5/5

5/5

图形执行单元

48

64

缓存

4MB

4MB

基准时钟

0.8GHz

1.4GHz

Max single-core turbo clock

2.8GHz

3.0GHz

Max all-core turbo clock

1.3GHz

1.8GHz

记忆

4,267MHz LPDDR4X

4,267MHz LPDDR4X

TDP(PL1/PL2)

7W/9.5W

7W/9.5W

横屏看更方便~    

二、lakefield die floorplan 基本介绍

下面是lakefield的floorplan

1.DDR单元,总共4个channel的DDR模组,其中north及south方向,各有两个16bit DDR模组,如下图

2.CPU和GPU单元。左右大块是GPU单元,右边是CPU单元,小核心tremont core在中间靠下方。

3.显示单元。右上方显示方面的,DP及DPHY

4.ISP单元. 在右下方区域,占据了大块面积

Lakefield 计算芯片采用具有单个大核和四个小核的混合架构。该架构采用单 ISA,因此在大核心上禁用AVX和AVX-512,以实现核心之间工作负载的无缝迁移。大型Sunny Cove核心专为高性能和突发性工作负载而设计,而轻量级和线程应用程序可以利用Tremont核心来实现更高的能效。

这种方案有利于更大限度的压榨性能,提高能耗比,增加电池使用时间,适用于移动端,很明显和ARM的big/little core类似。

三、dieshot 细节分析

具体工艺来说,在英特尔的 10 纳米工艺上,四个Tremont核心及其 1.5 MiB二级缓存适合单个Sunny Cove核心的硅区域。单个Sunny cove核心在性能/功率曲线的高端可产生最佳的功率性能效率,但在低端则输给Tremont核心。同样,四个Tremont内核的多线程功能比Sunny Cove内核扩展了 100% 以上,同时能效更高。

芯片专为实现超低功耗始终开启功能而设计。该芯片集成了供电、安全、存储、音频、USB 2 和 3、UFS3、PCIe Gen3、ISH、I3C、SDIO、CSE、TC SS、SPI/I2C。以下是各部分die size面积大小统计。横屏看更方便

Size(mm^2)

total size

82

sunny cove

4.338588009

tremont cluster

4.877025339

tremont

0.835407547

Gen11 GPU

30.24

LLC 4MB

2.386652552

SRAM的面积单独计算如下

density(MB/mm^2)

SRAM

1.675987565

Lakefield 动态地向操作系统/软件提供有关工作负载的功耗和性能特征的反馈。表现出性能或高响应能力的工作负载将被指示在Sunny Cove核心上进行调度。同样,后台线程也会收到在Tremont核心上进行调度的指示。该反馈可用于操作系统动态迁移线程,以提供最佳的功率和功率效率。

四、总结

英特尔写道:“采用英特尔混合技术的英特尔酷睿处理器(代号为“Lakefield”)是我们 xPU 战略和持续架构创新的一个重要里程碑。” “他们展示了混合 x86 CPU 和新封装技术的潜力,可显著减小电路板尺寸,同时提供英特尔酷睿性能。”

通过将核心架构和压缩组件融合到一个封装中,Lakefield 有望最大限度地延长电池寿命,并创造出一种新的超薄个人电脑类别。其单个高功率“Sunny Cove”核心只会在繁重的工作负载下启动,而四个“Tremont”效率核心则适合轻量级操作。两者之间的切换将大大提高移动设备的电池效率。将系统内存移至CPU封装上还降低了电路复杂性,从而有助于缩小主板尺寸。下图可以看到主板非常小巧,完全能放到平板机器中。

另外,Lakefield 使用电源管理集成电路(PMIC),而不是像Ice Lake等同时代产品那样使用分立式VR或FIVR。为了支持 Lakefield,需要两个 PMIC - 一个用于计算芯片,另一个用于基础芯片(CSC 和 WRC),如下图所示

整体来说,虽然lakefield生命周期很短,但是不失为一个值得学习的案例,不管是封装和混合架构的芯片设计。

0 阅读:2

启芯硬件

简介:资深硬件工程师, 拥有10+项专利及集成电路布图专有权。