高端性能封装技术的某些特点与挑战

半导体科技旅 2024-04-07 13:48:41

高端性能封装技术的某些特点与挑战

马力 项敏 石磊 郑子企

(通富微电子股份有限公司)

摘要:

高性能计算、人工智能等应用推动芯片的技术节点不断向前迈进,导致设计、制造的难度和成本问题凸显,针对这一问题,Chiplet 技术应运而生。Chiplet 技术是将复杂的系统级芯片按 IP 功能切分成能够复用的“小芯片 ( 芯粒 ) ”,然后将执行存储和处理等功能的小芯片以超高密度扇出型封装、2.5D 和 3D 高端性能封装进行重新组装,以实现高性能计算对高带宽、高性能的要求。介绍了上述封装的多样化形式和通信协议,分析其重要的电连接结构与工艺难点,及其在可靠性方面的一些问题。

1 引言

高性能计算、人工智能、5G 通信、数据中心和云计算的快速发展使芯片的技术节点不断向前推进,单颗芯片上集成的晶体管数目已超过百亿级。与此同时,将更多功能集成在单颗芯片的难度不断增大,设计与制造的成本不断上升。与 90 nm 技术节点相比,3 nm技术节点的投资成本增加了 35~40 倍,仅英特尔(Intel)、台积电(TSMC)和三星(Samsung)3 家头部企业参与其中。5 nm 技术节点的设计成本超过 5 亿美金,约是 28 nm 的 10 倍 [1] 。为解决上述问题,出现了Chiplet 概念。

Chiplet 作为一种设计概念,指将单颗集成复杂功能的片上系统级芯片(SoC)离散成多颗特定功能的小芯片(Chiplet,又称“芯粒”),再采用封装技术将其整合在一起,构成多功能的异构系统级封装(SiP),以持续提高器件算力,缩短产品开发周期,提升产品良率,降低整体成本 [2] 。近年来,受限于高端设备和材料的能力等,以 Chiplet 方式将处理芯片与存储芯片封装集成的技术越来越重要。目前,TSMC、Intel、Samsung 等均已发布相关产品,通过高密度(≥16 /mm 2 )和窄节距(≤130 μm)的输入 / 输出接口(I/O)为处理芯片与存储芯片提供定制化的封装,以应对高性能计算、人工智能、数据处理等前沿行业的要求 [3-5] 。市场研究公司 Yole 根据产品的终端应用特点,将为追求最优计算性能而采用的先进封装平台技术归类为高端性能封装,高端性能封装主要包括超高密度扇出型封装(UHD FO)、嵌入硅桥技术、2.5D 硅转接板技术、3D 存储堆叠和混合键合技术 [6] 。2021—2026 年,全球封装市场总额预计将达到 960 亿美元,复合年增长率保持在 3.8% [7] 。同时,先进封装的营收将超过传统封装。而以 FO、2.5D 和3D 封装为代表的高端性能封装,在人工智能、5G 通信和高性能计算等产业的推动下,其复合年增长率将超过 10%,呈现高速增长的态势。

本文介绍了高端性能封装的主要技术形式,剖析了其结构的特点,分析了其在设计、工艺和可靠性测试方面所面临的挑战。

2 高端性能封装的结构

高端性能封装主要以追求最优化计算性能为目的,其结构主要以 UHD FO、2.5D 和 3D 先进封装为主。在上述封装结构中,决定封装形式的主要因素为价格、封装密度和性能等。

由 TSMC 在先进封装上的主要业务可知,推动高端性能封装的主要项目为高性能计算与高带宽存储,其代表结构为基于硅转接板的芯片在晶圆基板上的封装(CoWoS@-S),是一种典型的 2.5D 封装结构 [8] 。该结构将处理芯片和存储芯片平铺在硅转接板上,采用线宽 / 线间距为 0.4 μm /0.4 μm 的金属布线将其互连。TSMC 突破光罩对硅转接板面积的限制,结合集成芯片的数量,制定了其在 2.5D 封装上的发展路线。Intel 和 Samsung 在 2.5D 封装上,也具有类似的封装结构 [9] 。对于 2.5D 封装而言,硅转接板可提供亚微米级高密度布线,能够显著提升多芯片的组装密度。随着高带宽存储芯片的数据传输效率逐步提升,采用2.5D 封装连接存储芯片和处理器芯片将成为主流的选择。然而,硅转接板采用前道晶圆制造的设备和工艺,制作成本相对昂贵。为此,一些企业在 FO 封装的基础上进一步深耕,开发出多样化的结构,以满足一些稍低端产品的需求。

FO 通过晶圆重构技术,将多颗相同或不同的芯片灵活组合起来,以实现多芯片集成的目的。在此基础上,FO 采用高密度布线有机层、硅桥和高速基板等来提升器件的性能,衍生出了 2D、2.1D、2.2D 和 2.3D封装结构 [10-11] ,以实现超高密度 I/O 的连接。由于 FO主要采用高分子材料来制造芯片间的微米级布线,其自身的线宽 / 间距的尺寸极限也相对明显。为进一步缩小 FO 封装的布线尺寸,新的设备与材料有待开发,同时,封装成本也将大大提高。因此,FO 封装主要应用在性能相对较低的存储器与处理器芯片上。

在高端性能封装中,处理芯片和存储芯片对高带宽、低延迟有严格的要求,3D 封装是最理想的方案。目前,常见的 3D 封装结构为存储芯片间垂直互连以及存储芯片与逻辑芯片间的连接。在上述结构中,除采用微凸点的芯片堆叠(C2C)和晶圆上芯片(C2W)工艺外,基于硅通孔和混合键合(HB)的无凸点工艺实现了异构异质芯片间的最短距离互连,将器件性能提至最优,其投资成本也最高 [12-13] 。预计在 2023 年,TSMC 采用 HB 的集成芯片系统封装(SoIC)将率先实现量产。

随着高端性能封装技术的发展,不同维度封装结构间的界限将变得模糊,将其集合成一个系统的 SiP会变得普遍,图 1 为集成多维度封装的 SiP 结构示意图。例如 Intel 的最新产品 Ponte Vecchio 集成了嵌入式多芯片互连桥接技术(EMIB)和逻辑晶圆 3D 堆叠技术(Foveros);TSMC 的 SoIC 也可与 CoWoS 和集成扇出型叠层封装(InFO-PoP)相结合并共同使用。上述结构可以实现器件对性能的极致追求,同时,多颗处理芯片的集成也为器件的热耗散带来巨大挑战。

3 高端性能封装的通信协议与设计

在高端性能封装结构中,多颗特定功能的芯片(Die)被集成在单个系统之中,上述芯片的连接已成为迫切需要解决的问题。Intel 公司开发了一种开放性的通用小芯片互连技术(UCIe),为异构的小芯片间提供了高带宽、低延迟、高电源效率和高性价比的封装连接 [15] 。该标准结合外围元器件互连总线标准(PCIe)、计算链接协议(CXL)和软件基础设施来确保互操作性,使得设计者能够对不同来源的芯片进行封装,UCIe 的分层与封装形式如图 2 所示。

UCIe 技术标准提供了协议层、适配器和物理层。芯片与芯片间的适配器为 Chiplet 提供链路状态管理和参数协商。物理层提供电信号、时钟、链路训练、边带、电路架构和封装互连通道等。上述技术适用于标准的 2D 封装和先进的 2.5D 封装。在先进的高端性能封装中,处理芯片对信道宽度最为敏感,其与存储芯片的数据发射与接收端沿芯片的边缘放置,双向的导线长度也保持一致,这样不仅简化了电路设计,还大大降低了信道带宽的损耗。随着处理芯片对带宽要求的进一步提升,存储芯片的 3D 封装得到发展,与之相应的 UCIe 标准还需不断升级,扩展到 3D 封装互连。

在国内,中国计算机互连技术联盟联合数+家企业和科研院所制定了应用计算机系统芯片内、芯片间、系统间互连技术的协议规范和标准,即《小芯片接口总线技术要求》[16] 。该标准描述了处理芯片、人工智能芯片、网络处理器和网络交换芯片等应用场景的小芯片接口总线技术要求,通过对链路层、适配层、物理层进行详细定义,实现小芯片之间的互连互通。上述标准于 2022 年 12 月发布,为 Chiplet 的芯片设计和封装打下了基础,其在高端性能封装中的应用尚未有报道。

4 高端性能封装的电连接结构与工艺

传统的通信协议可用于规定芯片封装的 I/O 设置,其中,最常用的是 PCIe。芯片间的带宽速率每 4 年增加 1 倍,迫使芯片需要更多的 I/O,与之相应的封装互连结构需要逐年缩小。在高端性能封装中,芯片的I/O 数目随着芯片技术节点的推进不断增多,与之相应的连接结构主要为凸点、高密度布线和中介层。

4.1 高端性能封装的凸点结构

I/O 密度与凸点节距、结构的关系如图 3 所示,传统的可控塌陷芯片连接焊球已无法满足高端性能封装对高密度 I/O 的要求,取而代之的是节距小于 100μm的微凸点。目前,常用的微凸点连接结构有铜-锡-铜、镍-锡-镍、铜-锡-镍、铜-镍-锡-镍-铜和铜-铜 [17] 。在热压键合工艺中,微凸点的最小节距甚至可以缩小至10 μm,混合键合工艺又使凸点节距小于 10 μm [18] 。除晶圆间的混合键合外,C2C 和 C2W 混合键合技术在近年来受到青睐。除可获得最优的电性能外,该技术可选择已知合格芯片进行贴片,以提升整体良率,降低制造成本。由于 C2C 和 C2W 混合技术涉及晶圆切割,如何保护化学机械抛光后的芯片表面免受污染、同时提升键合界面的强度问题仍需解决。已有的报道在切割过程中采用光刻胶遮住芯片表面,再采用等离子体进行后处理,产品的封装良率尚无法满足工业批量生产的要求,上述问题有待更多的研究 [19] 。

4.2 高端性能封装的高密度布线

在高密度布线方面,2.5D 与 3D 封装可以与前道晶圆制造共用已成熟的制程,其线宽 / 间距在微米级以下,达到最高的布线密度。以 FO 为基础的 2D、2.1D、2.2D 和 2.3D 封装更接近封测企业的制程。FO将芯片埋入模塑料中以重构晶圆,大量的模塑料不仅不利于器件的散热,还与芯片间存在热失配的问题,导致晶圆发生严重的翘曲,同时,包裹金属布线的高分子介电层又加剧了上述现象,给工艺带来了较大挑战 [20] 。除晶圆翘曲外,模塑料在成形过程中收缩,带动芯片偏离设定位置,造成曝光偏移,不利于高密度布线的制作,需要新的设备投入 [21] 。作为 FO 封装的重要连接结构,高密度布线在工艺上亦存在较高难度。特别在多层布线的制作过程中,底层布线的拱起妨碍上层光刻胶的曝光和刻蚀,造成布线缺陷。金属布线在电镀后的种子层过刻蚀亦会造成其与介电层的剥离 [22] 。目前,在 FO 封装结构中,4 层布线宽度 / 间距为 5 μm /5 μm 的产品已进入量产阶段,同时,布线宽度 / 间距的尺寸极限为 1 μm /1 μm,层数最多为 6 层,难以满足更高 I/O 密度的芯片间连接 [23] 。据报道,有学者采用聚酰亚胺的大马士革工艺来制作亚微米布线,提升介电层层数,上述研究尚未在量产中广泛应用 [24] 。

4.3 高端性能封装的中介层

在高端性能封装中,中介层作为重要的连接结构,可大幅提高芯片的集成度。目前,中介层按材料成分分为有机中介层与无机中介层。其中,有机中介层主要采用高分子材料制作高密度布线,将其置于芯片与基板之间,作为 2.5D 硅转接板的一种廉价的替代方案,同时降低了在基板上制造细线宽 / 窄间距布线的难度,如 Samsung 开发出的制板级封装转接板和TSMC 基于 FO 的集成基板 [25-26] 。

无机中介层包括硅桥、硅转接板和玻璃转接板。在高带宽存储芯片和处理芯片间,存在局部的高密度连接。Intel 根据上述结构特点,开发出硅桥结构,将其埋入基板,仅连接高密度 I/O 部分,其余的布线连接由基板完成 [27] 。部分企业则将硅桥与 FO 封装相结合,开发出新的封装结构。据日月光的报道,与布线宽度 / 间距为 0.8μm /0.8 μm 的 2.5D 封装相比,采用布线线宽/间距为 2 μm /2 μm 的嵌入硅桥的扇出型基板上芯片封装(FOCoS-B)表现出更优的电性能 [23] 。在 2.5D 封装中,硅转接板为芯片平面互连提供了媒介。台积电CoWoS@-S 封装路线如图 4 所示,按照 TSMC 推出的存储芯片与逻辑芯片的组合方式,2023 年硅转接板的平面面积将达到 2011 年转接板面积的 4 倍,如何将大尺寸的转接板贴在基板之上而无贴片偏移和虚焊等问题尚待解决 [28] 。另外,硅作为一种半导体材料,不利于信号的传输与完整性保持。TSMC 通过在硅转接板上制作电容以弥补上述不足,但金属布线形成的电容容量有限,无法满足广泛的应用需求 [8] 。近年来,有学者提出采用绝缘材料如玻璃替换硅,而在玻璃转接板上制作多层亚微米级布线并提高集成度仍需要进一步探索 [29-30] 。

5 高端性能封装的可靠性

在高端性能封装中,产品常常采用叠层结构,且存在大量用于信号连接的微结构,这使得封装体具有多材料、多界面和尺寸跨度大等特点,其在热、力和电学方面均存在较大的挑战。

5.1 高端性能封装中的热失配问题

在高端性能封装中,芯片主材硅、金属和高分子材料间的热失配问题普遍存在,由此导致封装结构在边角处出现焊球疲劳、模塑料开裂和底填料界面分层等现象,2.5D 封装结构的失效现象如图 5 所示 [31-32] 。在上述问题中,FO 封装在降低焊球热疲劳方面具有优势,大量的模塑料使得结构的热膨胀系数增大至接近基板的水平,两者在热胀冷缩过程中保持协调变形,焊球的应力降低,使得结构在可靠性测试时表现良好 [33] 。同时,模塑料的比重小,降低了焊球在振动与跌落过程中的惯性,有助于封装结构在上述测试时保持完整。相比于 FO 封装,2.5D 和 3D 封装的叠层结构自身比重大,不仅不利于散热,而且其与基板间协调变形的难度增加了,不断增大的 2.5D 硅转接板尺寸加剧了该现象。此外,采用模塑料对 FO、2.5D 和 3D 封装产品进行外保护,硅芯片与模塑料间会由于热失配导致模塑料开裂,事先使用有限元工具对模塑料的材料进行选择是一种合适的解决方案。

5.2 微结构的热电迁移

随着封装尺寸的不断缩小,微凸点和高密度布线作为高端性能封装的重要电连接结构,其热电迁移问题日益突出。在高性能产品的 2.5D 和 3D 封装中,微凸点的直径(10~20 μm)比传统的焊球缩小一个数量级。在 0.05 A 的小电流条件下,通过结构横截面的电流密度约为 10 4 A/cm 2 ,接近锡层电迁移发生的阈值。此外,在产品服役过程中,结构中的锡、银将完全转化为金属间化合物,造成体积收缩和柯肯达尔孔洞,加速结构的失效,电迁移试验的微凸点截面的 SEM 图片如图 6 所示 [34-35] 。

与微凸点的热电迁移相似,处理芯片与高带宽存储芯片间的高密度布线亦存在上述问题,且处理芯片工作时温度高达 100 ℃,其与存储芯片间的温度梯度加速了上述现象的发生。在 FO 封装中,金属铜布线被包裹在高分子钝化层中,使得其表面发生氧化、生成氧化铜,铜布线的氧化失效如图 7 所示 [36] 。在铜氧化的过程中,铜不断向表面迁移,使得铜与氧化铜界面处存在大量孔洞。在高温和大电流的作用下,上述氧化现象更加明显,形成的大量孔洞严重影响布线强度与信号传输。一些研究采用非有机材料在铜表面形成保护层,将铜与高分子材料隔离,防止其氧化,由此导致的新工艺增加了额外的制造成本。

5.3 封装体的散热问题

为追求最优的计算性能,处理芯片的技术节点不断向前推进,集成的晶体管数量激增,与此同时,封装的集成度进一步提高,要求封装体能够为处理芯片提供热流密度高达 1 000 W/cm 2 的热量耗散能力 [37] 。在高端性能封装中,UHD FO、2.5D 和 3D 封装最终与基板贴 合 ,一 般 的 组 装 方 式 为 倒 装 芯 片 球 栅 阵 列(FCBGA)。该封装的主要散热途径为背部热沉,一些学者通过优化其设计,采用水冷、气液 2 相、风冷等方式进行散热,优化结构的最大热耗散功率(Q max )与有效传热系数(h eff )间的关系,以满足不同产品的应用需求,热量耗散的主要途径如图 8 所示 [38-40] 。

在 FCBGA 结构中,影响散热的另一重要因素为热界面材料的选择。相比于传统的硅质材料,低熔点的金属材料更受到青睐,如铟、铟-银、锡和液态金属,上述材料具有较大的导热系数,能够及时传递处理芯片工作时的热量 [41-42] 。然而,基板焊球的回流焊会使这些低熔点的材料再熔化,由此导致的孔洞与外溢问题尚待有效解决。为进一步满足散热的需求,更加优质的热界面材料有待开发,如石墨 [43] 。除上述热沉和热界面材料的选择外,有研究者也通过优化逻辑芯片与存储芯片的叠层方式、FCBGA 的空腔大小等方式获得部分热性能的改进 [44] 。

6 结束语

高性能计算、人工智能、云计算、数据中心和 5G通信等领域的快速发展推动芯片技术向高性能、高带宽的方向发展,由此导致单颗 SoC 的技术节点不断向前推进,集成功能愈发复杂,制造成本不断攀升。一些厂商将 SoC 的存储单元与处理单元分离出来,再经由UHD FO、2.5D 和 3D 封装方式进行重新组合,以实现最优的计算性能。高端性能封装能够较好地满足处理芯片日益增长的 I/O 密度、散热能力等的要求,有望得到更多的关注和研究。

0 阅读:0

半导体科技旅

简介:感谢大家的关注