人工智能又带火一枚芯片。
在人工智能的淘金热中,英伟达吃肉,小型关键参与者喝汤。这次我们要说的是正发力在Retimer这个小型芯片的供应商。目前一台典型的配8块GPU的主AI服务器需要8颗甚至16颗PCIe 5.0 Retimer芯片。
什么是Retimer?
不为人知的Retimer,高速互连背后的功臣
在如今的AI服务器中,通常会有多个Retimer,事实上,每个加速卡内部都包含一个重定时器。这点可以从2022年10月Meta Platforms的“Grand Teton”AI系统中窥见一斑。The nextplatform所公布的最新框图显示了交换机和重定时器在 Grand Teton 系统中的使用情况。从图中可以看出,交换机和Retimer的数量是相同的,只是拓扑结构有所不同。
那什么是Retimer?它的作用是什么?
Retimer的出现是PCIe发展到一定阶段的必然产物。在PCIe 4.0及更早版本之前,数据传输速率相对较低,对信号完整性的要求不高。但到了PCIe 5.0时代,数据传输速率提高到32GT/s,信号衰减和抖动问题开始突出。PCIe 6.0实现了更高的传输速度,达到64GT/s,是PCIe 5.0的两倍。
在PCIe技术中,随着数据传输速率的提高,插入损耗也会增加。PCIe 规范有精确的插入损耗预算,如下图所示,PCIe 6.0版本的插入损耗预算为32dB,意思就是在设计时必须确保信号在传输过程中的总损失不超过32dB,以保持信号质量;在满足插入损耗预算的情况下,对于PCIe 6.0而言,PCB电路板的最大走线长度为3.4英寸(约8.64厘米),超过这个长度可能会导致信号质量下降,影响数据传输的可靠性。
上图显示了不同PCIe代的插入损耗和PCB的最大走线长度
而且一个不可忽视的变化是,当今的AI服务器由于配备了多个GPU和大型NVMe存储阵列,其机箱尺寸通常要比现在的1U服务器在垂直和水平方向上都大得多。这就要求更长的PCIe传输距离,但PCIe Gen6能够支持的最长距离却在减少。
(图源:Astera Labs)
如何解决PCIe信号链路的插入损耗问题,提高PCIe信号传输距离是业界面临的重要问题。
一种思路是选用低损的PCB,但这成本高昂。仅仅是主板就可能会带来较大的成本增加,而且并不能有效覆盖多连接器应用场景。例如,PCB材料“Megtron 6”的成本约为最流行且最具成本效益的PCB材料“FR4”的七倍;
另一种思路就是引入适当的链路扩展器件如Retimer。使用PCIe Retimer芯片,采用模拟信号和数字信号调理技术、重定时技术,来补偿信道损耗并消除各种抖动的影响,从而提升 PCIe信号的完整性,增加高速信号的有效传输距离。尤其是来到PCIe 5.0之后,更高的数据速率,更紧张的损耗预算,更短的走线长度,使得Retimer芯片技术路径的优势更加明显。
说了这么多,那究竟这个Retimer是什么东西?其实早在2017年PCIe 4.0规范发布时,首次正式定义了两个术语“redriver” 和“retimer”。
据Semianalysis的描述,Redriver(重驱动器)本质上是一种模拟信号放大器器件,用于抵消 PCB 引起的频率相关衰减。形象来说,它就像“扩音器”一样,可以增强信号。
Retimer(重定时器)则是一种混合信号数字/模拟设备,具有协议感知能力,可以完全恢复数据、提取嵌入式时钟并使用干净的时钟重新传输数据的新副本。简单来说,它不是像重驱动器那样的“扩音器”,更像是一个高品质麦克风+专用音频设备,将校正后的信号馈送到扬声器。重定时器就是一个小型芯片,用来执行PCIe SerDes功能以及有关信号完整性的监控和数据收集。
图源:澜起科技财报
根据Valuates Reports的报告,全球PCIe重定时器市场预计将从2023年的1.47亿美元增长到2029年的11.069亿美元,预测期内复合年增长率 (CAGR) 为40.0%。亚太地区是最大的消费地区,市场份额接近37%。北美是仅次于亚太地区的第二大消费地区。
黑马杀出,巨头回归,
Retimer市场风云再起
从历史上看,连接是数据中心市场中竞争极其激烈但利润率高的部分。尽管在交换机和 DSP领域进行了多次竞争,Broadcom和Marvell仍然能够以超过 80% 的收入份额和超过 65% 的毛利率占据主导地位。据了解,每个重定时器的成本高达20美元以上。
在Retimer这个利润高地,市场竞争相对激烈。Valuates Reports报告中指出,Astera Labs、瑞萨电子、Parade Technologies、德州仪器、Microchip Technology、澜起科技等公司是这一领域的领导者,前六家公司拥有关键技术和专利,市场份额最高,达到92%。(其中,德州仪器 的 DS160PT801 重定时器目前最高支持 PCIe 4.0,而瑞萨电子的重定时器目前最高只支持 PCIe 3.0。)
由AI服务器这波浪潮催生下的Retimer芯片需求,Astera Labs公司是目前最大的获利者。该公司的retimer芯片已悄然应用于80%以上的AI服务器中。国际大的CPU和GPU芯片厂商AMD、Intel和 NVIDIA等都是他的客户。2024年3月19日,Astera Labs宣布首次公开募股(IPO),在人工智能的热情下,其估值从45亿美元逐渐上升到51.8亿美元。据了解,该公司也获得了英特尔的风险投资部门的青睐,在B轮融资中就投资了Astera Labs。
Astera Labs 2017年在一个车库成立,有点类似乔布斯创立苹果公司,具有浓浓的硅谷风。公司核心人员背景强大,该公司联合创始人 Jitendra Mohan、Sanjay Gajendra 和 Casey Morrison 曾在德州仪器 (TI) 的高速接口业务部门工作。Astera Labs是一家纯粹的专用连接解决方案的公司,重点关注在PCIe和相关协议,如CXL。Astera Labs 的首席财务官Mike Tate曾担任 Annapurna Labs、Netlogic MicroSystems、Marvell Technology 和 Galileo Technology 等多家公司的首席财务官,并在任职期间领导了多次合并、收购和 IPO。Astera Labs 的首席商务官Thad Omura担任 Marvell 闪存和 CXL 业务的营销副总裁。内存连接业务部副总裁兼总经理Sanjay Charagulla此前在Rambus领导了Compute Express Link™ (CXL) 业务部门的组建。
2019年,Astera Labs 率先在业界推出适用于 PCIe 4.0 和 PCIe 5.0 的 Aries 智能重定时器,在2021年就为该公司创造了3480万美元的收入。
Astera Labs足称得上是一匹黑马。
成立仅4年多,该公司就登上了行业领导地位。Astera Labs的智能DSP Aries 5成为AMD EPYC Genoa/ Bergamo 和 Intel Xeon Sapphire Rapids 和 Emerald Rapids PCIe Gen5 服务器中最常见的PCIe/CXL重定时器。Arm也与之有合作,Arm表示,与Astera Labs的合作对于确保基于 Arm Neoverse 计算平台的 AI 定制芯片解决方案新时代的更高性能连接至关重要。
Microchip 在2020年也发布了一款PCIe 5.0/CXL 2.0的重定时器——XpressConnect。据悉,XpressConnect重定时器可将 PCIe 5.0/CXL 1.1 信号的覆盖范围扩大三倍,延迟比 PCIe 规范要求低 80%,引脚间延迟低于 10ns。可提供多达 16 个 PCIe Gen 5 通道的多通道。Microchip还与英特尔合作了参考设计。
由于Broadcom的误判,Broadcom在PCIe 5.0 重定时器上姗姗来迟。在PCIe4.0的时候,Broadcom的交换机和重定时器都是一起发布的。现今市场上带有Astera Labs 重定时器的 Broadcom PCIe 交换机并不罕见。其实原本Broadcom是打算放弃这个市场的。他们最初认为,在PCIe 5.0时代,重定时器将会成为一种通用的配套芯片,Retimer会成为一个成熟的商品,大约有3~4家供应商提供。因此,Broadcom将重点放在了交换机等更复杂的PCIe 5.0产品上。然而,Broadcom后来发现,重定时器的技术难度比预期更高,客户也遇到了很多使用问题。
因此,Broadcom不得不重新投入精力,开发更加可靠、易用的重定时器产品,并帮助客户解决使用问题。
2024年3月,Broadcom发布了新的支持PCIe Gen5、PCIe Gen6/CXL 的retimer产品——Vantage 5和6,重新进入PCIe重定时器市场。他们有 16 和 8 通道选项。这些通道可以分叉,因此如果您有四个 PCIe Gen5 x4 驱动器,它们可以共享一个 16 通道重定时器。Broadcom 还支持低延迟 CXL。
Broadcom正在5nm上构建Vantage 5和 Vantage 6,来体现竞争优势。从下图中可以看出,Vantage 5的典型功耗为10W,Vantage 6的典型功耗为13W。
与此同时,Astera Labs的竞争势头很旺,在Broadcom推出重定时器产品之后的不久,Astera Labs也宣布了最新一代的retimer芯片——Aries 6,可以为GPU、加速器、CPU、NIC 和 CXL 内存控制器之间提供PCIe 6.x和CXL 3.x连接。
从技术指标上来看,比Broadcom的Vantage 6重定时器功耗更低,PCIe 6.x 16 通道配置的典型功率为 11W。而且Astera Labs 的另一大优势是时间。Aries 6 已经出样,公司拥有重定时器板和互操作性实验室,已经在测试设备。但是相比Astera Labs,Broadcom拥有包括测试板、重定时器、PCIe交换机等在内的完整套件,因此可以将之进行捆绑,快速实施其重定时器和真正的 PCIe/CXL 生态系统产品。
随着Broadcom的回归,Retimer芯片市场再起风云。Broadcom已经将重定时器业务规划进了其路线图中。从Broadcom 和 Astera Labs两大市场玩家的产品可以看出,如今Retimer已经不再仅仅是围绕着PCIe竞争,而是卷到了CXL。说CXL可能又是另外一个故事了,业界不少人认为,CXL在接下来服务器中的作用愈发凸显,存储大厂已经开卷CXL了。但也有不同的声音认为,CXL在AI时代已死。未来根据系统配置,Retimer 芯片可以灵活地切换 PCIe 或 CXL 模式。
BroadcomPCI-Express交换机和重定时器路线图(图源:servethehome)
中国两大Retimer芯片双雄
如前文中所述,在前六大Retimer芯片市场中,中国占据2席,分别是大陆的澜起科技和台湾的谱瑞科技。两家公司均在Retimer芯片领域取得了长足的进步,并逐渐成为全球Retimer芯片市场的重要力量。
澜起科技在202403的投资者关系活动中表示,随着AI服务器的增长,需要配置 GPU BOX的场景越来越多,将增加对 PCIe Retimer 芯片的需求。目前一台典型的配 8 块 GPU 的主流AI 服务器需要8颗甚至16颗 PCIe 5.0 Retimer芯片。根据行业分析,PCIe 5.0 Retimer 芯片的市场规模较 PCIe 4.0 有望明显增长,同时,出于供应安全的考虑,客户一般会选择 2-3 家PCIe 5.0 Retimer芯片供应商来供货。
PCIe 5.0 Retimer芯片在某主流 AI 服务器的应用示例
澜起科技PCIe 4.0 Retimer芯片于2020年9月成功实现量产,2021年12月,澜起科技发布公告将研发PCIe 5.0重定时器芯片并实现产业化。2023 年 1 月,澜起科技宣布量产PCIe 5.0/CXL 2.0 Retimer芯片,据该公司声称,其是全球第二家宣布量产该产品的厂家。该芯片符合 PCI-SIG 和 CXL 行业组织的相关技术规范,采用业界主流封装,传输速率高达 32GT/s,在业界率先支持低于 5 ns 的超低传输时延。
澜起科技的Retimer芯片典型应用场景
(来源:澜起科技)
据了解,澜起科技已与CPU、交换芯片、固态硬盘、GPU 及网卡等领域的主要合作伙伴紧密协作,完成了 PCIe 5.0 Retimer 芯片严苛的互操作测试。经过前期客户导入,有望在今年实现规模出货。澜起科技也正在进行PCIe 6.0 Retimer芯片的研发。
台湾的谱瑞科技也已经推出了针对PCIe 5.0/CXL的重定时器PS8936,它能够支持16对双向传输通道,还支持 CXL 2.0 Alt 模式。谱瑞科技成立于2005年,是一家Fabless公司,20211年在台湾挂牌上市。Parade Technologies, Inc. 为谱瑞公司100%拥有的美国子公司。
结语
一枚小小的Retimer芯片,正成为数据中心领域内不可或缺的关键互连组件,它们在连接CPU与GPU、NVMe SSD、Riser卡等高速外设时发挥着至关重要的作用。Retimer芯片将是PCIe 5.0和之后版本系统不可或缺的元件,“刚性化”趋势已然呈现。这也将为国产Retimer芯片的发展打开广阔的空间。
1、Astera Labs IPO - The Next Connectivity Superhero or Steamrolled By Competition?
2、PUSHING PCI-EXPRESS SWITCHES AND RETIMERS TO BOOST SERVER BANDWIDTH
3、Broadcom Vantage 5 And Vantage 6 PCIe CXL Gen5 And Gen6 Retimer Features