PCIe6.0借AI开启商用,7.0即将登场

袁遗说科技 2025-02-18 20:25:38

大部分人连 PCIe 4.0 都未普及,即使是 PCIe 5.0的产品也只是少量推出,不过厂商们才不管这些,甚至开始推出PCIe 6.0的产品了。例如著名的主控厂商慧荣就已经开始为 PCIe 6.0 准备新的主控芯片,最高速度或许可以突破 30GB/s。PCIe 6.0的标准已经推出三年,如今商业化落地的曙光已现。

01PCIe 的起源和发展

在计算机技术不断演进的历程中,数据传输的效率始终是制约系统性能提升的关键因素。早期,传统总线技术如 PCI(Peripheral Component Interconnect)在计算机硬件连接中占据主导地位。然而,随着计算机硬件性能的飞速发展,尤其是 CPU 性能的大幅提升以及各种高速外部设备的涌现,传统总线技术逐渐暴露出诸多瓶颈。例如,PCI 总线的带宽有限,难以满足高速显卡、大容量存储设备等对数据传输速率的需求,成为了系统性能进一步提升的阻碍。

为了解决这些问题,PCI Express(PCIe)应运而生。PCIe 采用了全新的串行连接方式,取代了传统 PCI 的并行连接,极大地提高了数据传输的效率和稳定性。

PCIe 1.0 版本于 2003 年正式发布,它的出现标志着计算机总线技术的一次重大变革。PCIe 1.0 的每个通道单向传输速率可达 2.5Gbps,双向就是 5Gbps,每个通道的最大传输速率为250 MB/s。相比传统 PCI 总线,PCIe 1.0 在传输速率上有了质的飞跃,能够更好地支持当时逐渐兴起的高速显卡等设备,使得计算机在图形处理能力上得到显著提升。在实际应用中,PCIe 1.0 接口的显卡能够更流畅地运行大型 3D 游戏,为玩家带来了更好的视觉体验。

随后,PCIe 2.0 版本在 2007 年推出。该版本将每个通道的传输速率提升到了 5Gbps,双向 10Gbps,带宽相比 PCIe 1.0 翻倍,每个通道的最大传输速率为500 MB/s。这一提升使得 PCIe 2.0 能够更好地适应数据量不断增大的存储设备和网络设备。例如,企业级的磁盘阵列系统采用 PCIe 2.0 接口后,数据读写速度大幅提高,提升了企业数据存储和处理的效率。

2010 年发布的 PCIe 3.0 版本再次将每个通道的传输速率提高到 8Gbps,双向 16Gbps。PCIe 3.0 在保持与前两代产品兼容性的同时,进一步优化了协议,降低了延迟,提高了数据传输的效率,每个通道的最大传输速率为1 GB/s。在计算机硬件领域,PCIe 3.0 广泛应用于高端服务器、工作站等设备中,为多核心 CPU 与高速存储设备、网络设备之间的数据交互提供了高效的通道,推动了企业级数据处理能力的提升。

PCIe 4.0 版本于 2017 年发布,它是 PCIe 技术发展历程中的又一个重要里程碑。PCIe 4.0 将每个通道的传输速率提升到了 16Gbps,双向 32Gbps,带宽相比 PCIe 3.0 再次翻倍,每个通道的最大传输速率为2 GB/s。这一巨大的带宽提升为数据中心和高端显卡等领域带来了革命性的变化。

在数据中心领域,随着云计算、大数据分析等应用的快速发展,数据中心对数据传输速度和存储性能的要求越来越高。PCIe 4.0 的出现使得服务器能够更快地读取和存储海量数据,大大提高了数据处理的效率。例如,采用 PCIe 4.0 接口的固态硬盘(SSD),其顺序读取速度可以达到 7000MB/s 以上,顺序写入速度也能达到 5000MB/s 以上,相比 PCIe 3.0 接口的 SSD 有了大幅提升,能够满足数据中心对高速存储的需求。

在高端显卡领域,PCIe 4.0 也发挥了重要作用。随着游戏画面越来越精细,对显卡的性能要求也越来越高。PCIe 4.0 为显卡提供了更高速的数据传输通道,使得显卡能够更快地从内存中读取数据,从而提升了游戏的帧率和画面质量。例如,在运行 4K 分辨率的大型 3D 游戏时,采用 PCIe 4.0 接口的显卡能够更流畅地渲染画面,减少卡顿现象,为玩家带来更沉浸式的游戏体验。

2019 年发布的 PCIe 5.0 版本继续延续了 PCIe 技术的高速发展趋势。PCIe 5.0 将每个通道的传输速率提升到了 32Gbps,双向 64Gbps,带宽相比 PCIe 4.0 再次翻倍,每个通道的最大传输速率为4 GB/s。PCIe 5.0 不仅在带宽上有了巨大提升,还在信号完整性、电源管理等方面进行了优化,进一步提高了系统的性能和稳定性。

在数据中心,PCIe 5.0 的应用使得服务器能够更好地支持大规模的虚拟化和云计算应用。通过 PCIe 5.0 接口,服务器可以同时连接更多的高速设备,如高速网卡、高性能 GPU 等,实现更高效的数据处理和传输。在人工智能领域,PCIe 5.0 也为 GPU 之间的高速通信提供了支持,加速了 AI 模型的训练和推理过程。例如,在一些大型 AI 训练项目中,采用 PCIe 5.0 连接的多块 GPU 能够更快地交换数据,提高了训练效率,缩短了训练时间。

02PCIe 6.0 开始商业化落地,国产厂商开始布局

2022年1月,PCI-SIG组织正式发布了PCIe 6.0标准规范,也是该技术诞生以来变化最大的一次,不仅带宽继续提升,底层脚骨和功能特性也发生了翻天覆地的变化。2022年1月27日,Rambus全球首个发布了完全符合PCIe 6.0的控制器,支持全部新特性,主要面向高性能计算、数据中心、人工智能与机器学习、汽车、物联网、国防、航空等高精尖领域。该控制器支持PCIe 6.0 64GT/s传输数据率,x1通道即可带来8GB/s的单向物理带宽(相当于PCIe 4.0 x4),x16则高达128GB/s,双向就是256GB/s。目前,PCIe 6.0 已经开始在全球范围内商业化落地,众多企业正在推出基于 PCIe 6.0 技术的产品。

美光去年8月发布了行业首款PCIe 6.0 固态硬盘(SSD)。这些 SSD 利用 PCIe 6.0 的高速带宽,实现了更高的读写速度。美光表示这款性能爆炸的SSD将会属于旗下美光9550 NVMe SSD系列,官方并没有公布所采用的内存颗粒和主控,只是表示将会采用PCIe 6.0进行传输,并且主要为数据中心而不是消费级打造。美光同时也公布了这款SSD的具体速度,表示顺序读取速度最高可以达到26GB/s,而现在消费级PCIe 5.0 SSD速度大约为14GB/s,快了85.7%以上,不过这个速度距离PCIe 6.0的极限还有一段距离,正常来说PCIe 6.0 SSD的极限速度应该在32GB/s左右,很显然这款SSD还属于比较早期的产品。

2024年11月,英特尔发布了至强Diamond Rapids处理器,将支持PCIe 6.0。同月,AMD宣布推出第二代Versal Premium系列自适应SoC芯片,为各种工作负载提供最高水平的系统加速,这也是FPGA行业内首款在硬IP中支持CXL 3.1协议、PCIe 6.0总线、LPDDR5内存的器件。

随着 PCIe 6.0 的商业化落地开启,国产厂商也积极在这一领域进行布局。

存储解决方案提供商慧荣宣布,正在积极研发采用4nm先进制程技术的PCIe 6.0固态硬盘主控芯片,型号为SM8466。据悉,该主控芯片定位于企业级市场,旨在满足日益增长的高性能存储需求。SM8466主控将全面兼容PCIe 6.0 x4通道,其理论带宽高达30.25 GB/s,相比PCIe 5.0标准实现了显著的带宽提升。

澜起科技宣布推出其最新研发的 PCIe 6.x/ CXL 3.x Retimer 芯片,并已向客户成功送样,目前正在进行 PCIe 7.0 Retimer 芯片的研发。官方资料显示,澜起科技的 PCIe 6.x/ CXL 3.x Retimer 芯片支持 16 通道,其最高数据传输速率可达 64GT/s,相较 PCIe 5.0 提升一倍。

此外,高频高速线缆公司金信诺表示,已基本开发完成匹配英特尔下一代平台Oak Stream(PCIe 6.0)的相关产品,为国内厂商的技术第一梯队。广合科技表示,已完成下一代PCIe6.0产品的Oak平台和Venice平台NPI样品试制。

然而,国产厂商在 PCIe 6.0 领域的发展也面临着一些挑战。一方面,与国际知名企业相比,国产厂商在技术积累和研发投入上还有一定的差距,需要进一步加大研发力度,提高技术水平。另一方面,PCIe 6.0 技术的生态系统还在不断完善中,国产厂商需要积极参与到生态系统的建设中,加强与上下游企业的合作,共同推动 PCIe 6.0 技术的发展和应用。

03PCIe 6.0还没用上,PCIe 7.0又来了

值得注意的是,新一代PCIe 7.0已经徐徐走来,首次引入光学通信连接。

PCIe 6.0被认为是PCIe问世近20年以来变化最大的一次,但是到了这里,传统思路已经基本走到了尽头,想继续提升极为困难。PCIG-SIG DevCon 2024开发者大会上,Cadence全球首次展示了PCIe 7.0的全新方向,加入自己独有的光学连接方案,在一个真实、低延迟、无需重定时、线性光学连接的系统中,跑出了128GT/s的收发速率。这就意味着,它的x16双向带宽可达512GB/s,继续翻番。

传统的电气层已经举步维艰了。随着数据传输速率的不断提高,传统的电气信号传输面临着信号衰减、干扰等问题,难以满足高速数据传输的需求。而光信号具有传输速度快、损耗低、抗干扰能力强等优点,因此将光学技术引入 PCIe 7.0 成为了解决高速数据传输问题的关键。

PCIe 7.0规范有以下特点:

提供高达128GT/s的原始比特率,通过x16配置可实现双向最高可达512GB/s的数据传输速率。采用PAM4(四电平脉冲幅度调制)信号,通过在信号上编码四个不同的振幅级别,提高单位时间内传输的信息密度。优化信道参数与传输距离,优化信道设计参数,确保在更长的物理距离下仍能保持高数据传输速率和稳定性。继续改善低延迟性能,并强化系统的鲁棒性和数据传输的准确性,以适应对实时性和数据完整性要求极高的应用场景。在提高性能的同时注重节能,致力于降低每比特数据传输的能耗。良好的兼容性,保持与所有前几代PCIe技术的向后兼容性,确保新规范与先前PCIe版本的硬件设备无缝对接。新增光学互连,除了传统的铜互连,PCIe 7.0还将提供光学互连选项,能传输信号更远且延迟更低。

PCIe 7.0技术不会首先应用于任何消费级产品。它主要首先会应用于各种商用企业级产品领域,比如数据中心,人工智能机器学习、高性能计算和网络通信等方面。具体在目标应用场景上,PCIe 7.0将满足未来 800G 以太网、人工智能/机器学习、超大规模数据中心、HPC、量子计算和公有云的高带宽需求。据了解,PCIe 7.0的完整规范将于 2025 年发布。而这意味着受支持的设备可能要到2026年才会上市,而到2028-29年,我们才可能会看到广泛的产品在企业级市场问世。

04PCIe 技术将成为 AI 基础设施市场的重要组成部分

不难看出,从PCIe 6.0开始,厂商将不再主要针对消费级市场,而是专注于数据中心、AI基础设施等商用企业级产品领域。

随着人工智能技术的快速发展,AI 应用对数据传输速度和带宽的要求越来越高。在 AI 模型的训练过程中,需要处理海量的数据,这些数据需要在 CPU、GPU、存储设备等之间高速传输。例如,在训练一个大型的语言模型时,需要将大量的文本数据从存储设备读取到 GPU 中进行计算,同时还需要将计算结果传输回存储设备。如果数据传输速度过慢,将会大大延长模型的训练时间,降低 AI 应用的效率。

传统的数据传输技术在面对 AI 应用的高要求时,逐渐显露出局限性。例如,传统的以太网技术虽然在网络连接中广泛应用,但其带宽有限,难以满足 AI 应用对高速数据传输的需求。在 AI 训练场景中,大量的数据需要在短时间内传输,传统以太网的带宽瓶颈会导致数据传输延迟,影响 AI 模型的训练效果。

英伟达的 NVLink 技术便是一种专为 GPU 之间高速通信设计的技术。它提供了极高的带宽和极低的延迟,能够实现多块 GPU 之间的高速互联。例如,在英伟达的 DGX 系列超级计算机中,采用 NVLink 技术连接多块 GPU,实现了 GPU 之间的高速数据传输,大大提高了 AI 模型的训练效率。

虽然如今,各大芯片公司开始研发各自的互联技术,例如NVIDIA的NVLink、AMD的Infinity Fabric以及以太网互联,但是截至目前,PCIe仍然是服务器机架中的首选接口,它们通过铜缆或背板将资源连接在一起。随着PCIe 6.0以上的部署以及 PCIe 7.0 规范即将获得批准,PCIe将继续成为高速互连的关键参与者。

想要获取半导体产业的前沿洞见、技术速递、趋势解析,关注我们!

0 阅读:4

袁遗说科技

简介:感谢大家的关注