DPU可以怎么玩?思科的方法!

论半导体谈人生 2025-02-13 04:12:41

👆如果您希望可以时常见面,欢迎标星🌟收藏哦~

来源:内容编译自nextplatform,谢谢。

有两种方法可以制作可运行网络应用程序并加速某些网络功能的可编程交换机。

创建可编程交换机的第一个也是最明显的方法是将可编程性(希望通过添加可以运行用 P4 编程语言创建的算法的引擎)添加到交换机 ASIC 本身的结构中。这就是现已倒闭的Barefoot Networks 在 2016 年创造的东西,后来它在 2019 年落入了英特尔的巨口,从此再也没有出现过。

Barefoot 对其“Tofino 1”和“Tofino 2”交换机 ASIC 的做法本质上并没有什么问题,尽管与速度相当的非可编程交换机 ASIC 相比,它们的运行温度确实有点高。这是有道理的,因为这个世界上没有免费的东西,额外的处理总是需要在某些地方消耗额外的电力。如果有足够的时间和英特尔的支持,可编程交换机可能会在超大规模和云构建者中流行起来。英特尔分心了,最终 Barefoot 被搁置了。从长远来看,超大规模和云构建者可能会创建自己的 ASIC,而且它们肯定会以某种方式可编程。

创建可编程交换机的另一种方法是效仿思科系统公司在其新推出的 Nexus N9300 企业交换机系列中的做法。即采用交换机 ASIC 并在其周围包裹一堆 P4 可编程 DPU,将这些网络应用程序的运行和网络功能的加速从交换机 ASIC 转移到 DPU。

毫不奇怪,思科已经与 AMD 的 Pensando DPU 部门(由思科前高管创建)合作,将 DPU 包裹在其新的 Silicon One E100 交换机 ASIC 周围,以创建所谓的“智能交换机”,类似于“SmartNIC”,为服务器节点提供网络卸载功能。

Pensando 由连续创业者 Prem Jain 和 Soni Jiandani 创立,他们与 Mario Mazzola 和 Luca Cafiero 一起在思科的分拆下创建了 Nexus 系列交换机和 UCS 融合服务器网络平台,开发成功后又被思科分拆回来并由思科进行产品化和销售。许多人预计 Pensando 也会发生同样的事情,因为它没有得到思科的资助,但 AMD 抢在思科之前于2022 年 4 月以 19 亿美元收购了 Pensando。Pensando DPU 的优势在于(目前路线图上有四个),它们可以使用 P4 编程,P4 是一种专为数据包处理而创建的语言,而 FPGA 则必须使用原生 RTL/VHDL 语言进行调整。

思科刚刚推出的交换机-DPU混合产品是服务器-交换机混合产品的一种变体,我们已经多次看到这种产品问世但从未真正成为主流。Pluribus Networks 早在 2014 年就创建了一款产品,并于 2022 年被 Arista Networks 收购其知识产权。2015年,瞻博网络在其 QFX 交换机(使用 Broadcom Trident-II ASIC)中添加了 X86 内核和 FPGA 引擎,以创建类似的交换机,这款交换机面向希望在更靠近线路的地方进行计算以获得延迟优势的高速交易者。也许这一次,凭借其由 Hypershield AI 驱动的自动网络分段安全软件作为杀手级应用,这个想法将会起飞。通过将 DPU 放入交换机而不是更大的服务器端点中,思科可以使这种可编程交换机更经济实惠且更加普及。

Nexus 混合交换机-DPU Godboxes

新款 Nexus N9300 的核心是思科自主研发的商用 Silicon One 交换机 ASIC 的变体,称为 E100,其额定速度相当适中,为 4.8 Tb/秒。思科之前已推出用于路由的 P100、Q100 和 Q200 变体以及用于交换的 G100、G200 和 Q200 变体,顾名思义,Silicon One 的重点在于单一架构可以涵盖广泛的交换和路由用例,从机架顶部盒一直到数据中心互连盒。

思科数据中心和服务提供商业务总经理 Kevin Wollenweber 向The Next Platform表示,E100 是 Silicon One 新系列设备的首批产品,旨在打造带宽相对较低但功能更强大的交换机。25.6 Tb/秒的 G100 和 51.2 Tb/秒的 G200 面向主干交换机和高容量 AI 后端网络,而 E100 则更侧重于企业机架顶部和网络边界连接用例。

我们对 Nexus N9300 感兴趣并不是因为它是一款高容量交换机,而是因为它可能是未来事物的预兆。

我们的例子是 Silicon One 芯片的 12.8 Tb/秒版本——Wollenweber 没有提到 ASIC 的名称,但 Q200L 是交换端的 12.8 TB/秒版本——它周围包裹了八个 Pensando DPU,是为数量不详(但有多个)的超大规模计算公司和云构建商创建的。这是在过去几年中完成的,当时超大规模计算公司和云构建商正在核心网络中部署 100 Gb/秒以太网交换机,顺便说一句,他们现在仍在这样做,因为这台机器正在这些超大规模计算公司和云构建商处进行试点,他们正准备部署,初始数量为数千台,然后扩展到数万台,Wollenweber 说。

Nexus N9300 是超大规模处理器模块的一款芯片,采用更适中的 Silicon One ASIC 和数量较少的两种不同的 AMD Pensando DPU。作为回顾,以下是 Pensando DPU 路线图:

Nexus 9324C 交换机配有 Silicon One E100 和四个“Elba”Pensando DPU。Elba DPU 于 2021 年推出,是该公司的第二代 DPU。

Elba 设备采用台湾半导体制造公司的 7 纳米工艺蚀刻而成,拥有 144 个定制匹配处理单元 (MPU),运行速度为 2 GHz,用于处理 P4 算法,以及 16 个 Arm A72 内核,运行速度为 3 GHz,用于协助处理网络应用程序。它还具有专用的数据加密和存储卸载引擎,后者在思科的特定用例中可能不是那么有用。以下是 Elba DPU 的框图:

Elba 设备具有一对以 3.2 GHz 运行的 DDR4 接口,支持 8 GB 至 64 GB 的本地主内存和 56 Gb/秒的 SerDes,并带有 PAM4 信号,可提供两个以 200 Gb/秒运行的以太网端口,显然可以连续拆分以添加更多虚拟端口。Elba 支持 2,000 个虚拟 NIC 和 1600 万个硬件队列,并具有 ROCE v2 内存延迟减少功能。

Nexus N9324C 配置为 24 个端口,运行速度为 100 Gb/秒,但服务吞吐量以 800 Gb/秒的速度运行。它针对云和边缘、区域分割和数据中心互连用例。它将于 4 月上市。

另一款混合型思科交换机是 Nexus N9348Y,它具有相同的 Silicon One E100 交换机 ASIC,但它被一对 AMD 于 2023 年发布的新一代“Giglio”DPU包围。我们没有 Giglio DPU 的框图,但我们知道它是 7 纳米 Elba 芯片的一个版本,尽管如此,它还是针对低功耗和相对较高的性能进行了优化。Giglio 芯片处理有状态数据包(但不像 Elba 设备那样无状态和有状态),并具有以 5.6 GHz 运行的 DDR5 内存。

不仅 DPU 类型和数量与 Nexus N9348Y 不同,而且 E100 上的端口划分也不同,并与企业中典型的实际机架顶部配置相匹配,其中 25 Gb/秒仍然是节点以太网端口的常见速度。(在云端也仍然很常见。)此交换机配备 48 个以 25 Gb/秒运行的端口,以及 6 个以 400 Gb/秒运行的上行链路和另外两个以 100 Gb/秒运行的端口。这款交换机将于今年 8 月上市。

当然,这其中有一个软件定义的角度,思科表示这将为客户节省一大笔钱。以下是该公司从两家大型银行获得的两份总体拥有成本比较,一家银行部署了防火墙来替换竞争对手瞻博网络的设备,另一家银行用一对 Nexus N9300 替换了两个与四个交换机相连的防火墙:

这些比较包括思科 Hypershield 安全软件的成本。如果能看到这些图表背后的原始数据,那将大有裨益,因为我们可以准确地知道比较的内容以及比较的期限。

参考链接

https://www.nextplatform.com/2025/02/11/cisco-cuts-network-costs-by-welding-nexus-switch-to-amd-dpu/

END

👇半导体精品公众号推荐👇

▲点击上方名片即可关注

专注半导体领域更多原创内容

关注全球半导体产业动向与趋势

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4034期内容,欢迎关注。

0 阅读:0

论半导体谈人生

简介:感谢大家的关注