近日,2024世界互联网大会“互联网之光”博览会在浙江乌镇举行,中国移动携手产业合作伙伴共同发布全球首颗全调度以太网(GSE)DPU芯片——“智算琢光”。
01DPU芯片是什么?
DPU,全称为数据处理单元(Data Processing Unit),是专门用于处理数据中心中网络传输、数据安全和基础设施任务的芯片。
与CPU负责通用计算、GPU专注于并行处理的计算模式不同,DPU的设计旨在减轻CPU在数据传输、加密和存储等任务中的负担。
它可以承担一些数据处理计算的工作,使得CPU和GPU可以专注于执行核心的计算任务,提升整个系统的效率。简单来说,就是处理“CPU做不好,GPU做不了”的任务,实现数据中心降本提效。
AI爆发推动数据中心数据量呈现爆炸式增长,传统的网络架构已经难以满足需求,即便提升网络速度和带宽,也无法根本解决这一问题。DPU能够释放智算中心的有效算力,因此其重要性和渗透率正逐渐提升。
02全调度以太网(GSE)
大模型时代,大规模GPU集群采用高速交换网络实现上万颗GPU算力互联,互联网络技术成为提升集群有效算力的关键,也是全球产业科技创新焦点。
在这一背景下,中国移动抓住智算中心网络升级换代的契机,提出全调度以太网(GSE)技术,联合国内外主流云服务商、设备商、芯片商、高校等50余家产学研机构共同发起“GSE推进计划”,旨在打造标准开放、合作共赢的新型智算中心网络技术体系。
目前,全球范围内有两个具有影响力的技术方案:一个是由美国公司主导的超级以太网联盟(UEC),另一个是由中国公司主导的全调度以太网推进计划(GSE)。这两个组织都吸纳了主流的国内外运营商、互联网服务提供商、芯片制造商和设备供应商,旨在打造标准开放、合作共赢的技术体系。
值得一提的是,2023年5月,中国移动联合10余家中国企业率先发布了全调度以太网技术架构(GSE)白皮书,标志着GSE技术的确立。同年7月,Meta、微软、博通等才提出了超以太网(UEC)技术,技术愿景和核心理念与GSE基本一致。
03“智算琢光”芯片
本次中国移动携手产业合作伙伴共同发布的“智算琢光”芯片是首颗全量支持GSE标准的DPU芯片。据介绍,该芯片支持200G端口速率、以及GSE协议特有的报文容器喷洒以及基于DGSQ的拥塞控制机制等能力,并完成与业界多家主流交换芯片对接验证,可将GPU服务器与交换机连接,构建超万颗GPU集群,实现全调度以太网部署。
基于该芯片搭建的GSE网络性能可比传统网络提升30%以上,大幅提升GPU节点间通信效率,填补我国在新型智算中心网络高性能DPU芯片领域的空白。
中国移动表示,下一步将继续与合作伙伴一起开展协议迭代、芯片研发,加速GSE产业生态成熟,构建开放共享的技术标准体系,为全球智算产业发展贡献中国方案。
据了解,在2024世界互联网大会上,中国移动发布了一系列重磅成果。除了“智算琢光”芯片外,中国移动牵头的“超大规模算力并网、算网大脑技术创新与应用”及“基于新型SRv6的新一代互联网关键技术创新、产业发展及国际化应用”荣获世界互联网大会领先科技奖;“2Africa国际海缆项目—构筑环非信息高速公路,拥抱非洲智能数字未来”入围“携手构建网络空间命运共同体”精品案例。