在图形处理领域和人工智能加速领域,老黄的NVIDIA在全球已经确立了其无可争议的领导地位。
不过,在当前极度复杂行业背景下,我们迫切需要发展自己的游戏显卡和AI加速器。
万幸,摩尔线程,勇敢地扛起了这一历史重担。

他们不仅成功推出了国内首个千卡规模的国产算力集群,还进一步扩大了技术应用,实现了万卡级、万PetaFLOPs级和万亿级规模的算力扩展,为国产技术的发展树立了新的里程碑。
摩尔线程成立于2020年,致力于研发高性能GPU产品。初期,公司聚焦于核心技术的研发,逐步在图形渲染、计算加速等领域取得突破。
摩尔线程致力于向全球提供加速计算的基础设施和一站式解决方案,为各行各业的数智化转型提供强大的AI计算支持。
据解读哥了解,摩尔线程的核心研发团队和技术路线源自原英伟达全球副总裁、中国区总经理张建中及其团队。

摩尔线程还推出了以元计算为核心的MUSA架构GPU,旨在赋能下一代互联网应用。
摩尔线程,作为国产GPU的领军企业,其AI旗舰产品夸娥智算集群解决方案的升级,标志着国产GPU技术正式迈入了万卡万P时代。
夸娥智算集群的扩展,预计能够将训练效率提升至前所未有的水平,缩短训练时间,为超大规模基础大模型的训练提供了强有力的支持。
据摩尔线程官方数据显示,其智算集群具备每秒千亿亿次级别的计算能力,这在国际上也是屈指可数。
万卡集群的构建,并非简单的计算卡叠加,它是一个超级复杂的系统工程。

超大规模组网互联、集群有效计算效率、训练高稳定与高可用性等一系列技术难题,都是构建万卡集群必须面对的挑战。
摩尔线程通过自主研发的软硬件技术,全面整合了高性能GPU计算、高性能RDMA网络、高性能并行文件存储等全套技术,构建了一套完整的万卡集群解决方案。
其夸娥智算集群具备PB级的超大显存总容量和PB/s级的超高速卡间互联总带宽,实现了系统性协同优化,达到了超强的算力。
在AI模型训练的主战场上,万卡集群已成为最低入场券。国外科技巨头如谷歌、Meta、Grok等已经部署了数万甚至数十万张GPU加速卡的万卡集群。

而在国内,字节跳动、阿里巴巴等企业也在积极推动万卡集群的建设,如字节跳动搭建的12288张卡的训练集群,科大讯飞的超万卡集群算力平台“飞星一号”。
据了解,摩尔线程的夸娥智算集群不仅在技术上领先,更在稳定性和性能上表现出色。其平均无故障运行时间超过15天,周均训练有效率超过99%,远超行业平均水平。
这得益于摩尔线程自主研发的一系列可预测、可诊断的多级可靠机制,包括软硬件故障的自动定位与诊断预测,Checkpoint多级存储机制等。
摩尔线程的产品线涵盖了从芯片到算力卡,从一体机到节点集群的全栈式覆盖。MTT S4000加速卡和MCCX D800一体机等产品,都是专为大模型训练和推理设计,具备高性能和高稳定性。

同时,摩尔线程还提供了基于高效易用的MUSA编程语言、完整的CUDA生态兼容、自动化迁移工具Musify等,大大简化了开发者的迁移工作。
摩尔线程的战略签约项目包括与青海移动、青海联通、北京德道信科集团等的合作,共同推进万卡集群的建设和应用。
在生态建设方面,摩尔线程与国内外众多AI厂商、云厂商、科技厂商等建立了深入的合作关系,共同推动大模型训练、大模型推理、具身智能等不同场景和领域的持续创新。
跟华为一样,摩尔线程也是美国“实体清单”认证的贵宾。随着万卡万P时代的来临,希望摩尔线程撑起国产GPU的荣光。