编辑|信创纵横公众号(ID:xinchuangzh)出品 | 安东工作室 转载|请注明出处
编者按:飞腾积极响应国家和行业对智算中心的迫切需求,联合生态伙伴打造全栈国产化智算中心解决方案,整体系统架构包括智算芯片、智算设备、智算操作系统、智算平台、国产大模型、智能应用等 6 个部分,详情如下。
01
方案背景描述当前,以人工智能技术为代表的新质生产力,引导各行业智算需求爆炸式增长。智算中心作为最重要的算力基础设施,是大模型、图像类、自然语言类、预测类等智能应用的 “动力引擎”,为各类智能化业务场景提供安全、稳定、高效的算力支撑,满足国家和行业需求,同时可有效带动相关产业增长,助力行业数智化转型和数字中国建设。
02
方案技术架构飞腾积极响应国家和行业对智算中心的迫切需求,联合生态伙伴打造全栈国产化智算中心解决方案,整体系统架构包括智算芯片、智算设备、智算操作系统、智算平台、国产大模型、智能应用等 6 个部分,如下图所示。
该方案以飞腾新一代高性能 CPU 飞腾腾云 S5000C 为算力底座,兼容多款国产 AI 加速卡,实现通用算力与智能算力的异构融合,以此为基础研发国产 AI 服务器,设计适合大规模集群部署的智算中心网络拓扑,构建存算一体的智算平台体系架构,支撑大模型训练推理等应用,可为行业应用提供从端到云的智能化算力服务。03
智算中心核心单元智算底座智算中心算力底座基于飞腾新一代服务器芯片飞腾腾云 S5000C 和国产 AI 算力卡。其中 S5000C 计算性能强大,IO 吞吐量大,支持 DDR5 和 PCIe 5.0,可满足 AI 计算高带宽、低延迟的技术需求;国产 AI 算力卡具备自主可控、灵活拓展的特点,在性能上不断追赶并部分超越国际主流产品。
目前,飞腾腾云 S5000C 已与国产主流 AI 算力卡完成适配,整套智算中心算力底座具备自主化程度高、体系布局、生态开放、高可扩展、高性价比、平滑迁移等特点。整机基于飞腾腾云 S5000C 的智算设备产品多种多样,包含 2U/4U AI 服务器(2、4、8卡)、OAM 服务器、高速交换机、全闪存储服务器、智能网卡等,上述产品可单独或自由组合形成成熟的整体方案,满足智算中心的多样算力需求,对标国际先进算力水平。智算中心PoD单元在单个机架上集成了 AI 服务器、存储服务器、管理服务器、交换机等设备,用于深度学习模型的大规模训练和推理。PoD单元可支持 32 张加速卡协同工作,采用 200G 低延迟网络和固态存储方案,既可作为独立计算设备实现开箱即用,亦可作为 AI 服务器集群的基本组成单元,实现大规模集群配置。目前PoD 单元已适配多家厂商 AI 加速卡,打造出从高性能到高性价比的多套配置方案,具备超强算力、超强拓展性、超高易用性、低 TCO、可一体化交付的特点。千卡万卡集群基于 PoD单元模式可将 AI 服务器集群扩展至千卡、万卡规模,形成 AI 算力弹性资源池,借助智算平台管理软件和高性能网络互联技术,实现算力资源统一纳管、高效调度、智能运维。AI 服务器集群支持大规模的数据处理和复杂的计算任务,适用于大模型训练推理场景,性价比高于国际主流集群方案,可为各类智能应用提供强大、可控的智能算力。
大模型适配基于飞腾 AI 算力底座适配了 LLama 系列、智源、云天励飞,智谱华章、通义千问、百川智能等开源大模型,可开展全量训练、微调、推理等技术,满足不同行业场景客户的需求。携手国内加速卡厂商,训练场景上,适配 Megatron-LM、deepspeed 等流行训练框架;推理场景适配vllm 推理框架,通过集群性能整体优化,实现云端大批量、高效率的训练、推理任务。实际测试结果显示,4 机 32 卡,70B 大模型训练达到 249 tokens/s/p,性能达到 x86+国外主流 AI 产品的 93% 左右,整机成本为其 85%。综合性价比是其 109%。通过性能和整机成本的持续优化,性价比会进一步提升。
04
信创方案优势飞腾智算中心方案具有以下 6 点优势:
自主化程度高智算中心底座全栈均采用国产产品(CPU、整机、AI卡、网卡、交换机等)。体系布局覆盖芯片、整机、集群、软件、大模型等,打造云、边、端全栈技术体系。生态开放兼容国内外主流智算产品技术路线,智算生态开放。高可扩展扩展性强,集群规模可扩展至千卡万卡级别,支持多种 AI 卡异构混合并行。高性价比性价比高于国外产品,并可持续优化。平滑迁移兼容 CUDA 生态,可轻松实现软件系统迁移,迁移工具丰富、成本低。05
信创典型应用案例飞腾国产智算中心解决方案特别适用于国家机关和央企各行业,包括:政务、金融、电信、电力、能源、交通、教育等,支持私有化部署及快速灵活扩展,现已在物流、交通、金融服务等央企落地应用。
典型案例1某央企百亿参数级别大模型项目,支持代码撰写、文档自动生成处理等办公场景,支持自动控制及故障预测等系统使用,实现设备智能运控。
方案选型:
采用飞腾腾云 S5000C 的国产 AI 服务器方案替换 N 厂方案,移植成本低,兼性价比高,实现算力纳管及 LLAMA2 大模型训练。
典型案例2某央企园区智慧化管理平台项目,基于园区部署的多路高频摄像头采集数据,通过算法实时分析视频流,实现园区作业安全管控和灾害智能识别,提供智能运营决策和智能助理服务,同时开展大模型训练和视觉模型等多种业务。
方案选型:
采用飞腾 CPU + 国产 AI 卡 + 麒麟操作系统的全国产化方案,近 200 张训练推理卡,支持 33B 模型全量训练、增量预训练和微调。
典型案例3某金融企业大模型应用平台项目,提供大模型训练服务,支持金融风控、贷款征信等业务场景。
方案选型:
采用飞腾智算中心一体化PhyPOD方案,快速搭建PhyPOD节点集群,通过200G网络交换机实现多台4U8卡AI服务器、存储服务器的高速互联,支持金融大模型训练、微调、推理。