8月21日,以“计算提升品质,为未来积蓄能量”为主题的2024年第六届联想新品质媒体沙龙正式举办。现场,第十四届全国政协委员、中国科学院计算技术研究所研究员张云泉、联想中国基础设施业务集团战略总监黄山、周涛联想中国基础设施业务群服务器产品部总经理发表了聚焦行业趋势和前沿技术的演讲。分享会上,众多专家学者和媒体代表聚焦AI基础设施的创新发展,就算力行业趋势和最佳实践进行了深入交流,共同探讨了未来大模型时代算力发展的新图景。
当前,人工智能技术快速发展,大型模型百花齐放。推动智能算力高质量发展,为人工智能发展创新赋能,着力打造新品质生产力,成为行业面临的首要课题。作为中国领先的智能基础设施提供商,联想构建了AI基础设施“一横五纵”的战略布局。通过联想万全异构智能计算平台,构建服务器、存储、数据网络、软件和超融合。 、边缘计算“五个垂直”产品能力,为客户提供涵盖通用算力、AI算力、科学算力的高效稳定、绿色节能的全场景产品解决方案。
沙龙上,周涛透露,首款搭载AMD最新处理器的联想问天G3高性能机架服务器即将正式发布。本次产品发布不仅丰富了联想“一横五纵”的业务战略布局,也进一步满足了千行百业对算力多样性、高性能、高扩展性的需求。
大型模型对计算能力提出了新的要求。算力经济普及需要“算力插座”
随着生成式人工智能的快速推进,算力日益成为数字经济和社会发展的重要基础。技术层面,超级计算、云计算、大数据、人工智能等融合创新发展,带动算力需求快速增长;在实际应用层面,算力服务占比近三年持续上升。多方共同努力不断加大,推动我国算力发展迅速进入新阶段。
张云泉在活动中指出,当前背景下算力发展有几大趋势:
首先,算力服务异军突起,中国进入算力经济时代。 “算力每投入1元,带动经济产值3-4元;算力发展指数每提高1个点,GDP增加约1293亿元。”张云泉指出,算力经济是数字经济衍生的新经济。以计算为核心的形态,已成为衡量当地数字经济发展的代表性指标和新旧动能转换的主要手段。
第十四届全国政协委员、中国科学院计算技术研究所研究员 张云全
其次,超级计算与人工智能融合创新,智能计算中心纳入新基建,大模型带来新的计算需求。他指出,“在2020年至2026年的预测中,AI的算力需求将快速超过我们对基础算力的需求。算力需求主要来自大型模型、自动驾驶、短视频等场景。”
第三,GPT大模型的兴起和AGI时代的到来催生了模型即服务MaaS商业模式。张云泉认为,模型即服务的兴起将对传统软件开发和服务部署产生影响。可以在之前的三层架构(IaaS、SaaS、PaaS)基础上增加MaaS层,逐渐模糊上下层。 “‘涟漪’需要多长时间才能被击穿,还需要耐心等待。”张云泉说道。
此外,他进一步指出,算力经济的普及需要类似电源插座的算力插座,现在大型机型就扮演着算力插座的角色。类似发电厂的计算电站未来也会出现,特别是在新能源发达的地区。
“一横五纵”筑牢算力基础加速新生产力落地
在算力经济的趋势下,如何构建坚实的算力基础来激发新生产力成为重要课题之一。
黄山分享了联想在算力领域的布局。他表示,联想首先要有全面的算力布局,比如横向提供完整的基础设施产品组合,包括服务器、存储、网络、超融合、边缘计算,以及可以管理CPU、GPU、和DPU。计算,通用计算、科学计算、智能计算等异构计算集群的统一管理;垂直的云边算力协同,以智能计算领域为例,可以支持从云端训练、训练推理到边缘训练推理再到端侧智能的全场景算力。其次,支持和协调我国人工智能核心技术生态系统快速发展。三是拥有全球领先的液冷技术。第四,创造了多种算力部署和交付方式,例如高端计算服务的订阅式交付。第五,联想问天系列基础设施产品满足中国国内算力应用的需求特点,联想国际化产品帮助中国用户拓展国际业务。
黄山,联想中国基础设施业务集团战略总监
面对人工智能新时代,联想在人工智能基础设施方面构建了“一横五纵”的战略布局。其中,“一恒”指的是联想万全异构智能计算平台,可以统一管理异构算力,释放AI基础设施生产力。 “五个垂直领域”包括服务器、存储、数据网络、软件、超融合、边缘计算,为客户提供覆盖全算力场景的基础设施产品组合。
黄山现场详细介绍了联想万全异构智能计算平台。该平台集成了匹配魔方的算力、GPU核态虚拟化、集体通信算法库、AI高效断点续传训练技术、AI与HPC集群超级调度器等五项创新技术,帮助客户轻松获得集成稳定的AI基础设施。 ,能够满足不同场景高效、稳定、多样化的算力需求。
该平台自4月份发布以来受到广泛关注,并迅速在各行各业场景中得到应用。例如,在高校科研场景中,联想万全异构资产平台统一管理HPC(高性能计算)资源池和AI资源池,并与通用计算资源池对接,形成统一算力管理界面,实现资源共享和综合调度,大大提高资源使用效率,简化用户管理流程。
联想万全异构智能计算平台得到了北大生命科学学院、紫金云等众多行业客户的认可。例如,它将帮助西北地区最大的公共算力平台紫金云成功实现多种算力的异构管理。其提供的HPC(高性能计算)和AI(人工智能)的统一管理和运营服务,不仅支持科学计算、工程计算等传统HPC的算力需求,还满足大型模型开发的算力需求和探索。 。
联想问天G3服务器即将发布,释放算力新动能
“中国算力市场智能化无处不在,人工智能已经进入日常生活的方方面面。”周涛在现场表示,过去几年,中国智能算力规模以56%的复合增长率快速增长,远远超过通用摩尔定律时代的算力。
周涛 联想中国基础设施业务集团服务器产品部总经理
为了进一步满足各行业对算力多样性、高性能、高扩展性的需求,周涛透露,首款搭载AMD最新处理器的联想闻天G3即将正式发布。这款新服务器继承了联想服务器一贯的“三高一低”特点。
高性能方面,在全新AMD EPYC第四代处理器的帮助下,联想问天G3实现了单处理器核心数量100%的提升,带来2.8倍的性能提升,并且即将支持AMD的下一代平台。
在高可靠性方面,“”BMC解耦设计、“Aegis”防过载系统等技术将进一步帮助客户减少停机时间,并实现无中断固件升级,确保客户系统稳定持续运行。
在高扩展性方面,联想问天G3的“可变互联”模式可以实现灵活的极米高速互联,适应客户不同场景、不同使用周期的应用需求。同时,DDR5内存和PCIe Gen5的采用也带来了带宽的质的飞跃,12个PCIe插槽的设计为客户提供了无与伦比的IO性能。
低能耗方面,服务器可实现CPU、DIMM、VR、GPU全液冷覆盖。其中,“百精硅”内存液冷模块中创新的软硅导热材料,厚度精确到0.01毫米,恰到好处地保证了液冷模块与内存之间的充分接触和导热,同时保证该模块已插入内存。安装过程中不会损坏内存。此外,仿生技术设计的“羊角”EVAC散热器、“龙卷风”智能风道电源散热控制系统等技术的运用,进一步降低了整机能耗,提高了能效比。
这款新品无疑为联想服务器阵营再添一员“大将”。事实上,联想服务器近几个季度增长迅速,今年一季度在中国市场跃居第三位,同比、环比销量增速均位居十大厂商之首。此外,联想服务器在多个垂直行业的表现更是可圈可点,实现对领先互联网企业的全覆盖,拿下运营商市场多个大订单,2023年第三季度制造市场份额跃升至100%排名前三的教育市场也以众多HPC灯塔案例领跑第一阵营。
大机型浪潮来临,算力带来的新生产生活方式正在加速变革。也展现了一幅利用算力技术创新打造新品质生产力的生动图景。在AI浪潮中,联想将持续聚焦智能算力高质量发展,赋能AI发展,携手开启AI基础设施未来新篇章,释放高新动能。 AI时代的高质量发展。