目前,算力已经成为制约人工智能技术发展的主要瓶颈。最近,全球人工智能行业的标杆公司OpenAI发布了GPT-5推迟发布的消息。OpenAI的首席执行官Sam Altman透露,由于计算能力的不足,公司面临创新能力的瓶颈,因此计划今年不发布GPT-5版本。
然而,算力问题不仅困扰OpenAI。全球范围内,各国在推进人工智能发展时,算力的建设始终是最为关键的因素,而中国也面临着类似的挑战。
根据工业和信息化部的统计数据,中国的算力总规模已经达到246 EFLOPS(每秒百亿亿次浮点运算),位居全球前列。然而,尽管算力规模不断扩大,但我国在算力结构上的问题依然未能得到根本解决。根据相关报道,中国目前面临的算力挑战主要是供需不匹配。虽然算力规模在增长,但对于人工智能、高性能计算等高端应用的算力缺口依然较大。2023年中国的智能算力需求达到123.6 EFLOPS,但供给仅为57.9 EFLOPS,差距显著。
为此,工业和信息化部提出,要持续推动《算力基础设施高质量发展行动计划》的实施,合理规划算力资源布局,并通过强化智能算力供给、提升算力利用效率来推动算力建设。同时,政府也在加快算力的互联互通,力图构建一个全国统一的算力服务市场。
显然,高质量算力基础设施的建设、优化算力供给结构,以及实现算力资源的最大化利用,已成为中国下一阶段算力发展的重点。然而,目前我国算力建设过程中,低效和无效的项目仍在一定程度上存在,造成了大量资源浪费。
算力发展如火如荼
以“东数西算”工程为例,这项工程是中国近年来在算力建设领域的重要战略之一,并取得了显著进展。特别是在一些经济相对欠发达地区,通过加强智算中心建设和算力供给,不仅促进了当地经济转型,也为区域协调发展注入了新活力。提升算力供给能力和优化资源配置,已经成为推动数字经济高质量发展的关键举措。
自2022年起实施“东数西算”工程,到2024年3月,全国10个国家级数据中心集群的算力总规模已超过146万标准机架,整体上架率为62.72%,较2022年有所提升。该工程的推进带动了IT设备制造、信息通信、基础软件和绿色能源等多个产业链的发展,整体提升了国家算力水平。
得益于“东数西算”这样的国家战略,中国的算力基础设施建设出现了加速推进的势头,也在一定程度上推动了区域经济的增长。然而,随着建设的加速,低效甚至无效的算力项目问题也开始显现,造成了大量资源的浪费。
低效算力项目屡见不鲜
相关专家指出,低效和无效算力项目通常表现为“建成即废”,即算力设施虽然建成,但却未能得到有效应用。这主要是由于算力基础设施本身的设计缺陷以及生态系统的封闭性所致,往往需要进行二次建设,导致资金和资源的巨大浪费。
这一现象并不罕见,特别是在一些采用华为计算架构的项目中。根据X众银行一名员工的透露,在一些测试交流中,客户反馈华为昇腾生态对业务开发的支持不够友好,适配周期长,迁移难度大,导致企业面临不小的开销,甚至出现了严重的生态适配问题。
在华为涉足的汽车行业,也存在类似的问题。例如,一家汽车厂商曾表示,华为的昇腾计算平台无法支持常见的智能驾驶模型,尤其是在自动驾驶领域,对诸如BEVDet-R50、SurroundOcc等模型的支持力度不足。尽管华为提出可以采用其自有的盘古数据,但最终客户选择了拒绝这一方案。
业内人士分析认为,华为能够在多个领域拿下大规模项目,部分原因是依赖其封闭的生态系统形成的市场垄断,以及公司高层的强力推动。但这种过度强调企业自身利益的项目推进模式,往往忽视了产业发展的整体利益,导致项目实施后暴露出大量问题,进而影响项目的持续性和效益。
高层推动的低效算力项目
例如,华为的百信项目在一些地区的实施中,出现了多个问题。一个典型的例子是,某地的GA大数据二期项目,客户所得到的服务器仅为空壳,无法使用,必须等到明年才能申请新预算并购买配件,造成了巨大的资金浪费。此外,由于没有解决适配问题,一些采购的终端和笔记本也被搁置在仓库中,形成了大量闲置设备。
华为在多地推广鲲鹏计算生态,力图通过适配自研产品来实现平台的普及,但这一过程中的排他性政策和高迁移成本也引发了大量的投诉。一些地方政府甚至出台政策,强制要求在算力中心建设中使用华为的鲲鹏和昇腾产品,造成了开放性和兼容性差的问题,进一步加剧了算力资源的浪费。
广西壮族自治区相关部门近期发布的报告中也提到,华为鲲鹏生态在实际应用中存在较大局限,尤其是在企业、医疗、教育等行业的适配问题突出,导致产业集聚效应不明显,区域发展受限。
随着越来越多算力基础设施项目的落地,类似低效项目的问题开始显现。许多地方政府也开始重新审视算力基础设施建设的标准,逐渐倾向于支持开放、通用的算力平台,而非单一企业垄断的封闭系统。这一趋势表明,未来的算力发展将更加注重兼容性和高效性。
综上所述,在算力建设的推进过程中,虽然大规模的投资和基础设施建设取得了显著进展,但低效和无效算力项目的存在却严重制约了整体效果。未来,如何优化算力资源配置、提高算力基础设施的利用效率,避免重复建设和资源浪费,将是推动算力高质量发展的关键。