算力比拼下,中国需要非常规性策略

慧颜苏苏 2024-08-09 15:05:04

在相当长的时间内,企业都必须尽其所能地跑在算力比拼也就是抢购芯片的前列,稍有大意就会被很多对手超越甚至甩开距离。

7月23日,马斯克在其社交媒体上宣布,旗下AI初创公司xAI已开始在位于田纳西州的所谓“孟菲斯超级集群(Memphis Supercluster)”上进行训练,号称这是“全球最强大的AI训练集群”。据马斯克介绍,这个集群由100,000个液冷H100 GPU组成,这些芯片是英伟达去年开始提供的。

据马斯克介绍,这个集群由100,000个液冷H100 GPU组成,这些芯片是英伟达去年开始提供的。xAI的目标是到2024年12月训练出“按每项指标衡量都是全球最强大的AI”。马斯克表示,孟菲斯超级集群将为实现这一目标提供“显著优势”。

算力比拼是一场冲刺式的长跑

H200是英伟达H100的升级版,相比于其前一代产品H100,H200的性能提升了约60%到90%,H200预计在第三季度以后开始大规模交付。Blackwell GPU将在 2024 年底之前发货。根据英伟达联合创始人兼首席执行官黄仁勋在Computex2024会议上公开的全新Blackwell GPU架构的AI芯片路线图:Blackwell Ultra(2025年),Rubin(2026年),Rubin Ultra(2027年),8年内1.8万亿参数GPT-4的训练能耗将直接降到1/350,而推理能耗则直接降到1/45000。有人甚至认为英伟达产品的迭代速度,已经彻底无视摩尔定律。

马斯克匆忙开始Supercluster的工作,购买英伟达“Hopper”H100 GPU。这表明马斯克没有耐心等待H200芯片推出,更不用说即将推出的基于 Blackwell的B100 和 B200 GPU。据估计,H100每块成本在3-4万美元之间,孟菲斯超级集群在价格上达到惊人的40亿美元。等待几个月就可以获得性能大幅提升和成本大幅下降的的GPU,马斯克为什么不愿意呢?这表明当今世界对于算力的竞争已经日趋白热化。

过去几十年,在摩尔定律的推动下,芯片算力以每18个月增加一倍的速度快速前进。但是近年来,由于人工智能技术不断突破并在更大范围普及,催生了算力需求的爆发式增长,而算力供给短期难以跟上需求节奏,产生了“算力焦虑”。随着大模型参数量的持续膨胀,其对算力资源的消耗显著增长,对算力资源的需求出现了急剧飙升,加剧了现有算力资源供不应求的局面,使得算力短缺成为了一个常态性的挑战。

现在对于芯片的争夺,如同一场冲刺式的长跑,在相当长的时间之内,企业都必须尽其所能的跑在算力比拼也就是抢购芯片的前列,稍有大意就会导致自己被很多对手超越甚至甩开距离。

中国企业处于算力比拼的不利位置

根据美国2022年10月推出的出口管制的政策,英伟达对华出口的GPU 的TPP(总处理能力)需要低于 4800 分。最初的 A100/H100 就是超出了这个限制,因此也导致了英伟达被迫推出了经过“阉割”的A800/H800。

随后在2023年10月17日,美国政府又推出了新的限制规则,进一步收紧了限制范围。这导致英伟达针对中国市场推出的A800和H800芯片的对华出口受限。为解决合规问题,英伟达又推出了针对中国市场“特供”的新的H20 GPU和RTX 4090D游戏显卡,其中H20相对于原来的H100的性能降低了近85%,RTX 4090D相对于RTX 4090也降低了约10%。

虽然英伟达H20初期不被市场看好,但由于国产AI芯片与之相比仍有一定差距,且供应能力有限,这导致国内不少厂商依然选择采用H20。同样,英伟达也计划针对中国市场推出基于B200的B20,但是鉴于美国出口管制政策的限制,英伟达B20性能相对于B200也将会大幅削减。

这表明,中国企业在冲刺式长跑的算力比拼中,目前处于一种受压制的状态,无论如何努力,都难以抢到领先位置,只能尽全力跟进,避免被甩开太远。

企业如何应对全球算力竞争

算力是数字经济时代新的生产力,对推动科技进步、行业数字化转型以及人类经济社会发展发挥重要作用。算力作为人工智能时代最重要的竞争要素之一,是企业国际竞争力的主要标志。对于中国企业来说,特别是需要参与国际竞争的企业来说,要保持自身的竞争力,必须积极参与到算力竞赛当中。当前,中国也正在掀起建设万卡集群的热潮,华为、中国移动、摩尔线程等厂商都在布局万卡集群。在当前我国芯片进口受限的形势下,企业应当主要在以下方面发力:

首先,在算法和数据方面加大投入。计算水平的提升需要算力、算法、数据的深度融合与经验积累。在芯片受到一定限制的条件下,提升算法水平,加强数据的收集和整合,可以扬长避短,最终有可能实现与国外竞争对手同等的计算能力。

其次,在低成本地区部署算力中心。我国由于地域辽阔,区域之间的气候、能源供应等差异较大,导致部署算力中心的成本也存在较大差异。在芯片的性能成本难以优化的情况下,可能根据企业情况和区域特色,选择具有成本优势的地区进行算力中心建设,也可以减轻企业在算力比拼中的成本压力。

第三,建设海外算力基地。有些企业已经具有全球竞争力,其海外业务量较大,客户分布范围广泛,可以考虑在不受美国出口管制政策限制的国家和地区建设算力中心,摊薄国内算力建设的成本,保持国际竞争力的优势。

如何助力我国企业参与算力竞争

国家竞争力和企业竞争力是互相促进的,如果企业都能够提高竞争力,国家的竞争力也就提高了。国家竞争力提高以后,能够让企业站在更高的竞争力平台上发展。中国竞争力近几十年的迅速提升,主要是我国企业在全球的竞争力突飞猛进。在人工智能时代,算力将影响企业的竞争力,也最终将影响国家的竞争力。那么我们应当采取各种可行的政策,帮助企业参与算力竞争。

首先,应当放开对企业算力中心建设的各类限制。目前我国企业建设算力中心受到区域限制和能源指标限制,往往难以获得审批。这些限制将导致我国企业在算力冲刺赛中迅速地失去发展机遇,让国外对我国企业的限制产生更好的效果。未来应当放开各种限制政策,只要是非国有投资的算力中心,原则上应当鼓励建设和进行相应扶持。

其次,应当对数据跨境流动采取更为开放的态度,鼓励企业建设海外算力中心。在目前芯片进口受限的形势下,企业建设海外算力中心是有助于保持和提升竞争力的。但是,如果数据跨境流动受到严格限制,将导致境内境外优势资源相互割裂,海外算力中心可能无数据可算,而境内数据却无算力可用。建议在制定数据跨境流动政策时,应当充分考虑我国算力建设受限和相对落后的现实情况,对现行的数据跨境流动限制适当松绑。

第三,对竞争性领域的芯片采购采取更开放态度。当前的算力竞争是冲刺式的竞争,难以给企业等待的时间。因此,在不涉及国家安全的领域,应当允许企业尽其所能的采购当前最先进的芯片,不必要求企业等待国产芯片性能的提升。

第四,加大相关领域的扶持力度,加快国内算力建设。算力建设涉及的链条较长,在算力比拼刻不容缓的关键时期,应当对算力相关行业解除限制和加大扶持力度。例如,算力需要大量的能源,能源建设应当跟上算力的需要,不能让能源指标等限制新质生产力的发展。此外,也需要帮助国内芯片产业提升,在一些非竞争的领域,例如政府、医疗、教育、电力、铁路等部门,可以鼓励优先采购国产芯片。

总之,全球企业的算力比拼,表面上企业为了提升竞争力和生存在全力冲刺,其实也是国家竞争力的比拼。当一个国家所有的企业在算力比拼中落伍,国家的竞争力必然也会受到损伤。因此,我国无论政府还是企业,都必须高度重视目前的全球算力比拼形势,将思维调整到算力竞赛的非常规状态,改变过去的常规政策和做法,提升算力政策的一致性。

0 阅读:24

慧颜苏苏

简介:感谢大家的关注