美东时间的3月18日,一场引领全球人工智能潮流的盛会——英伟达2024 GTC AI大会,在万众瞩目中拉开了帷幕。
这场大会,不仅是英伟达时隔五年后首次让年度GTC重回线下,更是被外界普遍期待为“拿出点真家伙”的AI盛宴。
在加州圣何塞的SAP中心,英伟达的创始人兼CEO黄仁勋站在舞台上,他的身后是“面向开发者的1#AI峰会”几个大字,显得格外醒目。黄仁勋深知,这一刻,全球无数双眼睛都在紧盯着他,期待他能带来令人振奋的新消息。
他没有让大家失望。在演讲中,黄仁勋详细介绍了运行AI模型的新一代芯片和软件。当他说到“英伟达正式推出名为Blackwell的新一代AI图形处理器(GPU)”时,现场的气氛瞬间达到了高潮。这款预计将在今年晚些时候发货的新产品,无疑是英伟达在AI领域的一次重大突破。
万众瞩目的GB200自OpenAI的ChatGPT在2022年末掀起人工智能热潮以来,英伟达的股价就像坐上了火箭,一路飙升,上涨了整整五倍。而英伟达的销售额也在这股热潮的推动下,增长了两倍多。这一切的背后,都离不开英伟达的高端服务器GPU。
这些GPU对于训练和部署大型AI模型来说,就像心脏对于人体一样至关重要。微软、Meta等科技巨头,为了能在AI领域占据一席之地,已经不惜花费数十亿美元来购买这些芯片。
如今,新一代AI图形处理器Blackwell的发布,无疑将进一步巩固英伟达在AI领域的领先地位。首款Blackwell芯片GB200的发布,就像是一颗重磅炸弹,引爆了整个科技界。这款芯片的强大性能和创新设计,让人们看到了AI未来的无限可能。
英伟达的高管们表示,他们正在从一个唯利是图的芯片提供商,转变为一个更像微软或苹果的平台提供商。这意味着,其他公司可以在英伟达的基础上,构建自己的软件生态,共同推动AI技术的发展。
英伟达的GPU架构每两年更新一次,每次更新都能实现性能的飞跃。过去一年发布的许多AI模型,都是在该公司的Hopper架构上训练的。而Blackwell架构的GPU,则是由2080亿个晶体管组成,采用量身定制的台积电4纳米工艺制造。
这种制造工艺的精度和复杂度,都达到了前所未有的高度。两个reticle极限GPU裸片将10 TB/秒的芯片到芯片链路连接成单个统一的GPU,这样的设计让Blackwell架构的GPU在性能上实现了质的飞跃。
Blackwell不仅拥有强大的计算能力,还在AI推理能力上有了显著的提升。它结合了Blackwell Tensor Core技术和TensorRT-LLM以及NeMo Megatron框架中的英伟达先进动态范围管理算法,通过新的4位浮点AI支持双倍的计算和模型大小推理能力。这意味着,在处理复杂的AI任务时,Blackwell能够更快速、更准确地给出结果。
为了提高数万亿参数和混合专家AI模型的性能,英伟达还推出了第五代NVLink。这项技术为每个GPU提供了突破性的1.8TB/s双向吞吐量,确保最复杂LLM之间多达576个GPU之间的无缝高速通信。这样的设计让大型AI模型的训练和部署变得更加高效和便捷。
此外,Blackwell支持的GPU还包含一个专用引擎,实现可靠性、可用性和服务性(RAS)。这个引擎利用基于AI的预防性维护进行诊断和预测可靠性问题,可以最大限度地延长系统正常运行时间,并提高规模部署AI的弹性。这意味着,AI系统可以连续运行数周甚至数月而无需人工干预,大大降低了运营成本。
Blackwell GPU的体积庞大,将两个单独制造的晶粒组合成一个由台积电制造的芯片,将作为一款名为GB200 NVLink 2的整个服务器提供。这款服务器结合了72个Blackwell GPU和其他旨在训练AI模型的英伟达部件,为大型AI模型的训练和部署提供了强大的支持。
亚马逊、谷歌、微软和甲骨文等科技巨头已经宣布将通过云服务提供对GB200的访问。这意味着,全球的开发者和企业都可以通过这些云服务平台,轻松地使用到英伟达的最新AI技术。
技术背后的算计一张图片显示,英伟达的CEO黄仁勋正站在台上,他的身后是一张巨大的幻灯片,上面赫然写着“Blackwell:AI性能的新篇章”。
他激昂地介绍着这款新一代AI图形处理器,声称其AI性能可达20 petaflops,远超之前的H100,而这一切都是为了满足人工智能公司训练更大、更复杂模型的需求。
然而,当黄仁勋口中吐出“30倍性能提升,25分之一成本和能耗降低”的时候,场下的一些分析师们开始皱起了眉头。他们盯着手中的资料,上面详细列出了Blackwell的各项性能指标。在这些数字背后,似乎隐藏着一些不那么美好的算计。
尽管英伟达宣称GB200在GPT-3 LLM基准测试中的性能是H100的7倍,训练速度是4倍,但这与黄仁勋之前所说的30倍性能提升相去甚远。
分析师们开始怀疑,这些极端数据是否只是在一些特殊情况下得出,并不具备普遍性。他们指出,硬件投入的增长超乎想象,而英伟达却对新款GB200及其使用系统的成本保持沉默。
据知情人士透露,基于Hopper的H100芯片成本在2.5万至4万美元之间,推算GB200整个系统的成本高达20万美元。而在发布会现场,对于新款GB200的成本,英伟达却三缄其口。这不禁让人怀疑,英伟达是否在通过夸大性能数据来掩盖其高昂的硬件成本。
此外,黄仁勋在GTC上宣布的NIM新产品也引起了分析师们的关注。
据媒体报道,英伟达CEO黄仁勋在GTC宣布,将在其企业软件订阅中增加一款名为NIM的新产品。NIM可以更容易地使用旧的英伟达GPU进行推理,并允许公司继续使用他们已经拥有的数亿个英伟达GPU。该产品将使新人工智能模型的初始训练推理所需的算力更少。
英伟达的高端服务器GPU对于训练和部署大型AI模型至关重要。微软和Meta等公司已经花费了数十亿美元购买这些芯片。现在看,英伟达的策略是吸引购买基于英伟达的服务器的客户注册英伟达企业版,每个GPU每年的许可费为4500美元。
然而,这背后却隐藏着英伟达的另一个算计:通过软件授权,增加客户旧有设备的使用效率,从而在已经出售后的设备上再收入一笔钱。
英伟达的策略似乎很明确:一方面提供新的可替换芯片,鼓励客户更换和购买;另一方面,通过软件的授权,增加相关收入总额。这种策略在短期内可能会为英伟达带来可观的收益,但长远来看,却可能损害其在客户心中的信誉和形象。
一些客户开始质疑英伟达的诚意和动机。他们认为,英伟达在夸大其词地宣传新产品性能的同时,却对实际成本和后续软件授权费用避而不谈,这种做法显然不够坦诚。他们担心,一旦购买了新款GB200和注册了英伟达企业版,他们可能会陷入一个无尽的升级和授权循环中,无法自拔。
与此同时,英伟达的股价却在持续上涨。自OpenAI的ChatGPT于2022年末掀起人工智能热潮以来,英伟达的股价已经上涨了五倍,总销售额也增长了两倍多。这似乎与英伟达在技术和市场上的领先地位相符。
然而,分析师们警告说,如果英伟达继续玩弄数字游戏和隐瞒真相,那么它的领先地位可能不会持续太久。
黄教主想做什么英伟达的CEO黄仁勋正面临着前所未有的压力。
随着OpenAI的崛起和微软百亿资金的注入,GPU训练芯片的需求飙升,英伟达成为了这场人工智能热潮中的核心玩家。然而,黄仁勋的日子并不像外界想象的那么好过。
据权威数据显示,英伟达在全球人工智能处理器市场的份额高达80%以上,这无疑给OpenAI带来了巨大的供应压力。但黄仁勋却反其道而行,不断涨价,似乎想从这些大客户身上薅到更多的羊毛。这种策略让一些分析师感到困惑,他们担心英伟达可能会失去这些重要客户。
事实上,成本问题已经成为OpenAI的一大难题。据华尔街投行伯恩斯坦的分析师们估算,H100的价格已经飙升到了2.5万到3万美元,而且往往只能在二手市场购买,价格更是能超过4万美金。这让ChatGPT单次查询的成本高达4美分。随着用户量的激增,OpenAI需要投入巨额资金购买更多的AI芯片以维持服务的正常运行。这无疑对OpenAI的财务状况构成了巨大挑战。
据美国CNBC网站报道,Meta正在斥资数十亿美元购买英伟达的高端芯片H100,以构建自己的AI系统。而亚马逊、甲骨文等公司也在积极购买英伟达的芯片。这使得本就紧张的芯片供应更加捉襟见肘。
在这种背景下,黄仁勋推出了价格更高的GB200芯片,价格上升到A100的5倍以上。这一举动引起了科技巨头们的不满。他们纷纷表示,英伟达的涨价策略已经超出了他们的承受范围。
为了应对这种情况,微软、谷歌、OpenAI、META、亚马逊等公司都开始上马或者正在上马自身算力芯片的研发与制造。预计到下半年,相关技术和产品都会陆续成为各家互联网巨头对抗英伟达的武器。
另一方面,英伟达还丧失了一个最重要的市场。据2024财年三季报显示,英伟达来自中国大陆地区的收入为40亿美元,占总收入22.4%,为公司第三大市场。往前一年,2023财年时中国市场销售额占比接近50%,曾是英伟达第一大市场。
问题是,由于受到美国政府的限制,英伟达不能出口最先进的A100和H100芯片到中国市场。这使得英伟达不得不为中国市场特定了a800和h800的芯片。虽然这些芯片在当时的中国市场也属于最顶尖的算力芯片,但英伟达的中国市场份额仍然受到了影响。但依然被美国商务部出手叫停。
为了满足美国商务部的要求,英伟达最后做了新的阉割版芯片。可是中国的客户对这些阉割版芯片完全不感兴趣。根据相关的市场规模计算,英伟达2023年到2024年这个财年中实际从中国市场损失的金额接近120亿美元。
作为上市公司,英伟达要对自己增长的销售收入和利润负责。黄仁勋明白,他必须找到一种方式来弥补这部分损失。于是,他选择了让那些可以购买芯片的欧美大型企业承担这部分成本。
这种策略在短期内可能会让英伟达的收入保持增长,但长期来看,却可能损害其在客户心中的形象和信誉。
这一次在升级芯片的同时,黄教主还推出NIM服务,通过向旧有芯片收费提供新的软件平台提升大模型效率方式,打算从已经购买的产品上再回一波血。
这可以看出,为了企业营收增长,黄教主已经开始手段不用其极。
所以,与其说这是一场顶尖技术发布,不如说这是黄教主为了英伟达前景的最后一搏。但资本市场似乎不看好这个动作。
大会结束后,英伟达美股盘后跌幅扩大至超过1.4%。
一切要等时间给出答案。
作 者 | 张津京