3万-4万美元/颗,英伟达最新AI芯片曝设计缺陷、延迟出货

科技确有核芯 2024-08-06 17:41:02
电子发烧友网报道(文/吴子鹏)根据外媒The Information的报道,有知情人士透露,英伟达向其客户表示,新款Blackwell B200芯片将延迟发布三个月或更长时间,批量出货或延迟至明年Q1。 随后,SemiAnalysis在最新研报中剖析了英伟达Blackwell B200芯片的技术挑战,主要在合封方面。一颗Blackwell B200芯片包含了2个Blackwell GPU,连接2个Blackwell GPU的关键电路目前还存在一些问题,导致芯片的良率不高。这一故障也导致包含2个Blackwell GPU和1个Grace CPU的GB200超级芯片同样面临量产挑战。 合封是Blackwell B200和GB200发挥性能的关键根据英伟达的发布会信息,Blackwell B200芯片被定义为目前地表最强的AI加速芯片,基于台积电的4nm工艺打造,在芯片内部,采用将2个Blackwell GPU互联组成双芯设计,单颗芯片的晶体管数量高达2080亿个。 先进工艺+先进封装让Blackwell B200芯片成为一个性能怪兽,AI性能可达20PFLOPS,是H100芯片的5倍,可以为 LLM(大语言模型)的推理带来30倍的效率提升。Blackwell GB200芯片的性能就更强了,其AI性能是H100的7倍,训练性能是H100的4倍。 不难看出,由于摩尔定律失效,先进封装技术已经成为英伟达提升芯片性能的关键手段。为了让两颗GPU合封在一起还能充当单颗的GPU,英伟达在2个Blackwell GPU之间使用了高速带宽接口10 TB/s NV-HBI,整块芯片还封装有192GB高速HBM3e显存。 不过,知情人士透露,就是2个Blackwell GPU之间的电路设计出现了一些问题,导致B200芯片无法按照原计划量产。Blackwell封装是第一个使用台积电CoWoS-L技术进行大规模量产设计的封装,使用带有局部硅互连(LSI)和嵌入桥接芯片的RDL中介层。相较于此前热门的CoWoS-S,CoWoS-L更加复杂,不过带来的性能助益也更高。 谷歌、Meta和亚马逊受影响最大Blackwell芯片原计划于2024年10月开始批量生产,若因延期而推迟至2025年4月,将直接影响英伟达的季度收益。而客户方受影响最大的是谷歌、Meta和亚马逊三家公司。 据报道,谷歌、Meta和亚马逊三家公司已经向英伟达下了高达600多亿美元的订单。根据著名投行摩根斯坦利的估算,单个英伟达超算计算卡采用的连接技术分别是NVL36和NVL72,也就是在一个计算卡上搭载36颗或者72颗Blackwell B200芯片,按照3万-4万美元/颗芯片单价计算,即便是36颗芯片,只算芯片的价格就超过了100万美元,如果是4万美元的话,就是150万美元,因此采用NVL36连接的算力卡售价将定在200万美元,采用NVL72连接的则定价为300万美元,符合黄仁勋定义的买得越多越便宜的标准。 如果谷歌、Meta和亚马逊三家公司都是下定300万美元的NVL72计算卡,那么Blackwell B200芯片的需求量高达140万颗,如果大规模采购继续有优惠,那么这个数量会更大。事实也确实如此,根据接近谷歌方面的人士透露,谷歌大概会投入100亿美元,以获取40万颗Blackwell B200芯片,以及相关的服务器设施,那么600亿美元的预算可能带来差不多240万颗Blackwell B200芯片需求缺口。 同时,黄仁勋在发布英伟达Blackwell B200芯片时就曾透露,戴尔、微软、OpenAI、甲骨文、特斯拉和xAI都有计划采用Blackwell产品。如果单看Blackwell B200芯片,其推迟发布可能会影响到英伟达在今年的营收目标。 不过,目前前沿数据中心的打造,计算芯片基本100%来自英伟达,英伟达的弥补措施是继续延长Hopper系列芯片发货量,同时尽可能在今年实现Blackwell B200芯片供货,一旦实现,2025年英伟达可能会冲刺2000亿美元的营收,2024年为475亿美元。 结语根据半导体研究机构TechInsights的统计数据,2023年全球数据中心GPU总出货量达到了385万颗,相比2022年的267万颗增长了44.2%。其中,英伟达以98%的市场份额稳居第一。基于这样的统治力,英伟达Blackwell B200芯片的需求之大是可想而知的。 不过,Blackwell B200芯片是一颗复杂的芯片,采用了台积电的CoWoS-L封装技术,目前正面临一些量产挑战,但相信以英伟达和台积电的能力,会很快解决的。
0 阅读:26

科技确有核芯

简介:感谢大家的关注