黄仁勋承认BlackwellGPU中的一个致命设计缺陷完全是英伟达的错

科技有点奇谱 2024-10-24 16:08:43

英伟达的CEO黄仁勋本周承认,其Blackwell GPU中的一个致命设计缺陷完全是英伟达的错,并且该公司的生产合作伙伴台积电及时地帮助修复了它。

黄仁勋说:“我们在Blackwell中有一个设计缺陷,它是功能性的,但这个设计缺陷导致了低产量。这完全是英伟达的错。”

英伟达的Blackwell B100和B200 GPU使用台积电的CoWoS-L封装技术连接它们的两个芯片,该技术依赖于一个配备了局部硅互连(LSI)桥的RDL中介层(以实现大约10TB/s的数据传输速率)。这些桥的放置至关重要。然而,据说GPU芯片、LSI桥、RDL中介层和主板基板之间的热膨胀性能不匹配导致了系统变形和失败,英伟达不得不修改GPU的顶层金属层和凸点以提高产量。

当关于设计缺陷的报告首次出现时,一些媒体报道称台积电应该为此负责,并暗示这可能会造成英伟达与其代工伙伴之间的紧张关系。黄仁勋表示,情况并非如此,是英伟达自己的计算错误导致了这个问题,还驳斥了两家公司之间存在紧张关系的报道是“假新闻”。

在半导体领域,致命的产量问题和主要功能问题并不少见。通常,公司通过修改一个或两个金属层来修复它们。英伟达和台积电修复Blackwell GPU的速度非常快,现在已经修复的Blackwell GPU,用于AI和超级计算机,将在10月下旬进入大规模生产,并将于明年初开始发货。

尽管如此,英伟达今年早些时候透露,为了满足像AWS、谷歌和微软这样的主要云服务提供商对其Blackwell GPU的需求,它仍将不得不在2024年发货一些初始产量低的Blackwell处理器。

0 阅读:24

科技有点奇谱

简介:感谢大家的关注