英伟达中国“特供版”AI芯片遇冷,华为昇腾芯片量产不远了?

科技铭程 2024-03-25 21:42:32

美国对中国芯片态度开始软化,英伟达将恢复中国“特供版”AI芯片,预计2024年第二季度开始量产H20和其他AI芯片。

特供这个词总是很敏感,在国内只有高层、富豪们才能享受到特供的烟酒、蔬菜、粮食和水。

特供的食品都来自特设的农场基地,这些基地的农作物都使用了有机肥,很少使用农药,即便有也是生物农药,采摘必须在安全期,未到安全期的,就算烂掉也不能摘。

所以特供在中国往往意味着绿色、优质和安全,但是英伟达的特供AI芯片却让人大跌眼镜。

据悉,此次英伟达提供的特供芯片为HGXH20、L20PCle和L2PCle,分别对应的是训练、推理和边缘计算,

L20和L2在国内都有替代品,并且兼容英伟达CUDA架构,所以这两款芯片对我们影响并不大。

但是H20不同,我们没有替代品,而且这款芯片的目的是替代英伟达H800,但是H800是H100的阉割版,那H20就是阉割版中的阉割版,综合性能大打折扣。

这个折扣打了多大呢?

根据文件显示,H20的算力为296TFLOPS,而H100达到了2000TFLOPS,约为15%,算力差距非常明显。

但是H20拥有96GB的HBM2内存,内存带宽高达4.0 Tb/s,这一点是高于H100的。

这就意味着H20在内存和带宽方面拥有一定的优势,因此在集群后,整体性能可以接近H100的50%。

目前市面上的大模型都超过了万亿级,包括华为盘古、腾讯的混元、阿里的通义千问等,这些大模型对算力的需求达到了20000P,而能够满足20000P算力的AI芯片集群只有H100、H800。

这种情况下,腾讯、阿里对H20这种“残血版”AI芯片失去了兴趣,这些企业表示,今年向英伟达订购的AI芯片数量将大幅下降。

知情人士透露,腾讯、阿里、百度、字节跳动正在将AI芯片订单转移至中国本土企业,未来将优先购买国产AI芯片。

原因很简单,中国企业哪怕是把全款打给英伟达,也无法确定能够购买到AI芯片,因为美国商务部随时会改变出口政策,监管机构也定期审查芯片出口。

说的简单一点就是,中国企业能否买到英伟达的AI芯片,全凭美国政府的心情,什么信誉、合同都不重要。

这种情况下,中国企业肯定受不了啊!迫切的想要绕过英伟达。

实际上,你光绕过英伟达还不够,还要绕过英特尔、AMD等一众的美国公司,绕来绕去就绕到了中国本土企业。

本土企业玩AI芯片的也不少,有华为、寒武纪、壁仞科技、燧原科技、阿里平头哥、景嘉微等等。但是能够玩的动的恐怕只有华为。

你想造AI芯片,你得会设计,得有EDA工具;还要有生产线,能够制造;并且会封装测试。

以壁仞科技为例,这家企业的创始团队有很多来自英伟达、AMD、高通和华为,所以在芯片设计领域颇具优势。

设计的BR100在算力方面远超英伟达A100,达到了H100的一半,这个成绩已经非常厉害了,因为这家公司成立于2019年,两年时间做出了半个H100,了不得。

BR100为7nm工艺,由台积电代工,但是美国商务部直接把壁仞科技列入了“实体清单”,失去了台积电的代工,这个BR100只能是PPT。

我们再看华为的昇腾910B。

昇腾910B上一代910的迭代产品,它基于自研的达芬奇架构,拥有256个AI计算核心,并配备了高速缓存和内存管理单元。

参考多家资料,昇腾910B的峰值算力达到了376TFLOPS,内存达到了64GB,功耗为400W。

算力方面超越了英伟达“特供版”H20,难怪阿里、腾讯说不买英伟达芯片,转而买本土企业的芯片。

376T的算力,与英伟达H100相差很大,但是华为是做通讯出身的,在数据传输方面的技术积累要远超英伟达,所以昇腾系列的AI芯片更具集群优势。

什么意思呢?也就是说为了提升算力效率,在最短的时间内完成最快的计算,需要将大量的AI芯片通过网络组合在一起,形成一个整体,也就是集群。

集群的算力远超单个节点的计算能力,大幅提高计算效率,并且还可以降低能耗,实现资源的最大化利用。

但是由于网络带宽、数据传输效率、软硬件协同的限制,AI芯片的集群也是有限的。

H100理论上可以集群5万张卡,提供10万P算力,H800可以集群3万张卡,提供4万P算力。

如果华为依靠自身在网络通信、软硬件协同方面的优势,能够集群更多的AI芯片,是不是就解决了算力问题。

你集群5万张卡,提供10万P算力,我集群50万张卡,就可以提供18万P的算力。

虽然我单打独斗不是你的对手,但是我群殴赢了你,我不但能跑万亿级大模型,而且跑的还很快。

我想,这才是英伟达最担心的。

工艺制程方面,英伟达H100采用了台积电的4nm工艺,华为昇腾910B只能采用国产7nm工艺,双方相差很大。

造成这一差距的原因是多方面的,国产芯片缺少核心设备,而先进的EUV光刻机不卖给我们,导致我们的制造工艺整体落后。

台积电、三星这些代工巨头,也遵守美国的芯片政策,拒绝为华为代工。

但是华为硬是咬牙突破了制造端的“卡脖子”,打造出了麒麟9000S芯片,说明华为具备了7nm芯片生产线,这条生产线同样可以生产昇腾910B。

如果内地企业选择华为芯片,就能够快速搭建起昇腾GPU的生态,强大的软硬件生态将会让昇腾芯片如虎添翼。

随着昇腾910B的临近,一款性能超越英伟达H20,并且更具性价比优势,同时不受美国限制的纯国产AI芯片将会与大家见面。

在目前中美博弈的大环境下,在华为如此的诚意下,阿里、腾讯、字节必然会优先选择国产AI芯片,英伟达中国“特供版”AI芯片遇冷也是在所难免了。

我是科技铭程,喜欢就点个赞吧!

0 阅读:6

科技铭程

简介:喜欢科技,喜欢聊科技,更喜欢分享科技。