英伟达发布H200,性能翻倍,价格不重要,重要的是根本买不到

科技铭程 2023-11-15 20:24:45

英伟达发布史上最强AI芯片H200,性能相比上一代最高提升90%,接近翻倍。

H200与H100一样都是基于英伟达Hopper架构打造,这也意味着两款芯片可以互相兼容,对于使用H100企业而言,可以无缝更换成最新的H200。

同时H200还是首款使用HBM3e内存的芯片,内存容量进一步提升至141GB,带宽从3.35TB/s增加到了4.8TB/s。

更大的容量,更快的速度,更适合万亿级大模型的训练和推理。

根据实测,H200 在700亿参数的大模型上的推理速度比H100快了一倍,能耗降低了一半。在数据访问方面比CPU快110倍。

不出意外的话,这款芯片一经发布又会被各大厂商疯狂抢购,而中国区依然会被列为“禁售市场”。

所以啊!英伟达H200,性能翻倍不重要,价格也不重要,重要的是你根本买不到。

没有高性能AI芯片,就意味着各行各业发展速度大幅下降,注意是各行各业,包括你我。

可能有网友会说,我就是工厂打螺丝的,能有什么影响,那么恭喜你,还能多打两年螺丝。

大家都知道,机器人行业发展的如火如荼,马斯克又推出了人形机器人,势必要在几年时间内,打造一款真正的人类伴侣。

而人形机器人同样依靠强大的算力芯片,从而变得更智能、更人性、能耗也大大降低。

人形机器人都解决了,工业机器人的应用只会更快。你螺丝打的再快能快的过机器人吗?你再加班,比得上24小时的机器人吗?

不过不用担心,国家已经意识到了这个问题,并且把算力列入了《十四五规划》

工业信息化部、网信办、教育部、卫健委、央行、国资委等六部门联合印发了《算力基础设施高质量发展行动计划》,从计算力、运载力、存储力以及应用赋能四个方面,引导算力基础设施高质量发展。

应用层面,拥有百度、阿里、腾讯、360、华为等,整体来说处于领先地位;随着长江存储、长鑫存储的发展,存储力也会迅速解决;网络建设、光传送也不用担心。

最为薄弱的环节,就是算力。尽管涌现出了华为、寒武纪、壁仞科技、景嘉微等多家AI芯片企业,但是加起来也打不过英伟达,并且随着H200的发布,双方的差距反而还会继续扩大。

而这个重任似乎又落在了华为身上,寒武纪、景嘉微在芯片设计方面已经远远落后了。

壁仞科技设计能力很强,设计的BR100在性能方面超过了英伟达A100,甚至接近H100,结果找不到代工厂商,无法量产。

而国产AI芯片,能够量产、性能又强的就是华为的昇腾910B。根据多家媒体爆料,昇腾910B在性能方面能够媲美A100,与英伟达最新的H200差距高达20倍。

想要短期替代英伟达,恐怕是实现不了。但是缩小差距还是有希望的,需要解决两大难题——制造和HBM。

制造工艺挺进4nm,需要解决EUV光刻机、PVD、CVD、离子注入机等关键设备,升级掩膜版、硅片,攻克EUV光刻胶。

任何一项都是高难度动作,并且现存技术、专利、零部件基本都被美、日、荷把控,想要拿钱去买基本不可能,唯有自主研发。

主流媒体方面,基本看不到国产EUV光刻机的消息,何时攻克更是无法得知。

今年4月份,中科院院长白春礼视察了长春光机所,对光电关键核心技术所取得的成绩给予了高度肯定。

这个举动也气坏了ASML总裁温克宁,直言:中国自主研发光刻机是破坏全球产业链。

这两条消息放在一起,大家都懂了,都认为国产EUV光刻机成了,马上要与大家见面了,但是半年多过去了,再没有新消息。

所以,我们大单假设在2025年攻克国产EUV光刻机,加上配套设备、材料,到市场应用,再到量产4nm芯片,仍需要几年时间,恐怕到时候英伟达H300都出来了,我们还要继续追赶。

这种巨大的压力、无助的困惑,有时候想想都令人窒息。

解决了制造难题,还要解决HBM存储芯片问题。

我们先来了解一下什么是HBM。

HBM翻译成汉语就是高带宽内存,它是将多个DDR芯片堆叠在一起,然后和GPU封装在一起,从而实现大容量,高位宽。

HBM就是这种技术让更多的参数留在离核心计算更近的地方,从而减少计算和存储之间的延迟。

我们可以做一个简单的比喻,数据传输就像是漏斗向容器内注水,一开始使用DDR,管径只有1公分,感觉太慢了,如今使用HBM,管径达到了3公分,是不是很快。

那HBM继续升级呢?HBM2、HBM3、HNM3e,是不是越来越快。

当然,随着技术的升级,成本也越来越高,甚至有时候内存的价格都超过了芯片本身的价格。

但是,科技竞争就是如此,一步领先就可能吃到这条鱼,而一步落后就可能连汤都喝不上。

所以,英伟达H200将HBM3升级到HBM3e,效果果然不错,首先是内存由96GB提升至141GB,其次推理速度比H100提升了近2倍,最后就是功耗下降了50%。

可见,英伟达的H200最大的功臣就是HBM3e厂商SK海力士,SK海力士发明了这项技术,但由于成本过高,手机、电脑厂商基本不会采用,随着AI的发展,这种技术被广泛使用在GPU领域。

冷门技术一下成为了香饽饽,存储厂商很高兴,但是产能却提不上来,SK海力士表示,2024年的HBM3订单已经排满,而同样的情况现在也出现在三星身上。

尴尬的是国内的存储厂商,长江存储、长鑫存储没有这项技术,所以华为的昇腾910B还要使用落后的HBM2。

原本制造工艺就落后,再加上落后的HBM2,华为真是心有余,而队友力不足啊!

可以预料,短期内英伟达仍将继续统治AI芯片领域,国产大模型的算力底座仍然不稳。

所以,华为昇腾平替英伟达这件事,暂时还无法提上日程。

我是科技铭程,喜欢就点个赞吧!

1 阅读:123
评论列表
  • 2023-11-17 12:18

    不是根本买不到,而是根本不卖你。

科技铭程

简介:喜欢科技,喜欢聊科技,更喜欢分享科技。