上周,英特尔推出了新一代AI加速器,有外媒扒出的资料显示,英特尔制定了将Gaudi3推向中国市场的计划。
计划中提到了两个专为中国设计的Gaudi3加速器,这款加速器可能会在某些方面超越英伟达的H100和H200。
Gaudi3 AI加速器采用了最新的第五代Tensor核心架构,此外还有很多专为AI行业设计的功能特性。
由于性能和效率都比较高,Gaudi3加速器发布以来,在市场上收到了积极的响应。英特尔对于Gaudi3还是比较有信心的。
从上图可见,英特尔准备了OAM和PCIe两个形态的Gaudi3,还有两个面向中国市场的定制版Gaudi3。
上面标注了“Prc-Designed”的就是给中国市场准备的,一个是HL-328,一个是HL-388。
那么,这两个都砍了什么呢?
从图中可见,这两个定制版主要砍了功耗,相比满血版900W直接砍了50%。其他的部分都大同小异,都支持128GB的HBM显存,3.7TB/s的带宽什么的。
Gaudi3 vs H100
Gaudi3 vs H200
在上面两张图中,英特尔拿Gaudi3与H100和H200进行了性能对比,在推理LLama-7B、LLama-70B以及Falcon-180B时的性能,Gaudi3比H100平均快了50%,比H200平均快了30%。
另外一张图展示的是,英特尔Gaudi3在推理这些模型时的功耗优势,相较于H100,其能效比高出了40%。
英特尔计划将Gaudi3重新进入中国市场,未来结局还未可知。
此前,为规避美国政府相关规定的限制,英伟达推出了A800和H800,然而,最后也都被禁掉了。
而后,英特尔此前为中国市场推出的Gaudi2也被禁了,未来Gaudi3是否会被禁,也仍是未知数。这都得看美国是否会修改出口管制和国际贸易政策。
即使英特尔可以在中国市场销售Gaudi3,它仍会面临与英伟达以及一些来自中国国内的AI芯片厂商的竞争。