英伟达“特供版”或跳票!海思昇腾910B反被抢购

立创 2023-11-24 17:55:03

导读:11月24日据路透社报道,两位消息人士透露,英伟达已告知中国客户,其针对中国市场的新型人工智能(AI)芯片H20的推出时间将推迟到2024年第一季度。

图:英伟达三款“特供”型号

芯片大师曾报道刀法如神?曝英伟达对华再推3款“特供版GPU”应对管制,为应对最新管制推出的“特供”型号包括HGX H20、L20 PCle和L2 PCle,均基于英伟达H100改良而来。而H20是其中功能最强大的一款,理论上,整体算力要比英伟达H100芯片降80%左右。英伟达在本周的财报说明会上表示,他们的确正在为中国厂商开发特定的AI芯片,但还是要通过美国的规定。此前有消息称,英伟达预计最早将于11月16日推出新产品,但英伟达并未在该日期发布H20系列。此后又有报道称,中国国内厂商还没拿到H20的样卡,最快也要到11月底或者12月中旬。

图:英伟达

据国内AI企业人士透露,由于A800/H800仅推出一年又被管制及潜在的商业风险,一些大厂已经对英伟达及其供应链“失去信心”,具体做法是快速推动芯片到服务器的替换并重写软件算法,尽管生态、性能等还有很多课要补,但“几乎所有的一二线互联网大厂都加大了对昇腾计算卡等国产替代品的采购”。例如某个国内大模型的手机APP线上推理服务器已经换成昇腾,使用昇腾910B而非英伟达推理卡。同时,大模型训练方面,昇腾910B对比英伟达A100在使用一些开源模型时测试性能约为后者的0.8-1.2倍。由此带来的一个问题是,由于昇腾910B更大的die面积和挤占晶圆产能,麒麟9000s的供货可能会更加紧缺。

图:工厂测试“AI版”RTX4090

最近国内论坛的一则消息显示,国内疑似有专门的工厂正在批量收购和改造RTX4090用于满足特定客户的AI需求。一张图片展示,某工厂就堆积了同德代工的数百张RTX 4090显卡,由于这些游戏显卡均采用3或4槽设计,不太适合服务器环境,因此工厂会将每张卡拆开,首先拆除并更换散热器,然后将包括GPU核心和GDDR6X在内的所有部件从主PCB上拆除。据称,工厂设计了专门的样卡,为这些AD102核心和GDDR6X赋予了新的生命。最后,在经过一段时间的Furmark和特定AI测试程序验证新卡稳定性和性能后,这些“脱胎换骨”的GPU会运送给国内的AI客户。

1 阅读:98
评论列表
  • 2023-11-24 21:06

    还是华为硬气!不然中国的人工智能真的就被掐死了!

立创

简介:一站式电子元器件采购自营商城。