ZJAI算力行业交流

全产业 2025-01-22 02:00:33

关于算力CAPEX:

2025年:500-600e买60-70万台AMD Intel的通用server;另外的900-1000亿买GPU服务器,海外500e(GB200 B200/300);国内训练向海外对齐(capex不包括租赁和白建dc,IDC租赁主要是环京,太仓和内蒙也是租赁为主,自建为辅。国内自建RZ多。海外主要是在柔佛和新加坡)

算力布局:国内后续推理为主,NV阉割卡,国内训练卡;海外未来训练推理会从25-26年增加,之前没有海外训练;2025年90% capex做训练,10%做推理。

国外:主要都买NVidia卡,海外基座模型都不是国内用的。

国内:昇腾,寒武纪买了一些,昆仑、海光也不错(国家希望买国产尽量在30%以上,但没有明文)

Z]的国内芯片大部分做推理,但也不一定不能训练。百度昆仑芯做万卡集群训练模型做的挺好。现在做训练还是倾向三方模型搭配英伟达,国产芯片就是做推理类似ASIC算子固定

国内400e capex,40%买H20,L20,5090.60%采购昇腾寒武纪,·异腾还可以:910B难用一些,910C还行

25年上半年昇腾和寒武纪确定性高,各自大几万张。模型推理折现速率保底来看,每家国产芯片买5-6万张

昇腾明确会买:910B,910C还在谈,HW要求所有硬盘都要用它的,比较难接受,做组网零部都需件都会捆绑,交换机牌是XX。

寒武纪690待测试。

昆仑芯800还是挺不错,比A800强,有机会买一点。昆仑几干张,万张预算。

海光预期没那么高,送测节奏慢了,单卡性能中规中矩。

25下半年,国产芯片厮杀更激烈,本身国内芯片不缺预算。训练需求是明确的,无论如何都会去买。推理端是否能拿到订单,国产订单还是看我们最后的产品情况

AI芯片禁令影响:

此前有预期;(1)整个算力禁令不一定能直接生效,Trump上台还会有一些折中。(2)国内现在不一定还缺芯片,算力供应包括国内厂商也行,能接受。如果能承担更多预算成本,问题相对容易解决。(3)现在还有2个月缓冲,比23年还长,现在也不影响我们提前采NV芯片,最悲观情况下,撑过25年问题不大,26年后模型训练需求不一定存在,如果26年开始推理需求起来,算力结构性变化,ASIC卡用途可能更多给NV的量已经下单很多了。现在的问题是它交付不过来。

H100尾单买了点太老了。H200也买了一点点。海外主要是买GB200,B200/300。禁令对于国产芯片代工影响最大。

国内还需要再坚持1年时间,随着制造端XX厂产能良率的爬坡,明年还是有预期好今年可能会一些困难。租赁方面21也会寻求。

Z]的自研asic芯片?

海外: 24年开始设计,今年会流片,争取在年底回片;26H1验证,后续再交付。海外流片海外用。

国内:寒武纪在聊,计划国内设计、代工、量产,使用XX厂产能。和国内厂商做的ASIC主要是视频编解码,搜索业务,不一定是针对大模型推理做。

能拿到国内设计问题还好,最大问题是量产代工会有博弈情况,没有那么通畅,多少供应。国内目前都在预研,如果所选的设计公司不能解决代工问题也可能取消项目。

Z]大模型:

应用落地和主营业务是相关的,各个环节只要有需求量,就能得到数值上的回应,微信,百度搜索,抖音:创新场景AI搜索,情感陪伴,编程,端侧硬件。先是超级应用的渗透,智能回复;图像理解模型、视觉处理模型,让交付体感提升在垂直场景安防、教育等场景、医疗场景交互

未来做手机吗?

内部暂时没计划。和努比亚在做手机模型合作。端侧场景不是需要端侧模型。眼镜是今年内最有可能跑出来的形态,在眼镜端没必要放复杂芯片,端侧主要是散热续航、交互丰富程度。

努比亚愿意把自己的本地数据权限开放给豆包APP,然后豆包再去主控应用。扫地机器人,人形机器人等本身需要端侧推理,在离线情景下还要做复杂回复,这些去做端侧模型,是合理的。端侧模型太小了只有几B,云端再小也有70b,云性价比更高。

AI眼镜全球市场我估计3000-3500万销量,ZJ70-80万,今年5-6月份推出来。眼镜集成了目前AI做的最好的场景图像理解,眼镜一定是个趋势,不一定Z]做的最好。

50g左右,不拍照续航7-8小时没问题,电池崩了也不影响佩戴。社交属性,新款潮牌

0 阅读:0

全产业

简介:感谢大家的关注