最近的Deepseek概念大火,不仅在国内外,就是在全球现在也是炙手可热的AI第一梯队企业,直接将chatgpt曾经的光芒给掩盖下去了,关键是一手免费开源更是学到了360的精髓,要知道虽然是免费开源,但是也是在它的基础上建立的,这个打个比方,比如我们的很多软件都是在老美的基础上去开的,所以不管你开发得多么成功它都不会在乎,因为你的发展周期是他随时可以把控的。
DeepSeek对算力的需求与优化,DeepSeek通过技术创新降低了对算力的要求,如采用混合精度训练框架、辅助损失自由负载均衡、多令牌预测等技术。其训练仅用2048块英伟达H800芯片运行57天,消耗278万GPU小时,远低于同类大模型。其推理成本也较低,如梦派集团部署数字人,搭载DeepSeek只需约2万元的4090或4060显卡,而原来用GPT等大模型要用10万元的A100以上性能的显卡。所以这个消息公布,英伟达市值瞬间大幅下跌,DeepSeek是一家开发开源大语言模型的中国AI公司,其R1等模型性能比肩GPT-4。
虽然如此,但是算力依然是这场AI盛宴的核心点,如果没有强大的算力支持,这些底层基础和上层应用都不能够完美的展现,所以算力绝对是AI的核心,算力主要由服务器,交换机以及光模块三大底座组成,这三大分支相关的核心企业已经整理好,分享到文章的下方,具体名单如下:



