DeepSeek网上核心交流观点

得中 2025-02-06 17:34:37
AI的上半场行业闭环:英伟达(算力霸主)各大云厂商资本开支(以推出强模型为目的买卡,装备竞赛)算力产业链大繁荣。 上半场叫作:英伟达一家独大,或者”一”生万物阶段,“没卡,没戏”。因为上半场所有人的共识就是:没有最先进的算力你就做不出好的模型,由此带来了算力装备竞赛,硬件大繁荣。 而deepseek是把钥匙,他开源,他低算力消耗。你0-1-100产业趋势,这个1很难,但是deepseek等于给了所有人这个1...(他做到了,并且还开源)。 由此得出AI下半场的行业闭环:开源使得各家模型集体进阶各大模型厂适配端侧芯片和模组厂推出端侧AI产品(软+硬的组合)。 下游AI应用市场百花齐放大繁荣(基于各自原有的生态,应用可软可硬)。 Q:国内其他公司是否可以复制,减少英伟达GPU需求? A:DeepSeek用PTX优化,PTX并未绕过CUDA,是CUDA的一部分,PTX更底层,并没有100%用到CUDA标准库。 从这个角度来说,没办法马上复制到昇腾和AMD,PTX技术还是仅限于NVDA,跨生态还是有困难;方法可以参照,并非简单复制。 Q:本质上的框架还是基于英伟达的GPU芯片? A:是的,还是属于CUDA生态。 Q:和海外相比大概有多少成本降低? A:550万美金是V3本身,V3模型是迭代出来的,把之前的模型加起来的话,成本是目前的3-5倍,小2000万美金还是要的; 和Llama3相比,大概1:4左右;OpenAI是6000多张卡3个月以上,肯定是DeepSeek的好多倍。 Q:当用户量起来之后DeepSeek是否有很大的扩容需求? A:用户量增长的比较猛,增长了十几倍; 从这个角度来看,训练成本低了,门槛降低之后对算力是利好的,普及度提升,对DeepSeek来说要迅速扩容,不然会损失用户数。 Q:对芯片的依赖度会降低? A:这个解读肯定是有问题的,其他公司没有在PTX上面进行,还是在CUDA上做工作; 当大家看到之后,肯定会往这个方向做投入,用算法优化来提升性能,掌握方法之后会起来的很快;而硬件的抄袭很困难甚至不可能。 Q:国产芯片是否存在一定的成长空间? A:有的,低精度没那么大差距,FP8和FP16就可以做训练;用性能比较差的芯片也可以设计低精度模型,逻辑是通顺的。 Q:推理侧芯片需求量会增加? A:会出现很多基于DeepSeek的衍生版本,用DeepSeek模型来蒸馏,衍生版本出来后用比较低的成本部署,推理侧B端和C端商用。之后会出很多Agent和AI应用,生态会繁荣起来,要准备更多算力来支持。 Q:训练端芯片是否会增加? A:预训练可能不会增加,后训练可能会增加,但占比没有推理侧高,主要还是73开,7推理3训练。 Q:优化主要集中在哪些环节? A:DeepSeek改变了堆算力的想法,把算法的权重增加,用算法来抵消算力不足。 算法第一,工程第二(通信调度等),第三才是硬件。 Q:传统的算力产业链有什么增量环节? A:训练侧会减弱但推理侧会增长,上游需求并不会减少,DeepSeek后续要扩容,还是会带来硬件增长。 Q:是否仍然会有囤卡的现象? A:算法领先的时间窗口,会被复制和超越;如果有渠道的厂商还是会去买,硬件还是有很大差距。对英伟达来说,短时间内还不会有很大的地位变化。 Q:未来行业的趋势? A:多模态普及是方向,端到端多模态,Token比文本模型高很多。占比来说,多模态的算力消耗是文本模型的10倍左右,推理算力消耗是此前的好几倍。 Q:铜连接需求的变化? A:铜连接本身做节点级别的链接,中长期来看不会减少,机架扩容的时候还是会用低成本方式来组网。 Q:互联网大厂未来的AI资本开支? A:有大致数字,DeepSeek之后肯定会重新讨论;目前字节第一,腾讯第二,阿里第三;阿里之前讨论300亿元,现在在讨论要不要这么多,不会大规模下降,也不会猛增;其他大厂来说,我的预计,百度今年不到100亿。 相关概念梳理一、算力基础设施(AI大模型底层支撑) 1. 服务器/算力硬件- 中科曙光(603019):国产服务器龙头,布局AI算力与智算中心。 浪潮信息(000977):全球AI服务器头部厂商,深度参与国内大模型训练。- 工业富联(601138):为全球云服务商提供算力硬件,间接合作AI公司。 2. AI芯片/GPU- 寒武纪(688256):国产AI芯片龙头,产品用于云端推理与训练。 海光信息(688041):国产GPU厂商,深算系列对标英伟达。 景嘉微(300474):国产GPU企业,布局AI算力芯片。 3. 光模块/CPO 中际旭创(300308):全球光模块龙头,800G产品供应AI数据中心。 新易盛(300502):高速光模块核心供应商,受益算力需求爆发。- 天孚通信(300394):光器件龙头,配套高速光模块生产。 4. 数据中心/云计算 奥飞数据(300738):第三方IDC服务商,布局AI算力租赁。 光环新网(300383):云计算与数据中心运营商,支撑AI算力需求。 数据港(603881):阿里系数据中心合作方,服务大模型训练场景。 二、大模型技术与算法 1. 自然语言处理(NLP) 科大讯飞(002230):星火大模型厂商,深耕教育、医疗AI应用。 拓尔思(300229):金融、政务领域NLP技术领先,自研大模型。 云从科技(688327):计算机视觉与跨模态大模型研发企业。 2. AI框架/开源社区- 润和软件(300339):参与OpenHarmony生态,布局AI开发工具。 中国软件(600536):旗下麒麟软件适配国产AI框架。 三、应用场景(DeepSeek技术落地领域) 1. AI+医疗 卫宁健康(300253):医疗信息化龙头,探索AI辅助诊断。 创业慧康(300451):医疗大数据与AI应用结合。 2. AI+金融 恒生电子(600570):金融科技龙头,AI赋能投研与风控。 同花顺(300033):AI投资助手、智能投顾场景应用。 3. AI+教育 科大讯飞(002230):AI学习机、个性化教育解决方案。 视源股份(002841):智慧教育硬件与AI互动技术。 4. AI+机器人 绿的谐波(688017):精密减速器核心厂商,服务AI机器人。 埃斯顿(002747):国产工业机器人龙头,布局AI运动控制。 四、其他关联公司 1. 可能持股或合作方(未经证实) 浙江东方(600120):浙江国资背景,参投AI领域基金(或间接关联)。 华金资本(000532):创投机构,布局AI赛道早期项目。 2. 数据要素 人网(603000):舆情数据与AI内容审核结合。 每日互动(300766):数据挖掘与AI模型训练服务。 注:所有的文中提到的,都是网络上及自己思考和总结市场的感受和心得。 文中出现的任何股票以及行业,都是网上信息发现,一切也是基于公开媒体报道和信息。不构成任何投资意见和建议,希望大家理性投资,独立思考。 如果您认为有用欢迎关注、转发、动动发财小手点个赞呗!​
1 阅读:5

得中

简介:感谢大家的关注