开年以来,Deepseek凭借一己之力引发了美国科技股的巨震,同时也将中国科技股推向了高潮。这一轮大波动背后,除了表明海外对中国 AI 技术创新的始料未及之外,同时验证着中国AI创新的可能性与巨大潜力。
DeepSeek的出现对于国内乃至全球AI行业到底意味着什么?未来会给产业链哪些环节带来机遇?
Deep seek爆火,重新定义AI下半场
我们先带大家简单复盘一下AI产业链的炒作演变,来理解DeepSeek的出现意味着什么。
AI的爆发,最早要追溯到2023年英伟达股价一路暴涨说起。
自2023年美国的Open AI接连推出了Chat GPT和sora,表现除了惊人的潜力和发展前景后,人工智能就以铺天盖地之势,在全世界引发巨震,所有人都开始主动或被迫的参与到这场和时间、技术赛跑的人工智能之战。
而最初这场战役的最大收益者,就是流水的AI线上铁打的卖铲人英伟达。
在AI产业发展初期,大语言模型性能提升遵循Scaling-law,模型参数量、训练数据量同步快速增长,同时模型公司百花齐放、模型推理应用逐步推广,共同使得对底层计算、存储、液冷、通信的资源都有了爆炸性增长。
但到了2024年,AI的预训练基础模型的竞赛已快速收敛,模型层逐步(头部闭源模型能力逐渐趋同/ 开源模型性能逐步赶上),产业链价值逐步上移,一方面定制化模型服务公司帮助头部大企业落地大模型应用,另一方面产品化应用也开始在C与B端初步证明商业价值。
复盘去年年底,A股针对AI方向的炒作已经转向大模型及应用层面方向,如豆包、AI耳机、AI眼镜等,算力、液冷方向隐有熄火的迹象。
原本来到这一步,国内A股在AI产业链上的可炒作空间开始收缩,当时国内的应用大模型如豆包、Kimi等虽然表现已经算十分优异,但相对ChatGPT而言普遍竞争力不高,也没有什么先发优势,面对open AI和Meta等资金和技术雄厚的巨头几乎毫无对抗力,在全球的竞争格局中产品市占率较低。
按原先的市场竞争格局,加上特朗普上台后对华的技术封禁加剧,在大模型方面国内的参与度将逐步下降。
直到DeepSeek出现,并直接刷新了豆包、Kimi和文心一言等国内大模型的用户量记录,2025年1月DeepSeek月均活跃用户数跃居第一。
更关键的是,和GPT-4o约为1亿美元的训练成本,Meta的Llama 3 405B需要3080万GPU小时相比,DeepSeek V3的训练成本不到560万美元,训练时长仅为280万GPU小时,打破华尔街对AI算力需求的幻想。
在过去人们普遍认为,人工智能越强大,占用的计算容量就越大,耗电量也就越大。而DeepSeek这一突破性进展,彻底颠覆了“越大越好”的论调。
DeepSeek只需使用传统公司AI模型所需计算能力的一小部分就能运行,且使用的是较旧版本的英伟达芯片,使用数量也少于美国大型科技公司开发的模型。
在中美AI竞争的背景下,美国在AI领域一直“处于领先地位”,中国发展自己的大模型,受到海外芯片、算力等硬件和技术上的多重限制。
今年的1月15日,美国还将中国最早的大模型创业公司智谱列入实体清单,禁止其购买海外英伟达生产的GPU,试图阻止对中国大模型训练升级的脚步。
但没想到DeepSeek紧随其后,直接采用了更低的训练成本去做模型更新与开源,拉高了技术创新的天花板,悄不做声的实现了弯道超车。
AI产业链价值下移,这些环节有望深度参与
25年会是AI应用层爆发式增长的一年,而中国有望在Deep seek的爆发下深度参与下半场,未来当用户规模爆发后,推理带来的算力需求将让AI算力的蛋糕越变越大。
国际数据公司(IDC)的报告显示,未来几年推理端的AI服务器占比将持续攀升,预计到2027年,用于推理的工作负载将占据七成以上。
DeepSeek 生态的算力厂商与大模型服务商、以及端侧AI厂商也将随着AI模型的广泛应用,迎来爆发性需求。
同时,中长期看美国对华禁运仍会极大影响本土模型厂商获取算力资源,部分相对技术更易赶超的后道工艺、存储与通信势必承担更重要的任务,同时有在本土市场上更特殊的价值。
算力基础设施领域:
浪潮信息(000977)为 DeepSeek 北京亦庄智算中心提供 AI 服务器集群,配备英伟达H800GPU及自研 AIStation 管理平台。
中科曙光(603019)、曙光数创(872808)承建 DeepSeek 杭州训练中心液冷系统,单机柜功率密度达 35kW,PUE 小于 1.15。
润泽科技(300442)廊坊数据中心为 DeepSeek 提供3000 +机柜资源,采用间接蒸发冷却技术,运营成本低于同行 15%。大规模的机柜资源保障了 DeepSeek 对算力的大规模需求,同时低成本的运营模式也为其发展提供了经济优势。
并行科技(839493)为 DeepSeek 提供了多种并行计算技术,这些技术能够充分利用计算资源,提高计算效率,加速模型的训练过程。
寒武纪(688256)和景嘉微(300474)等国产 AI 芯片制造商,受益于 DeepSeek 技术推动的算力需求增长。此外,DeepSeek 的 AI 模型已适配华为昇腾芯片。
在DeepSeek拉平大模型之间的差距的趋势下,能赢得“胜局”的决定权落回到算力层面,而云厂商在具备充足的算力“弹药”与下游云需求爆发而带来的量价齐升的情况下,有望成为产业最受益的方向之一。
DeepSeek发布后,用户访问量短时间内激增,导致服务器压力过大,连续多日出现了服务中断的情况,算力短缺让模型的使用捉襟见肘,拥有海量GPU资源边缘侧云服务厂商也是较大的受益方。
公有云:金山云(03896)、优刻得(688158)等;
边缘云:顺网科技(300113)、网宿科技(300017);
混合云服务商:深信服(300454)、青云科技(688316);
垂直行业SaaS:三六零(601360)、金山办公(688111)、萤石网络(688475)、软通动力(301236)、科大讯飞(002230)。
原先的国内云厂由于客户要求定制化开发,利润率整体极低,24年国内云计算的逻辑没有演绎,核心卡在了各种模型的差距上。
未来,随着国产大模型和应用的崛起,智算中心、云服务基础设施建设将成为企业数据化转型发展基础设施建设,市场数字基础设施一体化云平台建设不断增加,企业上云将成为普遍趋势,国内云厂或将迎来毛利率和规模的“戴维斯双击”,和更广阔的发展前景。