DSR2或即将发布,并助力AI产业链重回风口!

锐叔论 2025-04-29 14:26:37

据中证报报道,消息人士透露,DeepSeek公司新一代大模型DeepSeek R2即将发布,目前预期是5月初。DeepSeek R2预计比GPT-4成本下降97%,并且是在昇腾卡上做的训练,主打全方位全产业链的自主可控。根据爆料信息,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),总参数量预计将达到1.2万亿,较之DeepSeek-R1(6710亿参数)提升约1倍。

回想三个月前的春节期间,DeepSeek R1火爆出圈,并引发了春节后A股AI产业链的价值重估。如果DeepSeek R2能够在“五一”期间如期落地且性能卓越的话,可以预想到节后AI产业链就有望再次成为市场主线热点,也意味着当下或可适当逢低关注。

4月25日重要会议强调,要持续用力推进关键核心技术攻关,加快实施“人工智能+”行动。同日,重要集体学习也锚定AI方向,重要指示强调坚持自立自强,突出应用导向,推动我国人工智能朝着有益、安全、公平方向健康有序发展。表明国家层面对人工智能发展的高度重视和支持。而在美国对中国实施芯片出口管制的背景下,DeepSeek模型通过算法优化显著降低了模型训练成本,一定程度上削弱了美国通过芯片出口管制遏制中国AI发展的国际战略,增强中国在人工智能产业的自主可控能力。

随着国内算力需求的不断增长,减少北美客户依赖,把握国产替代及新需求机遇将成为重要趋势。展望2025年,资源有限的条件下,预计低成本高性能追平海外SOTA为国产大模型的主题。以DeepSeek、豆包、阿里千问为例,1)DeepSeek-R1/V3依靠创新的降本提效手段,核心旨在资源有限的条件下,极大提升GPU在计算/通信上的利用率。2)豆包大模型在2024年下半年发力,月活数据冲上全球第二和国内第一;同样在降本增效范式上依靠稀疏MoE架构实现小参数高性能;3)阿里Qwen引领国产开源模型标杆的同时,依靠强化学习范式推出的QwQ-32B已登顶全球最强开源模型,以32B参数模型追平DeepSeek-R1满血模型性能,小参数高性能持续成为主旋律。

而受益于开源模型、算力成本的降低、多模态的融合,国内AI应用或迎来爆发,并带来两个发展趋势,一方面更广泛场景的AI渗透率将显著提升,数据要素的稀缺性将使得AI应用趋向细分、垂直化。另一方面产品层面革新,聚焦用户丰富交互模式、降低门槛,由Manus带来的AIAgent趋势或将驱动AI应用实现从思考到执行的全闭环。同时在商业化落地节奏上或有分化,通用型AI将迈入流量入口争夺阶段,积累用户并探索生态的优先级短期大于变现,或在下个阶段看到广泛的Agent应用在大厂生态内爆发,带来中长期变现潜力;而垂直赛道AI则靠提供增值产品和体验,以生产力等刚需场景驱动较高的商业转化。

1 阅读:133

锐叔论

简介:感谢大家的关注