DSR2或即将发布，并助力AI产业链重回风口！

据中证报报道，消息人士透露，DeepSeek公司新一代大模型DeepSeek R2即将发布，目前预期是5月初。DeepSeek R2预计比GPT-4成本下降97%，并且是在昇腾卡上做的训练，主打全方位全产业链的自主可控。根据爆料信息，DeepSeek-R2大模型将会采用一种更先进的混合专家模型（MoE），总参数量预计将达到1.2万亿，较之DeepSeek-R1（6710亿参数）提升约1倍。

回想三个月前的春节期间，DeepSeek R1火爆出圈，并引发了春节后A股AI产业链的价值重估。如果DeepSeek R2能够在“五一”期间如期落地且性能卓越的话，可以预想到节后AI产业链就有望再次成为市场主线热点，也意味着当下或可适当逢低关注。

4月25日重要会议强调，要持续用力推进关键核心技术攻关，加快实施“人工智能+”行动。同日，重要集体学习也锚定AI方向，重要指示强调坚持自立自强，突出应用导向，推动我国人工智能朝着有益、安全、公平方向健康有序发展。表明国家层面对人工智能发展的高度重视和支持。而在美国对中国实施芯片出口管制的背景下，DeepSeek模型通过算法优化显著降低了模型训练成本，一定程度上削弱了美国通过芯片出口管制遏制中国AI发展的国际战略，增强中国在人工智能产业的自主可控能力。

随着国内算力需求的不断增长，减少北美客户依赖，把握国产替代及新需求机遇将成为重要趋势。展望2025年，资源有限的条件下，预计低成本高性能追平海外SOTA为国产大模型的主题。以DeepSeek、豆包、阿里千问为例，1）DeepSeek-R1/V3依靠创新的降本提效手段，核心旨在资源有限的条件下，极大提升GPU在计算/通信上的利用率。2）豆包大模型在2024年下半年发力，月活数据冲上全球第二和国内第一；同样在降本增效范式上依靠稀疏MoE架构实现小参数高性能；3）阿里Qwen引领国产开源模型标杆的同时，依靠强化学习范式推出的QwQ-32B已登顶全球最强开源模型，以32B参数模型追平DeepSeek-R1满血模型性能，小参数高性能持续成为主旋律。

而受益于开源模型、算力成本的降低、多模态的融合，国内AI应用或迎来爆发，并带来两个发展趋势，一方面更广泛场景的AI渗透率将显著提升，数据要素的稀缺性将使得AI应用趋向细分、垂直化。另一方面产品层面革新，聚焦用户丰富交互模式、降低门槛，由Manus带来的AIAgent趋势或将驱动AI应用实现从思考到执行的全闭环。同时在商业化落地节奏上或有分化，通用型AI将迈入流量入口争夺阶段，积累用户并探索生态的优先级短期大于变现，或在下个阶段看到广泛的Agent应用在大厂生态内爆发，带来中长期变现潜力；而垂直赛道AI则靠提供增值产品和体验，以生产力等刚需场景驱动较高的商业转化。

中国AI亮剑! DeepSeek R2参数破万亿, 成本暴降97%撼动全球格局

【2评论】【12点赞】

玩酷网

DSR2或即将发布，并助力AI产业链重回风口！

中国AI亮剑! DeepSeek R2参数破万亿, 成本暴降97%撼动全球格局

锐叔论