电子发烧友网报道(文 / 章鹰)近日,DeepSeek推出的AI大模型R1火爆,随着DeepSeek的开源和国产大模型成本的下降,人工智能技术在企业的应用场景大幅度拓展,国产算力也有机会在更多行业应用。业内人士表示,DeepSeek的开源让行业应用AI门槛大幅度降低,政府及企业应用有望在2025年产生裂变式增长。最新,中国电信、华为、京东、联想都相继加入了DeepSeek一体机的矩阵。
2月11日,中国电信宣布推出了息壤智算一体机-DeepSeek版,在硬件层面以华为昇腾芯片为基础,提供8卡、16卡、32卡等多种规格型号。
2月13日,华为宣布推出昇腾DeepSeek大模型一体机,从服务器、推理卡、到加速模组等丰富的DeepSeek一体机产品形态,全面适配DSV3/R1满血版/蒸馏版本全系列模型,涵盖智能对话、智能编程、文档分析、开发板等全场景应用。
华为表示,DeepSeek V3/ R1 671B旗舰模型(满血版)通常需要高端GPU进行推理,现在基于华为云昇腾云服务的全栈优化适配可以获得持平全球高端GPU部署模型的效果,提供稳定的生产级服务能力,满足业务商用部署需求。
近日,联想百应总经理魏东表示,联想开发的DeepSeek一体机得到来自政府、医疗行业、制造行业、教育行业的关注。不少企业和联想沟通希望做一些本地的部署。
据悉,目前上市的DeepSeek推理一体机内置DeepSeek-R1 32B、70B、满血版671B等不同尺寸模型,价格在几十万到数百万不等,主要面向对数据安全、数据隐私较为敏感的企业用户。而训推一体机的售价更高,用于DeepSeek-R1 32B模型的预训练和微调的一体机价格就达到数百万。
对比其他AI大模型,DeepSeek的两大优势DeepSeek R1是一个基于混合专家(MOE)架构的 AI 对话模型。尽管中国 AI 公司 DeepSeek 发布的模型相当新,但它已经被称为 ChatGPT、Perplexity 和 Gemini 等较老 AI 模型的强劲竞争对手。
DeepSeek 的与众不同之处在于其开源特性和高效架构。这使得开发人员能够适应并在此基础上进行构建,而无需承担与资源密集型模型相关的高昂基础设施成本。对于想要使用 AI 但预算不足的初创公司和小型企业来说,DeepSeek R1 是一个不错的选择。
DeepSeek R1总共拥有惊人的 6710 亿个参数,但每个任务仅激活约 370 亿个参数——这就像为手头的工作召集了合适的专家。这种选择性激活是通过 DeepSeek R1 的创新多头潜在注意力 (MLA) 机制实现的。这种方法使 DeepSeek R1 能够以惊人的效率处理复杂任务,处理信息的速度通常比传统模型快两倍,例如编码和数学计算等任务。
ChatGPT 建立在 OpenAI 的 GPT 架构之上,该架构利用基于 Transformer 的神经网络。该模型采用自注意力机制来处理和生成文本,从而能够捕捉输入数据中的复杂关系。ChatGPT 的架构拥有 1750 亿个参数,确保其所有“知识”可用于每项任务。这意味着,与 DeepSeek R1 不同,ChatGPT 不会只调用提示所需的参数。相反,它每次都会使用所有1750 亿个参数,无论它们是否是必需的。这种广泛的参与令ChatGPT能够提供高度准确且具有情境感知能力的响应。但也意味着它消耗了大量的计算能力和能源资源,不可持续。
国产算力支持DeepSeek一体机部署,前景如何?联想集团和沐熙公司联合发布基于DeepSeek大模型的一体机解决方案,以“联想服务器/工作站+沐曦训推一体GPU+自主算法”为核心架构。京东云的DeepSeek大模型一体机,支持华为昇腾、海光、寒武纪、摩尔线程、天数智芯等国产AI加速芯片。
行业专家指出,大模型一体机主要是本地化部署,解决的是数据隐私问题。之前大模型一体机的经济价值不高,高投入影响了其落地,未来还是需要应用能有更大的发展。
据悉,国内多家国产芯片厂商完成了对DeepSeek满血版和蒸馏版开源模型的适配工作。但是目前主要针对的中小模型,而满血版的V3/R1拥有6710亿参数,对硬件要求大大提高。需要推理的时候用到320个GPU,这对于成本和芯片性能提出了更高要求。
DeepSeek对核心产业的相互渗透,将助力中国从“算力追求者”向“生态主导者”转型。DeepSeek一体机的密集发布,对中小企业的AI应用落地是一个极大助力,未来在行业拓展应用口碑如何,我们将拭目以待。