DeepSeek一体机发布！四大厂商入局，加速AI应用落地

电子发烧友网报道（文 / 章鹰）近日，DeepSeek推出的AI大模型R1火爆，随着DeepSeek的开源和国产大模型成本的下降，人工智能技术在企业的应用场景大幅度拓展，国产算力也有机会在更多行业应用。业内人士表示，DeepSeek的开源让行业应用AI门槛大幅度降低，政府及企业应用有望在2025年产生裂变式增长。最新，中国电信、华为、京东、联想都相继加入了DeepSeek一体机的矩阵。 2月11日，中国电信宣布推出了息壤智算一体机-DeepSeek版，在硬件层面以华为昇腾芯片为基础，提供8卡、16卡、32卡等多种规格型号。 2月13日，华为宣布推出昇腾DeepSeek大模型一体机，从服务器、推理卡、到加速模组等丰富的DeepSeek一体机产品形态，全面适配DSV3/R1满血版/蒸馏版本全系列模型，涵盖智能对话、智能编程、文档分析、开发板等全场景应用。华为表示，DeepSeek V3/ R1 671B旗舰模型（满血版）通常需要高端GPU进行推理，现在基于华为云昇腾云服务的全栈优化适配可以获得持平全球高端GPU部署模型的效果，提供稳定的生产级服务能力，满足业务商用部署需求。近日，联想百应总经理魏东表示，联想开发的DeepSeek一体机得到来自政府、医疗行业、制造行业、教育行业的关注。不少企业和联想沟通希望做一些本地的部署。据悉，目前上市的DeepSeek推理一体机内置DeepSeek-R1 32B、70B、满血版671B等不同尺寸模型，价格在几十万到数百万不等，主要面向对数据安全、数据隐私较为敏感的企业用户。而训推一体机的售价更高，用于DeepSeek-R1 32B模型的预训练和微调的一体机价格就达到数百万。对比其他AI大模型，DeepSeek的两大优势DeepSeek R1是一个基于混合专家（MOE）架构的 AI 对话模型。尽管中国 AI 公司 DeepSeek 发布的模型相当新，但它已经被称为 ChatGPT、Perplexity 和 Gemini 等较老 AI 模型的强劲竞争对手。 DeepSeek 的与众不同之处在于其开源特性和高效架构。这使得开发人员能够适应并在此基础上进行构建，而无需承担与资源密集型模型相关的高昂基础设施成本。对于想要使用 AI 但预算不足的初创公司和小型企业来说，DeepSeek R1 是一个不错的选择。 DeepSeek R1总共拥有惊人的 6710 亿个参数，但每个任务仅激活约 370 亿个参数——这就像为手头的工作召集了合适的专家。这种选择性激活是通过 DeepSeek R1 的创新多头潜在注意力 (MLA) 机制实现的。这种方法使 DeepSeek R1 能够以惊人的效率处理复杂任务，处理信息的速度通常比传统模型快两倍，例如编码和数学计算等任务。 ChatGPT 建立在 OpenAI 的 GPT 架构之上，该架构利用基于 Transformer 的神经网络。该模型采用自注意力机制来处理和生成文本，从而能够捕捉输入数据中的复杂关系。ChatGPT 的架构拥有 1750 亿个参数，确保其所有“知识”可用于每项任务。这意味着，与 DeepSeek R1 不同，ChatGPT 不会只调用提示所需的参数。相反，它每次都会使用所有1750 亿个参数，无论它们是否是必需的。这种广泛的参与令ChatGPT能够提供高度准确且具有情境感知能力的响应。但也意味着它消耗了大量的计算能力和能源资源，不可持续。国产算力支持DeepSeek一体机部署，前景如何？联想集团和沐熙公司联合发布基于DeepSeek大模型的一体机解决方案，以“联想服务器/工作站+沐曦训推一体GPU+自主算法”为核心架构。京东云的DeepSeek大模型一体机，支持华为昇腾、海光、寒武纪、摩尔线程、天数智芯等国产AI加速芯片。行业专家指出，大模型一体机主要是本地化部署，解决的是数据隐私问题。之前大模型一体机的经济价值不高，高投入影响了其落地，未来还是需要应用能有更大的发展。据悉，国内多家国产芯片厂商完成了对DeepSeek满血版和蒸馏版开源模型的适配工作。但是目前主要针对的中小模型，而满血版的V3/R1拥有6710亿参数，对硬件要求大大提高。需要推理的时候用到320个GPU，这对于成本和芯片性能提出了更高要求。 DeepSeek对核心产业的相互渗透，将助力中国从“算力追求者”向“生态主导者”转型。DeepSeek一体机的密集发布，对中小企业的AI应用落地是一个极大助力，未来在行业拓展应用口碑如何，我们将拭目以待。

玩酷网

DeepSeek一体机发布！四大厂商入局，加速AI应用落地

科技确有核芯