近日来,DeepSeek凭借其低成本、高性能的大模型研发成果,迅速引发了全球科技界关注。该公司最新推出的R1模型已经比肩行业顶尖模型能力。DeepSeek的成功展现了中国在人工智能领域的创新能力,也为整个行业提供了全新的成本与效率标杆,激发了各界对技术生态构建的广泛关注。
在北京一家国产智算芯片研发企业内,研发人员在春节后开工首日就宣布完成了对DeepSeek模型的适配。企业负责人告诉记者,以往他们适配其他不开源的大模型时,需要与模型开发企业共同进行交流协作、花费时间较长;而这次,他们只用不到一周的时间就自己完成了适配。
适配DeepSeek后,意味着这一国产大模型未来可以在国产算力基础设施上完成训练、推理和使用。此外,各行业对部署了DeepSeek的智算一体机的硬件需求也明显增长。
多个领军企业宣布发布DeepSeek一体机
联想创新性推出两大产品:面向敏捷部署的DeepSeek智能体一体机采用ThinkStation PX工作站为载体,搭载沐曦曦思N260国产GPU。实测数据显示,在相同并发条件下,沐曦曦思N260国产GPU在Qwen2.5-14B模型推理实测性能达到NVIDIA L20 GPU的110%-130%, 可支持本地部署DeepSeek各种参数蒸馏模型推理。而面向更广泛场景的DeepSeek训推一体机则基于联想问天WA5480 G3 AI服务器,搭载8张曦云C500国产GPU,可为大模型训练和推理提供强大的算力支撑。

京东云发布DeepSeek大模型一体机,具备国产算力全适配、支持丰富大模型参数规格、AI应用开箱即用、超高性价比等核心特性,助力用户一站式构建自主可控的AI生产力。
浪潮云联合发布预置DeepSeek-R1和DeepSeek-V3模型的海若一体机,率先实现671B DeepSeek大模型国产GPU单机推理服务,为行业用户提供大模型智能应用落地的一体化解决方案。
紫光股份旗下新华三集团发布基于DeepSeek大模全 面 搭 载型的-体机 Unicube,并实现671BDeepSeek V3、R1模型,Deepseek大模型单机推理及单机训推一体服务。
中国电信天翼云首席研发专家 林炳怀:用户无需云上去接入,类似于日常购买一个电脑,开箱就直接在企业里接入使用。国央企以及高校都有非常强烈的DeepSeek一体机的需求。
以下是A股DeepSeek智算一体机核心梳理(建议收藏)

