DeepSeek-V3满血版在国产沐曦GPU首发上线

为了验证DeepSeek-V3满血版在国产 GPU 下的适配情况，春节期间我们联合沐曦的工程师进行了充分的测试。经过几天紧张的测试，目前已经确认DeepSeek-V3全精度满血版可以成功的运行在沐曦训推一体的 GPU 之上，这也充分证明了 DeepSeek 可以实现全链路自主技术闭环。

今天我们再次将DeepSeek-V3满血版（671B）上线到平台上（满血版目前仅供大家体验用途）。这也是 Gitee AI 继全套千问蒸馏模型上线沐曦 GPU 之后的又一大的更新。

由于满血版模型的运行需要多机多卡的配置，除了服务器本身外，还需要InfiniBand（IB）互联设备（如交换机、HBA网卡、光纤等）以实现高速网络连接。然而，目前具备此类条件的服务器数量较为有限，因此只能部署一个最小规模的集群，无法支持更高的并发需求。由此可能会出现体验卡顿或超时的情况。我们将与沐曦进一步协调更多计算设备，以便为大家提供更稳定的服务。

如果用于生产环境使用，我们推荐选择 Gitee AI 已经准备好的全套免费的DeepSeek-R1蒸馏模型。

性能对标海外顶级闭源模型

DeepSeek-V3多项评测成绩超越了其他开源模型，并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。

V3 与蒸馏模型的核心差异

此次上线的 DeepSeek-V3 与近期上线的DeepSeek-R1-Distill（1.5B/7B/14B/32B）形成互补，企业和开发者可按需选择：

模型规模与架构

适用场景DeepSeek-V3适合复杂任务处理和高精度场景，如长文档分析、多模态推理、科研计算等支持千卡级训练，满足超大规模集群分布式训练需求DeepSeek-R1-Distill 蒸馏模型适合轻量级部署和资源受限场景，如边缘设备推理、中小企业快速验证 AI 应用在显存和算力要求上更为灵活，适配入门级硬件国产沐曦曦云 GPU 强势助力

曦云系列通用 GPU 产品（包括 C550、C500、C500X、C290、C280、N260 等型号）采用完全自主研发的 GPU IP，拥有完整的知识产权，并具备强大的多精度混合计算能力及高带宽显存支持。同时，沐曦产品搭载先进的时空互联技术和全球兼容的 MXMACA 软件栈，可广泛应用于智能、通用计算和数据处理等场景。

沐曦曦云 GPU 不仅具备强大的硬件支持，还在软硬件协同优化方面做了大量工作，确保DeepSeek-V3 能够发挥出其最大效能。相比海外厂商的 GPU，沐曦曦云 GPU 的更高兼容性和更低的资源消耗，使得DeepSeek-V3的 API 成本进一步降低。

为何100%国产AI至关重要

全球 AI 产业的竞争格局正在因开源战略和技术创新而发生深刻变化，中国 AI 企业正成为推动行业变革的重要力量。这种转变正促使过去三年由海外大厂主导的局面发生变化。

DeepSeek 之所以能在这个春节迅速破圈，成为国内外广泛关注的焦点，正是因为它代表了中国在人工智能领域的领先力量。然而，若其只能在海外硬件平台上运行，那么这一突破性的技术成果最终也只能局限于海外技术的生态之中，难以完全实现自主可控。

真正意义上的技术自主与独立，必须依托于能够充分兼容并高效运行在国产 GPU 上的能力。只有当 DeepSeek 能够在国产 GPU 上完美运行，整个中国 AI 技术体系才真正得以实现闭环！

访问 Gitee AI，体验基于基于沐曦曦云 GPU 的DeepSeek-V3，感受全链路自主技术闭环的 AI 应用开发！

Gitee AI 的 Serverless API 提供了文本生成、视觉模型、图像处理、语音识别、语音生成、向量与重排模型、代码生成等 9 种类型共 53 个大模型的 API 使用。通过购买模型资源包，即可通过极低的价格即可尽享众多主流模型。

玩酷网

DeepSeek-V3满血版在国产沐曦GPU首发上线

开源其实不简单