DeepSeek-V3满血版在国产沐曦GPU首发上线

开源其实不简单 2025-02-05 21:00:33

为了验证DeepSeek-V3满血版在国产 GPU 下的适配情况,春节期间我们联合沐曦的工程师进行了充分的测试。经过几天紧张的测试,目前已经确认DeepSeek-V3全精度满血版可以成功的运行在沐曦训推一体的 GPU 之上,这也充分证明了 DeepSeek 可以实现全链路自主技术闭环。

今天我们再次将DeepSeek-V3满血版(671B)上线到平台上(满血版目前仅供大家体验用途)。这也是 Gitee AI 继全套千问蒸馏模型上线沐曦 GPU 之后的又一大的更新。

由于满血版模型的运行需要多机多卡的配置,除了服务器本身外,还需要InfiniBand(IB)互联设备(如交换机、HBA网卡、光纤等)以实现高速网络连接。然而,目前具备此类条件的服务器数量较为有限,因此只能部署一个最小规模的集群,无法支持更高的并发需求。由此可能会出现体验卡顿或超时的情况。我们将与沐曦进一步协调更多计算设备,以便为大家提供更稳定的服务。

如果用于生产环境使用,我们推荐选择 Gitee AI 已经准备好的全套免费的DeepSeek-R1蒸馏模型。

性能对标海外顶级闭源模型

DeepSeek-V3多项评测成绩超越了其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。

V3 与蒸馏模型的核心差异

此次上线的 DeepSeek-V3 与近期上线的DeepSeek-R1-Distill(1.5B/7B/14B/32B)形成互补,企业和开发者可按需选择:

模型规模与架构

适用场景DeepSeek-V3适合复杂任务处理和高精度场景,如长文档分析、多模态推理、科研计算等支持千卡级训练,满足超大规模集群分布式训练需求DeepSeek-R1-Distill 蒸馏模型适合轻量级部署和资源受限场景,如边缘设备推理、中小企业快速验证 AI 应用在显存和算力要求上更为灵活,适配入门级硬件国产沐曦曦云 GPU 强势助力

曦云系列通用 GPU 产品(包括 C550、C500、C500X、C290、C280、N260 等型号)采用完全自主研发的 GPU IP,拥有完整的知识产权,并具备强大的多精度混合计算能力及高带宽显存支持。同时,沐曦产品搭载先进的时空互联技术和全球兼容的 MXMACA 软件栈,可广泛应用于智能、通用计算和数据处理等场景。

沐曦曦云 GPU 不仅具备强大的硬件支持,还在软硬件协同优化方面做了大量工作,确保DeepSeek-V3 能够发挥出其最大效能。相比海外厂商的 GPU,沐曦曦云 GPU 的更高兼容性和更低的资源消耗,使得DeepSeek-V3的 API 成本进一步降低。

为何100%国产AI至关重要

全球 AI 产业的竞争格局正在因开源战略和技术创新而发生深刻变化,中国 AI 企业正成为推动行业变革的重要力量。这种转变正促使过去三年由海外大厂主导的局面发生变化。

DeepSeek 之所以能在这个春节迅速破圈,成为国内外广泛关注的焦点,正是因为它代表了中国在人工智能领域的领先力量。然而,若其只能在海外硬件平台上运行,那么这一突破性的技术成果最终也只能局限于海外技术的生态之中,难以完全实现自主可控。

真正意义上的技术自主与独立,必须依托于能够充分兼容并高效运行在国产 GPU 上的能力。只有当 DeepSeek 能够在国产 GPU 上完美运行,整个中国 AI 技术体系才真正得以实现闭环!

访问 Gitee AI,体验基于基于沐曦曦云 GPU 的DeepSeek-V3,感受全链路自主技术闭环的 AI 应用开发!

Gitee AI 的 Serverless API 提供了文本生成、视觉模型、图像处理、语音识别、语音生成、向量与重排模型、代码生成等 9 种类型共 53 个大模型的 API 使用。通过购买模型资源包,即可通过极低的价格即可尽享众多主流模型。

4 阅读:272

开源其实不简单

简介:感谢大家的关注