阿里云PAI Model Gallery支持云上一键部署DeepSeek-V3、DeepSeek-R1。
在该平台上用户可以零代码实现从训练到部署再到推理的全过程,简化模型开发流程,为开发者和企业用户带来了更快、更高效、更便捷的AI开发和应用体验。
第一步:进入Model Gallery页面
点击文末阅读原文,或复制链接:
https://pai.console.aliyun.com/?utm_content=g_1000401510
登录PAI控制台,在顶部左上角根据实际情况选择地域。并在左侧导航栏选择工作空间列表,单击指定工作空间名称,进入对应工作空间内。最后在左侧导航栏选择快速开始>Model Gallery。

第二步:进入DeepSeek模型详情页
在Model Gallery页面的模型列表中,单击找到并点击需要部署的模型卡片,例如“DeepSeek-R1-Distill-Qwen-7B”模型,进入模型详情页面。

第三步:一键部署DeepSeek模型生成服务
单击右上角部署:目前DeepSeek-R1支持采用vLLM加速部署;DeepSeek-V3 支持vLLM加速部署以及Web应用部署;DeepSeek-R1蒸馏小模型支持采用BladeLLM(阿里云PAI自研高性能推理框架)和vLLM加速部署。选择部署方式和部署资源后,即可一键部署服务,生成一个PAI-EAS服务。

部署成功后,在服务页面可以点击“查看调用信息”获取调用的Endpoint和Token,想了解服务调用方式可以点击预训练模型链接,返回模型介绍页查看调用方式说明。


为了更高性价比地实现DeepSeek系列模型与现有业务的高效融合,本教程部署的模型为蒸馏过后的DeepSeek-R1-Distill-Qwen-7B。基于 DeepSeek-R1 的推理能力,通过蒸馏技术将推理模式迁移到较小的 Qwen 模型上,从而在保持高效性能的同时降低了计算成本。同时,阿里云PAI Model Gallery也提供 DeepSeek-R1、DeepSeek-V3原始模型的一键部署。