阿里云官宣上线六款全尺寸DeepSeek模型

太平洋科技 2025-02-10 10:06:23

2025年2月9日,阿里云正式宣布其百炼平台全面上线六款全尺寸DeepSeek模型,包括DeepSeek-V3、DeepSeek-R1以及多款蒸馏版模型如DeepSeek-R1-Distill-Qwen-32B、14B、7B和1.5B。此次上线的模型涵盖了多种应用场景,为企业和开发者提供了更灵活和高效的AI运算解决方案。

DeepSeek模型以其强大的推理能力,在数学、代码、自然语言处理等多个领域表现出色。满血版DeepSeek-R1和DeepSeek-V3模型分别拥有6710亿参数,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,极大提升了模型推理能力。

为吸引更多用户,阿里云为DeepSeek-R1和DeepSeek-V3两款模型各提供了100万免费tokens。此外,蒸馏版模型如DeepSeek-R1-Distill-Qwen-7B的输入价格仅为0.5元/百万tokens,为全网最低价,而最小尺寸的DeepSeek-R1-Distill-Qwen-1.5B则面向用户限时免费。

阿里云PAI支持云上一键部署DeepSeek-V3、DeepSeek-R1及其蒸馏版模型,用户无需编写代码,即可通过阿里云平台实现从模型训练到部署再到推理的全过程,极大地简化了AI模型的开发流程

0 阅读:71