玩酷网

Deepmind的科学家Harris Chan绘制的 DeepSeek-R1 训

2025-01-21 13:43:14 蚁工厂科技

Deepmind的科学家Harris Chan绘制的 DeepSeek-R1 训练/蒸馏可视化过程。

这张图展示了 DeepSeek-R1 模型的训练流程，包括 DeepSeek-R1-Zero 和 DeepSeek-R1 两个模型的训练步骤，以及如何将 DeepSeek-R1 的能力蒸馏到其他模型上。

阅读：100 点赞：0