玩酷网

Deepmind的科学家Harris Chan绘制的 DeepSeek-R1 训

Deepmind的科学家Harris Chan绘制的 DeepSeek-R1 训练/蒸馏可视化过程。

这张图展示了 DeepSeek-R1 模型的训练流程,包括 DeepSeek-R1-Zero 和 DeepSeek-R1 两个模型的训练步骤,以及如何将 DeepSeek-R1 的能力蒸馏到其他模型上。