玩酷网

DeepSeek 刚刚发布了关于大模型训练的最佳端到端论文。内容涵盖:— 软件(

DeepSeek 刚刚发布了关于大模型训练的最佳端到端论文。

内容涵盖:

— 软件(MLA,FP8 训练,DeepEP,LogFMT)

— 硬件(Multi-Rail Fat Tree,Ethernet RoCE 交换机)

— 混合(IBGDA,3FS 文件系统)

DeepSeek 的工程深度令人难以置信AI探索计划AI探索计划AI软件AI探索计划 ​​​