玩酷网

13760片 A100集群,200B参数大模型。 在AWS上训练48天,需花费

13760片 A100集群,200B参数大模型。 在AWS上训练48天,需花费4.7亿元。