埃隆·马斯克(Elon Musk)启动了美国田纳西州孟菲斯超级集群,声称是“世界上最强大的人工智能集群”,将使用他自己开发的Dojo AI加速器。另外,他还在特斯拉财报电话会议上宣布,由于英伟达GPU定价高,他将加倍投入Dojo的开发和部署。
在田纳西州建设的xAI设施的目标是在单一结构上安装100,000个Nvidia H100 GPU。马斯克表示,将在今年年底前启动并运行Dojo D1。它将拥有8,000 颗英伟达H100 芯片的处理能力,这“不是很大,但也不是微不足道”。
马斯克于2021年首次推出Dojo D1芯片,性能目标为322 TeraFLOPs。然后,在2023年8月,特斯拉被发现招聘了一名数据中心高级工程项目经理,这通常是任何组织在规划自己的数据中心时都会采取的第一步。特斯拉在下个月还将Dojo D1的订单翻了一番,这表明其对自己的表现充满信心。
需要说明的是,特斯拉和xAI两家公司的CEO都是马斯克。
到2024年5月,Dojo处理器已经投入量产。现在看来,Dojo芯片已经进入美国并落入马斯克的手中,昨天他在位于数据中心的家中分享了Dojo超级计算机的照片。
Dojo芯片是具有5×5 阵列的晶圆上系统处理器。这意味着其 25 个超高性能芯片使用台积电的集成扇出(InFO)技术互连,因此它们可以充当单个处理器,并且比类似的多处理器机器更高效地执行。
台积电为特斯拉制造Dojo芯片,马斯克将与他的英伟达(Nvidia)驱动的孟菲斯超级集群一起运行它们。然而,虽然田纳西州的设施归xAI所有,主要用于训练Grok,但Dojo芯片更适合AI机器学习和视频训练,特别是将用于训练特斯拉的全自动驾驶技术基于从特斯拉汽车收集的视频数据。
马斯克到2024年底,他建设的AI集群将拥有90,000个Nvidia H100芯片、40,000个Nvidia AI4和自研的Dojo D1芯片。当马斯克将他手头的所有芯片结合起来时,这种强大的计算能力将是不可小觑,同时也显示了这位亿万富翁在人工智能上投入上魄力。