马斯克用20万块英伟达芯片练出Grok3，印证了DeepSeek真的强

马斯克旗下xAI公司发布的更新版Grok 3大模型，被他盛赞为“地球上最聪明的人工智能”，这一新模型可是引起了广泛的关注和热议。

Grok 3可是用20万块英伟达芯片精心打造出来的，它的运算能力可是上一代的大约10倍之多。在xAI当天的直播里，马斯克与公司的三位工程师共同进行了现场演示。这一演示成果相当惊人，Grok 3在数学、科学以及编程的基准测试当中，击败了谷歌Gemini、DeepSeek的V3模型、Anthropic的Claude还有OpenAI的GPT - 4o。

马斯克之前就提到过，Grok 3是在大量的合成数据上进行训练的。它会反复检查这些数据，就像一个执着的追求者试图让一切都达到逻辑上的一致。要是发现了错误的数据，它就会像个冷静的思考者一样进行反思，然后毫不犹豫地删除那些有问题的数据。

从目前的测试情况来看，Grok 3在AIME'24数学能力测试、GPQA科学知识评估、LCB Oct - Feb编程能力测试等多项测试里的成绩都超过了DeepSeek。它有着独特的“思维链”推理机制，这种机制让它能够像人类一样逐步拆解那些复杂的任务，同时它的参数量达到了1万亿级别。在很多任务处理上，Grok 3的表现相当出色，比如在处理复杂逻辑和推理任务的时候，确实能够展现出很强的能力。

不过呢，Grok 3也有它的软肋。它可是花费了极其高昂的成本，计算量是前代Grok 2的10倍。有一种说法是，光是它的训练成本就可能高达30亿美元。根据相关工程师透露，xAI旗下的超算中心算力已经翻倍。要知道，去年4月马斯克就认为xAI想要打造出最好的AI，唯一的办法就是自建数据中心。因为急于推出Grok 3，在时间紧迫的情况下，他还决定在4个月内建成数据中心。最后，团队用了122天就让第一批10万个GPU启动并且运行起来了，但是要构建理想的AI，集群规模得再翻倍。在发布会上透露，团队仅仅用92天就实现了超算集群算力翻倍，也就是GPU数量达到了20万块。

这20万块GPU得花多少钱呢？就拿英伟达H100来说，单卡的价格大约在2.5万 - 3万美元之间。如果按照每张3万美元计算，20万块乘以3万美元，仅仅是硬件采购成本就得60亿美元。这还只是GPU硬件的成本，实际的部署成本更高，还得考虑配套服务器、网络设备、电力、冷却设施等等，总成本可能会达到百亿美元这么恐怖的量级，就算砍掉一半也得50亿美元。

再看看DeepSeek，它的训练成本仅仅为600万美元，和GPT - 4的7800万美元相比那可就低得多了。随着后续资金、人才、资源不断投入，DeepSeek的综合能力很可能不会比Grok3差。这说明了什么呢？第一，马斯克花了这么多钱堆砌算力，最后做出来的产品和OpenAI的差距不大。第二，这更证明了DeepSeek非常强。这两者是不同的路线，一个是大力出奇迹地疯狂砸钱堆算力，另一个则是凭借着创新的工程设计与高效的训练方法，优化资源节省成本，追求极致的性价比。

而这种堆算力的做法，实际上是在按照美国的意愿来进行AI资源分配的游戏。美国能够通过控制GPU芯片的出口，精确地调控全球的AI生产力水平。它把全球获取AI算力划分成三个等级圈，然后自己掌控分配，这使得其他国家在这个过程中有些绝望。特朗普投资的5000亿美元的“星际之门”项目也是如此，目的就是把美国在AI领域的领先牢牢锁定在美国本土，吸引日本、韩国、中东、欧洲等国家的资金，让除了中国之外的其他实力国家都被绑在美国的AI发展道路上。

然而DeepSeek的出现打破了这种局面，它给了其他国家自主发展AI的希望。它实现OpenAI模型同等性能的时候，所需的算力仅仅是对方的5%。它以低成本的运营模式直接让美国的一众科技巨头都相形见绌，这也让其他国家觉得自己也有机会在AI领域闯出一片天地，不用再依赖美国的高算力GPU芯片资源，而且还能大幅降低成本。

在AI大模型发展到如今这个阶段，很多模型的能力已经很难分出绝对的高低了。在大指标逐步趋同的情况下，开源成为了关键的一招。就像知名投资人朱啸虎提出的判断，开源模型就是闭源模型的斩杀线，闭源模型如果做不到开源基础的两到三倍，恐怕连存活的机会都没有。毕竟如果成本是别人的十倍，性能只提高了20%，就算是硅谷的投资人也很难接受这样的结果。只有开源的模型才能让更多人去充分测试它的实用性，如果不开源，即使别人付费使用，也没有什么特别领先的优势，这样的商业模式很难长久。

虽然Grok 3有自己的优势，比如以10万块英伟达H100芯片训练，每秒能够处理超过1.5万亿参数，能够实时解析车载摄像头、雷达等传感器数据。在识别暴雨天气下道路积水深度时准确率高37%，比竞品更有助于自动驾驶系统精准感知周边环境。而且它的“思维链”技术也能模拟人类逐步推理过程，在导航等自动驾驶场景中做出更合理、安全的决策，特斯拉若将其运用到FSD，会增强竞争力。

但DeepSeek也有很多优势，它是靠创新的工程设计和算法优化达到超低成本。它的开源模式在生态和技术优化上也有独特之处，未来甚至可能让全球很多科研人员在其AI模型上搞开发，东大也有望成为世界AI的开发中心。再加上中国的全力支持，众多行业快速接入，不断促使它发展和进化，未来它和各行各业结合产生生产力的能力，可能让Grok3都难以望其项背，我们只能拭目以待。

玩酷网

马斯克用20万块英伟达芯片练出Grok3，印证了DeepSeek真的强

外卖骑行侠