文/王新喜
马斯克的人工智能初创公司xAI发布了更新版Grok 3大模型,马斯克称之为“地球上最聪明的人工智能”。

Grok 3是用20万块英伟达芯片练出来的,运算能力是上代10倍。
xAI在当天的直播中,马斯克与该公司的三位工程师一起进行了现场演示,Grok 3在数学、科学和编程基准测试中,Grok 3击败了谷歌Gemini、DeepSeek的V3模型、Anthropic的Claude和OpenAI的GPT-4o。

据马斯克此前介绍,Grok 3是在大量的合成数据上训练的。它会反复检查数据,试图达到逻辑一致性。如果有错误的数据,它会反思并删除错误数据。
从目前测试看,Grok3在AIME'24数学能力测试、GPQA科学知识评估、LCB Oct - Feb编程能力测试等多项测试中成绩均高于DeepSeek。拥有“思维链”推理机制,能像人类一样逐步拆解复杂任务。参数量达1万亿级别。

Grok3 确实在不少任务上表现得很棒,例如在处理复杂逻辑和推理任务时,它的能力确实有东西。不过Grok3用海量GPU刷了榜单上的分数,数学、编程分高,其实也没好多少,没有拉开差距。而DeepSeek 的优势在于中文理解和多模态交互方面,它的表现一直很稳定,在实际应用场景中已经得到了不少验证。
最关键的问题在于,Grok3成本极其高,计算量是前代Grok 2的10倍,有说法是其训练成本就30亿美元,根据相关工程师透露xAI旗下超算中心算力已经翻倍。

去年4月,马斯克认为xAI若想成功打造出最佳AI,唯一途径是自建数据中心。由于想尽快推出Grok 3,时间紧迫,于是决定在四个月内建成数据中心。最终,团队耗时122天让第一批10万个GPU启动并运行,不过要构建理想中的AI需将集群规模翻倍。发布会上透露,团队仅用92天就已经实现了超算集群的算力翻倍,也就是GPU数量已达20万块。

20万块GPU多少钱?以英伟达H100为例,单卡价格约为2.5万-3万美元。20万块 × 3万美元 = 60亿美元(仅硬件采购成本)。这还只是GPU硬件成本,实际部署成本更高,还需考虑配套服务器、网络设备、电力、冷却设施等,总成本可能达百亿美元量级,砍一半也高达50亿美金。
Deepseek从训练成本来看仅有600万美元,远低于GPT-4的7800万美元。后续deepseek资金、人才、资源上去了,综合能力肯定不比Grok3差。
Grok 3,印证了DeepSeek真的强
这说明了什么,说明了两点,其一,马斯克花了那么多钱堆了比OpenAI还多的算力,最后搞出来个跟OpenAI差不多的产品。第二,这证明了DeepSeek真的强啊,马斯克大把烧美金当柴火搞炼丹,效果全靠堆硬件,而且从数据来看,和DeepSeek并没有拉开多少差距,DeepSeek那边走低成本路线都能差不多打平手,那只能更说明DeepSeek非常强。

因为这是两条不同的路线,一个是力大拍砖大力出奇迹坚定地砸钱堆算力,一个是创新的工程设计与高效的训练方法,优化节省资源追求极致性价比,是两条完全不同的路线。
而堆算力的游戏,是让AI成为美国人主导算力资源分配的游戏。美国可以通过控制GPU芯片出口,精确调控全球AI生产力水平。并且把全球获取AI算力划分为三个等级圈,由它来控制分配,这让其他国家陷入绝望。
而且特朗普还投资5000亿美元的“星际之门”,目的就是将AI领先牢牢锁在美国本土,吸引把日韩、中东、欧洲等相关资金,把除中国外的其他实力国家牢牢绑在老美的AI战车之上。

而DeepSeek则打破了这种主导,给了其他所有国家看到了自主发展AI的希望,因为它在实现OpenAI模型的同等性能时,仅需要对方5%的算力,以低成本模式直接掀翻了美国一众科技巨头,这下所有的国家都觉得自己都能行了。因为,这意味着所有的国家都不需要依赖美国高算力GPU芯片资源了,而且还能把成本极大的降下来。

这是现在到处搞钱的特朗普特别看重的能力,DeepSeek的横空出世,为啥不光是英伟达、AMD等企业很快接入,特朗普也一反常态的点赞——他们就一个意思:省成本,省社会总成本,可以给整个国家省下老鼻子钱了。
而且在AI 大模型发展到现在,其实模型能力已经很难分出绝对的胜负了,在大指标不断趋同的背景下,开源才是大招,知名投资人朱啸虎曾经提出一个判断,开源模型的基础就是闭源模型的斩杀线,今后闭源模型必须要做到开源基础的两到三倍才有活下去的机会。否则十倍成本砸下去性能只提高20%,那即使是硅谷的投资人也不会接受这样的结果。
而真用起来如何,也只有开源的才能比较充分测试。不开源,人家还交钱用,还没什么特别领先的,商业模式就很难成立。
加上有Chatgpt和deepseek的巨大成功在前,grok1和grok2差不多无人问津,grok3单纯砸钱堆算力实现大火上演反转剧情的几率并不大。
如果不开源,马斯克巨大的投入无法变现,或会自用到自己的机器人和 FSD。不过话说回来,目前特斯拉FSD用户订阅并不高,但是Grok-3还是能增强FSD的竞争力。
因为Grok 3 基于10万块英伟达 H100 芯片训练,每秒可处理超过 1.5 万亿参数,能实时解析车载摄像头、雷达等传感器数据,比竞品在识别暴雨天气下道路积水深度的准确率高 37%,可帮助自动驾驶系统更精准地感知周边环境。
此外是Grok 3 引入 “思维链” 技术,可模拟人类逐步推理过程,在导航时能综合分析实时交通数据、充电桩可用性和用户日程推荐路线,在自动驾驶场景中,面对复杂路况和交通信号时能做出更合理、安全的决策。
如果特斯拉将其用到FSD,这意味着新能源车企的智驾竞争会更加激烈,对此中国的车企要有足够的认知与准备。
相对于Grok3,deepseek的优势是创新的工程设计与算法优化实现的超低成本、其次是开源模式的生态与技术优化能力会让未来包括美国在内的很多科研人员只能在东大的AI模型上搞开发了!东大有望成为世界AI的开发中心。加上我们举国之力支持,中国成百上千行业都在快速接入,促进它不断进化,和千行百业结合实践,产生生产力。未来发展潜力,可能不是Grok3能比的,我们拭目以待。
作者:王新喜 TMT资深评论人 本文未经许可谢绝转载
grok就是垃圾,100倍算力成本,跟Deepseek效果差不多。浪费能源,污染环境
除了不服输看不到什么内容
哈哈,20万块还不到3万美元[呲牙笑](是这意思吗?)
如果是这样堆GPU的话,到时候电力会不够用的。还是抓紧建核电站吧。
中国货能立足世界的唯一法宝就是便宜
GrOK实战翻车了!