马斯克旗下xAI公司发布的更新版Grok 3大模型,被他盛赞为“地球上最聪明的人工智能”,这一新模型可是引起了广泛的关注和热议。
Grok 3可是用20万块英伟达芯片精心打造出来的,它的运算能力可是上一代的大约10倍之多。在xAI当天的直播里,马斯克与公司的三位工程师共同进行了现场演示。这一演示成果相当惊人,Grok 3在数学、科学以及编程的基准测试当中,击败了谷歌Gemini、DeepSeek的V3模型、Anthropic的Claude还有OpenAI的GPT - 4o。
马斯克之前就提到过,Grok 3是在大量的合成数据上进行训练的。它会反复检查这些数据,就像一个执着的追求者试图让一切都达到逻辑上的一致。要是发现了错误的数据,它就会像个冷静的思考者一样进行反思,然后毫不犹豫地删除那些有问题的数据。
从目前的测试情况来看,Grok 3在AIME'24数学能力测试、GPQA科学知识评估、LCB Oct - Feb编程能力测试等多项测试里的成绩都超过了DeepSeek。它有着独特的“思维链”推理机制,这种机制让它能够像人类一样逐步拆解那些复杂的任务,同时它的参数量达到了1万亿级别。在很多任务处理上,Grok 3的表现相当出色,比如在处理复杂逻辑和推理任务的时候,确实能够展现出很强的能力。
不过呢,Grok 3也有它的软肋。它可是花费了极其高昂的成本,计算量是前代Grok 2的10倍。有一种说法是,光是它的训练成本就可能高达30亿美元。根据相关工程师透露,xAI旗下的超算中心算力已经翻倍。要知道,去年4月马斯克就认为xAI想要打造出最好的AI,唯一的办法就是自建数据中心。因为急于推出Grok 3,在时间紧迫的情况下,他还决定在4个月内建成数据中心。最后,团队用了122天就让第一批10万个GPU启动并且运行起来了,但是要构建理想的AI,集群规模得再翻倍。在发布会上透露,团队仅仅用92天就实现了超算集群算力翻倍,也就是GPU数量达到了20万块。
这20万块GPU得花多少钱呢?就拿英伟达H100来说,单卡的价格大约在2.5万 - 3万美元之间。如果按照每张3万美元计算,20万块乘以3万美元,仅仅是硬件采购成本就得60亿美元。这还只是GPU硬件的成本,实际的部署成本更高,还得考虑配套服务器、网络设备、电力、冷却设施等等,总成本可能会达到百亿美元这么恐怖的量级,就算砍掉一半也得50亿美元。
再看看DeepSeek,它的训练成本仅仅为600万美元,和GPT - 4的7800万美元相比那可就低得多了。随着后续资金、人才、资源不断投入,DeepSeek的综合能力很可能不会比Grok3差。这说明了什么呢?第一,马斯克花了这么多钱堆砌算力,最后做出来的产品和OpenAI的差距不大。第二,这更证明了DeepSeek非常强。这两者是不同的路线,一个是大力出奇迹地疯狂砸钱堆算力,另一个则是凭借着创新的工程设计与高效的训练方法,优化资源节省成本,追求极致的性价比。
而这种堆算力的做法,实际上是在按照美国的意愿来进行AI资源分配的游戏。美国能够通过控制GPU芯片的出口,精确地调控全球的AI生产力水平。它把全球获取AI算力划分成三个等级圈,然后自己掌控分配,这使得其他国家在这个过程中有些绝望。特朗普投资的5000亿美元的“星际之门”项目也是如此,目的就是把美国在AI领域的领先牢牢锁定在美国本土,吸引日本、韩国、中东、欧洲等国家的资金,让除了中国之外的其他实力国家都被绑在美国的AI发展道路上。
然而DeepSeek的出现打破了这种局面,它给了其他国家自主发展AI的希望。它实现OpenAI模型同等性能的时候,所需的算力仅仅是对方的5%。它以低成本的运营模式直接让美国的一众科技巨头都相形见绌,这也让其他国家觉得自己也有机会在AI领域闯出一片天地,不用再依赖美国的高算力GPU芯片资源,而且还能大幅降低成本。
在AI大模型发展到如今这个阶段,很多模型的能力已经很难分出绝对的高低了。在大指标逐步趋同的情况下,开源成为了关键的一招。就像知名投资人朱啸虎提出的判断,开源模型就是闭源模型的斩杀线,闭源模型如果做不到开源基础的两到三倍,恐怕连存活的机会都没有。毕竟如果成本是别人的十倍,性能只提高了20%,就算是硅谷的投资人也很难接受这样的结果。只有开源的模型才能让更多人去充分测试它的实用性,如果不开源,即使别人付费使用,也没有什么特别领先的优势,这样的商业模式很难长久。
虽然Grok 3有自己的优势,比如以10万块英伟达H100芯片训练,每秒能够处理超过1.5万亿参数,能够实时解析车载摄像头、雷达等传感器数据。在识别暴雨天气下道路积水深度时准确率高37%,比竞品更有助于自动驾驶系统精准感知周边环境。而且它的“思维链”技术也能模拟人类逐步推理过程,在导航等自动驾驶场景中做出更合理、安全的决策,特斯拉若将其运用到FSD,会增强竞争力。
但DeepSeek也有很多优势,它是靠创新的工程设计和算法优化达到超低成本。它的开源模式在生态和技术优化上也有独特之处,未来甚至可能让全球很多科研人员在其AI模型上搞开发,东大也有望成为世界AI的开发中心。再加上中国的全力支持,众多行业快速接入,不断促使它发展和进化,未来它和各行各业结合产生生产力的能力,可能让Grok3都难以望其项背,我们只能拭目以待。