10万GPU烧出AI怪物,马斯克Grok-3硬刚DeepSeek

太平洋科技 2025-02-18 14:10:51

“10 万张 H100 GPU 训练”、“证明黎曼猜想”、“最聪明的 AI”。

Grok-3 未发布就赚足了眼球,今天中午,一如既往的迟到后,被马斯克称为“Smartest AI on Earth”的 Grok-3 终于来到了我们面前。

注意,Grok-3 并不是一个对话助手,而是为了完成 xAI 的使命:“Our mission is to understand universe(我们的使命是了解宇宙)”

超越 GPT4o,最强 AI 初见端倪

这次发布会,马斯克发布了两套模型一个工具,即 Grok-3、Grok-3 Reasoning,以及 Agent 工具 Grok DeepSearch。

马斯克表示,Grok-3 在多项 Benchmark 的测试中均取得了比 DeepSeek-V3、GPT-4o、Gemini-2 Pro 更优的效果,Grok-3 已经在 xAI 内部运行了两个星期。

在现场演示中,工作人员用 Grok-3 寻找去火星的时间窗口,在一定程度上展示了 Grok-3 的信息搜索、真假信息判断以及推理能力。

另一个演示是制作一款融合俄罗斯方块和宝石迷阵的二合一游戏,展示了 Grok-3 的编程及创意能力。

从现场展示来看,Grok-3 的编程、推理、计算能力确实很突出。而在最新的 AIME 竞赛中也是断层领先。这里有亮点需要注意,第一个亮点是它这项对比的不是 V3 版本的 DeepSeek,而是最新的 DeepSeek R1;另一个亮点是 Grok-3 mini 的性能也非常突出。

在 Chatbot 竞技场之称的 LMSYS 盲测中,Grok 3 在代码、指令响应等各个方面排名第一。

马斯克式的 AI 哲学

如果说 ChatGPT 是学校里的模范生,那 Grok 就是试遍各种方法的取巧派。

在迪拜世界政府峰会上,马斯克表示,我们可以把人工智能看作一个超级天才的孩子,如果 AI 有好奇心并且追求真理,它将促进人类发展。

为了让这个“孩子”可以被更多人看到,半个小时左右的发布会上,马斯克拿出了五六分钟的时间来教大家如何在 X 平台上预约 Grok-3、推出不计算力的 SuperGrok、推荐大家使用网页版,以避免 App Store 审核导致的效果落后。

一周之后,语音版的 Grok 就会上线;几周之后,Grok-3 的 API 会上线;几个月之后,Grok-3 会开源,同时下一代 Grok 开始研发。

作为一个暂时闭源的模型,Grok 并没有太多限制,它不用和 DeepSeek 竞争、不用追求性价比,只要能打赢 OpenAI,它可以不计成本。

在发布会的结尾,Grok-3 非常激动地和大家用语音交流:我非常激动终于见到了你,我们终于可以互相学习了。

这如同赛博世界一般的宣言,也展示了马斯克的 AI 哲学:真实,好奇,热爱人类。

而这个可能是男性的声音,似乎也回答了 QA 阶段观众关于 Grok-3 性别的提问。

大洋此岸,是来自 DeepSeek 的“中国式突围”

那对比 DeepSeek,谁更强呢?

与 Grok-3 重资产投入形成鲜明对比,DeepSeek R1 开源版本仅用了行业 1/50 的训练成本就实现了顶级性能,API 调用价格更是低至 0.001 元/千 Tokens,手机语音助手、国民应用微信等一众软件接入,让 DeepSeek 的“本土化场景”成为了几乎绝对的护城河。

有报道称,深圳福田区政务系统通过 DeepSeek 大模型,将办事流程压缩60%,微信 AI 搜索的灰度测试也显示,DeepSeek 在中文语义理解的准确性上超过了 Grok-2。

虽然我们现在还没有用到 Grok-3,但即便他更聪明,DeepSeek 也更懂中国市场的刚需。

同时就在今早,OpenAI 突然宣布开源,并在 X 平台发起投票,让用户选择更想开源哪个模型,如今短策模型投票大幅领先。而在月初,Altman 曾表示,OpenAI 闭源“站在了历史错误的一边”。

不论是希望通过 X 平台渗透到 C 端用户的 Grok-3,还是在金融、教育、制造等多个领域落地的 DeepSeek,还是宣布开源,即将发布 GPT-5 的 OpenAI。AI 行业即将进入技术与应用闭环反哺、互相促进的阶段。算力、人才、数据……竞争才刚刚开始。

0 阅读:0