就在昨天,按照“惯例”延迟20分钟后,马斯克才正式登场并推出了预热许久的xAI最新旗舰大模型Grok-3!
直播主题为“我们的使命是理解整个宇宙”,马斯克还表示Grok-3为“地球最聪明的AI”,并直言其性能比前代Grok-2提升10倍。
Grok-3训练动用了位于孟菲斯的超级数据中心,共计20万块GPU集群,仅用时122天建成!
图片来源:哔哩哔哩 @产品君(下同)
工程师团队还透露,Grok-3是一个系列模型家族,包含轻量版Grok-3 mini(牺牲部分精度以提升速度)。
Grok-3在多项测试中刷新纪录,直接开启不服跑个分模式:
数学(AIME’24):96分,超DeepSeek-R1(87分)、GPT-4o;
科学(GPQA):研究生级知识问答断层领先;
编程(LCB):生成复杂代码效率碾压Claude 3.5、Gemini 2.0268。
同时以1402分登顶Chatbot Arena历史榜单,成为首个突破1400分的模型,超越OpenAI、谷歌、Anthropic等巨头。
图片来源:哔哩哔哩 @环球新知
在AIME2025测试中,Grok-3 Reasoning Beta和Grok-3 mini Reasonin同样以90+的成绩击败了其他竞品。
还现场生成《俄罗斯方块×宝石迷阵》混合游戏的完整代码,并渲染3D动效;挑战黎曼猜想等未解难题,展示完整思考链。
还有DeepSearch模式:联网深度分析数据,提供研究、头脑风暴、代码调试一体化方案。
独创“思维链”机制,支持测试时计算(Test-Time Compute),开启“Big Brain”模式后,问题解决深度提升263%!
不过,“地表最聪明的AI”自然是不能让你随便用的。
X Premium+用户:即日可优先解锁Grok-3完整功能,SuperGrok订阅:30美元/月,无限图像生成+深度搜索配额。
图片来源:X @Elon Musk
外网有网友提问“赚一百万美元最快的方法”,然后Grok-3告诉他去买一张彩票。
最后马斯克承诺Grok-3稳定版发布后,将开源Grok-2模型25。并在结尾放话:“xAI的创新速度将彻底改写AI竞争格局!”。
反正外面的格局是——DeepSeek开源,ChatGPT“下海”。Grok-3能掀起多大的水花,咱们拭目以待!