20万张GPU!Grok-3斩获多个Top1,网友:DeepSeek的对手来了

楚楚科技世界 2025-03-28 09:23:02

科技界又迎来重磅消息。特斯拉CEO埃隆·马斯克旗下的人工智能公司xAI,正式推出第三代Grok系列模型。这款被马斯克称为"地球最聪明AI"的产品,不仅在数学、编程等核心领域全面超越谷歌、OpenAI等竞争对手,更以惊人的训练规模刷新行业认知。

━━━━━━━

■ 性能全面突破:数学博士题斩获75分

━━━━━━━

根据xAI公布的测试数据,Grok 3在多领域展现惊人实力:

• 数学解题能力:在美国数学协会认证的AIME测试中,以52分大幅领先第二名DeepSeek-V3的39分。面对新增的2025年博士级数学题,开启深度计算模式后得分更高。

• 科学素养测试:在涉及物理、化学、生物的GPQA博士级题库中,以75分创下新纪录。

• 编程实战能力:代码生成测试中,得分比同行高出近60%。现场演示中仅用30秒就生成了融合俄罗斯方块与宝石迷阵的完整游戏代码。

尤其值得关注的是,在国际权威的Chatbot Arena真人测评中,Grok 3成为首个突破1400分的AI模型。这意味着在真实对话场景中,它能提供更符合人类思维习惯的优质回答。

━━━━━━━

■ 黑科技加持:会"动脑"的AI怎么工作?

━━━━━━━

此次发布的Grok 3并非单一产品,而是一个智能家族:

基础版(Grok 3 mini):响应速度堪比真人对话,适合日常咨询深度思考版(Big Brain模式):遇到复杂问题时,自动调用额外算力进行多步骤推理学术增强版:专门攻克科研难题,可模拟卫星轨道计算等专业场景

更引人注目的是新加入的DeepSearch功能。这项技术能实时抓取社交媒体和学术数据库,像专业研究员般整理资料、生成综述。对比同类产品的信息检索功能,其答案的时效性和准确性提升明显。

━━━━━━━

■ 20万张显卡的豪赌:马斯克的"速度游戏"

━━━━━━━

支撑这款AI超强性能的,是xAI令人咋舌的硬件投入。团队在直播中透露:

• 用122天建成容纳10万张英伟达H100显卡的数据中心

• 随后92天完成容量翻倍,最终动用20万张顶级显卡训练模型

• 总计算量达到竞争对手DeepSeek V3的263倍

这种"基建狂魔"式的操作,让Grok 3相较前代产品性能提升超10倍。不过也有业内人士担忧,如此庞大的算力消耗可能带来巨额能源开支。

━━━━━━━

■ 行业震荡:AI大战进入白热化

━━━━━━━

Grok 3的横空出世,直接冲击现有市场格局:

→ OpenAI宣布将提前发布GPT-4.5应对竞争

→ 谷歌紧急召回休假中的Bard团队升级算法

→ 国内厂商DeepSeek承认"面临算力代差挑战"

值得玩味的是,马斯克团队延续了"开源自研"双线策略。在保持Grok 3核心代码私有的同时,宣布将于下月开源前代模型Grok 2。目前GitHub上已有数万开发者基于初代模型开发出医疗诊断、法律文书等垂直应用。

━━━━━━━

【延伸阅读】

• 命名玄机:"Grok"源自科幻经典《异乡异客》,寓意"透彻理解"

• 语音功能跳票:原定今日上线的语音交互推迟至下周

• 价值观争议:马斯克强调"追求真相优先于政治正确"

业内分析师认为,这场AI竞赛已演变为资源消耗战。当大多数公司还在纠结模型架构时,马斯克用简单粗暴的"堆硬件"策略撕开突破口。不过随着欧盟新规即将实施,这类超大规模模型的合规性将成为新战场。普通用户更关心的是:这些技术突破何时能转化为实实在在的生产力工具?或许答案就藏在xAI承诺的"周更计划"中。

0 阅读:1

楚楚科技世界

简介:感谢大家的关注