前两天,马斯克旗下的AI公司xAI,发布了其最新的AI大模型,也就是Grok3,以发布会上,马斯克称其是全球最聪明的AI。
而从各种测试对比来看,Grok3,也确实很厉害,比OpenAI、Deepseek的得分更高。
而Grok3,马斯克是主打一个大力出奇迹,那就是堆了20万张H100显卡,堪称是全球算力最强的大模型。
马斯克的Grok3推出,似乎也证明了,规模定律(Scaling Law)仍然有效,堆算力依然是AI大模型的必由之路。
不过,让马斯克尴尬的事出现了,堆了20万显卡的Grok3,仅1天,Deepseek就又搞出新东西了,那就是NSA。
DeepSeek在社交平台X上发布了一篇关于NSA的纯技术论文报告。
按照Deepseek的说法,NSA是一种与硬件高度适配并可原生训练的稀疏注意力机制,实现超高速长上下文训练与推理。
NSA和DeepSeek的一惯风格相似,那就是低成本高效,通过对现代硬件的优化设计,NSA可以降低预训练的成本,且不牺牲性能,且NSA的表现可可媲美甚至超越全注意力模型。
也就是说,完全不需要像Grok3这样,堆20万张显卡,NSA依然可以采用低成本的方式,实现对其它AI模型的超越。
可见,目前在AI上,Deepseek主打一个四两拨千斤,而Grok、Openai们,则主打大力出奇迹,努力的堆显卡。
本来美国那边的AI公司认为,限制中国的AI卡,不让你们获得先进的AI芯片,那么就肯定打不过我们的AI模型,不曾想,中国的AI模型,不需要堆显卡,也能实现更强的性能,更好的体验,这就真的让美国的这些企业们懵圈了,更重要的是,这也打破了美国的所谓算力垄断,整个AI芯片格局,都可能重构。
DeepSeek全部拷贝chatGPT训练好了的数据,自己成本低,几乎不花钱,强在这里了[大笑]
有人测试了Grok 3,从跑分看,他仅比DeepSeek领先两个百分点,性价比极㡳,只有马斯克有钱投,换个人就不一定了,所以他这条路无法推广
这就是强盗逻辑思维的劣根性。
开源的DS迭代速度,是资本洗钱AI的N倍!
就好比两个学生一个靠刷题。一个靠归纳总结,举一反三。用功程度完全不同,但成绩不相上下。
按照马斯克堆20万块H100弄出Grok3这阵仗,以后AI只能是美国等富裕国家玩了。但曲高和寡。而条条大路通罗马,达到同样的效果,开源成本又低廉DeepSeek也能从容应对,因而将成为许多国家的香饽饽,前途无量啊!
给Deepseek以所需全部100%算力时,AⅠ的功能是否也成百上干倍的增加了,而且是自我学习性的增加,那意味着DeePSeek随时可以算力升级?
如果用同样性能的高阶芯片,deep seek肯定还是吊打其他大模型
一个二十万片一个三百片。算法能一样吗?
小学奥数再厉害也干不过微积分[呲牙笑]
先优化大模型算法,紧跟第一梯队,不堆算力也不会落后太多,同步进行适配大模型算法的芯片设计,以咱家的工业生产能力和电力设施,堆叠算力是小儿科
为什么筚路蓝缕的正义之师能打败衣冠楚楚的强盗?
200000和2048块芯片,而且,一个是英伟达芯片,一个是华为昇腾901b芯片,当然说明梁伟峰deepseek世界领先。
马斯克用20万显卡来跑deepseek,不是稳赢?
不懂但我也不问,我从来不会不懂装懂![得瑟]
盼望谁能解决交通信号灯的智能化。
那咱们用100万块显卡训练,不就拼显卡谁家多
路遥知马力事久见人心,早就了解马斯克是什么样的人了,吹牛、诈骗最赚钱,位高权重更有一群舔客免费炒作,如“火星移民”