自从上周末DeepSeek火爆出圈后,本轮人工智能革命的最大受益者英伟达的股价便开始上蹿下跳,在本周的五个交易日里英伟达跌了三天,股价从上周末的142.62美元/股一路跌至本周五收盘后的120.07美元/股,下跌15.8%,市值蒸发5522亿美元,约合4万亿元人民币。
很多人可能对4万亿元没有什么概念。这么说吧,国内最大的“出险”房企恒大加上碧桂园的总负债为3.53万亿元,比英伟达一周蒸发的市值还少5000亿元。
中文互联网上关于DeepSeek带崩英伟达股价的说法越来越浓烈。与此同时,根据英伟达官网信息显示,DeepSeek发布的R1模型已上英伟达的NIM平台,而且是在显著的首页位置。
于是,很多人便认为英伟达是认怂了,属于打也打不过、骂也骂不过,只能选择加入、抱DeepSeek的大腿。
这种自嗨式的论断其实是很愚蠢的,连最基本的逻辑都没有,在我看来唯一的作用是捧杀DeepSeek,让这颗AI界冉冉升起的新星陷入被猛烈围攻的境地。
实际上,把DeepSeek发布的模型加入英伟达的NIM平台水到渠成的事情。
第一,英伟达没有诋毁过DeepSeek,而是称赞其是一个好模型。
DeepSeek火爆后引发了诸多欧美国家和企业的“破防”,美国部分官员用“偷窃”描述DeepSeek的成果、军方不让用DeepSeek;意大利等国家强制将DeepSeek从应用商店下架;微软和OpenAI发起对DeepSeek侵犯知识产权的调查。
不过,英伟达可从来没有质疑过抄袭或蒸馏其它成熟大模型的数据。相反,第一时间称赞DeepSeek是出色的AI进步。同时,聪明的英伟达借此给自己打了一波广告,意思是DeepSeek的成功会给英伟达带来更多订单。
第二,英伟达NIM平台上的大模型很多。
我估计大部分人根本没有登录过NIM平台的网站,但凡自己亲手上去看一下就会发现这个平台上的大模型数量繁多,大家所听到过的有点名气的大模型都在这个平台上发布,还有不少不为普通人知晓的行业大模型,如专门用于开发生物医药的模型也在平台上。
现在的DeepSeek,而且确实有技术创新和独到之处,如果不上NIM平台反而是一件奇怪的事情。
第三,DeepSeek早期囤积了大量英伟达算力芯片。
一些外媒将DeepSeek称为“不知名中国公司”,这种描述显然是有问题的。DeepSeek背后是大名鼎鼎的幻方量化,我相信炒股的朋友一定听过这家公司的大名,作为国内最有名的量化对冲基金,可是让散户们恨得牙痒痒的。
DeepSeek创始人梁文锋同时也是幻方量化的三大股东之一,早就开始用GPU芯片训练量化交易模型了。
几年前的一篇学术论文显示,幻方量化很早就囤了英伟达的GPU芯片,储备量不比当时的国内一线互联网公司少,具体用了多少块显卡来训练大模型众说纷纭,但至少是几千块的数量级。
从某种角度来说没有英伟达的芯片,DeepSeek能取得现在的成就离不开英伟达的芯片,未来DeepSeek想要取得更大突破还需要更多先进的算力芯片用于训练大模型。
DeepSeek探索出的训练路径,能够少用一些芯片、降低训练成本,不是不需要GPU了。
说白了,英伟达的平台上线DeepSeek的模型是商业领域的强强联手、互取所需,与“打不过就加入”完全没有关系。
如果一定要得出谁更依赖谁的话,那也是DeepSeek更希望与英伟达建立长期、稳定的合作关系,毕竟开源模型的“缺点”之一是大家都能模仿,算法不存在唯一性,而英伟达的GPU芯片在业内根本没有平替产品。
事情的逻辑并不复杂,希望大家能够理性看待,而不是为DeepSeek处处树敌。DeepSeek依靠开源实现创造性成果,真怕被部分“赢麻党”逼成闭源,从而丧失再进一步的机会。
以上纯属个人观点,欢迎关注、点赞,您的支持是对原创最好的鼓励!