在科技日新月异的今天,中国公司DeepSeek所开发的大模型无疑在全球人工智能领域投下了一颗震撼弹。其表现之强劲,足以与ChatGPT初登舞台时的辉煌相提并论。如果说ChatGPT的横空出世将人工智能推向了一个全新的高度,那么DeepSeek的出现,则如同在人工智能的广袤天地中开辟出了一条迥异的新路径,尤为引人注目的是,这是一条中小企业也能涉足并有望走通的路。
然而,市场上某些过于激进的言论,如声称DeepSeek将使美国科技股崩盘,甚至断言GPU芯片和算力的重要性将大打折扣显然有失偏颇,近乎无稽之谈。
以英伟达为例,这家在全球GPU市场占据举足轻重地位的巨头,在1月28日经历了一场股价暴跌的风暴,跌幅高达17%。对此,我及时在微头条上发表了反驳意见,指出这种低认知观点的不合理性。
事实胜于雄辩,美国当地时间1月28日上午英伟达股票开盘即高开2%以上,尽管盘中有所波动,但在开盘后的两个小时内开始发力上扬,最终几乎以全天最高价128.99美元/股收盘,涨幅高达8.9%。
这一表现无疑是对那些过度悲观论调的有力回击。前一交易日,英伟达市值蒸发了超过4万亿元人民币,而第二个交易日便迅速“回血”1.9万亿元人民币,市场信心的修复可见一斑。
当然,我们并不能因此就断定英伟达的股价将重拾升势。毕竟,这家公司在过去两年内市值翻了8倍以上,累积了大量的涨幅,随时可能面临调整的压力。这主要与金融市场的多空博弈密切相关。
DeepSeek的崛起,对于英伟达而言或许可以被视为空头手中的一个重磅“武器”,成为其股价调整的一个契机。但不可否认的是,这并不会改变AI公司对先进算力芯片的长期需求趋势。
之所以这么说,是因为有一个与DeepSeek紧密相关的事实被许多人忽视或不愿接受,那就是DeepSeek在训练大模型时依赖的正是英伟达的GPU。
DeepSeek脱胎于幻方量化这家在量化投资领域声名显赫的公司。对于炒股的朋友来说,幻方量化的名字可谓如雷贯耳,甚至在一些散户心中留下了复杂的情感印记。不乏有极端股民呼吁禁止幻方量化这样的私募量化基金公司投资A股。
作为顶级量化对冲基金,幻方量化在几年前便已经开始积极布局算力芯片,以支撑其量化交易模型的训练。
早在2021年,DeepSeek创始人梁文锋参与的论文中就曾提及,他们当时已经配备了1万张A100 GPU芯片。要知道在当时国内拥有1万块以上GPU的企业不超过5家,除了幻方量化外,其余均为互联网大厂。
因此,我们可以清晰地看到,DeepSeek训练大模型的基础正是建立在英伟达算力芯片之上的。未来,如果想要让大模型更加强大,DeepSeek依然需要想方设法绕过美国政府设置的障碍,以获得最新的GPU。
作为英伟达的重要客户和直接受益者,DeepSeek想要凭借一己之力将英伟达干趴下的逻辑显然是不成立的。
英伟达在首次股价大跌后的回应中也明确指出:“DeepSeek的研究展示了如何运用该技术,借助广泛可用的模型以及完全符合出口管制规定的算力来创建新模型。推理过程需要大量英伟达GPU和高性能网络。”
这一回应并非英伟达的自吹自擂,而是基于事实的客观陈述。DeepSeek想要取得更大的进展,离不开大量高性能GPU的支持。而在当今世界,能够生产最先进人工智能算力芯片的企业寥寥无几,英伟达无疑是其中的佼佼者,即便是另一家美国芯片巨头AMD也无法做到完全平替。
因此,我认为算力依然是未来人工智能竞争的最重要方向之一。
能够掌握足够的算力基础设施便能在人工智能赛道上脱颖而出、保持优势。算力芯片的研发和生产考验的是半导体产业的综合能力。我国近年来虽然在半导体行业取得了长足的进步,但与以美国为首的西方产业链相比,仍然存在一定的差距。
我们绝不能因为某个大模型的亮眼表现而转换思路、减少对半导体行业的投入。相反,我们应该进一步加大资源倾斜力度,争取在境内尽早诞生类似英伟达、ASML这样的半导体巨头。只有这样,我们才能在全球人工智能的竞争中立于不败之地。
当然,DeepSeek的横空出世显示了中国AI领域取得的突破性进展,这种1-10的创新同样是重要的创新。