DeepSeek的研发团队凭实力告诉你,没有什么成本是中国省不下来的

木晚清 2025-02-06 14:14:36

给世界带来最大的冲击

当所有投资人以为开发AI大模型必须要烧很多钱的时候,**DeepSeek**的研发团队凭实力告诉大家,没有什么成本是中国省不下来的。从微软豪掷百亿美元给OpenAI,到小扎宣布600亿投入Meta人工智能的研究,还有最近特朗普的撺掇下,英特尔、AMD和甲骨文三巨头决定花5000亿打造的“星际之门”。人工智能在过去的两年里不仅成为了美国投资圈的专属话题,还成为了“昂贵”的代名词。而这一切却在中国蛇年到来之际被彻底打破。

DeepSeek的崛起

2025年1月20日,**DeepSeek-V21**模型正式发布,应用程序发布后短短18天,下载量就达到1600万次,登顶了140个国家的苹果App Store下载排行榜首位,几乎成了硅谷每个公司的主要话题。微软CEO萨提亚表示,**DeepSeek**将引领AI成本的创新。脸书创始人扎克伯格表示,**DeepSeek**是值得学习的对象。OpenAI的CEO奥特曼说,**DeepSeek**是让人期待的对手。

而让世界疯狂的真正原因就在于,**DeepSeek**的研发成本仅为OpenAI的1/20,性能却堪比第一梯队的模型。这到底是怎么回事呢?

背后的公司:焕方量化

这家公司叫**焕方量化**,是国内一家顶级的量化公司。最初,**DeepSeek**只是焕方的一个小副业。因为焕方其实一直都在尝试把AI应用于交易算法,所以在美国出口限制之前,就买了1万张英伟达A100顶级芯片。没想到这个人工智能副业越做越大,远超除了交易的目的。所以到2023年,焕方正式成立了自己的工作室,陆陆续续发布了很多模型。其中**DeepSeek-V3**堪比GPT-4,也就是目前最常用的一个模型。最近发布的**DeepSeek-V21**相当于GPT去年9月刚发布的GPT-4.5,虽然不是目前最顶级的,但也妥妥是很多人做了好多年都达不到的第一梯队。

省钱才是硬道理

当然,速度快不是最牛的地方,最厉害的还是在咱们传统的省钱层面。用大白话来说,就是把AI的价格打下来了。根据外界的统计,焕方目前拥有的GPU加起来一共差不多有5万张,其中只有1万张是顶级的芯片。而目前OpenAI一共有30万张GPU,扎克伯格的Meta更夸张,光是最顶级的H100就有60万张。在这样巨大的硬件差距之下,**DeepSeek**成功在两个月内训练出了性能堪比GPT-4的V3模型,而且训练成本仅有不到600万美元,不足当时OpenAI训练成本的1/20。这件事情才是让整个硅谷震惊到睡不着觉的。

硅谷的震动

AI界的“纪检委”马斯克更是发言称,他们不可能只有1万张顶级芯片,这个“火药味”隔着太平洋,硅谷都能闻到了。睡不着觉的不仅是科技大佬,还有华尔街的投资人。虽然这600万美金不能算是**DeepSeek**最后的总成本,但毋庸置疑的是,这样的性价比却是前所未见的。于是投资机构们开始纷纷讨论,既然训练模型可以这么便宜地做到,这些科技公司以前问我们要的钱是干嘛去了?而这一点才是直戳美国资本和科技权力的痛点。

美国科技股的泡沫

大家都知道,美国科技股被高估已经不是一天两天了。传统科技公司苹果创新能力日益下降,而三天两头就烧掉数百亿美金的新贵人工智能噱头不小,却迟迟不能落地变现。对科技股泡沫的担忧,让股神巴菲特疯狂甩手里的股份。对于英伟达暴涨,各界也存在很大的担忧。果不其然,就在**DeepSeek**走红之后,英伟达连续收跌。美国各界对科技和高端芯片出口的忧虑成为了现实。

**DeepSeek**对中国人工智能的影响

那么,**DeepSeek**的问世,又对中国人工智能的发展和我们的未来生活产生什么样的影响呢?首先还是预期问题。相信不只是硅谷,大家一定也存在一个疑问:在人工智能高速发展的今天,中国到底在这个新的牌局上有多少机会?如今的**DeepSeek**总算是给出了一份答卷。

复工的第一天,**DeepSeek**概念股全线涨停,而这只是冰山一角。大家应该都有体感,AI这东西虽然原理咱不懂,但好不好用还是大家说了算。为什么之前国民想尽办法也要给某些公司送训练数据,因为实在没有同等级的替代品。**DeepSeek**的出现直接弥补了这一空白,让我们在国门之内用上了世界领先水平的大语言模型。

其实我们深知,目前的**DeepSeek**并没有达到神话级别的存在。但只要这样的公司能出现一个,我们就有信心出现第二个、第三个。就像如今的华为一样,**DeepSeek**同样是突破性的存在,是美国最害怕发生的情况。因为一旦失去科技的绝对优势,那么任何制裁都将岌岌可危。

人工智能的未来

**DeepSeek**是一个好的开始,是预期的拯救者,也是我们生活方式改变的一个预兆。谈及规模化、产业化,纵观世界很难找出跟中国媲美的地方。一旦人工智能的技术壁垒得到突破,中国在人工智能落地应用的速度很可能超越美国。

为什么特朗普要三家公司去打造“星际之门”?其实目的就是为了让人工智能能落地变现。在美国,人工智能就像一个能力高超的灵魂,却找不到一个赖以生存的实体。毕竟如果需要产业化,就得完善基建问题,得集中力量办大事。而这也是资本主义国家的难题。这一点从OpenAI有所保留的开源和**DeepSeek**接近“裸奔”的开源也能看出来。

OpenAI在后期由于公开的模型内容很少,API费用高,被马斯克嘲讽为“CloseAI”,口口声声说宗旨是创建造福全人类的通用人工智能,干的却是闭门造车的事情。而**DeepSeek**一声不吭,直接将模型代码和权重完全开源,开发者可以自由使用和修改,商业使用也无限制,鼓励开发者共同创新。这样的背景下,中国人工智能的发展也会迎来更大的可能。

0 阅读:17

木晚清

简介:感谢大家的关注