这家中国AI公司,吓坏了ChatGPT

水蜜桃洞见 2025-01-05 09:48:53

最近一段时间,一家名为“DeepSeek”的中国AI公司,频繁被硅谷的技术大佬提起,讨论之热烈,甚至引来了美国最大的财经频道CNBC的关注。

CNBC的女主持人在试用过DeepSeek推出的语言大模型后,称赞这款产品的回答“几乎与ChatGPT-4一样完美”。

其实,某家中国公司能复制出与美国差不多的产品,并不稀奇,硅谷的创新企业早已习惯了中国人的“跟随战略”。

但DeepSeek与众不同,它让硅谷感到了一股来自东方的神秘力量。

CNBC的女主持人将DeepSeek的“神秘”归纳为三点:

第一,开发成本极低。这家中国公司仅用了550万美元就训练出了美国公司要用5亿美元训练的模型。

油管上一位AI博主,统计了硅谷企业训练大模型的成本后,得出结论:DeepSeek仅用了2.8%的资金,就开发出媲美甚至超越ChatGPT-4的模型。

这意味着,中国企业,再次在AI领域取得了巨大的成本优势。

他表示自己免费使用了DeepSeek几天后,已经找不到继续每个月花20美元订阅ChatGPT的理由,完美平替。

第二,完全开源。CNBC的女主持人略带嘲讽地表示:虽然OpenAI名字里有“Open(开放)”一词,但美国主流的AI公司全是闭源的,一点不“Open”。

反倒是中国的DeepSeek完全开源——任何AI爱好者在全球任意的地点,都可以调用DeepSeek的底层代码。

正如苹果与安卓系统的竞争,闭源的苹果或许能带来更高的安全性,但开源的安卓应用更广泛,占领了全球80%的手机市场。DeepSeek似乎想用开源的方式,复制安卓的成功。

第三,最令美国人尴尬的是,DeepSeek在训练时使用的GPU是“阉割版”的英伟达H800,其性能不如美国公司使用的H100。

要知道,美国原本寄希望于禁止中国公司购买先进GPU的方式,来限制中国AI的发展。DeepSeek的横空出世,无疑让美国的制裁,看上去有点可笑了。

看到这里,很多粉丝一定好奇,DeepSeek究竟是一家什么样的公司,为何之前都没听说过???

这还真不能怪我们,因为DeepSeek成立时间太短了,距离现在仅15个月而已,成立于2023年的9月。

再者,与阿里、腾讯、百度这样动辄几万人的大厂相比,DeepSeek小的“可怜”,初创时只有50人,现在也就200来人,是一家既新又小的公司,所以之前没听过很正常。

小归小,但DeepSeek的创始人梁文锋在投资圈非常有名,这位出生于广东小县城的大佬,早年经历不详,只知道父亲是一名小学教师,家庭教育不错。

2008年左右,从浙江大学毕业后,虽然学的是人工智能专业,但梁文锋几经考虑后,还是决定“先富起来”,做起了金融,主攻对冲基金。

2015年,赚了不少钱的梁文锋回归初心,成立了一只投资AI的量化基金:幻方量化。

得益于金融、AI“双修”的背景,幻方量化仅运营了5年,管理的基金规模便突破了1000亿。

普通人遇到这种情况,嘴早笑歪了,可梁文锋看到的却是风险,近两年他着手降低基金的规模,控制在了两三百亿的范围。

2023年,梁文锋在北大附近的一座办公楼中成立了DeepSeek。起初团队只有50人,而且清一色的是没有留学背景的“土鳖”,纯中国本土大学教育培养出的团队。

这或许与梁文锋自己没有留学的经历有关,他曾说:中国的大厂,喜欢去美国挖AI人才,需要耗费大量的精力与成本不说,效果还不一定有本土团队好。

事实证明,外来的和尚,不一定会念经。

以让DeepSeek声名大噪的MLA架构为例,就是由团队中一位非常年轻的本土员工提出的。

这个架构的神奇之处在于大大降低了GPU显存的使用率,等于变相提高了算力,降低了训练成本。OpenAI的联合创始人看了MLA架构的论文后惊呼:这是今年AI行业最好的架构!

该架构的灵感来自一场讨论会,在研究完市面主流架构后,一位年轻的员工提出了一个全新的角度理解架构问题,大家听后都觉得有道理,便在CTO的组织下,进行可行性研究,没想到挖到个宝,真跑通了。

而“洋和尚”往往是硅谷次一级的人才,让他们搭建个主流架构,一点问题没有,干得又快又好,但说到创新,不好意思,硅谷公司聘他们的时候,就是来干苦活、累活的,创新是公司核心层的事儿。那些核心人才,国内的大厂别说挖,接触都接触不到的。

梁文锋还纠正了一个国内AI界流行的说法——中国的AI技术只比美国落后一到两年,好像加把劲就能追上。

但现实是,中国AI与美国的根本差距在创新上,每次都是美国人先搞出个什么东西,中国立刻跟进,仿个差不多的。这么搞永远有一到两年的差距,不可能追上。

梁文锋惋惜地表示,似乎大部分中国科技公司也习惯了这种模式,感觉追赶是理所当然的事情,领先反倒不正常了。

而DeepSeek在这波AI浪潮中,初心就不是捞一笔就跑,而是要走到技术的最前沿,去推动整个生态的发展。

考虑到DeepSeek是一家刚成立15个月的公司,我觉得梁文锋并非在“画饼”,是有可能实现的,毕竟他们已迈出了突破性的一步。

如果把DeepSeek放在更大宏达的产业转型中去分析,会发现过去中国人赚钱,大都靠运气和关系,导致中低端红利被吃干净了,未来再想发大财,更依赖技术与创新,创业的门槛正变得越来越高,想要不被时代淘汰,我们要时刻处于学习与进步之中,否则下一个被AI淘汰的就是我们自己。

作者:9527

0 阅读:0

水蜜桃洞见

简介:感谢大家的关注