“东方神秘力量”DeepSeek新年冲击波,英伟达也顶不住了?

穿透 2025-01-28 08:41:21

“DeepSeek暴击美股”“ChatGPT回应被DeepSeek超越”“ DeepSeek创始人来自广东湛江”……

2025新年前夕,满屏都是DeepSeek,而2023新年前后,刷屏的主角是ChatGPT。如今回想起来,似乎有种冥冥之中的定数。ChatGPT开启了生成式人工智能时代,而DeepSeek则成为时代迷雾中,再次开启“潘多拉魔盒”的主角。

DeepSeek带来的暴击无数,最新的暴击直指美科技股。

看看美科技股的最新股价吧!北京时间1月27日晚间,英伟达美股盘前一度大跌超12%,台积电跌超10%,阿斯麦跌超8%。它们都是美资本市场的当红炸子鸡,可却在走出多数暴涨曲线之后的今天,出现暴跌。

类似于ChatGPT横空出世之时,其在国内外获取的盛赞,此次刷屏的DeepSeek则获得海内外的花式赞美,以及用户疯狂下载。

DeepSeek被海外称之为“东方神秘力量”“本年度开源大语言模型领域的最大黑马”。

英伟达等一众美科技股暴跌同天,DeepSeek应用跃居苹果美国地区应用商店免费APP下载排行榜第一位,单就美区下载榜,其已超越ChatGPT。同天的苹果中国区应用商店免费榜之上,DeepSeek同样跃居第一位。

看看引发硅谷震动的DeepSeek,到底有何能量吧!

如今的生成式人工智能领域,正处于卷算力与商业化悖论之中。这种看不到头的AI军备竞赛,让人感到绝望与迷茫。似乎只有AI巨头们才玩得起这个重投入、高成本、低收益的高风险游戏。

过去的一年,国外比如OpenAI、Meta、Google、xAI等巨头,它们都在疯狂囤积高算力AI芯片,以打造万卡(GPU)集群作为目标。国内比如字节跳动、腾讯、阿里、百度等巨头,也纷纷跟进。

在AI商业化迷雾时期,在中小创业公司纷纷无望退却之际,DeepSeek却横空出世。

DeepSeek迅速火遍全球背后的逻辑,被Scale AI创始人亚历山大·王(Alexander Wang)发文一语点出,“DeepSeek-V3展示给外界苦涩的教训是:就在美国休息时,中国在工作,并以更便宜、更快、更强的产品迎头赶上。”

“更便宜、更快、更强”这三个常规逻辑相悖逆的词语,恰恰在DeepSeek身上集齐了。

2023年7月,幻方量化宣布成立大模型公司DeepSeek,至今才一年半左右。

2024年5月,DeepSeek发布混合专家语言模型DeepSeek-V2,当时该模型引发国内大厂纷纷跟进大降价。但真正让海外称之为“东方神秘力量”的是,其同年12月发布的DeepSeek-V3。

DeepSeek-V3的问世,不仅多项评测成绩碾压了Qwen2.5-72B和Llama-3.1-405B等同类开源模型。更令人震惊的是,其与OpenAI的闭源模型GPT-4o相比也毫不逊色。有些性能比如数学、代码能力和中文知识问答上,甚至超越了后者。要知道,GPT-4o是OpenAI于2024年5月发布的旗舰大模型,甚至被称之为世界上最强大的模型。

单单性能可以追平世界顶尖闭源模型,DeepSeek并不足以火遍全球,也不足以引发海外AI界的恐慌。因为以往逻辑是:高算力几乎决定了大模型的先进与否,而高算力则是高资金投入的产物,再往前推则可窥探到,美国之所以限制我国购买高算力AI芯片的原因。然而,这套逻辑被DeepSeek击碎了。这才是海外媒体花式盛赞、硅谷同行纷纷震惊的根本原因。

DeepSeek不愧为AI界的性价比之王。DeepSeek-V3的全部训练成本总计仅为557.6万美元,不到GPT-4o训练成本的二十分之一。

近期DeepSeek发布了DeepSeek-R1大模型,其称,在数学、代码、自然语言推理等方面,性能可与OpenAI o1正式版相媲美。

1月24日,DeepSeek-R1基准测试,在国外大模型排名Arena上升至全类别大模型第三,单以风格控制类模型(StyleCtrl)分类排名,其与OpenAI o1并列第一。竞技场得分上,DeepSeek-R1甚至略超OpenAI o1。

同天,Meta AI首席科学家Yann LeCun对此称,人们惊呼中国AI正在赶超美国,这种解读有误。更准确的结论是:开源模型正在超越闭源系统。

“DeepSeek的成功得益于开放生态,其创新基于前人成果的持续迭代。”Yann LeCun说。

DeepSeek-R1不仅是开源模型,还可免费供全球用户无限调用。这可以吸引全球技术人才加入进来,对模型进行共创和改进。

虽然DeepSeek正式宣布进军生成式人工智能,仅一年半左右,但其涉足AI并用其进行应用落地,已经很长时间。

幻方量化(杭州幻方科技有限公司)是2015年由梁文峰创立。第二年,公司就推出第一个AI模型,并且落地应用到投资交易上。第三年,公司宣称实现投资策略全面AI化。到2021年,公司资产管理规模突破千亿大关。

2023年7月,DeepSeek(深度求索)成立,两个月前有消息称,国内拥有超一万枚GPU的企业不超过5家,而DeepSeek在列。

DeepSeek创始人梁文峰,1985年出生于广东湛江市,2002年,他考入浙江大学电子信息工程专业,相继获得本科、硕士学位。

DeepSeek近日刷屏的同时,梁文锋将回湛江老家过年的消息,也被强烈关注。

0 阅读:8

穿透

简介:思考不能停,穿透现象,直达本质!