开年以来,科技圈、IT界最火的话题莫过于DeepSeek了。但凡你不懂点这玩意儿,你都不好意思和人聊天。
和其他热门的事件一样,外行基本也就看个热闹,顶多聊聊DeepSeek如何如何好用,某个回答多么有趣等等。真的多追问几句“DeepSeek到底牛在哪?”“今后将带来哪些方面的影响?”,又没几个人讲得清楚。
今天我们就来聊聊这个。
首先,DeepSeek的牛是货真价实的,是全球科技界都认可的,绝非有些人所说只是国人在自嗨。
DeepSeek-R1版本发布后,图灵奖获得者杨立坤、OpenAI CEO山姆*奥特曼以及马斯克等科技、商界大拿都对DeepSeek给出了很高的积极评价。这足以证明DeepSeek并非浪得虚名。因DeepSeek-R1推出导致的股票市场巨大波动更是直观的体现了这一点。
DeepSeek的牛主要体现在三个方面:一是它采用了独特的“MoE(混合专家模型)+MLA(多头潜在注意力)”架构, 技术上有开创性的创新;二是基于模型架构方面的创新,DeepSeek的训练成本大概只有同类模型的十分之一,成本极低;三是和其他业界主流大模型不同,DeepSeek采用了开源策略,这使得其他厂商和大模型可以检验、借鉴DeepSeek的优秀架构和高效的训练模式,极大的促进了大模型开发和训练方面的创新。
知道以上三点,DeepSeek得以大火和备受关注也就不奇怪了。
但事情远不止于此,因为游戏科学的创始人冯骥公开发言称DeepSeek是国运级别的创新。
去年,《黑神话悟空》的大火让冯骥跻身游戏行业一线大佬。游戏自古与IT紧密相关,冯骥在业内打拼多年,他对DeepSeek有如此高的评价肯定不是随口说说的玩笑。
国运级别的创新?DeepSeek何以有如此能耐和影响?
要理解这一点,我们可以回顾互联网的发展历程,从中“管窥一豹”。
1946年2月,世界上第一台计算机“ENIAC”在美国宾夕法尼亚大学诞生。ENIAC是个庞然大物,它占地170平米,重达30顿,原本是美国国防部设计用来进行弹道计算的。
ENIAC之后,由于计算功能在各个行业的普遍需求以及晶体管工艺的不断精进,计算机的体积一再小型化。
计算机诞生后的近30年,由于设计和制造费用昂贵,体积也一直比较大,基本只有各类企业单位有财力、物力购买和使用计算机。
但科技的不断进步和市场需求的持续扩大一直在推动着计算机的发展。
1975年,苹果电脑公司推出了一款名为AppleⅠPC的个人电脑,相对低廉的价格和小巧的机身使得计算机进入千家万户成为可能。随之而来的是越来越多的个人和家庭购买计算机,用于日常办公和娱乐。
海量计算机存在之后,计算机之间互联互通的需求也就愈发迫切,互联网由此诞生。
互联网的出现极大的便利了人与人的交流、信息的传递,随之也带来了整个社会甚至全球生产力的极大提升。
这是互联网发展第一阶段的简要历史。
至此,普通人只要买一台PC机再连上网或者去趟网吧就能享用各种丰富的互联网服务。
但互联网的发展并止步。1994年,IBM推出了一款名为Simon的触摸屏手持电话设备,开启了智能手机时代。
2007年1月,美国苹果公司推出了第一台iPhone手机,智能手机时代全面到来。
如果说PC的大量应用导致了互联网诞生并推动了互联网第一阶段的发展,那么智能手机则是真正将互联网普及到了几乎每一个普通人。
PC互联网时代,想上网要么去买台电脑,要么去网吧,一个成本高,另一个不方便。智能手机的出现和普及完美地解决了这个问题---只要一个几百块钱的手机,随时随地都能上网!智能手机带来的,就是我们现在熟悉的移动互联网。
如上所述,简单理解互联网的发展史就可以分为PC互联网时代和移动互联网时代两个阶段。这两个阶段得以出现和发生,前提和基础就在于PC和智能手机的出现和普及。而它们的普及都离不开两点,一是成本低很多人都买得起、能大范围普及,二是使用门槛低、简单易上手。
AI发展史上的DeepSeek就有如互联网发展史上的PC、智能手机!
DeepSeek不但性能出色,还把大模型的训练成本降低了90%以上,而且它不过度依赖大量的硬件资源、使用方便,中小企业甚至个人都能访问乃至独立部署使用。
回看互联网发展史上PC和智能手机的出现带来的影响就知道DeepSeek的出现意味着什么了。
PC的出现和普及促成了互联网的诞生,随后发生的是从芯片、显卡、组装机等硬件到操作系统、数据库、专业软件,出现了英特尔、IBM、惠普、微软、甲骨文、Autodesk等一众高科技企业,直接把美国推上了IT产业的巅峰,引领了整整一个时代。
智能手机的出现也类似,iPhone推出后,18年后的今天苹果公司依旧是目前市值最高的企业之一。智能手机的出现和普及还带起了高通、三星、联发科、谷歌等一众高科公司的发展,美国依然在这个阶段引领全球。
与PC互联网时代不同的是,由于奋力追赶,在移动互联网时代我们总算分到一杯羹,在智能手机制造、通信制式发展等方面基本赶了上来。
以往鉴今,AI时代的发展逻辑大概率会和互联网时代类似。我们和美国都在力争AI发展的“瓦特时刻(瓦特把蒸汽机改良之后,实现了一个稳定的动力输出,蒸汽机得以进入各个行业。)”出现在自己的一方。
如今,DeepSeek的出现大概率就是AI发展的“瓦特时刻”。DeepSeek使得AI的全面推广和普及变为可能,AI行业的发展也可能因之全面加速。
接下来,我们要做的就是再接再厉,在大模型领域进一步推出更先进、低成本的推理模型,保持该领域的优势,然后持续、快速将相关技术、应用落地推广。随后再根据市场和应用需求研发适配DeepSeek新版本模型的先进国产芯片及相关硬件,带动整个AI行业、产业链的发展,抓住发展契机,引领AI时代的发展。
到那时,我们也就全面打破了美国在AI、芯片等方面的科技封锁,也大概率能实现经济和国力的全面登顶了。
明白了这些,你就不会觉得说“DeepSeek是国运级别的创新”是夸大其词了。