1月27日,DeepSeek创始人梁文锋回应了DeepSeek火爆全球的现象。梁文锋认为,中国AI不可能永远处在跟随的位置,总会有人站到时代的前列。即使OpenAI闭源,也无法阻止别人的赶超,这是开源技术的胜利。只要DeepSeek继续把投入沉淀在技术创新上,中国AI将有无限可能。

DeepSeek爆火原因
• 技术创新与开源策略:DeepSeek的成功源于其在技术创新上的持续投入和开源策略。梁文锋坚信AI将改变世界,坚持将技术成果开源,以推动生态发展。这种非功利性的理念吸引了众多优秀年轻人才加入。
• 极致性价比:DeepSeek用远低于海外巨头的成本打造出比肩世界一流水平的大模型,并且做到了极大程度上的开源。例如,DeepSeek-V3的投入研发费用为558万美元,训练成本不到GPT-4o的1/20。
• 资金与硬件支持:DeepSeek的母公司幻方量化是中国头部量化对冲基金,曾管理资金规模超1000亿元。他们早在2021年便储备了超过1万块英伟达A100/H100 GPU集群,这为其提供了训练大模型所需的硬件基础。
• 团队实力:DeepSeek的团队成员在算法理念上做了一些优化,在强化学习、MOE架构、FP8精度等方面做了一些尝试。此外,DeepSeek-V2的关键开发者之一罗福莉被称为95后AI“天才少女”,她的加入也提升了团队的整体实力。
市场反应
• 应用商店登顶:1月27日,DeepSeek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。
• 服务器宕机:由于用户访问量激增,DeepSeek的服务曾出现短时闪崩现象。1月27日,DeepSeek官网显示,DeepSeek网页/API不可用。对此,DeepSeek回应称,问题在数分钟内就得到了解决。
• 行业震动:DeepSeek的爆火震动了全球AI科技圈,尤其是硅谷。有报道称,硅谷“被吓坏了”,工程师正在疯狂地分析DeepSeek。此外,DeepSeek还引发了科技股重估。
未来展望
梁文锋表示,DeepSeek将继续在技术创新上投入,推动AI技术的发展。同时,DeepSeek的成功也为中国AI的发展提供了新的思路和方向。