1月27日,一款名为Deepseek的应用在苹果中国地区与美国地区的应用商店免费APP下载排行榜上大放异彩,成功登顶,并在美国地区的应用商店下载榜上超越了备受瞩目的ChatGPT,这一成就无疑为国产大模型公司深度求索及其背后的量化巨头幻方量化赢得了广泛的关注与赞誉。

Deepseek,这款源自深度求索公司的创新之作,是幻方量化旗下大模型公司的杰出代表。就在不久前的1月20日,深度求索公司正式推出了其推理大模型DeepSeek-R1。
这款模型一经问世,便凭借其出色的性能和亲民的价格,在海外开发者社区中掀起了轩然大波。
DeepSeek-R1不仅在数学、代码、自然语言推理等任务上展现出了与OpenAI GPT-4o模型正式版相媲美的实力,更以MIT许可协议开源,支持免费商用、任意修改和衍生开发,这无疑为开发者们提供了极大的便利和自由度。
在国外大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名迅速攀升,目前已跻身全类别大模型第三的宝座,与OpenAI的ChatGPT-4o最新版并列。

更值得一提的是,在风格控制类模型(StyleCtrl)分类中,DeepSeek-R1更是与OpenAI的GPT-4o模型并列第一,这一成就无疑是对其卓越性能的最好证明。
然而,DeepSeek-R1的惊艳之处远不止于此。据DeepSeek公司介绍,这款模型的预训练费用仅为557.6万美元,相较于OpenAI GPT-4o模型高昂的训练成本,这一数字无疑显得极为亲民。
DeepSeek-R1在2048块英伟达H800 GPU(针对中国市场的低配版GPU)集群上运行了55天便完成了预训练,其训练成本仅为GPT-4o模型的不到十分之一。

这一成就不仅彰显了DeepSeek公司在技术上的深厚底蕴,更体现了其在成本控制上的高超技巧。
DeepSeek-R1在后训练阶段大规模使用了强化学习技术,这一创新之举使得模型在仅有极少标注数据的情况下,依然能够极大提升推理能力。
这一技术的运用,不仅提高了模型的性能,更降低了对标注数据的依赖,为AI模型的发展开辟了新的道路。
此外,DeepSeek公司不仅将R1的训练技术全部公开,还蒸馏了6个小模型向社区开源,这一举措无疑将极大地推动AI技术的普及和发展。

英伟达高级研究科学家Jim Fan对DeepSeek-R1给予了高度评价,他认为这可能是“首个展示了RL(强化学习)飞轮可以发挥作用且能带来持续增长的OSS(开源软件)项目”。
其中,“飞轮”一词形象地描绘了AI系统中自我强化、正向循环的过程。DeepSeek的论文也进一步证实了这一点,论文显示,与过去依赖监督微调(SFT)的AI模型不同,R1完全由强化学习驱动,这一创新之举证明了直接强化学习的可行性。

Jim Fan在评价中感慨道:“我们正处于一个奇特的时间线上,一家非美国公司正在践行OpenAI最初的使命,即实现真正开放的前沿研究并让所有人受益。
这种情况简直无法理解,但却又充满了无限可能。而最有娱乐性的结果,往往也是可能性最大的结果。
DeepSeek-R1的崛起,无疑为AI技术的发展注入了新的活力,也为国产大模型公司赢得了更多的尊重和认可。
苹果美国区应用商店