■DeepSeek的新一代模型R1引发全球关注
本月,DeepSeek在世界经济论坛2025年年会开幕当天发布了最新开源模型R1,再次引起了全球的关注。据介绍,R1模型在技术上实现了重要突破,用纯深度学习方法让AI自发涌现出推理能力,在数学、代码、自然语言推理等任务上的表现与OpenAI的o1模型正式版相当,但训练成本仅为560万美元,远低于美国科技巨头的数亿美元乃至数十亿美元投入。
市场分析师指出,DeepSeek的模型推出如同一颗“震撼弹”,令市场对美国科技行业的竞争力产生质疑,进而导致人工智能主题股票的抛售。安内克斯理财公司首席经济学家雅各布森表示:“像英伟达这样的公司,被认为几乎垄断了人工智能生态系统中的所有芯片,但或许其‘护城河’并不像人们想象的那么坚固。”
■DeepSeek:性能卓越,用户体验佳
DeepSeek是一款由国内人工智能公司研发的大型语言模型,具备强大的自然语言处理能力,能够理解和回答问题,辅助写代码、整理资料并解决复杂的数学问题。与OpenAI开发的ChatGPT相比,DeepSeek不仅实现了媲美OpenAI-o1模型的效果,还大幅降低了推理模型的成本。
据北京邮电大学人工智能学院人机交互与认知工程实验室主任刘伟介绍,DeepSeek的最大优势在于算法的改进和优化,使得算力和数据量的需求大大减少。南京大学人工智能学院教授俞扬也表示,DeepSeek在算法上进行了优化,大幅降低了训练成本。
目前,DeepSeek开发的移动应用程序已超越OpenAI的ChatGPT,登顶苹果手机应用商店美国区免费应用榜单。
■开源:未来的发展方向?
DeepSeek采用了完全开源的策略,不仅降低了用户的使用门槛,还促进了AI开发者社区的协作生态。通过开源,DeepSeek吸引了大量开发者和研究人员的关注,推动了AI技术的发展。英伟达AI科学家Jim Fan称赞DeepSeek是“真正开放的前沿研究,赋能所有人”。
当然,开源也面临着保护知识产权和维护开源社区秩序等挑战。俞扬指出,开源只是一种商业模式,即便开源项目也拥有版权。开源与闭源之争,实质上是不同商业模式在特定场景和时代背景下的有效性对比。
■DeepSeek的成功与未来展望
DeepSeek的成功被一些人视为中国技术理想主义的体现,甚至被外国人比喻为神秘的东方力量。但从整个AI大模型产业来看,DeepSeek的成功或许代表了一种全新的发展方向——通过算法优化而非单纯依赖算力和数据量来提升模型性能。这一方向也为AI大模型产业的发展提供了新的思路。
总的来说,DeepSeek的崛起不仅展示了中国人工智能技术的实力,也为全球AI行业带来了新的变革和发展机遇。