DeepSeek开源推理系统,日入56万美元,成本利润率高达545%

袁浩说 2025-03-03 12:56:38

DeepSeek,这个名字在AI领域掀起了一阵开源的浪潮。

过去一周,DeepSeek连续开源五个Infra项目,就在大家以为这场盛宴即将结束时,DeepSeek又放出了“彩蛋”:DeepSeek-V3/R1推理系统的技术解读。

更令人震惊的是,该系统惊人的盈利能力——日入56万美元,成本利润率高达545%!

这背后究竟隐藏着怎样的技术奥秘?

DeepSeek如此慷慨地开源核心技术,最终目的是什么?

DeepSeek的开源行动不仅仅是简单的代码公开,更像是一场精心策划的技术盛宴。

从最初的五个Infra项目到DeepSeek-V3/R1推理系统技术解读的发布,DeepSeek一步步揭开了其技术的神秘面纱。

核心技术在于大规模跨节点专家并行(EP)、计算通信重叠以及负载均衡。

这些技术创新使得DeepSeek-V3/R1推理系统实现了更大的吞吐量和更低的延迟,正如DeepSeek官方报告中强调的优化目标。

DeepSeek官方公布的数据显示,DeepSeek-V3/R1推理系统24小时内收入可达56.2万美元,成本利润率高达545%。

这份亮眼的成绩单是如何得出的?

DeepSeek详细列举了各项数据:GPU租赁成本、token总数、缓存命中率、输出速率以及平均KVCache长度等等。

Menlo Ventures投资人Deedy更是给出了极高的评价:“理论年收入2亿美元、利润率超过500%,DeepSeek的商业效率使其足以成为一家估值100亿美元的公司。”

一直以来,DeepSeek的模型服务以“价格屠夫”的形象示人,其价格远低于行业其他模型。

外界一度质疑DeepSeek是否在进行亏本的价格战。

这次开源和技术解读,无疑解答了这些疑问。

DeepSeek用实际数据证明,低价并不意味着亏损,高效的推理系统可以同时兼顾低价和高利润。

这也预示着未来模型推理价格将更加亲民,服务提供方也能获得可观收益。

社交平台上,网友们对这一消息的反应也十分热烈。

有人感叹:“DeepSeek的成本利润率545%,这难道是在告诉我,我被Open AI抢劫了吗?

”,还有人对DeepSeek的下一步动作充满期待:“开源周Day7的彩蛋是AGI吗?”

DeepSeek的开源之举,对于其生态伙伴而言,无疑是重大利好。

无论是提供在线推理还是私有化部署等服务的供应商,都能从中受益。

DeepSeek官方的技术解读表明,通过部署DeepSeek的服务,云平台和上下游的理论收益和利润率都非常可观,这为整个AI生态系统注入了新的活力。

硅基流动创始人袁进辉也对DeepSeek的开源表达了自己的看法。

他认为,DeepSeek官方披露的大规模部署成本和收益,又一次颠覆了人们的认知。

适配DeepSeek V3/R1模型架构并非易事。

由于V3/R1架构与其他主流模型存在较大差异,大量小专家的组成方式使得许多针对其他模型结构开发的系统都无法有效运行。

要达到DeepSeek所展示的效率,必须按照其报告中描述的方法开发新的系统,这需要时间和技术积累。

目前,许多供应商还难以达到这一水平。

袁进辉进一步分析了复现DeepSeek推理服务的难度以及DeepSeek可能的战略思考。

他认为,DeepSeek可能是先基于某种原因确定了这种模型结构,然后克服了训练和推理过程中的巨大工程挑战。

当然,也可能是反过来,基于系统的出发点设计了这一全新的模型结构。

无论如何,DeepSeek的成功都体现了其团队第一性原理的思考方式和强大的执行力。

DeepSeek慷慨地开源了主要模块,降低了社区复现的难度,这无疑加速了技术的普及和发展。

DeepSeek-V3/R1推理系统的技术细节,例如双batch重叠、prefill和decode阶段的负载均衡策略,以及对不同并行方式的优化,都展现了DeepSeek团队深厚的技术功底。

配合技术解读,DeepSeek开源周放出的5个代码库带来的影响才刚刚开始。

DeepSeek的这波操作,究竟是一场纯粹的技术分享,还是深谋远虑的战略布局?

DeepSeek的未来,又将如何影响整个AI生态?

这些问题,值得我们深入思考和探讨。

0 阅读:0

袁浩说

简介:袁浩说