揭秘:为何大模型总是赚不到钱?行业内幕大曝光

程序员咋不秃头 2024-12-02 04:12:17

一个扎心的问题:大模型盈利了吗?

随着技术的发展,AI 逐渐走下了「神坛」,整个业界都变得更加客观和务实。

从OpenAI 今年高达 50 亿的天价亏损,到月暗沸沸扬扬的前投资人仲裁风波,大模型厂商的生意之路不是铺满大额融资的花路,而是充满了坎坷和荆棘。

最近,国外的一篇热议的博客更毫不客气地指出:做大模型厂商不是明智之举。

“像 ChatGPT 和 Claude.ai 这样的大语言模型非常炫酷,许多人认为它们代表着未来。也许确实如此,但这并不意味着构建它们会成为一项盈利的生意。”

更为致命的是,作者认为,大模型尚未盈利的现状,并非普遍认知中的“时机”问题,而是因为大模型本身的行业结构就非常糟糕!

作者说,对比可口可乐这种“躺着就能赚钱”的好生意,大模型就是航空公司般吃力不讨好的苦差。

难道,即使是在大模型的牌桌上杀出一条血路的幸运儿,也看不到盈利的曙光吗?

大模型,糟糕的行业结构

在剖析大模型行业结构时,作者借用了营销学中经典的“五力框架”。这一关于企业经营战略的理论,由“竞争战略之父”迈克尔·波特,在上世纪80年代初提出。

下图可以明晰地解释,为什么可口可乐公司的生活如此滋润。他们购买“水、色素、香料、甜味剂”这种替代性非常高的原料,却生产被无数人拥护的可乐汽水,不仅将百事甩到身后,更让跟随者望而却步。

那么,从五力框架来看大模型厂商的生意会是如何?从作者给出的阐释来看:非常不乐观。

第一,从上游的供方来看,即使大模型厂商暗示他们的供应商是微软、亚马逊、Google Cloud 等云服务公司(在国内则是阿里云和火山引擎等等)。这听起来还不算太糟,因为大模型厂商大可以货比三家,迫使他们为模型训练降低高昂的费用。单看今年,国内云服务商就出现了多轮降价潮。

但作者却说:实际上,LLM 制造商只有一个真正的供应商——NVIDIA。

NVIDIA 提供所有模型训练所需的芯片,无论使用哪个云供应商。这赋予了 NVIDIA 巨大的、几乎完全的定价权。

而国内由于众所周知的原因,在供应链上需要解决的问题更多。虽然寒武纪、昆仑芯片为代表的国产芯正在崛起,但性能和能耗上的差距客观存在,中国大模型厂商在硬件端的压力或许更加严峻。

第二,从买家用户来看,我们对大模型服务的议价权有多大?——目前看来相当高。

作者观察,例如,在 Claude 编程能力飞升后,许多 LLM 用户从 ChatGPT 转投了 Claude。大模型的品牌忠诚度似乎尚未建立起来。

而将 AI 集成到业务中的公司,开始通过允许切换提供服务的模型来实现“无痛”迁移。甚至,国内出现了 360 AI 搜索这样以为用户选择模型为亮点的集成产品,也就是说,用户并不 care 究竟是哪款模型在提供帮助。

这使得 LLM 成为高度替代性的商品——对于 OpenAI 之流来说,这可不是什么好事。

第三,竞争对手的威胁有多大?同样的,国内外都称得上「卷生卷死」。

作者说,有许多大模型厂商,在 B 端的定价似乎很“白菜”、很有竞争力。不过,糟糕的是,像 Meta 这样的玩家几乎免费把模型投放入市场,所有人都可以围绕 Llama 做微调。“这让人联想到 Internet Explorer (注:曾经免费附带在 Windows 系统中的搜索巨头,逐渐被抛弃)——一个不算好兆头的例子。”

最后,对于新入局玩家来说,他们面临的竞争壁垒并不高。这就是为什么会有这么多大模型厂商。作者写道,“大多数 LLM 技术都公开发表在论文中。即使是性能差的模型,只要价格便宜,也能获得客户,从而让新入局者站稳脚跟。”

从国内的情况看,后来者居上的情况也屡见不鲜,腾讯系的元宝 AI 直接选择延续了鹅厂缓慢跟进的惯例。腾讯云副总裁、腾讯混元大模型负责人刘煜宏在接受媒体采访时表示:“在一个成熟的行业才可以谈先发优势,而大模型的To C产品如今渗透率不到1%,先发优势可以忽略不计。”

即使大模型存在一定的技术壁垒,也很容易被流动的人才打破。今年下半年,字节的 AI 团队新增了多位其他公司的技术骨干,例如面壁智能核心成员秦禹嘉、零一万物算法副总裁、模型预训练负责人黄文灏,以及原阿里通义千问大模型负责人周畅。

面向未来,不久前筹集到 66 亿美元资金的OpenAI,能在市场中获得地位上的改善吗?作者认为可能性微乎其微。

从供方来看,面对霸主英伟达,OpenAI 似乎放弃了原有的芯片工厂计划。根据最新消息,它们开始与高通讨论自研芯片。这也能降低对 NVIDIA 的依赖。不过,作者提示我们,NVIDIA实际上也是本轮融资的投资者之一(虽然金额相对较小),因此在融资 PPT 中提到“开发 NVIDIA 的竞争对手”显然不太可能。

从用户来看,虽然 OpenAI 可以通过建立品牌来留住用户,但高度同质化的 LLM 品牌能否为一家 AI 公司带来溢价呢?从科技行业来看,品牌建设和用户锁定机制是有效的(苹果就是一个力证)。然而,对于 AI 企业来说,这似乎很难实现,“因为LLM本身仅有一个通用的文本接口——基本没有真正意义上的独特API:你发一段文本,它返回一段文本。”

从竞争者来看,OpenAI 能够阻止新进入者吗?也许可以。“如果投入 66 亿美元能让他们开发出一个重大改进的模型,那么这将显著提高其他人的成本,可能会迫使一些小型竞争对手退出市场。但问题在于,资金本身是最具有流动性的商品(毕竟这就是资金的本质),而66亿美元并不算多。所以,这一轮融资本身不足以让其他人望而却步。”另外,大厂本身远比 AI 创企财大气粗的多,无论是谷歌还是腾讯、字节,他们都可以承受更大的经费燃烧。

最后,作者还补刀说:巨额融资说明不了啥。“即使是筹集了巨额资金的公司,有时也可能被证明没有可行的商业模式。例如,WeWork最终筹集了超过100亿美元,估值高达470亿美元,但后来人们发现他们的商业模式根本行不通。在最近的财务重组中,WeWork的估值仅剩5.6亿美元——损失了超过95%的投资金额。”

难道,大模型真的没有护城河?

护城河在哪里:

AI 时代会有自己的苹果和谷歌吗?

作者 Cal Paterson 的这篇博客也在 Hacker News 上得到了广泛的反响。

一些读者认为,LLM 当然可以通过品牌建立起护城河。这篇文章的视野局限在了「技术人员」,而没有注意到对于大多数人来说,ChatGPT 已经成为了大模型甚至 AI 的同义词,这说明其品牌具备相当的价值。

上图:罗杰斯的创新-扩散曲线。可以想见,技术人员是创新采用者和早期采用者,但一项技术只有推向大众后才能真正地走向市场。

和那些不是工程师的人聊聊吧,(他们)满脑子只有 ChatGPT。许多人甚至不知道 LLM 厂商这个概念,只知道“ChatGPT”。那集恶搞这些东西的《南方公园》剧集?他们称之为 ChatGPT。每年学生用来帮忙完成作业的工具?ChatGPT……

护城河在于一个非常非常庞大的用户群体已经形成的更广泛的意识。像这篇文章这样的分析将一些技术性因素,比如切换到另一个 LLM 的成本很低,作为切换会发生的前提,而没有考虑到改变社会力量有多么困难。

这并不意味着 ChatGPT 会永远是人们使用的工具。也许它会在一年内失败得很惨。但目前来说,这是 OpenAI 的地盘,他们可以丢掉它,而不是别人轻易夺走。

普通大众并不在意“LLM”和“ChatGPT”之间的区别,就像他们并不关心“网页浏览器”和“Chrome”之间的区别一样。大多数人会乐于使用你放到他们面前的任何东西,如果产品不好用,他们通常只是抱怨几句,然后无奈地耸耸肩,而不是去花时间研究如何切换到更好的替代品。对于普通用户来说,有鉴别力的消费者只是个可以忽略的小数点误差。

也就是说,平台持有者会决定谁赢谁输。如果 ChatGPT 能被微软、谷歌和苹果采用,它就会赢。

上述说法有一定道理,但平台持有者一旦有决定权,为什么不让自己获胜呢?看看 Internet Explorer 的先例,谁能保证微软不开发出自己的 AI 版 Edge ,从而抛弃 OpenAI。

另一些人则认为 LLM 很难拥有护城河。

品牌确实是一种护城河,但它并不深。讽刺的是,品牌效应在最具社会属性的消费品上效果最好(也最能盈利)——比如设计师品牌的衣服,这是最显而易见的例子——因为这些品牌有社交层面的价值。……

而对于LLM,它们的质量实际上并没有显著差异。

不管人们是否称LLM为“ChatGPT”,最终他们是为了得到一个结果。如果有一个不同的LLM能提供相同的结果,并且有足够的动机,人们就会去使用它。没人会关心别人用的是哪种“ChatGPT品牌”,也没人会因此炫耀。

Google在用户方面的护城河是质量、习惯和整合,但Google搜索是免费的,与其他“FANG”(Facebook(现已更名为 Meta)、Amazon、Netflix、Google )公司相比,我认为Google实际上相当脆弱。

Apple的护城河在于人们对其硬件的投资、它的界面、以及品牌,这些不仅在社会层面上有重要意义,而且也暗示了真实的质量差异。Apple的整体护城河远比Google大。

LLM的一个具体非护城河之处在于它们的答案是泛化的——LLM没有“个性”,因为它们是所有公开可用的语言的训练平均值。如果某个大模型有特定限制,它就不会那么有用。

正因如此,OpenAI和竞对都在积极寻找其他方案:OpenAI 高举高打进入搜索领域,还在考虑进军浏览器的可能性;Claude 桌面版在研究更智能的 AI 智能体,能自己搜索和浏览页面,以图在产品功能上取得突破。

虽然大模型目前的技术和产品都被跟进的很快,但不能武断地说大模型永远无法建立有意义的护城河。

国产大模型:内容生态或将成为的终极靠山

虽然上述讨论中说,大模型缺少“个性”。

但对于一个高频次的 AI 产品使用者来说,区分出几家国产 AI 产品的特色却并非难事。

其中一个主要的原因,在于国内互联网的内容生态相对封闭。抖音、快手、小红书、哔哩哔哩等平台的数据和内容资源,外部模型几乎完全无法接入。

对于有着丰富内容积累的大厂来说,它们可以更好地接触和利用数据,提供更精准、更本土化的服务。例如,字节跳动旗下的豆包能直接调用抖音内部的视频资源,这种“生态锁定”使得字节的豆包可以在视频生成、短视频搜索等领域占据了绝对优势。

而对于原生的 AI 创企来说,要在巨头的阴影下生存并盈利,只会愈发艰辛。

参考链接:

1.https://calpaterson.com/porter.html

2.https://news.ycombinator.com/item?id=42248496

0 阅读:0