国产大模型独角兽，困在光环里

作者 | ZeR0

编辑 | 漠影

11月16日，月之暗面举办了一场临时组织的媒体沟通会，说是特意选在Kimi开放一周年纪念日。

结果意料之外，啪，发了款数学模型。

还跟OpenAI o1系列、GPT-4o、Anthropic Claude 3.5 Sonnet模型的测试分数做了对比。

这个举动搁在友商身上很正常，但由月之暗面来做就有些稀奇了。因为这家大模型公司的作风一贯有些另类，不聊技术，只推拳头产品Kimi。

Kimi在今年年初的热度冲到一个高峰。铺天盖地的广告投放轰炸使这款智能助手产品声名鹊起。

快速攀升的Kimi用户数和影响力、“90后清华校友技术天才创业者”的创始人标签、阿里超10亿美元领投、Kimi概念股爆火……诸多光环叠加，将月之暗面捧成了一个新晋国产大模型“顶流”。

但很快其命运陡转，口碑逐渐下滑，质疑声扑面而至，这些光环也变成了缚住月之暗面的茧。

以前是好评如潮，但不知何时开始，月之暗面被冠以“大模型营销咖”的外号，模型乏善可陈，生态资源被大厂碾压，产品更新多为缝缝补补。

一些针对产品效果的负面评价也声量渐起：“动不动让换个话题”、“有时会瞎编”、“整理资料糙”、“听不懂需求”、“幻觉和错误严重”、“指出它错了还犟嘴”……这些大模型通病，在用户心里埋下失望的种子。多位用户吐槽说，Kimi最近莫名地越用越差，感觉比以前变蠢了，甚至有人怀疑这是不是想逼用户付费。

这是大模型竞赛中的一个缩影：当发展速度跟不上讲故事的高度，当免费和低价策略挟住每一个参赛者，当Scaling Law信仰开始动摇，此时的转折，是新高潮前的过渡，还是凛冽寒冬的序曲？

大模型独角兽们，集体走到逆风时刻。

一、月之暗面的B面：特长被复刻、出海失利、被前资方“逼宫”

2023年10月，月之暗面发布支持输入20万汉字的智能助手产品Kimi。

彼时，这是全球市场上商用大模型服务中所能支持的最长上下文输入长度。在高曝光度加持下，Kimi凭借“最强长文本”特色，很快在AI聊天产品大战中杀出重围，收获增长和口碑。

凶猛的推广投放为Kimi争取到先发优势。今年年初阿里的大笔投资进一步增加了月之暗面的曝光度。在4月Kimi智能助手支持200万字上下文后，二级市场一度掀起Kimi概念股热潮。

红得发紫，是A面的月之暗面。

但在另一侧B面，这家明星国产大模型独角兽，已经频频陷入麻烦中。

难守的“特长”

Kimi爆火后，很快“长文本”成为大模型突破的共识方向。

竞争对手们纷纷高调跟上，3月22日，阿里通义千问开放1000万字长文本能力，360智脑宣布内测500万字长文本能力，百度宣布文心一言4月升级逾200万字的长文本能力。

之后，Kimi仍努力拉大优势，今年10月上线具备AI自主搜索能力的Kimi探索版，搜索量是普通版的10倍，一次搜索可以精读500个页面。

但Kimi的身份，已经从引领潮流者转向追随者，上周新推出的对标o1的数学推理模型，便是在走OpenAI打过样的路。

激进投放

Kimi在投流上的生猛，连大厂掌门人都侧目。

在百度2024年第三季度总监会上，百度创始人李彦宏谈道：“AGI是个长期探索的事情，文小言的推广没必要像豆包、Kimi那样激进。”

自发布以来，Kimi在字节旗下穿山甲、B站、小红书等渠道进行了大规模投流。一张网传图表显示，Kimi的季度投放金额豪横到上亿元，吊打多数竞品。Kimi还长期推行免费策略，直到今年5月才首次试水商业化，启用打赏模式。

这带来的回报是领先的用户增长和产品影响力。但无论是月活、活跃用户留存率还是免费App下载排名，Kimi都被字节豆包压了一头。

出海止步

今年年初，月之暗面在海外推出情感陪伴类AI对话产品Ohai和AI生成视频工具Noisee。

据创投日报援引知情人士消息，其出海项目在今年6月就已撤掉。前Noisee产品负责人明超平、前Ohai产品负责人已于近期离职创业。

上周六，杨植麟回应说月之暗面今年二三月份开始聚焦和缩减，主动做减法，更加聚焦业务，先聚焦，后全球化，要更有耐心。他说过去一年给其团队上的一课是，几个业务一起做，会活生生把自己变成大厂，没有任何优势。

套现疑云

除了产品竞争压力外，月之暗面也陷入一系列舆情风波中。

今年4月，杨植麟被传通过售出个人持股套现数千万美金，随后月之暗面进行辟谣，但其中牵扯出的“资本贵人襄助论”长期余温未了。

前金沙江创投管理合伙人张予彤是循环智能最早的天使投资人，与杨植麟是清华校友，4月份离开金沙江创投。有报道称，月之暗面获阿里领投的A+轮融资，正是归功于张予彤的牵头促成。

仲裁风波

11月11日，据《暗涌Waves》报道，月之暗面创始人杨植麟、联合创始人兼CTO张宇韬被循环智能7家投资方中的5家（金沙江创投、靖亚资本、博裕资本、华山资本、万物资本）申请仲裁。

这场利益纠葛牵扯到三位清华同窗杨植麟、张宇韬、陈麒聪在2016年创办的循环智能。循环智能主要做企业营销客服AI软件，在2018~2021年完成5次公开融资，此后再无新融资披露。

极大的落差，被业界推测是循环智能老投资方们发起仲裁的导火索。

杨植麟此前曾在采访中透露：“我们2023年2月开始集中做第一轮融资，如果delay（延迟）到4月，基本没机会了。”之后其动作相当麻利，3月创办月之暗面，8月推出Kimi，今年暴风吸金，获得腾讯、阿里、小红书、三七互娱、美团、小红书等名企投资，估值扶摇直上超过30亿美元，远高于循环智能用8年时间发展到的估值。

该仲裁事件的后续及影响，仍有待观望。

二、国产大模型独角兽的“四重困”

今年，国产大模型江湖格局生变，创业头部梯队从“四小龙”变为“六小虎”，即智谱AI、月之暗面、MiniMax、百川智能、零一万物、阶跃星辰。

智谱AI和MiniMax成立时间较早，另外四家则都是在2023年3~5月期间创办。

借势2021年大放水和生成式AI飞升的红利，过去两年，资本密集汇向这几家大模型初创公司，只用短短一两年就将它们拱到独角兽身价。

百川智能、智谱AI、月之暗面均跻身200亿元估值俱乐部。今年6月，阶跃星辰被传正在进行一轮估值20亿美元的新融资。

金沙江创投主管合伙人朱啸虎今年3月接受腾讯新闻《潜望》采访时的发言，道出了一些质疑者的心声：“这些公司，要场景没场景，要数据没数据，你说它有什么价值？而且一上来估值这么贵。”

资本的追捧，与其在商业市场上的实际表现，始终存在着隐性的不平衡。

以前“六小虎”各具特色：智谱AI是正统清华科研班底，最早探路大模型研发，在To G、To B布局上都摊得较广；MiniMax在多模态和出海产品上保持领先；月之暗面手握爆款产品Kimi，不怎么强调背后模型；百川智能由王小川领衔的前搜狗团队创办，一年发了十多款大模型，并在AI医疗方向发力；零一万物由李开复组局创办，热衷于打榜；阶跃星辰则由前微软全球副总裁姜大昕创办，快步形成“万亿参数MoE+多模态”矩阵。

但一些变化已经显现。

1、人才之困

AI大模型独角兽们陷入的争议，很容易让人联想到AI 1.0创业时代的“CV四小龙”，高人才密度、强技术实力未能转换成高回报的市场竞争力，迄今难逃亏损魔咒。在生成式AI巨浪兴起后，不少来自互联网大厂及商汤、旷视的技术、产品、工程人才转身遁入大模型公司。

大模型创企像个围城，外面的人想进来，里面的人又纷纷出走。这一年来，一大波骨干人才从“六小虎”出走，有的回流大厂，有的选择创业。

今年8月，前零一万物算法副总裁、模型预训练负责人黄文灏被曝已加入字节跳动；9月，MiniMax“星野”产品负责人张前川被曝改任产品顾问，不再参与MiniMax业务。零一万物联合创始人李先刚也被曝出已离职并重返老东家贝壳。

月之暗面则有多位前产品负责人在离职后选择创业。比如月之暗面前大模型产品负责人王冠在今年年初创立了AI视频方向的ONE2X，已完成天使轮融资；前Noisee产品负责人明超平正以5000万美元的估值为其新创业项目融资。

另据Z Potentials报道，零一万物联合创始人潘欣正式加入闪极，出任闪极科技合伙人。

人才有出，也有进。

今年8月，百川智能宣布中国人民大学高瓴人工智能学院、信息学院院长文继荣教授受聘担任百川智能“首席科学家”，月之暗面将微软亚洲研究院前首席研究经理谭旭招至麾下。

在团队扩张上，杨植麟称月之暗面在几个大模型创业公司中始终保持人数最少、卡和人的比例最高，认为团队扩得大对创新有致命伤害。

2、技术之困

上周大模型领域的一大热议话题是Scaling Law，这个大力出奇迹的暴力美学，碰壁了。

OpenAI、Anthropic、谷歌都被曝出新模型改进放缓，寻求转变路线。连已经离职创业的前OpenAI首席科学家Ilya Sutskever都跳出来一吐为快，说2010年代是Scaling的时代，但现在是时候重归奇迹和发现的时代了。

而模型提升见顶，意味着AI聊天产品的智力很难再出现质的飞跃。

不过多位业界大佬否认了“碰壁论”。OpenAI联合创始人兼CEO Sam Altman、微软AI主管Mustafa Suleyman、微软董事长兼CEO Satya Nadella、前谷歌CEO Eric Schmidt等都宣称Scaling Law依然有效、没有迹象显示放缓。

杨植麟对Scaling Law仍持乐观态度，认为用强化学习的方式，上限很高。他预测训练模型还有半代到一代的空间，这个空间可能会在明年释放出来，接下来重点会是强化学习，范式上会产生一些变化，通过不同方式去Scale。

在他看来，留存与技术成熟度呈正相关，把思考能力和交互做好后，留存会进一步上升。

3、产品之困

模型卷不动后，竞争焦点必然向产品转移。

To B方面，大模型独角兽同时面临同行的闭源模型和开源模型的竞争，低价策略仍是主旋律。

To C方面，市场尚未等来一个超级应用，AI产品同质化严重的情况一直存在，目标用户重叠度高，同类产品功能和体验互相借鉴模仿，产品转移成本低，又不像一些头部社交、电商平台用推荐机制拿捏住人性的弱点、形成上瘾机制，那么如何才能长久占领用户心智？

当前AI聊天类产品在便捷搜索和提高生产力方面有效发挥作用，但受众仍然有限。不断优化的产品功能和效果，仍未能消减很多用户对幻觉错误和沟通费劲等问题的埋怨。

大模型主要靠To B还是To C赚钱，不同观点都有拥趸者。摆在大模型创企们面前的，是涉及精简成本和聚焦核心业务的方向选择难题：如果盈亏主要依赖To C应用，那么投入高昂的训练成本是否值当？如果To B才是商业表现的征途，那么姗姗来迟的月之暗面是否已经输在起跑线？

对市场需求的精准把控很重要，但国内团队擅长“抄作业”。大厂可以轻轻松松推出爆款AI功能合集，而创企只能选准方向精兵作战。

现阶段，大厂靠传统优势依然胜出，语言类有字节豆包，视频生成类有快手可灵。

对于与豆包的竞争，杨植麟上周的回应是：不希望过多关注竞争，因为竞争并不产生价值。做正确的事情，而不是专门去做不一样的事。只要能有人实现AGI，都是非常好的结果。

月之暗面目前还是聚焦于Kimi产品和品牌，聚焦在团队认为上限最高的事情上，更关注如何迭代更好的技术和产品、产生用户价值，更聚焦在提升模型的思考推理能力。

据晚点10月份报道，月之暗面的多模态研究从去年10月开始，在研发视频模型，为确保产品更具差异性，对外发布计划仍在推迟。

4、财力之困

除去人力成本不谈，大模型创企还面临三大烧钱问题：训练贵、推理贵、获客贵。

大模型训练和推理已经不是稀奇事。据外媒披露，预计OpenAI今年创收35~45亿美元，亏损40~50亿美元；Anthropic今年收入有望达到10亿美元，亏损可能是OpenAI的一半。

为了降低大模型推理成本，杨植麟称kimi未来考虑限制次数，让用户自己做选择。

为了保住拉新和留存，投放在所难免。早期Kimi投流效果立竿见影，知名度快速攀升，B站和小红书布满了安利。随后一些AI产品争相效仿，带动用户转化成本上涨。在机场、地铁等场所，旅客对大模型产品的大屏广告逐渐习以为常。

至少截至今年，大模型还不是一门能赚钱的好生意，也尚未展现出长期商业盈利的潜力。

结语

很少有新生行业能像生成式AI这样，短短两年孕育出多家百亿级估值的明星企业，它们被迅速推上神坛，也承受着过高期待带来的困扰。

近期，产业对大模型似乎逐渐祛魅。人们不再容易因雄心勃勃的AGI技术信仰而陷入狂热，不再对百模大战保持耐心和好奇心，不再盲从大佬预言，不再轻信投资者夸大的创新者投资资本回报，也不再热议谁会成为“中国版OpenAI”。

对于大模型创企而言，两年的成长，还不足以解决概念丰满但产品骨感的问题，消除业界一个长期的疑虑：大厂资源雄厚，进可攻退可守，仅靠大模型营生的公司又如何自证造血能力？当听众不再相信故事，又凭什么支撑起百亿级的估值？

玩酷网

国产大模型独角兽，困在光环里

智东西