玩酷网

美团升级龙猫大模型,本地生活能否靠AI改写竞争规则?

[亿邦原创]9月22日,美团发布并开源LongCat-Flash-Thinking大模型,这是“龙猫”系列模型的重要升级,在保持前代模型LongCat-Flash-Chat极致速度的基础上,进一步强化了在逻辑、数学、代码与智能体等多类推理任务的能力。MoE架构,总参数量5600亿,动态激活186亿至313亿参数,平均激活约270亿参数,可以兼顾性能与效率。

这个模型的突出特点是推理能力和工具调用特性。在AIME25的工具增强推理场景中,LongCat-Flash-Thinking能在保证约90%准确率的前提下,相比不调用工具可节省约64.5%的Token消耗(从19653个Token减少到6965个),体现了工具调用能力在提升效率方面的巨大价值。

LongCat-Flash-Thinking的发布和开源,展示了美团在自研AI技术的实力。

美团早已明确中AI方面的三层战略:AIatWork(提升员工效率)、AIinProducts(改造现有产品与创造原生AI应用)、BuildingLLM(自研大模型)。

LongCat-Flash-Thinking是“BuildingLLM”和“AIinProducts”中的重要步骤。

美团的核心是连接海量用户、商户和骑手的本地生活网络。一个深度优化工具调用和推理的模型,能更好地理解和优化这个复杂网络中的各种任务(如物流规划、资源调度),从而“加固”运营效率护城河。

智能体工具调用和能力,可以直接赋能美团的骑手智能调度、客服自动化、商家经营决策等核心场景,提升其“AIinProducts”的深度,降本增效。

LongCat-Flash-Thinking也是美团在本地生活领域,从“补贴战”转向“技术战”的重要筹码。

当高德凭借AI能力(如“扫街榜”)对美团的到店业务形成冲击,美团通过LLM、Agent等技术能力,打造差异化优势并探索新技术服务收入(如模型API、解决方案等),将竞争维度从烧钱拉升至技术壁垒和效率提升维度。

当然,模型最终的价值还需在实际应用中检验,开发者社区的接受度、在实际业务中带来的具体效率提升和成本节约,以及能否真正帮助美团开拓新的收入来源,都将有待观察。