2025年6月30日,美团正式发布新一代基础大模型——LongCat-2.0。此次发布的最大亮点在于,这是一款完全基于国产算力完成训练与推理全流程的万亿参数大模型。这不仅代表了美团在AI赛道上的技术跃迁,也向行业释放了一个关键信号:依托国产算力支撑超大规模模型的路径已经成功跑通。

具体来看,LongCat-2.0采用MoE(混合专家)架构,总参数量达到1.6万亿。这个数字或许听起来抽象——简单来说,模型在处理每个Token时,实际激活的参数约为480亿,属于典型的“大而精”设计思路。同时,它原生支持1M超长上下文,意味着单次可处理百万字级别的输入内容。在模型适配方面,LongCat-2.0深度兼容Claude Code、OpenClaw、Hermes等主流测试框架(Harness),让行业开发者能够快速上手使用。
早在今年4月底,美团便以匿名方式发布了LongCat-2.0的Preview版本,并接入了全球最大的大模型API路由平台OpenRouter。根据OpenRouter的统计,截至6月底,LongCat-2.0-Preview的总调用量已跻身全球前三。对于一个尚未正式公开的国产大模型而言,这一成绩充分体现了其技术实力与市场实际需求之间的高度匹配。
值得关注的是,从2024年起,美团便开始与国产算力厂商深度合作,推进所谓的“模芯协同”研发。整个进程从小规模验证逐步演进到超大规模稳定训练,期间成功攻克了万卡级容错恢复、NPU确定性计算、算力利用率提升等一系列技术难题。这些突破的意义不仅在于让LongCat-2.0顺利运行,更在于验证了一条可复制、可规模化的国产大模型训练路径。
在成本方面,LongCat-2.0的表现同样不容小觑。其训练与推理成本均低于全球其他同等万亿参数级别的大模型。这背后既有MoE架构带来的效率优势,也离不开国产算力在性价比方面的持续优化。LongCat团队最新宣布,将于近期在多平台同步开源Infra框架、推理引擎、模型参数等核心技术。这一动作一旦落地,将有力推动整个开源社区在超大规模模型领域的基础设施建设。
