一、核心基础信息
2026年6月30日,美团正式发布了新一代万亿参数MoE基础大模型——LongCat。这款模型专攻代码、智能体(Agent)及超长文本处理场景,全程基于国产算力完成训练与推理,并宣布开源核心技术。早在2026年4月底,LongCat的Preview版本便已悄然上线,并以匿名方式接入了全球知名的API路由平台OpenRouter。令人意外的是,上线仅两个月,其调用量便冲进了全球前三。没错,一个来自国内团队的大模型,在没有品牌光环加持的情况下,硬是在全球开发者中杀出了一条血路。
而真正令行业侧目的,是它的硬件里程碑:LongCat成为业界首个在5万张国产AI加速卡集群上完成完整预训练和线上推理的万亿参数大模型。全程未使用任何海外高端GPU,并成功攻克了万卡集群容错、NPU确定性计算、算力利用率等一系列技术难题。这不仅是美团的技术突破,更是对国产算力支撑能力的一次硬核验证。
二、模型架构与规格
模型的核心架构是总参数量达1.6万亿的MoE专家混合架构。具体而言,其单Token动态激活参数平均约为480亿,浮动区间在330亿到560亿之间。为何如此设计?关键在于自研的“零计算专家”机制:面对简单的文本Token,仅分配少量算力;遇到复杂的代码或超长文本时,系统会自动扩容计算资源。这样一来,推理成本被大幅降低——每一分钱都花在了刀刃上。
在上下文能力方面,LongCat原生支持1M(百万Token)超长上下文。这意味着它可以一次性处理百万字的文档、完整的代码仓库,甚至一个大型项目的全部源码,完全不存在上下文截断或“失忆”问题。训练数据量也相当惊人:超过30万亿Token的预训练数据,覆盖中英多语言、海量开源代码、工具调用及智能体交互数据。
技术架构上,LongCat采用了自研的ScMoE架构,包括跨层快捷连接、Ngram Embedding增强、LongCat专属长文本注意力机制,以及MOPD多专家融合机制。整个架构专为代码与智能体场景量身定制,与通用对话模型完全是两套打法。
三、核心能力亮点
1. 顶尖代码/开发能力
首先说说大家最关心的代码能力。LongCat深度适配了Claude Code、OpenClaw、Hermes等主流代码智能体框架,能够胜任整仓库代码理解、批量重构、bug修复,甚至复杂工程的多文件联动生成,以及前后端完整项目的输出。在SWE-bench Pro等专业代码评测中,表现也相当靠前。更直观的数据是:Preview版本在代码Agent平台的月调用量,全球排名第二。
2. Agent智能体原生强化
在智能体方面,LongCat天生就为自动化任务、多工具调用和复杂长链路规划进行了优化。Preview版在Hermes智能体平台上的调用量,直接拿下全球第一。这意味着什么?如果你需要自动化开发、数据分析,或者批量文档处理机器人,LongCat是一个非常靠谱的选择。
3. 极低API调用成本
最后是定价策略,这一点美团做得相当“狠”。缓存命中时,百万Token的输入成本仅需0.04元;输出成本大约8元/百万Token。这个价格比很多海外旗舰模型低了一大截,开发者几乎可以把它当“白菜价”使用,门槛被拉得非常低。
四、全球市场表现(Preview版数据)
从实际数据来看,LongCat的Preview版表现相当亮眼。接入OpenRouter全球大模型路由平台后,总调用量已跻身全球前三。细分场景的排名更是惊人:在Hermes通用智能体平台,月调用量全球第一;在Claude Code代码智能体平台,月调用量全球第二;在OpenClaw开发框架中,也稳居全球前列。目前,开发者可直接通过官网 longcat.ai 调用API通道。
五、开源规划
美团也相当厚道,宣布近期将全面开源三大核心资产:LongCat训练和推理底层的Infra分布式框架、自研的国产算力适配推理引擎,以及LongCat-2.0的完整模型权重(目前权重包正在上架)。这波开源的目标非常明确:降低国内开发者训练万亿级大模型的技术门槛,推动国产算力与大模型生态的协同发展。
六、行业意义
最后,聊聊这件事的行业意义。首先,算力自主突破——纯国产5万卡集群能稳定完成万亿参数模型的完整训练,意味着我们终于可以摆脱对海外高端GPU的依赖。其次,垂直场景标杆化——大厂自研大模型深度扎根代码和智能体赛道,这与通用对话模型是截然不同的路线,更接地气,也更务实。再次,普惠AI——极低的API定价加上完整的开源策略,让万亿级大模型的使用和二次开发成本大幅降低。最后,对美团自身而言,依托本地生活的海量数据和自研大模型能力,后续可以落地商家经营智能助手、配送调度AI、本地知识库客服以及研发自动化工具等内部业务场景,想象空间相当大。
