美团LongCat-2.0正式开源:万亿参数模型,全栈国产算力跑通
2025年6月30日,美团正式宣布开源其新一代万亿级参数大模型——LongCat-2.0。这不仅是又一款大模型,更具里程碑意义:它是业界首个完全依托五万张国产AI加速卡集群完成训练与推理全流程的万亿参数模型,总参数量高达1.6T(平均激活参数约48B,动态激活范围33B至56B),并原生支持最长100万Token的超长上下文处理能力。

此前,LongCat-2.0预览版已在OpenRouter平台上线。上线后单月调用量迅速攀升至全球前三,在Hermes、Claude Code等主流开发者生态中表现抢眼,目前已跻身全球范围内最受开发者欢迎的Agent专属大模型之列。
此次发布的意义远超一个模型本身。它标志着我国自主算力在超大规模分布式训练领域取得了关键性突破。自2023年启动研发以来,LongCat(龙猫)团队历时三年,系统攻克了算子兼容适配、集群通信效率优化以及分布式系统长期稳定性等底层技术难题。通过自研的确定性计算算子与弹性容错恢复机制,团队成功将集群月均每日故障率压降至原有水平的30%以下,稳定运行状态下的日吞吐量突破1T tokens。

在模型架构层面,LongCat-2.0深度聚焦真实场景下的Agentic Coding任务需求。它创新引入了线性稀疏注意力机制(LSA),显著降低了长文本建模的计算复杂度;同时融合了零计算开销专家路由策略与MOPD多专家协同融合架构,实现了细粒度的Token级动态专家激活。这一系列组合设计,使其在代码理解、数学逻辑推演以及跨文档长程信息检索等高难度办公类任务中展现出卓越性能。在SWE-bench Pro等权威编程能力评测中,综合得分甚至超越了GPT-5.5与Claude Opus4.6。可以说,这为AI Agent从概念验证迈向规模化落地与业务流程重构,打下了一个相当扎实的基础。

