游乐游手机版
首页/AI热点日报/热点详情

业界首个:美团LongCat-2.0国产芯片万亿参数模型

类型:热点整理2026-07-03
6月30日,美团正式发布新一代万亿参数大模型LongCat-2 0,并宣布对外开源。这无疑是当前国产算力赛道中一个极具关注度的信号。 LongCat-2 0被誉为业界首个在五万卡国产算力集群上完成全流程训练与推理的万亿参数级模型。其总参数量达1 6T,平均激活约48B,动态范围在33B至56B之间。

6月30日,美团正式发布新一代万亿参数大模型LongCat-2.0,并宣布对外开源。这无疑是当前国产算力赛道中一个极具关注度的信号。

业界首个:美团 LongCat-2.0 发布,国产芯片上跑出的万亿参数模型

LongCat-2.0被誉为业界首个在五万卡国产算力集群上完成全流程训练与推理的万亿参数级模型。其总参数量达1.6T,平均激活约48B,动态范围在33B至56B之间。模型从零开始预训练,原生支持100万Token的超长上下文——这一规格直接将门槛拉升至行业高位。

在正式版发布前,LongCat-2.0的预览版已通过OpenRouter平台和longcat.ai向全球开发者开放调用。截至目前,该模型已跻身OpenRouter全球大模型调用量前三,月调用量仅次于Hermes、Claude Code和OpenClaw——这显然是开发者用行动投票的结果。

预训练数据量超过30T tokens,涵盖中文、英文、多语言及代码等多种类型。真正的挑战在于,如何在万卡级别的国产算力集群上,从头到尾稳定、高效地完成训练任务。

那么,它是怎么做到的?LongCat团队从稳定性、正确性和效率三个维度,攻克了国产算力训练中的一系列核心难题:
- 稳定性方面,通过HCCL异常处理、弹性扩缩卡和自动故障恢复机制,将月均日故障率降低70%以上;
- 正确性方面,自研确定性算子、Bitwise一致性验证和参数检测,确保训练结果可靠,并在此基础上改进关键模块的计算精度,优化Reduce逻辑;
- 效率方面,通过流水线调度、显存优化和算子级控核,训练MFU直接提升1.5倍。

最终,LongCat实现稳态日吞吐超过1T tokens/天,完成了万亿参数MoE模型在国产算力上的稳定训练——这一成就此前在国内尚无先例。

再来看看推理端。LongCat-2.0在推理端围绕模型、算子、框架进行了协同优化:
- 利用大规模专家并行聚合访存带宽,支撑万亿参数MoE模型的低延迟解码;
- 将“零计算专家”机制融入专家并行通信流程,使路由到零专家的token真正避免不必要的传输与计算;
- 重点优化通信、Attention、GEMM等核心算子的调度,结合提前下发与权重预取等框架机制,进一步降低推理链路中的等待开销。

另一个值得关注的技术点是LongCat Sparse Attention(LSA)——稀疏注意力机制。在处理长文本时,它不再逐字逐句地扫描,而是智能筛选关键信息,将计算量从平方级降至线性级。因此,即便在100万Token的超长上下文中,模型依然能保持精准的信息定位与理解能力,避免“读到后面忘了前面”的问题。

代码任务中,不同token的复杂度差异显著:定义变量名与推导递归算法所需的算力截然不同。LongCat-2.0通过零计算专家实现token级的动态激活(33B~56B),简单token不消耗算力,复杂token则自动获得更多计算资源——兼顾高效与精准。

更重要的是,LongCat-2.0采用MOPD架构,融合了Agent、Reasoning、Interaction三组专家能力——Agent Experts主攻工具调用与自主纠错,Reasoning Experts深耕数学与STEM推理,Interaction Experts优化指令遵循与交互体验。推理时,门控网络根据任务类型动态调度最擅长的专家,而非简单地将参数混合。这一设计直接决定了它在编程、推理、交互等多个维度上的出色表现。

综合评测结果印证了这一点——LongCat-2.0在Code和General Agent场景中表现亮眼:

在编程能力方面:
- SWE-bench Pro(考察深层工程能力)得分59.5,领先Gemini 3.1 Pro(54.2)、GPT-5.5(58.6)和Claude Opus 4.6(57.3);
- SWE-bench Multilingual得分77.3,与Claude Opus 4.6(77.8)处于同一水平;
- 真实终端指令交互评测Terminal-Bench 2.1得分70.8,展现了在真实运维与开发终端任务中的稳定执行与纠错能力。

在真实办公场景的复杂任务处理方面:
- 搜索智能体评测集RWSearch得分78.8;
- 生产力场景评测集FORTE得分73.2;
- BrowseComp得分79.9——均达到或接近前沿闭源模型的水准,对企业级Agent落地而言,这已是实打实的可用级表现。

来源:https://www.ithome.com/0/970/320.htm

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。