6月30日,美团悄悄扔出一个重磅冲击波——正式发布并开源了新一代万亿参数大模型 LongCat-2.0。你可能会问,万亿参数是什么概念?这么说吧,这不仅是业界首个在五万卡国产算力集群上完成全流程训练与推理的万亿参数模型,它的总参数达到1.6T,平均激活约48B,动态范围在33B到56B之间灵活切换。更狠的是,原生支持1M超长上下文——这意味着什么?相当于能一口气读完一整本《三体》三部曲,还不带喘气的。
当然,数字只是表面。真正值得玩味的是背后的技术路线:在五万卡国产集群上跑通全流程,这本身就是对国产算力生态的一次极限压力测试。从训练到推理,没有依赖任何外援,全部自建闭环。而动态稀疏激活机制(平均48B)则暗示了它在推理效率上的取舍——不盲目堆参数,而是在“全才”与“专才”之间找平衡。

1M上下文长度也不是噱头。长文本处理一直是行业痛点,之前不少模型号称百万token,实际效果打折。这次美团直接开源,等于把验货权交给了全行业。是骡子是马,拉出来溜溜就知道了。从公开信息看,LongCat-2.0在多项长文档基准测试中表现突出,但更值得关注的是它在实际场景中的落地潜力——比如外卖配送的实时调度、海量评论的语义分析,这些才是美团真正的护城河。
一句话总结:国产大模型的军备竞赛,已经从“参数军备”转入“工程基建”阶段。LongCat-2.0的价值不只是模型本身,更在于它验证了一条完全自主可控的万亿参数模型生产线。至于能不能打,我们等着看后续的开源反馈和数据评测。
