蚂蚁开源Ring-2.5：首个万亿参数混合线性架构思考模型

首页

热心网友

转载

2026-02-13

2月13日，蚂蚁集团百灵大模型团队正式发布了首个采用混合线性架构的万亿参数思考模型——Ring-2.5-1T，并宣布开源。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

据介绍，作为迈向通用智能时代的关键一步，研发团队将混合线性注意力架构在预训练和强化学习阶段均进行了大规模扩展。一方面，团队通过高效的1:7 MLA结合Lightning Linear Attention架构，显著提升了模型的思考效率与探索空间；另一方面，借助扩展强化学习与智能体环境规模，进一步增强了模型的思考深度与长程执行能力。

与先前发布的Ring-1T相比，Ring-2.5-1T在生成效率、思考深度和长程执行能力上均有显著提升：

高效生成：得益于高比例线性注意力机制，当生成长度超过32K时，模型显存占用降低超过10倍，生成吞吐量提升3倍以上，特别适合需要深度思考与长程执行的任务场景。

深度思考：在RLVR基础上引入密集奖励机制，通过反馈思考过程的严谨性，使Ring-2.5-1T在IMO 2025和CMO 2025两项国际数学竞赛中均达到金牌水平。

长程执行：通过大规模全异步智能体强化学习训练，模型在复杂任务的长程自主执行能力得到显著提升，使得Ring-2.5-1T能够轻松适配Claude Code等智能体编程框架和OpenClaw个人AI助手。

蚂蚁集团开源Ring-2.5-1T：首个混合线性架构万亿参数思考模型

为评估Ring-2.5-1T的深度思考与长程执行能力，团队选取了具有代表性的开源思考模型和闭源API作为参照基准。

Ring-2.5-1T在数学、代码、逻辑等高难度推理任务和智能体搜索、软件工程、工具调用等长程任务执行上均达到开源领先水平。

团队还额外测试了深度思考模式，通过在推理过程中扩展并行思考与总结，实现测试时扩展，从而有效提升推理的深度与广度。在IMO 2025中，Ring-2.5-1T获得35分，达到金牌水平；在CMO 2025中取得105分，显著高于金牌线及国家集训队入选线。

此外，Ling 2.5架构在Ling 2.0架构基础上引入了混合线性注意力架构。通过增量训练方式，将Ling 2.0架构的GQA升级为1:7的MLA结合Lightning Linear结构。具体而言，团队基于此前发布的Ring-flash-linear-2.0技术路线，将部分GQA层改造为Lightning Linear Attention，以显著提升长程推理场景下的吞吐能力。为进一步压缩KV Cache，将其余GQA层近似转换为MLA，并对其中的QK Norm、Partial RoPE等特性进行了针对性适配，以增强Ling 2.5架构在混合注意力架构下的表达能力。

蚂蚁集团开源Ring-2.5-1T：首个混合线性架构万亿参数思考模型

改造后，Ring-2.5-1T的激活参数量从51B提升至63B。但在混合线性注意力架构的支持下，其推理效率相比Ling 2.0仍实现大幅提升。即便与激活参数仅为32B的KIMI K2架构相比，1T规模下的Ling 2.5架构在长程推理场景下的吞吐依然具有显著优势；且生成长度越长，吞吐优势越明显。

蚂蚁集团开源Ring-2.5-1T：首个混合线性架构万亿参数思考模型

不过，蚂蚁集团也提到，这一版本模型在token效率与指令遵循方面仍存在不足，在面向更真实、更复杂任务的长程执行与实际交付能力上，也仍有较大的优化空间。团队将在后续版本中持续改进上述能力，并非常期待来自社区的使用反馈与建议。目前，Ring-2.5-1T的训练仍在持续推进中。完整技术报告将在下一版本发布后正式公开。

模型发布地址如下：

Hugging Face

ModelScope

Ling Studio与ZenMux的Ring-2.5-1T Chat体验页面和API服务将在近期上线。

来源:https://tech.ifeng.com/c/8qi50HKJ3P0

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：Seedream 5.0 Lite发布：实时检索能力提升智能图像创作下一篇：又一家万亿级独角兽？AI新贵如何改写行业格局