蚂蚁开源万亿参数线性思考模型，获IMO金牌水平业界首例

首页

热心网友

转载

2026-02-13

智东西
作者程茜
编辑李水青

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

智东西2月13日消息，今天，蚂蚁集团开源全球首个基于混合线性架构的万亿参数思考模型Ring-2.5-1T。

根据最新信息，相比蚂蚁2025年10月发布的万亿级思考模型Ring-1T，Ring-2.5-1T在生成效率、推理深度和长时程任务执行能力三个关键维度上实现提升，且在长文本生成、数学推理与智能体任务执行上达到开源领先水平。

在生成效率上，Ring-2.5-1T在32K以上长文本生成场景中，对比上代模型访存规模降低至1/10，生成吞吐提升3倍以上。

在深度思考能力方面，该模型在国际数学奥林匹克竞赛（IMO 2025）和中国数学奥林匹克（CMO 2025）自测均达到金牌水平，IMO为35分、CMO为105分。

目前，该模型已经适配Claude Code等智能体框架与OpenClaw个人AI助理，支持多步规划与工具调用。

Ring-2.5-1T的模型权重与推理代码已在Hugging Face、ModelScope等主流开源平台发布，最新平台Chat体验页和API服务将在近期上线。

Hugging Face：https://huggingface.co/inclusionAI/Ring-2.5-1T

ModelScape：https://modelscope.cn/organization/inclusionAI

一、拿下多项开源SOTA，达IMO金牌水平

为了评估Ring-2.5-1T的深度思考与长时任务执行能力，蚂蚁研究人员选择了具有代表性的开源思考模型DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking和闭源API GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking作为比较。

蚂蚁集团公布的多项权威基准测试结果显示，Ring-2.5-1T在数学、编程和逻辑推理的IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench、ARC-AGI-V2等高难度推理任务以及Agent搜索、工具调用和软件工程Gaia2-search、Tau2-bench和SWE-Bench Verified等长时任务执行方面均实现了最先进的开源性能。

此外，蚂蚁还对深度思考（Heavy Thinking）模式下的模型性能进行了额外测试，Ring-2.5-1T在IMOAnswerBench、HMMT-25等数学竞赛推理基准和LiveCodeBench-v6代码生成基准中超越所有对比模型。

其中，在IMO 2025（满分42分）中，Ring-2.5-1T获得35分，达到金牌水平；在CMO 2025（满分126分）中，该模型获得105分，超过金牌分数线78分和国家队集训队选拔线87分。

研究人员比较了Ring-2.5-1T和Ring-1T的答案发现，前者在推理逻辑的严谨性、高级数学证明技术的应用以及答案表述的完整性方面均有提升。

在智能体搜索任务Gaia2-search中，Ring-2.5-1T在开源模型中取得了SOTA性能。Gaia2环境强调跨应用工具协作和复杂任务执行能力，Ring-2.5-1T在规划生成和多步工具调用方面均展现出较高的效率和准确性。

二、三大关键维度提升，能快速适配Claude Code、OpenClaw

相比蚂蚁2025年10月发布的万亿级思考模型Ring-1T，Ring-2.5-1T在生成效率、推理深度和长时程任务执行能力三个关键维度上有显著改进。

首先在生成效率方面，通过采用高比例线性注意力机制，Ring-2.5-1T将内存访问开销降低至1/10，并将超过32K token序列的生成吞吐量提高了3倍以上，适用于深度思考和长时程任务执行。

其次在深度思考层面，该模型在RLVR（基于可验证奖励的强化学习）基础上引入密集奖励机制，为推理过程提供严格性反馈，使Ring-2.5-1T同时达到IMO 2025和CMO 2025（自测）的金奖水平。

最后是长程任务执行，Ring-2.5-1T通过大规模完全异步智能体RL（强化学习）训练，增强了解决复杂任务的长时程自主执行能力，使其能快速适配Claude Code等智能体编程框架和OpenClaw个人AI助手。

三、引入混合线性注意力架构，可提升长程推理场景吞吐量

Ring-2.5-1T基于Ling 2.5架构，通过优化注意力机制，可提升长文本推理的效率与稳定性。

作为实现自主模型架构的关键进展，Ling 2.5架构在Ling 2.0架构的基础上引入了一种混合线性注意力架构。通过增量训练，研究人员将Ling 2.0架构中的GQA（分组查询注意力）升级为MLA（多头线性注意力）+Lightning Linear结构的1:7比例。

具体来说，基于其先前发布的Ring-flash-linear-2.0技术路线图，研究人员将部分GQA层转换为Lightning Linear注意力，以提升长时程推理场景中的吞吐量。

同时为了进一步压缩KV缓存，研究人员将剩余的GQA层近似转换为MLA，同时针对QK Norm（查询-核归一化）和Partial RoPE（部分旋转位置编码）等特征进行针对性改进，从而增强Ling 2.5架构的表达能力。

在此基础上，模型激活参数规模从前代的51B提升至63B，并且在混合线性注意力架构的支持下，其推理效率相比Ling 2.0仍实现大幅提升。

与仅具备32B激活参数的Kimi K2架构相比，在1T总参数量下，Ling 2.5架构在长序列推理任务中的吞吐表现优势显著，且随着生成长度增加，效率优势持续扩大。

▲在一台配备8块H20-3e GPU的机器上，批处理大小=64，比较不同生成长度下的解码吞吐量

▲在一台配备8块H200 GPU的机器上，批处理大小=64，比较不同生成长度下的解码吞吐量

结语：从短对话到复杂规划，大模型需突破长文本瓶颈

随着AI大模型应用从短对话向长文档处理、跨文件代码理解、复杂任务规划等场景扩展，Ring-2.5-1T可以缓解模型在长输出场景下计算开销高、推理速度慢的问题。

此前，传统架构在面对超长文本、多模态内容、复杂业务流程时，普遍面临算力成本高、响应延迟大、部署难度高等问题，蚂蚁百灵团队此次通过底层架构创新，或为行业提供一条兼顾性能、成本与扩展性的技术路径。

来源:https://www.163.com/dy/article/KLM6MQNO051180F7.html

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：马斯克回应xAI联创离职潮：组织进化的深层解读下一篇：马年汽车业破局前行：以“和光同尘”之姿开启新征程

相关攻略

业界动态

RPA入门需要编程基础吗

探讨RPA（机器人流程自动化）时，一个普遍被提及的问题是：学习和应用RPA需要编程基础吗？答案并非绝对。这主要取决于三个核心维度：所选RPA工具的特性、待自动化流程的复杂程度，以及实施者自身的技术背景。下面我们将逐一深入分析。一、RPA平台与编程需求不同RPA厂商提供的平台，其技术门槛差异显著

热心网友

05.14

南京大学与伦敦大学学院联合发布编程助手推理能力评估新基准

南京大学与伦敦大学学院联合研究团队近日发布了一项突破性成果，为精准评估大型语言模型在代码生成与编程任务中的真实能力提供了全新框架。相关研究论文《CONTEXTBENCH: 评估代码大模型上下文推理能力的基准》已正式发表于预印本平台arXiv，论文编号为arXiv:2602 05892v2。随着AI

热心网友

05.12

科技数码

学生创意编程作品虚拟拼豆机从失败到国际夺冠之路

苹果Swift学生编程挑战赛揭晓，江苏四名学生获奖。作品涵盖海洋公益游戏、手势控制音乐应用、虚拟拼豆机及机器人实验室游戏，展现了年轻开发者用代码表达创意与解决实际问题的能力。赛事允许使用AI工具辅助开发，但强调批判性思维与原创力仍是核心价值。

热心网友

05.10

编程语言

编程入门指南从零基础到理解核心概念

编程十年的一点分享在软件开发的路上走过十几年，从一个爱好者到以此为业，有些体会或许值得聊聊，就当是抛砖引玉吧。最早接触编程，是从BASIC和C语言开始的。工作后，随着需要，陆续学习了dBase、Access这类桌面数据库的开发。真正以开发为职业，可以说始于FoxPro 5 0，之后技术栈随着项目

热心网友

05.07

编程语言

编程入门指南什么是编程及其核心概念

编程是什么？在软件行业沉浸多年，回头一想，似乎很少严肃地追问过这个最根本的问题：到底什么是编程？今天，就让我们来好好探讨一下。如果翻开教科书，你会找到这样的标准答案：编程，就是为解决特定问题，使用某种程序设计语言编写代码，并最终让计算机输出结果的过程。其核心在于，人类必须将解决问题的思路、方法和

热心网友

05.07

热门推荐

科技数码

特斯拉CEO马斯克安保费用达480万美元同比大幅增长71%

特斯拉2025财年为首席执行官马斯克支付的个人安保费用达480万美元，较前一年增长71%。今年头两月支出同比激增超160%。该费用仅为其安保开支一部分，其名下其他企业也分担相关成本。费用增长源于投资者呼吁及本人确认的必要性，其日常安保规格极高，常由约20名保镖及医护人员随行。

热心网友

05.14

web3.0

HATCHY币空投教程：如何免费领取HatchyPocket NFT

HatchyPocket是融合DeFi与NFT的链上游戏平台，其代币HATCHY用于支付、治理与激励。玩家可孵化收集虚拟宠物，资产基于区块链。获取免费空投需关注官方社交渠道、参与测试网活动或贡献社区内容，但需注意安全防范与数量限制。该项目展现了游戏与区块链结合的新模式。

热心网友

05.14

科技数码

京东AI技术如何赋能企业数字化转型与智能升级

京东启动大规模数据采集计划，依托数十万员工与线下业务网络，在真实服务场景中采集超千万小时视频数据，构建高质量具身智能训练数据集。此举旨在破解物理AI落地的数据瓶颈，将日常履约场景转化为数据源头，为机器人从实验室走向现实提供关键支撑。

热心网友

05.14

游戏资讯

受枷者三套满分阵容推荐平民玩家通关攻略详解

还在为《无期迷途》受枷者关卡发愁？小兵无视阻挡快速推进，BOSS物理抗性极高，防线频频失守？别担心，本文将为你详细解析三套高适配阵容攻略，助你轻松通关。即便是零氪、微氪玩家，也能稳定获取24万高分奖励！法系速杀流：开局秒核，一击制胜应对受枷者关卡，两大核心难点在于：无视阻挡的杂兵推进速度极快，而

热心网友

05.14

游戏资讯

Warframe指挥官新手入门第一关操作技巧完全指南

握紧你的武器，指挥官！Vor的战利品之门已经开启——这不仅仅是一个新手任务，更是你蜕变为一名真正Tenno战士的震撼序章。无需担心经验不足，本关卡专为初入《星际战甲》宇宙的你设计，全程由引导者Lotus亲自指引。浩瀚的星际战甲世界，此刻正式为你拉开帷幕！核心操作精通：位移如风，攻防一体任务开始，

热心网友

05.14