蚂蚁开源Ring-2.5-1T:首个混合线性架构的万亿参数模型
IT之家2月13日消息,蚂蚁集团百灵大模型于今日正式发布并开源其首个混合线性架构的万亿参数思考模型——Ring-2.5-1T。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
据介绍,作为迈向通用智能时代的关键一步,该团队在预训练与强化学习阶段对混合线性注意力架构进行了大规模扩展。一方面采用高效的1:7 MLA+Lightning Linear Attention架构,显著提升了模型的思维效率与探索空间;另一方面通过扩展强化学习与智能体环境规模,有效增强了模型的思考深度与长程执行能力。
相比此前发布的Ring-1T,Ring-2.5-1T在生成效率、思考深度和长程执行能力上均有显著提升:
高效生成:得益于高比例线性注意力机制,在超过32K生成长度场景下,显存占用降低超过10倍,吞吐量提升达3倍以上,尤其适合深度思考和长程执行任务。深度思考:在RLVR基础上引入密集奖励机制,对思考过程的严谨性进行反馈,使得Ring-2.5-1T在IMO 2025和CMO 2025测试中均达到金牌水平(自测结果)。长程执行:通过大规模全异步智能体强化学习训练,显著提升对复杂任务的长程自主执行能力,使Ring-2.5-1T能够轻松适配Claude Code等智能体编程框架和OpenClaw个人AI助手。

为评估Ring-2.5-1T的深度思考和长程执行能力,团队选取了具有代表性的开源思考模型(DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking)和闭源API(GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking)作为参照基准。
Ring-2.5-1T在数学、代码、逻辑等高难度推理任务(IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench、ARC-AGI-V2)和智能体搜索、软件工程、工具调用等长程任务执行(Gaia2-search、Tau2-bench、SWE-Bench Verified)上均达到了开源领先水平。
团队还额外测试了深度思考模式,通过在推理过程中扩展并行思考与总结,实现测试时扩展,从而有效提升推理的深度与广度。在IMO 2025(满分42分)中,Ring-2.5-1T获得35分,达到金牌水平;在CMO 2025(满分126分)中取得105分,显著高于金牌线(78分)及国家集训队入选线(87分)。
此外,Ling 2.5架构在Ling 2.0架构基础上引入了混合线性注意力架构。通过增量训练方式,将Ling 2.0架构的GQA升级为1:7的MLA+Lightning Linear结构。具体而言,团队基于此前发布的Ring-flash-linear-2.0技术路线,将部分GQA层改造为Lightning Linear Attention,以显著提升长程推理场景下的吞吐能力。为进一步压缩KV Cache,将其余GQA层近似转换为MLA,并对其中的QK Norm、Partial RoPE等特性进行了针对性适配,以增强Ling 2.5架构在混合注意力架构下的表达能力。

改造后,Ring-2.5-1T的激活参数量从51B提升至63B。但在混合线性注意力架构的支持下,其推理效率相比Ling 2.0仍实现了大幅提升。即便与激活参数仅为32B的KIMI K2架构相比,1T规模下的Ling 2.5架构在长程推理场景下的吞吐依然具有显著优势;且生成长度越长,吞吐优势越明显。


不过,蚂蚁集团也提到,这一版本模型在token效率与指令遵循方面仍存在不足,在面向更真实、更复杂任务的长程执行与实际交付能力上,也仍有较大的优化空间。团队将在后续版本中持续改进上述能力,并非常期待来自社区的使用反馈与建议。目前,Ring-2.5-1T的训练仍在持续推进中。完整技术报告将在下一版本发布后正式公开。
IT之家附地址如下:
Hugging Face
ModelScope
Ling Studio与ZenMux的Ring-2.5-1T Chat体验页和API服务将在近期上线。
相关攻略
千问表格Agent可自动完成需求理解、步骤拆解与Excel生成全流程:通过任务规划拆解原子操作,自动检索权威政策数据,多模态解析图文文档,沙箱中生成验证公式代码,并基于多轮对话动态聚合约束条件生成结构化表格。 想让AI帮你搞定从理解需求、拆解步骤到生成Excel表格的全过程?千问表格Agent已经把
神译局是旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:当AI能在瞬间完乘人类200小时的工作,谁会成为新的“瓶颈”?一场来自METR的桌面演练揭示:未来的竞争格局正在发生根本性转变——纯粹的执行力将急速贬值,而人类的判断力与反馈效率,将成为唯一的决胜
快手推出AI桌面智能体KroWork,让电脑“听懂人话” 4月30日,一则消息在科技圈传开:快手正式推出了名为KroWork的AI桌面智能体产品,并且同步在国内外市场上线。有意思的是,它同时支持macOS和Windows两大主流桌面平台,覆盖面相当广。 那么,这款产品到底想解决什么问题?简单来说,它
AI的“AWS时刻”:让智能体从能跑变成能用 先看一个有趣的场景。就在不久前,Stratechery的Ben Thompson同时采访了OpenAI的Sam Altman和AWS的Matt Garman。当时外界还不知道,仅仅三天后,微软和OpenAI就会宣布修改长达数年的独家协议。但这场对话本身,
阿里通义千问推出Qwen-Agent框架,赋能开发者构建复杂AI智能体 1月4日,阿里云旗下的通义千问团队放出了一记新招:名为 Qwen-Agent 的全新 AI 框架正式亮相。它的核心定位很明确——以现有的 Qwen 语言模型为基石,支撑起一套能让智能体执行复杂任务的强大系统,并通过一系列高级功能
热门专题
热门推荐
爱玛电动车座垫开启指南:无钥匙方案与应急操作全解析 想要打开爱玛电动车的座垫,其实多数情况下并不需要钥匙。具体操作方法取决于您的车型配置与锁具设计。不同型号的电动车,其座垫开启方式存在显著差异。部分中高端车型已搭载电子按键或感应式座垫锁,只需轻按车把周边、仪表盘侧方或座垫边缘的实体按钮,座垫即可自动
小米MIX4升级澎湃OS 2 0指南:官方OTA直达,无需解锁Bootloader 对于小米MIX4用户而言,升级至全新的澎湃OS 2 0系统,过程异常简便。小米官方已将该机型纳入首批正式版全量推送计划,用户无需进行复杂的Bootloader解锁操作,即可通过无线升级(OTA)方式平滑过渡。整个升级
爱玛电动车车座开启全攻略:三种可靠方式详解 想要打开爱玛电动车的坐垫,其实方法多样且设计周全。厂家为用户提供了三种经过国家标准认证的可靠开启方案:经典的机械钥匙旋转、便捷的遥控器一键操作,以及面向未来的智能终端控制。绝大多数车型都在坐垫左后方区域配备了独立的物理钥匙孔,确保了基础开启的可靠性。中高端
自2025年起,SharpLink Gaming、Bitmine Immersion Tech、Bit Digital 与 BTCS Inc 四家美股公司通过大规模购入并质押 ETH,开创了“ETH 微策略”。 自2025年以来,美股市场出现了一股引人注目的新潮流。以SharpLink Gamin
路由器安装与设置的核心:三步闭环搞定网络连接 路由器安装后,Wi-Fi信号满格却显示“无网络访问”,这种情况确实令人困扰。但请先别急于断定设备损坏,绝大多数问题并非硬件故障,而是网络连接的“链路”在某个配置环节出现了中断。整个排查过程的核心,可以总结为“物理连通、参数匹配、逻辑生效”三步闭环法则。只





