游乐游手机版
首页/科技数码/文章详情

蚂蚁开源Ring-2.5-1T:首个混合线性架构的万亿参数模型

时间:2026-02-13 14:55
IT之家 2 月 13 日消息,今日,蚂蚁集团百灵大模型发布并开源首个混合线性架构的万亿参数思考模型 ——Ring-2 5-1T。据介绍,作为迈向通用智能体时代的关键步骤,团队将混合线性注意力架构在

IT之家2月13日消息,蚂蚁集团百灵大模型于今日正式发布并开源其首个混合线性架构的万亿参数思考模型——Ring-2.5-1T。

据介绍,作为迈向通用智能时代的关键一步,该团队在预训练与强化学习阶段对混合线性注意力架构进行了大规模扩展。一方面采用高效的1:7 MLA+Lightning Linear Attention架构,显著提升了模型的思维效率与探索空间;另一方面通过扩展强化学习与智能体环境规模,有效增强了模型的思考深度与长程执行能力。

相比此前发布的Ring-1T,Ring-2.5-1T在生成效率、思考深度和长程执行能力上均有显著提升:

高效生成:得益于高比例线性注意力机制,在超过32K生成长度场景下,显存占用降低超过10倍,吞吐量提升达3倍以上,尤其适合深度思考和长程执行任务。深度思考:在RLVR基础上引入密集奖励机制,对思考过程的严谨性进行反馈,使得Ring-2.5-1T在IMO 2025和CMO 2025测试中均达到金牌水平(自测结果)。长程执行:通过大规模全异步智能体强化学习训练,显著提升对复杂任务的长程自主执行能力,使Ring-2.5-1T能够轻松适配Claude Code等智能体编程框架和OpenClaw个人AI助手。


为评估Ring-2.5-1T的深度思考和长程执行能力,团队选取了具有代表性的开源思考模型(DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking)和闭源API(GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking)作为参照基准。

Ring-2.5-1T在数学、代码、逻辑等高难度推理任务(IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench、ARC-AGI-V2)和智能体搜索、软件工程、工具调用等长程任务执行(Gaia2-search、Tau2-bench、SWE-Bench Verified)上均达到了开源领先水平。

团队还额外测试了深度思考模式,通过在推理过程中扩展并行思考与总结,实现测试时扩展,从而有效提升推理的深度与广度。在IMO 2025(满分42分)中,Ring-2.5-1T获得35分,达到金牌水平;在CMO 2025(满分126分)中取得105分,显著高于金牌线(78分)及国家集训队入选线(87分)。

此外,Ling 2.5架构在Ling 2.0架构基础上引入了混合线性注意力架构。通过增量训练方式,将Ling 2.0架构的GQA升级为1:7的MLA+Lightning Linear结构。具体而言,团队基于此前发布的Ring-flash-linear-2.0技术路线,将部分GQA层改造为Lightning Linear Attention,以显著提升长程推理场景下的吞吐能力。为进一步压缩KV Cache,将其余GQA层近似转换为MLA,并对其中的QK Norm、Partial RoPE等特性进行了针对性适配,以增强Ling 2.5架构在混合注意力架构下的表达能力。


改造后,Ring-2.5-1T的激活参数量从51B提升至63B。但在混合线性注意力架构的支持下,其推理效率相比Ling 2.0仍实现了大幅提升。即便与激活参数仅为32B的KIMI K2架构相比,1T规模下的Ling 2.5架构在长程推理场景下的吞吐依然具有显著优势;且生成长度越长,吞吐优势越明显。



不过,蚂蚁集团也提到,这一版本模型在token效率与指令遵循方面仍存在不足,在面向更真实、更复杂任务的长程执行与实际交付能力上,也仍有较大的优化空间。团队将在后续版本中持续改进上述能力,并非常期待来自社区的使用反馈与建议。目前,Ring-2.5-1T的训练仍在持续推进中。完整技术报告将在下一版本发布后正式公开。

IT之家附地址如下:

Hugging Face

ModelScope

Ling Studio与ZenMux的Ring-2.5-1T Chat体验页和API服务将在近期上线。

来源:https://www.163.com/dy/article/KLLD23CO0511B8LM.html
上一篇岚图上市倒计时:2025年冲刺349亿营收10亿盈利,武汉迎关键IPO 下一篇太阳系逆向行星现身!科学家如何解释这一反常发现
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
宇树验证具身智能新趋势核心战场不止于模型
科技数码 · 2026-07-01

宇树验证具身智能新趋势核心战场不止于模型

具身智能领域的竞争,正步入一个全新的发展阶段。近日,宇树科技正式发布了其WVLA2 0具身大模型,并公开展示了无需远程遥操的实机演示。这一举动向业界释放了一个明确信号:当前这场竞赛的核心壁垒,或许已不再是谁拥有更大的模型参数,而是谁的架构设计更为精巧、谁能更深度地实现软硬件一体化、谁能积累更海量的实

智元精灵G2机器人产线直播完成64828件成功率99.99%
科技数码 · 2026-07-01

智元精灵G2机器人产线直播完成64828件成功率99.99%

99 99%的任务成功率——这是智元机器人在6月23日至28日期间,将精灵G2机器人直接部署到真实的平板量产质检产线,并全程公开直播后,交出的最具说服力的答案。 让我们关注这场直播的硬核数据:连续64小时不间断作业,产线累计完成17625件产品检测,机器人累计执行64828次操作,任务成功率精确达到

纯电动Cayenne首秀保时捷驾驶中心全国路演
科技数码 · 2026-07-01

纯电动Cayenne首秀保时捷驾驶中心全国路演

保时捷正在加速推进其电动化转型战略。继纯电动Cayenne与Gen 3 Evo赛车在三亚街道赛共同亮相后,仅过了一周时间,这款全新纯电SUV便驶入中国专业赛道场景——这一次,地点换成了永久性专业赛道。 回顾2026年北京车展,保时捷首款纯电动Cayenne Turbo正式首发并公布了售价。新车提供两

AI工具能否成为高价志愿咨询纠纷的破局之道
科技数码 · 2026-07-01

AI工具能否成为高价志愿咨询纠纷的破局之道

广东高考成绩公布后,志愿填报这场“第二次大考”随即全面开启。对众多家庭而言,这或许比高考本身更令人心力交瘁——时间紧迫、信息庞杂、选项繁多,每一步都如履薄冰。教育部近日发布预警,严厉批评那些漫天要价的“志愿规划师”,直言其本质上就是忽悠。然而每年踩坑的案例仍屡见不鲜,网上信息真假混杂,不同机构给出的

头部企业全产业链布局锂电池回收循环
科技数码 · 2026-07-01

头部企业全产业链布局锂电池回收循环

近年来,伴随新能源汽车产业的爆发式增长,早期投入使用的动力电池正迎来集中退役高峰,锂电池回收行业因此进入一个至关重要的“窗口期”。这些退役电池中富含锂、钴等珍贵金属资源——尤其是被誉为“白色石油”的锂,正从地下矿藏逐渐转向我们身边的“城市矿山”,从“一次性使用”的线性消耗模式,迈向“循环再生”的可持