蚂蚁开源Ring-2.5-1T:首个混合线性架构的万亿参数模型
IT之家2月13日消息,蚂蚁集团百灵大模型于今日正式发布并开源其首个混合线性架构的万亿参数思考模型——Ring-2.5-1T。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
据介绍,作为迈向通用智能时代的关键一步,该团队在预训练与强化学习阶段对混合线性注意力架构进行了大规模扩展。一方面采用高效的1:7 MLA+Lightning Linear Attention架构,显著提升了模型的思维效率与探索空间;另一方面通过扩展强化学习与智能体环境规模,有效增强了模型的思考深度与长程执行能力。
相比此前发布的Ring-1T,Ring-2.5-1T在生成效率、思考深度和长程执行能力上均有显著提升:
高效生成:得益于高比例线性注意力机制,在超过32K生成长度场景下,显存占用降低超过10倍,吞吐量提升达3倍以上,尤其适合深度思考和长程执行任务。深度思考:在RLVR基础上引入密集奖励机制,对思考过程的严谨性进行反馈,使得Ring-2.5-1T在IMO 2025和CMO 2025测试中均达到金牌水平(自测结果)。长程执行:通过大规模全异步智能体强化学习训练,显著提升对复杂任务的长程自主执行能力,使Ring-2.5-1T能够轻松适配Claude Code等智能体编程框架和OpenClaw个人AI助手。

为评估Ring-2.5-1T的深度思考和长程执行能力,团队选取了具有代表性的开源思考模型(DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking)和闭源API(GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking)作为参照基准。
Ring-2.5-1T在数学、代码、逻辑等高难度推理任务(IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench、ARC-AGI-V2)和智能体搜索、软件工程、工具调用等长程任务执行(Gaia2-search、Tau2-bench、SWE-Bench Verified)上均达到了开源领先水平。
团队还额外测试了深度思考模式,通过在推理过程中扩展并行思考与总结,实现测试时扩展,从而有效提升推理的深度与广度。在IMO 2025(满分42分)中,Ring-2.5-1T获得35分,达到金牌水平;在CMO 2025(满分126分)中取得105分,显著高于金牌线(78分)及国家集训队入选线(87分)。
此外,Ling 2.5架构在Ling 2.0架构基础上引入了混合线性注意力架构。通过增量训练方式,将Ling 2.0架构的GQA升级为1:7的MLA+Lightning Linear结构。具体而言,团队基于此前发布的Ring-flash-linear-2.0技术路线,将部分GQA层改造为Lightning Linear Attention,以显著提升长程推理场景下的吞吐能力。为进一步压缩KV Cache,将其余GQA层近似转换为MLA,并对其中的QK Norm、Partial RoPE等特性进行了针对性适配,以增强Ling 2.5架构在混合注意力架构下的表达能力。

改造后,Ring-2.5-1T的激活参数量从51B提升至63B。但在混合线性注意力架构的支持下,其推理效率相比Ling 2.0仍实现了大幅提升。即便与激活参数仅为32B的KIMI K2架构相比,1T规模下的Ling 2.5架构在长程推理场景下的吞吐依然具有显著优势;且生成长度越长,吞吐优势越明显。


不过,蚂蚁集团也提到,这一版本模型在token效率与指令遵循方面仍存在不足,在面向更真实、更复杂任务的长程执行与实际交付能力上,也仍有较大的优化空间。团队将在后续版本中持续改进上述能力,并非常期待来自社区的使用反馈与建议。目前,Ring-2.5-1T的训练仍在持续推进中。完整技术报告将在下一版本发布后正式公开。
IT之家附地址如下:
Hugging Face
ModelScope
Ling Studio与ZenMux的Ring-2.5-1T Chat体验页和API服务将在近期上线。
相关攻略
快科技3月28日消息,近日,在2026中国科幻大会上,360集团创始人周鸿祎与科幻作家刘慈欣、中国科学院高能物理研究所研究员张双南同台,就人工智能对人类文明的影响、AI与科学研究的融合、人类未来的生
来源:环球网【环球网科技报道 记者 冯超男】“回望过去三载,AI经济完成了发展历程中的第一次范式跃迁,从移动互联网的流量经济迈入以大模型为核心的工具化时代。如今,行业浪潮奔涌向前,迎来了第二次跃迁,
3月27日,CFMS|MemoryS 2026峰会以“穿越周期,释放价值”为主题在深圳举办。本届峰会汇聚存储、CPU GPU、AI大模型、汽车等全球核心产业链生态企业,探索AI时代下,存储厂商、应用
3月28日消息,近日,百度贴吧中的抓虾吧因其独特的运行规则引发了广泛关注。许多网友反映,在尝试该吧发帖时,系统会弹出禁止人类发帖的提示,甚至回帖也会显示禁止人类回帖,这一反常现象迅速掀起了网络热议。
“培育发展未来能源、量子科技、具身智能、脑机接口、6G等未来产业。”政府工作报告连续第二年提到6G产业,标志着6G已成为国家战略布局的重要组成部分。然而,市场在期待之余,也不乏疑问:5G的许多愿景尚
热门专题
热门推荐
可通过电子税务局 、随申办App 小程序、个税APP三种方式查询下载个税纳税记录:电子税务局需登录后搜索或按路径进入,下载PDF用身份证后6位解密;随申办依托统一认证,支持直接保存
3月26日,在SEMICON China 2026“半导体智能制造-未来工厂”论坛上,一场关于半导体制造AI未来形态的思想碰撞引发行业瞩目。智现未来董事长兼CEO管健博士受邀登台,发表题为《从“+A
南都讯 记者李洁琼 3月28日,珠海天际航空科技有限公司在金湾区天章产业园开业。作为珠海低空经济产业的新锐力量,天际航空智能制造基地的投运,标志着金湾区在载人级飞行器制造领域迈出关键一步,为珠海“天
来源:中国新闻网中新社杭州3月27日电 (鲍梦妮)随着机器人产业发展以及春晚机器人表演等热点带动,今年以来,中国多地机器人租赁业务持续升温。在上海上线的全球首个开放式机器人租赁平台“擎天租”,自去年
大象新闻·大象财富记者 李莉 张迪驰315消费者权益日刚过,广东李女士在某平台购买的“全新”打印机频繁报错,维修无果。她查询最新质保发现,整机标注保修三年,系统却显示剩余保修期不足两年,经售后核实确





