蚂蚁开源Ring-1T模型：万亿参数思考逼近GPT-5

时间：2025-10-14 13:09

10月14日凌晨，蚂蚁集团正式推出万亿参数思考模型Ring-1T，并全面开源模型权重、训练配方。Ring-1T在9月30日开源的预览版Ring-1T-preview基础上，持续扩展大规模可验证奖励强

10月14日凌晨，蚂蚁集团正式发布万亿参数级思考模型Ring-1T，不仅公开了完整模型权重，还同步开源了详细的训练配方。这款模型在9月底开放的预览版Ring-1T-preview基础上，继续采用大规模可验证奖励强化学习（RLVR）技术进行深度训练，有效提升了万亿基座模型的自然语言推理性能。同时通过RLHF对齐优化，模型在各类任务中的表现更为均衡稳定。

为进一步挖掘模型在复杂数学推理方面的潜力，百灵技术团队尝试将Ring-1T接入多智能体框架AWorld，使用纯自然语言推理解答IMO2025国际数学奥林匹克竞赛试题。实验结果表明，该模型仅一次尝试就成功解答出第1、3、4、5题，达到了相当于IMO银牌的水平，成为全球首个能够获得国际奥数奖项的开源AI系统。在第三次尝试解答第2题几何证明时，Ring-1T给出了接近完美的推理过程；而在众多顶尖模型纷纷失利的第6题中，其最终答案"4048"与Gemini 2.5 Pro结果一致（正确答案为2112）。作为专业思考模型，Ring-1T在通用能力方面同样表现亮眼：在"Arena-Hard V2"人类偏好对齐测试中，以81.59%的成功率位居开源模型首位，紧追GPT-5-Thinking(High)82.91%的成绩；在专业医疗问答基准HealthBench测评中，也取得了开源领域的最高分。

蚂蚁发布并开源万亿参数思考模型Ring-1T，综合能力逼近GPT-5

（Ring-1T与业界代表性思考模型的性能横评）

训练万亿参数级思考模型面临的核心挑战在于训练与推理阶段的精度差异问题——由于实现细节不同导致的精度不一致往往引发训练崩溃。为此，蚂蚁研发团队独创了"棒冰（icepop）"算法，通过带掩码的双向截断技术将训练-推理分布差异控制在较低水平，确保长序列、长周期训练的稳定性。针对万亿参数模型强化学习的特殊需求，团队还自主研发了高性能强化学习系统ASystem（内含已开源的高性能强化学习框架AReaL），重点优化了显存管理与权重交换机制，实现了单机显存碎片的秒级回收和权重的零冗余交换，使得大规模强化学习训练成为常态化操作。

蚂蚁发布并开源万亿参数思考模型Ring-1T，综合能力逼近GPT-5

（图左：GRPO训推差异随着训练成指数上升，icepop较为平稳；图右：训推差异最大值，GRPO随着训练上升非常明显，icepop维持在较低水位）

此次发布的Ring-1T继续基于Ling 2.0架构的1T基础模型进行后训练。该架构融合了高度稀疏的MoE设计、1/32的专家激活比、FP8混合精度以及MTP等先进特性，确保了训练与推理的高效性。在后训练阶段，百灵团队通过LongCoT-SFT、RLVR与RLHF多阶段协同训练，显著增强了模型在复杂推理、指令遵循和创意写作等领域的综合能力。

据百灵团队介绍，Ring-1T是其在万亿参数思考模型领域的首次探索，后续将持续优化模型性能。目前用户可通过HuggingFace、魔搭社区获取模型资源，也可通过蚂蚁百宝箱等平台进行在线体验。

蚂蚁发布并开源万亿参数思考模型Ring-1T，综合能力逼近GPT-5

截至目前，蚂蚁百灵大模型系列已累计发布18款不同规模的模型，形成了从160亿到1万亿参数的全系列产品矩阵，其中包括两款万亿级参数模型——通用大语言模型Ling-1T与思考模型Ring-1T。随着这两款重量级模型的推出，百灵大模型正式迈入2.0发展阶段。

来源：https://www.leiphone.com/category/industrynews/UyRI3zy8bX6qJ8Lf.html

蚂蚁Ring1T 开源思考模型数学推理奥赛

上一篇追觅双机械臂空调：破解传统空调痛点，智慧新风打造舒适空间 下一篇联想moto品牌官宣张凌赫出任品牌大使兼代言人

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

科技数码 · 2026-07-01

宇树验证具身智能新趋势核心战场不止于模型

具身智能领域的竞争，正步入一个全新的发展阶段。近日，宇树科技正式发布了其WVLA2 0具身大模型，并公开展示了无需远程遥操的实机演示。这一举动向业界释放了一个明确信号：当前这场竞赛的核心壁垒，或许已不再是谁拥有更大的模型参数，而是谁的架构设计更为精巧、谁能更深度地实现软硬件一体化、谁能积累更海量的实

科技数码 · 2026-07-01

智元精灵G2机器人产线直播完成64828件成功率99.99%

99 99%的任务成功率——这是智元机器人在6月23日至28日期间，将精灵G2机器人直接部署到真实的平板量产质检产线，并全程公开直播后，交出的最具说服力的答案。让我们关注这场直播的硬核数据：连续64小时不间断作业，产线累计完成17625件产品检测，机器人累计执行64828次操作，任务成功率精确达到

科技数码 · 2026-07-01

纯电动Cayenne首秀保时捷驾驶中心全国路演

保时捷正在加速推进其电动化转型战略。继纯电动Cayenne与Gen 3 Evo赛车在三亚街道赛共同亮相后，仅过了一周时间，这款全新纯电SUV便驶入中国专业赛道场景——这一次，地点换成了永久性专业赛道。回顾2026年北京车展，保时捷首款纯电动Cayenne Turbo正式首发并公布了售价。新车提供两

科技数码 · 2026-07-01

AI工具能否成为高价志愿咨询纠纷的破局之道

广东高考成绩公布后，志愿填报这场“第二次大考”随即全面开启。对众多家庭而言，这或许比高考本身更令人心力交瘁——时间紧迫、信息庞杂、选项繁多，每一步都如履薄冰。教育部近日发布预警，严厉批评那些漫天要价的“志愿规划师”，直言其本质上就是忽悠。然而每年踩坑的案例仍屡见不鲜，网上信息真假混杂，不同机构给出的

科技数码 · 2026-07-01

头部企业全产业链布局锂电池回收循环

近年来，伴随新能源汽车产业的爆发式增长，早期投入使用的动力电池正迎来集中退役高峰，锂电池回收行业因此进入一个至关重要的“窗口期”。这些退役电池中富含锂、钴等珍贵金属资源——尤其是被誉为“白色石油”的锂，正从地下矿藏逐渐转向我们身边的“城市矿山”，从“一次性使用”的线性消耗模式，迈向“循环再生”的可持