蚂蚁开源Ring-1T模型:万亿参数思考逼近GPT-5
10月14日凌晨,蚂蚁集团正式发布万亿参数级思考模型Ring-1T,不仅公开了完整模型权重,还同步开源了详细的训练配方。这款模型在9月底开放的预览版Ring-1T-preview基础上,继续采用大规模可验证奖励强化学习(RLVR)技术进行深度训练,有效提升了万亿基座模型的自然语言推理性能。同时通过RLHF对齐优化,模型在各类任务中的表现更为均衡稳定。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
为进一步挖掘模型在复杂数学推理方面的潜力,百灵技术团队尝试将Ring-1T接入多智能体框架AWorld,使用纯自然语言推理解答IMO2025国际数学奥林匹克竞赛试题。实验结果表明,该模型仅一次尝试就成功解答出第1、3、4、5题,达到了相当于IMO银牌的水平,成为全球首个能够获得国际奥数奖项的开源AI系统。在第三次尝试解答第2题几何证明时,Ring-1T给出了接近完美的推理过程;而在众多顶尖模型纷纷失利的第6题中,其最终答案"4048"与Gemini 2.5 Pro结果一致(正确答案为2112)。作为专业思考模型,Ring-1T在通用能力方面同样表现亮眼:在"Arena-Hard V2"人类偏好对齐测试中,以81.59%的成功率位居开源模型首位,紧追GPT-5-Thinking(High)82.91%的成绩;在专业医疗问答基准HealthBench测评中,也取得了开源领域的最高分。

(Ring-1T与业界代表性思考模型的性能横评)
训练万亿参数级思考模型面临的核心挑战在于训练与推理阶段的精度差异问题——由于实现细节不同导致的精度不一致往往引发训练崩溃。为此,蚂蚁研发团队独创了"棒冰(icepop)"算法,通过带掩码的双向截断技术将训练-推理分布差异控制在较低水平,确保长序列、长周期训练的稳定性。针对万亿参数模型强化学习的特殊需求,团队还自主研发了高性能强化学习系统ASystem(内含已开源的高性能强化学习框架AReaL),重点优化了显存管理与权重交换机制,实现了单机显存碎片的秒级回收和权重的零冗余交换,使得大规模强化学习训练成为常态化操作。

(图左:GRPO训推差异随着训练成指数上升,icepop较为平稳;图右:训推差异最大值,GRPO随着训练上升非常明显,icepop维持在较低水位)
此次发布的Ring-1T继续基于Ling 2.0架构的1T基础模型进行后训练。该架构融合了高度稀疏的MoE设计、1/32的专家激活比、FP8混合精度以及MTP等先进特性,确保了训练与推理的高效性。在后训练阶段,百灵团队通过LongCoT-SFT、RLVR与RLHF多阶段协同训练,显著增强了模型在复杂推理、指令遵循和创意写作等领域的综合能力。
据百灵团队介绍,Ring-1T是其在万亿参数思考模型领域的首次探索,后续将持续优化模型性能。目前用户可通过HuggingFace、魔搭社区获取模型资源,也可通过蚂蚁百宝箱等平台进行在线体验。

截至目前,蚂蚁百灵大模型系列已累计发布18款不同规模的模型,形成了从160亿到1万亿参数的全系列产品矩阵,其中包括两款万亿级参数模型——通用大语言模型Ling-1T与思考模型Ring-1T。随着这两款重量级模型的推出,百灵大模型正式迈入2.0发展阶段。
热门专题
热门推荐
《全面战争:中世纪3》:经典延续,如何平衡怀旧与创新? 近期,《全面战争:中世纪3》的项目负责人帕维尔·沃伊斯坦然指出,要打造一款真正优秀的续作,绝不能仅仅依赖对前作模式的简单复刻。这一观点引人深思——尽管《中世纪2:全面战争》至今仍在策略游戏爱好者心中占据着经典地位,但开发团队此次显然决心跳出“照
雷鸟X3 Pro斩获AWE艾普兰创新大奖,开启全民AR生活新篇章 在上海新国际博览中心隆重揭幕的2026年中国家电及消费电子博览会(AWE)上,前沿AI科技与未来生活愿景激情碰撞。全球消费级AR领导品牌雷鸟创新,以其里程碑式的表现,定义了行业发展的新方向。 通过“顶尖硬件科技+顶级文化IP”的双轨战
借力AWE2026“一展双区”,MOVA双区协同、震撼登场 备受瞩目的科技盛会——2026年中国家电及消费电子博览会(AWE),于3月12日至15日在上海盛大举办。本届AWE展会首次创新采用“一展双区”的展览模式,主会场位于上海新国际博览中心,分会场则设于上海东方枢纽国际商务合作区,两大展区高效联动
冰结师技能全解析 踏入2026年,《地下城与勇士》中的冰结师职业,其技能体系已构建得更为成熟与强大。无论是在副本中高效清理海量怪物,还是在决斗场与高手玩家周旋,这个职业都能凭借其独特的冰霜艺术掌控战局。刷图时,酷寒的范围法术可瞬间清屏;而在PVP竞技中,一套将冻结控制与瞬间爆发完美衔接的连招,往往让
iPhone 18 Pro系列模具不变,屏幕形态将与iPhone 17 Pro保持一致 备受期待的屏下Face ID组件小型化设计与灵动岛区域缩窄方案,预计将被推迟至后续迭代机型中正式应用。 近期,关于iPhone 18 Pro系列的技术传闻持续引发行业关注,尤其在显示与解锁设计领域传言甚多。多方消





