蚂蚁Ring-1T模型开源:IMO银牌水平,性能逼近GPT-5
蚂蚁集团旗下百灵团队近日在人工智能领域获得重要进展,完全自研的万亿参数思考模型Ring-1T正式推出,同时公开了模型权重与训练框架。该模型采用大规模可验证奖励强化学习技术,在自然语言推理、复杂数学求解等核心功能上表现优异,成为全球首款达到国际数学奥林匹克竞赛获奖水准的开源系统。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
在数学推理能力测试环节,研究团队将Ring-1T接入多智能体框架AWorld,通过纯自然语言推理方式解答IMO2025试题。测试结果显示,模型首次尝试便成功破解第1、3、4、5题,达到银牌水平;在第三次尝试中,其对第2题几何证明的演绎过程获得接近完美的评分。虽然第六题给出的"4048"与实际答案"2112"存在差距,但该成绩已与顶级商业模型Gemini 2.5 Pro相当,而同期参与测试的其他主流模型在这道题上几乎全部失误。
技术架构方面,Ring-1T通过两项创新突破行业限制。针对万亿参数模型普遍存在的训练与推理精度差异问题,研发团队提出"棒冰"算法,运用带掩码的双向截断技术将训练-推理分布差异降到最低,保障长序列训练的稳定运行。在强化学习系统优化上,自研的ASystem平台(内含开源框架AReaL)通过内存碎片毫秒级回收、权重零冗余交换等技术,使单机训练效率提升三倍,让大规模强化学习训练成为常规操作。
综合能力评估表明,Ring-1T在多项权威测试中表现突出。在"人类偏好对齐"测试Arena-Hard V2中,模型以81.59%的成功率位列开源模型首位,与GPT-5-Thinking(High)的82.91%仅一步之遥;在医疗问答专项测评HealthBench中,更是以明显优势领跑开源领域。这些成果验证了模型在专业严谨场景下的可靠表现与适应能力。
产品体系建设方面,蚂蚁百灵团队已构建覆盖160亿到1万亿参数的完整模型系列。继9月底发布预览版Ring-1T-preview后,此次推出的完整版Ring-1T标志着团队在思考模型领域的首次成功实践。特别值得注意的是,10月初发布的万亿参数通用大模型Ling-1T作为非思考型模型,与Ring-1T形成互补,共同构筑起蚂蚁集团的大模型技术体系。
目前,开发者可通过HuggingFace、魔搭社区等平台获取Ring-1T模型资源,并使用蚂蚁百宝箱等工具进行在线体验。百灵团队表示,后续版本将持续完善模型性能,重点加强复杂逻辑推理和跨领域知识迁移能力。随着18款模型的逐步发布,蚂蚁集团在万亿参数大模型领域的技术领先地位得到进一步加强。
热门专题
热门推荐
4月3日消息,今日,OPPO官微宣布,OPPO Find X9s Pro将首发新一代1nit明眸护眼屏,宣称全场景都护眼。据悉,这块屏幕来自新一代天马天工屏,搭载全新U9 Pro发光基材,从材料、器
Word行距异常增大可按五步解决:一、重置段前段后间距为0并设单倍行距;二、改用固定值行距(如小四号设18磅);三、清除样式继承并修复Normal模板;四、禁用自动格式更正干扰项;
汽车4月3日消息,4月3日,“年轻人第一台GT”比亚迪2026款海豹06GT新车交付仪式在深圳举行,作为海洋网又一搭载第二代刀片电池和最新闪充技术的重磅车型,上市售价12 89万元-16 99万元,
汽车4月3日消息,广汽埃安宣布将于 4 月 16 日举办品牌焕新发布会,埃安 N60 汽车将同步开启预售。目前新车已开启盲订,支付 99 元定金可享价值 5088 元礼遇。该车由曾任职于宝马等品牌的
4月5日消息,一起教育科技(NASDAQ: YQ)日前发布截至2025年12月31日的财报。财报显示,一起教育科技2025年营收为1 06亿(约1520万美元),较上年同期的1 89亿元下降44%。





