首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
蚂蚁开源Ring-2.5-1T:万亿参数模型突破不可能三角

蚂蚁开源Ring-2.5-1T:万亿参数模型突破不可能三角

热心网友
22
转载
2026-02-14

(文/陈济深 编辑/张广凯)

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

长期以来,深度思考模型一直面临一个尴尬的“不可能三角”:想要推理逻辑严密,就得忍受龟速的解码速度和爆炸式的显存开销。

为了绕开这个难题,目前业界主流路径多采用 MoE(混合专家模型)架构,通过只激活部分参数来节省算力,诸多头部模型如以DeepSeek、Kimi、MiniMax均采用了这种架构。

如今,这个行业魔咒被蚂蚁集团找到了解法。

2月13日,蚂蚁集团正式开源了全球首个基于混合线性架构的万亿参数思考模型Ring-2.5-1T。该模型同时做到了三件过去被认为难以兼得的事:推理速度快、深度思考强、长程任务执行能力突出。


在评测中,Ring-2.5-1T在数学竞赛中拿到IMO金牌级别的35分(满分42),在CMO拿到105分远超国家集训队分数线,同时在32K以上长文本生成场景中将访存规模降至上一代的1/10,生成吞吐量提升超3倍。使得其在搜索、编码这些复杂任务上都能独当一面。

如何又快又好?

Ring-2.5-1T的速度优势来自其底层架构的根本性创新。它基于Ling 2.5架构,采用了混合线性注意力机制——具体来说,是以1:7的比例混搭MLA(多头潜在注意力)和Lightning Linear Attention两种注意力模块。

这一设计源自蚂蚁此前发布的Ring-flash-linear-2.0技术路线。

研发团队通过增量训练的方式,将原有架构中的GQA(分组查询注意力)层分别转化为Lightning Linear Attention和MLA:前者在长程推理中负责拉满吞吐量,后者则极致压缩KV Cache。为防止模型表达能力因架构改造而受损,团队还特别适配了QK Norm和Partial RoPE等特性。

经过这番改造,Ring-2.5-1T的激活参数量从上一代的51B提升至63B,但凭借线性时间复杂度的特性,其推理效率反而大幅提升。

与同为1T参数量级但仅有32B激活参数的Kimi K2架构相比,Ling 2.5架构在长序列推理任务中的吞吐优势十分显著,且随着生成长度增加,效率优势持续扩大。


这意味着长程推理不再是“烧钱又烧显卡”的重资产操作,而变成了一种可以规模化部署的轻量级方案。从“做题家”到“实战派”跑得快只是一面,逻辑够不够硬才是深度思考模型的真正门槛。在思维训练层面,Ring-2.5-1T在RLVR(基于可验证奖励的强化学习)基础上引入了密集奖励机制。不同于只看最终答案对不对的传统方式,这套机制会逐步考察推理过程中每一个环节的严谨性,让模型在逻辑漏洞和高阶证明技巧上都获得了显著提升。

在此基础上,团队还引入了大规模全异步Agentic RL训练,大幅增强了模型在搜索、编码等长链条任务上的自主执行能力。这让Ring-2.5-1T从单纯的数学证明高手,进化为能在复杂实战场景中独当一面的智能体。

蚂蚁研究团队将Ring-2.5-1T与开源模型DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking以及闭源API GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking等进行了对比。

结果显示,Ring-2.5-1T在IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench等高难度推理任务,以及Gaia2-search、Tau2-bench、SWE-Bench Verified等长时任务执行基准上,均达到了开源最优水平。在Heavy Thinking模式下,Ring-2.5-1T更是在多项数学竞赛和代码生成基准中超越了所有对比模型,包括上述闭源API。


尤其值得一提的是,在IMO 2025(满分42分)中Ring-2.5-1T拿到35分达到金牌水平,在CMO 2025(满分126分)中获得105分,大幅超过金牌线78分和国家集训队选拔线87分。与上一代Ring-1T相比,新模型在推理逻辑的严谨性、高级证明技巧的运用和答案表述的完整性上都有明显进步。生态适配与开源落地Ring-2.5-1T已经适配Claude Code和OpenClaw等主流智能体框架,支持多步规划与工具调用。模型权重与推理代码已在Hugging Face、ModelScope等平台同步开放,最新Chat体验页和API服务也将在近期上线。

除Ring-2.5-1T外,蚂蚁集团同期还发布了扩散语言模型LLaDA2.1和全模态大模型Ming-flash-omni-2.0。前者采用非自回归并行解码技术,推理速度达到535 tokens/s,在HumanEval+编程任务上甚至达到892 tokens/s,还具备独特的Token编辑与逆向推理能力;后者则在视觉、音频、文本的统一表征与生成上实现了突破,打通了多模态的感知与创作能力,支持实时感官交互。

蚂蚁inclusionAI团队的目标很明确:将这些能力做成可复用的底座方案,为开发者提供统一的能力入口。据悉,后续团队还将继续在视频时序理解、复杂图像编辑和长音频实时生成等方向持续发力,推动全模态技术的规模化落地。

随着AI大模型应用从短对话向长文档处理、跨文件代码理解、复杂任务规划等场景延伸,深度思考模型面临的效率瓶颈愈发突出。Ring-2.5-1T通过底层架构的重构,给出了一条兼顾性能、成本与扩展性的技术路径。

当“又快又好又深”不再是不可能三角,深度思考模型的应用边界也将随之打开。

来源:https://www.163.com/dy/article/KLOERVME051481US.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Meta开源TRIBE v2模型:精准预测人脑多模态反应
科技数码
Meta开源TRIBE v2模型:精准预测人脑多模态反应

IT之家 3 月 28 日消息,科技媒体 The Decoder 昨日(3 月 27 日)发布博文,报道称 Meta 基础人工智能研究团队(FAIR)开源全新 AI 模型 TRIBE v2,可精准预

热心网友
03.28
一口气发布三大王炸模型!昆仑万维公布2026年AGI战略蓝图
AI
一口气发布三大王炸模型!昆仑万维公布2026年AGI战略蓝图

编辑|杜伟就在 27 日下午,在火热进行中的 2026 中关村论坛上,一家国产头部 AI 厂商引爆了全场!昆仑万维,这家 2024 年便已「All in AGI 与 AIGC」的实力玩家,亮出了其实

热心网友
03.28
国产玩家挑战世界模型,天工AI全模态技术走向顶尖水平
AI
国产玩家挑战世界模型,天工AI全模态技术走向顶尖水平

人人都在卷多模态,可多模态之后呢?直到今天,终于有人给出了清晰答案——而且是刚刚把多模态卷到全球第一梯队的国产玩家。不是更强的模型,而是平台。更关键的是,这个判断并非来自一次普通发布,而是出现在中关

热心网友
03.28
深度智控发布具身智能模型,赋予机器人物理常识认知
科技数码
深度智控发布具身智能模型,赋予机器人物理常识认知

来源:环球网【环球网科技综合报道】3月27日,在中关村论坛“全球对话”活动现场,由北京中关村学院与中关村人工智能研究院孵化的具身智能企业深度机智,正式发布PhysBrain 1 0具身通用智能基座模

热心网友
03.27
阿里前员工打造“破壁”龙虾:能提升大模型记忆力吗?
科技数码
阿里前员工打造“破壁”龙虾:能提升大模型记忆力吗?

AI正在从“能计算”走向“会决策”,而记忆是这场跃迁的关键。企业AI落地遭遇的困境正在变得清晰。数据分散在表格、PDF、音视频等载体中,系统无法形成连贯认知。高管分析项目风险时,模型找不到历史问题与

热心网友
03.27

最新APP

暗黑之地
暗黑之地
角色扮演 03-28
你比我猜
你比我猜
休闲益智 03-26
锦绣商铺
锦绣商铺
模拟经营 03-26
儿童画画
儿童画画
休闲益智 03-25
疯狂猜词
疯狂猜词
休闲益智 03-25

热门推荐

个人纳税记录查询:电子税务局操作与下载全指南
电脑教程
个人纳税记录查询:电子税务局操作与下载全指南

可通过电子税务局 、随申办App 小程序、个税APP三种方式查询下载个税纳税记录:电子税务局需登录后搜索或按路径进入,下载PDF用身份证后6位解密;随申办依托统一认证,支持直接保存

热心网友
03.28
智现未来联合晶合集荣获SEMICON China良率提升奖
科技数码
智现未来联合晶合集荣获SEMICON China良率提升奖

3月26日,在SEMICON China 2026“半导体智能制造-未来工厂”论坛上,一场关于半导体制造AI未来形态的思想碰撞引发行业瞩目。智现未来董事长兼CEO管健博士受邀登台,发表题为《从“+A

热心网友
03.28
珠海金湾引进30亿航空整机制造项目,布局载人飞行产业
科技数码
珠海金湾引进30亿航空整机制造项目,布局载人飞行产业

南都讯 记者李洁琼 3月28日,珠海天际航空科技有限公司在金湾区天章产业园开业。作为珠海低空经济产业的新锐力量,天际航空智能制造基地的投运,标志着金湾区在载人级飞行器制造领域迈出关键一步,为珠海“天

热心网友
03.28
神州写真:中国机器人租赁升温,二次开发成关键新赛道
科技数码
神州写真:中国机器人租赁升温,二次开发成关键新赛道

来源:中国新闻网中新社杭州3月27日电 (鲍梦妮)随着机器人产业发展以及春晚机器人表演等热点带动,今年以来,中国多地机器人租赁业务持续升温。在上海上线的全球首个开放式机器人租赁平台“擎天租”,自去年

热心网友
03.28
京东翻新打印机避雷指南:警惕以旧充新三大陷阱
科技数码
京东翻新打印机避雷指南:警惕以旧充新三大陷阱

大象新闻·大象财富记者 李莉 张迪驰315消费者权益日刚过,广东李女士在某平台购买的“全新”打印机频繁报错,维修无果。她查询最新质保发现,整机标注保修三年,系统却显示剩余保修期不足两年,经售后核实确

热心网友
03.28