蚂蚁开源万亿参数模型Ring-2.5:1T参数如何重塑AI思考方式
智通财经APP获悉,2月13日,蚂蚁集团正式发布并开源了首个采用混合线性架构的万亿参数思考模型Ring-2.5-1T。目前,该模型的权重参数与推理代码已在Hugging Face、ModelScope等主流开源平台全面上线。全新的平台对话体验页面及API服务也即将在近期推出。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
作为迈向通用智能时代的重要里程碑,研发团队将混合线性注意力架构在预训练和强化学习两个维度进行了大规模扩展。一方面采用高效的1:7 MLA+Lightning Linear Attention架构设计,显著提升了模型的思考效率和探索空间;另一方面通过扩展强化学习与智能体环境规模,有效增强了模型的思考深度与长程任务执行能力。
与先前发布的Ring-1T相比,Ring-2.5-1T在生成效率、思考深度和长程执行三大核心指标上均实现显著提升:
高效生成:依托高占比线性注意力机制,在超过32K生成长度时,显存占用降低超过10倍,生成吞吐量提升3倍以上,特别适合需要深度思考和长程执行的任务场景。
深度思考:在RLVR基础上引入密集奖励机制,通过实时反馈思考过程的严谨性,使模型在IMO 2025和CMO 2025数学竞赛中达到金牌水平(自测数据)。
长程执行:通过大规模全异步智能体强化学习训练,显著提升了处理复杂任务时的长程自主执行能力,使得模型能够轻松适配Claude Code等智能编程框架及OpenClaw个人AI助理系统。
相关攻略
IT之家 3 月 27 日消息,据《商业内幕》今晚报道,多位知情人士透露,谷歌员工正在使用一款名为“Agent Smith”的内部 AI 工具,该工具可以自动处理包括编程在内的多项任务。由于使用人数
来源:环球网【环球网科技综合报道】3月28日消息,据外媒BusinessInsider 报道,日前谷歌内部推出一款名为Agent Smith的AI工具,因使用量激增、人气爆棚,已被限制访问权限。该工
“干活消耗的Token量是简单问答的10倍甚至100倍,成本大幅提高。”回答月之暗面CEO杨植麟“为什么涨价”的问题时,智谱CEO张鹏这样说道。上文这组问答,发生在今天举行的2026中关村论坛年会开
文 | 字母AI“干活消耗的Token量是简单问答的10倍甚至100倍,成本大幅提高。”回答月之暗面CEO杨植麟“为什么涨价”的问题时,智谱CEO张鹏这样说道。上文这组问答,发生在今天举行的2026
AI正在走向“为了采取正确行动而思考”。编译整理|莘歆来源 | 盒饭财经(ID:daxiongfan)头图及封面来源 | 网络及即梦制作在X(推特)上宣布离职后的22天,林俊旸发了一篇长文。3月2
热门专题
热门推荐
迷你图是Excel中轻量直观的数据趋势可视化工具,支持折线、柱形、盈亏三种类型;可通过“插入”选项卡单个或批量添加,用“设计”选项卡自定义样式,并借助OFFSET、INDIRECT
在孩子的成长过程中,贝瓦儿歌是许多家长和孩子都喜爱的早教资源。而将贝瓦儿歌投屏到电视上,能让孩子在更大的屏幕上尽情享受欢快的儿歌,获得更好的视听体验。下面就为大家详细介绍贝瓦儿歌投
在红色沙漠中,绝望双手剑是一把超级帅的双手大剑,位于德梅尼斯的极寒之塔中。绝望双手剑基础攻击力高,不嵌增伤齿轮也有可观伤害但无自带霜冻附魔,可在任意剧情阶段获取,因极寒之塔敌人强且点灯时会刷飞行敌人
一部古装剧,火到国台办的新闻发布会上。《逐玉》这一次,属实让内娱扬眉吐气一把。简单的“点名”,却释放出三大强烈信号。果然,惠英红的话,一个字都没说错。01最新定调印象里,被最新点名的影视作品。要么是
应使用样式功能统一格式:一、应用并修改内置样式;二、创建自定义样式;三、通过主题字体设定中英文字体组合;四、清除手动格式后重应用样式;五、用格式刷批量同步。如果您在Word文档中需





