蚂蚁集团开源Awex框架:突破强化学习瓶颈,拓展模型智能边界
蚂蚁集团近日正式宣布,其自主研发的万亿参数强化学习高性能权重交换框架Awex已经开源。这一框架专门针对提升训练推理引擎的权重同步效率设计,有效解决了强化学习流程中训练权重参数向推理模型同步的技术瓶颈,能够在秒级时间内完成TB级大规模参数的快速交换,显著降低模型训练延迟。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
作为蚂蚁ASystem强化学习系统的核心组件,Awex为百灵万亿模型训练提供了重要的技术支撑。该框架通过优化权重同步机制,实现了训练与推理环节的高效衔接,在处理超大规模参数时表现尤为出色。据蚂蚁集团透露,未来将持续开源ASystem的其他核心强化学习组件,逐步构建完整的开源训练生态体系。
强化学习技术已成为当前大模型后训练阶段的核心驱动力。从ChatGPT采用的RLHF(基于人类反馈的强化学习)方法,到DeepSeek、Claude、Llama等主流模型的后训练体系,均依赖强化学习技术优化模型输出,使其更贴合人类偏好并增强推理能力。这项技术正在持续拓展人工智能模型的智能边界,推动行业向更高水平发展。
今年10月,蚂蚁集团已开源两款万亿参数旗舰模型:非思考型模型Ling-1T与思考型模型Ring-1T。其中,Ring-1T基于自研的Awex框架构建,在数千张GPU集群环境下实现了5至10秒内完成万亿级参数的权重同步。这一突破性进展验证了Awex框架在超大规模模型训练中的技术优势,为行业提供了高性能、低延迟的解决方案。
热门专题
热门推荐
4月3日消息,今日,OPPO官微宣布,OPPO Find X9s Pro将首发新一代1nit明眸护眼屏,宣称全场景都护眼。据悉,这块屏幕来自新一代天马天工屏,搭载全新U9 Pro发光基材,从材料、器
Word行距异常增大可按五步解决:一、重置段前段后间距为0并设单倍行距;二、改用固定值行距(如小四号设18磅);三、清除样式继承并修复Normal模板;四、禁用自动格式更正干扰项;
汽车4月3日消息,4月3日,“年轻人第一台GT”比亚迪2026款海豹06GT新车交付仪式在深圳举行,作为海洋网又一搭载第二代刀片电池和最新闪充技术的重磅车型,上市售价12 89万元-16 99万元,
汽车4月3日消息,广汽埃安宣布将于 4 月 16 日举办品牌焕新发布会,埃安 N60 汽车将同步开启预售。目前新车已开启盲订,支付 99 元定金可享价值 5088 元礼遇。该车由曾任职于宝马等品牌的
4月5日消息,一起教育科技(NASDAQ: YQ)日前发布截至2025年12月31日的财报。财报显示,一起教育科技2025年营收为1 06亿(约1520万美元),较上年同期的1 89亿元下降44%。





