蚂蚁Ling-1T开源:万亿参数模型FP8训练显优势
蚂蚁百灵大模型迎来重要升级,最新发布的Ling-2.0系列旗舰产品Ling-1T首次突破万亿参数规模。这款蚂蚁集团迄今为止最强大的人工智能语言模型在复杂问题求解方面表现尤为突出,创造了多项行业性能新标杆。
在美国数学邀请赛(AIME 25)标准测试中,Ling-1T展现出令人印象深刻的计算效率——仅需4000个Token便达到70.42%的正确率,优于Gemini-2.5-Pro模型5000个Token的70.10%表现。这一突破性成绩证明了该模型在优化计算资源方面的卓越能力。
核心技术突破
Ling-1T延续了百灵系列模块化架构的设计理念,其训练过程使用了高达20万亿Token的高质量推理数据,能够支持128K字符的超长上下文理解。研发团队创新性地采用了"中等训练+后优化"的动态思维链技术(Evo-CoT),这项技术通过智能化调整推理链条的维度和深度,显著提升了复杂问题的处理能力。
工程实现创新
在技术实现上,Ling-1T设立了新的行业标准。作为目前全球最大的FP8混合精度训练模型,它应用了前沿的量化感知技术,成功将内存占用减少30%,同时计算并行效率提升15%以上。值得一提的是,这些提升训练效率的关键技术已经部分开源。
算法突破
针对超大模型训练稳定性这一世界性难题,百灵实验室首创LPO策略优化算法。与传统方法不同,LPO以完整的语义单元为优化基础单元,实现了27%的语义对齐精度提升,既避免了微观优化的碎片化问题,又解决了宏观优化的模糊性困扰。
与此同时,蚂蚁集团还在推进另一项前沿研究。其深度思考模型Ring-1T的预览版已于9月底开放源代码,这款专注于递归推理的模型与Ling-1T形成完美互补——前者擅长高效即时推理,后者专精深度逻辑推演,共同构成了蚂蚁AI技术生态的双擎驱动。
热门专题
热门推荐
王者荣耀2025年KPL年度总决赛将于11月8日在北京国家体育场“鸟巢”正式举行,标志着移动电竞赛事首次进入这一标志性场馆。本次赛事预计将吸引超过五万名观众亲临现场观赛,有望创下电竞项目现场观赛人数
10月29日,网络信息显示,一款名为华为Mate 70 Air的新机海报被公开,首次呈现了该机型的外观设计。从图中可见,该设备延续了Mate 70系列的整体家族化语言,但最为突出的是其轻薄的机身轮廓
币安官方认证App入口在哪里?这是不少网友都关注的,接下来由PHP小编为大家带来币安交易所v3 6 0安卓版的下载地址及使用详情,感兴趣的网友一起随小编来瞧瞧吧!
从零开始玩转交易平台 前阵子朋友神秘兮兮给我发来链接,说是有个宝藏应用得赶紧装上。我当时还在用着某个老牌交易软件,界面土得掉渣不说
我的世界里面有很多的MOD,今天给大家带来了HBM的核科技模组块合成表大全,还有小伙伴不清楚HBM的核科技模组块怎么合成,那么下面就是具体的内容,来看看吧 我的世界HBM的核科技模





