蚂蚁开源万亿参数大模型,代码生成能力超越GPT-5
9月30日凌晨,蚂蚁集团迎来重大技术突破,正式开源自主研发的Ring-1T-preview模型,标志着全球首个公开可用的万亿级参数推理大模型诞生。
作为自然语言处理领域的重要成果,Ring-1T-preview虽然仅是万亿参数推理模型Ring-1T的预览版本,但其表现已远超预期。
在多项专业测评中,Ring-1T-preview展现出惊人实力:数学能力测试AIME 25中获得92.6高分,不仅超过所有开源模型和Gemini 2.5 Pro,更接近GPT-5(无工具使用)94.6分的顶尖水平;在具有"代码生成试金石"之称的CodeForces评估中,更以94.69分超越GPT-5。
权威评测平台LiveCodeBench和ARC-AGI-v1的数据显示,Ring-1T-preview同样稳居开源模型榜首。
值得一提的是,研发团队在国际奥林匹克数学竞赛IMO25的测试中,Ring-1T-preview不仅能一次性正确解答第三题,对其他题目也能部分推导出正确答案。
蚂蚁百灵团队透露,目前正全力推进Ling2.0家族1T语言基座的后训练工作,以充分挖掘这个万亿模型的推理潜力。正式版Ring-1T模型正在加紧训练中,未来表现值得期待。
相关攻略

9月30日消息,今日凌晨,蚂蚁集团开源了自研的首个万亿参数大模型Ring-1T-preview。该模型是一款自然语言推理大模型,也是全球首个开源的万亿参数推理大模型。据百灵大模型最新信息,此次发布的

9月12日消息,9月11日,在2025Inclusion·外滩大会上,蚂蚁集团与中国人民大学联合发布业界首个原生MoE架构的扩散语言模型(dLLM)“LLaDA-MoE”。中国人民大学高瓴人工智能学

“同种繁殖”,也就是个体只会繁殖出同一物种的后代,这是根深蒂固的生物学认知!然而,最近的一项研究刷新了人们对生物繁殖的刻板印象,欧洲一种常见的蚂蚁,其蚁后实际上可以产下完全不同物种的两种雄性后代。△

6 月 1 日消息,有用户发现,支付宝开始邀请部分用户抢先体验全新的“余额青春模式”,提供多种主题皮肤可选。从支付宝最新获悉,支付宝余额青春模式是对用户提供的全新余额产品模式,提供了更加炫彩、年轻
热门专题


热门推荐

山寨币的淘金热:寻找百倍币的十大潜力交易所在加密货币的世界里,除了比特币和以太坊这些主流币之外,还有着无数的山寨币(Altcoins)。

当地时间10月13日,2025年世界技能组织全体成员国大会于克罗地亚举行。东软创始人、东软睿新科技集团董事长刘积仁作为中国首家世界技能组织全球高级合作伙伴受邀出席大会并签署协议。这既是东软发展历程中

10月14日消息,哈弗SUV今晚发布了《关于哈弗猛龙PHEV车型后备箱地板积水问题的声明》。近期,我们收到部分用户反馈“哈弗猛龙PHEV后备箱地板积水”,对此,我们高度重视,第一时间进行调查、排查。

近日,雷诺集团“Tech World Tour”(科技世界探索)全球项目在中国正式启动,这是该集团构建国际化科技创新交流平台的重要一站。此前,雷诺已在法国和西班牙设立了全新项目站点,此次中国之行也是

在日常生活中,人们对于便捷服务的需求日益增长。京东外卖骑手帮扔垃圾服务引发了不少人的关注,那么这项服务究竟是真的吗?又在哪里可以享受到呢?首先,京东外卖骑手帮扔垃圾服务确实是真实存