首页 游戏 软件 资讯 排行榜 专题
首页
AI
蚂蚁发布两款万亿参数大模型 AI技术实力全面升级

蚂蚁发布两款万亿参数大模型 AI技术实力全面升级

热心网友
14
转载
2026-05-16

国庆假期,各行各业都进入了休整状态,但大模型的竞技场却比平时更加活跃。短短半个月内,国内外领先团队密集发布了十余款重要产品,展现出不同的技术路线与战略方向。

九月下旬,阿里推出了以Qwen3-Max为代表的系列模型,展示了其综合技术实力;月末,DeepSeek和Anthropic则聚焦于硬核的编程与推理场景,先后发布了DeepSeek V3.2-Exp和Claude Sonnet 4.5。智谱AI也发布了GLM-4.6,旨在成为国内领先的代码生成模型。

有的公司追求全栈布局,有的则专注于单点突破。随着大模型竞争进入深水区,各家公司的战略差异越来越明显。

10月9日凌晨,蚂蚁百灵大模型团队进行了一次重要发布,正式推出了最新的语言大模型Ling-1T,其参数量达到了惊人的1000B(一万亿)。而就在十天前,他们刚刚开源了自研的思考模型Ring-1T-preview。

十天之内,连续发布并开源两款万亿参数规模的模型,如此密集的技术动作,让蚂蚁百灵迅速成为行业关注的焦点。这种近乎“完全开放”的开源策略,也引发了一个核心思考:蚂蚁的长期布局,究竟指向何方?

探索智能上限是终极目标

蚂蚁集团自主研发的基础大模型系列命名为“百灵”,寓意“百试百灵”,也体现了其技术普惠的愿景。与集团内独立研发的路径相似,蚂蚁的百灵团队也坚持着自己的技术探索。此次发布的Ling-1T和此前开源的Ring-1T-preview,分别代表了其技术探索的两个重要分支:非思考模型与思考模型。

过去半年,百灵模型的迭代速度有目共睹。团队自上而下规划了三条清晰的技术路线:基于MoE架构的非思考模型Ling-Series、专注于深度推理的思考模型Ring-Series,以及面向未来的原生全模态大模型Ming-Series。目前,在前两条技术路线上,蚂蚁都已成功将模型参数规模提升至万亿级别。

万亿参数,这个数量级常被类比于人脑的神经元数量,象征着让AI具备类人脑处理能力的雄心。然而,训练一个万亿参数模型,其技术难度和资源消耗极其巨大。纵观国内,有能力跻身“万亿参数俱乐部”的团队屈指可数。

除了蚂蚁的Ling-1T和Ring-1T-preview,目前公开信息显示,也只有Kimi的K2、阿里通义千问的Qwen3-Max、腾讯混元大模型等少数几个。这个俱乐部的技术门槛,非常高。

尽管今年以来,关于“数据瓶颈”和“预训练范式终结”的讨论时有出现,但产业界和学术界正形成一个新共识:更大的模型参数规模、更高质量的训练数据,依然能带来持续的性能提升。阿里的算法负责人曾公开表示,Scaling Law(缩放定律)远未见顶。杨植麟带领的Kimi团队,克服了诸多工程挑战,在两个月前推出了万亿参数的旗舰模型K2。通义千问团队则明确提出了“规模即性能”的发展思路,推动Qwen3沿着扩大规模的路径前进。

由此可见,探索人工智能的性能极限,仍然是头部厂商共同锚定的终极目标。

百灵大模型加速涌现

过去一年,国内大模型领域新品频出,“七天一新款”的说法并不夸张。但随着模型数量增多,另一个关键问题浮现出来:能够在庞大的参数规模与高效的推理性能之间取得完美平衡的模型,实际上非常稀少。

对于万亿参数模型而言,规模上去后,推理速度往往成为瓶颈;而如果追求极致的响应速度,模型的准确率和深度又可能难以保证。业界公认的优秀大参数模型,无一不是在推理能力与计算效率之间找到了一个精妙的平衡点,即所谓的帕累托最优。这个平衡点,通常通过一系列多维度的基准测试分数来综合衡量。

这次蚂蚁发布的Ling-1T,在公开的权威评测榜单中,表现颇为出色。下图展示了Ling-1T在部分核心基准测试中的成绩,红色加粗代表其得分位列第一,黑色加粗下划线则代表第二:

在业界尤为关注的编程与数学推理两大关键维度上,Ling-1T表现非常突出,多项得分甚至超越了以代码能力著称的DeepSeek。在知识理解方面,它的得分也略高于Kimi、GPT-5主干模型等强劲对手。这意味着,Ling-1T在复杂思考、泛化能力以及逻辑推理上,展现出了相当全面的实力。因此,它在代码生成、软件开发、竞赛数学、专业逻辑推理等高阶应用场景中,会具有显著优势。

然而,对于万亿模型,综合性能之外,还有一个关键指标:推理的准确率。这就不得不提到竞赛数学领域的权威测试——AIME 25榜单。Ling-1T在该测试中的成绩如下:

与DeepSeek-V3.1-Terminus、Kimi-K2-Instruct-0905(开源版)以及GPT-5-main、Gemini-2.5-Pro(闭源版)这些顶级模型同台竞技,Ling-1T展示了更短的思考路径和更高的推理准确率。它具备处理128K长文本的能力,而每个token激活的参数量却控制在约500亿,这在计算效率上是一个显著优势。

这份成绩单背后,是蚂蚁百灵团队长期的技术积累与创新。模型依托团队储备的二十万亿Token高质量文本语料进行训练,学习了海量优质知识。在预训练阶段,团队创新地让模型依据“Ling Scaling Laws”自我设置关键超参数,实现了大模型的自我优化。在强化训练阶段,则引入了团队原创的LPO策略优化算法,让模型的回答更精准。此外,团队还提出了“语法-功能-美学”的混合奖励机制,提升了模型输出的综合质量。下图是工程师绘制的Ling-1T模型架构示意图:

事实上,蚂蚁已经构建起一个完整的百灵大模型家族。从参数规模看,涵盖了从160亿到1万亿的总参数产品矩阵;从模态能力看,包含了能看、能听、能说、能画,理解与生成统一的多模态模型;从应用场景看,则形成了可在手机端运行的Ling-mini、适合中小企业服务器部署的Ling-flash,以及云端调用的Ling-1T等系列。

这个产品家族在过去一段时间里,无论是在社区评测榜单还是实际应用反馈中,都获得了不少积极评价。百灵团队开发的全模态模型Ming-lite-omni v1.5,曾在Hugging Face的“any to any”模型趋势榜上登顶。Ring-1T-preview发布次日,便冲上Hugging Face文本生成总榜第三,而排名第四的同样是百灵家族9月发布的混合架构思考模型Ring-flash-linear-2.0。

更值得一提的是来自业界的真实反馈。图灵奖得主杨立昆(Yann LeCun)甚至点赞并评论“Impressive”(令人印象深刻),了解这位对LLM时常持批评态度的学者的网友都表示,这声夸奖“来之不易”。一位苹果工程师在量化并本地运行模型后评价,其性能“Getting closer to GPT-5 at home”(在本地部署上已接近GPT-5)。这些来自一线技术开发者的反馈,无疑是对百灵模型技术实力的有力认可。

探索AGI,亟需参与者们的共建意识

百灵团队能如此迅速地跻身“万亿参数俱乐部”,与蚂蚁集团的整体战略投入密不可分。作为一家成立二十年的科技公司,蚂蚁在AI领域的布局决心和资源投入一直非常坚定。

去年蚂蚁二十周年时,董事长井贤栋明确宣布,未来二十年,蚂蚁要成为一家科技与创新双轮驱动的公司。集团随后提出的“AI First”战略,与“支付宝双飞轮”、“加速全球化”并列,成为驱动蚂蚁前进的三大核心战略。Ling-1T和Ring-1T-preview的接连亮相,正是“AI First”战略持续加速落地的鲜明体现。

然而,蚂蚁选择的不是封闭的闭源道路,而是技术共享的开源路线。这充分表明,其目光投向的是更远的未来:通过技术开放,持续迭代,构建一个真正繁荣、开放的AGI(通用人工智能)生态系统。

据行业观察,目前“万亿参数俱乐部”中,能做到完全开源的,仅有蚂蚁百灵的Ling-1T、Ring-1T-preview和Kimi的K2。在2025年大模型参数“军备竞赛”白热化的背景下,投入巨资研发后却选择开源,初看确实令人费解。

但若理解开源背后的深层逻辑,便会豁然开朗。当Ling-1T这样的万亿参数“巨兽”公开其训练数据、算法和模型细节,全球开发者便能直接以此为基础,快速构建复杂应用,而无需从零开始攻克底层训练的难题。一个“使用-反馈-迭代”的正向循环由此建立,这将极大推动技术的共同演进,加速智能的“涌现”。这条“技术平权化”的道路,其实已有先行者。今年年初DeepSeek的横空出世,就已经为国内大模型玩家们示范了开源所能激发的巨大能量。

今年接任蚂蚁集团CEO的韩歆毅,曾在内部技术日上清晰地阐述了蚂蚁的AI主张:“年初我们讨论(蚂蚁)聚焦AI应用,还要不要做基础大模型时,答案非常坚决:一定要做。因为如果基于AI做服务和应用,就像训练一个人去做所有的事。追求智能的上限,会让这个人更加聪明,从而能够做更多、更好的服务。我们坚定地要去探索AGI,探索智能的极限。”

为此,蚂蚁专门成立了InclusionAI开源组织,并建设了涵盖强化学习推理框架AReaL、多智能体框架AWorld等在内的大模型全栈技术体系。这些技术成果也已通过开源、开放合作的形式与行业共享,旨在让更多的开发者和研究者能够交流、共创。

看得出来,相比于独自在舞台上表演,蚂蚁更倾向于搭建一个宽阔的舞台,铺设好AI的基础设施。因为只有生态繁荣了,才能吸引更多的参与者共同建设,那条通往AGI的道路,也才能真正走得通、走得远。

来源:https://www.leiphone.com/category/ai/L6tQCmiyhpWnqvRk.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

实在塔斯大模型:AI大模型技术解析与应用指南
业界动态
实在塔斯大模型:AI大模型技术解析与应用指南

在人工智能浪潮中,大语言模型已成为推动产业变革的关键引擎。其中,实在智能推出的实在塔斯(TARS)大模型,是一款面向垂直行业领域、可自主训练的类ChatGPT大语言模型。它并非通用模型的简单复刻,而是基于实在智能在自然语言处理领域长期的技术积淀与丰富的落地经验,为行业深度定制而生。下面,我们来详细拆

热心网友
05.15
大模型工作流原理与应用场景全解析
业界动态
大模型工作流原理与应用场景全解析

在探索如何高效利用GPT、BERT等大型语言模型的强大能力时,“工作流”无疑是实现任务自动化与智能化的核心策略。它是一套将复杂问题标准化、流程化的系统性方法,旨在显著提升任务执行的效率与输出结果的可靠性。那么,一套优秀的大模型工作流具体包含哪些关键组成部分?我们又该如何设计与实施呢? 工作流的核心要

热心网友
05.15
大模型调用成本太高?教你节省90%费用的实用方法
AI
大模型调用成本太高?教你节省90%费用的实用方法

大模型缓存机制通过KVCache和前缀匹配实现重复内容仅计费一次,显著降低成本。主流方案差异明显:OpenAI自动缓存折扣约五折但时效短;Claude需手动标记,折扣可低至一折;DeepSeek采用硬盘缓存,持久且费用极低。工程中应将稳定内容前置以提升命中率,高频重复场景下合理利用可大幅节省费用。

热心网友
05.15
大模型一体机:定义、功能与应用场景全解析
业界动态
大模型一体机:定义、功能与应用场景全解析

谈及当前企业智能化转型的主流方案,“大模型一体机”无疑是备受关注的核心选项。本质上,它是一套完整的“交钥匙”解决方案,将AI服务器硬件、预训练好的大模型以及配套的应用软件深度融合,打包交付,旨在为企业提供安全、高效、可私有化部署的大模型服务。 一、核心构成:三位一体的“智能体” 这套系统的架构与核心

热心网友
05.15
大模型私有化部署含义与实施指南
业界动态
大模型私有化部署含义与实施指南

企业在引入大型人工智能模型时,面临一个关键抉择:是采用便捷的云端服务,还是选择将模型私有化部署在本地?后者,即将大模型部署于企业自有的服务器或专用硬件上,正日益成为对数据安全、响应速度和成本控制有严格要求的机构的核心选择方案。 一、私有化部署的背景与趋势 在人工智能技术迅猛发展的浪潮中,以实在智能为

热心网友
05.15

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

问界M9保值率80.4%夺冠 2026年4月纯电车型保值榜
业界动态
问界M9保值率80.4%夺冠 2026年4月纯电车型保值榜

近日,中国汽车流通协会联合精真估发布了《2026年4月纯电动车型一年车龄保值率排行榜》。这份数据对于正在选购新能源车的消费者具有重要参考价值,能帮助大家更清晰地了解当前热门电动车的残值表现。 该榜单统计的是车龄满一年的纯电动车型。位居榜首的是问界M9,其一年保值率高达80 4%。这一夺冠成绩含金量十

热心网友
05.16
追觅Aurora Lux系列手机发布 29款奢华设计全解析
业界动态
追觅Aurora Lux系列手机发布 29款奢华设计全解析

科技行业近期迎来一场备受瞩目的创新盛宴。以智能清洁机器人闻名的追觅科技(Dreame),在旧金山隆重举办了“Dreame Next 2026”未来愿景发布会。活动不仅前瞻性地展示了涵盖智能手机、智能穿戴乃至概念电动车的全系列产品,更邀请到苹果联合创始人史蒂夫·沃兹尼亚克亲临助阵。这场为期四天的盛会,

热心网友
05.16
SpaceX最快下周披露招股书 6月初启动全球路演计划
AI
SpaceX最快下周披露招股书 6月初启动全球路演计划

SpaceX最快下周披露招股书,6月初启动全球路演,估值或达1 75万亿美元,募资规模有望创纪录。公司以垂直整合与成本控制为核心优势,布局商业航天、AI基础设施与卫星互联网,其“太空数据中心”构想融合太空太阳能与AI算力,开辟新赛道。此次IPO或引发科技板块资金结构性变动,标志资本正加速拥抱太空与AI融。

热心网友
05.16
NVIDIA扩展机器人微服务库加速人形机器人发展
AI
NVIDIA扩展机器人微服务库加速人形机器人发展

NVIDIA在SIGGRAPH上宣布扩展其微服务库,以加速人形机器人开发。其核心是将生成式AI深度集成至OpenUSD语言体系,推出相关模型与NIM微服务,从而提升数字孪生与机器人工作流效率。公司还开放了机器人技术栈,并联合合作伙伴推动OpenUSD的工业应用,为开发者提供从仿真到部署的端到端平台支持。

热心网友
05.16
OKX交易所安全性如何?资金风险与监管深度解析
web3.0
OKX交易所安全性如何?资金风险与监管深度解析

OKX作为全球领先的数字资产交易平台,其风险主要来源于市场波动、技术安全与合规环境。平台通过多重安全机制、资产储备证明和严格的合规流程来管理风险。用户需理解加密货币的高波动性本质,并采取自主保管资产、启用安全功能等策略,以在参与Web3生态时更好地保护自身权益。

热心网友
05.16