游乐游手机版
首页/科技数码/文章详情

蚂蚁开源首个百亿参数中文扩散模型LLaDA 2.0

时间:2025-12-12 16:49
IT之家 12 月 12 日消息,蚂蚁技术研究院今日宣布推出 LLaDA2 0 系列离散扩散大语言模型(dLLM),并同步公开了背后的技术报告,宣称是“业内首个 100B 扩散语言模型”。LLaDA

12月12日消息,蚂蚁技术研究院今天正式发布了LLaDA2.0系列离散扩散大语言模型(dLLM),并同步公开了其背后的技术报告,该模型被称为“业内首个100B扩散语言模型”。

LLaDA2.0系列包含基于MoE架构的16B(mini)与100B(flash)两个版本,一举将扩散模型的参数量级首次扩展到了100B级别。

蚂蚁技术研究院表示,此次发布的模型不仅打破了业界对扩散模型难以扩展的固有印象,更在代码、数学和智能体任务上展现出了超越同级自回归(AR)模型的强大性能。

通过创新的Warmup-Stable-Decay(WSD)持续预训练策略,LLaDA2.0能够无缝继承现有自回归模型的知识,避免了从头训练带来的高昂成本。结合不限于常规SFT的、基于置信度感知并行训练(CAP)以及扩散模型版DPO,LLaDA2.0在保证生成质量的同时,充分利用了扩散模型的并行解码优势,实现了相比AR模型高达2.1倍的推理加速。这证明了在超大规模参数下,扩散模型不仅可行,而且可以更强大、更高效。


蚂蚁技术研究院从知识理解、数学、代码、推理及智能体等多个维度对模型进行了综合评估。结果显示,LLaDA2.0在结构化生成任务(如代码生成)上具有显著优势,并在其他领域与顶尖开源自回归模型实力持平。

目前,LLaDA2.0的模型权重(16B/100B)及相关训练代码已在Huggingface平台开源,具体地址如下:

来源:https://www.163.com/dy/article/KGJCABOO0511B8LM.html
上一篇小米Redmi X 2026电视发布:2499元享4K 144Hz Mini LED 下一篇OPPO AI妙听上线:一键将文章转为双语播客
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
年国家能源局充换电服务业用电量增速48.8%
科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时,同比增长5 0%。充换电服务业用电增速高达48 8%,信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元
科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元

追风者冰川360S25液冷散热器售价429元,三联一体风扇便捷安装,冷头小体积纯铜底座噪音18dB,风扇转速300-2000RPM、风量75CFM、静压2 96mmAq,五年质保漏液包赔。

三星Galaxy Watch8用户反馈谷歌后台组件异常
科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映,GooglePlayServices后台耗电异常,电量占比最高达99 97%,远超正常水平,严重影响续航。目前故障原因不明,谷歌尚未发布官方声明。

罗永浩批苹果iOS 27创新不足 盼新CEO改进
科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足 盼新CEO改进

罗永浩批评苹果iOS27创新不足,称仅有双iPhone同号、音量分离等数十项细节改进,认为库克时代缺乏突破性创新,股市虽好但消费者只能被迫接受挤牙膏式升级。

年国产车出口710万辆,两家车企销量破百万
科技数码 · 2026-06-29

年国产车出口710万辆,两家车企销量破百万

2025年国产汽车出口总量达710万辆,同比增长21%。奇瑞以134万辆居首,比亚迪105万辆次之,上汽乘用车出口占比60%最高,长城出口51万辆。吉利、长安等主流品牌同步增长,小鹏、零跑等新兴品牌海外拓展加速。