游乐游手机版
首页/科技数码/文章详情

MIT与英伟达开发TLT技术:大模型训练效率提升210%

时间:2026-02-28 10:55
IT之家 2 月 28 日消息,MIT News 于 2 月 26 日发布博文,报道称麻省理工学院(MIT)联合英伟达等机构,发布“驯服长尾”(TLT)技术,可以大幅提升推理大语言模型(LLM)的训

IT之家2月28日消息,麻省理工学院新闻网站于2月26日发布研究动态,披露该校联合英伟达等科研机构推出名为“驯服长尾”(TLT)的创新技术,该技术能显著提升大语言模型(LLM)在强化学习训练中的效率表现。

据IT之家引述论文内容指出,大模型擅长通过分步推理处理复杂问题,但在强化学习(RL)训练流程中,其计算资源与能源消耗往往极为庞大。

研究团队发现,生成多个备选答案的“推演”阶段占据了高达85%的训练时长。由于不同处理器生成回复的文本长度存在差异,处理速度较快的处理器常被迫闲置,需要等待其他处理器完成长文本任务,由此形成严重的效率瓶颈。

为解决这一痛点,麻省理工学院研究人员联合英伟达、苏黎世联邦理工学院等机构,共同提出名为“驯服长尾(TLT)”的自适应解决方案。


该方案的核心在于创新性地运用“投机解码”技术,通过训练一个轻量级的“草稿模型”快速预测大模型的未来输出,再由大模型批量验证这些预测结果。这种机制使得大模型无需逐词顺序生成内容,从而大幅加快了整体处理速度。



传统投机解码方案中,草稿模型通常仅训练一次并保持静态参数。但在强化学习场景下,主模型需要经历数千次迭代更新,静态草稿模型会迅速失效。


为此,TLT系统引入了“自适应草稿训练器”。当部分处理器完成短查询任务进入闲置状态时,系统会立即调度它们实时训练草稿模型。同时,“自适应推演引擎”会根据工作负载特征自动调整解码策略,确保草稿模型始终与目标大模型保持高度同步,且不产生额外计算开销。


基于真实世界数据集的测试表明,TLT技术在完全保持模型准确率的前提下,将多个推理大语言模型的训练速度提升了70%至210%。


值得一提的是,训练得到的轻量级草稿模型还可作为免费副产品,直接用于后期的高效部署。研究团队计划将该技术融入更多训练与推理框架,进一步降低AI开发成本并提升能源利用效率。


参考文献

来源:https://www.163.com/dy/article/KMRLICC60511B8LM.html
上一篇欧空局发布6500万光年外螺旋星系NGC 5134实拍图集 下一篇中国电信领投墙面智能,获数亿元融资开启新年
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
OpenClaw手机App上线,结果翻车了
科技数码 · 2026-07-01

OpenClaw手机App上线,结果翻车了

OpenClaw 官方宣布,已正式推出 iOS 和 Android 原生移动 App,用户如今可以在手机上使用这款主打“能真正帮你做事”的个人 AI 助手。官方在 X 上给出的定位也很直接:把 Agent 放进口袋里,让用户可以在移动端处理频道消息、任务和回复。从功能上看,OpenClaw 移动端并

优必选CEO周剑:家庭机器人生态核心投入过半精力
科技数码 · 2026-07-01

优必选CEO周剑:家庭机器人生态核心投入过半精力

先说几个核心判断:优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上,直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进,现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景,另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛
科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛

6月30日,申银万国在光连接系列研报中重点指出,MPO光连接器领域的投资机会值得高度关注。通俗来说,随着AI算力集群持续扩张,光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件,如今它直接决定着链路插损、可

龙岗AR实景剧本游内测体验短板有效破解之道
科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上,区级部门一次性推出了7个AI“龙搭子”。其中,名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解,依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”,已在今年五一假期发布了内测版本。经过一个月市场验证后,该项目正式启动面向全社会的

南下资金6月30日净买入中芯国际与建滔积层板
科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日,南下资金持续大举买入港股,单日净流入金额高达58 95亿港元。接下来,我们直接盘点哪些个股获得资金青睐、哪些遭到减持: 净买入方面,中芯国际领跑全场,单日吸金19 33亿港元;建滔积层板紧随其后,净买入10 59亿港元;腾讯控股获得7 65亿港元净流入;智谱(02513 HK)也有6 5