首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
MIT与英伟达开发TLT技术:大模型训练效率提升210%

MIT与英伟达开发TLT技术:大模型训练效率提升210%

热心网友
21
转载
2026-02-28

IT之家2月28日消息,麻省理工学院新闻网站于2月26日发布研究动态,披露该校联合英伟达等科研机构推出名为“驯服长尾”(TLT)的创新技术,该技术能显著提升大语言模型(LLM)在强化学习训练中的效率表现。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

据IT之家引述论文内容指出,大模型擅长通过分步推理处理复杂问题,但在强化学习(RL)训练流程中,其计算资源与能源消耗往往极为庞大。

研究团队发现,生成多个备选答案的“推演”阶段占据了高达85%的训练时长。由于不同处理器生成回复的文本长度存在差异,处理速度较快的处理器常被迫闲置,需要等待其他处理器完成长文本任务,由此形成严重的效率瓶颈。

为解决这一痛点,麻省理工学院研究人员联合英伟达、苏黎世联邦理工学院等机构,共同提出名为“驯服长尾(TLT)”的自适应解决方案。


该方案的核心在于创新性地运用“投机解码”技术,通过训练一个轻量级的“草稿模型”快速预测大模型的未来输出,再由大模型批量验证这些预测结果。这种机制使得大模型无需逐词顺序生成内容,从而大幅加快了整体处理速度。



传统投机解码方案中,草稿模型通常仅训练一次并保持静态参数。但在强化学习场景下,主模型需要经历数千次迭代更新,静态草稿模型会迅速失效。


为此,TLT系统引入了“自适应草稿训练器”。当部分处理器完成短查询任务进入闲置状态时,系统会立即调度它们实时训练草稿模型。同时,“自适应推演引擎”会根据工作负载特征自动调整解码策略,确保草稿模型始终与目标大模型保持高度同步,且不产生额外计算开销。


基于真实世界数据集的测试表明,TLT技术在完全保持模型准确率的前提下,将多个推理大语言模型的训练速度提升了70%至210%。


值得一提的是,训练得到的轻量级草稿模型还可作为免费副产品,直接用于后期的高效部署。研究团队计划将该技术融入更多训练与推理框架,进一步降低AI开发成本并提升能源利用效率。


参考文献

来源:https://www.163.com/dy/article/KMRLICC60511B8LM.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

龙虾、Token是什么?6位AI大咖为你深度解析
科技数码
龙虾、Token是什么?6位AI大咖为你深度解析

来源:人民日报客户端走红的“龙虾”(OpenClaw)打开了智能体的想象空间;巨量的词元(Token)反映着AI产业规模快速扩张……3月27日,在2026中关村论坛人工智能主题日,月之暗面创始人杨植

热心网友
03.28
龙虾之后的大模型共识困境与未来趋势
科技数码
龙虾之后的大模型共识困境与未来趋势

出品|虎嗅科技组作者|宋思杭编辑|苗正卿头图|中关村论坛现场上一次智谱AI与月之暗面同台,还是在1月10日。那天是智谱通过港交所聆讯后的第三天,一个周六,在中关村国际创新中心举行了一场名为AGI-N

热心网友
03.28
阿里林俊离职首文:AI迈向智能体式思考新阶段
科技数码
阿里林俊离职首文:AI迈向智能体式思考新阶段

AI正在走向“为了采取正确行动而思考”。编译整理|莘歆来源 | 盒饭财经(ID:daxiongfan)头图及封面来源 | 网络及即梦制作在X(推特)上宣布离职后的22天,林俊旸发了一篇长文。3月2

热心网友
03.27
智能化如何主导未来?林俊峪离职后首次撰文深思
科技数码
智能化如何主导未来?林俊峪离职后首次撰文深思

3月26日晚间,前千问大模型技术负责人林俊旸在社交平台发文,在从阿里离职后,他首度发布长文详谈自己对大模型发展路线的理解及对AI下一阶段的预判。林俊旸表示,过去两年重塑了行业对大模型的评估方式与核心

热心网友
03.27
林俊烨离职首谈千问复盘:AI之路的反思与未来指向
AI
林俊烨离职首谈千问复盘:AI之路的反思与未来指向

梦晨 发自 凹非寺量子位 | 公众号 QbitAI林俊旸,离职阿里千问后首次发声。他没有回应离职风波或宣告去向,而是发长文探讨从“推理模型时代的思考”到“智能体时代的思考”的转变。整篇文章谈的是技术

热心网友
03.27

最新APP

暗黑之地
暗黑之地
角色扮演 03-28
你比我猜
你比我猜
休闲益智 03-26
锦绣商铺
锦绣商铺
模拟经营 03-26
儿童画画
儿童画画
休闲益智 03-25
疯狂猜词
疯狂猜词
休闲益智 03-25

热门推荐

苹果18 Pro屏幕盖板偷跑:灵动岛缩水实锤
iphone
苹果18 Pro屏幕盖板偷跑:灵动岛缩水实锤

3月28日消息,iPhone 18 Pro的屏幕盖板在社交平台上意外泄露。与上一代产品相比,该机最直观的改变莫过于灵动岛面积的显著缩小。根据博主的最新爆料,iPhone 18 Pro的灵动岛挖孔区域

热心网友
03.28
Excel漏斗图制作方法:5步搞定销售转化率分析
电脑教程
Excel漏斗图制作方法:5步搞定销售转化率分析

漏斗图是Excel中展示销售流程各阶段转化率变化的专用图表。方法包括:一、Excel 2016+内置漏斗图;二、条形图模拟(全版本兼容);三、Power BI嵌入(高交互);四、条

热心网友
03.28
Jungle Scout报警设置教程:避免库存风险,精准监控竞品
手机教程
Jungle Scout报警设置教程:避免库存风险,精准监控竞品

在电商运营中,及时掌握产品动态至关重要,而junglescout的产品监控警报功能就能帮您实现这一点。下面就为您带来入门指南。一、开启警报功能首先,登录您的junglescout账

热心网友
03.28
星穹铁道火主配队攻略:四套高胜率阵容推荐
游戏攻略
星穹铁道火主配队攻略:四套高胜率阵容推荐

《崩坏:星穹铁道》火主配队推荐:推荐一为火主+希儿+布洛妮娅+停云,火主承伤破盾,希儿主C爆发,布洛妮娅拉条增伤,停云回能加攻,适合BOSS战与高难副本。推荐二为火主+艾丝妲+青雀

热心网友
03.28
《你好1983》:夏梓玉与王建华的隐秘纠葛及其重生之谜
娱乐
《你好1983》:夏梓玉与王建华的隐秘纠葛及其重生之谜

从杜兆辉那里,夏晓兰知道堂姐夏子玉这几年的遭遇。成了逃犯后,夏子玉靠着那张介绍信逃到盛城,花光所有积蓄偷渡去港岛。因为不会说粤语,又没有身份,根本找不到工作。在地头蛇的连哄带骗下,夏子玉成为港岛街头

热心网友
03.28