内存压缩如何让大模型在更低资源下运行更准?
来源:科技日报
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
来自英国爱丁堡大学与英伟达的联合研究团队开发出一种新方法,能够压缩人工智能模型运行时依赖的内存占用。这意味着,在保持响应速度不变的前提下,模型处理复杂任务时的准确性将得到提升,其能耗也能显著降低。这项突破也指向了一个新的可能性:更小的内存或许能催生出“更强大的AI”,并有望突破大语言模型目前面临的性能瓶颈。

研究团队发现,当将大语言模型使用的内存压缩至原有大小的八分之一后,模型在数学、科学和编程等专业测试中的表现反而更优,且推理时间并未延长。这一方法也有助于模型同时响应更多用户请求,从而降低处理单个任务的平均功耗。除了节能优势,这项改进还有望使AI更适用于处理复杂问题的专业系统,或是那些存储速度较慢、内存容量有限的终端设备,例如智能家居产品和可穿戴设备。
人工智能模型在处理问题时,通常需要“思考”更复杂的假设,或同时探索多种可能性来寻找答案。在这个过程中,模型需要将已生成的推理线程内容暂存于一种称为“KV缓存”的内存中。随着线程数量增多或线程长度增加,KV缓存的体积会迅速膨胀,成为制约性能的瓶颈,拖慢模型输出响应的速度。
为了突破这一限制,该团队提出了一种名为“动态记忆稀疏化”(DMS)的内存压缩技术。该方法并非保留所有生成的标记,而是动态判断哪些标记对后续推理至关重要、哪些可以剔除。由于从决定删除某个标记到实际删除之间存在微小的延迟,使模型有机会将待删除标记中的有用信息转移至保留的标记中。通过这种方式,DMS让AI模型能够在相同的计算资源下进行更深入的“思考”,或探索更多可能的解决方案路径。
在测试中,情况得到了积极验证。在一项基于美国数学奥利匹克资格赛设计的数学测试中,压缩模型在相同内存读取次数下,平均得分比未压缩模型高出12分;在由博士级专家编制的专业科学题库中,其表现同样优于原模型;在评估代码编写能力的平台上,压缩模型的平均得分也提高了10分。
总编辑圈点
这项研究打破了人们“计算资源越多,AI越强”的惯性认知。DMS内存压缩技术就像给AI装上了过滤器,让它学会抓住思考的重点,而非盲目堆砌数据。这种“更少内存,更强智能”的路径,可能从根本上改变AI的研发方向,让高性能AI真正走向轻量化。未来,复杂的科学计算或许在智能手表上就能运行,家用机器人也可以同时处理多项复杂指令而不会卡顿。事实上,这也暗合了人类的高效思考逻辑——我们不会记住每个细节,而是提炼关键信息进行推理。这种向人脑学习的选择性记忆机制,或许会比单纯扩大模型规模更早触及通用AI的门槛。
相关攻略
一、前言:PCIe 5 0 SSD今年能普及吗?去年年底,我们还满心期待 2026 会是 PCIe 5 0 SSD 真正普及的一年。可谁也没想到,AI 引发的这轮半导体风暴,直接让存储市场的价格全线
这项由印度萨蒂亚赛巴巴高等学习学院联合印度理工学院罗帕尔分校和红帽公司共同完成的研究发表于2026年3月的arXiv预印本平台,编号为arXiv:2603 17309v1。有兴趣深入了解的读者可以通
快科技3月29日消息,据日本AKIBA PC Hotline报道,市面上出现了一批仿真度极高的假冒三星990 PRO SSD。其包装、标签几乎与正品无异,甚至能被Windows和CrystalDis
宋恒旭 粉笔划过黑板的一瞬间,篮球场上运动鞋不时发出的响声,这些生活中看似普通的摩擦现象,背后却隐藏着物理学界长期未能完全破解的谜题。近日,美国哈佛大学研究团队在《自然》杂志发表研究成果,首次揭示了
IT之家 3 月 28 日消息,零部件短缺推高了内存和 SSD 价格,市场环境正好给了诈骗者可乘之机。面对远低于正常市场价的“超值优惠”,不少消费者很容易上当。尤其是在 AI 数据中心持续大量占用
热门专题
热门推荐
《全面战争:中世纪3》:经典延续,如何平衡怀旧与创新? 近期,《全面战争:中世纪3》的项目负责人帕维尔·沃伊斯坦然指出,要打造一款真正优秀的续作,绝不能仅仅依赖对前作模式的简单复刻。这一观点引人深思——尽管《中世纪2:全面战争》至今仍在策略游戏爱好者心中占据着经典地位,但开发团队此次显然决心跳出“照
雷鸟X3 Pro斩获AWE艾普兰创新大奖,开启全民AR生活新篇章 在上海新国际博览中心隆重揭幕的2026年中国家电及消费电子博览会(AWE)上,前沿AI科技与未来生活愿景激情碰撞。全球消费级AR领导品牌雷鸟创新,以其里程碑式的表现,定义了行业发展的新方向。 通过“顶尖硬件科技+顶级文化IP”的双轨战
借力AWE2026“一展双区”,MOVA双区协同、震撼登场 备受瞩目的科技盛会——2026年中国家电及消费电子博览会(AWE),于3月12日至15日在上海盛大举办。本届AWE展会首次创新采用“一展双区”的展览模式,主会场位于上海新国际博览中心,分会场则设于上海东方枢纽国际商务合作区,两大展区高效联动
冰结师技能全解析 踏入2026年,《地下城与勇士》中的冰结师职业,其技能体系已构建得更为成熟与强大。无论是在副本中高效清理海量怪物,还是在决斗场与高手玩家周旋,这个职业都能凭借其独特的冰霜艺术掌控战局。刷图时,酷寒的范围法术可瞬间清屏;而在PVP竞技中,一套将冻结控制与瞬间爆发完美衔接的连招,往往让
iPhone 18 Pro系列模具不变,屏幕形态将与iPhone 17 Pro保持一致 备受期待的屏下Face ID组件小型化设计与灵动岛区域缩窄方案,预计将被推迟至后续迭代机型中正式应用。 近期,关于iPhone 18 Pro系列的技术传闻持续引发行业关注,尤其在显示与解锁设计领域传言甚多。多方消





