美团龙猫注意力机制升级:提速10倍,精准处理1M超长文本
文自 | 凹非寺
量子位 | 公众号 QbitAI
文本处理速度大幅提升超过50%,同时还解锁了多达1M的上下文处理能力。
美团龙猫LongCat系列在新年之际再出新招,正式发布了名为LoZA的全新稀疏注意力机制。
这项创新技术集中火力,旨在攻克长文本任务在理解与算力上的核心难题。
相比LongCat系列此前采用的全注意力机制MLA,新的LoZA仅对其一半的核心模块进行了改造。
但模型的长文本处理能力却从256K显著扩展至1M,解码速度也有了显著提升。
其表现甚至优于同类型的Qwen-3模型。
接下来,让我们一起看看它的具体实现方案。
如何实现“只算关键部分”?
全注意力机制的算力瓶颈在于其平方级的计算复杂度,这导致模型处理长文本任务时对硬件要求苛刻,并伴随着推理延迟问题。
LoZA的核心思路是让模型将算力资源聚焦于处理重要的内容,对于次要部分则减少计算开销。
作为LongCat系列的核心技术升级,LoZA主要是在原有的MLA机制基础上进行针对性改造。
具体分为两步走。
首先,对模型中的多头潜在注意力模块进行一次全局“筛查”,找出那些适合被改造的模块。
在原有的MLA架构中,每个模块都是处理注意力的核心单元。新方案为每个模块配备一个可学习的权重α。
α值越高,说明该模块进行全注意力计算越关键,一旦简化就容易丢失性能;α值越低则意味着模块的可替代性强,即便换成更轻量级的计算方式,对整体理解能力的影响也不大。
在训练过程中,团队冻结模型其他参数,只更新α的梯度,通过这种专门的校准训练让模型自主学习α值,然后按α值从小到大排序,找出那些稀疏化后不影响性能的MLA模块,作为后续的优化目标。
随后,将找出的50%低重要性模块替换成更轻巧的流式稀疏注意力SSA。
这样就形成了一种交错结构,团队将这种结构称为ZigZag。
SSA的计算复杂度是线性的,远低于全注意力的平方级复杂度。
所以这种交错结构让模型既不会因为过度简化而变“笨”,又能将计算复杂度降到线性级别,节省大量算力。
为了让模型在关注局部细节的基础上不忽略整体逻辑,LoZA还设计了一个大小为1024 Token的稀疏窗口。
每个窗口包含1个负责抓取整体关联的“全局块”和7个负责紧盯附近内容的“局部块”,单块大小为128 Token。
这样的改造也无需从头训练,在中期训练阶段就能完成,成本也比较低。
从测试数据来看,LoZA的表现相当不错,主要是在“更快”的同时“没变笨”。
速度上,处理128K上下文时,解码速度直接比原来快10倍;
处理256K上下文时,模型预加载速度提升了50%,后续解码阶段生成内容时还能节省约30%的算力。这意味着同样的硬件,现在能同时处理两倍多的长文本任务。
这也让LongCat-Flash-Exp解锁了1M的上下文处理窗口。
性能上,LoZA也没有因为简化而“缩水”。
在处理问答、写代码这类日常任务时,和原版LongCat-Flash持平;处理长文本任务时,表现反而更好。
比如在MRCR测试里,超越了同样能处理1M长文本的Qwen-3模型,表现也更稳定。
接下来,团队还计划让LoZA支持动态稀疏比例。
短文本场景自动多用全注意力保证精度,长文本场景自动增加稀疏模块提升效率,甚至适配多模态模型处理长视频、长图文内容。
真是新年新气象!
论文地址已发布。
— 完 —
相关攻略
这项研究来自美的集团AI研究中心(AIRC)与北京交通大学、大连理工大学的联合团队,论文于2026年4月10日挂载于预印本平台arXiv,编号为arXiv:2604 09450v1。对技术细节感兴趣的读者,可以通过这个编号查阅完整论文。 一个放射科医生的日常困境 想象一下,一位放射科医生每天早晨面对
来源:环球时报美国《科学日报》 4月4日文章,原题:科学家发现大米的奇异特性,并将它们转化为智能材料 近日,在一项发表在美国学术期刊《物质》上的研究中,英国伯明翰大学牵头的国际团队发现,紧密堆积的
一、前言:PCIe 5 0 SSD今年能普及吗?去年年底,我们还满心期待 2026 会是 PCIe 5 0 SSD 真正普及的一年。可谁也没想到,AI 引发的这轮半导体风暴,直接让存储市场的价格全线
这项由印度萨蒂亚赛巴巴高等学习学院联合印度理工学院罗帕尔分校和红帽公司共同完成的研究发表于2026年3月的arXiv预印本平台,编号为arXiv:2603 17309v1。有兴趣深入了解的读者可以通
快科技3月29日消息,据日本AKIBA PC Hotline报道,市面上出现了一批仿真度极高的假冒三星990 PRO SSD。其包装、标签几乎与正品无异,甚至能被Windows和CrystalDis
热门专题
热门推荐
在追求极致效率的现代软件开发中,一款名为Cursor的AI代码编辑器正引领着开发范式的变革。它被定义为“面向未来的IDE”,其核心理念清晰而有力:将人工智能深度无缝地集成到编码工作流的每一个步骤,为开发者创造一种前所未有的“AI结对编程”体验。 Cursor sh应用场景 那么,这款AI驱动的编辑器
在众多AI图像生成工具中,WHEE凭借其精准的产品定位与持续的功能迭代,正成为越来越多设计师和内容创作者的首选工具。它专注于打造高品质的AI视觉素材生成器,核心使命就是帮助用户快速、高效地获得可直接使用的优质图片素材。 那么,这款AI绘图工具究竟有哪些核心优势?下面我们从其关键特性与功能设计进行深入
在AI绘画工具不断涌现的当下,一款名为NightCafe Creator的应用以其全面的AI艺术生成能力脱颖而出。它不仅是一个简单的图片处理工具,更是一个融合了多种前沿人工智能技术的创意平台,帮助用户轻松实现从构思到成品的艺术创作。 NightCafe Creator是什么? NightCafe C
近期加密货币市场受到宏观经济不确定性及流动性紧缩影响,比特币(BTC)、以太坊(ETH)以及多种山寨币出现明显下行走势,市场情绪趋于谨慎。 比特币近期走势分析 比特币的价格近期表现如何?简单来说,它跌破了几个市场公认的关键支撑位,而且伴随交易量的放大。这种放量下跌的信号,往往意味着多空分歧加剧。无论
蔡司宣布将于6月2日发布一款新镜头,并称其为镜头技术的重大突破,标志着全新纪元的开启。官方仅公布了产品剪影,但措辞暗示其可能带来根本性的技术升级,例如全新光学结构、先进镀膜或对焦系统改进。具体细节需待发布日揭晓。





