谷歌TurboQuant算法遭中国博士后质疑,论文争议点深度剖析
近日,AI模型压缩领域发生了一场引人关注的学术风波。事件的起因是谷歌研究院在3月25日重磅发布的全新极端压缩算法TurboQuant。该技术旨在破解大语言模型推理过程中的核心瓶颈——键值缓存(KV Cache)所导致的庞大内存占用问题,宣称能将模型内存消耗降低至原有的六分之一,并使推理速度最高提升八倍,一度被业界视为可能重塑AI效率格局的突破。
然而,仅仅两天后,剧情出现反转。3月27日晚,苏黎世联邦理工学院博士后研究员、知名压缩算法RaBitQ的第一作者高健扬公开发文,对TurboQuant的论文内容提出严肃质疑。他明确指出,谷歌的这篇论文在描述其团队开创的RaBitQ工作时,存在多处严重的不准确陈述和误导性对比,并且在投稿前已被提醒的情况下仍未修正。

那么,争议的核心具体是什么?根据高健扬博士的详细梳理,TurboQuant论文主要在以下三个关键方面对RaBitQ的工作进行了误读与不公呈现。
第一,方法论溯源模糊。RaBitQ算法的核心理论基础之一是Johnson-Lindenstrauss变换(JL变换),而TurboQuant在论文中并未清晰说明自己同样依赖于这一关键数学工具,从而弱化了两项工作在最根本技术路径上的相似性与继承关系。
第二,缺乏依据的“次优”定性。TurboQuant在未提供严谨理论证明的情况下,就将RaBitQ的理论分析结论标记为“次优”。这种带有主观评判性质的断言,容易对读者造成先入为主的误导。
第三,实验设置有失公允。这是最受关注的实践性质疑。对比实验的公平性直接影响结论的可信度,而TurboQuant在评估RaBitQ性能时被指采用了不公平的硬件环境。
高健扬进一步强调,由于这篇存在争议的论文已被顶级学术会议ICLR 2026接收,并借助谷歌的平台获得了数千万次传播,若不及时澄清,文中不准确的表述恐将形成错误的“共识”,这对学术研究的健康发展是不利的。
除了上述三点,高博士还补充了几个未被充分披露的信息:其一,RaBitQ算法已在理论上被证明具有渐近最优性,符合相关理论上限;其二,TurboQuant实际采用了与RaBitQ相同的关键随机旋转步骤,但未明确承认这一技术关联;其三,实验对比中存在明显的“硬件不对等”问题——评估RaBitQ时使用单核CPU,而测试自家TurboQuant时则动用了强大的A100 GPU,这种差异无疑会极大影响性能对比结果的客观性。
目前,高健扬及其团队已决定正式提交投诉,以推动学术记录的澄清与更正。这场涉及算法创新归属、学术表述规范与实验伦理的争论,后续进展值得AI社区与科研界持续关注。

