游乐游手机版
首页/AI热点日报/热点详情

人工智能检索领域HippoRAG 2新版本正式发布 GraphRAG已退位

类型:热点整理2026-07-01
HippoRAG 2 正式亮相,这标志着 RAG 系统在模拟人类长期记忆的道路上迈出了关键性的一步。传统的“检索-生成”模式终于被更具人脑思维方式的新架构所取代。接下来,我们详细解析 HippoRAG 2 的核心改进、为何更强大,以及在实际评估中的表现究竟如何。 现有的检索增强生成系统在处理长期记忆

HippoRAG 2 正式亮相,这标志着 RAG 系统在模拟人类长期记忆的道路上迈出了关键性的一步。传统的“检索-生成”模式终于被更具人脑思维方式的新架构所取代。接下来,我们详细解析 HippoRAG 2 的核心改进、为何更强大,以及在实际评估中的表现究竟如何。

HippoRAG 2发布,GraphRAG退位~

现有的检索增强生成系统在处理长期记忆时,常常显得僵化——要么信息之间缺乏关联,要么无法动态调整。HippoRAG 2 正是针对这一痛点进行了创新,它在全新维度上重新定义了“持续学习”:事实记忆感知构建关联性。在这三项关键能力上,HippoRAG 2 全面领先于 RAPTOR、GraphRAG、LightRAG 以及初代 HippoRAG,使其离真正的长期记忆系统更近一步。

核心思想:知识图谱与个性化 PageRank 的深度融合

HippoRAG 2 的底层引擎依然基于 HippoRAG 的个性化 PageRank 算法,但此次带来了两项重要升级:一是进一步挖掘段落粒度,二是优化在线阶段的 LLM 调用效率。简而言之,它不再仅仅将文档切块并存入向量库,而是将信息拆解为概念和关系,重构为一张动态、可交互的知识图谱。

离线索引阶段

  • 利用大语言模型(LLM)从每个段落中抽取三元组(实体-关系-实体),并将这些三元组整合到开放的知识图谱(KG)中。
  • 通过嵌入模型自动识别同义词,并在 KG 中添加同义词边——这有效解决了“汽车”与“车辆”这类概念不一致的问题。
  • 将原始段落也一并挂接到 KG 中,形成既包含概念网络又保留上下文信息的开放知识图谱。

在线检索阶段

  • 使用嵌入模型将用户查询与 KG 中的三元组和段落进行匹配,定位图搜索的种子节点。
  • 随后让 LLM 过滤掉那些表面匹配但实际无关的三元组,仅保留真正相关的内容。
  • 最后运行个性化 PageRank 算法,执行上下文感知的检索,将最相关的段落输送到下游问答任务中。

这一流程使检索从简单的向量匹配升级为概念网络探索,不再是“寻找最相似的句子”,而是“发现最相关的概念网络”。

评估与对比:全面超越现有方法

实验设置严谨且全面。基线方法涵盖了经典检索器(BM25、Contriever、GTR)、大型嵌入模型(GTE-Qwen2-7B-Instruct、GritLM-7B、NV-Embed-v2)以及结构增强 RAG 方法(RAPTOR、GraphRAG、LightRAG、HippoRAG)。评估指标方面,问答任务采用 F1 分数,检索任务使用 passage recall@5。

结果令人瞩目:HippoRAG 2 在所有基准类别中均获得第一。平均 F1 分数较标准 RAG 提升 7 个百分点,尤其在关联记忆任务上,差距更是达到两位数。这表明它不仅能准确记住事实,还能将分散的信息有效串联,回答那些需要“联想”才能解决的复杂问题。

完整的 HippoRAG 2 pipeline 示例

如果你想亲自上手运行,以下链接提供了完整的代码和论文:

https://github.com/OSU-NLP-Group/HippoRAG 
From RAG to Memory: Non-Parametric Continual Learning for Large Language Models
https://arxiv.org/pdf/2502.14802

从“检索”迈向“记忆”,这一跨越的意义远超性能榜单的提升。当 RAG 系统开始具备类似人类的长期记忆能力——动态更新、概念关联、上下文感知——它才能真正成为大语言模型可靠的“外脑”。HippoRAG 2 至少让我们看到了这一方向的可能性。

来源:https://www.53ai.com/news/RAG/2025030119543.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。