人工智能检索领域HippoRAG 2新版本正式发布 GraphRAG已退位_AI热点日报

人工智能检索领域HippoRAG 2新版本正式发布 GraphRAG已退位

类型：热点整理2026-07-01

HippoRAG 2 正式亮相，这标志着 RAG 系统在模拟人类长期记忆的道路上迈出了关键性的一步。传统的“检索-生成”模式终于被更具人脑思维方式的新架构所取代。接下来，我们详细解析 HippoRAG 2 的核心改进、为何更强大，以及在实际评估中的表现究竟如何。现有的检索增强生成系统在处理长期记忆

HippoRAG 2 正式亮相，这标志着 RAG 系统在模拟人类长期记忆的道路上迈出了关键性的一步。传统的“检索-生成”模式终于被更具人脑思维方式的新架构所取代。接下来，我们详细解析 HippoRAG 2 的核心改进、为何更强大，以及在实际评估中的表现究竟如何。

现有的检索增强生成系统在处理长期记忆时，常常显得僵化——要么信息之间缺乏关联，要么无法动态调整。HippoRAG 2 正是针对这一痛点进行了创新，它在全新维度上重新定义了“持续学习”：事实记忆、感知构建和关联性。在这三项关键能力上，HippoRAG 2 全面领先于 RAPTOR、GraphRAG、LightRAG 以及初代 HippoRAG，使其离真正的长期记忆系统更近一步。

核心思想：知识图谱与个性化 PageRank 的深度融合

HippoRAG 2 的底层引擎依然基于 HippoRAG 的个性化 PageRank 算法，但此次带来了两项重要升级：一是进一步挖掘段落粒度，二是优化在线阶段的 LLM 调用效率。简而言之，它不再仅仅将文档切块并存入向量库，而是将信息拆解为概念和关系，重构为一张动态、可交互的知识图谱。

离线索引阶段

利用大语言模型（LLM）从每个段落中抽取三元组（实体-关系-实体），并将这些三元组整合到开放的知识图谱（KG）中。
通过嵌入模型自动识别同义词，并在 KG 中添加同义词边——这有效解决了“汽车”与“车辆”这类概念不一致的问题。
将原始段落也一并挂接到 KG 中，形成既包含概念网络又保留上下文信息的开放知识图谱。

在线检索阶段

使用嵌入模型将用户查询与 KG 中的三元组和段落进行匹配，定位图搜索的种子节点。
随后让 LLM 过滤掉那些表面匹配但实际无关的三元组，仅保留真正相关的内容。
最后运行个性化 PageRank 算法，执行上下文感知的检索，将最相关的段落输送到下游问答任务中。

这一流程使检索从简单的向量匹配升级为概念网络探索，不再是“寻找最相似的句子”，而是“发现最相关的概念网络”。

评估与对比：全面超越现有方法

实验设置严谨且全面。基线方法涵盖了经典检索器（BM25、Contriever、GTR）、大型嵌入模型（GTE-Qwen2-7B-Instruct、GritLM-7B、NV-Embed-v2）以及结构增强 RAG 方法（RAPTOR、GraphRAG、LightRAG、HippoRAG）。评估指标方面，问答任务采用 F1 分数，检索任务使用 passage recall@5。

结果令人瞩目：HippoRAG 2 在所有基准类别中均获得第一。平均 F1 分数较标准 RAG 提升 7 个百分点，尤其在关联记忆任务上，差距更是达到两位数。这表明它不仅能准确记住事实，还能将分散的信息有效串联，回答那些需要“联想”才能解决的复杂问题。

完整的 HippoRAG 2 pipeline 示例

如果你想亲自上手运行，以下链接提供了完整的代码和论文：

https://github.com/OSU-NLP-Group/HippoRAG 
From RAG to Memory: Non-Parametric Continual Learning for Large Language Models
https://arxiv.org/pdf/2502.14802

从“检索”迈向“记忆”，这一跨越的意义远超性能榜单的提升。当 RAG 系统开始具备类似人类的长期记忆能力——动态更新、概念关联、上下文感知——它才能真正成为大语言模型可靠的“外脑”。HippoRAG 2 至少让我们看到了这一方向的可能性。

来源：https://www.53ai.com/news/RAG/2025030119543.html

ai 人工智能

延伸阅读

补充最近整理过的热点入口。