BookRAG:用SOTA方法提升复杂文档理解效果的实用指南
BookRAG系统真正把“书”当书来解读:它首先恢复原始目录结构,然后构建书中实体关系图谱,最终使AI能够像人类阅读一样“品味内容脉络”,在复杂文档问答任务上全面超越了现有最佳模型。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
香港中文大学最新研究成果

论文地址:https://arxiv.org/pdf/2512.03413开源地址:https://github.com/sam234990/BookRAG
一句话总结
BookRAG真正实现了“读书式”文档解析:重建目录树、绘制知识图谱、模仿人类阅读路径,最终在复杂文档问答中全面领先。
传统RAG → 扁平切片 → 结构丢失
LayoutRAG → 保留块但无关联 → 跨块断链
BookRAG → 树图双索引 + 主动思考 → 精准定位

直击痛点
传统RAG方法将PDF当作一维文本处理,遇到真正的“书籍”类文档(如手册、论文、年报)就显得力不从心:
核心亮点

方案概览
① 离线建索引(BookIndex)
布局解析 → 将PDF拆解为内容块(标题、段落、表格、图片)章节过滤 → LLM为每个“标题”块定级,还原真实目录树实体抽取 → 每块抽实体/关系,构建知识图G消歧合并 → 梯度法检测“突变式”相似度下降,自动合并别名树图映射 → 每个实体挂载原始章节,形成GT-Link> 成果:一棵带“页码”的树 + 一张会“指引”的图

② 在线问答(Agent-based Retrieval)
查询意图识别:Single-hop / Multi-hop / Global-aggregation 三类路径匹配:动态组合4类智能体Formulator:解析问题、抽取关键实体
Selector:基于内容关联度或路径过滤缩小搜索范围
Reasoner:图文双维度分析打分
Synthesizer:汇总局部答案形成最终结论
执行流程:Skyline算子选取最优块 → 送LLM生成
图片
实验结果
召回率:71.2%(↑26.7%)Token开销:仅为DocETL的1/10平均延迟:提速2×

消融实验
思考启示
层级化文档不限于“书籍”:合同、病历、法规皆可参照此思路信息汲取理论为RAG带来了“人类式阅读”的可解释路径梯度消歧是clean-ER的低成本替代方案,可迁移到任何单文档图谱构建热门专题
热门推荐
PChome 3月30日消息,OPPO最新透露,OPPO Find X9s Pro配备哈苏双2亿镜头,堪称新一代旅拍神器,将于四月份正式推出。结合OPPO此前的预热信息来看,该机将与OPPO Fin
PPT中实现动态地图交互需避免静态截图,可采用四种方法:一、PowerPoint内置3D地图(需Office 2019+),二、嵌入网页地图(如高德API+Web Viewer加载
随着大模型技术持续演进,人工智能正加速从“能力展示”迈向“规模化应用”。作为承接大模型能力、实现任务自动执行的关键形态,AI智能体正在金融、能源、医疗、制造、政务等领域快速落地,成为重构产业生产力的
2026年3月29日,东莞,一场关乎智能未来的思想盛宴在聚光灯下缓缓落幕。三天时间里,以“Change-Maker”为名的熵基科技「脑机接口×AI空间智能体」发布会暨中国合作伙伴大会(以下简称“Ch
近日,有博主在社交平台晒出自己的四辆小米汽车,并称已集齐小米汽车目前发布的全部四款车型:小米SU7、新一代小米SU7、小米SU7 Ultra以及小米YU7。并配文道:“@雷军 您好,我集合了小米目前





