在前几篇文章中,我们已系统梳理了RAG(检索增强生成)的核心概念及其完整工作流程。在数据准备环节,首先通过文档加载器导入原始文档,随后借助文本分割器将长文档切分为大小适中的文档片段——这一步骤至关重要:切分过细会导致上下文信息丢失,切分过大则会降低检索效率。

紧接着,这些文档片段经由文本嵌入模型转化为向量数据,并由 VectorStore 组件存入向量数据库中。至此,RAG 的检索准备工作才算彻底完备。随后,检索器 Retrievers 正式登场——在向量数据库检索器内部,查询文本同样先通过文本嵌入模型转换为向量,再调用 VectorStore 执行向量检索,最终返回最相关的文档列表。整个流程环环相扣,任何环节都不可或缺。
