搭建一个高效稳定的RAGFlow知识库,能够让AI聊天真正“有料”。很多人在配置环节容易卡壳,其实理清几个关键步骤就能顺利上手。下面将系统模型设置、知识库创建、文件管理、分块与嵌入这些核心环节逐一拆解说明。

一、设定与修改系统默认模型
先配置好模型。点击头像进入模型供应商页面,找到【系统模型设置】按钮。在弹出的窗口里需要选择一个聊天模型——比如之前使用的是火山引擎,那就直接选用火山的DeepSeek-V3。至于嵌入模型和Rerank模型,系统自带了一套默认方案,如果觉得不够用,也可以替换为自己的模型。
二、创建知识库
知识库、聊天和文件管理是RAGFlow的三大支柱功能。AI聊天完全依赖知识库来提供信息支撑。每个知识库就是一个独立的知识源,将本地文件和文件管理里生成的文件引用解析转化为真正的“知识”。下面按步骤操作。
1. 创建知识库
在首页点击【知识库】选项卡,然后点击【创建知识库】按钮。在弹出的窗口中填写好名称,点击确定后会自动跳转到配置页面。
2. 配置知识库
在配置页面中可以修改名称,也可以直接上传文件。关于分块方法,RAGFlow提供了多种模板,针对不同文件布局来保证语义完整性。在Chunk 方法下拉菜单里选择适合你文件格式的模板。下表列出了各模板的说明及兼容格式。请注意,数据集页面也可以修改分块方法。
嵌入模型的选择:嵌入模型负责将文本块转换为向量。一旦知识库中已有块,就无法再更改嵌入模型。如果确实需要更换,必须删除所有现有块后重新开始——因为同一知识库必须使用同一个嵌入模型,确保所有向量在同一空间内进行相似度比较。
文件上传:RAGFlow的文件管理允许一个文件关联多个知识库,每个知识库只存储引用。也可以在知识库内直接上传文件(单个文件或整个文件夹),那样会保存副本。官方更推荐先上传到文件管理,再链接到知识库,这样删除时不会永久丢失文件。在【数据集】界面点击【新增文件】,通过拖拽或点击上传即可。上传时勾选【创建时解析】可以边上传边解析,或者在列表操作栏里手动触发解析。请记住:只有解析成功,才能开始问答交互。
解析
文件解析是知识库配置的关键环节。RAGFlow的解析包含两层含义:按照布局进行分块,以及在块上构建嵌入和全文(关键词)索引。选好分块方法和嵌入模型后,就可以点击解析按钮(播放图标)开始解析。
3. 搜索知识库
目前搜索仅支持按知识库名称查找。如果能按内容或其他参数检索,灵活性会更高——期待后续版本持续完善。
4. 删除知识库
鼠标悬停在知识库卡片的三个点上,会出现删除选项。删除后,root/.knowledge目录下的关联文件夹会自动被移除。如果文件是直接上传到知识库的,那么文件将被彻底删除;如果文件是在文件管理里创建的,知识库只存储引用,删除的只是引用关系,原始文件依然保留。
三、RAGFlow核心或专有功能介绍
几个值得一提的能力:
- 可以定义嵌入知识的语言类型,中文或英文
- 可以选择知识的内容类型,例如单页、书籍等
- 支持表格转HTML,表格数据处理起来非常顺畅
- 支持Rerank(重新排序模型)和img2text(图像转语义)
写到这里,RAGFlow创建知识库的流程已经基本清晰。单就知识库功能来看,RAGFlow确实比Dify要强大不少;不过综合能力方面Dify更为全面。有趣的是,可以让Dify连接RAGFlow的知识库作为外部知识源,将两者的优势整合在一起使用。
