15天学会AI应用开发第九讲:Chroma持久化向量数据
时间:2026-06-04 19:21
上一篇文章我们借助all-MiniLM-L6-v2模型与FAISS搭建了一个简易的RAG检索系统,但存在一个明显短板——FAISS完全基于内存运行,向量数据无法持久化存储。每次系统重启,都需要重新对全部文本进行向量化处理,大量算力资源因此被白白浪费。 Chroma向量数据库详解 Chroma是一款本
上一篇文章我们借助all-MiniLM-L6-v2模型与FAISS搭建了一个简易的RAG检索系统,但存在一个明显短板——FAISS完全基于内存运行,向量数据无法持久化存储。每次系统重启,都需要重新对全部文本进行向量化处理,大量算力资源因此被白白浪费。
Chroma向量数据库详解
Chroma是一款本地向量数据库,专为RAG知识库的持久化存储与快速检索而设计。与FAISS相比,两者核心区别体现在以下方面:
- FAISS仅提供检索能力,不负责数据持久保存;Chroma既支持高效检索,也自带持久化存储功能。
- FAISS运行在内存中,检索速度极快;Chroma需要从磁盘加载数据,启动阶段速度稍慢。
- FAISS更适用于临时检索、简单RAG场景;Chroma则适合长期使用,尤其适合资料量庞大的RAG系统。
简单总结:Chroma是一款本地、自带持久化能力的RAG专用数据库,可以理解为一个为大语言模型量身定做的小型知识仓库。
Chroma的使用方法
在Python环境下,Chroma的核心操作包含三步:创建数据库与数据表、保存知识向量、在用户提问时检索相关知识点。具体代码示例如下:
import chromadb
# 创建数据库,指定本地路径
client = chromadb.PersistentClient(path="./chroma_db")
# 创建或获取数据表
collection = client.get_or_create_collection("knowledge_base")
# 把文本和向量一起存入
collection.add(documents=knowledge, embeddings=vectors, ids=ids)
# 提问时自动检索最相似的内容
results = collection.query(query_embeddings=q_vec, n_results=1)
由此可见,Chroma的使用步骤与FAISS一一对应:
- FAISS首先建立内存索引,Chroma则先创建数据库与数据表。
- FAISS将知识向量放入内存索引,Chroma则将向量保存至数据表中。
- FAISS从内存索引中查找,Chroma则从数据表中完成检索。
结合all-MiniLM-L6-v2与Chroma实现RAG
接下来演示如何将all-MiniLM-L6-v2与Chroma结合,构建一套完整的RAG检索功能。在编写代码之前,需要先安装依赖:
pip install chromadb sentence-transformers
然后编写下面的Python测试代码:
from sentence_transformers import SentenceTransformer
import chromadb
# ===================== 知识库(不变) =====================
knowledge = [
"什么是AI:人工智能(AI)是一门使机器模拟人类智能的技术。",
"什么是RAG:RAG代表检索增强生成,通过检索外部知识提升大模型回答准确性。",
"本地RAG消耗Token吗:本地RAG不调用云端API,不消耗Token,完全免费。",
"FAISS是什么:FAISS是Facebook开源的向量检索库,用于本地高效检索。",
"RAG的作用:RAG让大模型能引用外部知识,避免胡说八道。"
]
# ===================== 加载本地embedding模型 =====================
embed_model = SentenceTransformer("./all-MiniLM-L6-v2", device="cpu")
# 生成向量
vectors = embed_model.encode(knowledge)
# ===================== Chroma 初始化 =====================
client = chromadb.PersistentClient(path="./chroma_db")
collection = client.get_or_create_collection(name="knowledge_base")
ids = [f"doc_{i}" for i in range(len(knowledge))]
collection.add(
documents=knowledge,
embeddings=vectors.tolist(),
ids=ids
)
# ===================== RAG 检索 =====================
def rag(question):
print(" 问题:", question)
q_vec = embed_model.encode([question])
results = collection.query(
query_embeddings=q_vec.tolist(),
n_results=1
)
best = results["documents"][0][0]
answer = best.split(":")[-1]
print(" 答案:", answer)
print("-" * 50)
# ===================== 运行 =====================
if __name__ == "__main__":
print("=== 本地智能 RAG 系统(Chroma版)===")
while True:
q = input("请输入问题(q退出):")
if q.lower() == "q":
break
rag(q)
运行代码,输入问题“AI是什么?”,输出结果如下:
=== 本地智能 RAG 系统(Chroma版)===
请输入问题(q退出):AI是什么?
问题:AI是什么?
答案:人工智能(AI)是一门使机器模拟人类智能的技术。
--------------------------------------------------
从结果可以看出,即使提问文本与知识库中的表述不完全一致(“AI是什么?”对应“什么是AI”),all-MiniLM-L6-v2结合Chroma依然能精准理解语义,给出正确回答。这正是语义检索的核心优势所在。