15天学会AI应用开发第九讲：Chroma持久化向量数据

时间：2026-06-04 19:21

上一篇文章我们借助all-MiniLM-L6-v2模型与FAISS搭建了一个简易的RAG检索系统，但存在一个明显短板——FAISS完全基于内存运行，向量数据无法持久化存储。每次系统重启，都需要重新对全部文本进行向量化处理，大量算力资源因此被白白浪费。 Chroma向量数据库详解 Chroma是一款本

上一篇文章我们借助all-MiniLM-L6-v2模型与FAISS搭建了一个简易的RAG检索系统，但存在一个明显短板——FAISS完全基于内存运行，向量数据无法持久化存储。每次系统重启，都需要重新对全部文本进行向量化处理，大量算力资源因此被白白浪费。 15天学会AI应用开发（九）利用Chroma持久化向量数据

Chroma向量数据库详解

Chroma是一款本地向量数据库，专为RAG知识库的持久化存储与快速检索而设计。与FAISS相比，两者核心区别体现在以下方面：

FAISS仅提供检索能力，不负责数据持久保存；Chroma既支持高效检索，也自带持久化存储功能。
FAISS运行在内存中，检索速度极快；Chroma需要从磁盘加载数据，启动阶段速度稍慢。
FAISS更适用于临时检索、简单RAG场景；Chroma则适合长期使用，尤其适合资料量庞大的RAG系统。

简单总结：Chroma是一款本地、自带持久化能力的RAG专用数据库，可以理解为一个为大语言模型量身定做的小型知识仓库。

Chroma的使用方法

在Python环境下，Chroma的核心操作包含三步：创建数据库与数据表、保存知识向量、在用户提问时检索相关知识点。具体代码示例如下：

import chromadb

# 创建数据库，指定本地路径
client = chromadb.PersistentClient(path="./chroma_db")

# 创建或获取数据表
collection = client.get_or_create_collection("knowledge_base")

# 把文本和向量一起存入
collection.add(documents=knowledge, embeddings=vectors, ids=ids)

# 提问时自动检索最相似的内容
results = collection.query(query_embeddings=q_vec, n_results=1)

由此可见，Chroma的使用步骤与FAISS一一对应：

FAISS首先建立内存索引，Chroma则先创建数据库与数据表。
FAISS将知识向量放入内存索引，Chroma则将向量保存至数据表中。
FAISS从内存索引中查找，Chroma则从数据表中完成检索。

结合all-MiniLM-L6-v2与Chroma实现RAG

接下来演示如何将all-MiniLM-L6-v2与Chroma结合，构建一套完整的RAG检索功能。在编写代码之前，需要先安装依赖：

pip install chromadb sentence-transformers

然后编写下面的Python测试代码：

from sentence_transformers import SentenceTransformer
import chromadb

# ===================== 知识库（不变） =====================
knowledge = [
    "什么是AI：人工智能（AI）是一门使机器模拟人类智能的技术。",
    "什么是RAG：RAG代表检索增强生成，通过检索外部知识提升大模型回答准确性。",
    "本地RAG消耗Token吗：本地RAG不调用云端API，不消耗Token，完全免费。",
    "FAISS是什么：FAISS是Facebook开源的向量检索库，用于本地高效检索。",
    "RAG的作用：RAG让大模型能引用外部知识，避免胡说八道。"
]

# ===================== 加载本地embedding模型 =====================
embed_model = SentenceTransformer("./all-MiniLM-L6-v2", device="cpu")

# 生成向量
vectors = embed_model.encode(knowledge)

# ===================== Chroma 初始化 =====================
client = chromadb.PersistentClient(path="./chroma_db")
collection = client.get_or_create_collection(name="knowledge_base")
ids = [f"doc_{i}" for i in range(len(knowledge))]

collection.add(
    documents=knowledge,
    embeddings=vectors.tolist(),
    ids=ids
)

# ===================== RAG 检索 =====================
def rag(question):
    print(" 问题：", question)
    q_vec = embed_model.encode([question])
    results = collection.query(
        query_embeddings=q_vec.tolist(),
        n_results=1
    )
    best = results["documents"][0][0]
    answer = best.split("：")[-1]
    print(" 答案：", answer)
    print("-" * 50)

# ===================== 运行 =====================
if __name__ == "__main__":
    print("=== 本地智能 RAG 系统（Chroma版）===")
    while True:
        q = input("请输入问题（q退出）：")
        if q.lower() == "q":
            break
        rag(q)

运行代码，输入问题“AI是什么？”，输出结果如下：

=== 本地智能 RAG 系统（Chroma版）===
请输入问题（q退出）：AI是什么？
 问题：AI是什么？
 答案：人工智能（AI）是一门使机器模拟人类智能的技术。
--------------------------------------------------

从结果可以看出，即使提问文本与知识库中的表述不完全一致（“AI是什么？”对应“什么是AI”），all-MiniLM-L6-v2结合Chroma依然能精准理解语义，给出正确回答。这正是语义检索的核心优势所在。

来源：https://cloud.tencent.com.cn/developer/article/2682275

AI应用开发

上一篇人工智能进入狂奔模式，安全能否同步跟上 下一篇AI时代为何始终难以找到靠谱的数据库产品

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

AI教程 · 2026-06-29

Windows Docker Desktop RabbitMQ生产级部署完整指南

前言在 Windows 本地开发环境中，直接安装 RabbitMQ 确实颇为周折：需要单独配置 Erlang 运行环境、手动管理环境变量、服务启停全凭手工操作。更令人困扰的是，版本兼容冲突、端口占用、环境不一致等问题层出不穷。笔者见过不少开发者为搭建环境就得耗费整整半天时间。相比之下，借助 Do

AI教程 · 2026-06-29

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践

先分享一个切实感受。过去两年，我们与福建制造企业合作较为频繁，发现一个非常突出的现象：超过80%的企业官网，产品参数仍然存放在PDF或图片中。AI爬虫？根本无法抓取。这些企业技术实力不弱、资质证照齐全、应用案例也丰富，但在AI搜索这一全新战场上，它们几乎处于隐身状态。一、一个正在发生的行业变化 A

AI教程 · 2026-06-29

阿里云Token Plan团队版功能价格与省钱购买指南

阿里云百炼近期推出了名为“Token Plan 团队版”的全新服务，这一服务专为企业与开发者量身打造，定位为AI大模型订阅平台。通过引入Credits作为统一计量单位，将文本生成、图像生成等多模态AI能力纳入单一计费体系，同时无缝兼容主流AI编程工具及智能体（Agent）生态系统。其核心亮点包括：全

AI教程 · 2026-06-29

阿里云物联网.NET Core客户端位置信息上报

阿里云物联网平台的位置服务并非一个完全独立的功能模块。位置信息可包含二维坐标与三维坐标，而位置数据的来源本质上是借助设备属性进行上传。换言之，若要让设备上报位置，您需先将其视为一个普通属性进行处理。 1）添加二维位置数据操作过程十分简洁。进入数据分析 → 空间数据可视化 → 二维数据，点击添加，将

AI教程 · 2026-06-29

年阿里云服务器选型配置与网站部署全攻略

2026年，阿里云服务器生态已高度成熟，形成了清晰的轻量应用服务器与ECS云服务器两大产品阵营。无论你是计划搭建个人博客、企业官网，还是运营电商平台、进行应用开发，基本都能找到理想的解决方案。本指南将从服务器选型、配置选择、部署流程到安全运维，系统梳理2026年最实用的操作要点，帮助你少走弯路，让网