游乐游手机版
首页/AI热点日报/热点详情

DeepSeek+Ollama+Xinference+RAGFlow+Dify部署教程:RAG落地五件套

类型:热点整理2026-07-04
DeepSeek-R1一经发布,AI应用的部署需求就肉眼可见地暴涨。抛开模型效果本身不谈,光说部署这一侧的易用性和灵活性,相比VLLM确实提升了一大截,门槛降低了不少,但坑也跟着来了——而且是连环坑。 下面的部署方案全部基于Docker,因为实在是太方便了。不过方便归方便,坑位也不少,请做好心理准备

DeepSeek-R1一经发布,AI应用的部署需求就肉眼可见地暴涨。抛开模型效果本身不谈,光说部署这一侧的易用性和灵活性,相比VLLM确实提升了一大截,门槛降低了不少,但坑也跟着来了——而且是连环坑。

下面的部署方案全部基于Docker,因为实在是太方便了。不过方便归方便,坑位也不少,请做好心理准备。喜欢折腾的同学可以按教程一步步来,我也是被逼无奈才把踩过的坑都记了下来。建议手边备好咖啡或茶,找个安静的时间段慢慢搞——不出意外的话,马上就会出意外,一个Bug一根烟。

Xinference部署

Xorbits Inference(简称Xinference)是一个开源的AI模型运行和集成平台。借助它,你可以在云端或本地环境中,轻松运行各种开源LLM、嵌入模型和多模态模型,并搭建强大的AI应用。

部署命令非常简洁,一条docker run就能搞定:

docker run \
  --name xinference \
  -d \
  -p 9997:9997 \
  -e XINFERENCE_HOME=/data \
  -v $(pwd):/data \
  --gpus all \
  xprobe/xinference:latest \
  xinference-local -H 0.0.0.0

参数说明:--name xinference给容器命名,-d后台运行,-p 9997:9997端口映射,-e XINFERENCE_HOME=/data设置主目录,-v $(pwd):/data将当前目录挂载到容器内实现数据持久化,--gpus all启用全部GPU。

部署成功后,直接访问http://localhost:9997就能看到管理界面。

部署一个reranker

建议从ModelScope下载,速度更快。部署成功后的界面如下:

RAGFlow部署

RAGFlow是一款基于深度文档理解的开源RAG引擎,专为各种规模的企业和个人设计,能结合大语言模型处理复杂格式数据,提供可靠的问答与引用。

步骤1:克隆仓库

$ git clone https://github.com/infiniflow/ragflow.git
$ cd ragflow/docker
$ git checkout -f v0.17.2

步骤2:使用预构建的Docker镜像并启动服务器

注意:下面的命令会下载v0.17.2-slim版本的RAGFlow镜像。如果你需要其他版本,可以在启动前修改docker/.env中的RAGFLOW_IMAGE变量。

# 使用CPU进行嵌入和DeepDoc任务:
$ docker compose -f docker-compose.yml up -d

# 使用GPU加速嵌入和DeepDoc任务:
# docker compose -f docker-compose-gpu.yml up -d

问题3:ragflow-mysql is unhealthy

如果遇到“dependency failed to start: container ragflow-mysql is unhealthy”,依次执行以下命令即可解决:

docker compose down -v 
docker compose up

不出意外的话,这里就要出意外了。访问http://localhost:81/login#/(81是修改后的默认web端口)。

Dify部署

Dify是一款开源的大语言模型应用开发平台,融合了后端即服务和LLMOps理念,非技术人员也能参与AI应用的定义和运营。

下载对应版本的标签:

访问安装页面:

启动报错pgdata: Operation not permitted

这个错误通常是因为PostgreSQL数据目录权限问题。按照以下步骤修复:

  1. 确保目录存在
mkdir -p ./volumes/db/data
  1. 设置正确的权限
sudo chown -R 999:999 ./volumes/db/data
  1. 验证Docker Compose配置:确保volume映射正确。
version: '3'
services:
  db:
    image: postgres:15-alpine
    restart: always
    environment:
      PGUSER: postgres
      POSTGRES_PASSWORD: difyai123456
      POSTGRES_DB: dify
      PGDATA: /var/lib/postgresql/data/pgdata
    volumes:
      - ./volumes/db/data:/var/lib/postgresql/data
    healthcheck:
      test: [ "CMD", "pg_isready" ]
      interval: 1s
      timeout: 3s
      retries: 30
  1. 清理现有数据
sudo rm -rf ./volumes/db/data/*
  1. 运行Docker Compose
docker compose up -d

Dify Docker部署后,install界面卡住,step请求报502

这个问题可以参考社区解决方案,通常是nginx或后端服务启动顺序的问题。

Postgres报错

修正后的docker-compose.yaml配置如下:

# PostgreSQL 数据库
db:
  image: postgres:15-alpine
  restart: always
  environment:
    PGUSER: xxxx
    # 默认 postgres 用户的密码
    POSTGRES_PASSWORD: xxxx
    # 默认的 postgres 数据库名称
    POSTGRES_DB: dify
    # PostgreSQL 数据目录
    PGDATA: /var/lib/postgresql/data/pgdata
  volumes:
    - db_data:/var/lib/postgresql/data
  healthcheck:
    test: ["CMD", "pg_isready"]
    interval: 1s
    timeout: 3s
    retries: 30

# 添加卷名称
volumes:
  db_data:

核心修复点:将原来的挂载路径改为使用命名卷db_data,并在文件末尾添加卷声明。

Ollama部署

Ollama是一个开源的大语言模型平台,让你能轻松在本地运行、管理各种LLM,支持文本生成、翻译、代码编写等任务。它的亮点是简化工作流程,让机器学习不再是深度技术背景的开发者才能触及的领域。Ollama支持多种硬件加速,包括纯CPU推理和Apple Silicon。

运行模型只需一条命令:

ollama run deepseek-r1:14b

Ollama在Windows中常用的环境变量:

环境变量 描述 默认值 示例值
OLLAMA_HOST 指定服务器主机地址和端口 127.0.0.1:11434 0.0.0.0:11434 或 192.168.1.100:11434
OLLAMA_MODELS 指定模型文件存储位置 %USERPROFILE%\.ollama\models D:\ollama\models
OLLAMA_KEEP_ALIVE 模型在内存中保持加载的时间(秒) 5分钟(300秒) 1800(30分钟)
OLLAMA_VERBOSE 启用详细日志输出 0 1
OLLAMA_TIMEOUT API请求超时时间(秒) 30 60

设置这些变量后,记得重启Ollama服务或重新打开命令行窗口。

缝合怪如何集成组件

  • RAGFlow集成Ollama
deepseek-r1:14b 基础 Url http://host.docker.internal:11434 API-Key 最大token数 8192
  • RAGFlow集成Xinference重排序模型

在Xinference中运行排序模型后,填写本机IP地址即可。

  • Dify集成Ollama模型
  • Dify集成Xinference排序模型
  • Dify集成Xinference向量模型

Dify集成RAGFlow

  • 获取RAGFlow知识库ID
  • 在Dify中添加外部知识库
来源:https://www.53ai.com/news/RAG/2025032204738.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。