Core本地部署自动脚本一键更新模型清理缓存_AI热点日报

Core本地部署自动脚本一键更新模型清理缓存

类型：热点整理2026-05-17

当您部署的Core本地推理服务出现模型版本未及时更新，或磁盘空间因缓存堆积而告急时，通常可归结为两类核心问题：本地模型文件未同步至最新版本，或缓存目录中积累了过多历史文件，导致服务响应迟缓甚至加载失败。无需担忧，遵循以下系统化的操作步骤，您将能高效解决这些问题，确保服务稳定运行。一、执行一键模型更

当您部署的Core本地推理服务出现模型版本未及时更新，或磁盘空间因缓存堆积而告急时，通常可归结为两类核心问题：本地模型文件未同步至最新版本，或缓存目录中积累了过多历史文件，导致服务响应迟缓甚至加载失败。无需担忧，遵循以下系统化的操作步骤，您将能高效解决这些问题，确保服务稳定运行。

Core本地部署自动化脚本_一键更新模型与清理缓存

最便捷高效的解决方案是使用项目自带的自动化更新脚本。该脚本设计智能，会首先比对远程模型仓库的哈希值与本地模型文件的“指纹”，仅下载存在变动的增量更新包，随后执行热替换操作。这种方法不仅避免了全量下载的漫长耗时，也确保了推理服务在更新过程中无需中断，实现无缝升级。

具体操作流程如下：

1. 首先，进入您的Core项目部署根目录，确认其中存在名为 update-model.sh 的脚本文件。

2. 为该脚本赋予可执行权限，执行命令：chmod +x update-model.sh。

3. 运行更新命令，并指定您需要更新的目标模型名称，例如：./update-model.sh --model glm-4-flash --force-reload。

4. 随后，请耐心等待终端输出。当出现 [SUCCESS] Model reload completed, inference service restarted 的成功提示时，即表示模型更新与服务重载已全部完成。

随着服务长期运行，缓存目录（默认路径通常为 /cache/llm/）中会逐渐堆积各类临时文件，例如：长时间未被访问的中间权重、过期的激活缓存以及历史日志快照等。这些“历史包袱”会持续占用宝贵的磁盘空间，影响系统性能。

Core服务内置了安全的清理工具，可自动扫描并清除这些过期资源：

1. 执行以下指令启动清理：core-cli cleanup --scope cache --ttl 7d --dry-run false。其中，参数 --ttl 7d 表示清理超过7天的缓存文件，您可以根据实际存储情况调整此时间阈值。

2. 执行后，请仔细查看命令行输出。若出现类似 327 items scheduled for deletion 的提示，并显示预估可释放的磁盘空间大小，则表明扫描与清理任务已成功触发。

3> 请放心，此清理过程是安全可靠的。系统会自动识别并跳过当前正被推理进程锁定的活跃缓存文件，仅对已过期且未被使用的“退休”资源进行清理，不会影响服务的正常运行。

在某些场景下，您可能通过外部编辑器直接修改了模型的配置文件（如 `config.json` 或 `tokenizer.json`）。然而，Core服务进程可能仍在内存中保留着旧的元数据索引映射，导致您的修改未能即时生效。

此时，需要进行一次手动干预，强制刷新服务的元数据缓存：

1. 首先，定位到您的具体模型加载路径，例如：/models/glm-4-plus/。

2. 找到并删除该目录下的元数据缓存文件，执行命令：rm -f .metadata_cache.bin。请注意，此文件为隐藏文件，文件名前的点号不可遗漏。

3. 最后，向正在运行的Core服务进程发送一个特定的重载信号，执行：kill -SIGUSR2 $(pgrep -f "core-server")。此操作会通知服务进程重新读取最新的配置文件与元数据，从而实现配置更新，而无需完全重启整个服务，最大程度保证服务连续性。

来源：https://www.php.cn/faq/2392772.html

fig 本地部署

补充最近整理过的热点入口。