粘贴截图致Claude Code对话崩溃？开源项目填坑了

首页/AI教程/文章详情

粘贴截图致Claude Code对话崩溃？开源项目填坑了

时间：2026-06-24 11:55

AICLI工具搭配不支持多模态的第三方模型时，粘贴截图导致对话崩溃。该项目通过袋里层图片整流器拦截base64数据并替换为文本提示，引导模型调用图片分析Skill，支持本地文件、剪贴板及30+Provider自动切换，实现透明化图片识别。

为什么需要本项目？

先说一个核心判断：当AI CLI工具配上第三方模型，图片理解这件事几乎就是一块真空地带。

用过Claude Code、OpenCode这类工具，再搭配DeepSeek等不支持多模态的模型时，这个问题简直让人抓狂。你辛辛苦苦贴了张截图上去，结果模型要么直接报错，要么给出离谱的分析，整段对话就这么毁了。

传统方案为啥走不通？

常见的做法，是在全局CLAUDE.md里写规则，强制要求系统调用某个Skill或MCP去处理图片。听起来很有道理，但实操中有一个绕不开的坑。

Claude Code在系统层面把指令写死了——只要粘贴图片，它就必定调用read工具，直接把图片数据发给模型。这个系统指令的优先级高于CLAUDE.md，所以你写的规则根本拦不住它。

结果是什么？Ctrl+V一张截图，模型收到base64数据，直接宕机或者胡说八道。对话就此烂尾，毫无挽回余地。

更麻烦的是，调试阶段我们几乎不会先把截图存成本地文件再上传——直接截图、复制到剪贴板、粘贴，这才是最自然的工作流。传统方案只适用于"先保存文件，再给路径"的场景，跟实际使用习惯完全对不上。

本项目的解法：两层防线

思路很直接：图片整流器 + 图片分析技能，分两层应对。

场景	传统方案	本项目
Ctrl+V粘贴剪贴板图片到Claude Code	❌ 系统硬编码`read`，直接发给模型，对话烂掉	✅ 整流器在袋里层拦截，替换为文本提示，引导模型调用Skill
给定图片文件路径	⚠️ `CLAUDE.md`规则勉强可用，但不同CLI行为不一致	✅ 整流器统一拦截，不依赖MD文件规则
OpenCode粘贴剪贴板图片	❌ OpenCode不生成临时文件，路径都拿不到	✅ Skill脚本自动检测：有路径读文件，没路径直接从剪贴板读取
多Provider切换	❌ 单个模型挂了就挂了	✅ Fallback机制，30+ Provider自动切换

两层防线怎么分工？

图片整流器（袋里层） — 在请求发出前拦截。检测messages中的base64图片块，移除原始数据，替换为文本提示，引导模型调用Skill。这一步在模型看到请求之前就已经完成了。
图片分析技能（CLI工具） — 被模型调用后，智能判断图片来源：传了本地路径就读文件，没传路径就从系统剪贴板直接读取。兼容Claude Code（粘贴生成临时文件）和OpenCode（粘贴不生成临时文件）两种行为。

原项目简介

CC Switch是一款管理AI CLI工具（Claude Code、Codex、Gemini CLI、OpenCode、OpenClaw、Hermes）的桌面应用，提供供应商管理、袋里/故障转移、MCP/Skills管理和用量统计等功能。

本分支在此基础上新增了针对图片输入处理的功能，核心解决了大量第三方API供应商不支持多模态（视觉理解）的问题。

本分支新增功能

1. 图片整流器

这个功能要解决的问题非常明确：大量第三方API供应商（中转站、非官方接口）不支持多模态输入。当请求的messages数组中间出现type: "image"的base64图片块时，这些供应商会直接报错或行为异常。

它的工作原理是作为袋里层的拦截器，在请求转发之前运行。整流器扫描messages[*].content，检测type: "image"块，移除base64数据（通常有几MB），然后替换为文本提示，引导模型调用指定的skill来处理图片。

几个关键特性：

自动检测并替换messages中的type: "image"块
存在图片缓存引用时自动提取文件路径拼入提示
可配置调用的skill名称（默认：image-analysis）
与下方的图片分析技能无缝配合

配置起来很简单：路由设置 → 整流器区域 → 图片整流器，打开开关，按需修改skill名称即可。

2. 图片分析技能

这是一个独立的Python命令行图片视觉识别工具，兼容任何能执行Shell命令的AI CLI。

核心能力包括：

支持本地图片（jpg/png/gif/webp/bmp）、网络图片URL、系统剪贴板（macOS AppleScript）
多图对比（多次--image）
Fallback机制：按配置顺序依次尝试所有provider，失败自动切换，第一个成功的结果标注[provider名]后返回

预置了30+ AI Provider：

平台	代表模型
火山引擎	豆包 Seed 2.0 Pro/Lite/Mini、Vision 250815
硅基流动	Qwen3.6-35B-A3B、Qwen3.6-27B
阿里百炼	Qwen3.6 Plus/Flash、Qwen3.5 Omni、Kimi K2.6、MiniMax M2.5
智谱	GLM-4.6V-Flash
商汤	SenseNova-6.7-Flash-Lite

它与图片整流器的联动逻辑是这样的：当某模型不支持图片时，整流器会将图片块替换为文本提示，引导模型调用Skill，模型自动通过CLI完成实际视觉分析。整个过程对用户透明，不需要手动执行Python脚本。

3. dev.sh — 开发启动脚本

封装了pnpm tauri dev / pnpm tauri build的便捷脚本：

./dev.sh # Debug模式（默认）
./dev.sh debug # Debug模式（含请求体打印）
./dev.sh release # Release模式
./dev.sh build # Release编译

预置了CARGO_HTTP_PROXY，方便国内网络环境下编译Rust依赖。

安装

从源码编译：

git clone https://github.com/piaomiaoguying/cc-switch.git
cd cc-switch
./dev.sh build

使用流程

第一步：注册AI Provider并获取API Key

本Skill预置了多个平台的视觉模型，均有免费额度，挑一个自己习惯的平台注册即可：

平台	代表模型	注册地址
阿里百炼	Qwen3.6 Plus/Flash、Qwen3.5 Omni 等	dashscope.aliyun.com
智谱	GLM-4.6V-Flash	open.bigmodel.cn
硅基流动	Qwen3.6-35B-A3B 等	siliconflow.cn
火山引擎	豆包 Seed 2.0 Pro/Lite/Mini	console.volcengine.com
商汤	SenseNova-6.7-Flash-Lite	platform.sensenova.cn

注册后获取API Key，填入Skill配置文件：

cp skills/image-analysis/scripts/config.example.json skills/image-analysis/scripts/config.json
# 编辑config.json，将各个平台的API Key填入对应字段

第二步：配置全局CLAUDE.md

在你的全局CLAUDE.md（~/.claude/CLAUDE.md）中加入以下规则，禁止直接使用read工具读取图片：

## 图片处理规范
禁止使用 `read` 工具读取任何图片文件（如.png, .jpg, .jpeg）
必须使用 image-analysis 这个 skill 来分析图片
当模型返回不支持直接接收图片输入时，自动调用 image-analysis 这个 skill 来分析图片

第三步：导入Skill到AI CLI

推荐通过CC Switch统一管理Skill，避免手动复制文件夹：

将skills/image-analysis配置文件夹放在CC Switch目录下
打开CC Switch → Skills管理
在Claude Code和OpenCode对应的Skill开关处，开启image-analysis

这样CC Switch会自动将Skill同步到各CLI的Skill目录。

第四步：配置CC Switch路由与整流器

这一步最关键，需要打开三层开关：

① 打开本地路由

进入CC Switch → 路由设置：

打开本地路由总开关
打开Claude Code的路由开关（常见漏掉：总开关开了但Claude Code开关没开）

② 配置图片整流器

在路由设置界面往下滑，找到整流器区域：

打开整流器总开关
打开图片整流器开关
在Skill名称输入框中填入image-analysis

完成

以上配置完成后，正常的Claude Code实例通常会立即生效。如果老的实例没有生效，重启一个新的Claude Code实例即可。此时模型的网络请求会经过CC Switch袋里，CC Switch会对会话数据进行拦截修改：

之后的整体流程为：

Ctrl+V粘贴图片 → CC Switch袋里拦截 → 移除base64，替换为文本提示
→ 模型收到文本，调用image-analysis Skill → Skill读取图片并返回分析结果

来源：https://juejin.cn/post/7642304739913400370

DeepSeek

上一篇别再只把大模型当API，当系统用的公司已领先 下一篇自动修复bug任务运行100分钟耗尽免费和付费次数

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

AI教程 · 2026-06-27

Claude MCP模型爆火 AI Agent圈万能插头让Cursor工作流效率提升10倍

坦白说，MCP这波热度来得有点突然。去年11月Anthropic推出的时候，没引起太大波澜；但最近几天，X上几乎所有人都在讨论MCP服务器，大有把它捧成AI应用碘伏者的架势。 MCP（模型上下文协议）是去年11月由Claude的母公司Anthropic推出的一项开放标准协议，目标是为大语言模型与外部

AI教程 · 2026-06-27

凯文凯利万字预言未来十年AI世界发展趋势

凯文·凯利授课现场 1、关于AI的未来图景感谢邀请，有机会跟嘉宾商学的企业家校友们面对面聊聊。大家这次访学行程很硬核——从拉斯维加斯CES到硅谷，接触了不少最新的AI技术和理论。所以今天的分享，想提供一个不太一样的视角：关于AI正在发生什么，以及接下来会发生什么。会用一种叫“情景规划”的方式来展开

AI教程 · 2026-06-27

从Manus到GO-1：AI逐步走进物理世界

2025年3月，中国AI领域投下的重磅冲击波，可不止一枚。Manus通用AI Agent以“全球首款执行级智能体”之姿闪亮登场，紧接着，GO-1通用具身基座大模型宣布开源，扬言要“重新定义人机交互边界”。这两件事，让不少人开始认真琢磨：当AI不再满足于云端聊天，开始伸手触碰物理世界，真正的智能革命，

AI教程 · 2026-06-27

Manus AI是通用Agent革命还是精巧缝合怪

先说一个基本判断：昨天，Manus至少在中文媒体圈里刷屏了。自媒体的反应相当狂热，“通用Agent终于实现了！”“这是继DeepSeek之后的又一技术革命！”这样的说法遍地都是。从Benchmark来看，Manus的表现确实亮眼——在GAIA测试中，它超越了此前的各种Agent以及OpenAI的D

AI教程 · 2026-06-27

Ubuntu从零部署OpenClaw完整教程（本地模型与DeepSeek）

0 前言 OpenClaw（圈内常称“龙虾”）是一套开源、支持自托管的 AI 助手平台，原生兼容 Ollama 本地模型与 DeepSeek 等云端 API，让您在隐私保护与性能体验之间灵活切换——需要安全就用本地，追求强大则上云端。本文记录了我在 Ubuntu 系统上从零搭建 OpenClaw