给Claude Code装上caveman插件省75%token

时间：2026-06-08 15:43

问题用Claude Code写代码，最让人头疼的是什么？话太多。你问它一个React组件为什么反复渲染，它洋洋洒洒回一大篇：1180个token。真正有用的信息就一句话：内联对象每次渲染都是新引用，用useMemo。有人算过一笔账：每天跟Claude Code聊200轮，每轮平均浪费30-40个to

问题

用Claude Code写代码，最让人头疼的是什么？

省75%token的骚操作：给Claude Code装个ca veman插件，写代码再也不废话了

话太多。

你问它一个React组件为什么反复渲染，它洋洋洒洒回一大篇：

1180个token。真正有用的信息就一句话：内联对象每次渲染都是新引用，用useMemo。

有人算过一笔账：每天跟Claude Code聊200轮，每轮平均浪费30-40个token在"I'd be happy to help"和"Let me take a look"这类客套话上。一天下来，光这些废话就烧掉6000-8000个token。一个月20万token，折合软妹币约50美元。

ca veman是什么

GitHub上有位叫JuliusBrussee的开发者，搞了个插件叫ca veman（github.com/JuliusBruss…），思路直截了当：让Claude学原始人说话——砍掉所有废话，只留核心干货。

装上之后，同一个问题，效果是这样的：

159个token。省了87%。

实际测试数据

用他仓库里的benchmark脚本，跑了10个常见编程问题，结果如下：

解释React重渲染bug：1180 → 159，省87%
修auth middleware token过期：704 → 121，省83%
搭PostgreSQL连接池：2347 → 380，省84%
解释git rebase vs merge：702 → 292，省58%
重构callback到async/await：387 → 301，省22%
微服务vs单体架构：446 → 310，省30%
PR安全审查：678 → 398，省41%
Docker多阶段构建：1042 → 290，省72%
调试PostgreSQL竞态：1200 → 232，省81%
实现React Error Boundary：3454 → 456，省87%

平均节省65%。范围从22%到87%不等。越是需要长篇大论的场景，省得越多。纯代码修改的场景省得少——因为代码本身没法“ca veman化”，它只压缩自然语言部分。

装法

一行命令搞定：

npx skills add JuliusBrussee/ca veman

如果你用的是Cursor、Copilot、Cline这类工具，指定一下agent就行：

npx skills add JuliusBrussee/ca veman -a cursor
npx skills add JuliusBrussee/ca veman -a copilot

已经有superpowers的话，可以直接从marketplace安装：

claude plugin install ca veman@superpowers-marketplace

装好之后，用/ca veman开启，用stop ca veman关闭。

三个档位

不是只有开和关。它有三档强度可选：

lite：去掉废话但保留语法，读起来还像正常人说话。日常推荐。
full：默认档，砍掉冠词、省略主语，读起来像电报。
ultra：极限压缩，能缩写的全缩写，适合只想看结论的场景。

lite档效果是这样：

full档是这样：

ultra档是这样：

同一个答案，丰俭由人。

它不压缩什么

代码块原样保留。技术术语不变——polymorphism还是polymorphism。错误信息原文引用。git commit和PR message正常写。

只压缩自然语言——那些“我很乐意帮你看看这个问题”和“之所以出现这种情况，是因为……”之类的填充废话，通通砍掉。

一个冷知识

今年3月有篇论文（arxiv.org/abs/2604.00025）发现：限制大模型用简短回复，在某些benchmark上准确率反而提高了26个百分点。不是“差不多”，而是“更好”。

原因可能是：强制简短回复让模型无法用废话来“对冲”不确定性，必须给出明确答案。啰嗦，有时候反而是一种逃避。

配合ca veman compress省输入token

ca veman压缩的是输出。但CLAUDE.md每次会话都要加载，这也是token消耗的大头。

/ca veman-compress CLAUDE.md可以把你的项目配置文件也“ca veman化”——压缩自然语言部分，保留代码和技术内容。

实测数据：

项目偏好文件：706 → 285 token，省60%
项目笔记：1145 → 535，省53%
TODO清单：627 → 388，省38%

平均省45%的输入token。输出省65% + 输入省45%，两边一加，一个月下来能省不少。

实际用法建议

日常开发用lite——看着舒服，省得够多
调试bug的时候用full——只要结论，不要解释
写代码review的时候关掉——review需要完整的上下文
CLAUDE.md用compress压过一遍，每轮会话大概能省500 token

用了两周下来，除了偶尔需要Claude详细解释时得记得先stop ca veman，没啥毛病。

折腾完算了一下，按token计费的话，每月大概能省40-50美元的API费用。Max订阅用户虽然没有直接省钱，但响应速度快了——生成的token少了，回复自然就快了。

来源：https://juejin.cn/post/7625572349438214194

Claude

上一篇超级能力工具结合克劳德代码的初步实战 下一篇AI替代RPA一键生成监控100个小红书博主工作流

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

更多

AI教程 · 2026-07-01

微软Copilot插件安装全流程：浏览器与扩展市场配置

围绕MicrosoftCopilot在浏览器、编辑器和扩展市场中的安装与配置，梳理账号准备、安装步骤、权限检查、常见故障及安全使用边界，适合新手快速完成AI办公工具部署。

AI教程 · 2026-07-01

Microsoft Copilot Docker 一键部署指南：镜像拉取、端口映射与数据目录配置

围绕Copilot类AI办公工具的Docker部署流程，说明镜像选择、拉取校验、端口映射、数据目录挂载、环境变量配置、更新回滚与常见故障处理。

AI教程 · 2026-07-01

微软Copilot API密钥注册获取与国内网络配置

围绕MicrosoftCopilot相关接口接入流程，梳理账号准备、Azure资源创建、密钥获取、环境变量配置、国内网络连通性优化、常见报错处理与安全管理要点。

AI教程 · 2026-07-01

微软Copilot Linux部署：环境准备到后台运行全流程

MicrosoftCopilot不适合按本地模型方式安装，Linux服务器更常见的是部署企业入口或集成服务。流程需完成账号授权、运行环境、服务配置、反向代理、进程守护与日志监控，并注意数据权限、访问控制和合规边界。

AI教程 · 2026-07-01

Microsoft Copilot macOS安装教程：Apple Silicon与Intel配置步骤

MicrosoftCopilot在Mac上可通过网页应用、Edge侧边栏或Microsoft365组件使用，AppleSilicon与Intel机型重点在系统版本、浏览器、账号授权和隐私设置。