游乐游手机版
首页/AI教程/文章详情

给Claude Code装上caveman插件省75%token

时间:2026-06-08 15:43
问题用Claude Code写代码,最让人头疼的是什么?话太多。你问它一个React组件为什么反复渲染,它洋洋洒洒回一大篇:1180个token。真正有用的信息就一句话:内联对象每次渲染都是新引用,用useMemo。有人算过一笔账:每天跟Claude Code聊200轮,每轮平均浪费30-40个to

问题

用Claude Code写代码,最让人头疼的是什么?

省75%token的骚操作:给Claude Code装个ca veman插件,写代码再也不废话了

话太多。

你问它一个React组件为什么反复渲染,它洋洋洒洒回一大篇:

1180个token。真正有用的信息就一句话:内联对象每次渲染都是新引用,用useMemo。

有人算过一笔账:每天跟Claude Code聊200轮,每轮平均浪费30-40个token在"I'd be happy to help"和"Let me take a look"这类客套话上。一天下来,光这些废话就烧掉6000-8000个token。一个月20万token,折合软妹币约50美元。

ca veman是什么

GitHub上有位叫JuliusBrussee的开发者,搞了个插件叫ca veman(github.com/JuliusBruss…),思路直截了当:让Claude学原始人说话——砍掉所有废话,只留核心干货。

装上之后,同一个问题,效果是这样的:

159个token。省了87%。

实际测试数据

用他仓库里的benchmark脚本,跑了10个常见编程问题,结果如下:

  • 解释React重渲染bug:1180 → 159,省87%
  • 修auth middleware token过期:704 → 121,省83%
  • 搭PostgreSQL连接池:2347 → 380,省84%
  • 解释git rebase vs merge:702 → 292,省58%
  • 重构callback到async/await:387 → 301,省22%
  • 微服务vs单体架构:446 → 310,省30%
  • PR安全审查:678 → 398,省41%
  • Docker多阶段构建:1042 → 290,省72%
  • 调试PostgreSQL竞态:1200 → 232,省81%
  • 实现React Error Boundary:3454 → 456,省87%

平均节省65%。范围从22%到87%不等。越是需要长篇大论的场景,省得越多。纯代码修改的场景省得少——因为代码本身没法“ca veman化”,它只压缩自然语言部分。

装法

一行命令搞定:

npx skills add JuliusBrussee/ca veman

如果你用的是Cursor、Copilot、Cline这类工具,指定一下agent就行:

npx skills add JuliusBrussee/ca veman -a cursor
npx skills add JuliusBrussee/ca veman -a copilot

已经有superpowers的话,可以直接从marketplace安装:

claude plugin install ca veman@superpowers-marketplace

装好之后,用/ca veman开启,用stop ca veman关闭。

三个档位

不是只有开和关。它有三档强度可选:

  • lite:去掉废话但保留语法,读起来还像正常人说话。日常推荐。
  • full:默认档,砍掉冠词、省略主语,读起来像电报。
  • ultra:极限压缩,能缩写的全缩写,适合只想看结论的场景。

lite档效果是这样:

full档是这样:

ultra档是这样:

同一个答案,丰俭由人。

它不压缩什么

代码块原样保留。技术术语不变——polymorphism还是polymorphism。错误信息原文引用。git commit和PR message正常写。

只压缩自然语言——那些“我很乐意帮你看看这个问题”和“之所以出现这种情况,是因为……”之类的填充废话,通通砍掉。

一个冷知识

今年3月有篇论文(arxiv.org/abs/2604.00025)发现:限制大模型用简短回复,在某些benchmark上准确率反而提高了26个百分点。不是“差不多”,而是“更好”。

原因可能是:强制简短回复让模型无法用废话来“对冲”不确定性,必须给出明确答案。啰嗦,有时候反而是一种逃避。

配合ca veman compress省输入token

ca veman压缩的是输出。但CLAUDE.md每次会话都要加载,这也是token消耗的大头。

/ca veman-compress CLAUDE.md可以把你的项目配置文件也“ca veman化”——压缩自然语言部分,保留代码和技术内容。

实测数据:

  • 项目偏好文件:706 → 285 token,省60%
  • 项目笔记:1145 → 535,省53%
  • TODO清单:627 → 388,省38%

平均省45%的输入token。输出省65% + 输入省45%,两边一加,一个月下来能省不少。

实际用法建议

  1. 日常开发用lite——看着舒服,省得够多
  2. 调试bug的时候用full——只要结论,不要解释
  3. 写代码review的时候关掉——review需要完整的上下文
  4. CLAUDE.md用compress压过一遍,每轮会话大概能省500 token

用了两周下来,除了偶尔需要Claude详细解释时得记得先stop ca veman,没啥毛病。

折腾完算了一下,按token计费的话,每月大概能省40-50美元的API费用。Max订阅用户虽然没有直接省钱,但响应速度快了——生成的token少了,回复自然就快了。

来源:https://juejin.cn/post/7625572349438214194
上一篇超级能力工具结合克劳德代码的初步实战 下一篇AI替代RPA一键生成监控100个小红书博主工作流
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
Kimi App手机电脑联动下载安装及浏览器兼容教程
AI教程 · 2026-06-09

Kimi App手机电脑联动下载安装及浏览器兼容教程

本文介绍了Kimi智能助手从手机端到电脑端的下载与安装方法,重点阐述了不同平台(包括iOS、Android、Windows、macOS)的获取途径。同时,详细说明了如何通过浏览器直接访问网页版,并针对主流浏览器的兼容性进行了分析,旨在帮助用户根据自身设备选择最便捷、稳定的使用方式。

HeyGen稳定安装步骤:先配置创意团队环境再注册开通
AI教程 · 2026-06-09

HeyGen稳定安装步骤:先配置创意团队环境再注册开通

HeyGen的稳定安装与高效使用,关键在于前期团队环境的统一规划与后期账号流程的顺畅完成。团队需明确设计规范、素材管理及权限分工,为工具运行打下基础。随后,通过官方渠道完成注册、验证及订阅开通,确保服务稳定。最后进行基础功能测试与团队培训,即可快速投入实际创作流程。

Mochi 1从零搭建本地服务与工作流导入指南
AI教程 · 2026-06-09

Mochi 1从零搭建本地服务与工作流导入指南

本文介绍了在成功完成Mochi1本地服务的基础搭建后,如何继续处理工作流导入这一关键后续步骤。内容涵盖工作流文件准备、导入操作的具体流程、常见问题的排查与解决,以及导入后的配置优化与测试验证,旨在帮助用户将预设的自动化流程顺利集成到本地环境中,确保工具发挥完整效能。

InvokeAI Linux用户安装配置与节点处理指南
AI教程 · 2026-06-09

InvokeAI Linux用户安装配置与节点处理指南

本文详细介绍了在Linux系统上安装和配置InvokeAI的完整流程。内容涵盖从环境准备、依赖安装到模型下载与加载的关键步骤,并重点解析了核心组件“处理节点”的安装与使用方法。指南旨在帮助用户顺利完成部署,并理解其工作流程,以便更好地利用这一AI图像生成工具进行创作。

Dify保姆级部署指南:服务安装与模型接入下载
AI教程 · 2026-06-09

Dify保姆级部署指南:服务安装与模型接入下载

本文详细介绍了开源AI应用开发平台Dify的部署流程。内容涵盖从服务器环境准备、Docker安装、Dify核心服务启动,到如何接入OpenAI、Azure等云端大模型API,以及如何配置Ollama等本地模型。最后,还提供了使用ModelScope社区下载特定模型文件并集成到本地环境中的具体操作方法,旨在帮助用户快速搭建属于自己的AI应用开发与测试平台。