首页 游戏 软件 资讯 排行榜 专题
首页
AI
Claude代码输出token减少75%的优化原因解析

Claude代码输出token减少75%的优化原因解析

热心网友
43
转载
2026-05-19

Claude的回复里,那些看似礼貌的“当然,我很乐意帮你处理这个问题”、“你现在遇到的问题,大概率是由……”之类的开场白,其实都在悄悄消耗你的token预算。

我们实际上是在为这些“客气话”付费。

这让我想起艾伦·艾弗森那段著名的采访,被全网反复调侃。重点不是比赛,也不是胜负,而是他一直在重复一个词——训练。

而现在,我们花钱购买的,某种程度上就是另一种“训练词汇”。

一个简单的测试

我用同一个Unity UI元素的bug,让Claude Code连续解释了两次。

默认状态下的Claude Code,用了1252个token。而开启一个特定方法后,只用了410个token。

修复的是同一个bug,给出的解决方向也完全相同。

差别不在于能力,而在于其中一个版本额外花了800多个token,用于铺垫、寒暄、解释语气,以及那些不影响最终结果的“人性化包装”。

说白了,答案没变,变的只是废话变少了。

图片

方法简单得离谱

GitHub上有一个免费的插件,已经获得了超过1.3万颗星。它做的事情听起来像个玩笑,但效果却非常实在:让Claude的说话方式变得像“xue居人”一样简洁。

安装之后,它会立刻将Claude的输出风格压缩到极简模式:减少寒暄,省略铺垫,砍掉不必要的完整句子,直接切入核心结果。

安装方式也异常简单:

claude plugin marketplace add JuliusBrussee/ca veman
claude plugin install ca veman

安装完成后,只需执行:

/ca veman

即可开启。没有复杂的配置,也没有额外的折腾步骤。

图片

开启后的效果对比

在未开启“xue居人”模式时,Claude通常会这样回答:

“Sure! I’d be happy to help you with that. The issue you’re experiencing is most likely caused by your authentication middleware not properly validating the token expiry. Let me take a look and suggest a fix.”

很礼貌,很完整,但也很“昂贵”。

而开启ca veman模式之后,它的回答会更像这样:

“Bug in auth middleware. Token expiry check use < not <=. Fix:”

瞬间变得干净利落。没有“我很乐意帮你”,没有“让我来看看”,也没有“你遇到的问题很可能是”。直接指出问题所在、错误原因以及修改方法。

关键在于,这不仅仅是为了省钱。通常,这样的回答也更好阅读。因为很多时候,用户需要的并非陪伴式对话,而是可执行的高密度信息。当目的是修复bug、修改代码或推进任务时,越快触及核心内容,体验往往就越好。

最令人意外的并非省钱

起初,我以为这种压缩必然伴随着代价。直觉上会认为:输出更短,token更少,那么质量是否也会随之下降?

听起来很合理,但结果却不一定如此。也就是说,冗长并不一定代表更聪明。很多时候,它只是更昂贵而已。

图片

因为我们过去太容易默认一个观念:“说得越多,说明理解越深。”但对于模型输出来说,许多额外的长度并非洞察,而只是冗余的包装。

可自定义的“xue居人”程度

这个插件并非只有一种压缩模式,它提供了三个层级,允许用户自行决定希望Claude简洁到什么程度。

1. Lite 模式

/ca veman lite

此模式会进行适度精简,保留基本语法结构,整体输出仍保持专业、正常且可读。如果你不喜欢过于生硬的风格,但又想削减不必要的前置话术,这个模式会是一个平衡的选择。

2. Full 模式

/ca veman full

这是默认模式。它会进一步压缩冠词和一些连接性内容,输出更接近短句或碎片化信息,读起来更利落,也更像“直接把结果扔给你”。

3. Ultra 模式

/ca veman ultra

这个模式非常极端。能压缩就压缩,能省略就省略,力求用一个词说完就绝不用两个。风格近乎于:“一词。足矣。”如果你本身就不在意语言的完整性,只追求token效率和信息密度,那么这个模式会让你感到非常痛快。

甚至还有一种更极致的模式:文言文压缩。看到这里,我几乎要后悔学生时代没有认真学好古文了。

一些值得关注的数据

根据插件作者Julius Brussee提供的基准测试,这种节省主要发生在Claude进行“解释说明”的阶段。也就是说,越是需要输出分析、推理过程或建议文本的场景,压缩带来的收益就越明显。真正消耗大量token的大头,往往不是“代码块”本身,而是环绕在代码周围的那些自然语言解释部分。

图片

仔细想想,这很合理。代码本身通常已经比较紧凑。真正容易膨胀的,恰恰是解释代码的那些句子。而Claude最爱“注水”的,也正是这一部分。

另一个配套的实用工具

除了ca veman,还有一个兄弟工具值得一试:ca veman-compress。这个工具的主要作用不是压缩Claude的回答,而是压缩你的CLAUDE.md文件。

很多人会忽略这一点:CLAUDE.md的token消耗是非常可观的。因为它几乎在每个会话中都会被加载一次。这意味着,这个文件里每多一个token,你在后续的每次会话中都可能为此反复付费。这不是一次性成本,而是一种持续的“消耗税”。

ca veman-compress的作用,就是将这类说明文件改写成更紧凑、但仍保持可读的格式。同时,它还会保留一份对人类友好的备份,避免压缩后连自己都看不懂。根据一些用户的反馈,使用后大约能节省45%左右的token。

这一点其实非常关键。因为很多人只盯着输出token,却忘了输入token同样昂贵,而且往往更稳定、更持续。输出token是当次会话的消耗,而输入token则是你每轮对话都在支付的“基础租金”。

我个人的使用习惯

现在,我基本上每次开启新的会话时,都会先输入/ca veman。这已经成了一个习惯。而且我越来越喜欢这种简短、直接、不拖泥带水的输出风格。

以前,我也会尝试让Claude自己来压缩我的CLAUDE.md,但现在我改用专门的插件来处理。一个明显的体感变化是:我遇到使用限额(limit)的频率下降了不少。

说实话,我甚至觉得这种简洁模式应该默认开启。但问题也很现实:输出越长,使用量越高;使用量越高,平台的收入可能就越多。所以,这种“替用户省钱”的行为,不一定天然符合服务提供商的商业激励。这也正是为什么,许多真正实用的小工具,最终往往是由社区率先开发出来的。

来源:https://www.51cto.com/article/840811.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

OpenMythos开源:基于PyTorch复现Claude深度推理架构
AI
OpenMythos开源:基于PyTorch复现Claude深度推理架构

关于Anthropic那个神秘的Claude Mythos,业内一直有各种传闻。它在复杂推理和系统性泛化上的表现据说相当惊人,但始终闭源,让人只能猜测其内部机制。现在,情况有了新变化。 一个名为OpenMythos的项目刚刚出现,它从第一性原理出发,用PyTorch完整实现了一套对Claude My

热心网友
05.18
2026年Claude必备插件推荐 真正提升效率的几款工具
AI
2026年Claude必备插件推荐 真正提升效率的几款工具

2026年2月24日,Anthropic为企业用户推出了私有插件市场。而就在此前两周,社区已经发布了超过1000个MCP服务器,将Claude的能力从单纯的文本生成,拓展到了一个更广阔的天地。 这意味着什么?Claude不再只是一个对话界面。它现在可以:自主编写并执行代码、实时浏览网页、访问你的Gm

热心网友
05.18
Claude性能维护与防降智优化完全指南
AI
Claude性能维护与防降智优化完全指南

Anthropic近期发布了Claude Code的官方实践指南,这份指南为开发者提供了对抗“AI性能衰退”的实用方法。通过有效运用回溯、压缩和子智能体等核心功能,你可以显著提升Claude在长上下文任务中的稳定性和智能表现。 对于开发者而言,如何高效管理百万Token级别的上下文窗口,是决定AI助

热心网友
05.18
Claude处理超长PDF文档的准确率实际测试结果
AI
Claude处理超长PDF文档的准确率实际测试结果

处理超长PDF文档时,如果发现Claude分析结果遗漏关键信息或上下文逻辑断裂,问题根源通常在于文档本身。这可能是文档长度超出了模型的有效处理范围,也可能是复杂的排版格式干扰了信息的精准提取。无需担忧,本文将分享四个经过实战检验的优化方法,能系统性提升Claude分析PDF的准确性与可靠性。 一、将

热心网友
05.18
Claude 200K上下文信息召回率实测与分析
AI
Claude 200K上下文信息召回率实测与分析

如果你把一份接近20万字的文档直接扔给Claude,然后指望它能精准地找出某个藏在中间的关键信息,结果可能会让你有点意外。实际情况是,它的“记忆力”并不均匀。 一系列独立测试揭示了其中的规律:模型对文档开头和结尾的内容记得更牢,而对中间部分的信息,召回率会出现显著下降。这并非偶然,而是长上下文处理中

热心网友
05.18

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

学生上班族剃须刀选购指南十大品牌性价比排名推荐
业界动态
学生上班族剃须刀选购指南十大品牌性价比排名推荐

市面上剃须刀品牌众多,选购时易遇剃不净、伤肤或续航短等问题。综合用户反馈与测评数据,未野在剃净度与舒适感上表现突出,兼容多种肤质与胡型。其他如VTT、京东京造等品牌也各有特点。选购需结合预算与需求,关注动力、刀头材质、贴合度等核心指标,根据自身胡须粗细、脸型和使用场景做出。

热心网友
05.19
大眼橙C3 Pro投影仪发布:1080P高清570CVIA流明 补贴价999元
业界动态
大眼橙C3 Pro投影仪发布:1080P高清570CVIA流明 补贴价999元

大眼橙C3Pro投影仪发布,具备1080P分辨率和570CVIA流明亮度。采用全封闭光机与高透面板,实现高对比度。集成双模传感系统,支持快速自动对焦与梯形校正。设计包含云台支架与触控夜灯,搭载旗舰芯片并支持Wi-Fi6。凭借以旧换新补贴,到手价可低至999元,性价比突出。

热心网友
05.19
机械师GTR迷你主机R7 8745H版16GB内存1TB硬盘售价3999元
业界动态
机械师GTR迷你主机R7 8745H版16GB内存1TB硬盘售价3999元

机械师GTR迷你主机推出搭载R78745H处理器的新配置,配备16GB内存和1TB固态硬盘,售价3999元。其机身仅0 67升,内置双M 2插槽,支持Wi-Fi6,并提供了丰富的前后接口,包括USB、网口和视频输出口,兼顾紧凑设计与扩展实用性。

热心网友
05.19
大学毕业典礼AI演讲引争议 学生嘘声表达不满
业界动态
大学毕业典礼AI演讲引争议 学生嘘声表达不满

美国多所大学毕业典礼上,演讲嘉宾对人工智能表达乐观时屡遭台下嘘声。前谷歌CEO施密特将AI比作“火箭船座位”,却因嘘声中断发言并承认听众的恐惧。其他高校类似场景中,AI被称为“下一场工业革命”或行业变革力量时,同样引发不满。毕业生对AI冲击就业市场的焦虑,直接转化为现场集体情绪宣泄。

热心网友
05.19
2026年宠物空气净化器选购指南:莱克C9、霍尼韦尔H-Cat与舒乐氏Umi深度对比
业界动态
2026年宠物空气净化器选购指南:莱克C9、霍尼韦尔H-Cat与舒乐氏Umi深度对比

选择宠物空气净化器需关注风道结构、底部吸口和除味系统。二代增压风道比传统格栅吸力更集中,可高效吸附浮毛;底部360°环吸口能清理地面毛发;复合净化系统可持久除味。不同产品各有侧重,如莱克C9适合多猫家庭,霍尼韦尔H-CatHub侧重智能体验,舒乐氏Umi也具备相应功能。

热心网友
05.19