游乐游手机版
首页/AI教程/文章详情

AGENTS.md规则让Codex Token占用减少50%

时间:2026-06-17 15:06
在AI编程工具中,上下文被无关日志、大文件输出占据导致token暴涨。通过在AGENTS md中增加按字节限制输出的规则(如head-c4000),可直接减少50%token占用,避免测试日志和超长文件污染上下文窗口,显著提升模型理解与生成质量。

最近在深入使用 Codex、Claude Code 等 AI 编程工具时,发现一个极为突出的痛点——并非模型本身不够智能,而是很多时候,AI 并非“不会写代码”,而是它的上下文被大量无意义的垃圾信息挤占了:Token 被日志耗尽、大文件输出污染了 Prompt、测试日志吞没了上下文窗口。最终导致回复质量下滑、对仓库的理解能力变弱、Token 消耗激增,很快就触及了配额上限。

直到在 Reddit 上看到一篇帖子才恍然大悟:问题的根源或许比想象中更简单——仅需一条 AGENTS.md 规则,就能让 Token 占用减少近一半。

本文将详细拆解这个技巧的实战方法与原理。

问题缘起:Codex 为何疯狂读取无关内容?

原帖作者发现,Codex 在“理解项目”时,会频繁执行 shell 命令来读取文件,比如 cat xxx.loghead -n 20。表面看似乎没问题,但真正的隐患在于:行数限制(line limit)其实并不可靠。

许多人以为 head -n 20 已经控制了输出量,但实际并非如此。因为某些文件格式——例如 SQLite 文件、压缩内容、超长 JSON、单行 minify JS、base64 文件——它们没有换行符。此时 head -n 20 依然可能直接输出数 MB 的内容。

后果如何?Token 瞬间爆炸。作者分享了一个真实案例:Codex 误读取了一个 5MB 的 SQLite 文件,且该文件没有换行。Token 消耗直接从 20k 飙升至 90k,瞬间超限。

真正有效的解决方案

作者直接在 AGENTS.md 里添加了一条规则:限制未知输出的字节大小。核心思路是:不再按“行数”限制,而是改为按“字节数”限制。例如:

cat huge.log | head -c 4000
rg keyword src | head -c 4000

这样一来,无论文件是否包含换行,最大输出仅为 4000 bytes,上下文安全性大幅提升。

为什么这个技巧极为重要?

因为 AI Coding Agent 的真正瓶颈并不在于模型能力,而在于 Context Window(上下文窗口)。尤其是 GPT-5、Claude Opus、Codex、Claude Code 这类模型,它们严重依赖上下文的“质量”,而非“数量”。大量无关文本会引发以下连锁反应:

问题后果
无关日志过多注意力被稀释
大文件污染上下文仓库理解能力下降
Token 消耗过高提前触发使用限制
历史上下文被挤出AI 遗忘前文信息
Shell 输出过长影响代码生成质量

这实际上与人类程序员的调试习惯相似:你不会一次性查看 5MB 日志,而是通过 grep、tail、筛选等方式聚焦问题。AI 同样需要这种“聚焦”能力。

第二个巨大优化:减少测试输出

帖子中另一个关键点是:不要每次改动都跑完整测试。许多 AI Agent 修改一行代码后,就立刻执行 npm test、vitest、playwright、xcode build、全量 typecheck,然后输出数万行日志。尤其 vitest 或 playwright 的日志量极其庞大。

作者后来修改了系统 Prompt:仅在必要时运行验证,并且对测试输出也做字节上限(byte cap)。例如:

npm test 2>&1 | head -c 4000

效果立竿见影。

为什么 AI 特别喜欢疯狂跑测试?

因为许多官方 system prompt 里都写了“修改后请运行测试确保正确”,于是 Agent 会机械执行:改一点 → 跑测试 → 产生大量日志 → Token 暴涨。尤其 Claude Code 表现得非常明显。帖子评论区中不少人提到,Claude Opus 特别容易疯狂吞占上下文,甚至搜索大量文件、引入无关代码、读取过长日志,最终导致模型反而“变笨”。

更高级的玩法:日志摘要

帖子评论区还有一个很有价值的思路:将编译日志交给更便宜的小模型先做摘要。例如只返回 success、真正错误、关键 warning。这样主 Agent 不会看到完整日志,只获得精简结果。这个思路非常先进,因为 AI Agent 的最大开销是 Context,而不是一次 API 调用。

还有哪些工具在做 Context 压缩?

评论区还提到了几个项目:

1. rtk

GitHub:https://github.com/rtk-ai/rtk。作用:自动重写命令输出,例如 git、grep、shell 输出,压缩 Token。有人实测可额外减少 20% Token,但也有反馈称可能影响调试质量,因为某些关键内容可能被过滤掉。

2. sqz

GitHub:https://github.com/ojuschugh1/sqz。作者给出的数据:tokens saved: 283509,平均减少 38.5%,压缩效果同样显著。

3. Serena MCP

这个更接近 Codex IDE 增强层,支持更智能的代码搜索、Context 管理、仓库理解,但会增加复杂度。

4. Tree-sitter Knowledge Graph

论文参考 codebase-memory-mcp。思路是:不再使用 grep,而是基于 AST + Knowledge Graph,理论上能极大减少无关上下文,但对于普通项目可能偏重。

最终结论

这个技巧的核心本质其实只有一句话:不要让 AI 看太多无关内容。尤其是 Coding Agent,真正影响质量的往往不是模型,而是 Context Engineering(上下文工程)。如今许多人已经开始优化 Prompt、优化 Agent、优化 Tool、优化 Context。未来,谁更擅长“管理上下文”,谁就能更高效地让 AI 成为真正的生产力工具。

原帖地址:Reddit,链接:https://www.reddit.com/r/codex/comments/1t6iulo/i_cut_codex_token_usage_50_with_one_agentsmd_rule/

如果你也遇到过类似问题——比如 Claude Code、Codex、Cursor、Windsurf、Roo Code 疯狂消耗 Token ——欢迎分享你现在的 AGENTS.md、system prompt、token 优化技巧、context 管理方案。很多时候,一条小规则,真的可能帮你省掉一半的 Token。

来源:https://cloud.tencent.com.cn/developer/article/2690123
上一篇智谱GLM视觉模型横向评测:从轻量OCR到多模态Agent选型 下一篇Operit安卓强大AI助手安装使用教程 手机自动写代码
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
Windows Docker Desktop RabbitMQ生产级部署完整指南
AI教程 · 2026-06-29

Windows Docker Desktop RabbitMQ生产级部署完整指南

前言 在 Windows 本地开发环境中,直接安装 RabbitMQ 确实颇为周折:需要单独配置 Erlang 运行环境、手动管理环境变量、服务启停全凭手工操作。更令人困扰的是,版本兼容冲突、端口占用、环境不一致等问题层出不穷。笔者见过不少开发者为搭建环境就得耗费整整半天时间。 相比之下,借助 Do

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践
AI教程 · 2026-06-29

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践

先分享一个切实感受。过去两年,我们与福建制造企业合作较为频繁,发现一个非常突出的现象:超过80%的企业官网,产品参数仍然存放在PDF或图片中。AI爬虫?根本无法抓取。这些企业技术实力不弱、资质证照齐全、应用案例也丰富,但在AI搜索这一全新战场上,它们几乎处于隐身状态。 一、一个正在发生的行业变化 A

阿里云Token Plan团队版功能价格与省钱购买指南
AI教程 · 2026-06-29

阿里云Token Plan团队版功能价格与省钱购买指南

阿里云百炼近期推出了名为“Token Plan 团队版”的全新服务,这一服务专为企业与开发者量身打造,定位为AI大模型订阅平台。通过引入Credits作为统一计量单位,将文本生成、图像生成等多模态AI能力纳入单一计费体系,同时无缝兼容主流AI编程工具及智能体(Agent)生态系统。其核心亮点包括:全

阿里云物联网.NET Core客户端位置信息上报
AI教程 · 2026-06-29

阿里云物联网.NET Core客户端位置信息上报

阿里云物联网平台的位置服务并非一个完全独立的功能模块。位置信息可包含二维坐标与三维坐标,而位置数据的来源本质上是借助设备属性进行上传。换言之,若要让设备上报位置,您需先将其视为一个普通属性进行处理。 1)添加二维位置数据 操作过程十分简洁。进入数据分析 → 空间数据可视化 → 二维数据,点击添加,将

年阿里云服务器选型配置与网站部署全攻略
AI教程 · 2026-06-29

年阿里云服务器选型配置与网站部署全攻略

2026年,阿里云服务器生态已高度成熟,形成了清晰的轻量应用服务器与ECS云服务器两大产品阵营。无论你是计划搭建个人博客、企业官网,还是运营电商平台、进行应用开发,基本都能找到理想的解决方案。本指南将从服务器选型、配置选择、部署流程到安全运维,系统梳理2026年最实用的操作要点,帮助你少走弯路,让网