资深程序员谈Coding Agents功能堆砌为何偏离开发本质
AI编程工具进入大乱斗时代,功能堆叠似乎已成常态。但在libGDX创始人、拥有17年开源经验的Mario Zechner看来,这种趋势正让开发者逐渐失去对工具的掌控。他近日在Tessel开发者大会上分享了自己的观察,并介绍了一款旨在“将控制权交还开发者”的极简终端编程智能体——pi。
“当你发现AI在背地里偷偷修改你的上下文,而你却对此一无所知时,这种掌控感的丧失是极其危险的。”Mario在演讲中直言不讳。他批评了当前主流工具的设计哲学,并提出了自己的解决方案:一个只有read、write、edit、bash四种工具,拥有极短system prompt,却强调极致可扩展性的编程助手。
本文基于该演讲视频整理,核心观点如下:
- Claude Code如今功能庞杂如宇宙飞船,用户可能只了解其10%,剩下90%是难以观测的“暗物质”。
- 现有编程框架的许多功能可能并非获得好结果的必需品。
- 行业正处于探索期,完美的编程智能体形态未定,因此工具必须是可自修改、可塑性极强的,以便快速实验新想法。
- 代码检查和类型检查的真正时机,仅在智能体认为自己彻底完成任务之后。
1 从ChatGPT到Claude Code:工具的膨胀与失控
回顾编程智能体的演进史,路径清晰可见。最初是从ChatGPT搬运零碎的代码片段,后来是集成在VS Code里的GitHub Copilot,需要用户不断敲击Tab键来补全。再后来出现了Aider和AutoGPT等工具。
直到Claude Code登场,才真正开创了一个品类。它通过强化学习,让模型学会使用文件工具和bash工具来实时探索代码库、理解上下文并直接修改,效果惊人,极大地提升了代码产出效率。
早期的Claude Code简单、可预测,完美契合了许多开发者的工作流。但问题随之而来:既然它能写这么多代码,为什么不把所有能想到的功能都加上呢?这个听起来不错的主意,最终却催生了一个功能臃肿的“怪物”。如今的Claude Code就像一架宇宙飞船,用户可能只用到其中5%的功能,了解其中10%,剩下90%都是AI和智能体领域的“暗物质”——没人确切知道它在后台做了什么。
2 Claude Code:为何不再是一个稳定的好工具
对开发者而言,了解智能体正在做什么至关重要。但Claude Code在可观测性和上下文管理方面并不理想。其终端界面曾出现令人困扰的闪烁问题,虽然后续被修复,却暴露了更深层的设计取向。

更关键的是,工具在后台对用户上下文进行了大量不透明的操作。有开发者通过拦截请求发现,Claude Code会向上下文注入额外文本,且这些操作的时机和方式频繁变动,直接扰乱了既定的工作流。对于一个追求稳定和可预测性的工具而言,这是致命的。
作为UI设计的代价,其可观测性被降低。同时,它没有模型选择权,扩展性也有限。虽然提供了一套钩子系统,但集成度不深,且基于进程调用的方式开销较大。
最终,Claude Code走向了服务更广泛大众用户的道路,这本身无可厚非,但对于那些渴望深度掌控和透明度的开发者来说,它已不再适用。
3 OpenCode:底层设计缺陷与信任危机
在寻找替代方案的过程中,Mario评估了多个项目。Codex CLI的模型表现令人惊艳;AMP团队通过“做减法”打造了一款优秀的商业化编程框架;而开源的OpenCode则因其社区属性和务实团队吸引了目光。
然而,OpenCode在上下文管理上存在严重问题。例如,它每一轮对话都会调用一个函数,删除最后4万个token之前的所有记录,这直接破坏了提示词缓存的有效性。
其自带的LSP支持在实际工作中也成了阻碍。当智能体逐个修改文件时,代码往往处于无法编译通过的状态,此时LSP反馈的错误信息会干扰模型的判断,导致产出结果糟糕。这印证了一个观点:代码检查和类型检查的真正时机,只在智能体认为自己彻底完成任务之后。
此外,一些底层架构决策也引发了信任危机,例如将每条消息保存为独立JSON文件的做法,以及默认服务端架构中曾存在的远程代码执行安全漏洞。在快速迭代的行业背景下,出错虽难避免,但此类隐患足以让注重安全和设计的开发者望而却步。
4 Pi:让编程智能体适应你的需求
基于对现有工具的观察,Mario提出了不同的思路:剥离一切冗余,构建一个极简且可扩展的核心。这就是pi的诞生背景,其核心理念是让工具适应开发者,而非相反。

pi的系统由四个包构成:一个抹平不同提供商差异的AI抽象层、一个包含工具调用和验证等基础能力的通用智能体循环、一个约600行代码的高效终端用户界面,以及既可作SDK又可作完整交互式智能体的Coding Agent本身。

它的系统提示词极其简短。原因在于,前沿模型已经通过大量训练“知道”如何扮演编程智能体,反复告知它基础规则并无必要。
pi默认采用YOLO模式,即智能体直接执行,无需步步确认。它只提供四个核心工具:read、write、edit和bash。没有MCP,没有子智能体,没有计划模式,也没有内置的待办系统。但关键在于,所有这些都可以用更简单、透明的方式自行实现。

没有MCP?可以用CLI工具加技能扩展来实现。没有子智能体?可以用tmux来生成并观察。没有计划模式?写一个plan.md文件即可,它比蹩脚的UI更实用且可跨会话复用。这种极致的可扩展性是pi的核心价值。开发者可以轻松扩展工具、自定义UI、技能、提示词模板和主题,并通过热重载即时生效。
社区已经基于pi构建了许多有趣的扩展。例如,有人在五分钟内复刻了Claude Code的ships功能;pi-messenger实现了多个智能体间的通信与观察;甚至还有pi-nes,允许在智能体运行时玩游戏。

pi采用树状结构管理会话,而非线性聊天记录,实现了更可控的“子智能体”工作流。整个系统透明,没有后台注入,所有调用成本均可追踪。在TerminalBench基准测试中,pi的表现紧随顶尖的Terminus之后。
最后,Mario也分享了维护此类开源项目的现实挑战,例如应对大量由AI生成的Issue和PR。他采取的“防御机制”包括定期关闭仓库以专注开发,以及通过一个简单的标记文件来验证提交者是否为真人,确保社区的交流质量。
pi代表的是一种哲学:将复杂性和选择权交还给开发者,通过极简的核心和无限的扩展可能性,重新夺回对编程过程的掌控。
相关攻略
AI编程工具进入大乱斗时代,功能堆叠似乎已成常态。但在libGDX创始人、拥有17年开源经验的Mario Zechner看来,这种趋势正让开发者逐渐失去对工具的掌控。他近日在Tessel开发者大会上分享了自己的观察,并介绍了一款旨在“将控制权交还开发者”的极简终端编程智能体——pi。 “当你发现AI
黑客组织TeamPCP频繁发起大规模软件供应链攻击,污染数百开源工具并勒索牟利。近期其入侵GitHub平台,波及数千仓库。攻击已持续数月,涉及超五百个恶意软件包。安全专家建议采取“信任但验证”策略,为代码更新设置观察期,部署前需筛查恶意软件,以提升事前防御能力。
3月3日,美团旗下光年之外团队研发的AI浏览器——Tabbit浏览器,针对其翻译功能被指涉嫌抄袭开源代码一事,发布了正式的《关于翻译插件项目代码的说明》,回应了近期开源社区的广泛关注与讨论。 2026年3月3日,我们注意到开源社区关于Tabbit浏览器翻译功能使用“陪读蛙”(read-frog)项目
热门专题
热门推荐
团队为打造面向年轻群体的智能家居产品,设定了产品打磨、按时交付和预算控制三大目标。通过市场调研、供应链建设及用户测试取得关键进展,并针对沟通、进度与预算挑战,采取了定期同步、任务拆解和开支优化等措施。最终达成目标,积累了项目实战经验,为未来工作提供了参考。
项目X成功交付完整解决方案,攻克技术集成挑战,通过灰度发布控制风险。实现核心功能全覆盖,系统响应时间提升40%,稳定性达99 9%,并沉淀技术文档与流程。经验表明,深入需求沟通与分阶段上线至关重要,未来将持续优化协作与产品价值。
以太坊行情分析工具可提供涨跌预测与风险预警,辅助投资者进行决策。相关软件入口汇集了多种预测功能,旨在帮助用户把握市场动态。需注意投资存在风险,工具仅为参考。
现代职场中,文档处理效率至关重要。传统方式耗时费力,而AI技术能实现一键生成。WPSAI针对文档、PPT和表格提供智能解决方案,帮助用户快速生成初稿,从而聚焦内容深化。其功能便捷且个性化,支持多种文档类型,有效融入工作流程,系统性提升办公效率。
AI智能写作平台正推动内容生产向全链路智能化转型,显著提升效率与互动率。其核心价值覆盖选题、生成、优化、发布及追踪五大环节,通过工具实现各阶段效率飞跃。选型需考量功能完备性、生态整合度与数据安全性,并遵循从体验到迭代的实践路径,以构建高效智能的内容生产体系。





