资深程序员谈Coding Agents功能堆砌为何偏离开发本质

时间：2026-05-24 13:12

AI编程工具进入大乱斗时代，功能堆叠似乎已成常态。但在libGDX创始人、拥有17年开源经验的Mario Zechner看来，这种趋势正让开发者逐渐失去对工具的掌控。他近日在Tessel开发者大会上分享了自己的观察，并介绍了一款旨在“将控制权交还开发者”的极简终端编程智能体——pi。 “当你发现AI

AI编程工具进入大乱斗时代，功能堆叠似乎已成常态。但在libGDX创始人、拥有17年开源经验的Mario Zechner看来，这种趋势正让开发者逐渐失去对工具的掌控。他近日在Tessel开发者大会上分享了自己的观察，并介绍了一款旨在“将控制权交还开发者”的极简终端编程智能体——pi。

“当你发现AI在背地里偷偷修改你的上下文，而你却对此一无所知时，这种掌控感的丧失是极其危险的。”Mario在演讲中直言不讳。他批评了当前主流工具的设计哲学，并提出了自己的解决方案：一个只有read、write、edit、bash四种工具，拥有极短system prompt，却强调极致可扩展性的编程助手。

本文基于该演讲视频整理，核心观点如下：

Claude Code如今功能庞杂如宇宙飞船，用户可能只了解其10%，剩下90%是难以观测的“暗物质”。
现有编程框架的许多功能可能并非获得好结果的必需品。
行业正处于探索期，完美的编程智能体形态未定，因此工具必须是可自修改、可塑性极强的，以便快速实验新想法。
代码检查和类型检查的真正时机，仅在智能体认为自己彻底完成任务之后。

1 从ChatGPT到Claude Code：工具的膨胀与失控

回顾编程智能体的演进史，路径清晰可见。最初是从ChatGPT搬运零碎的代码片段，后来是集成在VS Code里的GitHub Copilot，需要用户不断敲击Tab键来补全。再后来出现了Aider和AutoGPT等工具。

直到Claude Code登场，才真正开创了一个品类。它通过强化学习，让模型学会使用文件工具和bash工具来实时探索代码库、理解上下文并直接修改，效果惊人，极大地提升了代码产出效率。

早期的Claude Code简单、可预测，完美契合了许多开发者的工作流。但问题随之而来：既然它能写这么多代码，为什么不把所有能想到的功能都加上呢？这个听起来不错的主意，最终却催生了一个功能臃肿的“怪物”。如今的Claude Code就像一架宇宙飞船，用户可能只用到其中5%的功能，了解其中10%，剩下90%都是AI和智能体领域的“暗物质”——没人确切知道它在后台做了什么。

2 Claude Code：为何不再是一个稳定的好工具

对开发者而言，了解智能体正在做什么至关重要。但Claude Code在可观测性和上下文管理方面并不理想。其终端界面曾出现令人困扰的闪烁问题，虽然后续被修复，却暴露了更深层的设计取向。

更关键的是，工具在后台对用户上下文进行了大量不透明的操作。有开发者通过拦截请求发现，Claude Code会向上下文注入额外文本，且这些操作的时机和方式频繁变动，直接扰乱了既定的工作流。对于一个追求稳定和可预测性的工具而言，这是致命的。

作为UI设计的代价，其可观测性被降低。同时，它没有模型选择权，扩展性也有限。虽然提供了一套钩子系统，但集成度不深，且基于进程调用的方式开销较大。

最终，Claude Code走向了服务更广泛大众用户的道路，这本身无可厚非，但对于那些渴望深度掌控和透明度的开发者来说，它已不再适用。

3 OpenCode：底层设计缺陷与信任危机

在寻找替代方案的过程中，Mario评估了多个项目。Codex CLI的模型表现令人惊艳；AMP团队通过“做减法”打造了一款优秀的商业化编程框架；而开源的OpenCode则因其社区属性和务实团队吸引了目光。

然而，OpenCode在上下文管理上存在严重问题。例如，它每一轮对话都会调用一个函数，删除最后4万个token之前的所有记录，这直接破坏了提示词缓存的有效性。

其自带的LSP支持在实际工作中也成了阻碍。当智能体逐个修改文件时，代码往往处于无法编译通过的状态，此时LSP反馈的错误信息会干扰模型的判断，导致产出结果糟糕。这印证了一个观点：代码检查和类型检查的真正时机，只在智能体认为自己彻底完成任务之后。

此外，一些底层架构决策也引发了信任危机，例如将每条消息保存为独立JSON文件的做法，以及默认服务端架构中曾存在的远程代码执行安全漏洞。在快速迭代的行业背景下，出错虽难避免，但此类隐患足以让注重安全和设计的开发者望而却步。

4 Pi：让编程智能体适应你的需求

基于对现有工具的观察，Mario提出了不同的思路：剥离一切冗余，构建一个极简且可扩展的核心。这就是pi的诞生背景，其核心理念是让工具适应开发者，而非相反。

pi的系统由四个包构成：一个抹平不同提供商差异的AI抽象层、一个包含工具调用和验证等基础能力的通用智能体循环、一个约600行代码的高效终端用户界面，以及既可作SDK又可作完整交互式智能体的Coding Agent本身。

它的系统提示词极其简短。原因在于，前沿模型已经通过大量训练“知道”如何扮演编程智能体，反复告知它基础规则并无必要。

pi默认采用YOLO模式，即智能体直接执行，无需步步确认。它只提供四个核心工具：read、write、edit和bash。没有MCP，没有子智能体，没有计划模式，也没有内置的待办系统。但关键在于，所有这些都可以用更简单、透明的方式自行实现。

没有MCP？可以用CLI工具加技能扩展来实现。没有子智能体？可以用tmux来生成并观察。没有计划模式？写一个plan.md文件即可，它比蹩脚的UI更实用且可跨会话复用。这种极致的可扩展性是pi的核心价值。开发者可以轻松扩展工具、自定义UI、技能、提示词模板和主题，并通过热重载即时生效。

社区已经基于pi构建了许多有趣的扩展。例如，有人在五分钟内复刻了Claude Code的ships功能；pi-messenger实现了多个智能体间的通信与观察；甚至还有pi-nes，允许在智能体运行时玩游戏。

pi采用树状结构管理会话，而非线性聊天记录，实现了更可控的“子智能体”工作流。整个系统透明，没有后台注入，所有调用成本均可追踪。在TerminalBench基准测试中，pi的表现紧随顶尖的Terminus之后。

最后，Mario也分享了维护此类开源项目的现实挑战，例如应对大量由AI生成的Issue和PR。他采取的“防御机制”包括定期关闭仓库以专注开发，以及通过一个简单的标记文件来验证提交者是否为真人，确保社区的交流质量。

pi代表的是一种哲学：将复杂性和选择权交还给开发者，通过极简的核心和无限的扩展可能性，重新夺回对编程过程的掌控。

来源：https://36kr.com/p/3784634069277961

开源代码

上一篇追觅创始人俞浩三度发文抨击小红书价值观平台客服回应已反馈 下一篇自免口服药市场爆发在即这家Biotech再冲IPO融资213亿美元

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

业界动态 · 2026-06-29

长安汽车明年一季度发布首款车载人形机器人小安

长安汽车公布机器人战略，采用“1+N+X”布局，联合头部伙伴攻克大脑、能源、驱动技术。人形机器人“小安”身高169cm，体重69kg，移动速度0 8m s，具备40个自由度，续航超2小时。预计明年一季度发布首款车载组件机器人，已在广州车展展示。

业界动态 · 2026-06-29

中国信科刷新光通信世界纪录每秒可下载1.4万部4K电影

3月25日，光通信领域迎来又一个里程碑：中国信科集团光通信技术和网络全国重点实验室联合鹏城实验室、烽火藤仓光纤科技有限公司，成功实现了2 5Pb s 24芯光纤超大容量实时光传输，再次刷新了世界纪录。这一研究成果不仅入选国际顶级光通信会议OFC（2026）并荣获“高分论文”称号，还受国际权威SCI

业界动态 · 2026-06-29

美国调查18万辆特斯拉Model3车门应急释放装置易找性

美国国家公路交通安全管理局对约17 9万辆2024款特斯拉Model3启动缺陷调查，焦点在于车门应急释放装置是否不易找到且标识不清。该调查源于一份缺陷请愿，不意味着立即召回，但可能引发后续监管措施。

业界动态 · 2026-06-29

doc个人图书馆停服创始人称无偿转让失败

运营长达20年，累计服务8000万用户的360doc个人图书馆，最终还是迎来了谢幕时刻。2026年5月1日，这个承载着无数用户收藏记忆的知名平台将正式停止服务——关停原因并非用户流失，而是始终未能寻得一位能够安全接管的合适人选。创始人蔡智在告别信中坦言，近两个月来，他一直在尝试将360doc无偿转

业界动态 · 2026-06-29

年Q1随身WiFi实测安全靠谱高性价比机型推荐

2025年10月，艾瑞咨询正式授予飞猫“AI WiFi品类开创者”认证，紧接着CIC也将其认定为“多网融合自由切换技术服务首创者”。这些权威认证背后，折射出一个清晰的市场趋势：移动办公、户外出行、宿舍上网等场景的需求正在快速增长，随身WiFi几乎已成为不少用户的刚需装备。但问题也随之而来——网络卡顿