最近读到一篇颇有深度的访谈,来自斯坦福的 Mihail Eric 与哈佛商学院的 Rem Koning,深入探讨了 AI 时代软件工程师的角色演变。其中几个观点颇为反直觉,值得仔细品味。
这段视频的核心论点,并非老生常谈的“AI 是否会取代程序员”,而是更务实地聚焦于:顶级工程师的工作内容正在发生怎样的转变?答案令人深思——从“编写代码”转向“管理智能体(Agent)”。此外,还有一个值得关注的视角:初级工程师在这场转型中,反而可能比资深工程师更具优势,原因正是“没有历史包袱”。这一逻辑大体成立,但某些方面仍有深入探讨的空间,后续会作出补充。
顶尖开发者的工作正在演变成什么
许多人对于 AI 编程的认知或许仍停留在“Copilot 帮我补全代码”的阶段。然而,访谈中描绘的场景已向前迈进了一大步:真正的顶级工程师,如今需要协调多个 Agent 并行处理不同任务,自身则频繁切换上下文、检查进度、排除阻塞点。
听起来是否很像团队管理者?Mihail Eric 也明确使用了这个类比——你是经理,Agent 就是实习生。区别在于,实习生犯错的速度比人类快得多,而且错误会叠加放大。因此,“循序渐进”变得至关重要。不是一次性启动 10 个 Agent 让它们各自为政,而是先将一个 Agent 调试至稳定可信赖,确认它能独立完成任务后,再引入第二个。在此过程中,你需要随时掌握每个 Agent 的进度与卡点——这即是所谓的“上下文切换”能力。
代码库需让 Agent 不困惑
Agent 会迅速放大错误,这往往并非 Agent 自身的问题,而是基础环境所致。一个对 Agent 友好的代码库,需要满足以下三点:
- 测试要充分。Agent 需要明确的“契约”才能判断何为正确、何为错误,测试覆盖率就是这个契约。
- 文档与代码要一致。Readme 描述一套逻辑,实际代码运行另一套,人类可以凭借经验推断,但 Agent 不行,它会循着文档走入陷阱。
- 风格要统一。API 设计、代码规范、命名习惯,必须有一套贯穿始终的模式。Agent 面对多种实现方式时容易产生混淆,统一规范是减少出错最直接的手段。
初级工程师的处境
当前求职确实面临挑战。疫情期间过度招聘与随后的裁员、毕业生数量持续增长,再加上企业开始借助 AI 重新评估初级岗位的必要性,这些因素叠加在一起,正是访谈中所说的“完美风暴”。
但访谈的核心论断是:初级工程师在适应 AI 工具方面,反而比资深工程师更迅速。原因很简单:拥有 20 年经验的工程师已形成固有的习惯与思维模式,很多人对 AI 工具的第一反应是抗拒,或者仅在边缘场景尝试,不敢真正依赖。新人没有这些包袱,他们更自然地将 AI 融入工作流,试错的心理成本也更低。
访谈中使用了一个精妙的词:“Good naivety(良好的天真)”。并非真的无知,而是未被行业惯例固化,遇到复杂问题时不会本能地绕开,敢于直接迎难而上。
计算机科学基础训练的价值在此也格外关键——能够将复杂系统拆解为子问题,愿意深入底层寻找 Bug 而非绕过它,这种思维模式在 AI 时代不会贬值。因为当 Agent 出错时,最终仍需人类来定位与修复。
功能性软件与卓越软件的差距源自何处
AI 可以快速生成一个“能用”的版本,这已不足为奇。但访谈提出了一个问题:为什么有些软件让人感觉好用、精致,而有些只是凑合能跑?
答案指向“品味(Taste)”。这种品味并非天生,而是在不断实验与打磨中积累的。Anthropic 团队自身就在用 Claude 重写 Claude 的代码,反复试错,观察哪些有效、哪些无效。实验本身就是工作流的一部分,而非偶尔为之。
好软件与凑合软件之间的差距,往往体现在最后 20% 的功能上。能否在基本跑通之后,继续投入精力扩展边界场景、处理那些“理论上不常见但实际上很烦人”的情况——这才是真正拉开差距的关键。
商业层面的终局
Rem Koning 的观点更进一步:未来的核心能力称为“分配智能(Allocate intelligence)”。他提出的设想是,AI 原生组织的关键并非让 AI 帮人减负,而是让 AI 直接面对客户,将人从循环中移出。AI 处理前端服务,人类则处理异常与迭代。
更激进的预测是:当 AI Agent 开始相互沟通协作,而不仅仅是各自执行任务时,商业价值的量级将跃升一个全新台阶。能够搭建这类系统的公司,将解锁完全不同规模的市场。
深度思考
“管理 Agent”的技能远比“使用 Agent”困难。会用 Cursor 或 Claude 写代码,与能协调多个 Agent 稳定完成复杂任务,是两件差距极大的事。前者如今门槛很低,后者还没几个人真正做到,这个空间值得认真对待。
代码库质量的重要性可能被大大低估了。在引入 Agent 之前,先将测试、文档、风格规范做好——这听起来是老生常谈,但在 Agent 场景下其权重完全不同。糟糕的代码库会让人类工程师变慢,却会让 Agent 直接出错,两者不在一个数量级。
“Good naivety”有其时效性。初级工程师的无包袱优势,在全力拥抱 AI 工具的头两年最为显著。等到行业形成新的最佳实践后,这一优势将逐渐收窄,转化为另一种形式的经验积累。因此,这个窗口期必须善加利用,不是等待,而是主动实验。
品味是可以刻意训练的。访谈中提到“品味”,但未具体说明如何建立。大量使用、大量比较,这大概是绕不开的路径。用过许多糟糕工具之后,你才能体会到好工具好在哪里;做过许多凑合版本之后,你才能明白精致的含义。这个过程无法跳过,必须依靠量的堆积。
```