顶级工程师转向管理AI智能体不再写代码

时间：2026-05-28 21:38

```html 最近读到一篇颇有深度的访谈，来自斯坦福的 Mihail Eric 与哈佛商学院的 Rem Koning，深入探讨了 AI 时代软件工程师的角色演变。其中几个观点颇为反直觉，值得仔细品味。这段视频的核心论点，并非老生常谈的“AI 是否会取代程序员”，而是更务实地聚焦于：顶级工程师的工

```html

最近读到一篇颇有深度的访谈，来自斯坦福的 Mihail Eric 与哈佛商学院的 Rem Koning，深入探讨了 AI 时代软件工程师的角色演变。其中几个观点颇为反直觉，值得仔细品味。

这段视频的核心论点，并非老生常谈的“AI 是否会取代程序员”，而是更务实地聚焦于：顶级工程师的工作内容正在发生怎样的转变？答案令人深思——从“编写代码”转向“管理智能体（Agent）”。此外，还有一个值得关注的视角：初级工程师在这场转型中，反而可能比资深工程师更具优势，原因正是“没有历史包袱”。这一逻辑大体成立，但某些方面仍有深入探讨的空间，后续会作出补充。

顶尖开发者的工作正在演变成什么

许多人对于 AI 编程的认知或许仍停留在“Copilot 帮我补全代码”的阶段。然而，访谈中描绘的场景已向前迈进了一大步：真正的顶级工程师，如今需要协调多个 Agent 并行处理不同任务，自身则频繁切换上下文、检查进度、排除阻塞点。

听起来是否很像团队管理者？Mihail Eric 也明确使用了这个类比——你是经理，Agent 就是实习生。区别在于，实习生犯错的速度比人类快得多，而且错误会叠加放大。因此，“循序渐进”变得至关重要。不是一次性启动 10 个 Agent 让它们各自为政，而是先将一个 Agent 调试至稳定可信赖，确认它能独立完成任务后，再引入第二个。在此过程中，你需要随时掌握每个 Agent 的进度与卡点——这即是所谓的“上下文切换”能力。

代码库需让 Agent 不困惑

Agent 会迅速放大错误，这往往并非 Agent 自身的问题，而是基础环境所致。一个对 Agent 友好的代码库，需要满足以下三点：

测试要充分。Agent 需要明确的“契约”才能判断何为正确、何为错误，测试覆盖率就是这个契约。
文档与代码要一致。Readme 描述一套逻辑，实际代码运行另一套，人类可以凭借经验推断，但 Agent 不行，它会循着文档走入陷阱。
风格要统一。API 设计、代码规范、命名习惯，必须有一套贯穿始终的模式。Agent 面对多种实现方式时容易产生混淆，统一规范是减少出错最直接的手段。

初级工程师的处境

当前求职确实面临挑战。疫情期间过度招聘与随后的裁员、毕业生数量持续增长，再加上企业开始借助 AI 重新评估初级岗位的必要性，这些因素叠加在一起，正是访谈中所说的“完美风暴”。

但访谈的核心论断是：初级工程师在适应 AI 工具方面，反而比资深工程师更迅速。原因很简单：拥有 20 年经验的工程师已形成固有的习惯与思维模式，很多人对 AI 工具的第一反应是抗拒，或者仅在边缘场景尝试，不敢真正依赖。新人没有这些包袱，他们更自然地将 AI 融入工作流，试错的心理成本也更低。

访谈中使用了一个精妙的词：“Good naivety（良好的天真）”。并非真的无知，而是未被行业惯例固化，遇到复杂问题时不会本能地绕开，敢于直接迎难而上。

计算机科学基础训练的价值在此也格外关键——能够将复杂系统拆解为子问题，愿意深入底层寻找 Bug 而非绕过它，这种思维模式在 AI 时代不会贬值。因为当 Agent 出错时，最终仍需人类来定位与修复。

功能性软件与卓越软件的差距源自何处

AI 可以快速生成一个“能用”的版本，这已不足为奇。但访谈提出了一个问题：为什么有些软件让人感觉好用、精致，而有些只是凑合能跑？

答案指向“品味（Taste）”。这种品味并非天生，而是在不断实验与打磨中积累的。Anthropic 团队自身就在用 Claude 重写 Claude 的代码，反复试错，观察哪些有效、哪些无效。实验本身就是工作流的一部分，而非偶尔为之。

好软件与凑合软件之间的差距，往往体现在最后 20% 的功能上。能否在基本跑通之后，继续投入精力扩展边界场景、处理那些“理论上不常见但实际上很烦人”的情况——这才是真正拉开差距的关键。

商业层面的终局

Rem Koning 的观点更进一步：未来的核心能力称为“分配智能（Allocate intelligence）”。他提出的设想是，AI 原生组织的关键并非让 AI 帮人减负，而是让 AI 直接面对客户，将人从循环中移出。AI 处理前端服务，人类则处理异常与迭代。

更激进的预测是：当 AI Agent 开始相互沟通协作，而不仅仅是各自执行任务时，商业价值的量级将跃升一个全新台阶。能够搭建这类系统的公司，将解锁完全不同规模的市场。

深度思考

“管理 Agent”的技能远比“使用 Agent”困难。会用 Cursor 或 Claude 写代码，与能协调多个 Agent 稳定完成复杂任务，是两件差距极大的事。前者如今门槛很低，后者还没几个人真正做到，这个空间值得认真对待。

代码库质量的重要性可能被大大低估了。在引入 Agent 之前，先将测试、文档、风格规范做好——这听起来是老生常谈，但在 Agent 场景下其权重完全不同。糟糕的代码库会让人类工程师变慢，却会让 Agent 直接出错，两者不在一个数量级。

“Good naivety”有其时效性。初级工程师的无包袱优势，在全力拥抱 AI 工具的头两年最为显著。等到行业形成新的最佳实践后，这一优势将逐渐收窄，转化为另一种形式的经验积累。因此，这个窗口期必须善加利用，不是等待，而是主动实验。

品味是可以刻意训练的。访谈中提到“品味”，但未具体说明如何建立。大量使用、大量比较，这大概是绕不开的路径。用过许多糟糕工具之后，你才能体会到好工具好在哪里；做过许多凑合版本之后，你才能明白精致的含义。这个过程无法跳过，必须依靠量的堆积。

```

来源：https://juejin.cn/post/7611782441562275849

上一篇金山办公发布WPS新一代多维表格引擎企业协同达毫秒级 下一篇美团旗下光年之外Tabbit AI原生浏览器

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。