顶级工程师转向管理AI智能体 不再写代码
最近读到一篇颇有深度的访谈,来自斯坦福的 Mihail Eric 与哈佛商学院的 Rem Koning,深入探讨了 AI 时代软件工程师的角色演变。其中几个观点颇为反直觉,值得仔细品味。
这段视频的核心论点,并非老生常谈的“AI 是否会取代程序员”,而是更务实地聚焦于:顶级工程师的工作内容正在发生怎样的转变?答案令人深思——从“编写代码”转向“管理智能体(Agent)”。此外,还有一个值得关注的视角:初级工程师在这场转型中,反而可能比资深工程师更具优势,原因正是“没有历史包袱”。这一逻辑大体成立,但某些方面仍有深入探讨的空间,后续会作出补充。
顶尖开发者的工作正在演变成什么
许多人对于 AI 编程的认知或许仍停留在“Copilot 帮我补全代码”的阶段。然而,访谈中描绘的场景已向前迈进了一大步:真正的顶级工程师,如今需要协调多个 Agent 并行处理不同任务,自身则频繁切换上下文、检查进度、排除阻塞点。
听起来是否很像团队管理者?Mihail Eric 也明确使用了这个类比——你是经理,Agent 就是实习生。区别在于,实习生犯错的速度比人类快得多,而且错误会叠加放大。因此,“循序渐进”变得至关重要。不是一次性启动 10 个 Agent 让它们各自为政,而是先将一个 Agent 调试至稳定可信赖,确认它能独立完成任务后,再引入第二个。在此过程中,你需要随时掌握每个 Agent 的进度与卡点——这即是所谓的“上下文切换”能力。
代码库需让 Agent 不困惑
Agent 会迅速放大错误,这往往并非 Agent 自身的问题,而是基础环境所致。一个对 Agent 友好的代码库,需要满足以下三点:
- 测试要充分。Agent 需要明确的“契约”才能判断何为正确、何为错误,测试覆盖率就是这个契约。
- 文档与代码要一致。Readme 描述一套逻辑,实际代码运行另一套,人类可以凭借经验推断,但 Agent 不行,它会循着文档走入陷阱。
- 风格要统一。API 设计、代码规范、命名习惯,必须有一套贯穿始终的模式。Agent 面对多种实现方式时容易产生混淆,统一规范是减少出错最直接的手段。
初级工程师的处境
当前求职确实面临挑战。疫情期间过度招聘与随后的裁员、毕业生数量持续增长,再加上企业开始借助 AI 重新评估初级岗位的必要性,这些因素叠加在一起,正是访谈中所说的“完美风暴”。
但访谈的核心论断是:初级工程师在适应 AI 工具方面,反而比资深工程师更迅速。原因很简单:拥有 20 年经验的工程师已形成固有的习惯与思维模式,很多人对 AI 工具的第一反应是抗拒,或者仅在边缘场景尝试,不敢真正依赖。新人没有这些包袱,他们更自然地将 AI 融入工作流,试错的心理成本也更低。
访谈中使用了一个精妙的词:“Good naivety(良好的天真)”。并非真的无知,而是未被行业惯例固化,遇到复杂问题时不会本能地绕开,敢于直接迎难而上。
计算机科学基础训练的价值在此也格外关键——能够将复杂系统拆解为子问题,愿意深入底层寻找 Bug 而非绕过它,这种思维模式在 AI 时代不会贬值。因为当 Agent 出错时,最终仍需人类来定位与修复。
功能性软件与卓越软件的差距源自何处
AI 可以快速生成一个“能用”的版本,这已不足为奇。但访谈提出了一个问题:为什么有些软件让人感觉好用、精致,而有些只是凑合能跑?
答案指向“品味(Taste)”。这种品味并非天生,而是在不断实验与打磨中积累的。Anthropic 团队自身就在用 Claude 重写 Claude 的代码,反复试错,观察哪些有效、哪些无效。实验本身就是工作流的一部分,而非偶尔为之。
好软件与凑合软件之间的差距,往往体现在最后 20% 的功能上。能否在基本跑通之后,继续投入精力扩展边界场景、处理那些“理论上不常见但实际上很烦人”的情况——这才是真正拉开差距的关键。
商业层面的终局
Rem Koning 的观点更进一步:未来的核心能力称为“分配智能(Allocate intelligence)”。他提出的设想是,AI 原生组织的关键并非让 AI 帮人减负,而是让 AI 直接面对客户,将人从循环中移出。AI 处理前端服务,人类则处理异常与迭代。
更激进的预测是:当 AI Agent 开始相互沟通协作,而不仅仅是各自执行任务时,商业价值的量级将跃升一个全新台阶。能够搭建这类系统的公司,将解锁完全不同规模的市场。
深度思考
“管理 Agent”的技能远比“使用 Agent”困难。会用 Cursor 或 Claude 写代码,与能协调多个 Agent 稳定完成复杂任务,是两件差距极大的事。前者如今门槛很低,后者还没几个人真正做到,这个空间值得认真对待。
代码库质量的重要性可能被大大低估了。在引入 Agent 之前,先将测试、文档、风格规范做好——这听起来是老生常谈,但在 Agent 场景下其权重完全不同。糟糕的代码库会让人类工程师变慢,却会让 Agent 直接出错,两者不在一个数量级。
“Good naivety”有其时效性。初级工程师的无包袱优势,在全力拥抱 AI 工具的头两年最为显著。等到行业形成新的最佳实践后,这一优势将逐渐收窄,转化为另一种形式的经验积累。因此,这个窗口期必须善加利用,不是等待,而是主动实验。
品味是可以刻意训练的。访谈中提到“品味”,但未具体说明如何建立。大量使用、大量比较,这大概是绕不开的路径。用过许多糟糕工具之后,你才能体会到好工具好在哪里;做过许多凑合版本之后,你才能明白精致的含义。这个过程无法跳过,必须依靠量的堆积。
```相关攻略
其实,想在 Notion 中高效搞定用户反馈的自动归纳,并不复杂。下面这四种 AI 方法,基本覆盖了从单条处理到全局分析的常见场景。 如果你也在用 Notion 收集用户反馈——无论是问卷、邮件、客服记录,还是社群发言——但总觉得信息碎片化严重,难以提炼共性问题和核心诉求,那很可能是因为缺少一套结构
大模型能力强大,但提问方式不当会导致结果不理想。核心在于精准提问,通过角色设定、背景介绍、明确任务、实现路径和输出要求这五个关键步骤逐步细化问题,才能大幅提升AI回答的质量和精准度。
科技的浪潮正以前所未有的速度重塑着我们的工作场景。曾被视为未来概念的AI办公软件,如今已悄然成为现实工具箱中的一员。面对这个瞬息万变的时代,如何借助新一代AI工具来撬动团队效率、重塑协作模式,无疑是摆在每一位职场人面前的核心课题。今天,我们就来深入聊聊这场正在发生的办公革命。 当AI遇上办公:从工具
综合2026年行业公开数据及各企业在GEO(生成式引擎优化)领域的技术落地成果,本次重点推荐的前三家公司为知道人工智能实验室(KnowAI)、深维智信、赛博推;其余七家则各具特色,在细分方向上均有显著建树。 评选标准 本次评选基于2026年国内AI营销与GEO优化服务市场的实际发展情况,从以下四个维
想要利用即梦AI快速创作出小红书上备受欢迎的照片拼贴墙?让多张生活照、产品图或旅行照自动组合成富有呼吸感、包含留白节奏的创意展示页面,避免千篇一律的九宫格堆砌。 核心方法只需三步:首先通过提示词让AI构建整体骨架,接着导入照片并固定位置坐标,最后运用光影、材质和留白技巧进行微调,注入宛如空气流动般的
热门专题
热门推荐
《Paralives》开发商承诺所有后续更新永久免费,拒绝付费DLC模式。15人小团队依靠首发销售额即可支撑多年运营,无需依赖额外内容包维持开发,展现了与《模拟人生》系列不同的差异化竞争思路。
2025年5月28日,比亚迪王朝网全新力作——宋Ultra DM-i正式推向市场,共推出5款配置车型,官方售价区间为12 99万至15 99万元。此次定价策略极具突破性:一款拥有310公里纯电续航能力的中型插电混动SUV,直接下探至13万元级别市场。作为王朝网络的新旗舰,该车明确瞄准高频出行需求场景
先来关注一个有趣的细节:苹果首款折叠屏手机,传闻将于今年秋季正式亮相。产品命名可能为iPhone Ultra,也有媒体称之为iPhone Fold——无论最终叫什么,这都将标志着苹果在折叠形态领域首次“出手”。 近日,配件厂商iFunSmart已率先上架iPhone Ultra的首批保护壳——这绝非
山寨币ETF迎来批量上市潮,首批项目市场表现如何?一文分析 Binance币安 欧易OKX ️ Huobi火币️ 最近,市场出现了一个不容忽视的新动向:XRP、DOGE、LTC、HBAR等现货ETF已经悄然登陆美国市场。与此同时,A VAX、LINK等资产的同类产品也正在审批流程中。进入11月以来,
近日,公司对SteamDeck1TBOLED版涨价300美元至949美元,上架短短不到24小时便再度售罄。据外界分析,该公司从中国大量补货并分批投放库存,高溢价未影响众多玩家的抢购热情与速度,其人气极其旺盛无比足以支撑快速清空。





