管不好Agent的人,本质是不懂这5个管理法则
智能体天生就带有过度设计的倾向。代码生成的边际成本几乎为零,添加功能、堆砌代码量对它来说简直轻而易举。你让它增加功能,它绝对不会跟你说"这个不该做"。
最近和几位朋友聊起AI工具的使用体验,发现一个特别有意思的现象:同样是使用Claude Code、Cursor、Codex这套工具,有些人的效率翻了好几倍,有些人却和智能体来回拉扯半天,耗费大量token,最后回头一看还不如自己动手写。
曾经的我就是后者。当时我的第一反应是——这工具不行,模型降智了。
但后来我意识到,问题不在工具,而在我自己。
你已经不是写代码的人了
很多程序员到现在还没意识到一件事:你的角色已经变了。
你不再是那个一行行敲代码的执行者了。你是指挥智能体干活、审查产出、把控方向的人。
时代变了,你现在是个管理者。
但问题是,大部分人——包括曾经的我——完全不知道该怎么当管理者。我们从来没学过怎么委托任务、怎么做质量把控、什么时候该介入、什么时候该放手。
我们的训练全部集中在"怎么把代码写好"上,从没有人教过我们"怎么让别人把代码写好"。
而后者,恰恰是管理学研究了一百多年的核心问题。所以,我觉得管理学是这个时代最有价值的学科之一。
含糊的prompt全是坑
我见过最常见的用法是这样的:把一个含糊不清的需求甩给智能体,然后坐等结果。
"帮我重构一下这个模块。"
"这个页面性能不行,优化一下。"
然后智能体跑了,也确实给了你一大堆代码。你看了看,觉得好像能用,合并了。过两天发现有bug,再甩给智能体改。改完又发现另一个问题。来回几轮之后,代码库已经面目全非了。
这不叫用智能体,这叫甩锅。
你把一个复杂任务不做任何拆解就扔出去,不给上下文、不给约束、不做审查,出了问题怪工具不行——这跟把一个复杂项目扔给新来的实习生,啥也不交代,然后怪人家干不好,有什么区别?
"开10个会话并行"不会让你更快
最近看到不少人炫耀:我同时开了十几个Claude Code会话并行跑任务,效率爆表。
说实话,我也干过这事。
结果是什么呢?我只开了5个会话,5个会话同时产出了一堆代码,我审查不过来。等我终于看完第一个会话的产出时,后面四个已经基于过时的代码跑了一大堆修改了。最后代码之间还有冲突,合并的时候又花了一大堆时间。
映射到智能体工作流上:智能体不是瓶颈。你才是。
你能审查的速度、你能做出决策的速度、你能提供上下文的质量——这些才是决定最终产出的关键。智能体几分钟就能写出几百行代码,但你一天能review多少行?
当你的审查能力已经成为整个流程的瓶颈时,再去唤起更多的智能体没有任何意义。你只是在制造更多的待审代码,而不是更多的高质量产出。
大量的过度设计
我看过太多这样的案例了:凭感觉编程,短期撸出来一个看起来像模像样的产品,打开代码仓库一看,代码量膨胀了好几倍,真正有用的逻辑可能只占三分之一不到。
智能体天生就有过度设计的毛病。代码生成的边际成本为零,加功能、堆代码量对它来说太容易了。你让它加功能,它绝对不会跟你说"这个不该做"。
而你如果不去约束它,它就会一直加、一直堆。功能以前所未有的速度堆积,技术债指数级增长。等你终于意识到问题的时候,代码库已经积重难返了。
这不是智能体的错。是你放弃了作为管理者的控制权,你放权太多了。
反观天天说"模型降智"的人
每次大模型更新之后,社交媒体上就一堆人说"降智了"。
说实话,有些时候确实有波动。但更多时候,我发现很多人并没有处理好下面的这些问题:
幻想一个prompt完成一个复杂任务,不做任何拆解最开始给的方案路线就有问题,后面越走越歪从来不review智能体的产出,出了问题才开始着急,对智能体百般指责
当你自己成为了整个工作流的瓶颈,模型再怎么优化都只是杯水车薪。
这话可能不好听,但这是事实。
光现在第一梯队模型的能力,就够大部分人消化好几年了。真正限制产出的,不是模型的智力,是你调度它、管理它的能力。
写在最后
其实把上面这些问题归结起来,答案特别简单:
管智能体,就是管理。
怎么拆任务、怎么给上下文、什么时候该介入、什么时候该放手、怎么做质量把控、怎么识别瓶颈——这些全部都是管理学已经研究透了的东西。
可惜大部分人还在用"执行者"的思维来操作"管理者"的工具。这是现在我觉得这个时代之所以非常混乱的原因,人人都有管理者的权力了,但大部分却不懂管理。
如果你的智能体工作流一直不太顺,先别急着换工具、换模型。先检查一下你自己——上面管理智能体的坑你有没有处理好?如果你觉得你的朋友也可能会踩上面的坑,也请你转发给他,一起共勉。
这周我会写一篇更详细的,把几本经典管理学著作里面对智能体管理最受用的部分拆出来分享,感兴趣的可以点个赞。
相关攻略
最近,Perplexity 团队将他们内部维护数百个 Skill 的完整方法论公开了。结合原文与近期在 Agent 项目中的实践,一个核心感受愈发清晰:编写 Skill 与编写代码,本质上是两种截然不同的活动。甚至可以说,许多在软件开发中被奉为圭臬的最佳实践,在 Skill 设计领域可能需要完全反过
工具调用是智能体(Agent)实现复杂任务的核心能力,但当前技术仍面临诸多挑战:工具选择不当、参数传递错误、在不该调用时强行调用等问题时有发生。传统的解决方案多采用事后评估机制,即在错误操作执行后,通过分析日志、调整提示词(Prompt)或重新训练模型来改进。然而,这种方法存在根本性缺陷:它脱离了实
过去一年,我们团队深入探索了项目管理AI Agent的实践路径,成功完成了四次关键的版本迭代。从最初仅能提供建议的知识顾问,演进为如今能够为整个项目团队提供专属服务的智能业务伙伴,这一路走来积累了宝贵的经验与深刻的洞察。今天,我们将完整分享这段从0到1的构建历程、核心设计思路与未来展望。 纵观企业项
这里有个挺有意思的错位。市面上那些“蒸馏同事”工具,宣传语总爱说“把离职同事的经验留下来”,听起来特别合理。毕竟,谁没经历过核心同事离职、交接文档只有寥寥几页,结果半年后遇到问题,翻遍知识库也找不到答案的窘境呢? 但问题恰恰出在这里:我们真正找不到的,往往是人在特定情境下的判断和直觉。而这种判断力,
将重复性工作拆解为原子化步骤,封装成可自动执行的Skill或Agent,能有效解放生产力。例如,将写作风格流程化可实现自动生成初稿,将新闻整理自动化可节省时间。通过极致拆解、工具接口化及一键封装,个人经验被转化为标准化流程,使工作者更聚焦于创造性任务。
热门专题
热门推荐
钉钉文档官网 在探讨企业级协同办公解决方案时,钉钉文档无疑是备受瞩目的核心工具之一。作为阿里巴巴钉钉官方推出的旗舰级应用套件,它深度融合了在线文档编辑、智能表格、思维导图等多种高效创作工具。其核心优势在于与钉钉平台生态的无缝衔接,能够直接同步企业内部组织架构与通讯录,实现团队成员间的即时协作与信息流
在数字化转型浪潮中,高效、易用的数据分析工具已成为企业提升决策效率的关键。商汤科技推出的“办公小浣熊”智能助手,正是基于自研大语言模型打造的一款创新产品,旨在彻底降低数据分析的技术门槛。用户无需掌握编程知识或复杂操作,即可通过自然对话完成从数据查询、处理到可视化洞察的全流程,让数据价值触手可及。 办
在人工智能技术快速发展的今天,MiniMax作为一家专注于全栈自研的AI公司,正以其独特的技术路径和前瞻性的布局,在业界脱颖而出。公司致力于构建覆盖文本、图像、语音和视频的新一代多模态智能模型矩阵,这不仅体现了对核心底层技术自主权的深度掌控,也展现了对未来人机交互与内容生成形态的前瞻思考。 那么,M
ApolloCreditFund(ACRED)作为连接传统信贷与DeFi的桥梁,其价格受市场情绪、协议基本面及宏观环境影响。其价值逻辑根植于现实世界资产(RWA)的收益捕获与链上流动性释放。短期价格波动难以预测,但长期发展取决于信贷资产质量、协议安全性和市场采用度。投资者需关注其底层资产表现、代币经济模型及整个RWA赛道的发展趋势。
在数字化转型浪潮中,一套能够深度适配业务、彰显品牌特色的智能客服系统,已成为企业提升服务效率与用户体验的关键工具。然而,市场上许多解决方案往往模式固化,难以满足个性化需求。如何让AI客服不仅具备基础的自动化应答能力,更能承载独特的品牌文化与服务哲学?其核心在于系统是否支持深度的自定义与持续的AI训练





