首页 游戏 软件 资讯 排行榜 专题
首页
AI
智能体技能设计模式演进从Anthropic到谷歌的实践解析

智能体技能设计模式演进从Anthropic到谷歌的实践解析

热心网友
34
转载
2026-05-09

近日,Google Cloud Tech 发布了一篇关于 Agent Skill 设计模式的重磅文章,系统性地归纳了五种核心模式。若你仅将其视为“又多几个新术语”,便可能错失其背后更深刻的行业信号。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

这篇文章的真正价值,并非在于模式分类本身,而在于它标志着一个关键的范式转移:业界关于 Skills 的讨论,正从早期“格式如何书写”的初级阶段,深入至“工作流如何设计”的工程化阶段。这恰好填补了当前 Agent 生态演进中的一块关键拼图。

图片

回顾过去半年的发展脉络,这一趋势更为清晰。自去年十月 Anthropic 正式推出 Agent Skills 以来,社区焦点主要集中于几个基础议题:格式如何组织、机制如何加载、以及经验如何被 Claude 发现。正如 Simon Willison 那句广为流传的评价所言,Skill 的精妙之处在于其极简的抽象——它将扩展模型能力简化为“一个 Markdown 文件加可选脚本”,而将复杂的运行时逻辑交由 LLM Harness 和环境处理。

然而,当这些基础共识形成后,新的挑战便随之浮现:同样是一个 SKILL.md 文件,其内部究竟应设计为操作手册、填充模板、检查清单、访谈流程,还是多阶段流水线?Google 的这份指南,正是将问题推进到了下一层:Anthropic 定义了 Skill 的“容器”与运行机制,而 Google 则在探讨“容器内部应采用何种高效结构”。

以“过程资产”视角重新审视 Skill

要透彻理解这五种模式的意义,首先需跳出“提示词复用”的固有认知。Skill 更应被视作一份“过程资产”——它不仅是供人阅读的文档,更是指导 Agent 在运行时进行决策、影响工具调用乃至文件操作的“可执行工作单元”。

普通文档允许读者自行补充上下文、判断执行顺序和停止时机。但 Skill 中的许多语句承担着明确的运行时职责:触发词决定加载时机,步骤顺序防止 Agent 跳步,检查清单用于结果评价,负面约束规避越权行为,支撑文件用于管理上下文负载,脚本则执行确定性动作。

因此,当 SKILL.md 的格式趋于稳定后,真正的设计难点便转移到了其内部逻辑的构建上。一个 FastAPI 规范 Skill、一个报告生成 Skill 与一个代码审查 Skill,虽然外表都是 Markdown,但其内部的任务结构、上下文切割、停止条件和结果验证机制可能截然不同。Google 提出的五种模式,正是在系统回答:当团队经验被封装进 Agent 运行时,会沉淀为哪些稳定且可复用的内部结构。

五种模式,应对五类典型 Agent 失效场景

若简单地将这五种模式视为分类表,则有些可惜。实际上,每一种模式都精准对应着 Agent 在特定任务类型中容易遭遇的一类典型失败。它们本质上是经过实践验证的“反脆弱”设计范式。

模式一:Tool Wrapper —— 解决“领域知识缺失”问题

这是最直观的模式。将 FastAPI、Terraform 或 React Server Components 等庞大的技术规范全部塞进系统提示词,只会导致上下文窗口不堪重负。Tool Wrapper 模式的思路是,将这些稳定、低频但必需的领域知识整理成独立的 Skill,仅在用户需要编写、审查或调试相关技术时按需加载。

其关键在于控制知识的“入场方式”。冗长的参考资料应放入 references/ 目录,而 SKILL.md 本身只负责触发路由和应用规则。这与优化上下文工作集的思路一脉相承——上下文窗口不是资料仓库,大块知识应留在外部,用时再取,系统才能保持轻灵与高效。

图片

模式二:Generator —— 解决“输出格式不稳定”问题

Generator 模式针对另一类常见痛点:Agent 每次都能完成任务,但输出格式飘忽不定。无论是生成项目报告、PR 描述还是事故复盘文档,单次结果可能不错,但十次放在一起就杂乱无章,缺乏一致性。

其解决方案朴素而有效:将固定模板放入 assets/,将风格指南放入 references/,由 SKILL.md 协调加载、补全变量并填充模板。这种分工明确了责任边界——模板与风格指南可独立维护,缺失变量被单独处理,必须保留的章节予以明确声明。对于已拥有稳定文档格式的团队而言,Generator 是最易落地的一类 Skill。

图片

模式三:Reviewer —— 解决“审查标准混乱”问题

Reviewer 模式对工程团队尤为实用。无论是代码审查、安全审计还是架构方案评审,都必须厘清两件事:“如何审”的流程和“审什么”的标准。将两者混杂在一个系统提示词中,初期尚可运行,后期维护将成为噩梦。

Reviewer 的做法是将具体的审查标准(如 Python 代码风格规范、OWASP 安全清单)放入 references/review-checklist.md,Skill 本身只定义审查协议:先理解代码或方案的意图,再按清单逐项检查,依据问题严重程度输出,并给出具体的修复建议。这类似于软件工程中的测试与 Lint 工具——审查清单可版本化、可替换、可分项目配置,Agent 负责应用标准,而非临时发明标准。

图片

模式四:Inversion —— 解决“需求不清就仓促开工”问题

Inversion 模式的价值常被低估。许多 Agent 的失败并非源于能力不足,而是起步太早。用户一句“帮我设计一个系统”,它便立刻开始画架构图、选数据库,看似完整,实则遗漏了大量关键业务约束。

Inversion 将流程反转:让 Agent 首先扮演采访者或需求分析师。例如,一个项目规划 Skill 可以规定,必须依次问清问题背景、目标用户、预期规模、部署环境、技术栈偏好和非功能性约束后,才能进入方案合成阶段。这里的核心是“门控”机制——模糊的“如需可提问”往往不够,必须明确阶段划分、退出条件以及何时“禁止继续”。这类 Skill 特别适合高风险、高模糊度的任务,如系统架构设计、迁移规划或安全评估。

图片

模式五:Pipeline —— 解决“复杂流程中跳步骤”问题

Pipeline 模式专治“跳步”问题。文档生成、发布流程、数据迁移等复杂任务,绝非一次输出就能解决,它们需要经历清点、生成、确认、组装、质检等多个阶段。

Pipeline 的关键在于设置明确的“检查点”。以 Google 示例中的文档生成流水线为例,它先解析公开 API 并列出清单供用户确认,再生成 docstring,确认无误后才进入组装阶段,最后还要经过质量清单检查。这种模式看似繁琐,但在生产流程中极为现实。对于复杂任务,最可怕的不是速度慢,而是 Agent 跳过前置条件,直接给出一个看似完整却未经检验的结果。

图片

Skill 与 Harness:一体两面的工程闭环

要理解 Skill 的深层价值,需要将其置于更广阔的 Agent 工程视野中。它与 Harness(模型驾驭框架)构成了相辅相成、缺一不可的关系。

Harness 负责运行时的主循环:如何组织上下文、调用工具、管理状态、反馈错误、收敛权限。而 Skill 则负责将某一类可复用的工作方法、最佳实践带入运行时:这类 API 怎么写,这类文档如何生成,这类代码如何审查。

可以说,Skill 是 Harness 能够按需加载的“过程模块”。这也解释了为何 Claude Code 的最新文档将扩展点划分得如此清晰:CLAUDE.md 处理常驻上下文,Skills 处理按需知识与工作流,MCP 连接外部系统,Subagents 实现上下文隔离,Hooks 提供自动化与强制约束。它们并非相互替代,而是在一个真实、复杂的工作流中协同运作。

业界的讨论也正朝着这个方向演进。Tobi Lütke 曾强调他更偏爱“上下文工程”一词,因为核心能力在于将任务所需的上下文组织到模型“有机会解决”的程度。这与 Skill 的设计理念不谋而合——Skill 的目标不是让提示词更漂亮,而是将上下文、约束、模板和检查点组织成一个可触发、可执行的工作单元。

Apache Airflow 的 PMC 成员 Kaxil Naik 在分享其 Claude Code 实践时说得更直接:他花费大量时间迭代 Skills、Hooks 和集成,旨在让 Agent 按照他的工作方式运转。当一位资深工程师说出“Skill is the code”时,其深意在于:过去存在于个人习惯与团队默契中的工作方式,正在被编码为 Agent 可理解、可执行的标准化接口。

独立开发者 Zak El Fassi 提出的“技能驱动开发”理念同样印证了这一点。他在每个开发循环中都会思考:“这件事,要不要变成一个 Skill?”如果是,就编写一个 SKILL.md,下次 Agent 便能自动发现、加载并执行。这个看似微小的决策,经年累月便能沉淀为一套可复利、可传承的团队过程资产。

这正是 Skill 变得“厚重”的地方。它不再是模型层的炫技,而是工程层的务实接口,是连接人类经验与 AI 执行的桥梁。

团队实践指南:从窄流程入手,厘清六个关键设计问题

如果一个团队打算开始沉淀自己的 Skill 库,建议从一个边界清晰、高频发生的窄流程入手,而非追求一蹴而就的“全能助手”。例如:固定服务的发布检查清单、特定框架的代码审查、数据口径变更评审模板,或是客户方案生成前的标准化信息收集流程。

这类流程兼具高复用性和易验证性。在动手编写 SKILL.md 之前,不妨先回答以下六个关键问题,以明确 Skill 的设计边界与职责:

1. 触发条件是什么?

description 字段应被视为一份“路由契约”,而非简单介绍。模糊的“帮助处理部署任务”会导致触发混乱。更清晰的写法是列举具体场景:当用户需要发布 Next.js 服务到 Vercel、检查预览环境、处理构建失败或执行回滚时触发。触发范围需要基于真实使用日志进行持续校准,过宽或过窄都会影响实际效用。

2. 属于哪种核心模式?

在动笔前,先判断这个 Skill 的主要目的是注入知识、生成模板、审查结果、收集需求,还是执行流程?明确其核心模式能有效避免将 Skill 写成混杂手册、模板、审查器于一身的“四不像”,确保设计意图的纯粹性。

3. 哪些内容应该外置?

切忌让 SKILL.md 无限膨胀,重蹈“巨型系统提示词”的覆辙。稳定的长篇规范应放入 references/,固定输出模板放入 assets/,确定性高或易出错的动作尽量用 scripts/ 实现。主文件应专注于路由、流程、边界和加载规则。渐进式披露的价值正在于此——先让 Agent 知晓能力存在,待真正需要时再加载细节,优化上下文使用效率。

4. 何处必须设置“检查点”?

生产级 Skill 必须包含明确的停止或确认节点。例如:需求未收集完整前,禁止生成架构方案;API 清单未经确认,不得生成最终文档;破坏性操作未经明确许可,坚决不予执行。含糊的门控条件极易被 Agent “脑补”跳过,因此必须将“禁止继续”的条件写得清晰、明确、无歧义。

5. 失败路径如何设计?

许多 Skill 只描绘了理想的成功路径。现实中,依赖缺失、环境变量错误、API 返回 403、信息不足等失败场景更为常见。一个健壮的 Skill 至少需要明确:如何识别失败、失败时首先收集何种证据、哪些情况可自动重试、哪些必须暂停并请求人工介入、哪些安全底线绝不能为了完成任务而绕过。

6. 如何版本化与审查?

一旦 Skill 进入团队工作流,它就应被视为代码资产进行管理,尤其是那些涉及审查、流水线或脚本的 Skill。至少应建立以下机制:明确 Skill 负责人、修改需经同行评审、高风险 Skill 配备测试用例、记录关键流程变更、定期清理废弃规则、对第三方 Skill 采取“先审查后启用”的默认不信任策略。这部分工作虽不“性感”,却至关重要——一个坏的提示词只影响一次对话,而一个坏的 Skill 可能污染一整类任务,造成系统性风险。

警惕:别把一次偶然经验固化为长期规则

随着 Agent 能自动将成功路径沉淀为 Skill,“自我进化”的愿景极具诱惑力。但必须警惕其反面:错误经验也可能被固化。一次偶然的误判若被写入 Skill,此后所有类似任务都可能更快地走向同一个错误。

因此,过程资产需要治理。必须区分哪些是临时性、场景特定的经验,哪些是经过反复验证、值得固化的最佳实践。这里存在一个清晰的工程边界:SKILL.md 虽是 Markdown,却能直接影响 Agent 行为。只要 Agent 能调用工具、读写文件、发送请求,Skill 就可能间接影响真实系统。正如 Claude Code 文档中那句实在的提醒:如果某条规则必须每次成立,更适合通过 Hook 等确定性机制来强制实施,而非仅仅写在提示词或 Skill 中。

结语:从提示词工程迈向工作流设计

将 Google 总结的五种设计模式与 Anthropic 的 Skills 规范结合来看,Agent 工程正迈过一个重要的分水岭。

早期焦点在于如何写好一句提示词;随后扩展到如何组织上下文、暴露工具、隔离子智能体、连接外部系统;如今,随着 Skill 这条路径的成熟,焦点进一步深入到如何将团队经验、标准流程、检查清单和排障方法,封装为模型可发现、可加载、可执行的标准化工作单元。

这绝非文档形式的小修小补。它意味着工程团队必须开始回答一些更传统、也更棘手的问题:哪些经验值得沉淀?哪些规则常驻内存,哪些按需加载?哪些判断交给模型,哪些动作交给脚本?哪些流程必须设置检查点?模型升级后,旧 Skill 是否依然适配?

越来越明显的是,Agent 时代的架构师,不能只盯着模型能力或追逐新框架。更持久、更核心的能力,在于将这些纷繁复杂的工作流,拆解为边界清晰、可组合、可观测、可回滚的系统部件。Skill 正是这样一个微小的切入点。它小到一个文件即可起步,门槛低到用 Markdown 就能编写;可一旦融入真实工作流,其背后便会迅速牵引出上下文管理、工具集成、权限控制、效果评估、版本治理等一系列工程问题。

回想半年前 Anthropic 首次推出 Skills 时,社区不乏“这不就是几行 Markdown 吗”的声音。如今再看,整个生态——从 Claude Code、Codex CLI 到 Cursor、Gemini CLI,乃至 Vercel、Trail of Bits 等产品方——都在围绕同一个 SKILL.md 文件构建工程实践。Google 此次总结设计模式,更像是将这件事从“实验性玩法”,正式推进到了“该拥有自己设计语言”的新阶段。

至此,SKILL.md 已不再适合被简单视为一段加长的提示词。更准确的定位是:它是团队经验与知识进入 Agent 运行时的一种标准化、工程化的接口。而接口一旦确立,后续的比拼便不再是文字技巧,而是实打实的工程设计、流程抽象与治理能力了。

参考资料

• Google Cloud Tech: 《5 Agent Skill design patterns every ADK developer should know》

• Claude 官方博客: Introducing Agent Skills

• Claude Code 文档: Extend Claude with skills

• Claude API 文档: Agent Skills

• Anthropic 指南: The Complete Guide to Building Skills for Claude

• Simon Willison: Claude Skills are awesome, maybe a bigger deal than MCP

• Zak El Fassi: SkDD: Skills-Driven Development

• Tobi Lütke 关于 context engineering 的讨论

• Kaxil Naik 关于 Claude Code、Skills、Hooks、MCP 的实践长帖

来源:https://www.51cto.com/article/842646.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

智能体技能设计模式演进从Anthropic到谷歌的实践解析
AI
智能体技能设计模式演进从Anthropic到谷歌的实践解析

AgentSkill设计模式的发展焦点从基础格式转向工作流设计,将团队经验封装为可执行单元。Google提出的五种模式对应不同任务场景,旨在提升Agent的稳定性和可靠性。Skill与Harness形成工程闭环,推动过程资产标准化,使Agent工程从提示词优化迈向系统化工作流设计。

热心网友
05.09
Claude为何持续限速解析 Anthropic联合SpaceX部署GPU并展望2026独角兽
AI
Claude为何持续限速解析 Anthropic联合SpaceX部署GPU并展望2026独角兽

同一天,Anthropic官宣了一则震撼业界的消息:他们拿下了SpaceX旗下Colossus 1数据中心的全部算力,计划在一个月内上线超过300MW、总计22万张NVIDIA GPU。这一规模,足以让Anthropic的算力水平追平甚至超越OpenAI和谷歌DeepMind。 就在5月6日,旧金山

热心网友
05.08
Anthropic租用SpaceX数据中心扩容算力 我国太空计算技术发展领先
AI
Anthropic租用SpaceX数据中心扩容算力 我国太空计算技术发展领先

Anthropic紧急租用SpaceX数据中心,获得超22万张GPU算力以应对用户激增,并放宽使用限额。SpaceX出租旧集群既获取收入,也为太空算力合作铺垫。太空算力因能源与散热优势受关注,我国相关规划与进展亦处全球前列。算力竞赛正转向基础设施规模与弹性的比拼。

热心网友
05.07
马斯克xAI与Anthropic合作研发太空超级计算平台
业界动态
马斯克xAI与Anthropic合作研发太空超级计算平台

埃隆·马斯克旗下xAI与Anthropic达成计算合作,开放超级计算机访问权限,并计划共同探索太空算力。面对AI发展带来的巨大算力需求,轨道数据中心因散热与能源优势成为新方向。SpaceX及国内企业已开始布局卫星网络以构建太空算力基础设施,资本市场和相关产业链正加速投入核心技术研发。

热心网友
05.07
Anthropic用员工手册训练AI将失控率从54%降至7%
业界动态
Anthropic用员工手册训练AI将失控率从54%降至7%

研究提出“模型规范中期训练”(MSM)方法,在传统对齐微调前增加阶段,让AI先学习规范背后的原理与理由。实验显示,该方法使AI智能体在模拟企业环境中的失控率从54%大幅降至7%,并减少了对齐微调的数据需求。研究表明,理解行为准则背后的“为什么”比仅示范数据更有效。

热心网友
05.07

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

小米手机联系人备份到云盘详细步骤指南
电脑教程
小米手机联系人备份到云盘详细步骤指南

小米云盘备份联系人,不止是“开启同步”那么简单 提到备份手机通讯录,很多人的第一反应就是打开云同步开关。没错,小米云盘备份联系人的核心路径,确实是基于小米云服务的“同步联系人”功能。但想让整个过程真正做到无缝、可靠,里头还有些细节值得琢磨。 简单来说,当你在一部已登录小米账号的手机上,进入「设置」→

热心网友
05.09
小米云服务登录能否使用微信快捷登录
电脑教程
小米云服务登录能否使用微信快捷登录

小米云盘支持微信快捷登录吗?深度解析操作与细节 答案是肯定的。目前,小米云盘确实接入了微信快捷登录。用户在App或网页端的登录界面,找到“第三方账号登录”选项,点击微信图标,经过简单的授权确认,就能完成身份验证。整个过程无需反复输入手机号和密码,对于经常在多设备间切换的用户来说,便捷性的提升是实实在

热心网友
05.09
Cinema 4D树叶模型贴图添加详细步骤教程
电脑教程
Cinema 4D树叶模型贴图添加详细步骤教程

给树叶“穿上”逼真外衣:C4D模型贴图全流程解析 MAXON Cinema 4D 在三维建模领域的受欢迎程度不言而喻,尤其在进行有机形态创作时,其灵活性备受青睐。不过,很多朋友在为一个变形后的树叶模型添加贴图时,常会碰到贴图错位、拉伸的尴尬情况。这到底是怎么回事,又该如何解决?下面,我们就通过一个完

热心网友
05.09
iOS15微信来电铃声设置教程与自定义方法
电脑教程
iOS15微信来电铃声设置教程与自定义方法

iOS 15微信通话铃声设置全攻略:告别默认提示音 在iOS 15上想让微信语音视频通话的铃声与众不同?其实方法比想象中直接——这事儿不靠系统电话设置,也无需借助第三方快捷指令。一切操作,都在微信的“新消息通知”设置里完成。具体路径很清晰:打开微信,进入「我 → 设置 → 新消息通知」,先确保「语音

热心网友
05.09
红米K20 Pro微信小窗模式开启与使用教程
电脑教程
红米K20 Pro微信小窗模式开启与使用教程

红米K20 Pro微信小窗模式全指南:无需折腾的免提多任务方案 想一边刷资讯、看视频,一边随时回复微信消息?对于红米K20 Pro的用户来说,这事儿根本不用等系统更新,也无需下载任何第三方插件。它出厂就自带了一套相当成熟的微信小窗解决方案,完美集成在MIUI 11及后续版本中。无论是快速回复消息,还

热心网友
05.09