谷歌开源Agent Skill工具集打通云库引擎AI助力开发者

时间：2026-05-24 14:02

上周五，OpenAI发布GPT-5 5与DeepSeek推出V4模型几乎同时上演，大模型市场的竞争正进入白热化阶段。面对竞争对手的快速迭代，谷歌生态的技术从业者正在积极寻找应对之道——越来越多的人开始借助智能体（Agent）来构建和优化基于谷歌云平台的应用，从Firebase、Gemini API到

上周五，OpenAI发布GPT-5.5与DeepSeek推出V4模型几乎同时上演，大模型市场的竞争正进入白热化阶段。面对竞争对手的快速迭代，谷歌生态的技术从业者正在积极寻找应对之道——越来越多的人开始借助智能体（Agent）来构建和优化基于谷歌云平台的应用，从Firebase、Gemini API到BigQuery和Google Kubernetes Engine（GKE）。

但值得注意的是，在竞争日益激烈、技术快速演进的背景下，一个关键问题变得尤为突出：如何确保AI模型掌握关于这些技术准确、最新的信息？

在实际开发中，这个问题的棘手程度远超想象。开发者往往需要为每个云服务编写适配器，将API调用封装为智能体可调用的工具函数，然后反复调试模型是否正确调用了工具、传入了正确参数。更麻烦的是，一旦底层服务API发生变化，所有适配器都需要手动更新。这不仅是重复劳动，更是一种隐性的技术债。

为了解决这个问题，谷歌为开发者文档提供了模型上下文协议（Model Context Protocol， MCP）服务器，让智能体能够连接到可靠的实时信息源。但随之而来的，是一个被称为“上下文膨胀”（Context Inflation）的新挑战。

MCP服务器的核心价值在于为模型提供即时的外部信息，但它自身也有局限性：当智能体大规模使用MCP服务器时，大量上下文信息会被不加区分地加载到模型的上下文窗口中。这种做法带来两个严重后果：其一，过多的信息会使模型混乱，降低推理质量——这一问题在企业实践中已被反复验证，有团队发现智能体在每次调用时加载1.5万个tokens的指令，几乎不给实际需要处理的内容留下任何上下文空间；其二，上下文窗口的每一次填充都会转化为实实在在的Token成本，随着调用量增长，开销曲线会变得难以忽视。

面对这一困境，业界迫切需要一种更精细的信息供给方式——既能让智能体获得所需的专业知识，又不至于被冗余信息淹没。这正是Agent Skills应运而生的背景。

谷歌最新Skill仓库正式上线

那么，究竟什么是Agent的Skills？根据最新定义，Skill是一种“简单开放的格式，用于赋予智能体新的能力和专业知识”。我们可以将其理解为针对特定技术或任务的精简的、以智能体为中心的文档。

Skills的设计哲学可以用两句话概括：用Markdown编写，保持轻量；按需加载，避免冗余。每一份Skill文件可以包含参考文档、代码片段和其他资源，智能体仅在需要时才加载相关信息，从而大大降低了上下文信息过载的风险。

从技术定位来看，Skills占据了一个独特的位置。它在传统提示（Prompt）之上——因为Skills是可复用的、持久的；比微调（Fine-tuning）更轻——因为它能以业务逻辑的速度迭代；比RAG（检索增强生成）更主动——它不是被动的信息检索，而是主动的专业知识注入；比普通工具（Tools）更丰富——因为它不仅编码了“做什么”，还编码了“怎么做”和“为什么这么做”。

在Google Cloud Next 2026大会的第一天，谷歌正式宣布推出Google最新Agent Skills仓库。这一消息被认为是本届大会最具实用价值的发布之一。

该代码库包含十三项技能，涵盖谷歌云最核心的服务：AlloyDB、BigQuery、Cloud Run、Cloud SQL、Firebase、Gemini API和Google Kubernetes Engine（GKE）。这些技能帮助智能体理解如何创建、查询和管理云资源，是Agent操作谷歌云基础设施的能力基础。

还包括三大架构支柱技能：

安全性（Security）：让智能体理解云安全最佳实践，包括身份与访问管理、数据加密和威胁防护。

可靠性（Reliability）：涵盖高可用架构设计、容错机制和灾难恢复策略。

成本优化（Cost Optimization）：指导智能体在架构决策中考虑资源效率与成本控制。

这三大支柱技能的重点不在于教会智能体调用某个具体API，而是让它理解云系统设计的原则与决策逻辑，从而在更高层面提升应用质量。

此外，仓库还提供了三项面向常见任务的流程指南：Google Cloud入门（Onboarding to Google Cloud）、身份验证（Authenticating to Google Cloud）和网络可观测性（Google Cloud Network Observability）。这些“秘诀”将日常操作拆解为可执行的步骤，让智能体能够按照既定流程完成特定工作。

Agent Skill到底有什么用？

要理解Agent Skills的真正价值，不妨回到真实开发场景。在2026年的今天，构建Agent的实际情况与演示截然不同：开发者花费大量时间编写和维护工具适配器——一位构建文档处理智能体的开发者透露，她用于维护适配器的时间已经超过了构建智能体逻辑本身的时间。

Skills仓库正是为了解决这一痛点而生。最新Skills经过针对实际模型的测试和优化，谷歌已验证其能在Gemini上可靠运行；同时，Skills兼容MCP标准，可以跨平台使用，不限于Vertex AI；当底层云API发生变化时，谷歌会负责更新相应技能，开发者无需自行维护；此外，Skills直接使用开发者已有的GCP凭证，无需编写额外的认证代码。

在兼容性方面，Skills展示出极强的跨平台能力。通过npx skills install github.com/google/skills命令，开发者可以将这些技能安装到多种智能体平台中，包括Antigra vity、Gemini CLI，以及Claude Code、Cursor等第三方智能体工具。

近期发布的Antigra vity平台已经深度整合了Skills体系，支持通过规则（Rules）、技能（Skills）和工作流（Workflows）三个层级，将通用智能体转变为专业、稳健且高效的工作伙伴。同时，Gemini CLI也通过更新内置了对Skills的原生支持，让开发者可以在命令行环境中直接调用专业化技能。

再来看个具体的例子，每个Skill都包含：经过实际模型测试——不仅仅是“这里有一个函数”，而是经过优化的描述，这些描述已由谷歌验证，可与Gemini稳定兼容。兼容MCP——符合模型上下文协议 (MCP) 标准，因此可跨平台运行，而不仅限于Vertex AI。版本控制和维护——当底层云API发生变更时，谷歌会更新技能，无需用户亲自动手了。预认证——使用现有的GCP凭据，无需自定义授权码。

例如，BigQuery技能在实践中看起来是这样的：

对比一下没使用该技能时要写的东西：

每个项目可能大概要写四到十个这样的工具代码。而技能库可以帮你省去所有这些代码。

事实上，早在谷歌发布这款最新Agent Skill库之前，谷歌云AI总监、Gemini工程负责人Addy Osmani在领英上宣布开源了一款Agent Skills库：为AI编码智能体打造的19项工程技能 + 7条命令，灵感源自Google最佳实践。

他在文章中写道：“我们知道AI编码智能体很强大。但如果任由它们自由发挥，它们就会走捷径——跳过规格说明、跳过测试、跳过安全审查。它们会更倾向于追求‘完成’而非‘正确’。这就是我构建Agent Skills的原因。每一项技能都编码了资深工程师实际使用的工作流、质量关卡和最佳实践：编码前先制定规格、合并前先进行测试、优化前先进行测量。这些内容被打包好，让你的智能体能够始终如一地遵循。”

完整的生命周期覆盖：

→ Define（定义）——在写第一行代码之前，先打磨想法、撰写规格说明

→ Plan（规划）——分解为小而可验证的任务

→ Build（构建）——增量式实现、上下文工程、清晰的API设计、测试驱动开发（TDD）

→ Verify（验证）——使用DevTools进行浏览器测试、系统化调试

→ Review（审查）——代码质量、安全加固、性能优化

→ Ship（交付）——Git工作流、CI/CD、架构决策记录（ADR）、发布前检查清单

这些技能兼容Claude Code、Cursor、Antigra vity，以及任何接受Markdown指令的智能体。Addy Osmani的这款Agent Skills代码库把谷歌资深工程师的工作习惯，拆成20个可组合的Skill，约束AI每一步都按工程规范干活。目前，Addy Osmani的开源项目已经在Github上获得近2.4万star。

那么，这两款都出自谷歌的Agent Skills代码库有何不同，分别解决什么问题？

Osmani的项目解决的是“如何正确地构建”的问题——它是一套确保智能体编码行为符合专业标准的通用工程纪律框架。无论你使用哪个云平台、开发什么类型的软件，这套技能都能指导你的智能体遵循规格驱动开发、增量式实现、测试优先等专业实践。

谷歌最新开源的Agent Skills仓库解决的则是“构建什么以及如何操作”的问题——它提供的是针对特定技术栈（Google Cloud）的具体操作知识。当智能体需要创建BigQuery数据集、配置GKE集群或设计Cloud Run服务时，最新技能将提供准确的、经过验证的指令。

在实际使用中，两者可以并存于同一个智能体环境中：Osmani的技能包用于规范智能体的整体开发行为，而Google最新技能库则在智能体需要与Google Cloud服务交互时提供精准的操作知识。

这两个项目的先后出现，印证了Google在Skills领域的独特布局策略：既拥抱个人驱动的开源创新，又通过最新仓库为整个生态提供标准化的知识基础设施。这种“个人 - 最新”的双轨模式，或许正是技能成为“智能体工作流公认抽象层”的关键一步。

对于开发者而言，这意味着你既可以借助Osmani的技能包让智能体像资深工程师一样严谨工作，又可以借助最新技能仓库让智能体准确无误地操作Google Cloud服务——两者协同，构成了一个既遵守工程纪律又掌握专业知识的人工智能“超级员工”。

来源：https://36kr.com/p/3784801777032201

skill

上一篇MOBA新版本翻盘机制解析：灵魂瓮动态引导与中BOSS开局策略 下一篇智平方开源具身智能大脑重新定义行业范式

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。