游乐游手机版
首页/业界动态/文章详情

谷歌开源Agent Skill工具集打通云库引擎AI助力开发者

时间:2026-05-24 14:02
上周五,OpenAI发布GPT-5 5与DeepSeek推出V4模型几乎同时上演,大模型市场的竞争正进入白热化阶段。面对竞争对手的快速迭代,谷歌生态的技术从业者正在积极寻找应对之道——越来越多的人开始借助智能体(Agent)来构建和优化基于谷歌云平台的应用,从Firebase、Gemini API到

上周五,OpenAI发布GPT-5.5与DeepSeek推出V4模型几乎同时上演,大模型市场的竞争正进入白热化阶段。面对竞争对手的快速迭代,谷歌生态的技术从业者正在积极寻找应对之道——越来越多的人开始借助智能体(Agent)来构建和优化基于谷歌云平台的应用,从Firebase、Gemini API到BigQuery和Google Kubernetes Engine(GKE)。

但值得注意的是,在竞争日益激烈、技术快速演进的背景下,一个关键问题变得尤为突出:如何确保AI模型掌握关于这些技术准确、最新的信息?

在实际开发中,这个问题的棘手程度远超想象。开发者往往需要为每个云服务编写适配器,将API调用封装为智能体可调用的工具函数,然后反复调试模型是否正确调用了工具、传入了正确参数。更麻烦的是,一旦底层服务API发生变化,所有适配器都需要手动更新。这不仅是重复劳动,更是一种隐性的技术债。

为了解决这个问题,谷歌为开发者文档提供了模型上下文协议(Model Context Protocol, MCP)服务器,让智能体能够连接到可靠的实时信息源。但随之而来的,是一个被称为“上下文膨胀”(Context Inflation)的新挑战。

MCP服务器的核心价值在于为模型提供即时的外部信息,但它自身也有局限性:当智能体大规模使用MCP服务器时,大量上下文信息会被不加区分地加载到模型的上下文窗口中。这种做法带来两个严重后果:其一,过多的信息会使模型混乱,降低推理质量——这一问题在企业实践中已被反复验证,有团队发现智能体在每次调用时加载1.5万个tokens的指令,几乎不给实际需要处理的内容留下任何上下文空间;其二,上下文窗口的每一次填充都会转化为实实在在的Token成本,随着调用量增长,开销曲线会变得难以忽视。

面对这一困境,业界迫切需要一种更精细的信息供给方式——既能让智能体获得所需的专业知识,又不至于被冗余信息淹没。这正是Agent Skills应运而生的背景。

谷歌最新Skill仓库正式上线

那么,究竟什么是Agent的Skills?根据最新定义,Skill是一种“简单开放的格式,用于赋予智能体新的能力和专业知识”。我们可以将其理解为针对特定技术或任务的精简的、以智能体为中心的文档。

Skills的设计哲学可以用两句话概括:用Markdown编写,保持轻量;按需加载,避免冗余。每一份Skill文件可以包含参考文档、代码片段和其他资源,智能体仅在需要时才加载相关信息,从而大大降低了上下文信息过载的风险。

从技术定位来看,Skills占据了一个独特的位置。它在传统提示(Prompt)之上——因为Skills是可复用的、持久的;比微调(Fine-tuning)更轻——因为它能以业务逻辑的速度迭代;比RAG(检索增强生成)更主动——它不是被动的信息检索,而是主动的专业知识注入;比普通工具(Tools)更丰富——因为它不仅编码了“做什么”,还编码了“怎么做”和“为什么这么做”。

在Google Cloud Next 2026大会的第一天,谷歌正式宣布推出Google最新Agent Skills仓库。这一消息被认为是本届大会最具实用价值的发布之一。

该代码库包含十三项技能,涵盖谷歌云最核心的服务:AlloyDB、BigQuery、Cloud Run、Cloud SQL、Firebase、Gemini API和Google Kubernetes Engine(GKE)。这些技能帮助智能体理解如何创建、查询和管理云资源,是Agent操作谷歌云基础设施的能力基础。

还包括三大架构支柱技能:

安全性(Security):让智能体理解云安全最佳实践,包括身份与访问管理、数据加密和威胁防护。

可靠性(Reliability):涵盖高可用架构设计、容错机制和灾难恢复策略。

成本优化(Cost Optimization):指导智能体在架构决策中考虑资源效率与成本控制。

这三大支柱技能的重点不在于教会智能体调用某个具体API,而是让它理解云系统设计的原则与决策逻辑,从而在更高层面提升应用质量。

此外,仓库还提供了三项面向常见任务的流程指南:Google Cloud入门(Onboarding to Google Cloud)、身份验证(Authenticating to Google Cloud)和网络可观测性(Google Cloud Network Observability)。这些“秘诀”将日常操作拆解为可执行的步骤,让智能体能够按照既定流程完成特定工作。

Agent Skill到底有什么用?

要理解Agent Skills的真正价值,不妨回到真实开发场景。在2026年的今天,构建Agent的实际情况与演示截然不同:开发者花费大量时间编写和维护工具适配器——一位构建文档处理智能体的开发者透露,她用于维护适配器的时间已经超过了构建智能体逻辑本身的时间。

Skills仓库正是为了解决这一痛点而生。最新Skills经过针对实际模型的测试和优化,谷歌已验证其能在Gemini上可靠运行;同时,Skills兼容MCP标准,可以跨平台使用,不限于Vertex AI;当底层云API发生变化时,谷歌会负责更新相应技能,开发者无需自行维护;此外,Skills直接使用开发者已有的GCP凭证,无需编写额外的认证代码。

在兼容性方面,Skills展示出极强的跨平台能力。通过npx skills install github.com/google/skills命令,开发者可以将这些技能安装到多种智能体平台中,包括Antigra vity、Gemini CLI,以及Claude Code、Cursor等第三方智能体工具。

近期发布的Antigra vity平台已经深度整合了Skills体系,支持通过规则(Rules)、技能(Skills)和工作流(Workflows)三个层级,将通用智能体转变为专业、稳健且高效的工作伙伴。同时,Gemini CLI也通过更新内置了对Skills的原生支持,让开发者可以在命令行环境中直接调用专业化技能。

再来看个具体的例子,每个Skill都包含:经过实际模型测试——不仅仅是“这里有一个函数”,而是经过优化的描述,这些描述已由谷歌验证,可与Gemini稳定兼容。兼容MCP——符合模型上下文协议 (MCP) 标准,因此可跨平台运行,而不仅限于Vertex AI。版本控制和维护——当底层云API发生变更时,谷歌会更新技能,无需用户亲自动手了。预认证——使用现有的GCP凭据,无需自定义授权码。

例如,BigQuery技能在实践中看起来是这样的:

对比一下没使用该技能时要写的东西:

每个项目可能大概要写四到十个这样的工具代码。而技能库可以帮你省去所有这些代码。

事实上,早在谷歌发布这款最新Agent Skill库之前,谷歌云AI总监、Gemini工程负责人Addy Osmani在领英上宣布开源了一款Agent Skills库:为AI编码智能体打造的19项工程技能 + 7条命令,灵感源自Google最佳实践。

他在文章中写道:“我们知道AI编码智能体很强大。但如果任由它们自由发挥,它们就会走捷径——跳过规格说明、跳过测试、跳过安全审查。它们会更倾向于追求‘完成’而非‘正确’。这就是我构建Agent Skills的原因。每一项技能都编码了资深工程师实际使用的工作流、质量关卡和最佳实践:编码前先制定规格、合并前先进行测试、优化前先进行测量。这些内容被打包好,让你的智能体能够始终如一地遵循。”

完整的生命周期覆盖:

→ Define(定义)——在写第一行代码之前,先打磨想法、撰写规格说明

→ Plan(规划)——分解为小而可验证的任务

→ Build(构建)——增量式实现、上下文工程、清晰的API设计、测试驱动开发(TDD)

→ Verify(验证)——使用DevTools进行浏览器测试、系统化调试

→ Review(审查)——代码质量、安全加固、性能优化

→ Ship(交付)——Git工作流、CI/CD、架构决策记录(ADR)、发布前检查清单

这些技能兼容Claude Code、Cursor、Antigra vity,以及任何接受Markdown指令的智能体。Addy Osmani的这款Agent Skills代码库把谷歌资深工程师的工作习惯,拆成20个可组合的Skill,约束AI每一步都按工程规范干活。目前,Addy Osmani的开源项目已经在Github上获得近2.4万star。

那么,这两款都出自谷歌的Agent Skills代码库有何不同,分别解决什么问题?

Osmani的项目解决的是“如何正确地构建”的问题——它是一套确保智能体编码行为符合专业标准的通用工程纪律框架。无论你使用哪个云平台、开发什么类型的软件,这套技能都能指导你的智能体遵循规格驱动开发、增量式实现、测试优先等专业实践。

谷歌最新开源的Agent Skills仓库解决的则是“构建什么以及如何操作”的问题——它提供的是针对特定技术栈(Google Cloud)的具体操作知识。当智能体需要创建BigQuery数据集、配置GKE集群或设计Cloud Run服务时,最新技能将提供准确的、经过验证的指令。

在实际使用中,两者可以并存于同一个智能体环境中:Osmani的技能包用于规范智能体的整体开发行为,而Google最新技能库则在智能体需要与Google Cloud服务交互时提供精准的操作知识。

这两个项目的先后出现,印证了Google在Skills领域的独特布局策略:既拥抱个人驱动的开源创新,又通过最新仓库为整个生态提供标准化的知识基础设施。这种“个人 - 最新”的双轨模式,或许正是技能成为“智能体工作流公认抽象层”的关键一步。

对于开发者而言,这意味着你既可以借助Osmani的技能包让智能体像资深工程师一样严谨工作,又可以借助最新技能仓库让智能体准确无误地操作Google Cloud服务——两者协同,构成了一个既遵守工程纪律又掌握专业知识的人工智能“超级员工”。

来源:https://36kr.com/p/3784801777032201
上一篇MOBA新版本翻盘机制解析:灵魂瓮动态引导与中BOSS开局策略 下一篇智平方开源具身智能大脑重新定义行业范式
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
长安汽车明年一季度发布首款车载人形机器人小安
业界动态 · 2026-06-29

长安汽车明年一季度发布首款车载人形机器人小安

长安汽车公布机器人战略,采用“1+N+X”布局,联合头部伙伴攻克大脑、能源、驱动技术。人形机器人“小安”身高169cm,体重69kg,移动速度0 8m s,具备40个自由度,续航超2小时。预计明年一季度发布首款车载组件机器人,已在广州车展展示。

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影
业界动态 · 2026-06-29

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影

3月25日,光通信领域迎来又一个里程碑:中国信科集团光通信技术和网络全国重点实验室联合鹏城实验室、烽火藤仓光纤科技有限公司,成功实现了2 5Pb s 24芯光纤超大容量实时光传输,再次刷新了世界纪录。 这一研究成果不仅入选国际顶级光通信会议OFC(2026)并荣获“高分论文”称号,还受国际权威SCI

美国调查18万辆特斯拉Model3车门应急释放装置易找性
业界动态 · 2026-06-29

美国调查18万辆特斯拉Model3车门应急释放装置易找性

美国国家公路交通安全管理局对约17 9万辆2024款特斯拉Model3启动缺陷调查,焦点在于车门应急释放装置是否不易找到且标识不清。该调查源于一份缺陷请愿,不意味着立即召回,但可能引发后续监管措施。

doc个人图书馆停服 创始人称无偿转让失败
业界动态 · 2026-06-29

doc个人图书馆停服 创始人称无偿转让失败

运营长达20年,累计服务8000万用户的360doc个人图书馆,最终还是迎来了谢幕时刻。2026年5月1日,这个承载着无数用户收藏记忆的知名平台将正式停止服务——关停原因并非用户流失,而是始终未能寻得一位能够安全接管的合适人选。 创始人蔡智在告别信中坦言,近两个月来,他一直在尝试将360doc无偿转

年Q1随身WiFi实测安全靠谱高性价比机型推荐
业界动态 · 2026-06-29

年Q1随身WiFi实测安全靠谱高性价比机型推荐

2025年10月,艾瑞咨询正式授予飞猫“AI WiFi品类开创者”认证,紧接着CIC也将其认定为“多网融合自由切换技术服务首创者”。这些权威认证背后,折射出一个清晰的市场趋势:移动办公、户外出行、宿舍上网等场景的需求正在快速增长,随身WiFi几乎已成为不少用户的刚需装备。但问题也随之而来——网络卡顿