CLI结合Skill搭建浏览器AI自动化框架，告别重复工作

时间：2026-06-09 15:35

基于PlaywrightCLI与Skill的浏览器AI自动化框架，用自然语言即可操作。相比传统MCP方案，Token消耗减少约4倍。固定工作流可沉淀为Skill，甚至编写脚本实现0Token全自动运行，适用于抓取评论、自动发文与Web测试等任务。

先说一个核心结论：这套浏览器自动化工作流，能够借助AI帮你完成浏览器中所有重复性的机械操作，并且Token消耗极低。某些固定流程甚至无需AI参与，实现0 Token全自动运行。例如，0 Token抓取电商评论并导出CSV、自动将Markdown文章发布到X平台、对自己的Web应用进行自动化测试。你完全无需了解浏览器底层原理，仅用自然语言就能轻松搞定。

这里使用的Agent框架是Claude Code或Codex，浏览器自动化方案则采用微软在2025年初开源的Playwright CLI，再配合相应的Skill。实测表明，Playwright CLI相比传统的Playwright MCP方案，Token消耗大约能减少4倍——这才是真正的按需加载，而非一股脑将所有内容塞入上下文。

工具搭建完成后，你可以将固定工作流程沉淀为Skills，让AI既快速又省力地完成任务。熟练之后你会发现，很多流程根本不需要AI参与，只需让AI编写一个固定脚本，就能以0 Token全自动运行。现在直接开始实操。

基础使用

开始之前，请确保电脑已安装Node.js。如果尚未安装，请前往Node.js官网下载对应操作系统的安装包。然后打开命令行终端，输入命令安装Playwright CLI。安装完成后，确认电脑上已安装Chrome浏览器（Edge也可以，但推荐Chrome）。至此，准备工作全部就绪。

来测试一下：运行playwright-cli open google.com --headed，最后一个参数--headed表示使用有头浏览器（能看到界面），不加此参数则默认无头浏览器静默运行，适合生产环境。回车后，Playwright CLI会自动操作Chrome打开谷歌首页。

注意观察控制台输出——Playwright CLI只返回了一个简洁的网页摘要，而非整个网页的DOM结构。下面附带了一个快照文件地址，AI Agent如果需要更详细的结构信息，可以选择读取这个文件；如果不需要，就不读取。这正是相比MCP更省Token的关键：按需加载，而非全量塞入。同理，截图命令playwright-cli screenshot也是将PNG图片存储到本地磁盘，由AI决定是否读取，而不是直接塞进上下文。

还有一个重要参数：--persistent。它会将Cookie、登录状态、本地存储等数据写入磁盘，下次复用，无需重新登录。例如，带上--persistent打开谷歌，已登录的状态会自动恢复。

Playwright CLI的基础使用就介绍到这里，接下来将其接入AI Agent。

Playwright CLI是一个全新的命令行工具，AI并不了解如何使用这些命令，因此需要搭配Skills（即说明文档）。CLI加Skills搭配使用，就能取代传统的MCP方式，这也是当前的技术趋势。新建一个项目文件夹，打开终端，在文件夹中运行playwright-cli install --skills，Skills便会安装到项目目录下。然后启动Claude Code，询问它有哪些Skills，它就能正确读取Playwright CLI技能，接入成功。

对于另一个Agent框架Codex，只需将存放Skills的文件夹名称从.claude改为.codex即可适配。在Codex中输入/skills，就能看到Playwright CLI，配置完成。测试一下：让Codex使用Playwright CLI打开Grok，询问今天青岛天气如何——AI成功打开浏览器，自动输入问题、点击回车，获取结果并打印到控制台。

进阶实战

来看一个更复杂的例子：使用Playwright CLI查看某商品的前100条评论，并将其保存为CSV文件。AI会先学习Playwright CLI技能，然后打开商品页面。初次运行总会有些磕绊，没关系，让它自己探索，自己寻找解决思路。这个过程会消耗不少Token（例如使用了41%的上下文窗口），但最终成功抓取到100条数据并保存为CSV。

有两种方式可以将流程总结固化，使下次执行更省Token。第一种：让AI将整个过程保存成一个Skill。输入提示词：“创建一个新的Skill，将刚才打开网站、查看评论、保存评论的全过程以及遇到的坑都提炼出来，保存到Skills里，以后只要让你保存评论，你就能调用这个Skill完成任务。” AI帮助我们创建了Skill，将可复用的内容固化到知识库中。然后指定放在项目目录下。现在项目中有两个Skill：一个Playwright CLI，一个评论保存流程。清理上下文后，用相同任务测试——有了Skills指导，AI充分吸取经验，没有多余动作，没有报错，仅使用了5%的上下文就完美完成任务，效率提升了近10倍。

抓取评论是固定流程，其实无需AI智能化控制，可以直接编写成固定脚本。让Codex将刚才所有Playwright CLI命令汇总成一个脚本，执行就能获取前100条评论并保存为CSV，每一步都有合理延时。很快Codex就写好了脚本并自测通过。在Windows电脑上是一个PowerShell脚本，内容包含：打开商品页面、确认URL、点击查看评价按钮、执行JS获取评论、保存CSV。直接运行脚本，0 Token、0成本完成任务，效果相同。

总结这套浏览器自动化流程：第一步安装Node.js、Playwright CLI和Chrome；第二步选择AI Agent工具，安装Playwright CLI的Skill；第三步给AI一个复杂任务，让它自己摸索执行；第四步让AI将执行结果提炼总结成Skill，避免重复踩坑；第五步重试相同任务，Token消耗降低10倍；如果是完全固定的流程，还可以进行第六步，让AI直接编写脚本，以0 Token运行任务。

自动发文

再看一个实战案例：将视频内容转为图文教程，发布到各平台。X平台发布文章的步骤特别繁琐——Markdown格式粘贴会错乱且图片不显示，HTML格式能粘贴但图片变成照相机小图标，需要手动删除占位符再一张张粘贴图片。我们用前面的自动化流程来解决。先让Codex编写一个Python脚本：将文章中的图片下载到本地并从001编号，转换成使用本地图片的Markdown，再运行Pandoc转成HTML（每张图独立段落）。脚本编写并运行成功，images文件夹里是本地图片，HTML文件也已生成。

然后让AI用Playwright CLI自动发文：先打开X网站创建新文章，粘贴HTML内容，找到所有照相机小图标的位置，按退格键删除，再从图片文件夹中按顺序复制粘贴图片。AI开始一张张自动替换，过程非常顺畅。让AI将从头全流程整理成一个Skill放到项目目录，以后只要给一个文章路径就能自动发布。AI生成了Skill和配套脚本，覆盖自动发稿全流程。以后只需说“使用这个Skill自动发布”即可。

AI 自动化测试

这套流程的重要应用是对自己开发的Web应用进行自动化测试。例如，有一个简历润色美化的网页APP，输入指令：“阅读代码，将注册开始的主体流程写一份中文测试文档，再用Playwright CLI打开网页，根据测试用例完成测试。” AI通过阅读代码了解项目功能，确认主体流程，编写测试文档（第一步做什么、第二步做什么……），然后使用Playwright CLI打开浏览器，自动点击注册、创建测试账号、登录、创建测试简历并上传，完成主体流程测试，结论通过。

也可以要求AI编写更多测试用例，用Playwright CLI全自动测试，还能配合定时任务框架（如OpenClaw）定期测试系统。一旦修改出Bug，AI就能自动发现并通知你，省去大量人工测试成本，对开发Web应用会很有帮助。

好了，这就是本期内容的全部了。感谢大家的支持，我们下期再见。

来源：https://blog.csdn.net/techshrimp/article/details/160117376

skill

上一篇普通人低成本做AI视频实测Veo 3.1一条仅1元 下一篇ComfyUI 0.24.0更新：接入Ideogram 4，修复多GPU与精度问题

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

AI教程 · 2026-06-29

Windows Docker Desktop RabbitMQ生产级部署完整指南

前言在 Windows 本地开发环境中，直接安装 RabbitMQ 确实颇为周折：需要单独配置 Erlang 运行环境、手动管理环境变量、服务启停全凭手工操作。更令人困扰的是，版本兼容冲突、端口占用、环境不一致等问题层出不穷。笔者见过不少开发者为搭建环境就得耗费整整半天时间。相比之下，借助 Do

AI教程 · 2026-06-29

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践

先分享一个切实感受。过去两年，我们与福建制造企业合作较为频繁，发现一个非常突出的现象：超过80%的企业官网，产品参数仍然存放在PDF或图片中。AI爬虫？根本无法抓取。这些企业技术实力不弱、资质证照齐全、应用案例也丰富，但在AI搜索这一全新战场上，它们几乎处于隐身状态。一、一个正在发生的行业变化 A

AI教程 · 2026-06-29

阿里云Token Plan团队版功能价格与省钱购买指南

阿里云百炼近期推出了名为“Token Plan 团队版”的全新服务，这一服务专为企业与开发者量身打造，定位为AI大模型订阅平台。通过引入Credits作为统一计量单位，将文本生成、图像生成等多模态AI能力纳入单一计费体系，同时无缝兼容主流AI编程工具及智能体（Agent）生态系统。其核心亮点包括：全

AI教程 · 2026-06-29

阿里云物联网.NET Core客户端位置信息上报

阿里云物联网平台的位置服务并非一个完全独立的功能模块。位置信息可包含二维坐标与三维坐标，而位置数据的来源本质上是借助设备属性进行上传。换言之，若要让设备上报位置，您需先将其视为一个普通属性进行处理。 1）添加二维位置数据操作过程十分简洁。进入数据分析 → 空间数据可视化 → 二维数据，点击添加，将

AI教程 · 2026-06-29

年阿里云服务器选型配置与网站部署全攻略

2026年，阿里云服务器生态已高度成熟，形成了清晰的轻量应用服务器与ECS云服务器两大产品阵营。无论你是计划搭建个人博客、企业官网，还是运营电商平台、进行应用开发，基本都能找到理想的解决方案。本指南将从服务器选型、配置选择、部署流程到安全运维，系统梳理2026年最实用的操作要点，帮助你少走弯路，让网