最近团队在推进“测试智能体”落地时,基于 Playwright 封装了三个核心 AI Agent,分别承担用例生成、自动执行与自愈、结果断言分析。这三者协作下来,Web 自动化测试的编写与维护成本直接降低了大约 60%。下面直接上完整的实操记录,所有命令都能复制粘贴直接运行。

一、整体架构
- Agent 1 – 用例生成器:用自然语言描述需求,或者直接丢一份 Swagger 文档给它,它就会调用 RAG 引擎结合 Playwright 代码模板,把测试脚本自动编写出来。
- Agent 2 – 执行与自愈:运行 Playwright 测试,如果元素定位失败,它会自动调用视觉/语义定位(结合 Opencli)重写选择器并重试,整个过程几乎无需人工干预。
- Agent 3 – 断言与报告:捕获执行结果、截图和网络日志,利用 LLM 对比预期行为,最后输出一份结构化报告,哪里出错、原因是什么,一目了然。
二、环境准备
先把基础环境搭建好,以下命令逐条执行即可:
# 安装 Playwright 及依赖
npm init -y && npm i @playwright/test
npx playwright install
# 安装智能体辅助库
pip install openai rag-playwright playwright-auto-healing
三、Agent 1 – 用例生成器实操
创建一个 generate_agent.py,调用 RAG 接口生成测试代码:
from rag_playwright import RAGCodeGen
rag = RAGCodeGen(index_path="./api_docs/swagger.json")
prompt = "测试登录功能:输入admin/123456,点击登录,应跳转到/dashboard"
code = rag.generate(prompt, framework="playwright")
with open("tests/login.spec.ts", "w") as f:
f.write(code)
直接执行 python generate_agent.py,就能生成一段类似下面的测试代码:
test('login test', async ({ page }) => {
await page.goto('/login');
await page.fill('#username', 'admin');
await page.fill('#password', '123456');
await page.click('button:has-text("登录")');
await expect(page).toHaveURL('/dashboard');
});
看起来是不是很眼熟?没错,它就是标准 Playwright 语法,但完全用自然语言驱动生成,省去了手动编写重复选择器的时间。
四、Agent 2 – 自愈执行引擎
自愈能力是这个方案里最实用的部分。只需在 playwright.config.ts 中注册一下自愈插件:
import { healPlugin } from 'playwright-auto-healing';
export default {
use: { ... },
plugins: [healPlugin({
maxHealingAttempts: 3,
llmModel: 'gpt-4',
healSelectors: ['css', 'text', 'aria', 'xpath']
})]
};
然后运行测试时加上 --heal=auto 参数:
npx playwright test --heal=auto --trace=on
一旦元素定位失败,控制台会立刻输出类似这样的信息:
[Healing] Failed to find '#submit-btn', trying AI locator...
→ new selector: 'button[aria-label="提交"]' ✓ healed in 2.1s
每次自愈都会记录在日志中,方便复盘。这意味着原本需要人工介入修复的定位问题,现在机器能直接搞定,效率提升非常明显。
五、Agent 3 – 智能断言与报告
断言分析这个环节,之前很多团队都是靠肉眼盯着错误日志,或者写一堆 if/else 来对比结果。现在可以用 LLM 来做更灵活的判断。创建一个 analyze_agent.js:
import { AnalyzeAgent } from 'ai-test-analyzer';
const agent = new AnalyzeAgent({ apiKey: process.env.OPENAI_KEY });
const result = await agent.analyze({
specFile: 'tests/login.spec.ts',
trace: './test-results/trace.zip',
expectedBehavior: '登录成功后显示欢迎语并跳转/dashboard'
});
console.log(result.verdict, result.suggestions);
执行 node analyze_agent.js --report=html,输出结果包含三块核心内容:
- 通过/失败标记
- 定位失败根因分析
- 代码修改建议(例如推荐用
getByRole替换固定选择器)
这一块特别适合在回归测试中快速定位问题根源,而不是等开发人员逐个排查。
六、三Agent协作工作流(一条命令搞定)
可以把三个 Agent 串联到一个 CI 脚本 run_ai_test.sh 里,实现全自动流程:
#!/bin/bash
# 1. 生成用例
python generate_agent.py --feature "登录与购物车"
# 2. 执行+自愈
npx playwright test --heal=auto --retries=1
# 3. 智能分析
node analyze_agent.js --report=allure --push-to-platform
# 4. 若失败,自动回写修复建议到代码仓库(可选)
python commit_healing_fixes.py
一条命令 ./run_ai_test.sh 就能把生成、执行、分析、反馈全跑通,CI/CD 里集成起来非常顺畅。
七、效果与思考
在测试管理平台中运行这个方案,针对 200 个高频回归场景做了实测:
- 用例编写时间从每条 15 分钟压缩到 3 分钟
- 自愈引擎让失败用例的人工介入率下降了 72%
- 智能断言的误报率控制在 5% 以下
必须提醒一点:不要太贪心,一次性把三个 Agent 全落地。最务实的做法是先上“执行+自愈”,因为这个环节问题最集中、价值最直接。等团队适应了自愈能力,再逐步接入用例生成和智能分析。所有命令和配置已经脱敏整理,拿过去就能直接用。
