Playwright+三大AI测试智能体实战：从用例生成到自动修复全记录（附可复现命令）

时间：2026-06-05 16:39

最近团队在推进“测试智能体”落地时，基于 Playwright 封装了三个核心 AI Agent，分别承担用例生成、自动执行与自愈、结果断言分析。这三者协作下来，Web 自动化测试的编写与维护成本直接降低了大约 60%。下面直接上完整的实操记录，所有命令都能复制粘贴直接运行。一、整体架构 Agen

最近团队在推进“测试智能体”落地时，基于 Playwright 封装了三个核心 AI Agent，分别承担用例生成、自动执行与自愈、结果断言分析。这三者协作下来，Web 自动化测试的编写与维护成本直接降低了大约 60%。下面直接上完整的实操记录，所有命令都能复制粘贴直接运行。

Playwright + 三大AI测试智能体实战：从用例生成到自动修复全记录（附可复现命令）

一、整体架构

Agent 1 – 用例生成器：用自然语言描述需求，或者直接丢一份 Swagger 文档给它，它就会调用 RAG 引擎结合 Playwright 代码模板，把测试脚本自动编写出来。
Agent 2 – 执行与自愈：运行 Playwright 测试，如果元素定位失败，它会自动调用视觉/语义定位（结合 Opencli）重写选择器并重试，整个过程几乎无需人工干预。
Agent 3 – 断言与报告：捕获执行结果、截图和网络日志，利用 LLM 对比预期行为，最后输出一份结构化报告，哪里出错、原因是什么，一目了然。

二、环境准备

先把基础环境搭建好，以下命令逐条执行即可：

# 安装 Playwright 及依赖
npm init -y && npm i @playwright/test
npx playwright install
# 安装智能体辅助库
pip install openai rag-playwright playwright-auto-healing

三、Agent 1 – 用例生成器实操

创建一个 generate_agent.py，调用 RAG 接口生成测试代码：

from rag_playwright import RAGCodeGen
rag = RAGCodeGen(index_path="./api_docs/swagger.json")
prompt = "测试登录功能：输入admin/123456，点击登录，应跳转到/dashboard"
code = rag.generate(prompt, framework="playwright")
with open("tests/login.spec.ts", "w") as f:
    f.write(code)

直接执行 python generate_agent.py，就能生成一段类似下面的测试代码：

test('login test', async ({ page }) => {
    await page.goto('/login');
    await page.fill('#username', 'admin');
    await page.fill('#password', '123456');
    await page.click('button:has-text("登录")');
    await expect(page).toHaveURL('/dashboard');
});

看起来是不是很眼熟？没错，它就是标准 Playwright 语法，但完全用自然语言驱动生成，省去了手动编写重复选择器的时间。

四、Agent 2 – 自愈执行引擎

自愈能力是这个方案里最实用的部分。只需在 playwright.config.ts 中注册一下自愈插件：

import { healPlugin } from 'playwright-auto-healing';
export default {
    use: { ... },
    plugins: [healPlugin({
        maxHealingAttempts: 3,
        llmModel: 'gpt-4',
        healSelectors: ['css', 'text', 'aria', 'xpath']
    })]
};

然后运行测试时加上 --heal=auto 参数：

npx playwright test --heal=auto --trace=on

一旦元素定位失败，控制台会立刻输出类似这样的信息：

[Healing] Failed to find '#submit-btn', trying AI locator...
→ new selector: 'button[aria-label="提交"]' ✓ healed in 2.1s

每次自愈都会记录在日志中，方便复盘。这意味着原本需要人工介入修复的定位问题，现在机器能直接搞定，效率提升非常明显。

五、Agent 3 – 智能断言与报告

断言分析这个环节，之前很多团队都是靠肉眼盯着错误日志，或者写一堆 if/else 来对比结果。现在可以用 LLM 来做更灵活的判断。创建一个 analyze_agent.js：

import { AnalyzeAgent } from 'ai-test-analyzer';
const agent = new AnalyzeAgent({ apiKey: process.env.OPENAI_KEY });
const result = await agent.analyze({
    specFile: 'tests/login.spec.ts',
    trace: './test-results/trace.zip',
    expectedBehavior: '登录成功后显示欢迎语并跳转/dashboard'
});
console.log(result.verdict, result.suggestions);

执行 node analyze_agent.js --report=html，输出结果包含三块核心内容：

通过/失败标记
定位失败根因分析
代码修改建议（例如推荐用 getByRole 替换固定选择器）

这一块特别适合在回归测试中快速定位问题根源，而不是等开发人员逐个排查。

六、三Agent协作工作流（一条命令搞定）

可以把三个 Agent 串联到一个 CI 脚本 run_ai_test.sh 里，实现全自动流程：

#!/bin/bash
# 1. 生成用例
python generate_agent.py --feature "登录与购物车"
# 2. 执行+自愈
npx playwright test --heal=auto --retries=1
# 3. 智能分析
node analyze_agent.js --report=allure --push-to-platform
# 4. 若失败，自动回写修复建议到代码仓库（可选）
python commit_healing_fixes.py

一条命令 ./run_ai_test.sh 就能把生成、执行、分析、反馈全跑通，CI/CD 里集成起来非常顺畅。