先说一个核心观点:AI 生成测试脚本这件事,过去几年备受关注,但大多数工具要么仅仅停留在“将自然语言转换为简单的取值断言”阶段,要么生成的脚本可读性极差,导致维护成本居高不下。MiMo Code 的出现,至少在这个方向上迈出了实质性的一步——它不像传统的录制回放工具那样只能记录鼠标点击轨迹,而是试图深入理解业务语义,生成结构清晰、能够直接集成到 Playwright 或 Cypress 中的脚本。这对于那些编码经验有限但精通业务逻辑的测试人员来说,无疑是一次极大的能力释放。
第一步:清晰描述测试目标,避免模糊表达
MiMo Code 的输入机制非常直观——你需要用自然语言描述一个完整的操作流程。但这里有一个关键点:描述不能含糊。你写的内容越接近“用户操作说明书”,AI 解析的准确度就越高。
举个例子:“用户登录邮箱系统,输入正确的用户名和密码,点击登录按钮,成功跳转到收件箱页面,验证页面标题包含‘收件箱’”——这样的描述已经几乎可以直接作为控制台指令使用。相反,像“测试登录功能”或者“看看能不能进去”这类模糊表述,即使再强的 AI 也无法生成可靠的自动化测试脚本。
在描述中必须确保三大核心要素:前置条件(例如已打开的 URL)、操作步骤(最好附带元素定位线索,如按钮文字或输入框的提示文字)、预期结果(即断言的内容)。当这三个维度都覆盖到位,描述才算合格。
第二步:提交描述并选择技术栈
登录 MiMo Code 的 Web 控制台(或者集成 VS Code 插件后直接在编辑器内操作),将编写好的自然语言描述粘贴进去。在配置面板中,你需要指定目标框架,比如 Playwright TypeScript,以及运行环境——是运行在 Chrome、Firefox 还是模拟移动端场景。
系统接收到描述后,会自动解析其中的动词(如“点击”“输入”“等待”)、名词(如“按钮”“表单”“弹窗”)以及断言关键词(如“显示”“包含”“跳转到”)。这个过程本质上是将人类语言拆解成程序可以理解的逻辑单元。
如果需要提高精度,还可以补充上下文信息。例如,“该登录页的 URL 是 https://mail.example.com/login”这样 AI 生成的导航代码就不会猜错地址。此外,生成之前可以勾选“启用智能重试”或“添加截图日志”等选项,这些功能旨在增强脚本在真实环境中的健壮性,也方便后续调试。
第三步:人工审查,这一步不可跳过
AI 生成的脚本可读性确实不错,但有一条原则必须坚持:人工审核绝不能省略。尤其是动态元素、异步加载、权限状态等场景,AI 往往容易忽略实际应用中的复杂细节。
审核时需要重点关注三个方面。第一,检查选择器的稳定性——优先使用 aria-label 或 data-testid 这类语义化属性,避免使用容易变动的 class 名或 XPath。第二,验证等待逻辑——AI 可能会插入 page.waitForURL(),但在复杂的 SPA 应用中,更推荐改用 expect(page).toHaveTitle() 或者 expect(locator).toBeVisible()。第三,不要遗漏异常路径——例如“输入错误密码,然后验证是否显示‘用户名或密码错误’提示”。这需要额外提供描述,让 MiMo Code 生成对应的分支用例。
第四步:集成到 CI/CD 并持续优化提示词
将生成的脚本保存为标准测试文件(例如 login.spec.ts),纳入 Git 仓库管理。然后配置 GitHub Actions 或 Jenkins,让脚本自动定期执行。
第一次运行时如果失败,十有八九不要急于修改脚本——先回头审视原始描述。经验表明,90% 的问题源于初始描述中遗漏了状态或交互细节。调整描述后重新生成,往往比手动修改脚本更高效。
另外,还有一个实用技巧:团队内部可以建立“提示词模板库”。例如“注册流程模板”“支付成功后跳转模板”,统一表述习惯。这样每次生成的脚本质量更稳定,团队的协作效率也会明显提升。别忘了定期使用新版本的 MiMo Code 重新生成旧用例——模型迭代后,其对选择器和断言的处理能力可能已经大幅优化。
