前端部署平台 Vercel 正式推出了 Agent Browser——这是一款面向 AI 代理的浏览器自动化命令行工具(CLI),首次让大语言模型实现了“不仅能读懂网页内容,更能直接操控页面”的突破性能力。
Agent Browser 的核心优势在于极其简单的上手体验:无需手动部署浏览器驱动,也无需配置复杂的运行环境,真正做到了开箱即用。
开发者只需执行几条简洁的命令,即可驱动 AI 代理与真实网页进行深度交互。该工具提供双模式运行支持——既支持在带图形界面的浏览器中实时调试,直观追踪 AI 操作逻辑;也可切换至无头模式后台静默运行,高效完成批量任务,广泛应用于自动化测试、结构化数据抓取及端到端业务流程自动化等场景。

针对传统自动化框架(如 Playwright)在对接 AI 时普遍存在的上下文信息冗余、有效信息密度低、推理负担重等瓶颈,Agent Browser 进行了针对性重构。其序列化数据结构经过高度裁剪,可剔除高达 93% 的非关键信息,仅保留核心 DOM 节点与可交互元素,显著提升 AI 的理解效率与操作精度。
此外,工具底层由 Rust 语言构建,在启动速度、内存占用及运行稳定性方面全面优于基于 Node.js 或 Python 的传统方案。
Agent Browser 目前已原生适配 Claude Code、Gemini、Cursor、GitHub Copilot、Codex、opencode 等主流 AI 编程助手,并可在任意支持 Bash 命令的操作系统上无缝运行。
源码下载
