微软开源Webwright智能体实现代码式网页自动化
微软研究院近日正式开源了一款创新的网页智能体框架——Webwright。该框架采用了一种突破性的设计思路:它摒弃了当前主流的“视觉识别-点击DOM元素”的交互模式,转而让AI模型直接在终端环境中编写Playwright自动化脚本并执行Bash命令,通过更高效、更具逻辑性的编程方式来执行复杂的网页操作任务。

为何智能体需要从“点击操作”转向“代码生成”?
目前,大多数网页自动化智能体的工作模式,是持续预测下一个交互动作,例如“点击哪个坐标”、“滚动多少像素”或“输入什么文本”。这种方法不仅执行效率较低,而且在处理多步骤任务时难以保持稳定的状态。相比之下,Webwright所采用的代码驱动范式,展现出多方面的显著优势:
脚本可复用性高: 每次任务执行后生成的是一段完整的、可重复使用的Playwright脚本(类似于RPA机器人流程自动化脚本),而非一次性的点击序列。这些标准化脚本未来可直接被Claude Code、GitHub Copilot等代码生成工具调用与集成。
复杂逻辑处理能力强: 代码天然支持循环、条件分支、函数封装等编程结构。对于需要处理表单填写、多页面导航、条件判断等长链条任务场景,代码的表达能力与灵活性远胜于简单的动作堆叠。
具备工程化的错误修复流程: 当脚本执行出现错误时,模型能够自动解析错误堆栈信息,并进入“编码-运行-报错-调试”的迭代循环。这套自我修正机制显著提升了任务执行的最终成功率与鲁棒性。
核心技术突破:有效应对“伪成功”与“上下文膨胀”难题
针对网页智能体长期存在的两大挑战——误判任务完成(伪成功)与长上下文信息过载,Webwright框架引入了针对性的工程解决方案:
门控自检机制: 该机制旨在防止模型产生“任务已完成”的幻觉判断。其流程是:模型必须先生成一份“自检验证配置”,随后在一个全新的隔离环境中运行最终脚本,并通过预设的检查点进行结果验证。只有经过自我反思并确认目标达成后,系统才会输出任务完成标志。
历史对话压缩技术: 为解决长周期任务导致的上下文令牌膨胀问题,系统每执行20个步骤,便会自动将之前的对话历史压缩成一段精炼的进度摘要。这确保了模型的注意力始终聚焦于当前最核心的任务状态与后续步骤。
基准测试表现:性能大幅领先行业基准
根据2026年5月公布的基准测试结果,Webwright框架在多项评测中均取得了卓越成绩:
Online-Mind2Web基准测试: 基于GPT-5.4模型的Webwright,在100步的操作预算限制下,实现了86.67%的任务准确率,在同期开源网页智能体解决方案中排名领先。
Odysseys(长链路复杂任务)基准测试: 面对平均指令长度达272个单词的复杂场景,Webwright结合GPT-5.4取得了60.1%的综合得分。这一成绩相较于基础版GPT-5.4(33.5%)实现了约81.5%的性能飞跃,并且超越了同年4月榜单的冠军模型Opus4.6(44.5%)。
行业影响与未来展望
Webwright的出现标志着一个重要趋势:随着大模型代码生成能力的持续进化,智能体正逐步向“开发者范式”演进。它不再将浏览器视为简单的图形交互界面,而是将其作为一个可编程的端点来对待。这种根本性的视角转换,成功地将AI执行网页任务的效率、可靠性与可扩展性提升至新的高度。
对于开发者和企业而言,Webwright不仅是一个先进的网页自动化框架,更如同一位能够自动编写、调试、维护并打包自动化脚本的“AI工程师助手”。该项目代码已在GitHub平台全面开源,为社区提供了构建下一代网页智能体的强大基础设施。
相关攻略
微软研究院近日正式开源了一款创新的网页智能体框架——Webwright。该框架采用了一种突破性的设计思路:它摒弃了当前主流的“视觉识别-点击DOM元素”的交互模式,转而让AI模型直接在终端环境中编写Playwright自动化脚本并执行Bash命令,通过更高效、更具逻辑性的编程方式来执行复杂的网页操作
AI工程中心剖析:今日可复刻的10个智能体项目 理论学习固然重要,但智能体工程的精髓在于动手。如果你想真正掌握它,最佳路径不是阅读,而是实践——复刻(fork)真实的项目仓库,在本地运行它们,并根据自己的需求进行修改。这才是知识内化的关键。下面精选的10个项目,既有实用价值又广受社区认可,它们清晰地
知名黑客乔治·霍茨警告,过度依赖AI编程智能体可能代价高昂。他指出AI生成的代码虽看似规整,却隐藏着更隐蔽的逻辑缺陷,尤其对新手开发者构成风险,易导致维护成本激增和难以追踪的故障。霍茨认为当前大模型仅擅长模仿代码形式,缺乏真正理解与深度推理能力,其观点反映出业界正重。
当你说“帮我订一家周末的亲子餐厅”,传统AI或许会给你一份长长的餐厅名单;而智能体,则会像一个真正的私人助理,自动核对档期、比较评价、完成预约,甚至把行程同步到你的日历——整个过程一气呵成,无需你反复操作。 时间来到2026年,AI智能体(Agent)早已不再是实验室里的前沿概念,它正实实在在地渗透
“帮我找找关于江南文化地标的节目。” 话音刚落,在2026年CCBN的展台上,百视通的AI影视智能体已经精准推送了人文纪录片《大江南》中的《天一生水》一集。画面展开,宁波天一阁藏书楼静静呈现——范钦亲题的签条上,墨迹仿佛浸润了四百三十年的光阴,“天一生水”四个字的边角,已悄然爬上了时光的青苔。此时,
热门专题
热门推荐
在《和平精英》的激烈对决中,手雷不仅是范围杀伤武器,更是扭转战局、攻破敌阵的核心战术道具。许多玩家都曾遇到过手雷扔不准、错失良机的困扰。其实,游戏内自带了一个能极大提升投掷命中率的实用功能——丢雷轨迹线。这项功能无需在外部设置菜单中预先开启,其所有操作都集成在实战投掷界面中,关键在于对局时的灵活调用
2026年5月29日至6月2日,全球肿瘤学界的年度盛典——美国临床肿瘤学会(ASCO)年会将于芝加哥隆重举行。作为肿瘤领域最具影响力的国际学术会议,ASCO年会始终是前沿科研突破的风向标和临床治疗理念的策源地。本届大会,中国创新力量的表现格外引人瞩目:由中国学者主导并入选口头报告、快速口头报告等核心
EverMail AI是什么 在邮件营销的实际工作中,营销人员常常面临两难选择:使用模板群发效率高但缺乏个性,手动撰写又耗时耗力。如何实现大规模个性化沟通,是提升转化率的关键。EverMail AI正是为解决这一核心痛点而生的智能解决方案。 简单来说,EverMail AI是一款基于人工智能技术的电
OKX欧易:全球领先的数字资产服务平台 在数字资产的世界里,选择一个可靠、功能全面的交易平台,无疑是开启旅程的第一步。OKX欧易,正是这样一个备受全球用户信赖的数字资产服务平台。它集成了比特币(BTC)、以太坊(ETH)、狗狗币(DOGE)等主流数字资产的交易服务,凭借其强大的功能、清晰友好的用户界
《和平精英》全新推出的“奥特精英和平蛋”活动,已成为近期玩家热议的焦点。该活动为玩家提供了一个获取“荣耀勋章”的全新途径,而勋章正是抽取奥特曼主题限定奖励的关键道具。奖池内包含终极赛罗飞行器、多款人气角色套装及枪械皮肤等珍稀物品,对于奥特曼系列爱好者与皮肤收藏家来说,这是一次极具吸引力的机会。 奥特





