AI浏览器安全风险：南洋理工解析OpenAI等Web代理底层机制

首页

热心网友

转载

2025-11-03

OpenAI Atlas、Perplexity Comet等AI浏览器的推出，虽提升了网页自动化效率，却也使智能爬虫威胁加剧。南洋理工大学团队研发的WebCloak，创新性地混淆网页结构与语义，打破爬虫技术依赖，为数据安全筑起轻量高效防线，助力抵御新型智能攻击，守护网络安全。

随着OpenAI推出ChatGPT Atlas浏览器，与Google Chrome正面竞争，AI浏览器赛道的核心技术关注点已聚焦于「自动化效率」。

但同时，LLM驱动的Web Agent也正演变为难以防御的「智能爬虫」，对当前网络安全构成日益严峻的威胁。

为此，南洋理工大学、香港理工大学、夏威夷大学马诺阿分校团队联合研发的WebCloak，针对性破解了Web Agent的底层机制，为这一新型威胁提供了轻量且高效的防御方案，成功填补了当前 LLM 驱动爬虫防御的技术空白。

项目主页：https://web-cloak.github.io/

论文链接：https://letterligo.github.io/paper/SP26_WebAgent.pdf

代码链接：https://github.com/LetterLiGO/Agent-webcloak

AI浏览器背后的隐忧：Web Agent爬虫威胁的技术拆解

OpenAI Atlas的核心优势在于「自然语言驱动的网页自动化」：输入文字指令，AI就能帮你完成搜商品、订酒店等复杂操作。

然而，其「解析-理解-执行」的技术原理，也带来了一种新型攻击模式：攻击者能轻松操控Web Agent，实现自然语言驱动的爬虫自动化。

为研究这一问题，研究者自建了涵盖覆盖电商、旅游、设计等5类高价值场景，含50个热门、237个离线网页快照、10895张人工标注图片的LLMCrawlBench基准数据集。

基于数据集，研究者对32种主流Web Agent进行了系统测评，对三种爬虫范式进行了有效分析。

分析发现，三种技术范式的Web Agent都能有效绕过传统反爬手段：

LLM生成爬虫脚本（LLM-to-Script, L2S）：通过GPT-4o、Gemini-2.5等LLM生成Python爬虫脚本，虽需少量手动调试，但新手也可快速上手，代表工具Gemini-2.5-pro的爬虫召回率达84.2%。原生LLM爬虫方案（LLM-Native Crawlers, LNC）：将LLM深度集成到爬虫逻辑中，直接处理简化网页结构，代表工具Crawl4AI，无需手动干预，爬虫召回率高达98.0%。LLM 驱动的Web Agent（LLM-based Web Agents, LWA）：模拟人类浏览器交互，结合网页结构与视觉信息提取数据，代表工具Browser-Use的爬虫精度达88.8%，尤其擅长处理动态交互网页。

面对LLM驱动的Web Agent，传统防御方案的技术短板被彻底放大：

Web Agent可模拟真实用户浏览器环境，破除IP/UA审查；

多模态LLM 的CAPTCHA验证码破解成功率已持续提升，使验证码形同虚设；

而面对大规模、无需专家知识的「小白」攻击者，服务器端行为分析也将陷入计算开销过高的困境。

最关键的威胁在于，LLM已彻底打破爬虫对技术经验的依赖。

根据用户实验，新手使用Gemini-2.5-Pro生成爬虫脚本仅需1.5～4分钟，效果却好于花了31分钟的专家。使用Crawl4AI等LNC工具进一步将主观操作难度评分（1-5 分）低至1.3分，远低于专家的4.8分。

一切证据都表明，LLM对「网页结构解析逻辑」的代码生成能力，已将爬虫的门槛降至冰点。

Web Agent的核心技术漏洞

通过逆向分析，研究团队发现，所有主流Web Agent均依赖「先解析再理解」的双层工作流，而其中就存在的技术依赖，可以被针对性突破：

解析阶段（Parse）：由于原始网页平均含33.2万token，远超LLM的上下文窗口（如GPT 4o的128k、Claude 3.5的200k），Web Agent需通过非LLM的工具，如markdownify、过滤脚本等对网页结构进行简化，只保留关键交互标签，压缩token至1k级。理解阶段（Interpret）：LLM基于简化后的结构，理解内容并结合用户指令，提取图像URL、文本段落等目标数据。

这一机制的核心漏洞在于对「标准网页结构」的依赖：

Web Agent 默认网页使用规范的HTML标签（如存图片，src="" 存地址），而LLM的理解逻辑也是基于预训练得到的对网页模式的认知。

基于此，WebCloak设计了双层防御方案。在完全不影响人类用户浏览体验的前提下，WebCloak对Web Agent的这两个技术依赖进行了逐个攻破。