IT之家12月21日消息,科技媒体 The Verge 最新报道,谷歌近日向网络爬虫工具开发商 SerpApi 发起诉讼,指控其利用一系列技术手段,蓄意规避反爬虫机制,从而大量抓取受知识产权保护的搜索内容。

谷歌正式起诉爬虫工具开发商 SerpApi
谷歌在提交的诉状中明确指出,SerpApi 不仅严重侵犯了相关版权法律,更采用了具有欺骗性的自动化手段,高频访问并抓取谷歌搜索结果,其规模“令人震惊”。此外,这家公司还将抓取到的数据转售给客户牟利。
具体而言,SerpApi 采用非常规技术手段,成功绕过了谷歌自主研发的 SearchGuard 反爬虫技术。
谷歌还在诉讼中透露,公司当初开发并部署 SearchGuard 系统,正是为了有效阻止侵权行为,保护内容合作伙伴的权益。而 SerpApi 却动用了多种方法来规避这一系统,其具体应对方式包括:每天向谷歌服务器发送数以亿计的自动化查询请求来进行伪装,这些请求看起来与真实用户的正常访问别无二致。
谷歌认为,自家搜索引擎中包含大量受版权保护的内容,而 SerpApi 的行为完全无视了公司在获取版权授权方面所进行的投入,使得他人无需承担同等成本,便能坐享其成。
谷歌已向法院申请禁令,要求 SerpApi 立即停止使用相关技术突破反爬虫措施,并销毁所有相关工具。
值得注意的是,社交平台 Reddit 曾在今年10月对 SerpApi 以及另外两家爬虫公司提起诉讼,并在诉状中指出,这些被告方曾为 AI 初创公司 Perplexity 抓取 Reddit 的帖子内容。谷歌在本次诉讼中简要提及了此事件,但并未直接点名具体涉及的公司。
IT之家注:网络爬虫是一种自动化程序,用于在互联网上批量访问网页、抓取并解析网页内容。典型的爬虫会向目标网站发起访问请求,并扒取 HTML、JSON、图片等数据,随后解析出文字、链接、价格、图片等有用信息,最终保存到数据库中。
