CNN 起诉 Perplexity:电视媒体首次打响 AI 版权诉讼战
当生成式 AI 公司大规模“抓取”新闻内容并用于模型训练与输出时,传统媒体与科技巨头之间的版权摩擦已从纸媒时代蔓延至电视荧幕。2024 年 5 月 28 日,全球知名电视网络 CNN 正式向加州联邦法院提起诉讼,指控 AI 初创公司 Perplexity 未经授权复制、分发并展示 CNN 的原创新闻报道内容。这一案件被行业视为 全美电视网络首次针对人工智能发起的版权诉讼,标志着媒体与 AI 之间的边界争议进入全新阶段。
诉讼核心:Perplexity 如何“吃掉” CNN 的内容?
根据 CNN 提交的起诉书,Perplexity 通过其 AI 驱动的搜索与问答产品,系统性地抓取 CNN 网站上的受版权保护文章、图片及视频内容,并在未获得授权或支付许可费的情况下,将这些内容直接嵌入到 AI 生成的摘要、答案或引用中。CNN 指控 Perplexity 的行为构成“大规模、故意的版权侵权”,且其商业模型直接建立在窃取传统新闻机构劳动成果的基础上。
- 未经授权的抓取:Perplexity 的爬虫绕过 CNN 网站的技术保护措施,持续抓取付费墙后的内容。
- 直接复制与分发:AI 生成的回复中完整引用 CNN 的核心段落、标题甚至图片,使用户无需访问 CNN 网站即可获取信息。
- 商业获利不当:Perplexity 通过订阅服务(Perplexity Pro)向用户收费,而 CNN 并未从中获得任何分成。
CNN 在诉状中强调,Perplexity 的行为不仅侵害了其版权,还直接损害了广告收入与订阅模型——因为用户无需跳转至 CNN 主页,流量被截留,进而影响其赖以生存的商业模式。
为什么这次诉讼尤其特殊?
与以往媒体起诉 AI 公司不同,这次诉讼的原告身份和背景具有标志性意义。此前,诸如《纽约时报》、Axel Springer(Axel Springer 是德国最大的数字出版集团)等印刷媒体或数字出版商已对 OpenAI、微软等公司提起类似诉讼,但 CNN 是全美第一家以电视网络身份发起 AI 版权案的主要媒体。电视网络的内容形式(视频、音频、图文结合)比纯文本更复杂,侵权认定和损害赔偿计算也更具挑战性。
电视媒体与印刷媒体的差异
电视新闻内容往往具有更高的制作成本(现场报道、高清视频、独家采访),且版权保护范围涵盖画面、脚本、字幕等多个维度。Perplexity 不仅抓取文字,还可能提取视频片段的关键帧或转录音频,这使得技术侵权手段更加隐性。CNN 的诉讼预示着视频内容将步入 AI 版权保护的核心战场。
从《纽约时报》到 CNN:AI 版权诉讼战升级
在 CNN 之前,多家顶级出版商已发起法律攻势:
- 《纽约时报》:2023 年底起诉 OpenAI 和微软,指控其使用数百万篇版权文章训练 GPT 模型,要求销毁侵权训练数据并支付数十亿美元赔偿。
- Axel Springer 与 News Corp:与 OpenAI 达成授权协议,但同样保留诉讼权利以防范超出范围的抓取。
- Getty Images:2023 年起诉 Stability AI 非法使用其图片训练 Stable Diffusion 模型。
CNN 的加入使“媒体联盟”的声量进一步扩大。值得注意的是,电视网络通常拥有更强大的法务团队和行业话语权,这场诉讼可能为后续的 AI 内容合规标准 奠定判例基础。
AI 公司如何“消化”新闻内容?技术路径与法律争议
生成式 AI 获取新闻内容的典型方式包括:
- 网络爬虫抓取:AI 公司使用自研或开源爬虫(如 CommonCrawl)大规模抓取公开网页,包括新闻网站的全部文章。
- RAG(检索增强生成):如 Perplexity 宣称的“实时检索”模式,AI 模型在回答时搜索互联网并提取相关结果,再生成摘要。但实际过程中抓取与引用往往跨越版权边界。
- 训练数据混入:即使未实时引用,版权内容也可能已进入训练语料,导致模型在后续输出中“记忆”并复现原文。
法律争议的焦点集中在:未经许可的商业性使用是否构成“合理使用”?AI 公司通常主张其行为属于“转换性使用”(训练模型而非直接复制),但媒体方认为 AI 输出直接替代了原作品的市场价值。美国版权局至今未给出明确指引,而国会正在推进的《人工智能创新法案》也未能覆盖这一灰色地带。
对 Web3 与去中心化内容生态的启示
这一事件对 Web3 领域同样具有深刻影响。在区块链与去中心化存储(如 IPFS、Arweave)构建的内容网络中,版权归属与使用许可可通过智能合约自动执行——例如 通过 NFT 绑定原创内容的所有权与商业使用权,每次 AI 调用或引用均可触发链上授权与自动分成。然而,当前 AI 公司的数据中心化架构与传统媒体的法律困境,暴露出一个关键缺失:缺乏透明的、可审计的溯源与计算机制。
链上版权管理的可能性
- 内容指纹与哈希登记:将新闻内容的哈希值上链,供 AI 爬虫在抓取时比对,自动触发授权支付。
- 去中心化 AI 训练数据市场:内容创作者通过 DataDAO 授权训练数据,获得代币回报,避免无偿侵权。
- 可验证的归因系统:AI 生成结果的来源信息通过链上证据固定,法院可快速取证。
CNN 诉 Perplexity 一案,无论最终判决如何,都将加速整个行业对 内容价值再分配机制 的探索。对于 Web3 从业者而言,这正是推动去中心化版权协议落地的窗口期——当传统媒体与科技巨头陷入诉讼泥潭时,链上原生方案或许能提供一条更高效、更公平的出路。
结论:电视新闻的 AI 版权战才刚刚开始
CNN 起诉 Perplexity 并非孤立的个例,而是传统媒体在 AI 时代集体反弹的缩影。随着生成式 AI 嵌入搜索引擎、问答助手、智能终端,内容创作者的生存空间正在被机械式“采撷”所压缩。这场诉讼的走向将不仅决定 Perplexity 的商业模式能否持续,更将影响整个 AI 产业在数据获取环节的法律合规标准。对于用户而言,在享受 AI 便捷效率的同时,也应意识到每一段免费生成的答案背后,都可能隐藏着一场尚未结清的版权账——而 Web3 提供了一种值得期待的记账方式。
