
2025年12月24日,多位知名作家联手向美国加州北部地区法院提起诉讼,将六家主流人工智能公司告上法庭。这起诉讼的焦点在于,这些AI公司在训练大模型过程中,涉嫌使用了未经授权的盗版书籍。诉状指控相关公司蓄意利用受版权保护的文学作品进行算法训练,构成了系统性的版权侵权行为。
牵头本次诉讼的是曾两度获得普利策新闻奖的记者约翰·卡雷鲁。他在诉状中主张,被告企业通过非正规渠道获取了大量受版权保护的文本内容。根据披露,这些公司借助被称为“影子图书馆”的LibGen、Z-Library等平台,批量下载了数以百万计的盗版图书,并将其作为训练数据用于大语言模型的开发与优化,最终转化为商业化产品与服务,形成了从非法获取内容到技术变现的完整链条。
原告指出,人工智能系统的知识体系和语言能力在很大程度上依赖于专业作家创作的文本资源,整个AI语言模型生态的价值正是建立在这些原创内容的基础之上。然而,原作者既未被通知,也从未获得任何形式的授权或报酬,其合法权益遭到了严重忽视。
根据美国现行版权法,若侵权行为被认定为蓄意为之,每部被非法使用的著作最高可获赔15万美元。这一赔偿标准使得本案的潜在责任金额极为可观,亦凸显出其行业警示意义。
值得注意的是,围绕AI训练数据的版权争议已持续引发法律关注。公开数据显示,在此类诉讼中,部分AI企业已成为被告频发的对象,仅在文字内容领域就已涉及多起司法纠纷。而作为案件审理地的加州北部法院,目前累计受理的AI相关版权案件数量已占据全美同类案件总数的一半以上,其裁判取向可能对未来AI数据使用的合法性边界产生深远影响。
