10月11日最新消息显示,苹果公司近日在美国加州联邦法院遭遇诉讼风波。纽约州立大学下州健康科学大学的两位神经科学教授苏珊娜·马丁内斯-孔德(Susana Martinez-Conde)和斯蒂芬·麦克尼克(Stephen Macknik)指控该公司在开发新一代人工智能系统"Apple Intelligence"过程中,涉嫌非法使用数千本受版权保护的图书作为训练素材。
盗版书库成训练素材
根据法庭文件披露,苹果在2024年4月展示OpenELM语言模型时,承认使用了包含著名盗版书库"Books3"的"The Pile"英文数据集。这个已被下架的书库原本收录了通过Bibliotik私人追踪器获取的18.6万余本图书,其中包括原告的多部著作,如《错觉冠军:令人费解的图像和神秘脑谜背后的科学》《思维的魔术:魔术的神经科学揭示了我们的日常欺骗》等。
"苹果未经授权就完整复制了我们的版权作品用于AI训练,这种行为构成直接侵权。"原告在诉状中强调。极具讽刺意味的是,苹果Books商店一直在合法销售《思维的魔术》一书,却在AI训练中使用了该书的盗版副本,暴露出公司在版权管理方面的矛盾。
苹果或面临巨额赔偿
两位教授要求法院判令苹果停止使用其著作权作品,并根据美国版权法进行赔偿。值得注意的是,诉状特别指出Apple Intelligence发布次日,苹果市值单日暴涨2000亿美元,刷新公司历史纪录,以此证明AI业务带来的巨大商业利益。
行业维权浪潮延续
这已是近期针对科技巨头AI训练数据版权的又一起法律纠纷。此前已有作家群体对苹果提起诉讼,而OpenAI、微软、Meta等科技公司也面临着作家、新闻机构和音乐产业的多起集体诉讼。
今年8月,Anthropic公司以15亿美元和解了作者团体提起的版权诉讼。有趣的是,该案中法院裁定AI模型训练本身属于"合理使用",争议焦点在于系统是否会记住并重现受保护内容。截至目前,苹果公司尚未就此次诉讼作出公开回应。
