12月23日消息,全球最受欢迎的音乐流媒体平台Spotify遭遇了影子图书馆组织“安娜的档案”入侵。该组织近乎完整地抓取了Spotify平台的内容,下载了超过300TB的音乐文件,并通过BT种子进行非法传播。
Spotify已承认此次事件,并通过外媒Android Authority回应:“我们在调查未经授权的访问时发现,有第三方抓取了公开的元数据,并通过非法手段绕过了数字版权管理,从而获取了平台上的部分音频文件。目前事件仍在调查中。”
泄露的文件数量约8600万首歌曲,虽然只占Spotify全部曲库的37%,却覆盖了平台99.9%的播放量。大部分音频仍保持Spotify原始的OGG Vorbis 160kbps格式;只有热度评分为0的歌曲被重新编码为75kbps,以降低存储占用。
据外媒Tom‘s Hardware报道,泄露数据还包括25.6亿条元数据记录,覆盖Spotify上99.6%的收听量,并被整理为可查询的SQL数据库。“安娜的档案”还对Spotify API进行了近乎无损的JSON级重建,包含18.6亿个唯一ISRC编号,涵盖所有录音标识、专辑信息、艺人资料和封面图像。
“安娜的档案”发布的博客对这次数据抓取进行了详细说明,并附带了大量统计图表。例如,Spotify平台大约70%的歌曲几乎无人收听,而最受欢迎的0.1%曲目占据了绝大多数的关注度。平台上的音乐以单曲为主,每分钟120拍是最常见的节奏。
“安娜的档案”称,此次行动的目的是实现“音乐保存”。该组织认为,Spotify的曲库分发机制过度偏向热门艺人和音质表现,因此需要建立一个“旨在覆盖人类历史上所有音乐作品”的权威BT种子列表。
种子文件由“安娜的档案”自行托管,音频数据采用其自定义的Anna‘s Archive Containers封装格式。元数据已率先公开,其余音频内容将按照受欢迎程度分级,以大规模分批方式陆续发布。这次抓取事件的长期影响,仍有待时间验证。
