Meta 声称在没有做种证据的情况下下载盗版图书不违法
社交媒体公司 Meta 在本周提交的一份法庭文件中称,虽然 Meta 承认为人工智能训练目的下载了盗版书籍数据集,但这并不一定意味着 Meta 在下载文件后播种了该文件。
有证据表明,Meta “采取了预防措施,没有‘播种’任何下载的文件”。所谓 “播种 ”是指在下载完成后共享下载文件,由于没有证据证明存在这种 “播种 ”行为,Meta 公司坚持认为,作者无法证明 Meta 公司在下载过程中与任何人共享了盗版图书。
包括理查德-卡德雷(Richard Kadrey)、莎拉-西尔弗曼(Sarah Silverman)和塔-尼希斯-科茨(Ta-Nehisi Coates)在内的图书作者提起版权诉讼,而 Meta 是否真的为盗版图书提供了种子可能会对诉讼产生影响。 作家们此前曾指控 Meta 通过人工智能输出非法复制和传播他们的作品–这种指控越来越常见,但迄今为止几乎没有进行过诉讼。 但是,Meta 公司承认了下载行为,这似乎增加了一项更为直接的指控,即通过非法下载非法传播版权作品,而这早已被视为既定的判例法。
作者们声称,”Meta 公司蓄意参与了历史上规模最大的数据盗版活动之一,为其 LLM 训练数据集获取文本数据,下载并共享数十兆字节的盗版数据,这些数据共包含数百万部受版权保护的作品”。 除了反对 Meta 在盗版书籍上进行人工智能训练的版权侵权索赔之外,作者们还声称,根据加利福尼亚州的《计算机数据访问和欺诈法》(CDAFA),Meta 下载数据集是 “独立的非法行为”,据称该法 “防止未经授权获取数据,包括受版权保护的作品”。
然而,Meta 公司希望说服法庭相信,torrenting 本身并不违法,而是一种 “广泛使用的下载大文件的协议”。 根据 Meta 公司的说法,从 LibGen 和 Z-Library 等盗版图书馆下载盗版图书数据集的决定只是为了获取”‘知名在线资源库’中的数据,而这些数据是可以通过 Torrents 公开获得的”。
为了维护自己的山洪行为,Meta 公司在描述自己的行为时基本上没有使用 “盗版 “一词。 该公司声称,作者不能声称 Meta 在未经授权的情况下根据 CDAFA 获取了他们的数据。 相反,他们所能声称的是,”Meta 涉嫌从原告并未运营或拥有的公共网站上访问并下载了原告并未创建的数据集,其中包含任何人都可以在公共图书馆阅读的已出版书籍的文本”。
虽然 Meta 公司可能会声称没有证据表明存在播种行为,但有一些证词可能会让法庭信服。 此前,负责项目管理的 Meta 公司高管迈克尔-克拉克(Michael Clark)曾作证称,Meta 公司涉嫌修改了 Torrenting 设置,”以便尽可能减少种子传播”,这似乎支持了作者的说法,即发生了一些种子传播。 Meta 公司研究员弗兰克-张(Frank Zhang)的一条内部信息似乎表明,Meta 公司据称试图通过在下载数据集时不使用 Facebook 服务器来掩盖播种行为,以 “避免 “任何人从 Facebook 服务器 “追溯播种者/下载者 “的 “风险”。 这些信息曝光后,提交人要求法庭再次传唤 Meta 公司高管,声称新的事实 “与之前的证词相矛盾”。
Torrenting 术语可能会让法庭感到困惑
Meta 的 Torrenting 抗辩成功与否尚无定论,但作者指出,即使 Meta 以某种方式设法避免播种任何 Torrented 图书,这家社交媒体巨头仍然参与了 “在线盗版圈”。 此外,作者还在脚注中告诉法庭,”像 Meta 这样的 IP 盗版者还会在下载过程中(leeching)和下载后(seeding)上传或与他人共享文件”。 此外,TorrentFreak 还指出,Meta “采取预防措施并不等于防止 “播种。
作者们可能会力图说服法庭,Meta 公司仅仅通过下载文件就 “向全球其他用户提供了盗版作品”,同时明确指出,即使是 Meta 公司也不能声称阻止了所有的播种行为。 一位代表作者的律师拒绝就正在进行的证据调查是否会发现更多有助于证明播种指控的证据发表评论。 缺乏证据可能是一个问题,因为 TorrentFreak 认为,对法庭来说,转播术语可能是陌生的,这可能会使作者们认为原本直截了当的指控变得模糊不清,即 Meta 涉嫌知道自己转播盗版书违反了法律。
到目前为止,Meta 公司对 “leeaching”(下载)时共享数据的索赔保持沉默,但告诉法庭,它计划在简易判决时对播种索赔进行抗辩。
目前,Meta 已提出动议,要求驳回作者的 CDAFA 诉讼请求,因为该诉讼请求已被版权法排除,但不出所料,作者们告诉法庭,他们坚决不同意该诉讼请求。
“如果 Meta 在书店购买了原告的作品,或者从图书馆借阅了原告的作品,然后在未获得许可的情况下对原告的作品进行 LLM 培训,那么它就侵犯了版权,但并不违反 CDAFA,”作者们声称。“Meta决定绕过合法的获取方式,成为非法点对点盗版网络的知情参与者,这提供了’额外的因素’,而且’质的不同’,从而确立了独立的CDAFA侵权行为”。
作者们还将 CDAFA 索赔与反对 Meta 人工智能培训的版权侵权索赔联系起来。他们声称,通过 “从盗版数据库中下载他们的作品,而不是执行合法的许可安排”,Meta 公司不仅剥夺了原告的许可收入,还剥夺了原告本可以从 “全球其他用户 ”那里获得的额外收入,因为 Meta 公司在获取原告数据进行人工智能训练的过程中,同时向任何感兴趣的互联网用户提供了版权作品供其下载。
Meta 公司没有立即回应 Ars 的置评请求。
你也许感兴趣的:
- npm又被滥用,灰产用《庆余年2》盗版资源——把开源公共基础设施的羊毛薅秃了
- 来算算程序员们这些年所欠下的债!
- 微软谈”开源”、”赦”盗版背后的商业逻辑
- 海盗湾与盗版精神:不断被围剿,不断重生
- 海盗湾最后一名创始人在泰国落网
- Julia 的新天地
- 丑陋的代码和蠢事
- 如果您使用 Python… 你现在就需要了解这 3 个工具!
- 【外评】谷歌:从源头消除内存安全漏洞
- Linus正面回应Linux内核“Rust之争”:未来必定使用,完全生产级别尚需时日!
你对本文的反应是: