paint-brush
DOE 与 Github:软件盗版的美丽新世界经过@legalpdf
2,248 讀數
2,248 讀數

DOE 与 Github:软件盗版的美丽新世界

经过 Legal PDF: Tech Court Cases5m2023/08/31
Read on Terminal Reader

太長; 讀書

通过 DOE 诉 Github(修订后的起诉书)的法庭文件,深入了解软件盗版的法律世界。 HackerNoon 的法律 PDF 系列从公共领域检索了此案例,强调了侵犯版权、开源许可的复杂性以及软件开发与法律边界之间复杂的相互作用。
featured image - DOE 与 Github:软件盗版的美丽新世界
Legal PDF: Tech Court Cases HackerNoon profile picture

DOE 与 Github(修订后的诉状)法院备案(已编辑),2023 年 6 月 8 日是HackerNoon 法律 PDF 系列的一部分。您可以在此处跳至本文件中的任何部分。这是 38 部分中的第 1 部分。


原告 J. Doe 1、J. Doe 2、J. Doe 3、J. Doe 4 和 J. Doe 5(“原告”)代表自己和所有其他情况类似的人提出本集体诉讼诉状(“诉状”) ”) 针对被告 GitHub, Inc.;微软公司;开放人工智能公司; OpenAI,LP; OpenAI OpCo, LLC; OpenAI GP 有限责任公司; OpenAI 启动基金 GP I, LLC; OpenAI 启动基金 I,有限合伙人; OpenAI Startup Fund Management, LLC1 违反《数字千年版权法》,17 USC §§ 1201–1205(“DMCA”);违反有关建议许可的合同、违反有关 GitHub 政策(包括其服务条款)的合同;对未来经济关系的侵权干扰;加州反不正当竞争法,Cal.公共汽车。 & 教授代码第 17200 节等;普通法不正当竞争;过失和不当得利。


一、概述:软件盗版的美丽新世界

  1. 原告和集体成员是 GitHub 上公开提供的材料的版权权益所有者,这些材料受包含这些作品使用条件的各种许可(“许可材料”)的约束。此处涉及的所有许可(“许可”)均包含某些通用条款(“许可条款”)。


  2. “人工智能”在本文中被称为“AI”。就本投诉而言,人工智能被定义为一种计算机程序,通常使用统计方法通过算法模拟人类推理或推理。机器学习(“ML”)是人工智能的一个子集,其中程序的行为源自对称为训练数据的材料库的研究。


  3. GitHub 是一家由开源爱好者团队于 2008 年创立的公司。当时,GitHub 的既定目标是支持开源开发,特别是在github.com网站上托管开源代码。在接下来的 10 年里,基于这些表述的 GitHub 取得了巨大成功,吸引了近 2500 万开发者。


  4. 开发人员根据书面许可在 GitHub 上发布许可材料。特别是,最流行的术语有一个共同的术语:使用许可材料需要某种形式的归属,通常包括许可证副本以及原作者的姓名和版权声明。


  5. 2018年10月26日,微软以75亿美元收购了GitHub。尽管开源社区的一些成员对这个联盟持怀疑态度,但微软始终重复着一句话:“微软热爱开源”。在最初的几年里,微软的陈述似乎是可信的。


  6. 微软于 2019 年 7 月向 OpenAI LP 投资了 10 亿美元,估值为 200 亿美元。 2020 年,微软成为 OpenAI 的 GPT-3 语言模型的独家授权商——尽管 OpenAI 不断声称其产品旨在造福广大“人类”。 2021 年,微软开始通过其 Azure 云计算平台提供 GPT-3。 2022 年 10 月 20 日,有报道称 OpenAI“正在就从微软筹集更多资金进行深入谈判”,估值同样为 200 亿美元。 Copilot 在微软的 Azure 平台上运行。微软已使用 Copilot 来提升 Azure 的处理能力,特别是在人工智能方面。


  7. 据了解,微软以 10 亿美元的投资换取了 OpenAI 的部分股权。作为 OpenAI 最大的投资者和最大的服务提供商(特别是与微软的 Azure 产品相关的服务提供商),微软对 OpenAI 拥有相当大的控制权。


  8. 2021 年 6 月,GitHub 和 OpenAI 推出了 Copilot,这是一款基于人工智能的产品,承诺通过使用人工智能提供或填写代码块来帮助软件编码人员。 GitHub 向 Copilot 用户收取这项服务每月 10 美元或每年 100 美元的费用。 Copilot 忽略、违反和删除了数千(可能是数百万)软件开发人员提供的许可证,从而实现了前所未有的规模的软件盗版。 Copilot 输出源自原告和集体许可材料的文本,但未遵守适用的许可条款和适用的法律。副驾驶的输出在本文中被称为“输出”。


  9. 2021 年 8 月 10 日,OpenAI 首次推出了 Codex 产品,该产品将自然语言转换为代码并集成到 Copilot 中。 Copilot 和 Codex 可以称为 AI 或 ML。除非需要区分,否则 Codex 和 Copilot 在本文中将被称为 Ais。


  10. 尽管被告对用于训练人工智能的数据一直守口如瓶,2但他们承认训练数据包括 GitHub 上大量可公开访问的存储库中的数据,3 其中包括许可证并受到许可证的限制。


  11. 除此之外,被告从其代码中删除了原告和集体的归属、版权声明和许可条款,侵犯了许可以及原告和集体的权利。被告使用 Copilot 将现已匿名的代码分发给 Copilot 用户,就好像它是由 Copilot 创建的一样。


  12. Copilot 完全在微软的 Azure 云计算平台上运行。


  13. Copilot 通常只是简单地复制可以追溯到开源存储库或开源被许可人的代码。与许可相反且违反许可,Copilot 复制的代码从不包含底层作者的归属。


  14. GitHub 和 OpenAI 提供了用于训练和操作 Copilot 的代码或其他数据的来源和数量的转移帐户。对于为什么像 Copilot 这样的商业人工智能产品应该免除这些许可要求,他们还提供了不断变化的理由,通常引用“合理使用”。


  15. 这是不公平、不被允许或不合理的。相反,Copilot 的目标是通过将大量开源代码保留在 GitHub 控制的付费墙内来取代它。它违反了开源程序员选择的许可证,并将他们的代码货币化,尽管 GitHub 承诺永远不会这样做。



继续阅读这里


关于 HackerNoon Legal PDF 系列:我们为您带来最重要的技术性和富有洞察力的公共领域法庭案件文件。


该法庭案件 4:22-cv-06823-JST 于 2023 年 6 月 8 日从Storage Courtlistener检索,属于公共领域的一部分。法院创建的文件是联邦政府的作品,根据版权法,自动置于公共领域,可以不受法律限制地共享。