DOE vs. Github (denuncia enmendada) Presentación judicial (redactada), 8 de junio de 2023 es parte de la serie PDF legal de HackerNoon . Puede saltar a cualquier parte de este archivo aquí . Esta es la parte 1 de 38.
Los Demandantes J. Doe 1, J. Doe 2, J. Doe 3, J. Doe 4 y J. Doe 5 (“Demandantes”), en nombre de ellos mismos y de todos los demás en situación similar, presentan esta Demanda colectiva (la “Demanda ”) contra los demandados GitHub, Inc.; Corporación Microsoft; OpenAI, Inc.; OpenAI, LP; OpenAI OpCo, LLC; OpenAI GP, LLC; Fondo de inicio OpenAI GP I, LLC; Fondo de inicio OpenAI I, LP; y OpenAI Startup Fund Management, LLC1 por violación de la Ley de Derechos de Autor del Milenio Digital, 17 USC §§ 1201–1205 (la “DMCA”); incumplimiento de contrato con respecto a las Licencias sugeridas, incumplimiento de contrato con respecto a las políticas de GitHub, incluidos sus términos de servicio; interferencia tortuosa con futuras relaciones económicas; Ley de Competencia Desleal de California, Cal. Autobús. & Código Prof. sección 17200, et seq.; competencia desleal en el derecho consuetudinario; negligencia y enriquecimiento injusto.
Los demandantes y los miembros del grupo son propietarios de derechos de autor sobre materiales disponibles públicamente en GitHub que están sujetos a varias licencias que contienen condiciones para el uso de esos trabajos (los "Materiales con licencia"). Todas las licencias en cuestión aquí (las “Licencias”) contienen ciertos términos comunes (los “Términos de la Licencia”).
La “Inteligencia Artificial” se denomina en el presente documento “IA”. A los efectos de esta denuncia, la IA se define como un programa informático que simula algorítmicamente el razonamiento o la inferencia humanos, a menudo utilizando métodos estadísticos. El aprendizaje automático (“ML”) es un subconjunto de la IA en el que el comportamiento del programa se deriva del estudio de un corpus de material llamado datos de entrenamiento.
GitHub es una empresa fundada en 2008 por un equipo de entusiastas del código abierto. En ese momento, el objetivo declarado de GitHub era apoyar el desarrollo de código abierto, especialmente alojando código fuente abierto en el sitio web github.com . Durante los siguientes 10 años, GitHub, basado en estas representaciones, tuvo un gran éxito y atrajo a casi 25 millones de desarrolladores.
Los desarrolladores publicaron Materiales con licencia en GitHub de conformidad con Licencias escritas. En particular, los más populares comparten un término común: el uso de los Materiales con licencia requiere algún tipo de atribución, generalmente incluyendo, entre otras cosas, una copia de la licencia junto con el nombre y el aviso de derechos de autor del autor original.
El 26 de octubre de 2018, Microsoft adquirió GitHub por 7.500 millones de dólares. Aunque algunos miembros de la comunidad de código abierto se mostraron escépticos ante esta unión, Microsoft repitió un mantra en todo momento: "Microsoft ama el código abierto". Durante los primeros años, las representaciones de Microsoft parecían creíbles.
Microsoft invirtió mil millones de dólares en OpenAI LP en julio de 2019 con una valoración de 20 mil millones de dólares. En 2020, Microsoft se convirtió en licenciatario exclusivo del modelo de lenguaje GPT-3 de OpenAI, a pesar de las continuas afirmaciones de OpenAI de que sus productos están destinados a beneficiar a la “humanidad” en general. En 2021, Microsoft comenzó a ofrecer GPT-3 a través de su plataforma de computación en la nube Azure. El 20 de octubre de 2022, se informó que OpenAI “está en conversaciones avanzadas para recaudar más fondos de Microsoft” con esa misma valoración de 20 mil millones de dólares. Copilot se ejecuta en la plataforma Azure de Microsoft. Microsoft ha utilizado Copilot para promover la potencia de procesamiento de Azure, particularmente en lo que respecta a la IA.
Según la información y la creencia, Microsoft obtuvo una participación parcial en OpenAI a cambio de su inversión de mil millones de dólares. Como mayor inversor y proveedor de servicios de OpenAI (específicamente en relación con el producto Azure de Microsoft), Microsoft ejerce un control considerable sobre OpenAI.
En junio de 2021, GitHub y OpenAI lanzaron Copilot, un producto basado en inteligencia artificial que promete ayudar a los codificadores de software proporcionando o completando bloques de código utilizando inteligencia artificial. GitHub cobra a los usuarios de Copilot $10 por mes o $100 por año por este servicio. Copilot ignora, viola y elimina las Licencias ofrecidas por miles (posiblemente millones) de desarrolladores de software, logrando así la piratería de software a una escala sin precedentes. Copilot genera texto derivado de los materiales con licencia de los demandantes y del grupo sin cumplir con los términos de licencia ni las leyes aplicables. La salida de Copilot se denomina en este documento “Salida”.
El 10 de agosto de 2021, OpenAI presentó su producto Codex, que convierte el lenguaje natural en código y está integrado en Copilot. Copilot y Codex pueden denominarse AI o ML. En el presente documento, nos referiremos a Codex y Copilot como Ais, a menos que se requiera una distinción.
Aunque los demandados se han mostrado cautelosos sobre qué datos se utilizaron para entrenar la IA,2 han admitido que los datos de entrenamiento incluyen datos en una gran cantidad de repositorios de acceso público en GitHub,3 que incluyen Licencias y están limitados por ellas.
Entre otras cosas, los Demandados eliminaron de su código la atribución, el aviso de derechos de autor y los términos de licencia de los Demandantes y del Grupo, en violación de las Licencias y los derechos de los Demandantes y del Grupo. Los demandados utilizaron Copilot para distribuir el código ahora anónimo a los usuarios de Copilot como si hubiera sido creado por Copilot.
Copilot se ejecuta íntegramente en la plataforma de computación en la nube Azure de Microsoft.
Copilot a menudo simplemente reproduce código que puede rastrearse hasta repositorios de código abierto o licenciatarios de código abierto. Contrariamente a las Licencias y en violación de ellas, el código reproducido por Copilot nunca incluye atribuciones a los autores subyacentes.
GitHub y OpenAI han ofrecido cuentas cambiantes de la fuente y la cantidad del código u otros datos utilizados para entrenar y operar Copilot. También han ofrecido justificaciones cambiantes de por qué un producto comercial de IA como Copilot debería estar exento de estos requisitos de licencia, a menudo citando "uso justo".
No es justo, permitido o justificado. Por el contrario, el objetivo de Copilot es reemplazar una gran cantidad de código abierto tomándolo y manteniéndolo dentro de un muro de pago controlado por GitHub. Viola las licencias que eligieron los programadores de código abierto y monetiza su código a pesar de la promesa de GitHub de no hacerlo nunca.
Acerca de la serie PDF Legal de HackerNoon: Le traemos los expedientes judiciales de dominio público más importantes, técnicos y reveladores.
Este caso judicial 4:22-cv-06823-JST recuperado el 8 de junio de 2023 de Storage Courtlistener es parte del dominio público. Los documentos creados por el tribunal son obras del gobierno federal y, según la ley de derechos de autor, se colocan automáticamente en el dominio público y se pueden compartir sin restricciones legales.