paint-brush
The Times gegen Microsoft/OpenAI: Ein Geschäftsmodell, das auf massenhaften Urheberrechtsverletzungen basiert (8)von@legalpdf
252 Lesungen

The Times gegen Microsoft/OpenAI: Ein Geschäftsmodell, das auf massenhaften Urheberrechtsverletzungen basiert (8)

Zu lang; Lesen

OpenAI startete mit einer Milliarde US-Dollar Startkapital von seinen Gründern, einer Gruppe einiger der reichsten Technologieunternehmer, Investoren und Unternehmen
featured image - The Times gegen Microsoft/OpenAI: Ein Geschäftsmodell, das auf massenhaften Urheberrechtsverletzungen basiert (8)
Legal PDF: Tech Court Cases HackerNoon profile picture

Der Gerichtsantrag „New York Times Company gegen Microsoft Corporation“ vom 27. Dezember 2023 ist Teil der Legal PDF Series von HackerNoon . Sie können hier zu jedem Teil dieser Akte springen. Dies ist Teil 8 von 27.

IV. FAKTISCHE BEHAUPTUNG

B. GenAI-Produkte der Beklagten

1. Ein Geschäftsmodell, das auf Massenverstößen gegen das Urheberrecht basiert


55. OpenAI wurde im Dezember 2015 als „gemeinnütziges Forschungsunternehmen für künstliche Intelligenz“ gegründet. OpenAI startete mit einer Milliarde US-Dollar Startkapital von seinen Gründern, einer Gruppe einiger der reichsten Technologieunternehmer und -investoren sowie Unternehmen wie Amazon Web Services und InfoSys. Zu dieser Gruppe gehörten Elon Musk, der CEO von Tesla und X Corp. (früher bekannt als Twitter); Reid Hoffman, der Mitbegründer von LinkedIn; Sam Altman, der ehemalige Präsident von Y Combinator; und Greg Brockman, der ehemalige Chief Technology Officer von Stripe.


56. Obwohl OpenAI bei seiner Gründung sehr große Investitionen von äußerst wohlhabenden Unternehmen und Einzelpersonen akzeptierte, behauptete es ursprünglich, dass seine Forschung und Arbeit völlig nicht auf Gewinn ausgerichtet sein würden. In einer Pressemitteilung vom 11. Dezember 2015 schrieben Brockman und Mitbegründerin Lya Sutskever (jetzt Präsidentin bzw. Chefwissenschaftlerin von OpenAI): „Unser Ziel ist es, die digitale Intelligenz so voranzutreiben, dass sie der gesamten Menschheit am ehesten zugute kommt.“ , unabhängig von der Notwendigkeit, eine finanzielle Rendite zu erwirtschaften. Da unsere Forschung frei von finanziellen Verpflichtungen ist, können wir uns besser auf einen positiven Einfluss auf die Menschheit konzentrieren.“ Im Einklang mit dieser Mission versprach OpenAI, dass seine Arbeit und sein geistiges Eigentum offen und für die Öffentlichkeit zugänglich sein würden, dass seine „Forscher nachdrücklich dazu ermutigt werden, ihre Arbeit zu veröffentlichen, sei es als Aufsätze, Blogbeiträge oder Code“ und dass seine „Patente (falls vorhanden) mit der Welt geteilt werden“.


57. Trotz seiner frühen Versprechen des Altruismus entwickelte sich OpenAI schnell zu einem milliardenschweren, gewinnorientierten Unternehmen, das zu einem großen Teil auf der unlizenzierten Verwertung urheberrechtlich geschützter Werke der Times und anderer basiert. Nur drei Jahre nach seiner Gründung gab OpenAI seinen ausschließlich gemeinnützigen Status auf. Im März 2019 wurde OpenAI LP gegründet, ein gewinnorientiertes Unternehmen, das sich der Durchführung des Löwenanteils der Geschäftstätigkeit von OpenAI – einschließlich der Produktentwicklung – und der Kapitalbeschaffung von Investoren widmet, die eine Rendite anstreben. Die Unternehmensstruktur von OpenAI entwickelte sich zu einem komplizierten Netz gewinnorientierter Holding-, Betriebs- und Mantelgesellschaften, die den täglichen Betrieb von OpenAI verwalten und den Investoren von OpenAI (vor allem Microsoft) Autorität und Einfluss auf den Betrieb von OpenAI gewähren und gleichzeitig Milliarden einsammeln Kapital von Investoren. Das Ergebnis: OpenAI ist heute ein kommerzielles Unternehmen mit einem Wert von bis zu 90 Milliarden US-Dollar, dessen Umsatz im Jahr 2024 voraussichtlich über 1 Milliarde US-Dollar betragen wird.


58. Mit dem Übergang zum gewinnorientierten Status kam es zu einer weiteren Änderung: Auch OpenAI beendete seinen Status

Engagement für Offenheit. OpenAI hat die ersten beiden Iterationen seines Flaggschiffmodells GenAI veröffentlicht.

GPT-1 und GPT-2, auf Open-Source-Basis im Jahr 2018 bzw. 2019. Aber OpenAI hat sich verändert

Kurs im Jahr 2020, beginnend mit der Veröffentlichung von GPT-3 kurz nach OpenAI LP und anderen gewinnorientierten Organisationen

Es wurden OpenAI-Einheiten gegründet, die die Kontrolle über Produktdesign und -entwicklung übernahmen.


59. GPT-3.5 und GPT-4 sind beide um Größenordnungen leistungsfähiger als die beiden vorherigen Generationen, dennoch haben die Beklagten ihr Design und ihre Ausbildung völlig geheim gehalten. Für frühere Generationen verfügte OpenAI über umfangreiche Berichte, in denen die Inhalte des Trainingssatzes, das Design und die Hardware der LLMs detailliert beschrieben wurden. Nicht so für GPT-3.5 oder GPT-4. Für GPT-4 hieß es beispielsweise im von OpenAI veröffentlichten „technischen Bericht“: „Dieser Bericht enthält keine weiteren Details zur Architektur (einschließlich Modellgröße), Hardware, Trainingsberechnung, Datensatzkonstruktion, Trainingsmethode oder Ähnlichem.“[ 3]


60. Sutskever, Chefwissenschaftler von OpenAI, begründete diese Geheimhaltung mit kommerziellen Gründen: „Da draußen herrscht Konkurrenz …“ Und es gibt viele Unternehmen, die das Gleiche tun wollen, also kann man dies aus wettbewerbstechnischer Sicht als eine Reifung des Fachgebiets betrachten.“[4] Der Effekt bestand jedoch darin, die Identität der Daten zu verbergen, die OpenAI kopiert hat, um seine neueste Version zu trainieren Modelle von Rechteinhabern wie The Times.


61. OpenAI wurde mit der Veröffentlichung von ChatGPT im November 2022 zu einem bekannten Namen. ChatGPT ist ein textgenerierender Chatbot, der bei benutzergenerierten Eingabeaufforderungen menschenähnliche Antworten in natürlicher Sprache nachahmen kann. ChatGPT war sofort eine virale Sensation, erreichte innerhalb eines Monats nach seiner Veröffentlichung eine Million Nutzer und gewann innerhalb von drei Monaten über 100 Millionen Nutzer hinzu.


62. OpenAI bietet über OpenAI OpCo LLC und auf Anweisung von OpenAI Inc., OpenAI LP und anderen OpenAI-Unternehmen eine Reihe von Diensten an, die auf seinen LLMs basieren und sich sowohl an normale Verbraucher als auch an Unternehmen richten. Eine Version von ChatGPT mit GPT-3.5 steht Benutzern kostenlos zur Verfügung. OpenAI bietet Verbrauchern für 20 US-Dollar pro Monat auch einen Premium-Service an, der auf dem „leistungsfähigsten Modell“ GPT-4 von OpenAI basiert. Zu den geschäftsorientierten Angeboten von OpenAI gehören ChatGPT Enterprise und ChatGPT API-Tools, die es Entwicklern ermöglichen sollen, ChatGPT in maßgeschneiderte Anwendungen zu integrieren. Gegen Lizenzgebühren lizenziert OpenAI seine Technologie auch an Firmenkunden.


63. Diese kommerziellen Angebote waren für OpenAI von großem Wert. Über 80 % der Fortune-500-Unternehmen nutzen ChatGPT.[5] Jüngsten Berichten zufolge erwirtschaftet OpenAI einen Umsatz von 80 Millionen US-Dollar pro Monat und ist auf dem besten Weg, innerhalb der nächsten 12 Monate die Grenze von 1 Milliarde US-Dollar zu überschreiten.[6]


64. Dieser kommerzielle Erfolg beruht zu einem großen Teil auf der groß angelegten Urheberrechtsverletzung von OpenAI. Eines der zentralen Merkmale, die die Nutzung und den Verkauf von ChatGPT und den damit verbundenen Produkten vorantreiben, ist die Fähigkeit des LLM, Texte in natürlicher Sprache in verschiedenen Stilen zu erstellen. Um dieses Ergebnis zu erreichen, fertigte OpenAI im Zuge der „Schulung“ des LLM zahlreiche Reproduktionen urheberrechtlich geschützter Werke an, die sich im Besitz von The Times befanden.


65. Nach bestem Wissen und Gewissen waren alle OpenAI-Beklagten entweder direkt an der weit verbreiteten Verletzung und kommerziellen Ausbeutung von Times Works durch OpenAI beteiligt oder haben diese geleitet, kontrolliert und davon profitiert. OpenAI Inc. kontrollierte und leitete zusammen mit Microsoft die weit verbreitete Vervielfältigung, Verbreitung und kommerzielle Nutzung des Materials der Times durch OpenAI LP und OpenAI Global LLC über eine Reihe von Holding- und Mantelgesellschaften, zu denen OpenAI Holdings LLC, OpenAI GP LLC, und OAI Corporation LLC. OpenAI LP und OpenAI Global LLC waren direkt am Design, der Entwicklung und der Vermarktung der GPT-basierten Produkte von OpenAI beteiligt und direkt an der weit verbreiteten Reproduktion, Verbreitung und kommerziellen Nutzung von Times Works beteiligt. OpenAI LP und OpenAI Global LLC kontrollierten und leiteten auch OpenAI, LLC und OpenAI OpCo LLC, die an der Verbreitung, dem Verkauf und der Lizenzierung der GPT-basierten Produkte von OpenAI beteiligt waren und so die Reproduktion, Verbreitung und kommerzielle Nutzung von Times Works monetarisierten.


66. Seit mindestens 2019 ist und bleibt Microsoft eng in die Schulung, Entwicklung und Kommerzialisierung der GPT-Produkte von OpenAI involviert. In einem Interview mit dem Wall Street Journal auf dem Weltwirtschaftsforum 2023 sagte Microsoft-CEO Satya Nadella, dass „die ChatGPT- und GPT-Modellfamilie … etwas ist, mit dem wir seit mehreren Jahren eng mit OpenAI zusammenarbeiten.“ Durch diese Partnerschaft war Microsoft auf mindestens zwei Arten an der Entwicklung und Vermarktung von GPT-LLMs und darauf basierenden Produkten beteiligt.


67. Erstens hat Microsoft maßgeschneiderte Computersysteme entwickelt und betrieben, um die hier beschriebene massenhafte Urheberrechtsverletzung auszuführen. Diese Systeme wurden verwendet, um mehrere Reproduktionen des geistigen Eigentums der Times zu erstellen, um die GPT-Modelle zu erstellen, die große Teile des in diesen Werken enthaltenen urheberrechtlich geschützten Ausdrucks ausnutzen und in vielen Fällen beibehalten.


68. Microsoft ist der einzige Cloud-Computing-Anbieter für OpenAI. Microsoft und OpenAI arbeiteten zusammen, um die Supercomputing-Systeme zu entwerfen, die auf der Cloud-Computerplattform Azure von Microsoft basieren und zum Trainieren aller GPT-Modelle von OpenAI nach GPT-1 verwendet wurden. In einer Grundsatzrede im Juli 2023 auf der Microsoft Inspire-Konferenz sagte Herr Nadella: „Wir haben die Infrastruktur aufgebaut, um ihre Modelle zu trainieren. Sie entwickeln Innovationen bei den Algorithmen und dem Training dieser Grenzmodelle.“


69. Bei dieser Infrastruktur handelte es sich nicht nur um allgemeine Computersysteme, die OpenAI nach eigenem Ermessen nutzen konnte. Microsoft hat es speziell für den Zweck entwickelt, im Wesentlichen das gesamte Internet – kuratiert, um Times Works überproportional zu präsentieren – zu nutzen, um den leistungsfähigsten LLM in der Geschichte auszubilden. In einem Interview im Februar 2023 sagte Herr Nadella:


Aber denken Sie daran, was OpenAI als große Modelle darstellt:

Die schwere Arbeit wurde vom [Microsoft] Azure-Team für die Erstellung übernommen

die Computer-Infrastruktur. Weil diese Arbeitsbelastungen so sind

anders als alles, was es zuvor gab. Also mussten wir es tun

Denken Sie sogar vom Rechenzentrum bis hin zur Infrastruktur völlig neu

Zuerst gaben wir uns sogar die Chance, die Modelle zu bauen. Und jetzt sind wir es

Umsetzung der Modelle in Produkte.[7]


70. Microsoft baute diesen Supercomputer „in Zusammenarbeit mit und exklusiv für OpenAI“ und „entwarf [ihn] speziell, um die KI-Modelle dieses Unternehmens zu trainieren.“[8] Selbst für Supercomputing-Verhältnisse war er ungewöhnlich komplex. Laut Microsoft operierte es als „ein einzelnes System mit mehr als 285.000 CPU-Kernen, 10.000 GPUs und 400 Gigabit pro Sekunde Netzwerkkonnektivität für jeden GPU-Server“. Dieses System gehörte zu den fünf leistungsstärksten öffentlich bekannten Supercomputing-Systemen der Welt.


71. Um sicherzustellen, dass das Supercomputing-System den Anforderungen von OpenAI entsprach, musste Microsoft das System sowohl unabhängig als auch in Zusammenarbeit mit OpenAI-Softwareentwicklern testen. Laut Herrn Nadella in Bezug auf OpenAI: „Sie erstellen die Grundmodelle, und wir [Microsoft] arbeiten viel daran herum, einschließlich der Tools für verantwortungsvolle KI und KI-Sicherheit.“ Nach Informationen und Überzeugung umfasst ein solches „Tooling rund um KI und KI-Sicherheit“ die Feinabstimmung und Kalibrierung der GPT-basierten Produkte vor ihrer Veröffentlichung für die Öffentlichkeit.[9]


72. In Zusammenarbeit mit OpenAI hat Microsoft außerdem die GPT-basierte Technologie von OpenAI kommerzialisiert und mit seinem eigenen Bing-Suchindex kombiniert. Im Februar 2023 stellte Microsoft Bing Chat vor, eine generative KI-Chatbot-Funktion seiner auf GPT-4 basierenden Suchmaschine. Im Mai 2023 stellten Microsoft und OpenAI „Browse with Bing“ vor, ein Plugin für ChatGPT, das den Zugriff auf die neuesten Inhalte im Internet über die Suchmaschine Microsoft Bing ermöglichte. Bing Chat und Browse with Bing kombinieren die Fähigkeit von GPT-4, den menschlichen Ausdruck – einschließlich des Ausdrucks von The Times – nachzuahmen, mit der Fähigkeit, Zusammenfassungen von Suchergebnissen in natürlicher Sprache zu generieren, einschließlich Treffern auf Times Works, die den Besuch der eigenen Websites von The Times überflüssig machen . Diese „synthetischen“ Suchergebnisse geben vor, Benutzeranfragen direkt zu beantworten und können ausführliche Paraphrasen und direkte Zitate von Times-Berichten enthalten. Ein solches Kopieren hält die Interaktion mit den eigenen Websites und Anwendungen der Beklagten aufrecht, anstatt Benutzer auf die gleiche Weise wie organische Suchergebnisse auf The Times zu verweisen.


73. In einem aktuellen Interview räumte Herr Nadella die enge Beteiligung von Microsoft an den Operationen von OpenAI und damit seine Urheberrechtsverletzung ein:


[W]wir waren von unseren eigenen Fähigkeiten sehr überzeugt. Wir verfügen über alle IP-Rechte und alle Möglichkeiten. Wenn OpenAI morgen verschwindet, möchte ich ehrlich gesagt nicht, dass sich einer unserer Kunden darüber Sorgen macht, denn wir haben alle Rechte, die Innovation fortzusetzen. Nicht nur, um das Produkt anzubieten, sondern wir können einfach das tun, was wir in Partnerschaft getan haben. Wir haben die Leute, wir haben die Rechenleistung, wir haben die Daten, wir haben alles.


74. Durch ihre Mitarbeit sowohl bei der Entwicklung als auch bei der Kommerzialisierung der GPT-Modelle haben die Beklagten von der massiven Urheberrechtsverletzung, kommerziellen Ausbeutung und Veruntreuung des geistigen Eigentums der Times profitiert. Wie Herr Nadella es kürzlich ausdrückte: „[OpenAI] setzt auf uns, wir setzen auf sie.“ Er fuhr fort und beschrieb die Auswirkungen der 13-Milliarden-Dollar-Investition von Microsoft:


Und das gibt uns, wie gesagt, erhebliche Rechte. Und auch dieses Ding kann man nicht lassen, oder? Wir sind da drin. Wir sind unter ihnen, über ihnen, um sie herum. Wir führen die Kernel-Optimierungen durch, wir erstellen Tools und wir bauen die Infrastruktur auf. Deshalb denke ich, dass viele Industrieanalysten sagen: „Oh wow, es ist wirklich ein Gemeinschaftsprojekt von Microsoft und OpenAI.“ Die Realität ist, dass wir, wie gesagt, in all dem sehr autark sind.





Lesen Sie hier weiter.


[3] OPENAI, GPT-4 TECHNISCHER BERICHT (2023), https://cdn.openai.com/papers/gpt-4.pdf.


[4] James Vincent, Mitbegründer von OpenAI, über den früheren Ansatz des Unternehmens, Forschungsergebnisse offen zu teilen: „We Were Wrong“, THE VERGE (15. März 2023), https://www.theverge.com/2023/3/15 /23640180/openai-gpt-4-launch-closedresearch-ilya-sutskever-interview.


[5] OpenAI, Einführung in ChatGPT Enterprise, OPENAI (28. August 2023), https://openai.com/blog/introducing-chatgpt-enterprise.


[6] Chris Morris, OpenAI erreicht Berichten zufolge einen Jahresumsatz von fast 1 Milliarde US-Dollar, FAST COMPANY (30. August 2023), https://www.fastcompany.com/90946849/openai-chatgpt-reportedly-nears-1-billion-annual -Verkäufe.


[7] Zuerst auf CNBC: CNBC-Transkript: Microsoft-CEO Satya Nadella spricht mit Jon Fortt von CNBC am

„Power Lunch“ Today, CNBC (7. Februar 2023), https://www.cnbc.com/2023/02/07/first-on-cnbc-cnbc-transcriptmicrosoft-ceo-satya-nadella-speaks-with -cnbcs-jon-fortt-on-power-lunch-today.html.


[8] Jennifer Langston, Microsoft kündigt neuen Supercomputer an und legt Vision für die zukünftige KI-Arbeit dar, MICROSOFT (19. Mai 2020), https://news.microsoft.com/source/features/ai/openai-azure-supercomputer/. 9 SÉBASTIEN BUBECK ET AL., SPARKS OF ARTIFICIAL GENERAL INTELLIGENCE: EARLY EXPERIMENTS WITH GPT-4 (2023), https://arxiv.org/pdf/2303.12712.pdf




Über HackerNoon Legal PDF Series: Wir stellen Ihnen die wichtigsten technischen und aufschlussreichen gemeinfreien Gerichtsakten vor.


Dieser Gerichtsfall 1:23-cv-11195, abgerufen am 29. Dezember 2023 von nycto-assets.nytimes.com , ist Teil der Public Domain. Die vom Gericht erstellten Dokumente sind Werke der Bundesregierung und werden gemäß dem Urheberrecht automatisch öffentlich zugänglich gemacht und können ohne rechtliche Beschränkungen weitergegeben werden.