Stellen Sie sich eine Zukunft vor, in der KI nicht in Unternehmenstresoren eingeschlossen ist, sondern von einer globalen Gemeinschaft von Innovatoren Stein für Stein im Freien aufgebaut wird. Wo Zusammenarbeit und nicht Wettbewerb den Fortschritt vorantreibt und ethische Überlegungen genauso wichtig sind wie reine Leistung. Das ist keine Science-Fiction, sondern die Open-Source -Revolution, die sich im Herzen der KI-Entwicklung zusammenbraut. Aber Big Tech hat seine eigene Agenda und maskiert eingeschränkte Modelle als Open Source und versucht gleichzeitig, die Vorteile einer wirklich offenen Community zu nutzen.
Lassen Sie uns die Codeschichten durchbrechen und die Wahrheit hinter diesen Bemühungen ans Licht bringen. Diese Erkundung der Zukunft der Open-Source-KI wird die „Vortäuscher“ analysieren und sich für die „echten“ in der KI-Entwicklung einsetzen, um den Innovationsmotor aufzudecken, der hinter all dem brummt. Das Fazit ist, dass Open-Source-KI einen Open-Source-Datenstapel hervorbringen wird.
Das Bedürfnis
Ein aktueller Artikel von Matteo Wong in The Atlantic: „ So etwas wie „offene“ KI gab es nie ' beschreibt einen wachsenden Trend in der Wissenschaft und der Software-Community zu wirklich Open-Source-KI. „Die Idee besteht darin, relativ transparente Modelle zu schaffen, die die Öffentlichkeit einfacher und kostengünstiger nutzen, studieren und reproduzieren kann, und so eine hochkonzentrierte Technologie zu demokratisieren, die das Potenzial haben könnte, Arbeit, Polizei, Freizeit und sogar Religion zu verändern.“ Derselbe Atlantic weist darauf hin, dass Big-Tech-Unternehmen wie Meta versuchen, diesen Bedarf auf dem Markt zu decken, indem sie ihre Produkte „offen waschen“. Sie übernehmen die Qualitäten und den positiven Ruf der Open-Source-Community, ohne ihr Produkt wirklich als Open-Source-Lösung anzubieten. Aber es gibt keinen Ersatz für die Realität. Dies liegt daran, dass echte Open-Source-Software Innovation und Zusammenarbeit vorantreibt: zwei Eigenschaften, die dringend benötigt werden, um die KI verantwortungsvoll voranzutreiben.
Die Prätendenten
LLaMA 2 ist ein von Meta erstelltes großes Sprachmodell, das sowohl für Forschungs- als auch für kommerzielle Zwecke kostenlos verwendet werden kann. Dies lässt einige vermuten, dass LLaMA 2 Open Source ist. Allerdings hat Meta einige strenge Einschränkungen bei der Verwendung ihres Modells eingeführt. Beispielsweise kann LLaMA 2 nicht zur Verbesserung eines anderen großen Sprachmodells verwendet werden. Eine Position, die dem Traditionellen zuwiderläuft privates kollektives Innovationsmodell von offener Software, die die freie und offene Offenlegung von Innovationen zum Nutzen aller in der Software-Community fördert.
Meta hat die Verwendung ihres Modells weiter beeinträchtigt, indem es die Integration von LLaMA 2 mit Produkten mit 700 Millionen monatlichen Nutzern nicht zuließ und nicht offenlegte, auf welchen Daten ihr Modell trainiert wurde oder welchen Code sie für die Erstellung verwendet hatten. Durch die Nichtoffenlegung öffnet sich Meta den Fragen inhärenter Voreingenommenheit und versehentlicher Diskriminierung. Ein Modell, das auf diskriminierenden Daten trainiert wird, wird dies tun diskriminierende Antworten liefern . Da die Software-Community als Ganzes nicht in der Lage ist, entweder den zum Aufbau des Modells verwendeten Code einzusehen, um zu sehen, ob Sicherheitsmaßnahmen eingebaut wurden, oder die Daten, die zum Trainieren des Modells verwendet wurden, tappen wir bei diesen moralischen Fragen im Dunkeln. In einer Zeit, in der veröffentlichte Forschungsergebnisse zu KI legt mehr Wert auf Leistung als auf Gerechtigkeit und Respekt. Diese Verschleierung ist besonders beunruhigend.
Die Echten
Mistral-KI hat Anerkennung für seine großen Open-Source-Sprachmodelle erlangt, insbesondere Mistral 7B und Mixtral 8x7B. Das Unternehmen ist bestrebt, eine breite Zugänglichkeit seiner KI-Modelle sicherzustellen und die Überprüfung, Änderung und Wiederverwendung durch die Open-Software-Community zu fördern.
vLLM steht für „Vectorized Low-Latency Model Serving“ und ist eine Open-Source-Bibliothek, die speziell zur Beschleunigung und Optimierung großer Sprachmodelle (LLMs) entwickelt wurde. Es handelt sich um ein leistungsstarkes Tool, das die Leistung und Benutzerfreundlichkeit von LLMs erheblich verbessern kann. Dies macht es zu einem wertvollen Hilfsmittel für Entwickler, die an einer Vielzahl von KI-Anwendungen arbeiten, von Chatbots und virtuellen Assistenten bis hin zur Inhaltserstellung und Codegenerierung. Mistral empfiehlt daher die Verwendung von vLLM als Inferenzserver für die Modelle 7B und 8x7B.
EleutherAI ist ein gemeinnütziges KI-Forschungslabor, das sich von einem Discord-Server zur Diskussion von GPT-3 zu einer führenden gemeinnützigen Forschungsorganisation entwickelt hat. Die Gruppe ist bekannt für ihre Arbeit in der Ausbildung und Förderung offener Wissenschaftsnormen in der Verarbeitung natürlicher Sprache. Sie haben verschiedene große Open-Source-Sprachmodelle veröffentlicht und sind an Forschungsprojekten zur KI-Ausrichtung und Interpretierbarkeit beteiligt. Ihre LM-Geschirr Das Projekt ist wahrscheinlich das führende Open-Source-Bewertungstool für Sprachmodelle.
Phi-2 ist das LLM von Microsoft, das sein Gewicht übertrifft. Dieses kleine, aber leistungsstarke Modell basiert auf einer Mischung aus synthetischen Texten und gefilterten Websites und eignet sich hervorragend für Aufgaben wie das Beantworten von Fragen, das Zusammenfassen und Übersetzen. Was Phi-2 wirklich auszeichnet, ist sein Fokus auf Argumentation und Sprachverständnis, der auch ohne fortgeschrittene Ausrichtungstechniken zu einer beeindruckenden Leistung führt.
Viele kompetente Open-Source-Einbettungsmodelle stärken den gesamten generativen Open-Source-KI-Bereich. Diese sind der aktuelle Stand der Technik für Open Source und beinhalten UAE-Groß-V1 Und mehrsprachig-e5-groß .
Es gibt noch viele weitere in diesem stetig wachsenden Bereich. Diese begrenzte Liste ist nur ein Anfang.
Open Source treibt Innovation voran
Unternehmen, die sich einer Philosophie extremer offener Innovation verschrieben haben und sich wirklich an der Entwicklung von Open-Source-Software beteiligen, stellen traditionelle Vorstellungen von Wettbewerbsvorteilen in Frage, indem sie dies anerkennen Nicht alle guten Codes oder großartigen Ideen befinden sich in ihrer Organisation . Diese Verschiebung unterstützt die Streit dass gemeinsame Innovationen innerhalb des Open-Source-Ökosystems zu einem schnelleren Marktwachstum führen und selbst kleineren Softwarefirmen begrenztere Mittel für Forschung und Entwicklung zur Verfügung stellen Gelegenheit zu profitieren von F&E-Spillovers in Open-Source-Software. Denn im Gegensatz zum traditionellen Outsourcing ist Open Innovation gefragt stärkt interne Ressourcen durch Nutzung der kollektiven Intelligenz der Community, ohne die internen Forschungs- und Entwicklungsbemühungen zu schwächen. Das bedeutet, dass Open-Source-Softwareunternehmen ihre Budgets nicht opfern müssen, um Vordenkertum und Code außerhalb ihrer Organisation zu verfolgen.
Darüber hinaus treiben Open-Source-Softwareunternehmen Innovationen strategisch voran Code früh und häufig veröffentlichen , in Anerkennung der kumulativen Natur des Innovationsprozesses in der Software-Community. All dies um etwas zu sagen, das viele bereits erkennen: Open-Source-Software treibt Innovationen voran.
Open Source fördert die Zusammenarbeit
Durch Vernetzung In der Open-Source-Software-Community können Unternehmer sowohl kurzfristige als auch langfristige Ziele erreichen. Kurzfristige Gewinnziele bauen Unternehmen auf und langfristige Gewinnziele erhalten sie. Gleichzeitig wird durch diese Netzwerkbemühungen das Netzwerk selbst aufrechterhalten und für den nächsten Unternehmer erweitert. Es ist bekannt, dass Open-Source-Plattformen Zugriff auf den Quellcode bieten und es Entwicklern ermöglichen, Upgrades, Plug-Ins und andere Softwareteile zu erstellen und diese entsprechend ihren Anforderungen zu verwenden. Diese besondere Art der Zusammenarbeit erlebte mit der breiten Einführung von Kubernetes in der breiteren Software-Community einen Boom. Moderne Technologien arbeiten heute mehr denn je reibungslos zusammen und können in wenigen Minuten fast überall zusammengeschaltet werden.
Große Technologieunternehmen würdigen diese intensive Zusammenarbeit, die der Open-Source-Community innewohnt, indem sie Frameworks, Bibliotheken und Sprachen, die sie zur Wartung und Entwicklung interner Tools erstellt haben, frei veröffentlichen. Dadurch wird der Pool an Entwicklern erweitert, die in der Lage sind, an ihren Produkten zu arbeiten, und es beginnt, den Standard dafür zu setzen, wie ähnliche Technologien funktionieren sollten. In demselben Atlantic-Artikel wird Meta-Gründer Mark Zuckerberg mit den Worten zitiert, es sei „für uns sehr wertvoll gewesen, dies bereitzustellen, da mittlerweile alle der besten Entwickler der Branche Tools verwenden, die wir auch intern verwenden“.
Open Source erzeugt Open Source
Dies sind Faktoren, warum wir sehr oft Synergien zwischen Open-Source-Unternehmen sehen. Open-Source-KI- und ML-Unternehmen werden natürlich Lösungen mit anderen Open-Source-Produkten entwickeln, von Basisprodukten wie Objektspeicher bis hin zu Visualisierungstools. Wenn ein Open-Source-Unternehmen den Schritt nach vorne macht, tun wir es alle. Dieser kohärente und gemischte Ansatz ist wahrscheinlich unsere beste Wahl für die Entwicklung einer KI, die einen menschenzentrierten Ansatz verfolgt. Diese natürlichen Kräfte, die dem Marktbedürfnis nach Open-Source-KI innewohnen, kombiniert mit den Qualitäten von Open-Source-Software in Bezug auf Innovation und Zusammenarbeit, werden den Open-Source-KI-Datenstapel vorantreiben.
Bitte nehmen Sie an diesem Gespräch und unserer Community teil und tragen Sie dazu bei, indem Sie uns eine E-Mail an senden [email protected] oder senden Sie uns eine Nachricht auf unserem Slack-Kanal .
Auch hier veröffentlicht.