Wenn Sie ChatGPT häufig nutzen, wissen Sie, dass es dazu neigt, in sogenannte Halluzinationen zu verfallen. Eine großartige Sammlung statistisch korrekter Wörter, die keine Grundlage in der Realität haben. Vor einigen Monaten löste eine Anfrage zur Verwendung von Apache Cassandra für große Sprachmodelle (LLMs) und LangChain eine merkwürdige Antwort aus. ChatGPT berichtete, dass Cassandra nicht nur eine gute Werkzeugwahl bei der Erstellung von LLMs war, OpenAI nutzte Cassandra auch mit einer MIT-lizenzierten Python-Bibliothek namens CassIO.
Wir gingen in den Kaninchenbau und durch weitere Aufforderungen beschrieb ChatGPT viele Details darüber, wie CassIO verwendet wurde. Es enthielt sogar Beispielcode und eine Website. Nachfolgende Untersuchungen fanden außerhalb der ChatGPT-Antworten keine Hinweise auf CassIO, aber der Samen war gesät. Wenn diese Bibliothek nicht existierte, musste sie vorhanden sein, und wir begannen kurz darauf mit der Arbeit daran.
Beste Halluzination aller Zeiten.
Was war diese großartige Idee, die ChatGPT (und damit auch OpenAI) inspirierte? Eine großartige Python-Bibliothek ermöglicht es Entwicklern, mit weniger mehr zu erreichen. DataStax und Anant bündelten ihre Kräfte bei der Entwicklung
Die Stärke von CassIO liegt in seiner Agnostizismus gegenüber bestimmten KI-Frameworks. Es befasst sich nicht mit den spezifischen Implementierungsdetails von Schnittstellen wie
Ein Speichermodul für LLMs, das Cassandra zur Speicherung verwendet und sich an den letzten Austausch in einer Chat-Interaktion erinnern oder sogar eine Zusammenfassung der gesamten vergangenen Konversation speichern kann.
Eine Funktion zum Zwischenspeichern von LLM-Antworten auf Cassandra, wodurch nach Möglichkeit Latenz und Token eingespart werden. Automatische Injektion von Daten aus Cassandra in eine Eingabeaufforderung oder innerhalb einer längeren LLM-Konversation.
Unterstützung für die „Teilung“ von Eingabeaufforderungen, sodass einige Eingaben für die zukünftige Bereitstellung nicht spezifiziert bleiben.
Automatische Injektion von Daten aus einem
Diese Komponenten arbeiten zusammen, um den Prozess der Datenintegration in Eingabeaufforderungen zu rationalisieren und eine reibungslose Interaktion zwischen dem LLM und der Datenbank sicherzustellen.
Die Einbeziehung von
Durch die Kombination von CassIO und LangChain werden diese Funktionen im Laufe der Zeit immer weiter erweitert und verfeinert, um den sich ständig weiterentwickelnden Anforderungen des LLM-Managements gerecht zu werden. Der aktuelle Stand der Technik besteht darin, Eingabeaufforderungen zu verketten, um genauere Antworten von LLMs zu erhalten. In einem kürzlich erschienenen Artikel wird eine Technik namens beschrieben
Als sich weiterentwickelndes Tool wächst CassIO schnell und es kommen regelmäßig neue Entwicklungen und Updates hinzu. Zum Zeitpunkt des Verfassens dieses Artikels unterstützt CassIO LangChain, LlamaIndex wird bald verfügbar sein. Das langfristige Ziel dieses Projekts besteht darin, hochskalierten Speicher für autonome KI-Agenten wie den zu unterstützen
Ein bevorstehendes Bootcamp, „
Wer weiß, wie die Geschichte diesen Moment beurteilen wird? War es ein Leak interner Informationen von OpenAI? Oder, wenn man etwas düsterer darüber nachdenkt: Ist dies der erste Schritt der KI, den Menschen dazu zu bringen, seinen Befehlen zu gehorchen? So oder so verfügen Entwickler jetzt über eine einfach zu verwendende Bibliothek, mit der sie die nahezu unendliche Skalierung von Cassandra nutzen können, wenn sie in die Welt der generativen KI eintauchen.
ChatGPT hat uns ein Geschenk gemacht. Was werden Sie also damit aufbauen? Ich werde mich in einem kommenden Webinar mit der Vektorsuche befassen (Anmelden).
Von Patrick McFadin, DataStax
Patrick McFadin ist Co-Autor des O'Reilly-Buches „Managing Cloud Native Data on Kubernetes“. Derzeit arbeitet er bei DataStax im Bereich Entwicklerbeziehungen und als Mitwirkender am Apache Cassandra-Projekt. Patrick hat als Chefevangelist für Apache Cassandra (er ist auch ein frischgebackener Cassandra-Committer!) und als Berater für DataStax gearbeitet, wo er viel Spaß beim Aufbau einiger der größten Bereitstellungen in der Produktion hatte.