paint-brush
4 Vor- und Nachteile von 2024: Vector Database Editionvon@zilliz
502 Lesungen
502 Lesungen

4 Vor- und Nachteile von 2024: Vector Database Edition

von Zilliz2m2024/01/31
Read on Terminal Reader

Zu lang; Lesen

Wenn Ihre Empfehlungen im Jahr 2024 immer noch ähnlich sind, machen Sie es (respektvoll) falsch. Hier finden Sie eine Zusammenfassung dessen, was in der Welt der Vektordatenbanken im Jahr 2024 in und out ist. Eine Art von Empfehlung ist out, ein ausgewogenes Set ist in. Die Cloud-Anbieter-Dreiklang: AWS, GCP und Azure.
featured image - 4 Vor- und Nachteile von 2024: Vector Database Edition
Zilliz HackerNoon profile picture
0-item

Wenn Ihre Empfehlungen im Jahr 2024 immer noch ähnlich sind, machen Sie es (respektvoll) falsch.


Hier ist eine Zusammenfassung dessen, was in der Welt der Vektordatenbanken im Jahr 2024 in und ausgeht.


1. Eine Art von Empfehlung ist out; Ein ausgewogenes Set ist da

❌ Out: Bietet nur eine Suchart wie Top-K. Verstehen Sie mich nicht falsch, Top-K ist der Kern der Vektorsuche, aber manchmal gibt es Empfehlungen zu Elementen, die zu ähnlich sind, was sich auf die Empfehlungsqualität auswirkt. Nur weil jemand an traurigen Tagen auf Adele hört, heißt das nicht, dass er ihr ständig zuhören möchte.


✅ In: Die Einbeziehung von Bereichssuche sorgt für eine „ausgewogenere“ Ergebnismenge, indem Sie einen Abstandsbereich für Vektorähnlichkeit definieren können. Ausgewogene Empfehlungen tragen dazu bei, zu verhindern, dass Dinge empfohlen werden, die zu ähnlich oder zu unterschiedlich sind.


2. Zusätzliche Schritte zur Normalisierung von Vektoren sind out, die Verwendung der Kosinusähnlichkeit ist in

❌ Out: Machen Sie einen zusätzlichen Schritt 👎, um einen zu messenden Vektor zu normalisieren Ähnlichkeit (Identifizierung von Sätzen oder Phrasen, die einander ähnliche Bedeutungen vermitteln) oder Verwandtschaft in verschiedenen Bereichen.


✅ In: Kosinusähnlichkeit So können Sie einen Vektor ganz einfach in einem Schritt normalisieren 👍

3. Das Aktualisieren von Daten in mehreren Schritten ist nicht mehr möglich. Die nahtlose Nutzung von Upsert ist angesagt

❌ Out: Ineffiziente Aktualisierung von Daten in einer Datenbank in einem frustrierenden 😡zweistufigen Prozess: Löschen, dann einfügen. Dies kann die Atomizität der Daten und den Bedienkomfort nicht gewährleisten.


✅ In: Upsert vereinfacht den Aktualisierungsprozess: Wenn Daten nicht im System vorhanden sind, werden sie eingefügt; Wenn es existiert, wird es aktualisiert. 😀

4. Die Cloud-Provider-Triade (AWS, GCP und Azure) ist da

❌ Out: Vector-Datenbanken sind auf der Cloud-Anbieter-Triade AWS, GCP und Azure nicht verfügbar.


✅ In: Vektordatenbanken, die bei 3 großen Cloud-Anbietern 🌟 (einschließlich GCP Marketplace) und 8 Regionen in Nordamerika, Europa und Asien 👀 AKA verfügbar sind Zilliz-Wolke .


Eine Welt mit einer Vektordatenbank, die auf allen drei Cloud-Plattformen verfügbar ist, ist nicht mehr vorstellbar. Das stimmt mit Zilliz Cloud.


Wenn Sie daran interessiert sind, Bereichssuche, Upsert und Kosinusähnlichkeit (auf einer der drei Cloud-Plattformen) auszuprobieren, legen Sie los Hier .


Am 1. Februar gibt es außerdem ein Live-Webinar zu diesen und weiteren Funktionen. Registrieren Hier .


Es wird auch ein Live-Q&A auf Discord geben. Begleiten Sie uns Hier .