paint-brush
4 плюса и минусы 2024 года: издание Vector Databaseк@zilliz
502 чтения
502 чтения

4 плюса и минусы 2024 года: издание Vector Database

к Zilliz2m2024/01/31
Read on Terminal Reader

Слишком долго; Читать

Если ваши рекомендации по-прежнему аналогичны в 2024 году, вы делаете это неправильно (уважительно). Вот краткое изложение того, что будет и что будет в мире векторных баз данных в 2024 году. Один тип рекомендаций отсутствует, но используется сбалансированный набор. Триада поставщиков облачных услуг: AWS, GCP и Azure.
featured image - 4 плюса и минусы 2024 года: издание Vector Database
Zilliz HackerNoon profile picture
0-item

Если ваши рекомендации и в 2024 году останутся такими же, вы делаете это неправильно (с уважением).


Вот краткий обзор того, что будет и что будет в мире векторных баз данных в 2024 году.


1. Один тип рекомендаций отсутствует; сбалансированный набор уже есть

❌Выход: предлагает только 1 вид поиска типа Топ-К. Не поймите меня неправильно, top-K является основой векторного поиска, но иногда он дает рекомендации по слишком похожим элементам, что влияет на качество рекомендаций. Тот факт, что кто-то слушает Адель в грустные дни, не означает, что они хотят слушать ее все время.


✅ В: Включение поиск по диапазону обеспечивает более ✨сбалансированный✨ набор результатов, позволяя вам определить диапазон расстояний для сходства векторов. Сбалансированные рекомендации помогают предотвратить рекомендации слишком похожих или слишком разных вещей.


2. Дополнительные шаги по нормализации векторов отсутствуют, использование косинусного подобия доступно

❌ Выход: сделать дополнительный шаг 👎 для нормализации вектора для измерения. сходство (определение предложений или фраз, которые передают друг другу схожие значения) или родство в различных областях.


✅В: Косинусное подобие позволяющий легко нормализовать вектор за один шаг 👍

3. Обновление данных в несколько этапов исключено; Использование Upsert для беспрепятственного выполнения задач уже в разработке

❌ Выход: неэффективное обновление данных в базе данных в рамках разочаровывающего двухэтапного процесса: удалить, затем вставить. Это не может обеспечить атомарность данных и удобство работы.


✅В: Upsert упрощает процесс обновления: если данных в системе нет, она их вставляет; если он существует, он обновляет его. 😀

4. Триада поставщиков облачных услуг (AWS, GCP и Azure) присутствует.

❌ Выход: базы данных Vector недоступны в триаде поставщиков облачных услуг: AWS, GCP и Azure.


✅ В: Базы данных Vector, доступные у 3 основных облачных провайдеров 🌟 (включая GCP Marketplace) и 8 регионов Северной Америки, Европы и Азии 👀 AKA. Зиллиз Клауд .


Мир, в котором векторная база данных доступна на всех трех облачных платформах, больше не является воображением. Это правда с Zilliz Cloud.


Если вы хотите попробовать поиск по диапазону, повышение и косинусное сходство (на любой из трех облачных платформ), начните здесь .


1 февраля также пройдет вебинар, посвященный этим и многим другим функциям. регистр здесь .


Также в Discord будут проводиться вопросы и ответы в прямом эфире. Присоединяйтесь к нам здесь .