paint-brush
2024 年的 4 个细节:矢量数据库版经过@zilliz
502 讀數
502 讀數

2024 年的 4 个细节:矢量数据库版

经过 Zilliz2m2024/01/31
Read on Terminal Reader

太長; 讀書

如果你的推荐在 2024 年仍然相似,那么你就错了(恭敬地)这是 2024 年矢量数据库世界的进出情况的总结。一种类型的推荐已经过时,一种平衡的推荐已经出现。云提供商三合一:AWS、GCP 和 Azure。
featured image - 2024 年的 4 个细节:矢量数据库版
Zilliz HackerNoon profile picture
0-item

如果您的建议在 2024 年仍然相似,那么您就做错了(恭敬地)。


以下是 2024 年矢量数据库领域的最新动态的总结。


1. 一种类型的推荐已经出来;平衡组已在

❌ Out:仅提供 1 种搜索类型,如 Top-K。不要误会我的意思,top-K 是向量搜索的核心,但有时,它会推荐过于相似的项目,从而影响推荐质量。仅仅因为有人在悲伤的日子里听阿黛尔的歌,并不意味着他们想一直听她的歌。


✅ 在:包含范围搜索通过允许您定义矢量相似性的距离范围,确保一组更加✨平衡✨的结果。平衡的推荐有助于防止推荐过于相似或过于不同的事物。


2. 向量归一化的额外步骤已经消失,使用余弦相似度已经出现

❌ 输出:采取额外步骤 👎 标准化要测量的向量相似(识别彼此传达相似含义的句子或短语)或各个领域的相关性。


✅ 在: 余弦相似度让您一步即可轻松标准化向量👍

3、分步更新数据已经过时了;使用 Upsert 无缝完成它

❌ Out:以令人沮丧的两步过程低效地更新数据库中的数据:删除,然后插入。这无法保证数据的原子性和操作的便利性。


✅ 在: 更新插入简化更新过程:如果系统中不存在数据,则将其插入;如果存在,则会更新它。 😀

4. 云提供商三合一(AWS、GCP 和 Azure)已然出现

❌ 出局:矢量数据库在云提供商三合一上不可用:AWS、GCP 和 Azure。


✅ 在:矢量数据库可在 3 个主要云提供商🌟(包括 GCP Marketplace)以及北美、欧洲和亚洲的 8 个区域👀 AKA 上使用齐利兹云


在所有 3 个云平台上都提供矢量数据库的世界不再是想象的。 Zilliz Cloud 确实如此。


如果您有兴趣尝试范围搜索、更新插入和余弦相似度(在 3 个云平台中的任何一个上),请开始使用这里


2 月 1 日还将举办一场实时网络研讨会,涵盖这些功能及更多内容。登记这里


Discord 上还将有现场问答。加入我们这里