ModaHub魔搭社区:向量数据库Zilliz Cloud的ANN 搜索教程

目录

 

HNSW:图索引算法

ANNOY:树索引算法

LSH:哈希索引算法

DiskANN:基于 Vamana 图的磁盘索引算法


通过 k-最近邻(kNN)搜索可以找到一个查询向量的 k 个最近向量。kNN 算法将查询向量与向量空间中的每个向量进行比较,直到出现 k 个完全匹配的结果。尽管 kNN 搜索可以确保准确性,但十分耗时。尤其是数据量大,向量维度高时,耗时更久。

相比之下,近似最近邻(ANN)搜索耗时更短。ANN 算法会预先构建索引。选择不同的索引算法会影响搜索速度、内存使用情况和准确性。各种类型的 ANN 索引算法主要分为 2 种思路:缩小搜索范围和将高维向量空间分解为低维子空间。

ModaHub魔搭社区:向量数据库Zilliz Cloud的ANN 搜索教程_第1张图片

缩小搜索范围是指仅在可能性较高的候选项子集中对比查询向量,从而缩短搜索时间。但是可能结果不可避免地会返回不相关的向量。

你可能感兴趣的:(《向量数据库指南》,机器学习,算法,人工智能,向量数据库,AI-native,ModaHub,milvus)