向量数据库的量化压缩:从Product Quantization到RaBitQ的二十年技术博弈
一台配备64GB内存的服务器,要索引十亿个768维的向量,需要多少存储空间? 答案是超过3TB。而标准的内存索引方案,比如HNSW,要求将所有数据加载到内存中才能保证查询延迟在毫秒级。这意味着,即使是企业级的服务器,也无法在单机上完成这项任务。云服务器的内存按GB计费,3TB内存的月成本可能高达数千美元——这才是向量数据库规模化部署面临的真正瓶颈。 ...
一台配备64GB内存的服务器,要索引十亿个768维的向量,需要多少存储空间? 答案是超过3TB。而标准的内存索引方案,比如HNSW,要求将所有数据加载到内存中才能保证查询延迟在毫秒级。这意味着,即使是企业级的服务器,也无法在单机上完成这项任务。云服务器的内存按GB计费,3TB内存的月成本可能高达数千美元——这才是向量数据库规模化部署面临的真正瓶颈。 ...
2016年3月,Yury Malkov和Dmitry Yashunin在arXiv上发表了一篇题为《Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small World graphs》的论文。这篇论文提出的HNSW算法,在随后的几年里成为了几乎所有主流向量数据库的核心索引——Elasticsearch、Milvus、Pinecone、Weaviate、Qdrant无一例外。 ...