向量数据库

向量数据库的量化压缩：从Product Quantization到RaBitQ的二十年技术博弈

一台配备64GB内存的服务器，要索引十亿个768维的向量，需要多少存储空间？答案是超过3TB。而标准的内存索引方案，比如HNSW，要求将所有数据加载到内存中才能保证查询延迟在毫秒级。这意味着，即使是企业级的服务器，也无法在单机上完成这项任务。云服务器的内存按GB计费，3TB内存的月成本可能高达数千美元——这才是向量数据库规模化部署面临的真正瓶颈。 ...

HNSW：为什么这个图算法正在统治AI时代的向量检索

2016年3月，Yury Malkov和Dmitry Yashunin在arXiv上发表了一篇题为《Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small World graphs》的论文。这篇论文提出的HNSW算法，在随后的几年里成为了几乎所有主流向量数据库的核心索引——Elasticsearch、Milvus、Pinecone、Weaviate、Qdrant无一例外。 ...