GitHub 热榜GitHub Trending · 日·1 小时前

alibaba/zvec：轻量级极速进程内向量数据库

原标题：alibaba/zvec

C++★ 10,282 stars+251 今日

速览

zvec 是一个由阿里巴巴开发的轻量级、高性能的进程内向量数据库，专为低延迟和高吞吐量的向量检索场景设计。它无需部署独立的数据库服务，可直接嵌入到应用程序中运行，非常适合对响应速度要求极高的 AI 应用、RAG 系统或嵌入式场景。

AI 深度解读

这是什么

Zvec 是一个开源的、进程内（in-process）向量数据库，主要由 Alibaba 开发，主语言为 C++。它在 GitHub 上获得了极高的关注度（Star 数超过 10,000），旨在为应用程序提供轻量级、极速且易于集成的相似度搜索能力。

与传统需要独立部署服务端（如 Elasticsearch 或 Milvus 集群）的向量数据库不同，Zvec 以库的形式直接嵌入到宿主应用中运行。这意味着开发者无需管理额外的服务器进程、配置文件或网络通信开销。该项目已在阿里巴巴集团内部经过大规模生产环境验证，具备低延迟、高可扩展性和数据持久化的生产级特性。

解决的问题

Zvec 主要解决了传统向量数据库在集成复杂度、资源开销和部署灵活性方面的痛点：

部署与维护成本高：传统方案通常需要独立部署数据库服务，涉及复杂的集群管理、网络配置和运维监控。Zvec 作为进程内库，消除了这些基础设施负担。
延迟敏感场景需求：对于需要毫秒级响应的高并发应用，网络往返（RTT）和序列化/反序列化开销可能成为瓶颈。Zvec 直接在内存中操作数据，极大降低了查询延迟。
边缘与轻量级环境限制：在 Notebook、CLI 工具、边缘设备或资源受限的环境中，运行一个完整的数据库服务往往不切实际。Zvec 的轻量级特性使其能在这些场景中无缝运行。
混合检索复杂性：现代应用往往需要同时结合向量相似度、全文关键词匹配和结构化过滤。Zvec 原生支持混合检索，避免了在多个独立系统间协调查询的复杂性。

核心功能

混合检索（Hybrid Retrieval）：支持在单次查询中融合密集向量（Dense Vectors）、稀疏向量（Sparse Vectors）、全文搜索（FTS）和标量过滤（Scalar Filters）。开发者可以使用自然语言或结构化表达式进行查询，无需依赖外部搜索引擎。
原生全文搜索（Native FTS）：从 v0.5.0 版本开始，Zvec 引入了原生的全文搜索功能。任何字符串字段都可以附加 FTS 索引，支持关键词匹配和自然语言查询，彻底摆脱了对 Elasticsearch 等外部组件的依赖。
多向量与稀疏向量支持：除了标准的密集向量，Zvec 还支持稀疏嵌入（Sparse Embeddings）和多向量查询。这为处理长文本、关键词匹配或结合多种嵌入模型提供了灵活性。
DiskANN 索引：引入了基于 DiskANN 的磁盘索引技术。该索引将大部分数据保留在磁盘上，仅将关键部分加载到内存，从而显著降低大规模数据集的内存占用，同时保持较高的搜索速度。
数据持久化与并发访问：
- WAL（预写日志）：通过 Write-Ahead Logging 机制保证数据持久性，即使进程崩溃或断电，数据也不会丢失。
- 并发控制：支持多进程同时读取同一集合，写入操作则采用单进程独占模式，平衡了读写性能与数据一致性。
多语言 SDK 支持：提供官方 SDK，覆盖主流开发语言：
- Python：pip install zvec（支持 Python 3.10–3.14）
- Node.js：npm install @zvec/zvec
- Go：高性能 Go 绑定
- Rust：高性能 Rust 绑定
- Dart/Flutter：flutter pub add zvec
跨平台兼容：支持 Linux (x86_64, ARM64)、macOS (ARM64) 和 Windows (x86_64)，并新增了对 RISC-V 架构的支持。

亮点 / 与同类相比

极致轻量与“即插即用”：与 Milvus、Chroma 或 Pinecone 等需要独立服务或云托管的方案相比，Zvec 的核心优势在于“零配置”。安装后直接在代码中 create_and_open 即可使用，无需启动后台服务。
混合检索原生集成：许多向量数据库需要结合 Elasticsearch 或 OpenSearch 才能实现高质量的全文+向量混合搜索。Zvec 将 FTS 和向量搜索整合在同一引擎中，简化了架构栈。
生产级性能验证：作为阿里巴巴内部广泛使用的组件，Zvec 经过了大量真实业务场景的考验，具备处理十亿级向量的能力，并在毫秒级延迟下保持高吞吐。
灵活的索引类型：支持从纯内存索引到基于磁盘的 DiskANN 索引，用户可以根据数据规模和硬件资源灵活选择，实现内存与存储成本的平衡。
可视化调试工具：提供 Zvec Studio 可视化工具，允许开发者在不编写代码的情况下浏览数据、调试查询，降低了学习和排查问题的门槛。

适合谁用 / 上手

适合人群：

全栈/后端开发者：希望在不引入复杂基础设施的情况下，为应用添加语义搜索、推荐系统或 RAG（检索增强生成）功能的团队。
边缘计算/IoT 开发者：需要在资源受限设备上运行向量搜索的应用场景。
数据科学家/分析师：在 Jupyter Notebook 或本地环境中快速原型化向量搜索逻辑。
对延迟敏感的应用：需要极低查询延迟的实时推荐、即时搜索或个性化引擎。

快速上手示例（Python）：

import zvec

# 1. 定义集合模式
schema = zvec.CollectionSchema(
    name="example",
    vectors=zvec.VectorSchema("embedding", zvec.DataType.VECTOR_FP32, 4),
)

# 2. 创建并打开集合（数据持久化到本地路径）
collection = zvec.create_and_open(path="./zvec_example", schema=schema)

# 3. 插入文档
collection.insert([
    zvec.Doc(id="doc_1", vectors={"embedding": [0.1, 0.2, 0.3, 0.4]}),
    zvec.Doc(id="doc_2", vectors={"embedding": [0.2, 0.3, 0.4, 0.1]}),
])

# 4. 执行向量相似度搜索
results = collection.query(
    zvec.VectorQuery("embedding", vector=[0.4, 0.3, 0.3, 0.1]),
    topk=10
)

# 5. 获取结果（按相关性排序）
print(results)

安装方式：

Python: pip install zvec
Node.js: npm install @zvec/zvec
Go/Rust: 通过官方 SDK 包管理器安装
Flutter: flutter pub add zvec

对于希望从源码构建或了解详细基准测试数据的用户，可参考项目文档中的 Building from Source 和 Benchmarks 指南。

查看原文 →github.com