Qdrant Edge:嵌入式AI的向量搜索
Qdrant
·2025年7月29日

Qdrant Edge(私有测试版):嵌入式AI的向量搜索
过去两年,向量搜索已成为AI应用的基础设施,从检索增强生成(RAG)到代理推理。但是,随着AI系统从云托管推理扩展到物理世界——运行在机器人、信息亭、家庭助理和手机等设备上——新的限制随之出现。低延迟检索、多模态输入和与带宽无关的操作将成为首要要求。Qdrant Edge正是我们对这一转变的回应。
从静态RAG到嵌入式AI:向量搜索的三波浪潮
向量数据库在RAG 1.0兴起时首次获得广泛采用,它们为执行基于文本任务(如文档搜索和聊天机器人问答)的LLM提供上下文。在这些应用中,性能由过滤速度、召回准确性和对结构化元数据的混合搜索支持来定义。
这演变为Agentic AI浪潮,其中向量搜索引擎正在成为自主(软件)代理中的长期记忆模块。要求扩展到包括低延迟更新、令牌级重排序和多模态检索。Qdrant目前正在生产中为数千个此类应用提供支持——支持实时搜索、高级元数据过滤器和用于ColBERT式工作流的本地多向量语义。
现在,第三波浪潮正在兴起:嵌入式AI。这一浪潮将基于向量的推理带入没有可靠网络访问或云计算的环境。在这里,向量数据库必须在设备上运行,在内存、功耗和I/O的严格限制下。传统的向量存储——为大型服务器环境设计——不适用。
Qdrant Edge:专为设备端向量搜索而生
Qdrant Edge是一个轻量级、嵌入式向量搜索引擎,旨在在本地硬件上运行,具有有限的持久后台线程、网络访问或集中协调。它保留了Qdrant的核心搜索和过滤功能,但经过重新架构,可作为最小的本地库直接集成到边缘设备上的AI工作流中。
主要功能包括:
进程内执行:Qdrant Edge作为库运行,而不是服务。没有后台优化器或更新线程。所有操作——包括搜索和索引——都是同步的,并由应用程序控制。
最小占用空间:专为内存和计算受限环境设计。
多租户感知:适用于每个设备(例如,机器人或移动单元)作为具有隔离数据和计算的租户部署的场景。
用例和设计目标
Qdrant Edge专为在边缘、靠近数据进行推理和决策的场景而构建。示例环境包括:
- 机器人和自主导航:通过多模态向量输入(例如,摄像头、激光雷达、雷达)进行实时感知和决策。
- 移动设备:具有离线访问、设备端个性化和隐私保护搜索的本地助手功能。
- 销售点系统:在断开连接或带宽受限的环境中进行产品相似性、异常检测和决策支持。
- 物联网代理:用于状态监控、预测性维护或传感器融合的本地检索。
在这些领域中的每一个中,系统需求都与云托管向量基础设施的需求正交:短生命周期进程、严格的延迟限制和最小的运行时依赖。
Qdrant为何在边缘表现出色
Qdrant是第一个积极为嵌入式系统领域开发的生产级向量数据库。Qdrant Edge是一项专门的工程工作,旨在为在边缘工作的机器学习从业者构建一个高性能、可扩展、可嵌入的向量引擎,它基于Qdrant最初的轻量级设计,并利用了Qdrant闻名的架构优势:
- 可定制、可过滤的HNSW实现
- 稀疏和密集模态的混合搜索
- 多向量兼容性和多模态索引
- 实时摄取
Qdrant Edge将这些功能带入了一类新的部署环境。
申请私有研究测试版
Qdrant Edge目前处于私有测试阶段。由于此版本的目标性极强,我们将选择有限数量的合作伙伴,他们正在积极为嵌入式或实时环境构建AI系统。
如果您正在从事机器人技术、边缘推理、自主系统或设备原生助手方面的工作,我们鼓励您申请。
总结
嵌入式AI系统带来了独特的限制,需要我们重新思考如何设计向量数据库等基础设施。Qdrant Edge代表了一类新的工具——它将设备端推理视为一流的功能。我们很高兴与正在构建下一代智能系统的具有前瞻性思维的团队合作。
常见问题
Qdrant Edge适用于谁?
需要嵌入式或资源受限设备(如机器人、移动应用程序或物联网硬件)上的快速本地向量搜索的AI系统构建团队。
所有Qdrant用户都可以使用吗?
暂未。Qdrant Edge处于私有测试阶段。我们正在根据技术契合度和活跃的边缘部署场景选择有限数量的合作伙伴。
加入测试版的最低要求是什么?
您应该有一个明确的设备端或离线向量搜索用例。优先考虑从事嵌入式硬件或在边缘部署代理的公司。
我如何获得访问权限?
Qdrant Edge目前处于私有测试阶段。如果您正在构建边缘原生或嵌入式AI系统并希望提前访问,请申请加入测试版。