Mixpeek 如何使用 Qdrant 构建高效的多模态特征存储
Daniel Azoulai
·2025 年 4 月 8 日

Mixpeek 如何使用 Qdrant 构建高效的多模态特征存储
关于 Mixpeek
Mixpeek 是一个专为开发者和数据团队设计的多模态数据处理和检索平台。Mixpeek 由前 MongoDB 搜索专家 Ethan Steininger 创立,能够高效地摄取、提取特征并在包括视频、图像、音频和文本在内的各种媒体类型中进行检索。
挑战:优化复杂检索器的特征存储
随着 Mixpeek 的多模态数据仓库不断发展,他们的特征存储需要支持日益复杂的检索模式。最初使用 MongoDB Atlas 的向量搜索时,他们在实现结合稠密向量和稀疏向量并带有元数据预过滤的 混合检索器 时遇到了限制。
在对视频嵌入应用 ColBERT 等后期交互技术时出现了一个关键限制,这需要多向量索引。MongoDB 的 kNN 搜索无法支持这些多向量表示来实现这种上下文理解。
Mixpeek 的另一位客户需要将反向视频搜索用于程序化广告投放,这要求检索器能够在海量对象集合中识别高转化率的视频片段——这项任务在使用 MongoDB 的通用数据库特征存储时效率低下。
“我们将 Qdrant 作为我们的特征存储替换了以前的 MongoDB kNN 混合搜索,从而减少了数百行代码。”—— Ethan Steininger,Mixpeek 创始人
Mixpeek 为何选择 Qdrant 作为特征存储
在评估了包括带有 pgvector 的 Postgres 和 MongoDB 的 kNN 搜索在内的多种方案后,Mixpeek 选择 Qdrant 来为其特征存储提供支持,原因在于其在向量搜索方面的专业性以及与他们检索管道的集成能力。Qdrant 对多向量索引的原生支持对于实现 ColBERT 等后期交互技术至关重要,而 MongoDB 无法高效支持这些技术。
简化混合检索器
以前,Mixpeek 维护着复杂的自定义逻辑来合并不同特征存储的结果。Qdrant 对 Reciprocal Rank Fusion (RRF) 的原生支持简化了他们的检索器实现,将混合搜索代码减少了 80%。多向量能力还支持了更复杂的检索方法,更好地捕捉语义关系。
“使用我们以前的特征存储进行混合检索具有挑战性。使用 Qdrant,一切都水到渠成。”
通过并行检索将查询时间加快 40%
对于拥有数十亿特征的集合,Qdrant 的预取能力支持跨多个特征存储进行并行检索。这将检索器查询时间缩短了 40%,从大约 2.5 秒降至 1.3-1.6 秒。
“Qdrant 中的预取功能使我们能够同时执行多个特征存储检索,然后合并结果,完美地支持了我们的检索器管道架构。”
优化 SageMaker 特征提取工作流
Mixpeek 使用 Amazon SageMaker 进行特征提取,而数据库查询是一个显著的瓶颈。通过将 Qdrant 作为他们的特征存储,他们将查询开销减少了 50%,简化了他们的摄取管道。
“我们使用 SageMaker 进行特征提取推理,我们的特征存储查询曾经是一个显著的瓶颈。Qdrant 节省了大量时间。”
支持 Mixpeek 的分类法和聚类架构
Qdrant 在实现 Mixpeek 的分类法和聚类功能方面特别有效
分类法(类似于 JOIN)
Qdrant 的 payload 过滤功能促进了扁平分类法和分层分类法的有效实现,通过跨集合的基于相似度的“连接”实现了文档富集。
聚类(类似于 GROUP BY)
该平台的批量向量搜索功能简化了基于特征相似度的文档聚类,提供了传统“group by”接口的有效实现。
迁移特征存储后的可衡量改进
将 Qdrant 作为 Mixpeek 的特征存储带来了显著改进
- 检索器速度提高 40%:查询时间从约 2.5 秒减少到 1.3-1.6 秒
- 代码减少 80%:简化了检索器实现
- 提高了开发者生产力:更容易实现复杂的检索模式
- 优化了可扩展性:在数十亿特征规模下表现更佳
- 增强了多模态检索:更好地支持结合不同特征类型
未来方向:支持多样化的多模态用例
Mixpeek 的架构通过预构建与检索器管道紧密耦合的专用特征提取器而表现出色,从而能够高效处理多样化的多模态用例。
这种架构方法确保在摄取过程中提取的特征正是检索器高效查询所需的,消除了通常会减慢多模态系统速度的转换层。
“我们正在迈向复杂的多模态本体,而 Qdrant 作为特征存储的专业能力对于这些高级检索策略至关重要。”
结论:用于多模态数据仓库的专用特征存储
Mixpeek 的实践突显了专用特征存储在多模态数据仓库架构中的重要性。Qdrant 对向量搜索效率的关注使其成为驱动 Mixpeek 特征存储的理想选择,从而实现了更高效的检索器和摄取管道。