Voiceflow 与 Qdrant:利用可扩展向量搜索为无代码 AI 代理创建提供动力
Qdrant
·2024 年 12 月 10 日

Voiceflow 使企业能够在无代码环境中,通过拖放界面设计工作流程来创建 AI 代理。该平台允许开发者托管和定制聊天机器人界面,而无需构建自己的 RAG pipeline,开箱即用且易于适应特定用例。Voiceflow 云基础设施主管 Xavier Portillo Edo 表示:“Voiceflow 凭借自然语言理解 (NLU)、大型语言模型 (LLM) 和 Qdrant 向量搜索引擎等技术,服务于各类客户,包括为内部和外部 AI 用例开发聊天机器人的企业。”
评估标准
Voiceflow 机器学习团队负责人 Denys Linkov 解释了构建托管 RAG 解决方案的过程。Linkov 说:“最初,我们的产品专注于用户在画布上手动定义步骤。ChatGPT 发布后,我们添加了基于 AI 的响应,并在 2023 年春季推出了我们的托管 RAG 解决方案。”
作为这项开发的一部分,Voiceflow 工程团队正在寻找一个向量数据库解决方案来为其 RAG 设置提供动力。他们根据几个关键因素评估了各种向量数据库
- 性能:能够处理 Voiceflow 所需的规模,高效支持数十万个项目。
- 元数据:能够标记数据和分块,并根据这些值进行检索,这对于快速组织和访问特定信息至关重要。
- 托管解决方案:提供具有自动化维护、扩展和安全性的托管服务,使团队摆脱基础设施方面的担忧。
Linkov 指出:“我们最初使用 Pinecone,但最终转向了 Qdrant。” 转换的原因包括
- 扩展能力:Qdrant 提供强大的多节点设置和水平扩展,允许通过添加更多节点并在它们之间分配数据和负载来扩展集群。这确保了高性能和弹性,对于处理大型项目至关重要。
- 基础设施:Portillo Edo 表示:“Qdrant 提供强大的基础设施支持,允许使用 AWS Private Links 与 AWS 上的虚拟私有云集成,并确保使用 AWS KMS 进行加密。这种设置确保了高安全性和可靠性。”
- 响应迅速的 Qdrant 团队:Linkov 补充道:“Qdrant 团队响应非常迅速,快速推出新功能,是很好的合作伙伴。”
迁移和上线
Voiceflow 通过创建备份并通过随机检查和关键客户验证来确保数据一致性,开始迁移到 Qdrant。Linkov 解释说:“一旦我们对稳定性充满信心,我们就将主数据库迁移到 Qdrant,顺利完成了迁移。”
在上线过程中,Voiceflow 从命名空间过渡到 Qdrant 的 collections,后者提供了增强的灵活性和高级向量搜索功能。他们还实施了量化 (Quantization) 以提高数据处理效率。这一全面的过程确保了平稳过渡到 Qdrant 强大的基础设施。
RAG Pipeline 设置
Voiceflow 的 RAG pipeline 设置提供了上传和管理来自各种来源数据的简化流程,旨在在每个步骤提供灵活性和定制化。
- 数据上传:客户可以通过 API 上传来自 URL、PDF、Word 文档和纯文本格式等来源的数据。支持与 Zendesk 等平台的集成,用户可以选择单次上传或基于刷新的上传。
- 数据摄取:数据摄取后,Voiceflow 提供预设的数据检查策略。用户可以利用这些策略,或通过 API 进行更多定制,以根据需要调整摄取过程。
- 元数据标记:可以在摄取过程中应用元数据标签,这有助于组织数据并促进后续的高效数据检索。
- 数据检索:在检索时,Voiceflow 提供可以通过添加上下文、变量或其他修改来修改用户问题的提示。这种定制包括添加角色或将响应结构化为 markdown。根据交互类型(例如,按钮、用于图像检索的带图像的轮播),这些提示会以结构化格式向用户显示。
这一全面的设置确保了 Voiceflow 用户可以高效地管理和定制他们的数据工作流程,为构建 AI 驱动的应用程序提供了强大的解决方案。
Voiceflow 如何使用 Qdrant
Voiceflow 利用 Qdrant 强大的功能和基础设施来优化其 AI 助手平台。以下是他们如何利用这些能力的细分
数据库功能
- 量化:此功能通过减小向量大小来帮助 Voiceflow 执行高效的数据处理,从而加快搜索速度。该团队特别使用了乘积量化 (Product Quantization)。
- 分块搜索:Voiceflow 使用分块搜索通过将大型数据集分解为可管理的块来提高搜索效率,从而实现更快、更高效的数据检索。
- 稀疏向量搜索:尽管尚未实现,但正在探索此功能以实现更精确的关键词搜索。Linkov 表示:“这是 Qdrant 团队正在努力的一个令人鼓舞的方向,因为许多用户寻求更精确的关键词搜索。”
架构
- 节点池:一个大型节点池用于公共云用户,确保可扩展性;同时,几个较小的独立实例满足私有云用户的需求,提供增强的安全性。
基础设施
- 私有链接:在不同实例之间使用私有链接连接的能力是一个显著优势,需要 Qdrant 强大的基础设施支持。Linkov 解释说:“这种设置对于 SOC2 合规性至关重要,Qdrant 的支持团队通过确保可行性并协助实施,使整个过程无缝衔接。”
通过利用这些功能,Voiceflow 确保其平台具有可扩展性、安全性和高效性,满足了其用户的多样化需求。
成果
Voiceflow 通过利用 Qdrant 的能力实现了显著的改进和效率提升
- 增强的元数据标记:实现了强大的元数据标记功能,允许自定义字段和标签,从而促进高效的搜索过滤。
- 优化性能:通过优化索引策略解决了大量标签导致的检索时间问题,实现了高效性能。
- 最低运营开销:运营开销极低,简化了他们的运营流程。
- 面向未来:期待在混合搜索和多令牌注意力方面的进一步创新。
- 多租户支持:利用 Qdrant 高效且隔离的数据管理来支持多样化的用户需求。
总而言之,Qdrant 的功能和基础设施为 Voiceflow 提供了一个稳定、可扩展且高效的数据处理和检索解决方案。
下一步
Voiceflow 计划通过更多过滤和定制选项来增强其平台,允许开发者托管和定制聊天机器人界面,而无需构建自己的RAG pipeline。