Voiceflow 与 Qdrant:通过可扩展的向量搜索赋能无代码 AI 代理创建
Qdrant
·2024年12月10日


Voiceflow 通过拖放界面设计工作流,使企业能够在无代码环境中创建 AI 代理。该平台允许开发人员托管和自定义聊天机器人界面,而无需构建自己的 RAG 管道,开箱即用,并且易于适应特定用例。Voiceflow 云基础设施负责人 Xavier Portillo Edo 表示:“Voiceflow 由自然语言理解 (NLU)、大型语言模型 (LLM) 和 Qdrant 作为向量搜索引擎等技术提供支持,服务于包括为内部和外部 AI 用例开发聊天机器人的企业在内的各种客户。”
评估标准
Voiceflow 机器学习团队负责人 Denys Linkov 解释了构建托管 RAG 解决方案的历程。“最初,我们的产品侧重于用户手动定义画布上的步骤。ChatGPT 发布后,我们添加了基于 AI 的响应,并于 2023 年春季推出了我们的托管 RAG 解决方案,”Linkov 说道。
作为此开发的一部分,Voiceflow 工程团队正在寻找一种向量数据库解决方案来支持他们的 RAG 设置。他们根据几个关键因素评估了各种向量数据库:
- 性能:处理 Voiceflow 所需规模的能力,有效支持数十万个项目。
- 元数据:标记数据和分块并根据这些值检索的能力,这对于快速组织和访问特定信息至关重要。
- 托管解决方案:提供具有自动化维护、扩展和安全功能的托管服务,使团队摆脱基础设施的担忧。
“我们最初使用 Pinecone,但最终切换到 Qdrant,”Linkov 指出。切换的原因包括:
- 扩展能力:Qdrant 提供强大的多节点设置,具有水平扩展功能,允许通过添加更多节点并在它们之间分配数据和负载来扩展集群。这确保了高性能和弹性,这对于处理大规模项目至关重要。
- 基础设施:Portillo Edo 表示:“Qdrant 提供强大的基础设施支持,允许使用 AWS Private Links 与 AWS 上的虚拟私有云集成,并确保使用 AWS KMS 进行加密。此设置可确保高安全性和可靠性。”
- 响应迅速的 Qdrant 团队:Linkov 补充道:“Qdrant 团队响应非常迅速,功能发布迅速,是很好的合作伙伴。”
迁移与上线
Voiceflow 通过创建备份并通过随机检查和关键客户验证确保数据一致性,开始向 Qdrant 迁移。Linkov 解释说:“一旦我们对稳定性充满信心,我们就将主数据库切换到 Qdrant,顺利完成了迁移。”
在上线过程中,Voiceflow 从命名空间过渡到 Qdrant 的集合,后者提供了增强的灵活性和高级向量搜索功能。他们还实施了量化以提高数据处理效率。这个全面的过程确保了向 Qdrant 强大基础设施的无缝过渡。
RAG 管道设置
Voiceflow 的 RAG 管道设置提供了一个流线型流程,用于从各种来源上传和管理数据,旨在在每个步骤提供灵活性和自定义功能。
- 数据上传:客户可以通过 API 从 URL、PDF、Word 文档和纯文本格式等来源上传数据。支持与 Zendesk 等平台集成,用户可以选择单次上传或基于刷新的上传。
- 数据摄取:一旦数据摄取,Voiceflow 会提供用于数据检查的预设策略。用户可以利用这些策略,或通过 API 选择更多自定义功能,以根据需要调整摄取过程。
- 元数据标记:元数据标签可以在摄取过程中应用,这有助于组织和促进后续高效的数据检索。
- 数据检索:在检索时,Voiceflow 提供可以修改用户问题的提示,通过添加上下文、变量或其他修改。这种自定义包括添加角色或将响应结构化为 Markdown。根据交互类型(例如,用于图像检索的按钮、带图像的轮播),这些提示以结构化格式显示给用户。
这种全面的设置确保 Voiceflow 用户可以高效地管理和自定义他们的数据工作流,为构建 AI 驱动的应用程序提供了强大的解决方案。
Voiceflow 如何使用 Qdrant
Voiceflow 利用 Qdrant 的强大功能和基础设施来优化其 AI 助手平台。以下是他们如何利用这些功能的详细信息:
数据库功能
- 量化:此功能通过减小向量大小来帮助 Voiceflow 执行高效的数据处理,从而加快搜索速度。该团队特别使用了乘积量化。
- 分块搜索:Voiceflow 使用分块搜索通过将大型数据集分解为可管理的分块来提高搜索效率,从而实现更快、更高效的数据检索。
- 稀疏向量搜索:尽管尚未实施,但正在探索此功能以进行更精确的关键字搜索。Linkov 表示:“这是 Qdrant 团队在此方面采取的一个令人鼓舞的方向,因为许多用户寻求更精确的关键字搜索。”
架构
- 节点池:为公共云用户使用大型节点池,确保可扩展性,同时为私有云用户提供几个较小的、独立的实例,提供增强的安全性。
基础设施
- 私有链接:跨不同实例使用私有链接连接的能力是一个显著优势,需要 Qdrant 强大的基础设施支持。Linkov 解释说:“此设置对于 SOC2 合规性至关重要,Qdrant 的支持团队通过确保可行性并协助实施,使过程无缝衔接。”
通过利用这些功能,Voiceflow 确保其平台具有可扩展性、安全性和高效性,满足其用户的多样化需求。
成果
Voiceflow 通过利用 Qdrant 的功能实现了显著的改进和效率:
- 增强的元数据标记:实施了强大的元数据标记,允许自定义字段和标签,从而促进高效的搜索过滤。
- 优化性能:通过优化索引策略,解决了在高标签数量下的检索时间问题,实现了高效性能。
- 最小化运营开销:运营开销最小化,简化了运营流程。
- 面向未来:期待通过多令牌注意力在混合搜索方面进一步创新。
- 多租户支持:利用 Qdrant 高效且隔离的数据管理来支持多样化的用户需求。
总的来说,Qdrant 的功能和基础设施为 Voiceflow 提供了稳定、可扩展和高效的数据处理和检索解决方案。
下一步
Voiceflow 计划通过更多过滤和自定义选项来增强其平台,允许开发人员托管和自定义聊天机器人界面,而无需构建自己的 RAG 管道。