0

通过实时精度和规模赋能 QA.tech 的测试代理

Qdrant

·

2024 年 11 月 21 日

Empowering QA.tech’s Testing Agents with Real-Time Precision and Scale

qdrant-qatech-1

QA.tech 是一家专注于 AI 驱动自动化测试解决方案的公司,他们发现构建和全面测试 Web 应用程序,尤其是端到端测试,可能复杂且耗时。与单元测试不同,端到端测试揭示了浏览器中实际发生的情况,通常能发现其他方法遗漏的问题。

传统的解决方案(如硬编码测试)不仅设置费力,而且长期维护也充满挑战。或者,雇佣 QA 测试人员可以是一种解决方案,但对于初创公司而言,这很快就会成为瓶颈。每次发布都需要更多的测试人员,如果将测试外包,管理时间线和确保质量将变得更加困难。

为了解决这个问题,QA.tech 开发了测试代理,它们像用户一样在浏览器上执行任务——例如,在旅行应用程序上购买机票。这些代理导航整个预订过程,从搜索航班到完成购买,同时评估其成功。它们记录错误,记录过程,并标记问题供开发人员审查。 通过访问控制台日志和网络调用,开发人员可以轻松分析每个步骤,快速理解和调试出现的任何问题。

qdrant-qatech-2

QA.tech AI 代理的输出

是什么促使 QA.tech 使用向量数据库?

QA.tech 最初使用 pgvector 处理更简单的向量用例,但随着需求增长,遇到了可伸缩性限制,促使他们采用 Qdrant。他们需要一个向量数据库,能够处理高速、实时分析,以支持其 AI 代理,这些代理在观察和解释网页操作的分析层中运行。这个分析层严重依赖多模态模型和大量的子处理,以使 AI 代理能够做出明智的实时决策。

在某些 Web 界面中,可能发生数百个操作,实时处理它们(尤其是在每次点击时)可能会很慢。动态 Web 元素和不断变化的标识符进一步使这变得复杂,导致传统方法不可靠。为了解决这些挑战,QA.tech 对特定操作进行了自定义嵌入训练,这显著加快了决策速度。

这种设置需要频繁的嵌入查找,为每次交互生成大量的数据库调用。正如 QA.tech 的 Vilhelm von Ehrenheim 所解释的:

“每次点击都会产生大量的嵌入、大量的调用和大量的数据库查找,这需要良好地扩展。”

Qdrant 快速、可扩展的向量搜索使 QA.tech 能够无缝处理这些高速查找,确保代理保持响应并能够实时做出快速、准确的决策。

为什么 QA.tech 选择 Qdrant 作为其 AI 代理平台

QA.tech 的 AI 代理处理高速 Web 操作,需要高效的实时操作和可扩展的基础设施。团队面临管理网络开销、CPU 负载以及存储不同用例的多个嵌入的挑战。Qdrant 提供了解决这些问题的方案。

通过批量操作减少网络开销

在 Web 界面上单独处理数百个同时操作会产生显著的网络开销。Von Ehrenheim 解释说:“单独调用所有这些操作会产生大量网络开销。” Qdrant 的批量操作允许 QA.tech 同时处理多个操作,从而减少网络流量并提高效率。此功能对于 AI 代理至关重要,因为实时响应能力是关键。

优化嵌入处理的 CPU 负载

PostgreSQL 的事务保证在处理嵌入时会导致高 CPU 使用率,尤其是在大规模情况下。Von Ehrenheim 指出,添加许多新嵌入“需要更多的 CPU”,这导致了性能瓶颈。Qdrant 的架构有效地处理大规模嵌入,防止 CPU 过载并确保流畅、不间断的性能,这是 AI 代理的关键要求。

管理用于不同用例的多个嵌入

AI 代理需要灵活地处理实时操作和上下文感知任务。QA.tech 需要不同的嵌入用于即时操作处理和更深入的语义搜索。Von Ehrenheim 提到:“我们使用一个嵌入进行高速操作,但我也想存储其他类型的嵌入用于分析目的。

Qdrant 能够为每个数据点存储多个嵌入,这使得 QA.tech 能够满足这些多样化的需求,而不会增加复杂性。

QA.tech 如何克服 AI 代理开发中的关键挑战

构建可靠的 AI 代理带来了独特的复杂性,尤其是在工作流变得更加多步骤和动态时。

“你要求代理执行的步骤越多,就越难确保一致的性能,”QA.tech 联合创始人 Vilhelm von Ehrenheim 说。

每个附加操作都会增加相互依赖变量的层,如果不仔细管理,这些变量很容易导致错误。

Von Ehrenheim 还指出了当前大型语言模型 (LLM) 的局限性,他指出“LLM 变得越来越强大,但它们仍然在多步骤推理和例如处理细微的视觉变化(如暗模式或自适应 UI)方面存在困难。” 这些挑战使得代理必须具备精确的规划能力和上下文感知能力,QA.tech 通过实施自定义嵌入和多模态模型解决了这些问题。

这就是可扩展、自适应的基础设施变得至关重要的地方,”Von Ehrenheim 补充道。Qdrant 对 QA.tech 来说至关重要,它提供稳定、高性能的向量搜索,以支持苛刻的工作流。“有了 Qdrant,我们能够处理这些复杂、高速的任务,而不会影响可靠性。”

免费开始使用 Qdrant

开始使用