Alhena AI 如何通过 Qdrant 统一其 AI 堆栈并提高电子商务转化率

Daniel Azoulai

2025 年 7 月 10 日

How Alhena AI unified its AI stack and improved ecommerce conversions with Qdrant

主页
/
博客
/
Alhena AI 如何通过 Qdrant 统一其 AI 堆栈并提高电子商务转化率

本页内容

Alhena AI 如何通过 Qdrant 统一其 AI 堆栈并加速电子商务成果

How Alhena AI unified its AI stack and improved ecommerce conversions with Qdrant

构建可带来收入并提供支持结果的 AI 代理

Alhena AI 正在通过智能代理重新定义电子商务体验，这些代理在购买前后协助客户。在前端，这些代理帮助用户根据细微的偏好找到完美的产品。在后端，它们无需升级到人工即可解决复杂的支持查询。

为了提供这种体验，Alhena 必须结合自然语言理解、上下文感知检索和高性能基础设施。这意味着构建的代理不仅要快速准确，还要能够跨具有截然不同目录和架构的客户进行扩展。

基础设施挑战：碎片化的向量搜索，复杂性不断增加

随着 Alhena 开始吸引更多电子商务客户，其向量搜索层开始承受不住压力。团队正在同时处理 FAISS 和 Pinecone，每个都是为不同需求选择的。FAISS 轻巧且易于用于小型索引，但缺乏强大的过滤和可扩展性。Pinecone 更好地处理大型索引，但对小型索引引入延迟，并且对高级过滤或稀疏嵌入的支持有限。

为了实现这一点，工程师编写了自定义路由逻辑，根据用例决定使用哪个索引。他们在 FAISS 上叠加了 SQL 系统以模拟元数据过滤器。他们通过后处理绕过 Pinecone 的限制。结果是日益复杂的纠缠，减缓了客户入职速度，降低了系统可靠性，并限制了产品路线图。

这种复杂性影响了业务。新的客户部署需要耗时的后端调整。拥有大量目录的大型电子商务客户会遇到代理响应延迟。而且不同索引类型之间不一致的行为使得更难保证延迟和答案质量的 SLA。

Alhena 选择 Qdrant 的原因：所有工作负载的单一后端

Alhena 着手寻找一种解决方案，可以统一所有客户和工作负载的向量搜索层。它需要一个系统，能够以一致的性能支持小型和大型索引，提供真正的混合搜索功能，并处理元数据过滤和提升，而无需额外的基础设施层。

经过概念验证，Alhena 将其 100% 的流量迁移到 Qdrant 云。这次整合使团队能够淘汰 FAISS、Pinecone 和 Weaviate，从而简化了基础设施和部署工作流程。

“我们用 Qdrant 云取代了 FAISS、Pinecone 和 Weaviate。它简化了一切，并全面提升了我们的性能。”
—— Kshitiz Parashar，Alhena AI 创始工程师兼向量基础设施主管

通过性能、灵活性和控制释放业务价值

迁移到 Qdrant 带来了立竿见影的技术优势。但更重要的是，它为 Alhena 的业务开启了新的能力。

通过在单一查询中支持密集和稀疏嵌入，Qdrant 的混合搜索使代理能够为更广泛的客户查询返回更相关的结果。这导致了更好的产品推荐，直接影响了电子商务网站的转化率。结合元数据过滤器和实时提升，代理现在可以根据零售商的业务优先级调整答案，例如推广高利润 SKU 或降低缺货商品的优先级。

有了 Qdrant 处理检索，Alhena 不再需要为每个客户定制基础设施。无论目录大小如何，代理都可以在几分钟内部署。这意味着更快的入职、更少的实施障碍以及随着公司规模扩大而更可预测的利润。

“AI 能回答的问题越多，我们的客户就能获得越多的收入。Qdrant 帮助我们提供更好的上下文和更准确的答案。”
—— Kshitiz Parashar

达到生产级性能目标

延迟是 Alhena 的一个关键指标。使用 FAISS 时，包含 100,000 多个商品的目录的向量搜索远远超出了他们的延迟预算。这延迟了代理响应流的启动，使 AI 感觉迟钝并损害了用户体验。Pinecone 在大型索引方面有所帮助，但对小型索引引入了延迟，并且无法处理混合过滤需求。

Qdrant 将相同数据集上的检索延迟降低了高达 90%。这使 Alhena 能够满足其从查询到第一个 token 的内部 P95 SLA，即使在考虑了幻觉检测、策略执行和上下文重写之后。

“我们追踪每一毫秒。Qdrant 帮助我们大规模将向量检索时间缩短了 90%。这就是我们能够保持在延迟 SLA 以下的原因。”
—— 康志豪

为速度和安全而构建的生产架构

Alhena 的代理平台由多个智能子系统组成，每个子系统都扮演着独特的角色。当查询到来时，它会进行上下文重写，由策略执行器评估安全性，并由事实验证代理检查是否存在幻觉风险。这些组件并行运行，并带有令牌缓冲以避免阻塞响应时间。

Qdrant 为此代理管道提供相关块和结构化知识的检索层。它实现了快速、过滤、排名靠前的结果，同时满足了每个电子商务客户的语义意图和业务约束。

在向量搜索查询中提升特定项目的能力已被证明特别有价值。Alhena 的客户现在可以直接在其产品推荐逻辑中推广季节性优惠或品牌优先商品，而无需更改上游 LLM 行为。

多租户是扩展的关键

多租户在 Alhena 扩展能力的同时保持精益运营方面发挥了关键作用。Alhena 没有为每个客户创建一个单独的集合，而是在共享集合中隔离数据，在不引入额外基础设施复杂性的情况下保留了租户级别边界。这种模型极大地减少了集合蔓延，简化了版本控制，并使团队能够支持数十万最终客户，同时只维护少数几个集合。

“多租户是我们发现非常有益的一项功能。它使我们能够扩展到数十万客户，同时只管理少量集合，从而避免了集合管理中的挑战。此外，我们还能在他们自己的搜索空间中进行搜索。对于每家公司，我们都实施了精细的版本控制，以确保在新训练完成后零停机。”
—— 康志豪，Alhena AI 创始人工智能工程师

通过 Qdrant 云简化全球部署

Alhena 为美国和欧盟的客户提供服务，数据驻留问题日益突出。在 Qdrant 之前，使用 FAISS 或 Pinecone 托管和扩展区域实例需要自定义 Kubernetes 部署和持久存储管理。现在，借助 Qdrant 云，团队只需点击几下即可在任何区域启动托管集群。

功能升级是无缝的。提升、混合搜索和稀疏-密集融合都已集成，而无需破坏性更改。随着 Alhena 需求的演进，Qdrant 的托管基础设施保持同步，因此在构建新产品功能时不再需要与数据库“斗争”。

“我们两周内就上线了。当 Qdrant 发布像提升这样的功能时，我们可以在同一天开始使用它。这种敏捷性确实很重要。”
—— Kshitiz Parashar

启用产品创新的下一阶段

有了统一的高性能向量后端，Alhena 现在正在为未来而努力。多模态搜索已在路线图上，允许用户上传照片并找到视觉上相似的产品。Qdrant 的图像-文本嵌入支持使这变得简单。团队计划部署一个独立的视觉嵌入集合，而无需触及核心检索系统。

“我们正在使用 Qdrant 的所有功能：混合搜索、仅关键字回退、提升、过滤。无论目录有 1,000 个还是 100,000 个项目，它都能正常工作。”
—— Kshitiz Parashar

从碎片化到专注

迁移到 Qdrant 云使 Alhena 能够统一其向量基础设施，提高系统性能，并加速上市进程。工程团队现在花更少的时间管理复杂性，更多的时间构建差异化功能。客户获得更快的入职和性能更好的 AI 代理。电子商务买家获得更智能的推荐和更快的支持。

最重要的是，Alhena 现在拥有一个可以随之扩展的检索层，而不是阻碍它。

“Qdrant 为我们提供了亚秒级的混合搜索，简化了我们的堆栈，并解锁了更好的转化率。它是我们整个代理平台的基础设施基础。”
—— 康志豪