通过 Qdrant 的新 API 提供更好的推荐

Kacper Łukawski

2023年10月25日

Deliver Better Recommendations with Qdrant’s new API

像 Qdrant 这样的向量搜索引擎最流行的用例是使用单个查询向量进行语义搜索。给定查询，我们可以将其向量化（嵌入）并找到索引中最接近的点。但是超越搜索的向量相似性确实存在，推荐系统就是一个很好的例子。推荐可以看作是多目标搜索，我们希望找到接近正面示例而远离负面示例的项目。这种向量数据库的应用非常广泛，包括电子商务、内容甚至约会应用的推荐系统。

Qdrant 提供推荐 API 已有一段时间，在最新版本 Qdrant 1.6 中，我们很高兴为您提供更多灵活性和控制权来使用推荐 API。在这里，我们将讨论一些内部机制，并展示它们如何在实践中使用。

旧版推荐 API 回顾

Qdrant 之前的推荐 API 存在一些限制。首先，它要求为正面和负面示例点传递向量 ID。如果您想直接使用向量嵌入，您必须在集合中创建一个新点，或者通过使用搜索 API 来模拟推荐 API 的行为。此外，在 Qdrant 的先前版本中，您始终被要求提供至少一个正面示例。此要求基于用于将多个样本组合成单个查询向量的算法。这是一种简单而有效的方法。但是，如果您拥有的唯一信息是您的用户不喜欢某些项目，则无法直接使用它。

Qdrant 1.6 带来了更灵活的 API。您现在可以提供正面和负面示例的 ID 和向量。您甚至可以在单个请求中将它们组合起来。这使得新的实现向后兼容，因此您可以在不更改代码的情况下轻松升级现有 Qdrant 实例。而且 API 的默认行为仍然与以前相同。但是，我们扩展了 API，因此您现在可以选择查找推荐点的策略。

POST /collections/{collection_name}/points/recommend
{
  "positive": [100, 231],
  "negative": [718, [0.2, 0.3, 0.4, 0.5]],
  "filter": {
        "must": [
            {
                "key": "city",
                "match": {
                    "value": "London"
                }
            }
        ]
  },
  "strategy": "average_vector",
  "limit": 3
}

请求中有两个关键更改。首先，我们可以调整搜索策略，并将其设置为 average_vector（默认）或 best_score。此外，我们可以将 ID (718) 和嵌入 ([0.2, 0.3, 0.4, 0.5]) 作为正面和负面示例传递。

HNSW ANN 示例和策略

让我们从一个示例开始，以帮助您理解 HNSW 图。假设您想去另一个大陆的一个小城市旅行

您从家乡出发，乘坐公共汽车到当地机场。
然后，乘坐航班到最近的枢纽之一。
从那里，您必须乘坐另一个航班到目的地大陆的枢纽。
希望最后一班航班能到达您的目的地城市。
您还有一段当地交通工具才能到达最终地址。

这个旅程类似于 HNSW 图在 Qdrant 近似最近邻搜索中的使用。

Transport network

HNSW 是一个多层向量（嵌入）图，连接基于向量邻近度。顶层点的数量最少，这些点之间的距离最大。我们深入的层越多，点的数量越多，距离越近。图的构建方式是，每个层的点都连接到它们的最近邻居。

特定层的所有点也位于其下层，因此可以在同一位置切换搜索层。在交通网络的情况下，顶层将是航空公司枢纽，连接良好但机场之间距离很大。当地机场以及铁路和公共汽车，密度更高，距离更小，构成了中间层。最后，我们的底层由当地交通工具组成，它们最密集，点之间的距离最小。

旅行时不必检查所有可能的连接。您选择洲际航班，然后是本地航班，最后是公共汽车或出租车。所有决定都基于点之间的距离。

HNSW 中的搜索过程也基于类似地遍历图。从顶层的入口点开始，找到其最近点，然后将该点用作进入下一个最密集层的入口点。这个过程重复进行，直到我们到达最底层。访问过的点和到原始查询向量的距离保存在内存中。如果当前点的邻居都没有比最佳匹配更好，我们可以停止遍历，因为这是局部最小值。我们从最大规模开始，然后逐渐放大。

在这个过度简化的示例中，我们假设点之间的距离是唯一重要的因素。实际上，我们可能希望考虑其他标准，例如机票价格，或者由于某些限制而避免某些特定地点。这意味着，有各种策略来选择最佳匹配，在向量推荐的情况下也是如此。我们可以通过更改在遍历过程中计算候选点得分的方式来使用不同的方法来确定遍历 HNSW 图的路径。默认行为基于纯距离，但 Qdrant 1.6 为推荐 API 暴露了两种策略。

平均向量

默认策略，称为 average_vector，是之前的策略，基于正面和负面示例的平均值。它简化了推荐过程，并将其转换为单个向量搜索。它支持点 ID 和向量作为参数。例如，您可以根据过去与现有点的交互以及查询向量嵌入来获取推荐。在内部，该机制基于正面和负面示例的平均值，并使用以下公式计算

$$ \text{平均向量} = \text{avg}(\text{正面向量}) + \left( \text{avg}(\text{正面向量}) - \text{avg}(\text{负面向量}) \right) $$

average_vector 将推荐问题转换为单个向量搜索。

新热点 - 最佳得分

新策略名为 best_score。它不依赖于平均值，并且更灵活。它允许您只传递负面样本，并在内部使用稍微复杂的算法。

最佳得分在 HNSW 图遍历的每一步中选择。我们分别计算遍历点与每个正面和负面示例之间的距离。在最佳得分策略的情况下，不再有单个查询向量，而是一堆正面和负面查询。因此，对于查询中的每个样本，我们都有一组距离，每个样本一个。在下一步中，我们简单地取正面和负面的最佳得分，创建两个单独的值。最佳得分只是查询与正面和负面的最近距离。其思想是：如果一个点比任何正面示例更接近任何负面示例，我们就不想要它。我们惩罚接近负面示例，因此我们不直接使用相似度值，而是检查它是否更接近正面或负面示例。以下公式用于计算遍历的潜在点的得分

// Sigmoid function to normalize the score between 0 and 1
let sigmoid = |x| 0.5 * (1.0 + (x / (1.0 + x.abs())));

let score = if best_positive_score > best_negative_score {
    sigmoid(best_positive_score)
} else {
    -sigmoid(best_negative_score)
};

如果该点更接近负面示例，我们通过取最佳负面得分的负平方值来惩罚它。对于更接近的负面示例，候选点的得分将始终小于或等于零，这使得选择该点的机会显著降低。但是，如果最佳负面得分高于最佳正面得分，我们仍然更喜欢那些离负面示例更远的点。该过程有效地将遍历过程从负面示例中拉开。

如果您想了解有关 HNSW 内部机制的更多信息，可以查看有关可过滤 HNSW 的文章，该文章对此主题进行了全面介绍。

美食发现演示

我们的美食发现演示是一个基于新推荐 API 构建的应用程序。它允许您根据喜欢和不喜欢的照片查找餐点。新 Qdrant 版本带来了一些更新

能够在推荐请求中包含多个文本查询。 以前，我们只允许传递单个查询来解决冷启动问题。现在，您可以传递多个查询，并将它们与喜欢/不喜欢的照片混合使用。这之所以成为可能，是因为参数的灵活性。我们可以在同一个请求中传递点 ID 和嵌入向量，而用户查询显然不属于集合的一部分。
在推荐策略之间切换。 您现在可以选择 average_vector 和 best_score 评分算法。

策略之间的差异

美食发现演示的 UI 允许您在策略之间切换。best_vector 是默认策略，但只需一个开关，您就可以看到使用旧的 average_vector 策略时结果有何不同。

如果您只选择一个正面示例，两种算法的工作方式是相同的。

一个正面示例

只有当您开始添加更多示例，特别是选择一些负面示例时，差异才会显现出来。

一个正面和一个负面示例

我们添加的喜欢和不喜欢越多，best_score 策略的结果就越多样化。在旧策略中，只有一个向量，因此所有示例都与它相似。新策略分别考虑所有示例，使多样性更丰富。

多个正面和负面示例

选择正确的策略取决于数据集，嵌入在这里起着重要作用。因此，始终值得尝试这两种策略并在特定情况下比较结果。

仅处理负面示例

在我们的美食发现演示中，只传递负面图像可以作为异常检测机制。虽然数据集应该只包含食物照片，但实际上并非如此。找到这些异常的一种简单方法是将食物照片作为负面示例传递，从而导致结果是最“不像”食物的图像。在我们的例子中，您会看到药瓶和书籍。

average_vector 策略仍然要求提供至少一个正面示例！ 但是，由于演示中使用的集合设置了余弦距离，我们使用之前文章中描述的技巧进行了模拟。简而言之，如果您只传递负面示例，它们的向量将被平均，并将否定后的结果向量用作搜索端点的查询。

仅限负面示例

尽管如此，两种方法仍然返回不同的结果，因此它们根据所提出的问题和使用的数据集各有其用武之地。

多模态的挑战

美食发现使用 CLIP 嵌入模型，它是多模态的，允许将图像和文本编码到同一个向量空间中。使用此模型可以进行图像查询、文本查询，或将它们结合起来。我们利用了更新后的演示中的该机制，允许您传递文本查询以进一步过滤结果。

单个文本查询

文本查询可以与喜欢和不喜欢的照片混合使用，因此您可以将它们组合在一个请求中。但是，如果您开始添加负面示例，您可能会对新策略获得的结果感到惊讶。

带有负面示例的单个文本查询

这是一个与嵌入本身相关的问题。我们的数据集中包含许多彼此非常接近的图像嵌入。另一方面，我们的文本查询与大多数图像嵌入相距甚远，但与其中一些相对接近，因此文本到图像搜索似乎运行良好。当所有查询项都来自同一领域（例如仅文本）时，一切都正常。但是，如果我们将正面文本和负面图像嵌入混合，则 best_score 的结果会被负面样本淹没，因为它们只是更接近数据集嵌入。如果您遇到此类问题，average_vector 策略可能是一个更好的选择。

查看演示

美食发现演示在线可用，您可以测试并查看差异。这是一个开源项目，您可以轻松地自行部署。源代码可在 GitHub 存储库中获取，README 描述了设置过程。由于计算嵌入需要一段时间，我们预先计算了它们并将其导出为快照，可以轻松导入任何 Qdrant 实例。不过，Qdrant Cloud 是最简单的入门方式！

文章