使用统计

默认情况下,Qdrant 开源容器镜像会收集用户的匿名使用统计数据,以便改进引擎。您可以随时停用,并且已经收集的任何数据都可以根据请求删除

停用此功能不会影响您通过访问数据库的 /metrics/telemetry 端点来自行监控 Qdrant 数据库。它只会停止向 Qdrant 团队发送独立的匿名使用统计数据。

我们为什么要收集使用统计数据?

我们希望让 Qdrant 快速可靠。为此,我们需要了解它在实际场景中的表现。我们在内部进行了大量基准测试,但不可能涵盖所有可能的使用案例、硬件和配置。

为了识别瓶颈并改进 Qdrant,我们需要收集有关其如何使用的信息。

此外,Qdrant 使用许多内部启发法来优化性能。为了更好地设置这些启发法的参数,我们需要收集各种代码片段的计时和计数。利用这些信息,我们可以让 Qdrant 对所有人来说都更快。

收集了哪些信息?

我们收集以下 3 种类型的信息:

  • 系统信息 - 关于系统的通用信息,例如 CPU、RAM 和磁盘类型。以及 Qdrant 实例的配置。
  • 性能 - 关于各种代码片段的计时和计数信息。
  • 关键错误报告 - 关于 Qdrant 中发生的关键错误(例如回溯)的信息。这些信息有助于识别尚未向我们报告的问题。

我们绝不收集以下信息:

  • 用户 IP 地址
  • 任何可用于识别用户或用户组织的数据
  • 存储在集合中的任何数据
  • 集合的任何名称
  • 任何 URL

我们如何对数据进行匿名化处理?

我们理解有些用户可能担心他们的数据隐私。这就是为什么我们格外努力确保您的隐私。

我们使用几种不同的技术来对数据进行匿名化处理:

  • 我们使用随机 UUID 来标识实例。此 UUID 在每次启动时生成,并且不会存储在任何地方。没有其他方法可以区分不同的实例。
  • 我们对所有大数字进行四舍五入,以便最后几位始终为 0。例如,如果数字是 123456789,我们将存储 123456000。
  • 我们将所有名称替换为不可逆的哈希值。因此,集合或字段名称不会泄露到遥测数据中。
  • 所有 URL 也会进行哈希处理。

您可以通过访问 遥测 API 并带上参数 anonymize=true 来查看匿名化收集数据的确切版本。

例如,http://localhost:6333/telemetry?details_level=6&anonymize=true

停用使用统计

您可以通过以下方式停用使用统计:

  • 将环境变量 QDRANT__TELEMETRY_DISABLED 设置为 true
  • config/production.yamlconfig/config.yaml 文件中将配置选项 telemetry_disabled 设置为 true
  • 使用 CLI 选项 --disable-telemetry

上述任一选项都将阻止 Qdrant 发送任何使用统计数据。

如果您决定停用使用统计,恳请您在 Discord 社区或 GitHub 讨论区与我们分享您的反馈意见。

请求删除信息

我们提供一个电子邮件地址,用户可以通过此地址请求从我们所有工具中完全删除他们的数据。

为此,请发送电子邮件至 privacy@qdrant.com,邮件中包含您的 Qdrant 安装生成的唯一标识符。您可以在遥测 API 响应("id" 字段)或 Qdrant 实例日志中找到此标识符。

任何关于我们收集的数据管理的问题也可以发送到此电子邮件地址。

此页面是否有用?

感谢您的反馈!🙏

很抱歉听到您这样说。😔 您可以在 GitHub 上编辑此页面,或创建一个 GitHub issue。