使用统计信息

Qdrant 开源容器镜像默认会收集用户的匿名使用统计信息,以改进引擎。您可以随时停用此功能,并且可以按要求删除任何已经收集的数据。

停用此功能不会影响您通过访问数据库的 /metrics/telemetry 端点自行监控 Qdrant 数据库的能力。它只会停止向 Qdrant 团队发送独立的、匿名的使用统计信息。

为什么要收集使用统计信息?

我们希望使 Qdrant 变得快速且可靠。为此,我们需要了解它在实际场景中的表现。我们在内部进行了大量的基准测试,但不可能覆盖所有可能的用例、硬件和配置。

为了识别瓶颈并改进 Qdrant,我们需要收集有关其使用方式的信息。

此外,Qdrant 使用了一系列内部启发式算法来优化性能。为了更好地设置这些启发式算法的参数,我们需要收集各种代码片段的计时和计数器。有了这些信息,我们可以让 Qdrant 对每个人来说都变得更快。

收集哪些信息?

我们收集 3 种类型的信息:

  • 系统信息 - 有关系统的常规信息,例如 CPU、RAM 和磁盘类型。以及 Qdrant 实例的配置。
  • 性能 - 有关各种代码片段的计时和计数器的信息。
  • 关键错误报告 - 有关 Qdrant 中发生的关键错误的信息,例如回溯(backtraces)。此信息使我们能够识别尚未有人向我们报告的问题。

我们绝不收集以下信息:

  • 用户的 IP 地址
  • 任何可用于识别用户或用户所在组织的数据
  • 存储在集合(collections)中的任何数据
  • 任何集合的名称
  • 任何 URL

我们如何对数据进行匿名化处理?

我们理解一些用户可能担心他们数据的隐私。这就是为什么我们要付出额外的努力来确保您的隐私。

我们使用几种不同的技术来对数据进行匿名化处理:

  • 我们使用随机 UUID 来标识实例。此 UUID 在每次启动时生成,不会存储在任何地方。没有其他方法可以区分不同的实例。
  • 我们会对所有大数字进行舍入,使得末位数字始终为 0。例如,如果数字是 123456789,我们将存储 123456000。
  • 我们将所有名称替换为不可逆的哈希值。因此,任何集合或字段名称都不会泄露到遥测数据中。
  • 所有的 URL 也经过了哈希处理。

您可以通过访问 遥测 API 并使用 anonymize=true 参数来查看匿名收集数据的确切版本。

例如:https://:6333/telemetry?details_level=6&anonymize=true

停用使用统计信息

您可以通过以下方式停用使用统计信息:

  • 将环境变量 QDRANT__TELEMETRY_DISABLED 设置为 true
  • config/production.yamlconfig/config.yaml 文件中将配置选项 telemetry_disabled 设置为 true
  • 使用 CLI 选项 --disable-telemetry

以上任何一种选项都将阻止 Qdrant 发送任何使用统计数据。

如果您决定停用使用统计信息,我们恳请您在 Discord 社区 或 GitHub 讨论区 与我们分享您的反馈。

请求删除信息

我们提供了一个电子邮件地址,以便用户可以请求从我们所有的工具中彻底删除其数据。

为此,请发送电子邮件至 privacy@qdrant.com,并在邮件中包含为您安装的 Qdrant 生成的唯一标识符。您可以在遥测 API 响应("id" 字段)中或 Qdrant 实例的日志中找到此标识符。

关于我们所收集数据的任何管理问题,也可以发送至此电子邮件地址。

此页面有用吗?

感谢您的反馈!🙏

听到这个消息我们很遗憾。😔 您可以在 GitHub 上编辑此页面,或者创建一个 GitHub Issue。