
Redpanda Connect 是一种声明式、与数据无关的流服务,旨在实现高效、无状态的处理步骤。它提供基于事务的弹性和背压机制,确保在连接到至少一次源和汇时实现至少一次交付,而无需在传输过程中持久化消息。
Connect 流水线使用 YAML 文件配置,该文件分层组织组件。每个部分代表不同类型的组件,例如输入、处理器和输出,它们可以包含嵌套的子组件和动态值。
Qdrant 输出组件允许将矢量数据流式传输到 RedPanda 流水线中的 Qdrant 集合。
示例
一旦设置了输入和处理器,输出的示例配置将如下所示:
input:
# https://docs.redpanda.com/redpanda-connect/components/inputs/about/
pipeline:
processors:
# https://docs.redpanda.com/redpanda-connect/components/processors/about/
output:
label: "qdrant-output"
qdrant:
max_in_flight: 64
batching:
count: 8
grpc_host: xyz-example.eu-central.aws.cloud.qdrant.io:6334
api_token: "<provide-your-own-key>"
tls:
enabled: true
# skip_cert_verify: false
# enable_renegotiation: false
# root_cas: ""
# root_cas_file: ""
# client_certs: []
collection_name: "<collection_name>"
id: root = uuid_v4()
vector_mapping: 'root = {"some_dense": this.vector, "some_sparse": {"indices": [23,325,532],"values": [0.352,0.532,0.532]}}'
payload_mapping: 'root = {"field": this.value, "field_2": 987}'