Qdrant 云推理
在 Qdrant 云中原生运行推理
Qdrant 云推理允许您直接在托管的 Qdrant 云集群中生成和存储文本和图像嵌入,从而消除了外部管道,并支持通过单个 API 进行多模态和混合搜索。
嵌入更快。查询更快。实现混合或多模态。
内置嵌入的向量搜索
在 Qdrant 云集群的网络内部生成嵌入。无需单独的模型服务器或管道。
集群内推理,更低延迟
在 AWS、Azure 或 GCP (仅限美国) 的区域内生成嵌入并运行搜索。无外部跳传,无额外出口。非常适合无法承受延迟或数据传输开销的实时应用程序。
支持密集、稀疏和图像模型
根据您的需求构建向量搜索。使用 all-MiniLM-L6-v2 等密集模型进行快速语义匹配,使用 splade-pp-en-v1 或 bm25 等稀疏模型进行关键词召回,或使用 CLIP 风格模型处理图像和文本。需要混合和/或多模态搜索?我们都涵盖了。
Qdrant 云推理文档
阅读文档常见问题
Qdrant 云推理在免费账户上可用吗?
推理仅在付费 Qdrant 云集群上可用。
我可以嵌入哪种类型的数据?
您可以使用当前可用的模型嵌入文本和图像数据。
嵌入是在哪里生成的?
嵌入在集群的网络内部生成,消除了外部 API 开销。
费用是多少?
推理按令牌计费,费用取决于模型。每个月,Qdrant 付费云用户根据模型可获得最多 500 万个免费令牌,BM25 则享有无限令牌。
如何开始?
如果您使用的是付费计划,云推理默认启用。
会有其他嵌入模型的选项吗?
我们计划根据客户反馈逐步添加模型。
