0

Cosmos 如何利用 Qdrant 实现编辑级视觉搜索

Daniel Azoulai

·

2025 年 11 月 20 日

How Cosmos delivered editorial-grade visual search with Qdrant

How Cosmos powered text, color, and hybrid search with Qdrant

Cosmos 正在重新定义人们在线寻找灵感的方式。它是一款专为创意专业人士和日常用户设计的视觉搜索应用程序,他们希望在一个干净、沉思、无广告的场所收集和整理创意。与充斥着“刷屏”、“广告”和生成式“AI 垃圾”的 feeds 不同,Cosmos 专注于高质量、人工制作的内容。AI 驱动的搜索和标题将每张图片与其创作者联系起来,使视觉发现更丰富、更准确、更易于导航。

在这个前端背后是一个复杂的技术问题:为数百万用户提供实时文本、颜色和混合视觉搜索。对于 Cosmos 而言,解决方案来自 Qdrant 云。

挑战:感受人性的创意发现

Cosmos 服务于一个创意社区,他们期望精确、清晰和美观。该平台托管着数百万个“元素”——图片、视频、文本片段、社交嵌入以及用户上传的其他创意作品。

搜索体验 通过图像、颜色和术语搜索

搜索是 Cosmos 的核心。用户通过以下方式探索:

  • 文本搜索(“现代陶瓷”,“柔光摄影”)
  • 颜色搜索(精确十六进制或色调匹配)
  • 混合查询,融合文本和颜色上下文
  • 类似元素,显示与用户当前正在查看的元素相关的元素
  • 聚类推荐,为聚类(元素组)建议其他元素

挑战在于以亚秒级延迟提供这些多模态结果,同时应用丰富的元数据过滤(格式、参与信号等)。

早期的原型依赖于带有 pgvector 的 Postgres,但可扩展性和性能很快成为潜在问题。

“我们希望有一个向量搜索引擎,能够同时处理我们的颜色和文本嵌入,同时允许我们按数十个元数据维度进行过滤。”

-Griffin Miller,AI/ML 和产品

Cosmos 还需要一个托管部署,以避免手动维护重新索引、扩展或平衡逻辑。工程团队希望专注于产品创新,而不是基础设施调优。

解决方案:Qdrant 云作为检索层

Cosmos 迁移到 Qdrant 云,将其作为整个平台所有搜索和推荐的基础。Qdrant 现在提供以下功能:

  • 文本和颜色搜索,包括混合文本加颜色结果
  • 聚类中类似元素的推荐(Cosmos 对用户集合的术语)
  • 为 Cosmos 内部排序器生成候选
  • 用于去重目的的元素处理管道

Cosmos Retrieval Architecture

“Qdrant 为我们的文本搜索、颜色搜索、混合搜索和类似元素视图提供支持,”Miller 说。“它让我们能够快速进行候选生成,同时在之上应用我们自己的编辑和参与逻辑。”

团队选择了 Qdrant 云的完全托管部署,理由是其强大的过滤功能、命名向量和操作稳定性。“我们不想管理自己的重新索引或优化,”Miller 解释说。“Qdrant 会自动处理,我们已经看到诸如重分片和 CPU 预算等功能随着我们的需求而发展。”

Cosmos 的一项关键创新是其大规模运行的精确颜色搜索系统。人们可以输入一种颜色(例如,#FFFFFF 白色),Qdrant 会检索具有感知匹配色调的图像。

为了实现这一点,Cosmos 将颜色数据存储为 CIELAB (L*a*b*) 向量,这是一种感知颜色模型,能更好地反映人类如何看待色调和亮度。每个元素包含五个独立的 3D 颜色向量(从主色到五级色),所有这些都保留在内存中,以便进行快速欧几里德距离搜索。

当用户通过颜色搜索时,Cosmos 将十六进制值转换为 CIELAB,检索所有五个颜色向量的匹配项,然后根据该颜色在图像中实际存在的多少重新排序结果。“如果一张图片在其主色调中 60% 是白色,那很重要,”Miller 说。

Qdrant 的命名向量功能使此设计变得简单高效。每个元素在一个集合中存储多个嵌入(CLIP、CNN、pHash 和颜色向量),允许 Cosmos 处理多模态检索,而无需交叉连接或维护单独的索引。

混合搜索,但带有编辑风格

Cosmos 尝试了 Qdrant 通过倒数排名融合实现的内置混合搜索。它适用于标准语义检索,但对于颜色关键型工作流,即使是轻微的近似也显而易见。

“对我们来说,颜色匹配必须精确,”Miller 说。“混合搜索过多地混合了相关性和色调。我们转向了应用程序端融合模型。Qdrant 处理检索,我们处理参与度、相关性和美学之间的平衡。”

这种相关性和美学的平衡是 Cosmos 发现方法的核心。团队开发了一个美学评分模型,对图像应用一致的质量度量,确保 feed 始终保持高质量内容。

正如 Miller 所说:“我们想要相关性、参与度和美感。这就是我们一直在优化的三角。”

结果:亚秒级检索和更快的管道

如今,Cosmos 在 Qdrant 云上的检索和推荐堆栈提供:

  • 200-500 毫秒的端到端搜索延迟,包括检索、过滤和重新排名
  • 通过并行化 CNN、CLIP 和 pHash 计算并利用 Qdrant 直接存储这些向量,元素处理时间减少了 79%
  • 通过量化、批处理和 CPU 预算实现可预测的操作和更低的成本

这些改进使搜索保持响应,同时确保基础设施随着用户增长而平稳扩展。

为下一版本构建

Cosmos 正在继续扩展其 AI 能力。团队正在完善多色搜索,并准备对其 iOS 和 Web 应用程序进行重大重新发布,两者均基于最新的 Qdrant 配置。

Miller 强调了合作伙伴关系:“Qdrant 的客户工程团队反应非常迅速。我们需要的每一个新功能,如重新分片、读写分离和优化器,都在我们需要的时候出现了。”

随着 Cosmos 迈向下一版本,其搜索堆栈现在反映了其设计理念:快速、周到、精确。

“我们的用户是艺术家。他们能分辨出‘差不多’和完美的区别。Qdrant 帮助我们达到这种精度。”
-Griffin Miller,AI/ML 和产品,Cosmos

免费开始使用 Qdrant

开始使用