向量数据库将继续存在。AI的新时代由向量嵌入提供动力,向量数据库是技术栈的基础组成部分。在 Qdrant,我们致力于提供尖端的开源向量相似性搜索解决方案,以最佳性能和卓越的开发者体验为出色的AI应用提供支持。
我们获得的750万美元种子轮融资——由 Unusual Ventures、优秀的投资人和现有投资者领投——将帮助我们将这些创新带给工程师,赋能他们充分利用非结构化数据和强大的大型语言模型(LLMs)的威力,无论规模大小。
我们很高兴地宣布,我们刚刚完成了种子轮融资,获得了我们在这个阶段所能想象到的最好的投资者。稍后我们再谈募资——这本身就是一个故事,我可能可以写一本畅销书。首先,让我们深入了解一下我们项目的背景、进展和未来计划。
对向量数据库的需求。
非结构化数据正在呈指数级增长,我们都是庞大非结构化数据工作流的一部分。这篇博客文章是非结构化数据;您的每次网络互动、每次拍照或发送的每封电子邮件都会产生非结构化和半结构化数据。到2025年,全球数据圈将增长到 165泽字节,其中约80%将是非结构化的。与此同时,对AI日益增长的需求远远超过现有基础设施。约90%的机器学习研究成果因缺乏工具而未能投入生产。

对AI工具的需求
幸运的是,新一代工具使开发者能够以向量嵌入的形式处理非结构化数据,向量嵌入是神经网络模型获取的对象深度表示。向量数据库,也称为向量相似性搜索引擎或近似最近邻(ANN)搜索数据库,是一种旨在存储、管理和搜索带有附加有效载荷的高维数据的数据库。向量数据库将研究原型转化为商业AI产品。向量搜索解决方案与行业无关,为多种用例提供解决方案,包括语义搜索、匹配引擎和推荐系统等经典用例,以及异常检测、时间序列处理或生物医学数据等新颖应用。最大的限制是需要为所处理的数据类型准备一个神经网络编码器。

向量搜索用例
随着大型语言模型(LLMs)的兴起,向量数据库已成为新AI堆栈的基础组成部分。它们使开发者能够通过将基于LLMs的应用程序(如ChatGPT)的“知识库”与实时和真实世界数据进行扩展,从而构建更高级的应用程序。
一种新的AI产品类别,“X的副驾驶(Co-Pilot for X)”,应运而生,并已影响到我们的工作方式。从内容创作到软件开发。而这仅仅是个开始,在此堆栈之上,还有更多类型的新型应用正在开发中。

新AI堆栈
Qdrant登场。
同时,普及才刚刚开始。向量搜索数据库正在取代FAISS等VSS库,尽管它们存在缺点,但仍被大约90%的项目使用。这些库与应用程序代码紧密耦合,缺乏生产就绪功能,如基本的CRUD操作或高级过滤,维护和扩展起来非常困难,并且存在许多其他问题,给开发者的生活带来了困扰。
当前的 Qdrant 生态系统包含出色的产品,可用于处理向量嵌入。我们于今年早些时候推出了托管向量数据库解决方案 Qdrant Cloud,它已经为超过1000个 Qdrant 集群提供服务。我们现在正在扩展我们的产品,为企业客户提供托管本地解决方案。

Qdrant 生态系统
我们当前 开源路线图 的计划是让亿级向量搜索变得经济实惠。我们最近发布的 标量量化 改进了内存使用(x4)和速度(x2)。即将推出的 乘积量化 将引入另一种选择,提供更多的内存节省。敬请期待。
Qdrant 始于两年多前,其使命是构建一个由精心设计的技术栈驱动的向量数据库。在引擎开发过程中,采用 Rust 作为系统编程语言和技术架构决策,使 Qdrant 成为领先且最受欢迎的向量数据库解决方案之一。
我们对近似最近邻搜索(ANN)的 HNSW算法 进行了独特的自定义修改,允许以最先进的速度查询结果并应用过滤器,同时不影响结果。对分布式部署和复制的云原生支持使该引擎适用于具有实时延迟要求的高吞吐量应用程序。Rust 带来了稳定性、效率和在非常底层进行优化的可能性。总的来说,我们始终致力于在 性能、代码质量和功能集方面取得最佳结果。
最重要的是,我们想向我们的 开源社区、我们的采用者、我们的贡献者和我们的客户表示衷心的感谢。你们积极参与我们产品的开发,帮助 Qdrant 成为市场上最好的向量数据库。我无法想象没有社区,没有开源,没有工程师的信任,我们如何能做到现在的一切。感谢大家!
我还要感谢我们的团队。感谢你们的耐心和信任。我们同心协力,力量强大。让我们继续共同创造伟大的事业。
融资
整个过程只用了几天时间,我们收到了好几个报价,而且很可能在不同条件下我们会收到更多报价。我们决定选择 Unusual Ventures,因为他们真正了解开源领域是如何运作的。他们做对了。
对于所有对开源感兴趣的投资者,这里有一条重要的建议:深入社区,感受并了解产品的吸引力和反馈,而不是只看那些光鲜亮丽的宣传演示文稿。有了 Unusual 的支持,我们拥有了一个积极运营的合作伙伴,而不仅仅是一个简单地开支票的人。这种帮助比过高的估值和华而不实的名头重要得多。
最终,社区和采纳者将决定哪些产品成功,哪些失败,而不是风险投资公司。公司不需要疯狂的估值来创造客户喜爱的产品。创新不需要博士学位。构建可扩展的解决方案不需要过度设计。拥有一个优秀的团队不需要前 FANG(Facebook、Apple、Netflix、Google)员工。你需要明确的焦点、对所创建事物的热情以及将其做好的诀窍。
我们知道怎么做。
附:本文由我以老式方式撰写,没有任何 ChatGPT 的帮助。有时你只需要灵感,而不是人工智能 ;-)
