英特尔全新CPU助力矢量搜索提速
David Myriel, Kumar Shivendu
·2024年5月10日

新一代芯片是AI/ML应用的颠覆性技术

英特尔第五代至强处理器专为矢量空间的企业级操作而生。
矢量搜索在机构客户中日益普及,英特尔已准备好支持这一新兴行业。其最新一代CPU在领先的用于企业级AI应用的矢量数据库Qdrant上表现出色。
英特尔刚刚发布了面向数据中心的最新至强处理器(代号:Emerald Rapids),预计该市场将增长至450亿美元。Emerald Rapids比前几代产品提供更高的计算性能和显著的能源效率。与第四代Sapphire Rapids相比,Emerald将AI推理性能提升了42%,矢量搜索速度提高了38%。
矢量数据库操作的首选CPU
在Qdrant研发部门进行的测试中,最新一代CPU表现异常出色。英特尔的CPU在针对大规模数据集的查询速度、数据库延迟和矢量上传时间方面进行了压力测试。结果显示,拥有32个核心的机器在运行查询时比上一代产品快1.38倍。在此范围内,Qdrant的延迟与Sapphire相比也降低了2.79倍。
Qdrant强烈建议在8-64核范围内使用英特尔的下一代芯片。除了是云中大多数机器的实际核心数量外,这种计算能力将在大众市场用例中产生最佳结果。
CPU通过影响数学计算的速度和效率来影响矢量搜索。最近,公司已开始使用GPU来处理AI模型训练和推理中的大量工作负载。然而,对于矢量搜索目的,研究表明CPU架构非常适合,因为它可以轻松处理并发请求。
“矢量搜索针对CPU进行了优化。英特尔的新款CPU带来了更高的性能提升,并使AI应用的矢量操作变得异常快速。客户应考虑部署更多的CPU而不是GPU计算能力,以同时实现最佳性能结果并降低成本。”
- André Zayarni,Qdrant首席执行官
矢量搜索为何重要?

矢量搜索引擎使AI能够更深入地查看存储数据并检索高度相关的响应。
Qdrant的矢量数据库是现代信息检索和机器学习系统的关键。那些希望运行大规模检索增强生成(RAG)解决方案的人需要利用此类语义搜索引擎,以便通过其AI产品生成最佳结果。
Qdrant专为使开发人员能够高效存储和搜索高维矢量而构建。它可轻松与众多AI/ML工具集成:大型语言模型(LLM)、LangChain、LlamaIndex或Haystack等框架,以及Cohere、OpenAI和Ollama等服务提供商。
支持企业级AI/ML
市场正在为一系列人工智能和机器学习案例做准备,将计算推向创新竞赛的最前沿。
Qdrant等矢量数据库的主要优势在于,它可以持续支持用户度过原型设计和发布阶段。Qdrant的产品已被拥有数十亿数据点的大型企业使用。这些用户可以几乎立即从测试过渡到生产。那些希望托管大型应用程序的用户可能只需要高达18GB的RAM即可支持100万个OpenAI矢量。这使得Qdrant成为最大化资源利用率和数据连接的最佳选择。
英特尔的最新发展对矢量数据库的未来至关重要。矢量搜索操作对CPU要求很高。因此,Qdrant依赖于英特尔等芯片制造商的创新来提供大规模支持。
“矢量数据库是当今AI/ML工具链的中流砥柱,为最新一代RAG和其他生成式AI应用程序提供动力。通过与Qdrant合作,英特尔正在帮助企业提供尖端的生成式AI解决方案,并通过利用Qdrant在基于最新英特尔架构基础设施上(跨部署模型)运行的高性能和高成本效益的矢量相似性搜索功能来最大化其投资回报率。”
- Arijit Bandyopadhyay,英特尔公司企业分析与人工智能首席技术官,云与企业策略主管,CSV集团
推进矢量搜索和下一代CPU的作用
展望未来,矢量数据库市场正处于显著增长的边缘,特别是企业市场。英特尔等公司在CPU技术方面的发展有望通过1)提高处理速度和2)提高检索效率和质量来增强矢量搜索操作。这将使企业用户能够轻松管理大型和更复杂的数据集,并在全球范围内引入AI。
随着大型公司继续集成复杂的AI和机器学习工具,对强大矢量数据库的依赖将会增加。市场上的这种演变强调了持续硬件创新在满足数据密集型应用程序不断增长的需求方面的重要性,而英特尔的贡献在塑造企业级AI/ML解决方案的未来方面发挥着显著作用。
下一步
Qdrant是开源的,并提供完整的SaaS解决方案,托管在AWS、GCP和Azure上。
入门很简单,可以启动一个容器镜像或启动一个免费的云实例。文档涵盖了将数据添加到您的Qdrant实例以及创建索引。我们很乐意了解您正在构建什么,请通过Github、Discord或LinkedIn与我们的工程团队联系。