Haystack

Haystack 是一个全面的 NLP 框架,提供模块化方法来构建前沿的生成式 AI、问答和语义知识库搜索系统。现代 NLP 系统中的一个关键要素是用于存储和检索大量文本数据的有效数据库。向量数据库在此方面表现出色,因为它们存储文本的向量表示并实现了快速检索的有效方法。因此,我们很高兴宣布与 Haystack 集成 - QdrantDocumentStore。此文档存储独特之处在于,它由 Qdrant 团队在外部维护。

新的文档存储是一个单独的包,可以独立于 Haystack 进行更新。

pip install qdrant-haystack

QdrantDocumentStore 支持 Qdrant Python 客户端中所有可用的配置属性。如果您想自定义底层使用的集合的默认配置,可以在创建 QdrantDocumentStore 实例时提供这些设置。例如,如果您想启用标量量化(Scalar Quantization),可以按以下方式进行:

from qdrant_haystack.document_stores import QdrantDocumentStore
from qdrant_client import models

document_store = QdrantDocumentStore(
    ":memory:",
    index="Document",
    embedding_dim=512,
    recreate_index=True,
    quantization_config=models.ScalarQuantization(
        scalar=models.ScalarQuantizationConfig(
            type=models.ScalarType.INT8,
            quantile=0.99,
            always_ram=True,
        ),
    ),
)

延伸阅读

此页面有用吗?

感谢您的反馈! 🙏

很抱歉听到此消息。😔 您可以在 GitHub 上编辑此页面,或创建一个 GitHub 问题。