Qdrant基础
7天内交付生产就绪的文档搜索
掌握重要的向量搜索技能:混合检索、多向量重排序、量化、分布式部署和多租户。完成一个完整的文档搜索引擎作为最终项目。
7天课程
简短、重点突出的视频和动手练习可分享证书
完成后获得数字证书灵活的日程安排
按自己的节奏学习(每天1-2小时)初级水平
无需Qdrant经验您将学到什么
您将获得的技能
- Qdrant数据建模:点、有效载荷和模式
- 嵌入、分块和相似性度量
- 索引和检索调优(HNSW、过滤器、召回率/延迟)
- 稀疏+密集向量和重排序的混合搜索
- 性能优化、压缩和量化
- 扩展、分片/复制和安全性
学习路径
第0-2天:基础。连接到Qdrant Cloud,处理点和有效载荷,计算语义相似性,分块文本,并调整HNSW以提高速度和召回率。
第3-5天:高级检索。结合密集和稀疏信号,使用服务器端融合进行混合搜索,使用通用查询API处理多向量(ColBERT),并构建推荐系统。
第6天:交付。连接摄取、混合检索、多向量重排序和评估(召回率@10、MRR、延迟P50/P95)。
第7天(额外):生态系统。尝试与AI框架、搜索工具和数据管道集成。
课程运作方式
视频优先课程
Qdrant团队制作的清晰简洁模块最终项目
交付生产就绪的向量搜索应用额外一天
在第7天探索合作伙伴集成中途项目
每天进行小型构建以应用概念课程大纲
第0天:设置与第一步
- Qdrant云设置
- 实现基本向量搜索
- 项目:构建你的第一个向量搜索系统
第1天:向量搜索基础
- 点、向量和负载
- 距离度量
- 文本分块策略
- 演示:语义电影搜索
- 项目:构建语义搜索引擎
第2天:索引与性能
- HNSW索引基础
- 结合向量搜索和过滤
- 演示:HNSW性能调优
- 项目:HNSW性能基准测试
第3天:混合搜索
- 稀疏向量和倒排索引
- 演示:使用稀疏向量进行关键词搜索
- 使用分数融合的混合搜索
- 演示:实现混合搜索系统
- 项目:构建混合搜索引擎
第4天:优化与扩展
- 向量量化方法
- 通过重新评分恢复准确性
- 高吞吐量数据摄取
- 项目:量化性能优化
第5天:高级API
- 用于后期交互模型的多向量
- 通用查询API
- 演示:用于混合检索的通用查询
- 项目:构建推荐系统
第6天:最终项目 - 构建生产级搜索引擎
- 项目架构和评估框架
- 实现与性能评估
- 课程总结和后续步骤
第7天:合作伙伴生态系统集成(奖励)
- AI和LLM框架(Haystack、Jina AI、TwelveLabs)
- 数据处理(Unstructured.io)
- ML平台和分析(Tensorlake、Vectorize.io、Superlinked、Quotient)
适合人群
构建RAG、语义搜索或推荐系统的机器学习、后端、数据和搜索工程师。要求中级Python、基本CLI/API知识,以及熟悉嵌入。
时间投入
- 时长:6天,每天1-2小时 + 1天可选的额外课程
- 视频学习:约3小时
- 动手学习:4-5小时
- 最终项目:2-4小时
- 总计:9-12小时