Qdrant 24 年编程之夏
Andre Zayarni
·2024年2月21日

Google 编程之夏(#GSoC)今年通过 2024 年项目庆祝其 20 周年。在过去的 20 年里,1.9 万名新贡献者在 800 多个不同领域的开源组织的数千名导师的指导下,通过该计划接触了#开源。Qdrant 去年成功参与了该计划。UI 仪表板与非结构化数据可视化和高级地理过滤这两个项目都按时完成,现已成为引擎的一部分。两位年轻贡献者中的一位加入了团队,并继续从事该项目。
我们很高兴地宣布,Qdrant 𝐧𝐨𝐭 𝐚𝐜𝐜𝐞𝐩𝐭𝐞𝐝 因未知原因未被纳入 2024 年 GSoC 计划,但我们正在推出我们自己的 𝐐𝐝𝐫𝐚𝐧𝐭 𝐒𝐮𝐦𝐦𝐞𝐫 𝐨𝐟 𝐂𝐨𝐝𝐞 计划,并为贡献者提供津贴!为了不重复造轮子,我们遵循官方 Google 计划的所有时间表和规则。
我们的项目想法。
我们准备了一些很棒的项目想法。看看并选择您想贡献 Rust 还是基于 Python 的项目。
➡ 基于 WASM 的降维可视化 📊
在 Rust 中实现降维算法,编译为 WASM 并将 WASM 代码与 Qdrant Web UI 集成。
➡ 高效的 BM25 和使用 BERT Tokenizer 的 Okapi BM25 🥇
BM25 和 Okapi BM25 是流行的排名算法。Qdrant 的 FastEmbed 支持密集嵌入模型。我们需要一个快速、高效、大规模并行的 Rust 实现,并带有 Python 绑定。
➡ Python 中的 ONNX 交叉编码器 ⚔️
导出交叉编码器排名模型以在 ONNX 运行时上运行,并将此模型与 Qdrant 的 FastEmbed 集成以支持高效的重新排名。
➡ Rust 中的排名融合算法实现 🧪
开发各种排名融合算法的 Rust 实现,包括但不限于倒数排名融合 (RRF)。完整列表请参见:https://github.com/AmenRa/ranx 并为已实现的 Rust 模块创建 Python 绑定。
➡ 设置 Jepsen 以测试 Qdrant 的分布式保证 💣
根据其他数据库的实现设计并编写 Jepsen 测试,并撰写包含发现的报告或博客。
请参阅我们的 Notion 页面上的所有详细信息:https://www.notion.so/qdrant/GSoC-2024-ideas-1dfcc01070094d87bce104623c4c1110
贡献者申请期于 3 月 18 日开始。我们将通过电子邮件接受申请。让我们一起贡献和庆祝!
我们相信开源!🦀🤘🚀