0

Qdrant 24 年编程之夏

Andre Zayarni

·

2024年2月21日

Qdrant Summer of Code 24

Google Summer of Code (#GSoC) 今年迎来了 20 周年庆典,推出了 2024 年计划。在过去的 20 年里,该计划在来自 800 多个不同领域的开源组织的数千名导师的指导下,向 #opensource 社区介绍了 1.9 万名新的贡献者。Qdrant 去年成功参与了该计划。UI Dashboard 的非结构化数据可视化和高级地理过滤这两个项目都按时完成,现已成为引擎的一部分。其中一名年轻贡献者加入了团队,并继续致力于该项目。

我们很高兴地宣布,出于未知原因,Qdrant 𝐍𝐎𝐓 𝐚𝐜𝐜𝐞𝐩𝐭𝐞𝐝(未被接受)参加 GSoc 2024 计划,但我们正在推出我们自己的 𝐐𝐝𝐫𝐚𝐧𝐭 𝐒𝐮𝐦𝐦𝐞𝐫 𝐨𝐟 𝐂𝐨𝐝𝐞 计划,并为贡献者提供津贴!为了避免重复造轮子,我们遵循官方 Google 计划的所有时间表和规则。

我们的项目想法。

我们已经准备了一些很棒的项目想法。来看看并选择您想贡献的基于 Rust 或 Python 的项目吧。

基于 WASM 的降维可视化 📊

在 Rust 中实现降维算法,编译为 WASM 并将 WASM 代码与 Qdrant Web UI 集成。

高效的 BM25 和使用 BERT Tokenizer 的 Okapi BM25 🥇

BM25 和 Okapi BM25 是流行的排名算法。Qdrant 的 FastEmbed 支持密集嵌入模型。我们需要一个快速、高效、大规模并行的 Rust 实现,并带有 Python 绑定。

Python 中的 ONNX Cross Encoders ⚔️

将 cross-encoder 排名模型导出到 ONNX 运行时,并将此模型与 Qdrant 的 FastEmbed 集成以支持高效的重新排序。

Rust 中排名融合算法的实现 🧪

开发各种排名融合算法的 Rust 实现,包括但不限于倒数排名融合 (RRF)。完整列表请参见:https://github.com/AmenRa/ranx,并为已实现的 Rust 模块创建 Python 绑定。

设置 Jepsen 以测试 Qdrant 的分布式保证 💣

基于其他数据库的实现设计和编写 Jepsen 测试,并提交一份包含测试结果的报告或博客。

查看我们 Notion 页面上的所有详细信息:https://www.notion.so/qdrant/GSoC-2024-ideas-1dfcc01070094d87bce104623c4c1110

贡献者申请期从 3 月 18 日开始。我们将通过电子邮件接受申请。让我们一起贡献和庆祝吧!

我们相信开源!🦀🤘🚀

免费开始使用 Qdrant

开始使用