数据管理集成
集成 | 描述 |
---|---|
Airbyte | 专注于 ELT 流水线的数据集成平台。 |
Airflow | 专为开发、调度和监控面向批处理的工作流而设计的平台。 |
CocoIndex | 高性能 ETL 框架,用于转换 AI 数据,支持实时增量处理 |
Connect | 声明式、与数据无关的流处理服务,用于高效、无状态的处理。 |
Confluent | 全托管数据流平台,采用云原生 Apache Kafka 引擎。 |
DLT | 一个简化多个源和目标之间数据加载过程的 Python 库。 |
Fluvio | 基于 Rust 的平台,用于高速实时数据处理。 |
Fondant | 用于开发数据集、共享可重用操作和数据处理树的框架。 |
MindsDB | 用于部署、提供服务和微调模型的平台,集成了众多数据源。 |
NiFi | 数据摄取平台,用于管理不同源和目标系统之间的数据传输。 |
Spark | 用于大规模数据处理的统一分析引擎。 |
Unstructured | 一个包含用于摄取和预处理来自众多数据源的组件的 Python 库。 |