| 数据摄取工具 | 说明 |
|---|---|
| Airbyte | 一个开源数据集成平台。它支持创建 ELT 数据管道,并开箱即用地提供 140 多种连接器。 |
| Apache Spark | 一个多语言引擎,用于在单节点机器或集群上执行数据工程、数据科学和机器学习任务。 |
| Apache Flink | 通过 Flink 的 DataStream API 将数据实时摄取到 ClickHouse 并进行处理,同时支持批次写入。 |
| Amazon Glue | 由 Amazon Web Services (AWS) 提供的全托管无服务器数据集成服务,可简化面向分析、机器学习和应用开发的数据发现、准备和转换过程。 |
| Artie | 一个全托管的实时流式数据平台,可将生产数据复制到 ClickHouse 中,从而支持面向客户的分析、运营工作流以及生产环境中的 Agentic AI。 |
| Azure Synapse | 由 Microsoft Azure 提供的全托管云分析服务,结合大数据与数据仓库能力,借助 SQL、Apache Spark 和数据管道简化大规模数据集成、转换和分析。 |
| Azure Data Factory | 一项基于云的数据集成服务,使您能够大规模创建、调度和编排数据工作流。 |
| Apache Beam | 一个开源的统一编程模型,使开发者能够定义并执行批次和流式 (连续) 数据处理管道。 |
| BladePipe | 一款具备亚秒级延迟的实时端到端数据集成工具,可促进跨平台之间的数据无缝流动。 |
| dbt | 让分析工程师只需编写 select 语句,即可在其数据仓库中转换数据。 |
| dlt | 一个开源库,您可以将其添加到 Python 脚本中,以便将来自各种且往往较为杂乱的数据源的数据加载到结构良好的实时数据集中。 |
| Estuary | 一个近实时数据平台,支持构建具备毫秒级延迟且部署方式灵活的 ETL 管道。 |
| Fivetran | 一个自动化数据移动平台,可在您的云数据平台之间以及进出这些平台传输数据。 |
| NiFi | 一款开源工作流管理软件,旨在自动化软件系统之间的数据流动。 |
| Vector | 一条高性能的可观测性数据管道,使组织能够掌控其可观测性数据。 |
数据摄取
数据摄取部分的概览页
ClickHouse 可与多种数据集成和转换解决方案配合使用。
如需了解更多信息,请查看以下页面:
最后修改于 2026年6月10日