本文档将简要介绍如何将数据从亚马逊 Redshift 迁移到 ClickHouse。
简介
ClickHouse 与 Redshift 对比
- Redshift 会为每个查询执行计划编译代码,这会给首次执行查询带来显著开销。当查询模式可预测,且已编译的执行计划可以存储在查询缓存中时,这种开销尚属合理。然而,这也给查询变化较大的交互式应用带来了挑战。即使 Redshift 能利用这类代码编译缓存,ClickHouse 在大多数查询上仍然更快。参见 “ClickBench”。
- Redshift 将所有队列的并发数限制为 50,这虽然对 BI 场景已经足够,但并不适合高并发的分析型应用。
| Advantage | Description |
|---|---|
| 更低的查询延迟 | ClickHouse 即使在高并发且伴随流式插入的情况下,也能实现更低的查询延迟,包括面对多样化查询模式时也是如此。即便查询未命中缓存——这在面向用户的交互式分析中不可避免——ClickHouse 仍然能够快速处理。 |
| 更高的并发查询限制 | ClickHouse 对并发查询的限制要高得多,这对于实时应用体验至关重要。在 ClickHouse 中,无论是自管理还是 Cloud,你都可以扩展计算资源分配,以满足各个 service 所需的并发能力。ClickHouse 允许的查询并发级别是可配置的,而 ClickHouse Cloud 的默认值为 1000。 |
| 更出色的数据压缩 | ClickHouse 提供更出色的数据压缩能力,这意味着你可以减少总存储量 (从而降低成本) ,或者在相同成本下保留更多数据,并从数据中获得更多实时洞察。参见下文“ClickHouse 与 Redshift 的存储效率对比”。 |