真正的列式数据库管理系统
数据压缩
数据的磁盘存储
在多个内核上并行处理
多服务器上的分布式处理
SQL 支持
向量计算引擎
实时数据插入
按主键对数据进行物理排序后,就可以基于特定值或值范围以较低延迟提取数据,通常只需几十毫秒以内。
二级索引
适用于在线查询
对近似计算的支持
- 用于近似计算不同值数量、中位数和分位数的聚合函数。
- 基于部分数据 (SAMPLE) 运行查询并获得近似结果。在这种情况下,从磁盘读取的数据量会按比例减少。
- 仅对数量有限的随机键执行聚合,而不是对所有键执行聚合。在数据中键的分布满足特定条件时,这种方式能够以更少的资源消耗提供相当准确的结果。
自适应 JOIN 算法
数据复制和数据完整性支持
基于角色的访问控制
可视为缺点的特性
- 不支持完整的事务。
- 难以在高吞吐、低延迟的情况下修改或删除已插入的数据。不过,ClickHouse 提供了批次删除和更新功能,可用于清理或修改数据,例如满足 GDPR 的合规要求。
- 稀疏索引使 ClickHouse 在按键检索单行的点查询场景中效率不高。