uniqCombined64
uniqCombined 相同,但会对所有数据类型使用 64 位哈希,而不只是对 String 类型使用。
此函数提供确定性结果 (不依赖于查询处理顺序) 。
由于它对所有类型都使用 64 位哈希,因此当基数明显大于
UINT_MAX 时,结果不会像 uniqCombined 那样产生很大的误差;后者对非 String 类型使用的是 32 位哈希。- 内存消耗少数倍
- 计算精度高数倍
实现细节
实现细节
此函数会先为聚合中所有参数的所有数据类型计算 64 位哈希,然后基于该哈希进行计算。
它结合使用三种算法:数组、哈希表,以及带误差校正表的 HyperLogLog:
- 当不同元素数量较少时,使用数组
- 当集合大小进一步增大时,使用哈希表
- 当元素数量更多时,使用 HyperLogLog,此时会占用固定大小的内存
HLL_precision— 可选。HyperLogLog 中单元数量的以 2 为底对数。默认值为 17,实际约占 96 KiB 空间 (2^17 个单元,每个单元 6 位) 。范围:[12, 20]。UInt8
UInt64 类型的数值,表示不同实参值的近似数量。UInt64
示例
大型数据集示例
Query
Response
Query
Response