uniqCombined
Como usa um hash de 32 bits para tipos diferentes de
String, o resultado terá um erro muito alto para cardinalidades significativamente maiores que UINT_MAX (o erro aumentará rapidamente após algumas dezenas de bilhões de valores distintos).
Se as cardinalidades forem maiores que UINT_MAX, use uniqCombined64.- Consome várias vezes menos memória
- Calcula com precisão várias vezes maior
- Em geral, tem desempenho ligeiramente inferior. Em alguns cenários, uniqCombined pode ter desempenho melhor que uniq, por exemplo, com consultas distribuídas que transmitem um grande número de estados de agregação pela rede
Detalhes de implementação
Detalhes de implementação
Esta função calcula um hash (hash de 64 bits para String e de 32 bits nos demais casos) para todos os parâmetros da agregação e, em seguida, o usa nos cálculos.
Ela usa uma combinação de três algoritmos: array, tabela hash e HyperLogLog com uma tabela de correção de erros:
- Para um pequeno número de elementos distintos, é usado um array
- Quando o tamanho do conjunto aumenta, é usada uma tabela hash
- Para um número maior de elementos, é usado HyperLogLog, que ocupará uma quantidade fixa de memória
HLL_precision— Opcional. O logaritmo de base 2 do número de células no HyperLogLog. O valor padrão é 17, o que corresponde, na prática, a 96 KiB de espaço (2^17 células, 6 bits cada). Intervalo: [12, 20].UInt8
x— Um número variável de argumentos.Tuple(T)ouArray(T)ouDateouDateTimeouStringou(U)Int*ouFloat*ouDecimal
UInt64
Exemplos
Uso básico
Query
Response
Query
Response