Conjunto de dados simples com distribuição uniforme
rand() % 10000: distribuição uniforme de 10 mil usuáriosarrayElement(...): seleciona aleatoriamente um de três tipos de evento- Timestamps distribuídos ao longo das últimas 24 horas
Distribuição exponencial
- Timestamps uniformemente distribuídos em um período recente
randExponential(1/10)— a maioria dos totais fica próxima de 0, com 15 como valor mínimo ([ClickHouse][1], [ClickHouse][2], [Atlantic.Net][3], [GitHub][4])
Eventos distribuídos ao longo do tempo (Poisson)
- Os eventos atingem o pico por volta do meio-dia, com desvio com distribuição de Poisson
Distribuição normal variável ao longo do tempo
usagesegue uma onda senoidal ao longo do dia + aleatoriedade- Valores limitados ao intervalo [0,100]
Dados categóricos e aninhados
- Comprimento aleatório do array entre 1 e 3
- Três pontuações por usuário para cada interesse
Gerando tabelas aleatórias
generateRandomStructure é particularmente útil quando combinada com o mecanismo de tabela generateRandom para testes, benchmarking ou criação de dados simulados com schemas arbitrários.
Vamos começar vendo como é uma estrutura aleatória usando a função generateRandomStructure:
DESCRIBE para ver o que foi criado: