シンプルな一様分布のデータセット
rand() % 10000: 1万人のユーザーに対する一様分布arrayElement(...): 3種類のイベントタイプのうち1つをランダムに選択- タイムスタンプは過去24時間にわたって分散
指数分布
- 直近の期間全体に均等に分布したタイムスタンプ
randExponential(1/10)— 値の大半は 0 付近で、最小値が 15 になるようにオフセット ([ClickHouse][1], [ClickHouse][2], [Atlantic.Net][3], [GitHub][4])
時間帯に偏りのあるイベント (ポアソン)
- イベントは正午ごろにピークを迎え、ばらつきはポアソン分布に従います
時間とともに変化する正規分布
usageは日周の正弦波+ランダムな変動に従います- 値は [0,100] の範囲に収まります
カテゴリカルデータとネストデータ
- 配列の長さは1〜3のランダムな値
- 各関心項目に対して、ユーザーごとのスコアを3つ
ランダムなテーブルの生成
generateRandomStructure 関数は、generateRandom テーブルエンジンと組み合わせることで、テストやベンチマーク、あるいは任意のスキーマを持つモックデータの作成に特に役立ちます。
まずは、generateRandomStructure 関数を使って、ランダムな構造がどのようなものかを見てみましょう。
DESCRIBEステートメントを使って作成結果を確認します。