メインコンテンツへスキップ
このドキュメントでは、MySQL ClickPipe における並列化されたスナップショット/初期ロードの仕組みと、それを制御するために使用できるスナップショットパラメータについて説明します。

概要

初期ロードは CDC ClickPipe の最初のフェーズで、この段階では ClickPipe は CDC を開始する前に、ソースデータベース内のテーブルの過去データを ClickHouse に同期します。多くの場合、開発者はこれを単一スレッドで実行します。 しかし、MySQL ClickPipe ではこのプロセスを並列化できるため、初期ロードを大幅に高速化できます。

パーティションキー カラム

機能フラグを有効にすると、ClickPipe のテーブルピッカーに以下の設定が表示されます (ClickPipe の作成時と編集時の両方) : MySQL ClickPipe では、ソーステーブルを論理的にパーティション分割するために、そのテーブル上のカラムを使用します。このカラムを パーティションキー カラム と呼びます。これはソーステーブルをパーティションに分割するために使われ、各パーティションは ClickPipe によって並列に処理されます。
十分なパフォーマンス向上を得るには、パーティションキー カラムにソーステーブル上で索引が設定されている必要があります。これは、MySQL で SHOW INDEX FROM <table_name> を実行すると確認できます。

論理パーティション化

以下の設定を見ていきましょう。

スナップショット時のパーティションあたりの行数

この設定は、1 つのパーティションを構成する行数を制御します。ClickPipe はソーステーブルをこのサイズの chunk 単位で読み取り、chunk は設定された初期ロードの並列度に基づいて並列に処理されます。デフォルト値は、パーティションあたり 100,000 行です。

初期ロードの並列度

この設定では、並列に処理するパーティション数を制御します。デフォルト値は 4 で、ClickPipe はソーステーブルの 4 つのパーティションを並列に読み取ります。初期ロードを高速化するためにこの値を増やすことはできますが、ソースデータベースに過度な負荷をかけないよう、ソースインスタンスのスペックに応じて妥当な値に抑えることを推奨します。ClickPipe は、ソーステーブルのサイズと各パーティションあたりの行数に基づいて、パーティション数を自動的に調整します。

並列にスナップショットするテーブル数

並列スナップショット自体に直接関係する設定ではありませんが、この設定では初期ロード中に並列処理するテーブル数を制御します。デフォルト値は 1 です。これはパーティションの並列度に加えて適用される点に注意してください。たとえば、4 つのパーティションと 2 つのテーブルがある場合、ClickPipe は 8 個のパーティションを並列に読み取ります。

MySQL で並列スナップショットを監視する

MySQL で SHOW processlist を実行すると、並列スナップショットが実際に動作していることを確認できます。ClickPipe はソースデータベースに複数の接続を作成し、それぞれがソーステーブルの異なるパーティションを読み取ります。異なる範囲の SELECT クエリが表示されていれば、ClickPipe がソーステーブルを読み取っていることを意味します。ここでは、COUNT(*) やパーティション化のためのクエリも確認できます。

制限事項

  • スナップショットパラメータは、パイプの作成後に編集できません。変更する場合は、新しいClickPipeを作成する必要があります。
  • 既存のClickPipeにテーブルを追加する場合、スナップショットパラメータは変更できません。新しいテーブルには既存のパラメータが使用されます。
  • パーティションキー カラムにはNULLを含めないでください。NULLはパーティション化のロジックでスキップされるためです。
最終更新日 2026年6月10日