Выбор стратегии вставки

Эффективная ингестия данных — основа высокопроизводительных развертываний ClickHouse. Выбор подходящей стратегии вставки может существенно повлиять на пропускную способность, стоимость и надёжность. В этом разделе рассматриваются лучшие практики, компромиссы и параметры конфигурации, которые помогут вам выбрать оптимальный вариант для вашей рабочей нагрузки.

Далее предполагается, что вы передаёте данные в ClickHouse через клиент. Если же вы загружаете данные в ClickHouse, например, с помощью встроенных табличных функций, таких как s3 и gcs, рекомендуем ознакомиться с нашим руководством “Оптимизация производительности вставки и чтения для S3”.

Синхронные вставки по умолчанию

По умолчанию вставки в ClickHouse выполняются синхронно. Каждый запрос на вставку сразу создает на диске часть данных, включая метаданные и индексы.

Используйте синхронные вставки, если можете батчировать данные на стороне клиентаЕсли нет, см. раздел Асинхронные вставки ниже.

Ниже мы кратко рассмотрим механизм вставки в MergeTree в ClickHouse:

Шаги на стороне клиента

Для оптимальной производительности данные должны быть ① объединены в батчи, поэтому размер батча — это первое решение, которое нужно принять. ClickHouse хранит вставленные данные на диске, отсортированными по столбцам первичного ключа таблицы. Второе решение — ② нужно ли предварительно сортировать данные перед отправкой на сервер. Если батч поступает уже отсортированным по столбцам первичного ключа, ClickHouse может пропустить этап ⑩ сортировки, ускоряя ингестию. Если у данных для ингестии нет заранее заданного формата, ключевое решение — выбрать формат. ClickHouse поддерживает вставку данных в более чем 70 форматах. Однако при использовании клиента ClickHouse для командной строки или клиентов для языков программирования этот выбор часто выполняется автоматически. При необходимости этот автоматический выбор можно и явно переопределить. Следующее важное решение — ④ сжимать ли данные перед передачей на сервер ClickHouse. Сжатие уменьшает объём передаваемых данных и повышает эффективность сети, что ускоряет передачу данных и снижает расход пропускной способности, особенно для больших наборов данных. Данные ⑤ передаются через сетевой интерфейс ClickHouse — либо native, либо HTTP интерфейс (их мы сравним позже в этой статье).

Шаги на стороне сервера

После получения данных на шаге ⑥ ClickHouse на шаге ⑦ распаковывает их, если использовалось сжатие, а затем на шаге ⑧ разбирает их из исходного формата. Используя значения из этих отформатированных данных и DDL-оператор DDL целевой таблицы, ClickHouse на шаге ⑨ формирует в памяти блок в формате MergeTree, на шаге ⑩ сортирует строки по столбцам первичного ключа, если они ещё не были предварительно отсортированы, на шаге ⑪ создаёт разреженный первичный индекс, на шаге ⑫ применяет сжатие на уровне столбцов, а на шаге ⑬ записывает данные на диск как новую ⑭ часть данных.

Батч-вставки при синхронной вставке

Описанный выше механизм создаёт постоянные накладные расходы независимо от размера вставки, поэтому размер батча — самый важный фактор оптимизации пропускной способности приёма. Батчинг вставок уменьшает долю накладных расходов в общем времени вставки и повышает эффективность обработки. Мы рекомендуем вставлять данные батчами не менее 1 000 строк, а в идеале — от 10 000 до 100 000 строк. Чем меньше и крупнее вставки, тем меньше записывается частей, ниже нагрузка на слияние и общее потребление системных ресурсов. Чтобы синхронная стратегия вставки была эффективной, батчинг на стороне клиента обязателен. Если вы не можете выполнять батчинг данных на стороне клиента, ClickHouse поддерживает асинхронные вставки, которые переносят батчинг на сторону сервера (см. Asynchronous inserts).

Независимо от размера вставок, мы рекомендуем поддерживать частоту запросов на вставку на уровне примерно одного запроса в секунду. Это связано с тем, что созданные части в фоновом режиме сливаются в более крупные (чтобы оптимизировать данные для запросов на чтение), и если отправлять слишком много запросов на вставку в секунду, фоновое слияние может не успевать за появлением новых частей. Однако при использовании асинхронных вставок можно работать с более высокой частотой запросов на вставку в секунду (см. Asynchronous inserts).

Обеспечьте идемпотентность повторных попыток

Синхронные вставки также идемпотентны. При использовании движков MergeTree ClickHouse по умолчанию выполняет дедупликацию вставок. Это защищает от неоднозначных сбоев, например в случаях, когда:

Вставка прошла успешно, но клиент не получил подтверждение из-за сбоя сети.
Вставка завершилась ошибкой на стороне сервера и привела к тайм-ауту.

В обоих случаях повторить вставку безопасно — при условии, что содержимое батча и его порядок остаются неизменными. Поэтому крайне важно, чтобы клиенты выполняли повторные попытки последовательно, не изменяя и не переупорядочивая данные.

Выберите подходящую цель для вставки

Для кластеров с сегментацией у вас есть два варианта:

Выполнять вставку напрямую в таблицу MergeTree или ReplicatedMergeTree. Это самый эффективный вариант, если клиент может балансировать нагрузку между сегментами. При internal_replication = true ClickHouse прозрачно управляет репликацией.
Выполнять вставку в distributed таблицу. Это позволяет клиентам отправлять данные на любой узел, а ClickHouse сам перенаправит их в нужный сегмент. Это проще, но немного менее производительно из-за дополнительного шага перенаправления. internal_replication = true по-прежнему рекомендуется.

В ClickHouse Cloud все узлы читают и записывают данные в один и тот же сегмент. Операции вставки автоматически балансируются между узлами. Вы можете просто отправлять их на доступную конечную точку.

Выберите подходящий формат

Выбор подходящего входного формата крайне важен для эффективной ингестии данных в ClickHouse. При наличии более 70 поддерживаемых форматов выбор наиболее производительного варианта может существенно повлиять на скорость вставки, нагрузку на CPU и память, а также на общую эффективность системы. Хотя гибкость полезна для инженерии данных и импорта из файлов, приложениям следует отдавать приоритет форматам, ориентированным на производительность:

формат Native (рекомендуется): Наиболее эффективный вариант. Столбцовый формат, требует минимального разбора на стороне сервера. По умолчанию используется в Go- и Python-клиентах.
RowBinary: Эффективный построчный формат, оптимален, если преобразование в столбцовый вид сложно выполнить на стороне клиента. Используется в Java-клиенте.
JSONEachRow: Прост в использовании, но требует больших затрат на разбор. Подходит для сценариев с небольшими объёмами данных или быстрых интеграций.

Используйте сжатие

Сжатие играет важную роль в снижении сетевых накладных расходов, ускорении вставки и сокращении затрат на хранение в ClickHouse. При правильном использовании оно повышает производительность ингестии, не требуя изменений формата данных или схемы. Сжатие данных при вставке уменьшает размер полезной нагрузки, передаваемой по сети, снижая потребление пропускной способности и ускоряя передачу. Для вставки сжатие особенно эффективно при использовании формата Native, который уже соответствует внутренней столбцовой модели хранения ClickHouse. В такой конфигурации сервер может эффективно распаковывать и напрямую сохранять данные с минимальными преобразованиями.

Используйте LZ4 для скорости, а ZSTD — для более высокого коэффициента сжатия

ClickHouse поддерживает несколько кодеков сжатия при передаче данных. Два наиболее распространённых варианта:

LZ4: Быстрый и лёгкий. Значительно уменьшает объём данных при минимальной нагрузке на CPU, поэтому отлично подходит для вставки с высокой пропускной способностью и используется по умолчанию в большинстве клиентов ClickHouse.
ZSTD: Обеспечивает более высокий коэффициент сжатия, но сильнее нагружает CPU. Полезен, когда передача данных по сети обходится дорого — например, между регионами или у облачных провайдеров, — хотя при этом немного возрастают вычислительная нагрузка на клиенте и время распаковки на сервере.

Рекомендуемая практика: используйте LZ4, если только у вас не ограничена пропускная способность канала или нет затрат на исходящий трафик данных — в этом случае стоит рассмотреть ZSTD.

В тестах из бенчмарка FastFormats вставки Native со сжатием LZ4 уменьшили объём данных более чем на 50%, сократив время ингестии со 150 до 131 с для набора данных объёмом 5,6 GiB. При переходе на ZSTD тот же набор данных сжался до 1,69 GiB, но время обработки на стороне сервера немного увеличилось.

Сжатие снижает потребление ресурсов

Сжатие не только уменьшает сетевой трафик — оно также повышает эффективность использования CPU и памяти на сервере. Со сжатыми данными ClickHouse получает меньше байтов и тратит меньше времени на парсинг больших объёмов входных данных. Это особенно важно при ингестии данных от нескольких параллельных клиентов, например в сценариях обсервабилити. Влияние сжатия на CPU и память для LZ4 невелико, а для ZSTD — умеренное. Даже под нагрузкой эффективность на стороне сервера повышается за счёт уменьшения объёма данных. Сочетание сжатия с батчингом и эффективным входным форматом (например, Native) обеспечивает наилучшую производительность ингестии. При использовании нативного интерфейса (например, clickhouse-client) сжатие LZ4 включено по умолчанию. При необходимости можно переключиться на ZSTD через настройки. При использовании HTTP-интерфейса используйте заголовок Content-Encoding, чтобы включить сжатие (например, Content-Encoding: lz4). Перед отправкой необходимо сжать всю полезную нагрузку.

Предварительная сортировка, если это не требует больших затрат

Предварительная сортировка данных по первичному ключу перед вставкой может повысить эффективность ингестии в ClickHouse, особенно для больших батчей. Если данные поступают уже отсортированными, ClickHouse может пропустить или упростить внутренний этап сортировки при создании части данных, что снижает нагрузку на CPU и ускоряет процесс вставки. Предварительная сортировка также повышает эффективность сжатия, поскольку схожие значения оказываются сгруппированными, позволяя таким кодекам, как LZ4 или ZSTD, достигать лучшего коэффициента сжатия. Это особенно полезно в сочетании с вставкой больших батчей и сжатием, поскольку уменьшает как накладные расходы на обработку, так и объём передаваемых данных. Тем не менее, предварительная сортировка — это необязательная оптимизация, а не требование. ClickHouse очень эффективно сортирует данные за счёт параллельной обработки, и во многих случаях сортировка на стороне сервера оказывается быстрее или удобнее, чем предварительная сортировка на стороне клиента. Мы рекомендуем использовать предварительную сортировку только в том случае, если данные уже почти упорядочены или если ресурсы на стороне клиента (CPU, память) достаточны и при этом недоиспользуются. В сценариях, чувствительных к задержкам, или при высокой пропускной способности, например в обсервабилити, где данные поступают не по порядку или от множества агентов, часто лучше отказаться от предварительной сортировки и положиться на встроенную производительность ClickHouse.

Асинхронные вставки

Асинхронные вставки в ClickHouse — это эффективная альтернатива, когда пакетирование на стороне клиента невозможно. Это особенно важно для задач обсервабилити, где сотни или тысячи agent-ов непрерывно отправляют данные — журналы, метрики, трассировки, — часто небольшими полезными нагрузками в реальном времени. Буферизация данных на стороне клиента в таких средах усложняет архитектуру, поскольку требует централизованной очереди, чтобы отправлять достаточно крупные батчи.

Отправлять много небольших батчей в синхронном режиме не рекомендуется, так как это приводит к созданию множества частей. Это ухудшает производительность запросов и вызывает ошибки “too many part”.

Асинхронные вставки переносят ответственность за пакетирование с клиента на сервер: входящие данные записываются в буфер в памяти, а затем сбрасываются в хранилище при достижении настраиваемых порогов. Такой подход значительно снижает накладные расходы на создание частей, уменьшает нагрузку на CPU и обеспечивает эффективную ингестию даже при высоком параллелизме. Основное поведение управляется через настройку async_insert. Асинхронные вставки поддерживаются как через HTTP, так и через native TCP interface. Когда они включены (async_insert = 1), вставки буферизуются и записываются на диск только после выполнения одного из условий сброса:

Буфер достигает заданного размера данных (async_insert_max_data_size, по умолчанию 100 MiB).
Проходит заданный интервал времени (async_insert_busy_timeout_ms, по умолчанию 200 мс или 1000 мс в Cloud).
Накапливается максимальное количество запросов на вставку (async_insert_max_query_number, по умолчанию 450).

Сброс выполняется при достижении первого из этих порогов. Этот процесс пакетирования прозрачен для клиентов и помогает ClickHouse эффективно объединять трафик вставки из нескольких источников. Однако до сброса данные недоступны для запросов. Важно, что для каждой комбинации формы вставки и настроек существует несколько буферов, а в кластерах буферы поддерживаются отдельно на каждом узле, что позволяет гибко управлять ими в многопользовательских средах. Во всем остальном механика вставки идентична описанной для синхронных вставок.

Выбор режима возврата

Поведение асинхронных вставок дополнительно настраивается с помощью параметра wait_for_async_insert. Если установлено значение 1 (по умолчанию), ClickHouse подтверждает вставку только после того, как данные успешно сбрасываются на диск. Это обеспечивает строгие гарантии сохранности данных и упрощает обработку ошибок: если во время сброса что-то пойдет не так, ошибка будет возвращена клиенту. Этот режим рекомендуется для большинства production-сценариев, особенно если отказы вставки нужно надежно отслеживать. Бенчмарки показывают, что этот режим хорошо масштабируется при параллелизме — как с 200, так и с 500 клиентами — благодаря адаптивным вставкам и стабильному созданию частей. Параметр wait_for_async_insert = 0 включает режим “fire-and-forget”. В этом случае сервер подтверждает вставку сразу после буферизации данных, не дожидаясь их записи в хранилище. Это обеспечивает сверхнизкую latency вставок и максимальный throughput, что идеально подходит для высокоскоростных, но некритичных данных. Однако здесь есть компромиссы: нет гарантии, что данные будут сохранены, ошибки проявляются только во время сброса, а dead-letter queue для неудачных вставок отсутствует — для трассировки сбоев приходится постфактум проверять серверные журналы и системные таблицы. Используйте этот режим только в том случае, если ваша рабочая нагрузка допускает потерю данных. Бенчмарки также показывают существенное сокращение количества частей и снижение загрузки CPU, когда буфер сбрасывается нечасто (например, каждые 30 секунд), однако риск незаметного сбоя сохраняется. Мы настоятельно рекомендуем использовать async_insert=1,wait_for_async_insert=1, если вы используете асинхронные вставки. Использование wait_for_async_insert=0 очень рискованно, потому что ваш INSERT-клиент может не узнать о наличии ошибок, а также это может привести к перегрузке, если клиент продолжит быстро записывать данные в ситуации, когда серверу ClickHouse нужно замедлить запись и создать обратное давление, чтобы обеспечить надежность сервиса.

Адаптивные асинхронные вставки

Начиная с версии 24.2, ClickHouse по умолчанию использует адаптивные тайм-ауты сброса буфера (async_insert_use_adaptive_busy_timeout). Вместо фиксированного интервала сброса тайм-аут динамически подстраивается между минимальным значением (async_insert_busy_timeout_min_ms, по умолчанию 50 мс) и максимальным (async_insert_busy_timeout_max_ms, по умолчанию 200 мс или 1000 мс в Cloud) в зависимости от скорости поступления данных. Когда данные поступают часто, тайм-аут остается ближе к минимальному значению, чтобы сброс происходил раньше и уменьшалась сквозная задержка. Когда данные поступают редко, он увеличивается в сторону максимального значения, чтобы накапливать более крупные батчи. Это особенно полезно в режиме по умолчанию (wait_for_async_insert=1), где фиксированный большой тайм-аут заставлял бы клиентов ждать весь интервал, даже если данные уже готовы к сбросу.

Обработка ошибок

Проверка схемы и разбор данных происходят при сбросе буфера, а не в момент получения вставки. Если в какой-либо строке запроса на вставку есть ошибка разбора данных или несоответствие типа, никакие данные из этого запроса не сбрасываются на диск — отклоняется вся полезная нагрузка запроса. В режиме по умолчанию (wait_for_async_insert=1) ошибка возвращается клиенту. В режиме fire-and-forget ошибки записываются в серверный журнал и в таблицу system.asynchronous_inserts. Каждый сброс создает как минимум одну часть для каждого отдельного значения ключа партиционирования в буфере. Даже для таблиц без ключа партиционирования один сброс может создать несколько частей, если объем буферизованных данных превышает max_insert_block_size (по умолчанию ~1 миллион строк).

Несмотря на использование асинхронных вставок, вы все равно можете столкнуться с ошибками “too many parts”, если ключ партиционирования имеет высокую мощность.

Дедупликация и надежность

По умолчанию ClickHouse автоматически выполняет дедупликацию для синхронных вставок, что делает повторные попытки безопасными в случае сбоев. Однако для асинхронных вставок она отключена, если только вы не включили ее явно (ее не следует включать, если у вас есть зависимые materialized views — см. issue). На практике, если дедупликация включена и одна и та же вставка выполняется повторно — например, из-за тайм-аута или сбоя сети, — ClickHouse может безопасно проигнорировать дубликат. Это помогает сохранять идемпотентность и избежать повторной записи данных.

Включение асинхронных вставок

Асинхронные вставки можно включить для конкретного пользователя или для конкретного запроса:

Включение асинхронных вставок на уровне пользователя. В этом примере используется пользователь default; если вы создадите другого пользователя, подставьте его имя:
```
ALTER USER default SETTINGS async_insert = 1
```
Вы можете указать настройки асинхронной вставки с помощью секции SETTINGS в запросах вставки:
```
INSERT INTO YourTable SETTINGS async_insert=1, wait_for_async_insert=1 VALUES (...)
```
Вы также можете указать настройки асинхронной вставки как параметры подключения при использовании клиентской библиотеки ClickHouse для языка программирования. Например, вот как это можно сделать в строке подключения JDBC, если вы используете драйвер ClickHouse Java JDBC для подключения к ClickHouse Cloud:
```
"jdbc:ch://HOST.clickhouse.cloud:8443/?user=default&password=PASSWORD&ssl=true&custom_http_params=async_insert=1,wait_for_async_insert=1"
```

Асинхронные вставки не применяются к запросам INSERT INTO ... SELECT. Если вставка содержит секцию SELECT, запрос всегда выполняется синхронно, независимо от настройки async_insert.

Сброс буферов при завершении работы

Чтобы сбросить все буферы async insert с ожидающими записи данными — например, при корректном завершении работы или перед обслуживанием, — выполните:

SYSTEM FLUSH ASYNC INSERT QUEUE

Это гарантирует, что все буферизованные данные будут записаны в хранилище перед остановкой сервера.

Сравнение с буферными таблицами

Асинхронные вставки — современная замена буферным таблицам. Ключевые различия:

Изменения DDL не требуются. Асинхронные вставки прозрачны — достаточно включить настройку, а не создавать дополнительные таблицы.
Буферизация по форме запроса. Асинхронные вставки поддерживают отдельные буферы для каждой уникальной формы запроса и комбинации настроек, что позволяет применять более гибкие политики сброса. Буферные таблицы используют один буфер на целевую таблицу.
Надёжность. В режиме по умолчанию (wait_for_async_insert=1) данные записываются на диск до того, как клиент получит подтверждение. Буферные таблицы работают по принципу fire-and-forget — при сбое буферизованные данные теряются.
Поведение в кластере. В кластерах буферы асинхронных вставок поддерживаются на каждом узле. Для буферных таблиц их нужно явно создавать на каждом узле.

Выберите интерфейс — HTTP или нативный

Native

ClickHouse предлагает два основных интерфейса для ингестии данных: нативный интерфейс и HTTP-интерфейс — каждый со своим балансом между производительностью и гибкостью. Нативный интерфейс, который используют clickhouse-client и некоторые клиенты для языков, таких как Go и C++, специально разработан для максимальной производительности. Он всегда передаёт данные в высокоэффективном формате Native ClickHouse, поддерживает поблочное сжатие с помощью LZ4 или ZSTD и сводит к минимуму обработку на стороне сервера, перенося на клиент такие задачи, как разбор и преобразование формата. Он даже позволяет вычислять значения столбцов MATERIALIZED и DEFAULT на стороне клиента, благодаря чему сервер может полностью пропустить эти этапы. Это делает нативный интерфейс идеальным для сценариев ингестии с высокой пропускной способностью, где эффективность критически важна.

HTTP

В отличие от многих традиционных баз данных, ClickHouse также поддерживает HTTP-интерфейс. В этом случае приоритет отдается совместимости и гибкости. Он позволяет отправлять данные в любом поддерживаемом формате, включая JSON, CSV, Parquet и другие, и поддерживается большинством клиентов ClickHouse, включая Python, Java, JavaScript и Rust. Этот вариант часто предпочтительнее собственного протокола ClickHouse, поскольку позволяет легко перенаправлять трафик с помощью балансировщиков нагрузки. При использовании собственного протокола возможны небольшие различия в производительности вставки, так как у него немного меньше накладных расходов. Однако HTTP-интерфейс лишен более глубокой интеграции, доступной в собственном протоколе, и не поддерживает оптимизации на стороне клиента, такие как вычисление материализованных значений или автоматическое преобразование в формат Native. Хотя HTTP-вставки по-прежнему можно сжимать с помощью стандартных HTTP-заголовков (например, Content-Encoding: lz4), сжатие применяется ко всей полезной нагрузке, а не к отдельным блокам данных. Этот интерфейс часто выбирают в средах, где простота протокола, балансировка нагрузки или широкая совместимость форматов важнее, чем максимальная производительность. Более подробное описание этих интерфейсов см. здесь.

​Синхронные вставки по умолчанию

​Шаги на стороне клиента

​Шаги на стороне сервера

​Батч-вставки при синхронной вставке

​Обеспечьте идемпотентность повторных попыток

​Выберите подходящую цель для вставки

​Выберите подходящий формат

​Используйте сжатие

​Используйте LZ4 для скорости, а ZSTD — для более высокого коэффициента сжатия

​Сжатие снижает потребление ресурсов

​Предварительная сортировка, если это не требует больших затрат

​Асинхронные вставки

​Выбор режима возврата

​Адаптивные асинхронные вставки

​Обработка ошибок

​Дедупликация и надежность

​Включение асинхронных вставок

​Сброс буферов при завершении работы

​Сравнение с буферными таблицами

​Выберите интерфейс — HTTP или нативный

​Native

​HTTP

Синхронные вставки по умолчанию

Шаги на стороне клиента

Шаги на стороне сервера

Батч-вставки при синхронной вставке

Обеспечьте идемпотентность повторных попыток

Выберите подходящую цель для вставки

Выберите подходящий формат

Используйте сжатие

Используйте LZ4 для скорости, а ZSTD — для более высокого коэффициента сжатия

Сжатие снижает потребление ресурсов

Предварительная сортировка, если это не требует больших затрат

Асинхронные вставки

Выбор режима возврата

Адаптивные асинхронные вставки

Обработка ошибок

Дедупликация и надежность

Включение асинхронных вставок

Сброс буферов при завершении работы

Сравнение с буферными таблицами

Выберите интерфейс — HTTP или нативный

Native

HTTP