- Выгрузка в долгосрочное хранилище - Данные поступают в ClickHouse как слой Real-time аналитики, обеспечивая работу панелей мониторинга и операционной отчетности. Когда данные выходят за пределы окна актуальности, их можно записать в Iceberg в объектном хранилище для надежного и экономичного долговременного хранения в интероперабельном формате.
- Reverse ETL - Преобразования, агрегации и обогащение, выполняемые в ClickHouse, создают производные наборы данных, которые должны использоваться downstream-инструментами и другими командами. Запись этих результатов в таблицы Iceberg делает их доступными для всей экосистемы данных.
INSERT INTO SELECT позволяет переносить данные из таблиц ClickHouse в таблицы Iceberg, хранящиеся в объектном хранилище.
Запись в открытые табличные форматы в настоящее время поддерживается только для таблиц Iceberg. Частичная поддержка таблиц Delta Lake находится в разработке. Таблицы не должны управляться через каталог.
Подготовьте исходный набор данных
Создайте и заполните таблицу MergeTree
Запись данных в таблицу Iceberg
Создайте таблицу Iceberg
IcebergS3.
Обратите внимание, что по сравнению с исходной таблицей MergeTree схему нужно упростить. ClickHouse поддерживает более богатую систему типов, чем Iceberg и лежащие в его основе файлы Parquet, поэтому такие типы, как Enum, LowCardinality и UInt8, в Iceberg не поддерживаются и должны быть приведены к совместимым типам.
Вставка части данных
INSERT INTO SELECT, чтобы записать данные из таблицы MergeTree в таблицу Iceberg. В этом примере мы записываем только транзакции из Лондона: