Перейти к основному содержанию
На этой странице представлены подробные матрицы поддержки для интеграций ClickHouse с озерами данных. Здесь описаны возможности, доступные для каждого открытого табличного формата, каталоги, к которым может подключаться ClickHouse, а также функции, поддерживаемые каждым каталогом.

Поддержка открытых табличных форматов

ClickHouse интегрируется с четырьмя открытыми табличными форматами: Apache Iceberg, Delta Lake, Apache Hudi и Apache Paimon. Выберите формат ниже, чтобы посмотреть матрицу поддержки. Условные обозначения: ✅ Поддерживается | ⚠️ Частично / экспериментально | ❌ Не поддерживается
ВозможностьСтатусПримечания
Поддерживаемые хранилища
AWS S3Через icebergS3() или псевдоним iceberg()
GCSЧерез icebergS3() или псевдоним iceberg()
Azure Blob StorageЧерез icebergAzure()
HDFS⚠️Через icebergHDFS(). Устарело.
Local filesystemЧерез icebergLocal()
Методы доступа
Табличная функцияicebergS3() в вариантах для каждого типа хранилища
Движок таблицыIcebergS3 в вариантах для каждого типа хранилища
Распределённое чтение в кластереicebergS3Cluster, icebergAzureCluster, icebergHDFSCluster
Именованные коллекцииОпределение именованной коллекции
Возможности чтения
Поддержка чтенияПолная поддержка SELECT со всеми функциями ClickHouse SQL
Отсечение партицийСм. Отсечение партиций.
Скрытое партиционированиеПоддерживается партиционирование Iceberg на основе преобразований
Эволюция партицийПоддерживается чтение таблиц с изменяющимися со временем спецификациями партиций
Эволюция схемыДобавление, удаление и изменение порядка столбцов. См. Эволюция схемы.
Повышение / расширение типовintlong, floatdouble, decimal(P,S)decimal(P',S), где P’ > P. См. Эволюция схемы.
Путешествие во времени / снимкиЧерез настройки iceberg_timestamp_ms или iceberg_snapshot_id. См. Путешествие во времени.
Удаления по позицииСм. Обработка удалённых строк.
Удаления по равенствуТолько для движка таблицы, начиная с v25.8+. См. Обработка удалённых строк.
Merge-on-read⚠️Экспериментальная возможность. Поддерживается для операций удаления.
Версии формата⚠️Поддерживаются v1 и v2. V3 не поддерживается.
Статистика столбцов
Bloom-фильтры / файлы puffinИндексы bloom-фильтров в файлах puffin не поддерживаются
Виртуальные столбцы_path, _file, _size, _time, _etag. См. Виртуальные столбцы.
Возможности записи
Создание таблицыЭкспериментальная возможность. Требуется allow_insert_into_iceberg = 1. Начиная с v25.7+. См. Создание таблицы.
INSERTБета с 26.2. Требуется allow_insert_into_iceberg = 1. См. Вставка данных.
DELETEЭкспериментально. Требуется allow_insert_into_iceberg = 1. Через ALTER TABLE ... DELETE WHERE. См. Удаление данных.
ALTER TABLE (изменения схемы)Экспериментально. Требуется allow_insert_into_iceberg = 1. Добавление, удаление, изменение и переименование столбцов. См. Эволюция схемы.
Compaction⚠️Экспериментально. Требуется allow_experimental_iceberg_compaction = 1. Объединяет файлы позиционного удаления с файлами данных. См. Компакция. Другие операции компакции Iceberg не поддерживаются.
UPDATE / MERGEНе поддерживается. См. Compaction.
Copy-on-writeНе поддерживается
Удаление устаревших снимковНе поддерживается
Удаление осиротевших файловНе поддерживается
Запись в партицииПоддерживается.
Изменение партицийИзменение схемы партиционирования из ClickHouse не поддерживается. ClickHouse может записывать в таблицы Iceberg с изменённой схемой партиционирования.
Метаданные
Ветвление и тегированиеСсылки на ветки/теги Iceberg не поддерживаются
Определение файла метаданныхПоддерживается определение файла метаданных через каталоги, простое перечисление каталога, использование ‘version-hint’ и указание конкретного пути. Настраивается через iceberg_metadata_file_path и iceberg_metadata_table_uuid. См. Определение файла метаданных.
Кэширование данныхТот же механизм, что и в движках хранения S3/Azure/HDFS. См. Кэш данных.
Кэширование метаданныхManifest-файлы и файлы метаданных кэшируются в памяти. По умолчанию включено через use_iceberg_metadata_files_cache. См. Кэш метаданных.

Поддержка каталогов

ClickHouse может подключаться к внешним каталогам данных с помощью движка базы данных DataLakeCatalog, который представляет каталог в виде базы данных ClickHouse. Таблицы, зарегистрированные в каталоге, появляются автоматически, и их можно запрашивать с помощью стандартного SQL. В настоящее время поддерживаются следующие каталоги. Полные инструкции по настройке см. в справочном руководстве для каждого каталога.
КаталогФорматыЧтениеСоздание таблицыINSERTСправочное руководство
Каталог AWS GlueIceberg✅ бетаРуководство по каталогу Glue
BigLake MetastoreIceberg✅ бетаРуководство по BigLake Metastore
Databricks Unity CatalogDelta, Iceberg✅ бета✅ бета✅ бетаРуководство по Unity Catalog
Iceberg RESTIceberg✅ бетаРуководство по REST-каталогу
LakekeeperIceberg✅ бетаРуководство по каталогу Lakekeeper
Project NessieIceberg✅ экспериментальныйРуководство по каталогу Nessie
Microsoft OneLakeIceberg✅ бета✅ бета✅ бетаРуководство по каталогу OneLake
Для всех интеграций с каталогами в настоящее время требуется включить экспериментальную или бета-настройку. За исключением Microsoft OneLake и Databricks Unity Catalog, все каталоги предоставляют доступ только для чтения — таблицы можно запрашивать, но нельзя создавать или записывать в них данные через подключение к каталогу. Чтобы загружать данные из каталога в ClickHouse для ускорения аналитики, используйте INSERT INTO SELECT, как описано в руководстве по ускорению аналитики. Чтобы записывать данные обратно в открытые табличные форматы, создавайте автономные таблицы Iceberg, как описано в руководстве по записи данных.
Последнее изменение 10 июня 2026 г.