메인 콘텐츠로 건너뛰기
이 페이지에서는 ClickHouse의 데이터 레이크 통합에 대한 종합적인 지원 매트릭스를 제공합니다. 각 오픈 테이블 포맷에서 사용할 수 있는 기능, ClickHouse가 연결할 수 있는 카탈로그, 그리고 각 카탈로그에서 지원되는 기능을 다룹니다.

오픈 테이블 포맷 지원

ClickHouse는 Apache Iceberg, Delta Lake, Apache Hudi, Apache Paimon 등 4가지 오픈 테이블 포맷을 지원합니다. 아래에서 포맷을 선택하면 해당 지원 매트릭스를 확인할 수 있습니다. 범례: ✅ 지원 | ⚠️ 부분 지원 / Experimental | ❌ 미지원
기능상태비고
스토리지 백엔드
AWS S3icebergS3() 또는 iceberg() alias를 통해 사용
GCSicebergS3() 또는 iceberg() alias를 통해 사용
Azure Blob StorageicebergAzure()를 통해 사용
HDFS⚠️icebergHDFS()를 통해 사용합니다. 더 이상 권장되지 않습니다.
Local filesystemicebergLocal()를 통해 사용
접근 방식
테이블 함수백엔드별 변형을 제공하는 icebergS3()
테이블 엔진백엔드별 변형을 제공하는 IcebergS3
클러스터 분산 읽기icebergS3Cluster, icebergAzureCluster, icebergHDFSCluster
이름이 지정된 컬렉션명명된 컬렉션 정의
읽기 기능
읽기 지원모든 ClickHouse SQL 함수와 함께 전체 SELECT를 지원
파티션 프루닝Partition pruning을 참조하십시오.
숨겨진 파티셔닝Iceberg transform 기반 파티셔닝을 지원
파티션 진화시간에 따라 파티션 사양이 변경되는 테이블 읽기를 지원
스키마 진화컬럼 추가, 제거, 재정렬을 지원합니다. Schema evolution을 참조하십시오.
유형 승격 / 확장intlong, floatdouble, decimal(P,S)decimal(P',S)를 지원하며, 여기서 P’ > P입니다. Schema evolution을 참조하십시오.
시점 이동 / 스냅샷iceberg_timestamp_ms 또는 iceberg_snapshot_id 설정을 통해 지원합니다. Time travel을 참조하십시오.
위치 삭제Processing deleted rows를 참조하십시오.
동등성 삭제v25.8+부터 테이블 엔진에서만 지원됩니다. Processing deleted rows를 참조하십시오.
읽기 시 머지⚠️실험적 기능입니다. delete operations에서 지원됩니다.
포맷 버전⚠️v1 및 v2를 지원합니다. V3는 지원되지 않습니다.
컬럼 통계
블룸 필터 / puffin 파일puffin 파일의 블룸 필터 인덱스는 지원되지 않습니다
가상 컬럼_path, _file, _size, _time, _etag. Virtual columns을 참조하십시오.
쓰기 기능
테이블 생성실험적 기능입니다. allow_insert_into_iceberg = 1이 필요합니다. v25.7+부터 지원됩니다. Creating a table을 참조하십시오.
INSERT26.2부터 베타입니다. allow_insert_into_iceberg = 1이 필요합니다. 데이터 삽입을 참조하십시오.
DELETE실험적 기능입니다. allow_insert_into_iceberg = 1이 필요합니다. ALTER TABLE ... DELETE WHERE를 통해 수행합니다. 데이터 삭제를 참조하십시오.
ALTER TABLE (schema changes)실험적 기능입니다. allow_insert_into_iceberg = 1이 필요합니다. 컬럼 추가, 삭제, 수정, 이름 변경을 지원합니다. 스키마 진화를 참조하십시오.
Compaction⚠️실험적 기능입니다. allow_experimental_iceberg_compaction = 1이 필요합니다. 포지션 삭제 파일을 데이터 파일에 머지합니다. Compaction을 참조하십시오. 다른 Iceberg compaction 작업은 지원되지 않습니다.
UPDATE / MERGE지원되지 않습니다. Compaction을 참조하십시오.
Copy-on-write지원되지 않습니다
Expire snapshots지원되지 않습니다
Remove orphan files지원되지 않습니다
Writing partitions지원됩니다.
Altering partitionsClickHouse에서 파티셔닝 방식 변경은 지원되지 않습니다. ClickHouse는 파티셔닝이 진화된 Iceberg 테이블에 쓸 수 있습니다.
메타데이터
Branching and taggingIceberg 브랜치/태그 참조는 지원되지 않습니다
Metadata file resolution카탈로그, 단순 디렉터리 나열, ‘version-hint’, 특정 경로를 사용한 메타데이터 파일 확인을 지원합니다. iceberg_metadata_file_pathiceberg_metadata_table_uuid로 구성할 수 있습니다. 메타데이터 파일 확인을 참조하십시오.
Data cachingS3/Azure/HDFS 스토리지 엔진과 동일한 메커니즘입니다. 데이터 캐시를 참조하십시오.
Metadata caching매니페스트와 메타데이터 파일이 메모리에 캐시됩니다. 기본적으로 use_iceberg_metadata_files_cache를 통해 활성화됩니다. 메타데이터 캐시를 참조하십시오.

카탈로그 지원

ClickHouse는 DataLakeCatalog 데이터베이스 엔진을 사용해 외부 데이터 카탈로그에 연결할 수 있으며, 이 엔진은 카탈로그를 ClickHouse 데이터베이스로 노출합니다. 카탈로그에 등록된 테이블은 자동으로 표시되며, 표준 SQL로 쿼리할 수 있습니다. 현재 다음 카탈로그를 지원합니다. 전체 설정 방법은 각 카탈로그의 참고 가이드를 참조하십시오.
CatalogFormatsReadCreate tableINSERT참고 가이드
AWS Glue CatalogIceberg✅ 베타Glue 카탈로그 가이드
BigLake MetastoreIceberg✅ 베타BigLake 메타스토어 가이드
Databricks Unity CatalogDelta, Iceberg✅ 베타✅ 베타✅ 베타Unity Catalog 가이드
Iceberg RESTIceberg✅ 베타REST 카탈로그 가이드
LakekeeperIceberg✅ 베타Lakekeeper 카탈로그 가이드
Project NessieIceberg✅ ExperimentalNessie 카탈로그 가이드
Microsoft OneLakeIceberg✅ 베타✅ 베타✅ 베타OneLake 카탈로그 가이드
현재 모든 카탈로그 통합은 Experimental 또는 베타 설정을 활성화해야 사용할 수 있습니다. Microsoft OneLake와 Databricks Unity Catalog를 제외한 모든 카탈로그는 읽기 전용 액세스만 제공합니다. 즉, 카탈로그 연결을 통해 테이블을 쿼리할 수는 있지만, 테이블을 생성하거나 데이터를 쓸 수는 없습니다. 카탈로그의 데이터를 ClickHouse로 로드해 더 빠르게 분석하려면 분석 가속화 가이드에 설명된 대로 INSERT INTO SELECT를 사용하십시오. 오픈 테이블 포맷에 데이터를 다시 쓰려면 데이터 쓰기 가이드에 설명된 대로 독립형 Iceberg 테이블을 생성하십시오.
마지막 수정일 2026년 6월 10일