압축 전략: 운영 환경에서의 LZ4 vs ZSTD
- ZSTD 압축을 통해 대규모 테이블에서 스토리지 50% 절감
- 월 2페타바이트 데이터 처리 용량
- 수집과 쿼리 성능에 대한 영향이 관리 가능한 수준
- 수백 TB 규모에서 상당한 비용 절감
컬럼 기반 보존 전략
- ClickHouse 텔레메트리를 사용해 컬럼 사용 패턴을 분석합니다
- 스토리지 사용량은 높고 쿼리 수는 적은 컬럼을 식별합니다
- 선택적 보존 정책을 구현합니다
- 데이터 기반 의사결정을 위해 쿼리 패턴을 모니터링합니다
파티션 기반 데이터 관리
- 매우 간단한 데이터 정리(행별 삭제 대신 파티션 삭제)
- 청구 계산 단순화
- 파티션 프루닝을 통한 쿼리 성능 향상
- 더 쉬운 운영 관리
문자열-정수 변환 전략
weather_answer에 대한 데이터를 요청하면, 쿼리 최적화기가 먼저 MySQL 매핑 테이블을 조회해 해당 정수 ID를 찾은 뒤, 그 정수를 사용하도록 쿼리를 변환하여 ClickHouse로 전송합니다.
이 아키텍처는 사용자 경험을 그대로 유지합니다. 즉, 사용자는 여전히 대시보드에서 weather_answer와 같은 의미 있는 레이블을 볼 수 있지만, 백엔드 저장소와 쿼리는 훨씬 더 효율적인 정수를 기준으로 동작합니다. 매핑 시스템이 모든 변환을 투명하게 처리하므로 사용자 인터페이스나 사용자 워크플로를 변경할 필요도 없습니다.
주요 이점:
- 영향을 받는 데이터셋의 저장 공간 60% 절감
- 정수 비교를 사용해 더 빠른 쿼리 성능 제공
- 조인 및 집계 시 메모리 사용량 감소
- 대규모 결과 집합의 네트워크 전송 비용 절감
이 예시는 Microsoft Clarity의 데이터 시나리오에 특화된 예시입니다. 모든 데이터가 ClickHouse에 있거나 데이터를 ClickHouse로 옮기는 데 제약이 없다면, 대신 Dictionaries를 사용해 보십시오.
영상 자료
- Microsoft Clarity and ClickHouse - Microsoft Clarity 팀
- ClickHouse journey in Contentsquare - Doron Hoffman & Guram Sigua (ContentSquare)