Estrategia de compresión: LZ4 vs ZSTD en producción
- 50 % de ahorro de almacenamiento en tablas grandes mediante compresión ZSTD
- 2 petabytes de capacidad mensual de procesamiento de datos
- Impacto manejable en el rendimiento de la ingestión y las consultas
- Reducción significativa de costos a escala de cientos de TB
Estrategia de retención basada en columnas
- Analizar los patrones de uso de las columnas mediante la telemetría de ClickHouse
- Identificar columnas con alto consumo de almacenamiento y pocas consultas
- Implementar políticas de retención selectivas
- Supervisar los patrones de consulta para tomar decisiones basadas en datos
Gestión de datos basada en particiones
- Limpieza de datos trivial (eliminar una partición en lugar de borrar fila por fila)
- Cálculos de facturación simplificados
- Mejor rendimiento de las consultas mediante la exclusión de particiones
- Gestión operativa más sencilla
Estrategia de conversión de cadenas a enteros
weather_answer, el optimizador de consultas consulta primero la tabla de mapeo de MySQL para obtener el identificador entero correspondiente y luego reescribe la consulta para usar ese entero antes de enviarla a ClickHouse.
Esta arquitectura preserva la experiencia de usuario: las personas siguen viendo etiquetas descriptivas como weather_answer en sus dashboards, mientras que el almacenamiento y las consultas del backend operan con enteros mucho más eficientes. El sistema de mapeo gestiona toda la traducción de forma transparente, sin requerir cambios en la interfaz de usuario ni en los flujos de trabajo de los usuarios.
Beneficios clave:
- Reducción del 60% del almacenamiento en los conjuntos de datos afectados
- Mejor rendimiento de las consultas al comparar enteros
- Menor uso de memoria para joins y agregaciones
- Menores costes de transferencia de red para grandes conjuntos de resultados
Este es un ejemplo usado específicamente para el caso de datos de Microsoft Clarity. Si tienes todos tus datos en ClickHouse o no tienes restricciones para mover datos a ClickHouse, prueba a usar diccionarios en su lugar.
Videos
- Microsoft Clarity y ClickHouse - Equipo de Microsoft Clarity
- La trayectoria de ClickHouse en Contentsquare - Doron Hoffman & Guram Sigua (ContentSquare)