Particiones de tabla - ClickHouse Documentation

¿Qué son las particiones de tabla en ClickHouse?

Las particiones agrupan las partes de datos de una tabla de la familia de motores MergeTree en unidades lógicas y organizadas: una forma de organizar los datos con sentido conceptual y alineada con criterios específicos, como rangos de tiempo, categorías u otros atributos clave. Estas unidades lógicas facilitan la gestión, consulta y optimización de los datos.

PARTITION BY

El particionamiento puede habilitarse al definir inicialmente una tabla mediante la cláusula PARTITION BY. Esta cláusula puede contener una expresión SQL sobre cualquier columna, cuyos resultados definirán a qué partición pertenece una fila. Para ilustrarlo, ampliamos la tabla de ejemplo Qué son las partes de una tabla añadiendo una cláusula PARTITION BY toStartOfMonth(date), que organiza las partes de datos de la tabla según el mes de venta de las propiedades:

CREATE TABLE uk.uk_price_paid_simple_partitioned
(
    date Date,
    town LowCardinality(String),
    street LowCardinality(String),
    price UInt32
)
ENGINE = MergeTree
ORDER BY (town, street)
PARTITION BY toStartOfMonth(date);

Puedes consultar esta tabla en nuestro Playground de ClickHouse SQL.

Estructura en disco

Siempre que se inserta un conjunto de filas en la tabla, en lugar de crear una sola parte de datos que contenga todas las filas insertadas (como se describe aquí) con al menos, ClickHouse crea una nueva parte de datos para cada valor único de la clave de partición presente en las filas insertadas:
El servidor de ClickHouse primero divide las filas del ejemplo de inserción, con 4 filas representadas en el diagrama anterior, según el valor de su clave de partición toStartOfMonth(date). Luego, para cada partición identificada, las filas se procesan como es habitual mediante varios pasos secuenciales (① Ordenación, ② División en columnas, ③ Compresión, ④ Escritura en disco). Ten en cuenta que, con el particionamiento habilitado, ClickHouse crea automáticamente índices MinMax para cada parte de datos. Se trata simplemente de archivos para cada columna de la tabla utilizada en la expresión de la clave de partición, que contienen los valores mínimo y máximo de esa columna dentro de la parte de datos.

Fusiones por partición

Con el particionamiento habilitado, ClickHouse solo fusiona partes de datos dentro de una misma partición, pero no entre particiones. Lo mostramos en la tabla de ejemplo anterior:
Como se muestra en el diagrama anterior, las partes que pertenecen a particiones distintas nunca se fusionan. Si se elige una clave de partición con alta cardinalidad, las partes distribuidas entre miles de particiones nunca serán candidatas a fusión, lo que hará que se superen los límites preconfigurados y provocará el temido error Too many parts. Resolver este problema es sencillo: elija una clave de partición razonable con una cardinalidad inferior a 1000..10000.

Monitorización de particiones

Puede consultar la lista de todas las particiones únicas existentes de nuestra tabla de ejemplo mediante la columna virtual _partition_value: Como alternativa, ClickHouse realiza un seguimiento de todas las partes y particiones de todas las tablas en la tabla del sistema system.parts, y la siguiente consulta devuelve, para nuestra tabla de ejemplo, la lista de todas las particiones, junto con el número actual de partes activas y la suma de filas de esas partes por partición:

¿Para qué se usan las particiones de tabla?

Gestión de datos

En ClickHouse, el particionamiento es principalmente una función de gestión de datos. Al organizar los datos de forma lógica según una expresión de partición, cada partición puede gestionarse de forma independiente. Por ejemplo, el esquema de particionamiento de la tabla de ejemplo anterior permite conservar en la tabla principal solo los datos de los últimos 12 meses, eliminando automáticamente los datos más antiguos mediante una regla TTL (véase la última fila añadida de la sentencia DDL):

CREATE TABLE uk.uk_price_paid_simple_partitioned
(
    date Date,
    town LowCardinality(String),
    street LowCardinality(String),
    price UInt32
)
ENGINE = MergeTree
PARTITION BY toStartOfMonth(date)
ORDER BY (town, street)
TTL date + INTERVAL 12 MONTH DELETE;

Dado que la tabla está particionada por toStartOfMonth(date), se eliminarán particiones completas (conjuntos de partes de tabla) que cumplan la condición de TTL, lo que hace que la operación de limpieza sea más eficiente, sin necesidad de reescribir partes. Del mismo modo, en lugar de eliminar los datos antiguos, estos pueden trasladarse de forma automática y eficiente a un nivel de almacenamiento más rentable:

CREATE TABLE uk.uk_price_paid_simple_partitioned
(
    date Date,
    town LowCardinality(String),
    street LowCardinality(String),
    price UInt32
)
ENGINE = MergeTree
PARTITION BY toStartOfMonth(date)
ORDER BY (town, street)
TTL date + INTERVAL 12 MONTH TO VOLUME 'slow_but_cheap';

Optimización de consultas

Las particiones pueden ayudar a mejorar el rendimiento de las consultas, pero esto depende en gran medida de los patrones de acceso. Si las consultas se dirigen solo a unas pocas particiones (idealmente, a una sola), el rendimiento puede mejorar. Normalmente, esto solo resulta útil si la clave de partición no está en la clave primaria y se está filtrando por ella, como se muestra en la consulta de ejemplo a continuación. La consulta se ejecuta sobre la tabla de ejemplo anterior y calcula el precio más alto de todas las propiedades vendidas en Londres en diciembre de 2020, filtrando tanto por una columna (date) usada en la clave de partición de la tabla como por una columna (town) usada en la clave primaria de la tabla (y date no forma parte de la clave primaria). ClickHouse procesa esa consulta aplicando una secuencia de técnicas de poda para evitar evaluar datos irrelevantes:
① Poda de particiones: se usan los índices MinMax para ignorar particiones completas (conjuntos de partes) que, lógicamente, no pueden coincidir con el filtro de la consulta sobre columnas usadas en la clave de partición de la tabla. ② Poda de gránulos: para las partes de datos restantes tras el paso ①, se usa su índice primario para ignorar todos los gránulos (bloques de filas) que, lógicamente, no pueden coincidir con el filtro de la consulta sobre columnas usadas en la clave primaria de la tabla. Podemos observar estos pasos de poda de datos inspeccionando el plan físico de ejecución de la consulta para la consulta de ejemplo anterior mediante una cláusula EXPLAIN:

EXPLAIN indexes = 1
SELECT MAX(price) AS highest_price
FROM uk.uk_price_paid_simple_partitioned
WHERE date >= '2020-12-01'
  AND date <= '2020-12-31'
  AND town = 'LONDON';

    ┌─explain──────────────────────────────────────────────────────────────────────────────────────────────────────┐
│ Expression ((Project names + Projection))                                                                    │
│   Aggregating                                                                                                │
│     Expression (Before GROUP BY)                                                                             │
│       Expression                                                                                             │
│         ReadFromMergeTree (uk.uk_price_paid_simple_partitioned)                                              │
│         Indexes:                                                                                             │
│           MinMax                                                                                             │
│             Keys:                                                                                            │
│               date                                                                                           │
│             Condition: and((date in (-Inf, 18627]), (date in [18597, +Inf)))                                 │
│             Parts: 1/436                                                                                     │
│             Granules: 11/3257                                                                                │
│           Partition                                                                                          │
│             Keys:                                                                                            │
│               toStartOfMonth(date)                                                                           │
│             Condition: and((toStartOfMonth(date) in (-Inf, 18597]), (toStartOfMonth(date) in [18597, +Inf))) │
│             Parts: 1/1                                                                                       │
│             Granules: 11/11                                                                                  │
│           PrimaryKey                                                                                         │
│             Keys:                                                                                            │
│               town                                                                                           │
│             Condition: (town in ['LONDON', 'LONDON'])                                                        │
│             Parts: 1/1                                                                                       │
│             Granules: 1/11                                                                                   │
    └──────────────────────────────────────────────────────────────────────────────────────────────────────────────┘

La salida anterior muestra: ① Poda de particiones: Las filas 7 a 18 de la salida de EXPLAIN anterior muestran que ClickHouse primero usa el índice MinMax del campo date para identificar 11 de los 3257 gránulos existentes (bloques de filas) almacenados en 1 de las 436 partes de datos activas existentes que contienen filas que coinciden con el filtro date de la consulta. ② Poda de gránulos: Las filas 19 a 24 de la salida de EXPLAIN anterior indican que ClickHouse luego usa el índice primario (creado sobre el campo town) de la parte de datos identificada en el paso ① para reducir aún más el número de gránulos (que contienen filas que potencialmente también coinciden con el filtro town de la consulta) de 11 a 1. Esto también se refleja en la salida del cliente de ClickHouse que imprimimos más arriba para la ejecución de la consulta:

... Elapsed: 0.006 sec. Processed 8.19 thousand rows, 57.34 KB (1.36 million rows/s., 9.49 MB/s.)
Peak memory usage: 2.73 MiB.

Esto significa que ClickHouse escaneó y procesó 1 gránulo (bloque de 8192 filas) en 6 milisegundos para calcular el resultado de la consulta.

El particionamiento es principalmente una función de gestión de datos

Ten en cuenta que consultar todas las particiones suele ser más lento que ejecutar la misma consulta sobre una tabla no particionada. Con el particionamiento, los datos suelen distribuirse entre más partes de datos, lo que a menudo hace que ClickHouse examine y procese un mayor volumen de datos. Podemos demostrarlo ejecutando la misma consulta tanto sobre la tabla de ejemplo What are table parts (sin particionamiento habilitado) como sobre nuestra tabla de ejemplo actual de arriba (con particionamiento habilitado). Ambas tablas contienen los mismos datos y el mismo número de filas: Sin embargo, la tabla con particiones habilitadas tiene más partes de datos activas porque, como se mencionó antes, ClickHouse solo fusiona partes de datos dentro de las particiones, pero no entre ellas: Como se mostró más arriba, la tabla particionada uk_price_paid_simple_partitioned tiene más de 600 particiones y, por lo tanto, 600 306 partes de datos activas. En cambio, en nuestra tabla no particionada uk_price_paid_simple, todas las partes de datos iniciales pudieron fusionarse en una sola parte activa mediante fusiones en segundo plano. Cuando comprobamos el plan físico de ejecución de la consulta con una cláusula EXPLAIN para nuestra consulta de ejemplo anterior, sin el filtro de partición, ejecutada sobre la tabla particionada, podemos ver en las filas 19 y 20 de la salida siguiente que ClickHouse identificó 671 de los 3257 gránulos existentes (bloques de filas), repartidos en 431 de las 436 partes de datos activas existentes, que potencialmente contienen filas que coinciden con el filtro de la consulta y que, por lo tanto, serán examinados y procesados por el motor de consultas:

EXPLAIN indexes = 1
SELECT MAX(price) AS highest_price
FROM uk.uk_price_paid_simple_partitioned
WHERE town = 'LONDON';

    ┌─explain─────────────────────────────────────────────────────────┐
│ Expression ((Project names + Projection))                       │
│   Aggregating                                                   │
│     Expression (Before GROUP BY)                                │
│       Expression                                                │
│         ReadFromMergeTree (uk.uk_price_paid_simple_partitioned) │
│         Indexes:                                                │
│           MinMax                                                │
│             Condition: true                                     │
│             Parts: 436/436                                      │
│             Granules: 3257/3257                                 │
│           Partition                                             │
│             Condition: true                                     │
│             Parts: 436/436                                      │
│             Granules: 3257/3257                                 │
│           PrimaryKey                                            │
│             Keys:                                               │
│               town                                              │
│             Condition: (town in ['LONDON', 'LONDON'])           │
│             Parts: 431/436                                      │
│             Granules: 671/3257                                  │
    └─────────────────────────────────────────────────────────────────┘

El plan físico de ejecución de la misma consulta de ejemplo sobre la tabla sin particiones muestra en las filas 11 y 12 de la salida siguiente que ClickHouse identificó 241 de los 3083 bloques de filas existentes en la única parte de datos activa de la tabla que podrían contener filas que coinciden con el filtro de la consulta:

EXPLAIN indexes = 1
SELECT MAX(price) AS highest_price
FROM uk.uk_price_paid_simple
WHERE town = 'LONDON';

    ┌─explain───────────────────────────────────────────────┐
│ Expression ((Project names + Projection))             │
│   Aggregating                                         │
│     Expression (Before GROUP BY)                      │
│       Expression                                      │
│         ReadFromMergeTree (uk.uk_price_paid_simple)   │
│         Indexes:                                      │
│           PrimaryKey                                  │
│             Keys:                                     │
│               town                                    │
│             Condition: (town in ['LONDON', 'LONDON']) │
│             Parts: 1/1                                │
│             Granules: 241/3083                        │
    └───────────────────────────────────────────────────────┘

Al ejecutar la consulta sobre la versión particionada de la tabla, ClickHouse escanea y procesa 671 bloques de filas (~ 5.5 millones de filas) en 90 milisegundos:

SELECT MAX(price) AS highest_price
FROM uk.uk_price_paid_simple_partitioned
WHERE town = 'LONDON';

┌─highest_price─┐
│     594300000 │ -- 594.30 millones
└───────────────┘

1 row in set. Elapsed: 0.090 sec. Processed 5.48 million rows, 27.95 MB (60.66 million rows/s., 309.51 MB/s.)
Peak memory usage: 163.44 MiB.

En cambio, al ejecutar la consulta en la tabla no particionada, ClickHouse escanea y procesa 241 bloques (~ 2 millones de filas) en 12 milisegundos:

SELECT MAX(price) AS highest_price
FROM uk.uk_price_paid_simple
WHERE town = 'LONDON';

┌─highest_price─┐
│     594300000 │ -- 594.30 millones
└───────────────┘

1 row in set. Elapsed: 0.012 sec. Processed 1.97 million rows, 9.87 MB (162.23 million rows/s., 811.17 MB/s.)
Peak memory usage: 62.02 MiB.

​¿Qué son las particiones de tabla en ClickHouse?

​PARTITION BY

​Estructura en disco

​Fusiones por partición

​Monitorización de particiones

​¿Para qué se usan las particiones de tabla?

​Gestión de datos

​Optimización de consultas

​El particionamiento es principalmente una función de gestión de datos