Saltar al contenido principal

Atomicidad

La atomicidad garantiza que una transacción (una serie de operaciones de base de datos) se trate como una sola unidad indivisible. Esto significa que todas las operaciones de la transacción se realizan o no se realiza ninguna. Un ejemplo de transacción atómica es la transferencia de dinero de una cuenta bancaria a otra. Si alguno de los pasos de la transferencia falla, la transacción falla y el dinero permanece en la primera cuenta. La atomicidad garantiza que no se pierda ni se cree dinero.

Bloque

Un bloque es una unidad lógica para organizar el procesamiento y almacenamiento de datos. Cada bloque contiene datos columnares que se procesan de forma conjunta para mejorar el rendimiento durante la ejecución de consultas. Al procesar los datos en bloques, ClickHouse aprovecha eficientemente los núcleos de CPU al minimizar los fallos de caché y facilitar la ejecución vectorizada. ClickHouse utiliza varios algoritmos de compresión, como LZ4, ZSTD y Delta, para comprimir los datos en bloques.

Clúster

Un conjunto de nodos (servidores) que trabajan juntos para almacenar y procesar datos.

CMEK

Las claves de cifrado gestionadas por el cliente (CMEK) permiten a los clientes usar la clave de su servicio de gestión de claves (KMS) para cifrar la clave de datos del disco de ClickHouse y proteger sus datos en reposo.

Diccionario

Un diccionario es una correspondencia de pares clave-valor útil para varios tipos de listas de referencia. Es una funcionalidad potente que permite usar diccionarios de forma eficiente en las consultas, algo que a menudo resulta más eficiente que usar un JOIN con tablas de referencia.

Tabla distribuida

Una tabla distribuida en ClickHouse es un tipo especial de tabla que no almacena datos por sí misma, sino que ofrece una vista unificada para el procesamiento distribuido de consultas en varios servidores de un clúster.

Gránulo

Un gránulo es un lote de filas dentro de un bloque sin comprimir. Al leer datos, ClickHouse accede a los gránulos, no a las filas individuales, lo que permite procesar los datos más rápido en cargas de trabajo analíticas. De forma predeterminada, un gránulo contiene 8192 filas. El índice primario contiene una entrada por gránulo.

Vista materializada incremental

En ClickHouse, se trata de un tipo de vista materializada que procesa y agrega datos en el momento de la inserción. Cuando se insertan nuevos datos en la tabla de origen, la vista materializada ejecuta una consulta de agregación SQL predefinida solo sobre los bloques recién insertados y escribe los resultados agregados en una tabla de destino.

Actualización ligera

Una actualización ligera en ClickHouse es una característica experimental que permite actualizar filas de una tabla mediante la sintaxis estándar de SQL UPDATE, pero, en lugar de reescribir columnas completas o partes de datos (como ocurre con las mutaciones tradicionales), crea “patch parts” que contienen solo las columnas y filas actualizadas. Estas actualizaciones son visibles de inmediato en las consultas SELECT mediante la aplicación de parches, pero los datos físicos solo se actualizan durante los merges posteriores.

Archivo de marcas

Un archivo de marcas en ClickHouse es un archivo que almacena “marcas”, es decir, entradas de índice que ayudan a ClickHouse a localizar rápidamente en qué archivos de datos se almacenan rangos de datos específicos.

Vista materializada

Una vista materializada en ClickHouse es un mecanismo que ejecuta automáticamente una consulta sobre los datos a medida que se insertan en una tabla de origen y almacena los resultados transformados o agregados en una tabla de destino independiente para agilizar las consultas.

MergeTree

Un MergeTree en ClickHouse es un motor de tabla diseñado para altas tasas de ingestión y grandes volúmenes de datos. Es el motor de almacenamiento principal de ClickHouse y ofrece funcionalidades como almacenamiento columnar, particionamiento personalizado, índices primarios dispersos y la posibilidad de realizar fusiones de datos en segundo plano.

Mutación

Una mutación en ClickHouse es una operación que modifica o elimina datos existentes en una tabla, normalmente mediante comandos como ALTER TABLE … UPDATE o ALTER TABLE … DELETE. Las mutaciones se implementan como procesos asíncronos en segundo plano que reescriben por completo las partes de datos afectadas por el cambio, en lugar de modificar las filas directamente.

Mutación sobre la marcha

Las mutaciones sobre la marcha en ClickHouse son un mecanismo que permite que las operaciones de actualización o eliminación sean visibles en las consultas SELECT posteriores inmediatamente después de enviar la mutación, sin esperar a que termine el proceso de mutación en segundo plano.

Partes

Un archivo físico en un disco que almacena una porción de los datos de la tabla. Esto es distinto de una partición, que es una división lógica de los datos de una tabla creada mediante una clave de partición.

Clave de particionamiento

Una clave de particionamiento en ClickHouse es una expresión SQL definida en la cláusula PARTITION BY al crear una tabla. Determina cómo los datos se agrupan lógicamente en particiones en el disco. Cada valor único de la clave de particionamiento forma su propia partición física, lo que permite realizar operaciones eficientes de gestión de datos, como eliminar, mover o archivar particiones completas.

Clave primaria

En ClickHouse, la clave primaria determina el orden en que los datos se almacenan en disco y se usa para crear un índice disperso que acelera el filtrado de consultas. A diferencia de las bases de datos tradicionales, la clave primaria en ClickHouse no garantiza la unicidad: varias filas pueden tener el mismo valor de clave primaria.

Proyección

Una proyección en ClickHouse es una tabla oculta, mantenida automáticamente, que almacena datos en un orden distinto o con agregaciones precalculadas para acelerar las consultas, especialmente las que filtran por columnas que no forman parte de la clave primaria de la tabla principal.

Vista materializada actualizable

Una vista materializada actualizable es un tipo de vista materializada que vuelve a ejecutar periódicamente su consulta sobre el conjunto de datos completo y almacena el resultado en una tabla de destino. A diferencia de las vistas materializadas incrementales, las vistas materializadas actualizables se actualizan de forma programada y pueden admitir consultas complejas, incluidos JOINs y UNIONs, sin restricciones.

Réplica

Una copia de los datos almacenados en una base de datos de ClickHouse. Puede haber cualquier cantidad de réplicas de los mismos datos para proporcionar redundancia y fiabilidad. Las réplicas se usan junto con el motor de tabla ReplicatedMergeTree, que permite a ClickHouse mantener sincronizadas varias copias de los datos entre distintos servidores.

Segmento

Un subconjunto de datos. ClickHouse siempre tiene al menos un segmento para sus datos. Si no distribuye los datos entre varios servidores, se almacenarán en un único segmento. La distribución de los datos entre varios servidores puede utilizarse para repartir la carga si se supera la capacidad de un solo servidor.

Índice de omisión

Los índices de omisión se utilizan para almacenar pequeñas cantidades de metadatos a nivel de varios gránulos consecutivos, lo que permite a ClickHouse evitar escanear filas irrelevantes. Los índices de omisión ofrecen una alternativa ligera a las proyecciones.

Clave de ordenación

En ClickHouse, una clave de ordenación define el orden físico de las filas en disco. Si no se especifica una clave primaria, ClickHouse usa la clave de ordenación como clave primaria. Si se especifican ambas, la clave primaria debe ser un prefijo de la clave de ordenación.

Índice disperso

Un tipo de indexación en el que el índice primario contiene una entrada para un grupo de filas, en lugar de para una sola fila. La entrada correspondiente a un grupo de filas se denomina marca. Con los índices dispersos, ClickHouse primero identifica grupos de filas que podrían coincidir con la consulta y luego los procesa por separado para encontrar coincidencias. Gracias a esto, el índice primario es lo bastante pequeño como para cargarse en memoria.

Motor de tabla

Los motores de tabla de ClickHouse determinan cómo se escriben, almacenan y consultan los datos. MergeTree es el motor de tabla más común y permite insertar rápidamente grandes cantidades de datos, que se procesan en segundo plano.

TTL

Time To Live (TTL) es una funcionalidad de ClickHouse que mueve, elimina o agrega automáticamente columnas o filas después de un período de tiempo determinado. Esto le permite administrar el almacenamiento de forma más eficiente, ya que puede eliminar, mover o archivar los datos a los que ya no necesita acceder con frecuencia.
Última modificación el 10 de junio de 2026