Este documento ofrece una introducción a cómo migrar datos de Amazon Redshift a ClickHouse.
Introducción
ClickHouse vs Redshift
- Redshift compila código para cada plan de ejecución de consulta, lo que añade una sobrecarga significativa a la primera ejecución de una consulta. Esta sobrecarga puede estar justificada cuando los patrones de consulta son predecibles y los planes de ejecución compilados pueden almacenarse en una caché de consultas. Sin embargo, esto plantea dificultades para aplicaciones interactivas con consultas variables. Incluso cuando Redshift puede aprovechar esta caché de compilación de código, ClickHouse es más rápido en la mayoría de las consultas. Consulte “ClickBench”.
- Redshift limita la concurrencia a 50 en todas las colas, lo que, aunque es adecuado para BI, lo hace inapropiado para aplicaciones analíticas con alta concurrencia.
| Advantage | Description |
|---|---|
| Menor latencia de consulta | ClickHouse logra menores latencias de consulta, incluso con patrones de consulta variados, bajo alta concurrencia y mientras recibe inserciones en streaming. Incluso cuando su consulta no encuentra resultados en la caché, algo inevitable en la analítica interactiva orientada al usuario, ClickHouse puede seguir procesándola rápidamente. |
| Límites más altos de consultas concurrentes | ClickHouse establece límites mucho más altos para las consultas concurrentes, lo cual es vital para experiencias de aplicación en tiempo real. En ClickHouse, tanto autogestionado como en Cloud, puede ampliar su asignación de cómputo para alcanzar la concurrencia que su aplicación necesita para cada servicio. El nivel de concurrencia de consultas permitida es configurable en ClickHouse, y en ClickHouse Cloud el valor predeterminado es 1000. |
| Compresión de datos superior | ClickHouse ofrece una compresión de datos superior, lo que le permite reducir su almacenamiento total (y, por tanto, el costo) o conservar más datos al mismo costo y obtener más información en tiempo real a partir de ellos. Consulte “ClickHouse vs Redshift Storage Efficiency” a continuación. |