Esta es la Parte 2 de una guía sobre la migración de PostgreSQL a ClickHouse. A través de un ejemplo práctico, muestra cómo llevar a cabo la migración de forma eficiente mediante un enfoque de replicación en tiempo real (CDC). Muchos de los conceptos tratados también se aplican a las transferencias masivas manuales de datos de PostgreSQL a ClickHouse.La mayoría de las consultas SQL de su entorno de PostgreSQL deberían ejecutarse en ClickHouse sin modificaciones y, probablemente, más rápido.
Deduplicación usando CDC
Optimizar consultas en ClickHouse
Para simplificar, las consultas siguientes omiten el uso de técnicas para deduplicar los datos.
Los recuentos aquí diferirán ligeramente, ya que los datos de Postgres solo contienen filas que cumplen la integridad referencial de las claves foráneas. ClickHouse no impone esas restricciones y, por lo tanto, contiene el dataset completo; por ejemplo, incluye usuarios anónimos.Users (con más de 10 preguntas) que reciben la mayor cantidad de vistas:
tags tienen más views: