Это Часть 2 руководства по миграции с PostgreSQL на ClickHouse. На практическом примере здесь показано, как эффективно выполнить миграцию с использованием подхода CDC (фиксации изменений данных) в реальном времени. Многие из рассмотренных концепций также применимы к ручному переносу больших объемов данных из PostgreSQL в ClickHouse.Большинство SQL-запросов из PostgreSQL должны выполняться в ClickHouse без изменений и, вероятно, будут работать быстрее.
Дедупликация с использованием CDC (фиксация изменений данных)
Оптимизация запросов в ClickHouse
Для простоты в приведенных ниже запросах не используются методы дедупликации данных.
Приведенные здесь значения будут немного отличаться, поскольку данные в Postgres содержат только строки, удовлетворяющие ограничениям ссылочной целостности внешних ключей. В ClickHouse таких ограничений нет, поэтому он содержит полный набор данных, включая, например, анонимных пользователей.Пользователи (с более чем 10 вопросами), набравшие больше всего просмотров:
tags больше всего views: