Дублирование исходных данных в другом месте
Снимки файловой системы
SELECT.
Снимки на таких репликах будут недоступны для любых запросов, изменяющих данные.
Дополнительным преимуществом может быть то, что эти реплики могут иметь специальные аппаратные конфигурации, где к каждому серверу подключено больше
дисков, что будет экономически выгодно.
Для небольших объёмов данных также может подойти простой INSERT INTO ... SELECT ... в удалённые таблицы.
Операции с частями
ALTER TABLE ... FREEZE PARTITION ... для создания
локальных копий партиций таблицы. Это реализовано с помощью жестких ссылок в каталог /var/lib/clickhouse/shadow/,
поэтому обычно не занимает дополнительного места на диске для уже существующих данных. Созданные
копии файлов не управляются ClickHouse server, поэтому их можно просто оставить там:
это будет простая резервная копия, не требующая какой-либо внешней системы,
но при этом она всё равно останется уязвимой к аппаратным сбоям. По этой причине лучше
скопировать их по сети в другое место, а затем удалить локальные копии.
Распределённые файловые системы и объектные хранилища по-прежнему хорошо подходят для этой задачи,
но могут подойти и обычные файловые серверы с достаточной ёмкостью
(в этом случае передача будет выполняться через сетевую файловую систему или, возможно, с помощью rsync).
Данные можно восстановить из резервной копии с помощью ALTER TABLE ... ATTACH PARTITION ...
Для получения дополнительной информации о запросах, связанных с операциями над партициями, см.
документацию по ALTER.
Для автоматизации этого подхода доступен сторонний инструмент: clickhouse-backup.