Duplicando os dados de origem em outro lugar
Snapshots do sistema de arquivos
SELECT.
Os snapshots nessas réplicas ficarão inacessíveis a quaisquer consultas que modifiquem dados.
Como benefício adicional, essas réplicas podem ter configurações especiais de hardware, com mais
discos conectados por servidor, o que pode ser mais econômico.
Para volumes menores de dados, um simples INSERT INTO ... SELECT ... em tabelas remotas
também pode funcionar.
Manipulação de Partes
ALTER TABLE ... FREEZE PARTITION ... para criar
uma cópia local das partições da tabela. Isso é feito com hardlinks para a pasta /var/lib/clickhouse/shadow/,
portanto, normalmente não consome espaço adicional em disco para dados antigos. As
cópias dos arquivos criadas não são gerenciadas pelo servidor ClickHouse, então você pode simplesmente deixá-las lá:
você terá um backup simples que não requer nenhum sistema externo adicional,
mas que ainda estará sujeito a problemas de hardware. Por esse motivo, é melhor
copiá-las para outro local remotamente e depois remover as cópias locais.
Sistemas de arquivos distribuídos e armazenamentos de objetos continuam sendo boas opções para isso,
mas servidores de arquivos convencionais montados, com capacidade suficiente, também podem funcionar
(nesse caso, a transferência ocorrerá via sistema de arquivos de rede ou talvez rsync).
Os dados podem ser restaurados do backup usando ALTER TABLE ... ATTACH PARTITION ...
Para mais informações sobre consultas relacionadas à manipulação de partições, consulte a
documentação do ALTER.
Há uma ferramenta de terceiros disponível para automatizar essa abordagem: clickhouse-backup.