ALTER que manipulam dados da tabela por meio de exclusões. Em especial, incluem consultas como ALTER TABLE DELETE. Executar essas consultas gera novas versões modificadas das partes de dados. Isso significa que essas instruções acionam a reescrita de partes de dados inteiras para todos os dados inseridos antes da mutação, resultando em uma grande quantidade de solicitações de gravação.
Para exclusões, você pode evitar essa grande quantidade de solicitações de gravação usando motores de tabela especializados, como ReplacingMergeTree ou CollapsingMergeTree, em vez do motor de tabela MergeTree padrão.
[db.]table que correspondem à expressão expr. Ela está disponível apenas para a família *MergeTree de mecanismos de tabela.
Exemplos
Exclusão leve não exclui os dados imediatamente
DELETE aguardam a conclusão da marcação das linhas como excluídas antes de retornar. Isso pode levar muito tempo se o volume de dados for grande. Como alternativa, você pode executá-la de forma assíncrona em segundo plano usando a configuração lightweight_deletes_sync. Se ela estiver desabilitada, a instrução DELETE retornará imediatamente, mas os dados ainda poderão ficar visíveis para consultas até que a mutação em segundo plano seja concluída.
A mutação não remove fisicamente as linhas marcadas como excluídas; isso só acontece durante a próxima mesclagem. Como resultado, é possível que, por um período indeterminado, os dados não sejam de fato excluídos do armazenamento, apenas marcados como excluídos.
Se você precisar garantir que seus dados sejam excluídos do armazenamento em um prazo previsível, considere usar a configuração da tabela min_age_to_force_merge_seconds. Ou use o comando ALTER TABLE … DELETE. Observe que excluir dados com ALTER TABLE ... DELETE pode consumir recursos significativos, pois recria todas as partes afetadas.
Exclusão de grandes volumes de dados
TRUNCATE TABLE.
Se você espera fazer exclusões frequentes, considere usar uma chave de particionamento personalizada. Você poderá então usar o comando ALTER TABLE ... DROP PARTITION para remover rapidamente todas as linhas associadas a essa partição.
Limitações da exclusão leve
Exclusões leves com projeções
DELETE não funciona em tabelas com projeções. Isso ocorre porque linhas de uma projeção podem ser afetadas por uma operação DELETE. Porém, há uma configuração do MergeTree, lightweight_mutation_projection_mode, para alterar esse comportamento.
Considerações de desempenho ao usar exclusão leve
- Uma condição
WHEREcomplexa em uma consultaDELETE. - Se a fila de mutações estiver cheia de muitas outras mutações, isso pode levar a problemas de desempenho, já que todas as mutações em uma tabela são executadas sequencialmente.
- A tabela afetada tem um número muito grande de partes de dados.
- Ter muitos dados em partes compactas. Em uma parte compacta, todas as colunas são armazenadas em um único arquivo.
Permissões para exclusão
DELETE requer o privilégio ALTER DELETE. Para habilitar instruções DELETE em uma tabela específica para um determinado usuário, execute o comando a seguir:
Como as exclusões leves funcionam internamente no ClickHouse
-
Uma “máscara” é aplicada às linhas afetadas
Quando uma consulta
DELETE FROM table ...é executada, o ClickHouse salva uma máscara na qual cada linha é marcada como “existente” ou “excluída”. Essas linhas “excluídas” são omitidas das consultas subsequentes. No entanto, as linhas só são realmente removidas mais tarde, por mesclagens subsequentes. Gravar essa máscara é muito mais leve do que o que é feito por uma consultaALTER TABLE ... DELETE. A máscara é implementada como uma coluna de sistema oculta_row_existsque armazenaTruepara todas as linhas visíveis eFalsepara as excluídas. Essa coluna só está presente em uma parte se algumas linhas dessa parte tiverem sido excluídas. Essa coluna não existe quando uma parte tem todos os valores iguais aTrue. -
As consultas
SELECTsão transformadas para incluir a máscara Quando uma coluna mascarada é usada em uma consulta, a consultaSELECT ... FROM table WHERE conditioné internamente estendida com o predicado em_row_existse transformada em:No momento da execução, a coluna_row_existsé lida para determinar quais linhas não devem ser retornadas. Se houver muitas linhas excluídas, o ClickHouse pode determinar quais grânulos podem ser totalmente ignorados ao ler o restante das colunas. -
As consultas
DELETEsão transformadas em consultasALTER TABLE ... UPDATEODELETE FROM table WHERE conditioné traduzido em uma mutaçãoALTER TABLE table UPDATE _row_exists = 0 WHERE condition. Internamente, essa mutação é executada em duas etapas:-
Um comando
SELECT count() FROM table WHERE conditioné executado para cada parte individual para determinar se a parte foi afetada. -
Com base nos comandos acima, as partes afetadas são então modificadas, e links físicos são criados para as partes não afetadas. No caso de partes no formato wide, a coluna
_row_existsde cada linha é atualizada, e os arquivos de todas as outras colunas recebem links físicos. Para partes no formato compact, todas as colunas são regravadas porque ficam armazenadas juntas em um único arquivo.
ALTER TABLE ... DELETEtradicional porque não regrava os arquivos de todas as colunas das partes afetadas. -
Um comando