Pular para o conteúdo principal
Os serviços do ClickHouse Cloud contam com componentes de monitoramento prontos para uso que oferecem aos usuários dashboards e notificações. Por padrão, todos os usuários no Console do ClickHouse Cloud podem acessar esses dashboards.

Dashboards

Saúde do serviço

O dashboard Saúde do serviço pode ser usado para monitorar a saúde geral de um serviço. O ClickHouse Cloud coleta e armazena as métricas exibidas nesse dashboard a partir de tabelas de sistema, para que possam ser visualizadas mesmo quando um serviço estiver ocioso.

Utilização de recursos

O dashboard Infrastructure fornece uma visão detalhada dos recursos usados pelo processo do ClickHouse. O ClickHouse Cloud coleta e armazena as métricas exibidas nesse dashboard a partir de tabelas de sistema, para que possam ser visualizadas quando um serviço estiver inativo.

Memória e CPU

Os gráficos de CPU alocada e Memória alocada exibem o total de capacidade computacional disponível para cada réplica no seu serviço. Essas alocações podem ser alteradas usando os recursos de escalonamento do ClickHouse Cloud. Os gráficos de Uso de memória e Uso de CPU estimam quanto de CPU e memória está sendo efetivamente utilizado pelos processos do ClickHouse em cada réplica, incluindo consultas e também processos em segundo plano, como merges.
Degradação de desempenhoSe a utilização de memória ou CPU estiver se aproximando da memória ou CPU alocada, você poderá começar a perceber degradação no desempenho. Para resolver, recomendamos:
  • Otimizar suas consultas
  • Alterar o particionamento dos seus motores de tabela
  • Adicionar mais capacidade computacional ao seu serviço usando escalonamento
Estas são as métricas correspondentes da tabela de sistema exibidas nesses gráficos:
GráficoNome da métrica correspondenteAgregaçãoObservações
Memória alocadaCGroupMemoryTotalMáx
CPU alocadaCGroupMaxCPUMáx
Memória usadaMemoryResidentMáx
CPU usadaMétrica de CPU do sistemaMáxClickHouseServer_UsageCores via endpoint do Prometheus

Transferência de dados

Os gráficos exibem o tráfego de entrada e saída de dados do ClickHouse Cloud. Saiba mais sobre a transferência de dados pela rede.

Dashboard avançado

Este dashboard é uma versão modificada do dashboard avançado de observabilidade nativo, em que cada série representa métricas por réplica. Ele pode ser útil para monitorar e solucionar problemas específicos do ClickHouse.
O ClickHouse Cloud coleta e armazena as métricas exibidas neste dashboard a partir de tabelas do sistema, para que elas possam ser visualizadas mesmo quando um serviço estiver inativo. O acesso a essas métricas não emite uma consulta para o serviço subjacente e não reativará serviços inativos.
A tabela abaixo mapeia cada gráfico do Dashboard avançado para a métrica correspondente do ClickHouse, a tabela do sistema de origem e o tipo de agregação:
GráficoNome da métrica correspondente no ClickHouseTabela do sistemaTipo de agregação
Consultas/sProfileEvent_Querymetric_logSum / bucketSizeSeconds
Consultas em execuçãoCurrentMetric_Querymetric_logAvg
Merges em execuçãoCurrentMetric_Mergemetric_logAvg
Bytes selecionados/sProfileEvent_SelectedBytesmetric_logSum / bucketSizeSeconds
Espera de E/SProfileEvent_OSIOWaitMicrosecondsmetric_logSum / bucketSizeSeconds
Espera na leitura do S3ProfileEvent_ReadBufferFromS3Microsecondsmetric_logSum / bucketSizeSeconds
Erros de leitura do S3/sProfileEvent_ReadBufferFromS3RequestsErrorsmetric_logSum / bucketSizeSeconds
Espera de CPUProfileEvent_OSCPUWaitMicrosecondsmetric_logSum / bucketSizeSeconds
Uso de CPU do SO (userspace, normalizado)OSUserTimeNormalizedasynchronous_metric_log
Uso de CPU do SO (kernel, normalizado)OSSystemTimeNormalizedasynchronous_metric_log
Leitura do discoProfileEvent_OSReadBytesmetric_logSum / bucketSizeSeconds
Leitura do filesystemProfileEvent_OSReadCharsmetric_logSum / bucketSizeSeconds
Memória (rastreada, bytes)CurrentMetric_MemoryTrackingmetric_log
Total de partes do MergeTreeTotalPartsOfMergeTreeTablesasynchronous_metric_log
Máx. de partes por partiçãoMaxPartCountForPartitionasynchronous_metric_log
Leitura do S3ProfileEvent_ReadBufferFromS3Bytesmetric_logSum / bucketSizeSeconds
Tamanho do cache do filesystemCurrentMetric_FilesystemCacheSizemetric_log
Requisições de gravação no Disk S3/sProfileEvent_DiskS3PutObject + ProfileEvent_DiskS3UploadPart + ProfileEvent_DiskS3CreateMultipartUpload + ProfileEvent_DiskS3CompleteMultipartUploadmetric_logSum / bucketSizeSeconds
Requisições de leitura no Disk S3/sProfileEvent_DiskS3GetObject + ProfileEvent_DiskS3HeadObject + ProfileEvent_DiskS3ListObjectsmetric_logSum / bucketSizeSeconds
Taxa de acerto do cache do filesystemsum(ProfileEvent_CachedReadBufferReadFromCacheBytes) / (sum(ProfileEvent_CachedReadBufferReadFromCacheBytes) + sum(ProfileEvent_CachedReadBufferReadFromSourceBytes))metric_log
Taxa de acerto do cache de páginasgreatest(0, (sum(ProfileEvent_OSReadChars) - sum(ProfileEvent_OSReadBytes)) / (sum(ProfileEvent_OSReadChars) + sum(ProfileEvent_ReadBufferFromS3Bytes)))metric_log
Bytes recebidos pela rede/sNetworkReceiveBytesasynchronous_metric_logSum / bucketSizeSeconds
Bytes enviados pela rede/sNetworkSendBytesasynchronous_metric_logSum / bucketSizeSeconds
Conexões TCP simultâneasCurrentMetric_TCPConnectionmetric_log
Conexões MySQL simultâneasCurrentMetric_MySQLConnectionmetric_log
Conexões HTTP simultâneasCurrentMetric_HTTPConnectionmetric_log
Para informações detalhadas sobre cada visualização e como usá-las na solução de problemas, consulte a documentação do dashboard avançado.

Query insights

O recurso Query Insights facilita o uso do log de consultas integrado do ClickHouse por meio de várias visualizações e tabelas. A tabela system.query_log do ClickHouse é uma fonte essencial de informações para otimização de consultas, depuração e monitoramento da integridade e do desempenho gerais do cluster. Após selecionar um serviço, o item de navegação Monitoring na barra lateral esquerda se expande e revela o subitem Query insights:

Métricas principais

As caixas de estatísticas na parte superior representam métricas básicas de consulta no período selecionado. Abaixo delas, gráficos de séries temporais mostram o volume de consultas, a latência e a taxa de erro, divididos por tipo de consulta (select, insert, other). O gráfico de latência pode ser ajustado para exibir as latências p50, p90 e p99:

Recent queries

Uma tabela exibe registros do log de consultas agrupados por hash de consulta normalizada e usuário na janela de tempo selecionada. Recent queries podem ser filtradas e ordenadas por qualquer campo disponível, e a tabela pode ser configurada para exibir ou ocultar campos adicionais, como tabelas e latências p90 e p99:

Detalhamento da consulta

Selecionar uma consulta na tabela Recent queries abrirá um painel lateral com métricas e informações específicas da consulta selecionada: Todas as métricas na aba Query info são métricas agregadas, mas também podemos ver métricas de execuções individuais selecionando a aba Query history: Nesse painel, os itens Settings e Profile Events de cada execução da consulta podem ser expandidos para mostrar informações adicionais.
  • Notificações — Configure alertas para eventos de escalonamento, erros e faturamento
  • Dashboard avançado — Referência detalhada de cada visualização do dashboard
  • Consultando tabelas do sistema — Execute consultas SQL personalizadas em tabelas do sistema para uma introspecção mais aprofundada
  • Endpoint do Prometheus — Exporte métricas para o Grafana, o Datadog ou outras ferramentas compatíveis com Prometheus
Última modificação em 10 de junho de 2026