Escalonamento de cargas de trabalho - ClickHouse Documentation

Quando o ClickHouse executa várias queries simultaneamente, elas podem usar recursos compartilhados (por exemplo, discos e núcleos de CPU). Restrições e políticas de escalonamento podem ser aplicadas para regular como os recursos são utilizados e compartilhados entre diferentes cargas de trabalho. É possível configurar uma hierarquia de escalonamento comum para todos os recursos. A raiz da hierarquia representa os recursos compartilhados, enquanto as folhas correspondem a cargas de trabalho específicas, contendo solicitações que excedem a capacidade do recurso.

Atualmente, E/S de disco remoto e CPU podem ser escalonados usando o método descrito. Para limites flexíveis de memória, consulte memory overcommit

Configuração de disco

Para habilitar o agendamento de carga de trabalho de E/S em um disco específico, você precisa criar recursos de leitura e gravação para os acessos WRITE e READ:

CREATE RESOURCE resource_name (WRITE DISK disk_name, READ DISK disk_name)
-- ou
CREATE RESOURCE read_resource_name (WRITE DISK write_disk_name)
CREATE RESOURCE write_resource_name (READ DISK read_disk_name)

O recurso pode ser usado com qualquer número de discos para READ, WRITE ou ambos. Há uma sintaxe que permite usar um recurso para todos os discos:

CREATE RESOURCE all_io (READ ANY DISK, WRITE ANY DISK);

Uma forma alternativa de indicar quais discos são usados por um recurso é o storage_configuration do servidor:

O agendamento de carga de trabalho usando a configuração do ClickHouse está obsoleto. Em vez disso, deve ser usada a sintaxe SQL.

Para habilitar o agendamento de E/S para um disco específico, você precisa especificar read_resource e/ou write_resource na configuração de armazenamento. Isso informa ao ClickHouse qual recurso deve ser usado para cada solicitação de leitura e gravação do disco especificado. Os recursos de leitura e gravação podem se referir ao mesmo nome de recurso, o que é útil para Local SSDs ou HDDs. Vários discos diferentes também podem se referir ao mesmo recurso, o que é útil para discos remotos, caso você queira permitir uma divisão justa da largura de banda da rede entre cargas de trabalho como, por exemplo, “produção” e “desenvolvimento”. Exemplo:

<clickhouse>
    <storage_configuration>
        ...
        <disks>
            <s3>
                <type>s3</type>
                <endpoint>https://clickhouse-public-datasets.s3.amazonaws.com/my-bucket/root-path/</endpoint>
                <access_key_id>your_access_key_id</access_key_id>
                <secret_access_key>your_secret_access_key</secret_access_key>
                <read_resource>network_read</read_resource>
                <write_resource>network_write</write_resource>
            </s3>
        </disks>
        <policies>
            <s3_main>
                <volumes>
                    <main>
                        <disk>s3</disk>
                    </main>
                </volumes>
            </s3_main>
        </policies>
    </storage_configuration>
</clickhouse>

Observe que as opções de configuração do servidor têm prioridade sobre a forma de definir recursos via SQL.

Marcação de carga de trabalho

As consultas podem ser marcadas com a configuração workload para distinguir diferentes cargas de trabalho. Se workload não estiver definida, o valor “default” será usado. Observe que também é possível especificar outro valor usando perfis de configurações. Restrições de configuração podem ser usadas para tornar workload constante, caso você queira que todas as consultas do usuário sejam marcadas com um valor fixo da configuração workload. É possível atribuir uma configuração workload a atividades em segundo plano. Merges e mutações usam as configurações do servidor merge_workload e mutation_workload, respectivamente. Esses valores também podem ser substituídos para tabelas específicas usando as configurações do MergeTree merge_workload e mutation_workload Vamos considerar um exemplo de um sistema com duas cargas de trabalho diferentes: “production” e “development”.

SELECT count() FROM my_table WHERE value = 42 SETTINGS workload = 'production'
SELECT count() FROM my_table WHERE value = 13 SETTINGS workload = 'development'

Hierarquia de agendamento de recursos

Do ponto de vista do subsistema de agendamento, um recurso representa uma hierarquia de nós de agendamento.

O agendamento de carga de trabalho usando a configuração do ClickHouse está obsoleto. Em vez disso, deve-se usar a sintaxe SQL. A sintaxe SQL cria automaticamente todos os nós de agendamento necessários, e a descrição de nós de agendamento a seguir deve ser considerada como detalhes de implementação de nível inferior, acessíveis por meio da tabela system.scheduler.

Possíveis tipos de nó:

inflight_limit (restrição) - bloqueia se o número de solicitações simultâneas em andamento exceder max_requests ou se o custo total delas exceder max_cost; deve ter um único filho.
bandwidth_limit (restrição) - bloqueia se a largura de banda atual exceder max_speed (0 significa ilimitada) ou se a rajada exceder max_burst (por padrão, é igual a max_speed); deve ter um único filho.
fair (política) - seleciona a próxima solicitação a ser atendida de um de seus nós filhos de acordo com o critério de justiça max-min; os nós filhos podem especificar weight (o padrão é 1).
priority (política) - seleciona a próxima solicitação a ser atendida de um de seus nós filhos de acordo com prioridades estáticas (um valor menor significa prioridade mais alta); os nós filhos podem especificar priority (o padrão é 0).
fifo (fila) - folha da hierarquia capaz de armazenar solicitações que excedem a capacidade do recurso.

Para conseguir usar toda a capacidade do recurso subjacente, você deve usar inflight_limit. Observe que um valor baixo de max_requests ou max_cost pode levar ao uso incompleto do recurso, enquanto valores altos demais podem levar a filas vazias dentro do agendador, o que, por sua vez, fará com que as políticas sejam ignoradas (falta de equidade ou desconsideração de prioridades) na subárvore. Por outro lado, se você quiser proteger os recursos contra uso excessivo, deve usar bandwidth_limit. Ele aplica limitação quando a quantidade de recurso consumida em duration segundos excede max_burst + max_speed * duration bytes. Dois nós bandwidth_limit no mesmo recurso podem ser usados para limitar a largura de banda de pico durante intervalos curtos e a largura de banda média durante intervalos mais longos. O exemplo a seguir mostra como definir as hierarquias de agendamento de E/S mostradas na imagem:

<clickhouse>
    <resources>
        <network_read>
            <node path="/">
                <type>inflight_limit</type>
                <max_requests>100</max_requests>
            </node>
            <node path="/fair">
                <type>fair</type>
            </node>
            <node path="/fair/prod">
                <type>fifo</type>
                <weight>3</weight>
            </node>
            <node path="/fair/dev">
                <type>fifo</type>
            </node>
        </network_read>
        <network_write>
            <node path="/">
                <type>inflight_limit</type>
                <max_requests>100</max_requests>
            </node>
            <node path="/fair">
                <type>fair</type>
            </node>
            <node path="/fair/prod">
                <type>fifo</type>
                <weight>3</weight>
            </node>
            <node path="/fair/dev">
                <type>fifo</type>
            </node>
        </network_write>
    </resources>
</clickhouse>

Classificadores de carga de trabalho

O agendamento de carga de trabalho usando a configuração do ClickHouse está obsoleto. Em vez disso, deve-se usar a sintaxe SQL. Os classificadores são criados automaticamente ao usar a sintaxe SQL.

Os classificadores de carga de trabalho são usados para definir o mapeamento do workload especificado por uma consulta para as filas folha que devem ser usadas para recursos específicos. No momento, a classificação de carga de trabalho é simples: apenas o mapeamento estático está disponível. Exemplo:

<clickhouse>
    <workload_classifiers>
        <production>
            <network_read>/fair/prod</network_read>
            <network_write>/fair/prod</network_write>
        </production>
        <development>
            <network_read>/fair/dev</network_read>
            <network_write>/fair/dev</network_write>
        </development>
        <default>
            <network_read>/fair/dev</network_read>
            <network_write>/fair/dev</network_write>
        </default>
    </workload_classifiers>
</clickhouse>

Hierarquia de cargas de trabalho

O ClickHouse fornece uma sintaxe SQL conveniente para definir a hierarquia de escalonamento. Todos os recursos criados com CREATE RESOURCE compartilham a mesma estrutura hierárquica, mas podem diferir em alguns aspectos. Cada carga de trabalho criada com CREATE WORKLOAD mantém alguns nós de escalonamento criados automaticamente para cada recurso. Uma carga de trabalho filha pode ser criada dentro de outra carga de trabalho pai. Veja abaixo o exemplo que define exatamente a mesma hierarquia da configuração XML acima:

CREATE RESOURCE network_write (WRITE DISK s3)
CREATE RESOURCE network_read (READ DISK s3)
CREATE WORKLOAD all SETTINGS max_io_requests = 100
CREATE WORKLOAD development IN all
CREATE WORKLOAD production IN all SETTINGS weight = 3

O nome de uma carga de trabalho folha, sem filhos, pode ser usado nas configurações de consulta SETTINGS workload = 'name'. Para personalizar a carga de trabalho, as seguintes configurações podem ser usadas:

priority - cargas de trabalho irmãs são atendidas de acordo com valores de prioridade estáticos (um valor menor significa prioridade mais alta).
weight - cargas de trabalho irmãs com a mesma prioridade estática compartilham recursos de acordo com os pesos.
max_io_requests - o limite para o número de solicitações de E/S concurrentes nesta carga de trabalho.
max_bytes_inflight - o limite para o total de bytes em trânsito de solicitações concurrentes nesta carga de trabalho.
max_bytes_per_second - o limite da taxa de leitura ou gravação de bytes desta carga de trabalho.
max_burst_bytes - o número máximo de bytes que pode ser processado pela carga de trabalho sem sofrer limitação de taxa (para cada recurso de forma independente).
max_concurrent_threads - o limite para o número de threads de consultas nesta carga de trabalho.
max_concurrent_threads_ratio_to_cores - o mesmo que max_concurrent_threads, mas normalized em relação ao número de CPU cores disponíveis.
max_cpus - o limite para o número de CPU cores para atender consultas nesta carga de trabalho.
max_cpu_share - o mesmo que max_cpus, mas normalized em relação ao número de CPU cores disponíveis.
max_burst_cpu_seconds - o número máximo de segundos de CPU que pode ser consumido pela carga de trabalho sem sofrer limitação devido a max_cpus.

Todos os limites especificados por meio das configurações da carga de trabalho são independentes para cada recurso. Por exemplo, uma carga de trabalho com max_bytes_per_second = 10485760 terá um limite de largura de banda de 10 MB/s para cada recurso de leitura e gravação, de forma independente. Se for necessário um limite comum para leitura e gravação, considere usar o mesmo recurso para acesso READ e WRITE. Não há como especificar hierarquias diferentes de cargas de trabalho para recursos diferentes. Mas há uma forma de especificar um valor de configuração de carga de trabalho diferente para um recurso específico:

CREATE OR REPLACE WORKLOAD all SETTINGS max_io_requests = 100, max_bytes_per_second = 1000000 FOR network_read, max_bytes_per_second = 2000000 FOR network_write

Observe também que uma carga de trabalho ou recurso não pode ser excluído se estiver referenciado por outra carga de trabalho. Para atualizar a definição de uma carga de trabalho, use a consulta CREATE OR REPLACE WORKLOAD.

As configurações de carga de trabalho são convertidas em um conjunto apropriado de nós de escalonamento. Para detalhes mais específicos, consulte a descrição dos tipos e opções de nós de escalonamento.

Escalonamento de CPU

Para habilitar o escalonamento de CPU para cargas de trabalho, crie um recurso de CPU e defina um limite para o número de threads concorrentes:

CREATE RESOURCE cpu (MASTER THREAD, WORKER THREAD)
CREATE WORKLOAD all SETTINGS max_concurrent_threads = 100

Quando o servidor ClickHouse executa muitas consultas simultâneas com múltiplas threads e todos os slots de CPU estão em uso, o estado de sobrecarga é atingido. Nesse estado, cada slot de CPU liberado é reatribuído à workload apropriada de acordo com as políticas de agendamento. Para consultas que compartilham a mesma workload, os slots são alocados usando round robin. Para consultas em workloads separadas, os slots são alocados de acordo com os pesos, prioridades e limites especificados para as workloads. O tempo de CPU é consumido pelas threads quando elas não estão bloqueadas e executam tarefas intensivas em CPU. Para fins de agendamento, distinguem-se dois tipos de threads:

Thread principal — a primeira thread que começa a trabalhar em uma consulta ou em uma atividade em segundo plano, como um merge ou uma mutation.
Thread de trabalho — as threads adicionais que a thread principal pode gerar para executar tarefas intensivas em CPU.

Pode ser desejável usar recursos separados para threads principais e threads de trabalho para obter melhor capacidade de resposta. Um número elevado de threads de trabalho pode facilmente monopolizar os recursos de CPU quando são usados valores altos da configuração de consulta max_threads. Nesse caso, as consultas recebidas precisam ficar bloqueadas e aguardar um slot de CPU para que sua thread principal inicie a execução. Para evitar isso, a configuração a seguir pode ser usada:

CREATE RESOURCE worker_cpu (WORKER THREAD)
CREATE RESOURCE master_cpu (MASTER THREAD)
CREATE WORKLOAD all SETTINGS max_concurrent_threads = 100 FOR worker_cpu, max_concurrent_threads = 1000 FOR master_cpu

Isso criará limites separados para threads master e worker. Mesmo que todos os 100 slots de CPU de worker estejam ocupados, novas consultas não serão bloqueadas enquanto houver slots de CPU de master disponíveis. Elas iniciarão a execução com uma thread. Depois, se slots de CPU de worker ficarem disponíveis, essas consultas poderão escalar e criar suas threads de worker. Por outro lado, essa abordagem não relaciona o número total de slots ao número de processadores de CPU, e executar threads concorrentes em excesso afetará o desempenho. Limitar a concorrência das threads master não limitará o número de consultas concorrentes. Os slots de CPU podem ser liberados no meio da execução da consulta e readquiridos por outras threads. Por exemplo, 4 consultas concorrentes com limite de 2 threads master concorrentes podem ser executadas em paralelo. Nesse caso, cada consulta receberá 50% de um processador de CPU. Uma lógica separada deve ser usada para limitar o número de consultas concorrentes, e isso atualmente não é compatível com workloads. Limites separados de concorrência de threads podem ser usados para workloads:

CREATE RESOURCE cpu (MASTER THREAD, WORKER THREAD)
CREATE WORKLOAD all
CREATE WORKLOAD admin IN all SETTINGS max_concurrent_threads = 10
CREATE WORKLOAD production IN all SETTINGS max_concurrent_threads = 100
CREATE WORKLOAD analytics IN production SETTINGS max_concurrent_threads = 60, weight = 9
CREATE WORKLOAD ingestion IN production

Este exemplo de configuração fornece pools independentes de slots de CPU para admin e produção. O pool de produção é compartilhado entre analytics e ingestão. Além disso, se o pool de produção estiver sobrecarregado, 9 em cada 10 slots liberados serão reatribuídos a consultas analíticas, se necessário. As consultas de ingestão receberão apenas 1 em cada 10 slots durante períodos de sobrecarga. Isso pode melhorar a latência das consultas voltadas ao usuário. Analytics tem seu próprio limite de 60 threads concorrentes, sempre deixando pelo menos 40 threads para dar suporte à ingestão. Quando não há sobrecarga, a ingestão pode usar todas as 100 threads. Para excluir uma consulta do agendamento de CPU, defina a configuração de consulta use_concurrency_control como 0. O agendamento de CPU ainda não é compatível com merges e mutações. Para fornecer alocações justas para as cargas de trabalho, é necessário realizar preempção e redução de escala durante a execução da consulta. A preempção é habilitada com a configuração de servidor cpu_slot_preemption. Se ela estiver habilitada, cada thread renova periodicamente seu slot de CPU (de acordo com a configuração de servidor cpu_slot_quantum_ns). Essa renovação pode bloquear a execução se a CPU estiver sobrecarregada. Quando a execução fica bloqueada por muito tempo (consulte a configuração de servidor cpu_slot_preemption_timeout_ms), a consulta reduz o número de threads em execução, que diminui dinamicamente. Observe que a distribuição justa de tempo de CPU é garantida entre cargas de trabalho, mas, entre consultas dentro da mesma carga de trabalho, isso pode falhar em alguns casos extremos.

O agendamento de slots oferece uma forma de controlar a concorrência de consultas, mas não garante uma alocação justa do tempo de CPU, a menos que a configuração de servidor cpu_slot_preemption esteja definida como true; caso contrário, a justiça é fornecida com base no número de alocações de slots de CPU entre cargas de trabalho concorrentes. Isso não implica a mesma quantidade de segundos de CPU porque, sem preempção, um slot de CPU pode ser mantido indefinidamente. Uma thread adquire um slot no início e o libera quando o trabalho é concluído.

Definir um recurso de CPU desabilita o efeito das configurações concurrent_threads_soft_limit_num e concurrent_threads_soft_limit_ratio_to_cores. Em vez disso, a configuração de carga de trabalho max_concurrent_threads é usada para limitar o número de CPUs alocadas a uma carga de trabalho específica. Para obter o comportamento anterior, crie apenas o recurso WORKER THREAD, defina max_concurrent_threads para a carga de trabalho all com o mesmo valor de concurrent_threads_soft_limit_num e use a configuração de consulta workload = "all". Essa configuração corresponde à configuração concurrent_threads_scheduler definida com o valor “fair_round_robin”.

Threads vs. CPUs

Há duas maneiras de controlar o consumo de CPU de uma carga de trabalho:

Limite no número de threads: max_concurrent_threads e max_concurrent_threads_ratio_to_cores
Limitação de CPU: max_cpus, max_cpu_share e max_burst_cpu_seconds

A primeira permite controlar dinamicamente quantas threads são criadas para uma consulta, dependendo da carga atual do servidor. Na prática, ela reduz o que a configuração de consulta max_threads determina. A segunda limita o consumo de CPU da carga de trabalho usando o algoritmo token bucket. Ela não afeta diretamente o número de threads, mas limita o consumo total de CPU de todas as threads na carga de trabalho. A limitação por token bucket com max_cpus e max_burst_cpu_seconds significa o seguinte. Durante qualquer intervalo de delta segundos, o consumo total de CPU por todas as consultas na carga de trabalho não pode ser maior que max_cpus * delta + max_burst_cpu_seconds segundos de CPU. Isso limita o consumo médio a max_cpus no longo prazo, mas esse limite pode ser excedido no curto prazo. Por exemplo, com max_burst_cpu_seconds = 60 e max_cpus=0.001, é permitido executar 1 thread por 60 segundos, ou 2 threads por 30 segundos, ou 60 threads por 1 segundo sem limitação. O valor padrão de max_burst_cpu_seconds é 1 segundo. Valores menores podem levar à subutilização dos núcleos permitidos por max_cpus quando há muitas threads concorrentes.

As configurações de limitação de CPU ficam ativas somente se a configuração de servidor cpu_slot_preemption estiver habilitada; caso contrário, serão ignoradas.

Ao manter um slot de CPU, uma thread pode estar em um destes três estados principais:

Running: Consumindo efetivamente recursos de CPU. O tempo gasto nesse estado é contabilizado pela limitação de CPU.
Ready: Aguardando uma CPU ficar disponível. Não é contabilizado pela limitação de CPU.
Blocked: Executando operações de I/O ou outras syscalls bloqueantes (por exemplo, aguardando um mutex). Não é contabilizado pela limitação de CPU.

Vamos considerar um exemplo de configuração que combina limitação de CPU e limites no número de threads:

CREATE RESOURCE cpu (MASTER THREAD, WORKER THREAD)
CREATE WORKLOAD all SETTINGS max_concurrent_threads_ratio_to_cores = 2
CREATE WORKLOAD admin IN all SETTINGS max_concurrent_threads = 2, priority = -1
CREATE WORKLOAD production IN all SETTINGS weight = 4
CREATE WORKLOAD analytics IN production SETTINGS max_cpu_share = 0.7, weight = 3
CREATE WORKLOAD ingestion IN production
CREATE WORKLOAD development IN all SETTINGS max_cpu_share = 0.3

Aqui, limitamos o número total de threads de todas as queries a 2x o número de CPUs disponíveis. A carga de trabalho Admin fica limitada a no máximo duas threads, independentemente do número de CPUs disponíveis. Admin tem prioridade -1 (inferior ao padrão 0) e, se necessário, recebe primeiro qualquer slot de CPU. Quando o Admin não executa queries, os recursos de CPU são divididos entre as cargas de trabalho de produção e desenvolvimento. As cotas garantidas de tempo de CPU são baseadas nos pesos (4 para 1): pelo menos 80% vai para produção (se necessário), e pelo menos 20% vai para desenvolvimento (se necessário). Embora os pesos definam garantias, o throttling de CPU define limites: produção não tem limite e pode consumir 100%, enquanto desenvolvimento tem um limite de 30%, aplicado mesmo que não haja queries de outras cargas de trabalho. A carga de trabalho de produção não é uma folha, então seus recursos são divididos entre analytics e ingestão de acordo com os pesos (3 para 1). Isso significa que analytics tem uma garantia de pelo menos 0.8 * 0.75 = 60% e, com base em max_cpu_share, um limite de 70% dos recursos totais de CPU. Já a ingestão fica com uma garantia de pelo menos 0.8 * 0.25 = 20%, sem limite superior.

Se você quiser maximizar a utilização de CPU no seu servidor ClickHouse, evite usar max_cpus e max_cpu_share para a carga de trabalho raiz all. Em vez disso, defina um valor mais alto para max_concurrent_threads. Por exemplo, em um sistema com 8 CPUs, defina max_concurrent_threads = 16. Isso permite que 8 threads executem tarefas de CPU, enquanto outras 8 podem lidar com operações de I/O. Threads adicionais criarão pressão sobre a CPU, garantindo que as regras de agendamento sejam aplicadas. Em contraste, definir max_cpus = 8 nunca criará pressão sobre a CPU, porque o servidor não pode exceder as 8 CPUs disponíveis.

Agendamento de slots de consulta

Para habilitar o agendamento de slots de consulta para cargas de trabalho, crie o recurso QUERY e defina um limite para o número de consultas simultâneas ou de consultas por segundo:

CREATE RESOURCE query (QUERY)
CREATE WORKLOAD all SETTINGS max_concurrent_queries = 100, max_queries_per_second = 10, max_burst_queries = 20

A configuração de workload max_concurrent_queries limita o número de consultas concorrentes que podem ser executadas simultaneamente para uma determinada carga de trabalho. Ela é análoga à configuração de consulta max_concurrent_queries_for_all_users e à configuração do servidor max_concurrent_queries. Consultas de async insert e algumas consultas específicas, como KILL, não são contabilizadas nesse limite. As configurações de workload max_queries_per_second e max_burst_queries limitam o número de consultas da carga de trabalho usando um throttler de token bucket. Isso garante que, durante qualquer intervalo de tempo T, não mais que max_queries_per_second * T + max_burst_queries novas consultas iniciarão a execução. A configuração de workload max_waiting_queries limita o número de consultas em espera para a carga de trabalho. Quando o limite é atingido, o servidor retorna o erro SERVER_OVERLOADED.

As consultas bloqueadas ficarão em espera indefinidamente e não aparecerão em SHOW PROCESSLIST até que todas as restrições sejam atendidas.

Armazenamento de cargas de trabalho e recursos

As definições de todas as cargas de trabalho e de todos os recursos, na forma de instruções CREATE WORKLOAD e CREATE RESOURCE, são armazenadas de forma persistente em disco, em workload_path, ou no ZooKeeper, em workload_zookeeper_path. Recomenda-se usar o armazenamento no ZooKeeper para garantir consistência entre os nós. Como alternativa, a cláusula ON CLUSTER pode ser usada em conjunto com o armazenamento em disco.

Cargas de trabalho e recursos baseados em configuração

Além das definições baseadas em SQL, cargas de trabalho e recursos podem ser predefinidos no arquivo de configuração do servidor. Isso é útil em ambientes em nuvem, nos quais algumas limitações são ditadas pela infraestrutura, enquanto outros limites podem ser alterados pelos clientes. As entidades baseadas em configuração têm prioridade sobre as definidas por SQL e não podem ser modificadas nem excluídas com comandos SQL.

Formato de configuração

<clickhouse>
    <resources_and_workloads>
        CREATE RESOURCE s3disk_read (READ DISK s3);
        CREATE RESOURCE s3disk_write (WRITE DISK s3);
        CREATE WORKLOAD all SETTINGS max_io_requests = 500 FOR s3disk_read, max_io_requests = 1000 FOR s3disk_write, max_bytes_per_second = 1342177280 FOR s3disk_read, max_bytes_per_second = 3355443200 FOR s3disk_write;
        CREATE WORKLOAD production IN all SETTINGS weight = 3;
    </resources_and_workloads>
</clickhouse>

A configuração usa a mesma sintaxe SQL das instruções CREATE WORKLOAD e CREATE RESOURCE. Todas as consultas devem ser válidas.

Recomendações de uso

Para ambientes em nuvem, uma configuração típica pode incluir:

Definir a carga de trabalho raiz e os recursos de E/S de rede na configuração para estabelecer os limites da infraestrutura
Definir throw_on_unknown_workload para impor esses limites
Criar um CREATE WORKLOAD default IN all para aplicar automaticamente os limites a todas as consultas (já que o valor padrão da configuração de consulta workload é ‘default’)
Permitir que os usuários criem cargas de trabalho adicionais dentro da hierarquia configurada

Isso garante que todas as atividades em segundo plano e consultas respeitem as limitações da infraestrutura, ao mesmo tempo em que mantém a flexibilidade para políticas de agendamento específicas de cada usuário. Outro caso de uso é ter configurações diferentes para nós distintos em um cluster heterogêneo.

Acesso restrito a recursos

Para garantir que todas as consultas sigam as políticas de agendamento de recursos, há uma configuração do servidor chamada throw_on_unknown_workload. Se ela estiver definida como true, toda consulta deverá usar uma configuração de consulta workload válida; caso contrário, será gerada a exceção RESOURCE_ACCESS_DENIED. Se ela estiver definida como false, essa consulta não usará o agendador de recursos, ou seja, terá acesso ilimitado a qualquer RESOURCE. A configuração de consulta ‘use_concurrency_control = 0’ permite que a consulta contorne o agendador de CPU e tenha acesso ilimitado à CPU. Para impor o agendamento de CPU, crie uma restrição de configuração para manter ‘use_concurrency_control’ como um valor constante somente leitura.

Não defina throw_on_unknown_workload como true a menos que CREATE WORKLOAD default tenha sido executado. Isso pode causar problemas na inicialização do servidor se uma consulta sem a configuração explícita workload for executada durante a inicialização.

Veja também

system.scheduler
system.workloads
system.resources
merge_workload configuração do MergeTree
merge_workload configuração global do servidor
mutation_workload configuração do MergeTree
mutation_workload configuração global do servidor
workload_path configuração global do servidor
workload_zookeeper_path configuração global do servidor
cpu_slot_preemption configuração global do servidor
cpu_slot_quantum_ns configuração global do servidor
cpu_slot_preemption_timeout_ms configuração global do servidor

​Configuração de disco

​Marcação de carga de trabalho

​Hierarquia de agendamento de recursos

​Classificadores de carga de trabalho

​Hierarquia de cargas de trabalho

​Escalonamento de CPU

​Threads vs. CPUs

​Agendamento de slots de consulta

​Armazenamento de cargas de trabalho e recursos

​Cargas de trabalho e recursos baseados em configuração

​Formato de configuração

​Recomendações de uso

​Acesso restrito a recursos

​Veja também

Configuração de disco

Marcação de carga de trabalho

Hierarquia de agendamento de recursos

Classificadores de carga de trabalho

Hierarquia de cargas de trabalho

Escalonamento de CPU

Threads vs. CPUs

Agendamento de slots de consulta

Armazenamento de cargas de trabalho e recursos

Cargas de trabalho e recursos baseados em configuração

Formato de configuração

Recomendações de uso

Acesso restrito a recursos

Veja também