Sintaxe
Argumentos
| Argumento | Descrição |
|---|---|
URI | A URI relativa para o arquivo no HDFS. O caminho para o arquivo oferece suporte aos seguintes globs no modo somente leitura: *, ?, {abc,def} e {N..M}, em que N, M — números, 'abc', 'def' — strings. |
format | O formato do arquivo. |
structure | Estrutura da tabela. Formato: 'column1_name column1_type, column2_name column2_type, ...'. |
Valor retornado
hdfs://hdfs1:9000/test e seleção das duas primeiras linhas:
Globs no caminho
*— Representa uma quantidade arbitrária de caracteres, exceto/, incluindo a string vazia.**— Representa todos os arquivos dentro de uma pasta, recursivamente.?— Representa um único caractere arbitrário.{some_string,another_string,yet_another_one}— Substitui qualquer uma das strings'some_string', 'another_string', 'yet_another_one'. As strings podem conter o símbolo/.{N..M}— Representa qualquer número>= Ne<= M.
{} são semelhantes às funções de tabela remote e file.
Exemplo
- Suponha que haja vários arquivos com os seguintes URIs no HDFS:
- ‘hdfs://hdfs1:9000/some_dir/some_file_1’
- ‘hdfs://hdfs1:9000/some_dir/some_file_2’
- ‘hdfs://hdfs1:9000/some_dir/some_file_3’
- ‘hdfs://hdfs1:9000/another_dir/some_file_1’
- ‘hdfs://hdfs1:9000/another_dir/some_file_2’
- ‘hdfs://hdfs1:9000/another_dir/some_file_3’
- Consulte a quantidade de linhas nesses arquivos:
- Consulte a quantidade de linhas de todos os arquivos nesses dois diretórios:
Se a sua lista de arquivos contiver intervalos numéricos com zeros à esquerda, use a construção com chaves para cada dígito separadamente ou use
?.file000, file001, … , file999:
Colunas virtuais
_path— Caminho do arquivo. Tipo:LowCardinality(String)._file— Nome do arquivo. Tipo:LowCardinality(String)._size— Tamanho do arquivo em bytes. Tipo:Nullable(UInt64). Se o tamanho for desconhecido, o valor seráNULL._time— Hora da última modificação do arquivo. Tipo:Nullable(DateTime). Se a hora for desconhecida, o valor seráNULL.
configuração use_hive_partitioning
use_hive_partitioning é definida como 1, o ClickHouse detecta o particionamento no estilo Hive no caminho (/name=value/) e permite usar colunas de partição como colunas virtuais na consulta. Essas colunas virtuais terão os mesmos nomes do caminho particionado.
Exemplo
Usar a coluna virtual criada com o particionamento no estilo Hive
Configurações de armazenamento
- hdfs_truncate_on_insert - permite truncar o arquivo antes de inserir dados nele. Desativado por padrão.
- hdfs_create_new_file_on_insert - permite criar um novo arquivo a cada inserção se o formato tiver sufixo. Desativado por padrão.
- hdfs_skip_empty_files - permite ignorar arquivos vazios durante a leitura. Desativado por padrão.