| Entrada | Saída | Alias |
|---|---|---|
| ✔ | ✗ |
Descrição
Regex processa cada linha dos dados importados de acordo com a expressão regular fornecida.
Uso
A expressão regular da configuração format_regexp é aplicada a cada linha dos dados importados. O número de subpadrões na expressão regular deve ser igual ao número de colunas no conjunto de dados importado.
As linhas dos dados importados devem ser separadas pelo caractere de nova linha '\n' ou por uma nova linha no estilo DOS "\r\n".
O conteúdo de cada subpadrão correspondente é processado com o método do tipo de dado correspondente, de acordo com a configuração format_regexp_escaping_rule.
Se a expressão regular não corresponder à linha e format_regexp_skip_unmatched estiver definida como 1, a linha será ignorada silenciosamente. Caso contrário, uma exceção será lançada.
Exemplo de uso
data.tsv:
data.tsv
imp_regex_table:
Query
Query
SELECT dos dados da tabela para ver como o formato Regex interpretou os dados do arquivo:
Query
Response
Configurações de formato
Regexp, você pode usar as seguintes configurações:
-
format_regexp— String. Contém uma expressão regular no formato re2. -
format_regexp_escaping_rule— String. Há suporte para as seguintes regras de escape:- CSV (de forma semelhante a CSV
- JSON (de forma semelhante a JSONEachRow
- Escaped (de forma semelhante a TSV
- Quoted (de forma semelhante a Values
- Raw (extrai os subpadrões como um todo, sem regras de escape, de forma semelhante a TSVRaw
-
format_regexp_skip_unmatched— UInt8. Define se uma exceção deve ser lançada caso a expressãoformat_regexpnão corresponda aos dados importados. Pode ser definido como0ou1.