input_format_parquet_case_insensitive_column_matching | Игнорировать регистр при сопоставлении столбцов Parquet со столбцами ClickHouse. | 0 |
input_format_parquet_preserve_order | Не менять порядок строк при чтении файлов Parquet. Обычно это сильно замедляет работу. | 0 |
input_format_parquet_filter_push_down | При чтении файлов Parquet пропускать целые группы строк на основе выражений WHERE/PREWHERE и статистики min/max в метаданных Parquet. | 1 |
input_format_parquet_bloom_filter_push_down | При чтении файлов Parquet пропускать целые группы строк на основе выражений WHERE и bloom filter в метаданных Parquet. | 0 |
input_format_parquet_allow_missing_columns | Разрешить отсутствие столбцов при чтении входного формата Parquet | 1 |
input_format_parquet_local_file_min_bytes_for_seek | Минимальное количество байтов для локального чтения (из файла), при котором выполняется seek вместо чтения с пропуском во входном формате Parquet | 8192 |
input_format_parquet_enable_row_group_prefetch | Включить предварительную загрузку групп строк во время разбора Parquet. Сейчас предварительная загрузка поддерживается только при однопоточном разборе. | 1 |
input_format_parquet_skip_columns_with_unsupported_types_in_schema_inference | Пропускать столбцы с неподдерживаемыми типами при определении схемы для формата Parquet | 0 |
input_format_parquet_max_block_size | Максимальный размер блока для ридера Parquet. | 65409 |
input_format_parquet_prefer_block_bytes | Средний размер блока в байтах, выдаваемого ридером Parquet | 16744704 |
input_format_parquet_enable_json_parsing | При чтении файлов Parquet разбирать JSON-столбцы как JSON-столбцы ClickHouse. | 1 |
output_format_parquet_row_group_size | Целевой размер группы строк в строках. | 1000000 |
output_format_parquet_row_group_size_bytes | Целевой размер группы строк в байтах до сжатия. | 536870912 |
output_format_parquet_string_as_string | Использовать тип Parquet String вместо Binary для столбцов String. | 1 |
output_format_parquet_fixed_string_as_fixed_byte_array | Использовать тип Parquet FIXED_LEN_BYTE_ARRAY вместо Binary для столбцов FixedString. | 1 |
output_format_parquet_compression_method | Метод сжатия для выходного формата Parquet. Поддерживаемые кодеки: snappy, lz4, brotli, zstd, gzip, none (без сжатия) | zstd |
output_format_parquet_parallel_encoding | Выполнять кодирование Parquet в несколько потоков. | 1 |
output_format_parquet_data_page_size | Целевой размер страницы в байтах до сжатия. | 1048576 |
output_format_parquet_batch_size | Проверять размер страницы через каждые столько строк. Рассмотрите возможность уменьшить значение, если у вас есть столбцы со средним размером значений в несколько КБ и более. | 1024 |
output_format_parquet_write_page_index | Добавить возможность записывать индекс страниц в файлы Parquet. | 1 |
input_format_parquet_import_nested | Устаревшая настройка, ничего не делает. | 0 |
input_format_parquet_local_time_as_utc | true | Определяет тип данных, используемый при определении схемы для временных меток Parquet с isAdjustedToUTC=false. Если true: DateTime64(…, ‘UTC’), если false: DateTime64(…). Ни один из вариантов не является полностью корректным, так как в ClickHouse нет типа данных для локального wall-clock time. Как ни странно, вариант ‘true’, вероятно, менее некорректен, потому что форматирование временной метки ‘UTC’ как String даст корректное представление локального времени. |