Стратегия сжатия: LZ4 или ZSTD в продакшене
- Экономия 50% места на крупных таблицах за счёт сжатия ZSTD
- Возможность обрабатывать 2 PB данных в месяц
- Приемлемое влияние на производительность ингестии и запросов
- Существенное снижение затрат при масштабе в сотни ТБ
Стратегия хранения на уровне столбцов
- Анализируйте шаблоны использования столбцов с помощью телеметрии ClickHouse
- Выявляйте столбцы с высоким потреблением хранилища и низкой частотой запросов
- Применяйте выборочные политики хранения
- Отслеживайте шаблоны запросов для принятия решений на основе данных
Управление данными на основе партиций
- Простая очистка данных (удаление партиции вместо построчного удаления)
- Упрощение расчетов биллинга
- Более высокая производительность запросов за счет исключения партиций
- Более простое операционное управление
Стратегия преобразования строк в целые числа
weather_answer, оптимизатор запросов сначала обращается к таблице сопоставления в MySQL, чтобы получить соответствующий целочисленный ID, а затем преобразует запрос так, чтобы использовать это число перед отправкой в ClickHouse.
Такая архитектура сохраняет удобство для пользователей: на панелях мониторинга они по-прежнему видят понятные метки вроде weather_answer, а в хранилище и запросах используются гораздо более эффективные целые числа. Система сопоставления выполняет всё преобразование прозрачно, не требуя никаких изменений в пользовательском интерфейсе или пользовательских сценариях работы.
Основные преимущества:
- Сокращение объёма хранилища затронутых датасетов на 60%
- Более высокая производительность запросов за счёт сравнения целых чисел
- Снижение использования памяти для JOIN и агрегаций
- Снижение затрат на передачу данных по сети для больших результирующих наборов
Это пример, специально используемый для сценария данных Microsoft Clarity. Если все ваши данные находятся в ClickHouse или у вас нет ограничений на перенос данных в ClickHouse, попробуйте использовать словари.
Видео по теме
- Microsoft Clarity и ClickHouse — команда Microsoft Clarity
- Опыт использования ClickHouse в Contentsquare — Doron Hoffman & Guram Sigua (ContentSquare)