На этой странице приведены рекомендации по аварийному восстановлению для ClickHouse Cloud, а также инструкции для клиентов по восстановлению после сбоя.
ClickHouse Cloud в настоящее время не поддерживает автоматическое переключение или автоматическую синхронизацию между несколькими географическими регионами.
Клиентам следует периодически проводить тестовое восстановление из резервных копий, чтобы понимать фактическое значение RTO для сервиса с их размером и конфигурацией.
Сначала полезно разобрать несколько определений.
RPO (Recovery Point Objective): Максимально допустимая потеря данных, измеряемая во времени, после аварийного события. Пример: RPO в 30 минут означает, что в случае сбоя DB должна быть возможно восстановить до состояния, в котором данным не более 30 минут. Это, разумеется, зависит от того, как часто создаются резервные копии.
RTO (Recovery Time Objective): Максимально допустимое время простоя до возобновления нормальной работы после сбоя. Пример: RTO в 30 минут означает, что в случае сбоя команда сможет восстановить данные и приложения и возобновить нормальную работу в течение 30 минут.
Резервные копии базы данных и снимки: Резервные копии обеспечивают надежное долгосрочное хранение за счет создания отдельной копии данных. Снимки не создают дополнительную копию данных, обычно создаются быстрее и обеспечивают более низкие значения RPO.
Резервные копии базы данных
Резервная копия основного сервиса позволяет восстановиться в случае его недоступности.
ClickHouse Cloud поддерживает следующие возможности резервных копий.
- Резервные копии по умолчанию
По умолчанию ClickHouse Cloud создает резервную копию вашего сервиса каждые 24 часа.
Эти резервные копии хранятся в том же регионе, что и сервис, и создаются в бакете хранилища облачного провайдера ClickHouse (CSP).
Если данные в основном сервисе будут повреждены, резервную копию можно использовать для восстановления в новом сервисе.
- Внешние резервные копии (в собственном бакете хранилища клиента)
Вы можете экспортировать резервные копии в собственное объектное хранилище в своей учетной записи, в том же регионе или в другом регионе.
Поддержка экспорта резервных копий между разными облаками появится в ближайшее время.
Для межрегиональных и межоблачных резервных копий применяются соответствующие тарифы на передачу данных.
Эта возможность в настоящее время недоступна для сервисов PCI/HIPAA
- Настраиваемые резервные копии
Клиенты могут настроить резервные копии так, чтобы они создавались чаще, вплоть до одного раза каждые 6 часов, чтобы улучшить RPO.
Клиенты также могут настроить более длительный срок хранения.
Резервные копии, доступные в настоящий момент для сервиса, перечислены на странице «резервная копия» в консоли ClickHouse Cloud.
В этом разделе также отображается статус выполнения каждой резервной копии — успешно или ошибка.
Восстановление из резервной копии
- Резервные копии по умолчанию, хранящиеся в бакете ClickHouse Cloud, можно восстановить в новом сервисе в том же регионе.
- Внешние резервные копии (в объектном хранилище клиента) можно восстановить в новом сервисе в том же или другом регионе.
Рекомендации по времени резервного копирования и восстановления
Время резервного копирования и восстановления зависит от нескольких факторов, включая размер базы данных, ее схему и количество таблиц.
По результатам нашего тестирования, создание относительно небольших резервных копий размером около 1 ТБ может занимать 10–15 минут и более.
Резервное копирование данных объемом менее 20 ТБ обычно завершается в течение часа, а резервное копирование около 50 ТБ данных должно занимать 2–3 часа.
На больших объемах проявляется эффект масштаба, и мы наблюдали, что резервное копирование до 1 ПБ данных для некоторых внутренних сервисов завершалось менее чем за 10 часов.
Мы рекомендуем протестировать это на своей базе данных или на тестовых данных, чтобы получить более точные оценки, поскольку фактическое время зависит от нескольких факторов, перечисленных выше.
Время восстановления для данных сопоставимого объема примерно такое же, как и время резервного копирования.
Как уже упоминалось выше, мы рекомендуем протестировать это на своей базе данных, чтобы понимать, сколько времени займет восстановление из резервной копии.
В настоящее время НЕ поддерживается автоматическое переключение между двумя экземплярами ClickHouse Cloud, независимо от того, находятся ли они в одном регионе или в разных.
В настоящее время также НЕТ автоматической синхронизации данных между разными сервисами ClickHouse Cloud в одном или разных регионах, то есть репликации Active-Active.
В этом разделе рассматриваются различные варианты восстановления и порядок действий для каждого случая.
Повреждение данных основного сервиса
В этом случае данные можно восстановить из резервной копии в другом сервисе в том же регионе.
При использовании политики резервного копирования по умолчанию резервная копия может быть давностью до 24 часов, а при использовании настраиваемых резервных копий с интервалом 6 часов — до 6 часов.
Чтобы восстановить данные из существующей резервной копии
- Перейдите в раздел «Резервная копия» в консоли ClickHouse Cloud.
- Нажмите на три точки в разделе «Действия» у нужной резервной копии, из которой вы хотите восстановить данные.
- Укажите имя нового сервиса и восстановите данные из этой резервной копии
Недоступность основного региона
Вы можете экспортировать резервные копии в бакет у вашего облачного провайдера.
Если вас беспокоят отказы региона, мы рекомендуем экспортировать резервные копии в другой регион.
Имейте в виду, что при этом будет взиматься плата за межрегиональную передачу данных.
Если основной регион станет недоступен, резервную копию из другого региона можно восстановить в новом сервисе в другом регионе.
После восстановления резервной копии в другом сервисе вам нужно убедиться, что все настройки DNS, балансировщика нагрузки и строки подключения обновлены и указывают на новый сервис.
Это может включать:
- Обновление переменных среды или секретов
- Перезапуск сервисов приложения для установки новых подключений
Есть ещё несколько вариантов, которые стоит рассмотреть.
- Одновременная запись в отдельные кластеры
В этом варианте можно настроить 2 отдельных кластера в разных регионах и записывать данные в оба одновременно.
Этот вариант изначально связан с более высокими затратами, так как требует запуска нескольких сервисов, но обеспечивает более высокую доступность в случае недоступности одного из регионов.
- Использование репликации CSP
В этом варианте используется встроенная репликация Объектного хранилища облачного провайдера для копирования данных.
Например, при использовании BYOB можно экспортировать резервную копию в принадлежащий вам бакет в основном регионе, а затем реплицировать её в другой регион с помощью AWS cross region replication. Последнее изменение 10 июня 2026 г.