Как восстановить потерянный кластер
Рекомендации по восстановлению
Наличие регулярно создаваемых резервных копий может помочь оперативно восстановить работу Комплекса:
- в случае потери кластера управления;
- в случае потери клиентского кластера (все Control Plane-узлы ‒ NotReady);
- в случае удаления клиентского кластера;
- в случае потери критических данных клиентского кластера.
Рекомендуется настроить планировщик резервных копий как минимум для:
- неймспейсов клиентских кластеров в кластере управления. Резервная копия должна включать все неймспейсные ресурсы неймспейсов клиентских кластеров (рисунок 37);

Рисунок 37 ‒ Неймспейсы клиентских кластеров в кластере управления
- инфраструктурных провайдеров в кластере управления (рисунок 38);

Рисунок 38 ‒ Инфраструктурные провайдеры в кластере управления
- ClusterRoles в кластере управления (рисунок 39);

Рисунок 39 ‒ ClusterRoles в кластере управления
- клиентских кластеров с полным набором данных, необходимых для обеспечения жизнедеятельности развернутых приложений (рисунок 40).

Рисунок 40 ‒ Клиентские кластеры
Следует обратить внимание, что в настройках резервного копирования клиентских кластеров с полным набором данных требуется отключить использование резервной копии файловой системы тома пода для всех томов (defaultVolumesToFsBackup) (рисунок 41).

Рисунок 41 ‒ Настройка резервного копирования клиентских кластеров
Эти ресурсы могут быть полезны для восстановления контроля над клиентскими кластерами в случае отказа кластера управления, а также для восстановления клиентских кластеров.
Восстановление доступа к клиентским кластерам при потере кластера управления
В случае если все Control Plane-узлы кластера управления не отвечают и есть резервные копии неймспейсов клиентских кластеров в S3-хранилище, инфраструктурных провайдеров и ClusterRoles в кластере управления, необходимо:
- установить РОСА Кубис в соответствии с инструкцией по установке Руководства, где:
- в качестве IP-адреса API-сервера должен быть использован IP-адрес не отвечающего кластера управления;
- количество и характеристики узлов должны соответствовать параметрам не отвечающего кластера управления;
- должен быть установлен модуль резервного копирования и восстановления;
- настроить доступ к S3-хранилищу с помощью интерфейса резервного копирования и восстановления в кластере управления(рисунки 42 и 43);

Рисунок 42 ‒ Страница "Хранилища"

Рисунок 43 ‒ Добавление хранилища
- восстановить резервную копию, содержащую данные неймспейсов клиентских кластеров, инфраструктурных провайдеров и ClusterRoles (рисунки 44‒45);

Рисунок 44 ‒ Восстановленные копии

Рисунок 45 ‒ Восстановление из резервной копии
Доступ к управлению клиентскими кластерами должен быть восстановлен
Восстановление при потере клиентского кластера
В случае если IP-адреса всех мастеров клиентского кластера недоступны, но сохранены данные конфигурации клиентского кластера в кластере управления и есть резервная копия клиентского кластера, рекомендуется:
- создать новый клиентский кластер с характеристиками неработоспособного кластера, теми же IP-адресами API-сервера и Ingress (рисунок 46);

Рисунок 46 ‒ Создание нового клиентского кластера
- установить модуль резервного копирования и восстановления (Velero) в режиме "Автоматический" (auto) (рисунок 47);

Рисунок 47 ‒ Настройка режима управления
- подключить S3-хранилище, в котором находится резервная копия сломанного кластера (рисунки 48, 49, 50);

Рисунок 48 ‒ Страница "Хранилища"

Рисунок 49 ‒ Добавление хранилища

Рисунок 50 ‒ Добавленное хранилище
- восстановить резервную копию клиентского кластера (рисунки 51, 52, 53).

Рисунок 51 ‒ Восстановление из резервной копии

Рисунок 52 ‒ Страница "Восстановленные копии"

Рисунок 53 ‒ Восстановленные копии
Восстановление при удалении клиентского кластера
В случае если IP-адреса всех мастеров клиентского кластера недоступны, данные конфигурации клиентского кластера утеряны, но есть резервная копия клиентского кластера, рекомендуется:
- поднять временный клиентский кластер (рисунок 54);

Рисунок 54 ‒ Клиентский кластер
- подключить S3-хранилище, в котором находится резервная копия неймспейсов клиентских кластеров, инфраструктурных провайдеров и ClusterRoles из кластера управления (рисунки 55, 56, 57);

Рисунок 55 ‒ Страница "Хранилища"

Рисунок 56 ‒ Добавление хранилища

Рисунок 57 ‒ Добавленное хранилище
- восстановить резервную копию клиентского кластера (рисунок 58, 59, 60);

Рисунок 58 ‒ Страница "Восстановленные копии"

Рисунок 59 ‒ Восстановление из резервной копии

Рисунок 60 ‒ Восстановленные копии
- записать конфигурацию клиентского кластера:
- адрес API-сервера кластера и сведения о конфигурации безопасности доступны в Configmap kubeadm-config неймспейса kube-system (рисунок 61);

Рисунок 61 ‒ kubeadm-config
- адрес Ingress доступен в SSC "Модуля управления внешними подключениями" (shturval-ingress-controller) (рисунок 62);

Рисунок 62 ‒ Модуль управления внешними подключениями
- после этого тестовый кластер можно удалить (рисунки 63‒64).

Рисунок 63 ‒ Удаление тестового кластера

Рисунок 64 ‒ Подтверждение удаления тестового кластера
- дальнейшие шаги соответствуют инструкции "Восстановление при потере клиентского кластера" (п. Восстановление при потере клиентского кластера).