Как восстановить потерянный кластер

Рекомендации по восстановлению

Наличие регулярно создаваемых резервных копий может помочь оперативно восстановить работу Комплекса:

  • в случае потери кластера управления;
  • в случае потери клиентского кластера (все Control Plane-узлы ‒ NotReady);
  • в случае удаления клиентского кластера;
  • в случае потери критических данных клиентского кластера.

Рекомендуется настроить планировщик резервных копий как минимум для:

  • неймспейсов клиентских кластеров в кластере управления. Резервная копия должна включать все неймспейсные ресурсы неймспейсов клиентских кластеров (рисунок 37);

Рисунок 37 ‒ Неймспейсы клиентских кластеров в кластере управления

  • инфраструктурных провайдеров в кластере управления (рисунок 38);

Рисунок 38 ‒ Инфраструктурные провайдеры в кластере управления

  • ClusterRoles в кластере управления (рисунок 39);

Рисунок 39 ‒ ClusterRoles в кластере управления

  • клиентских кластеров с полным набором данных, необходимых для обеспечения жизнедеятельности развернутых приложений (рисунок 40).

Рисунок 40 ‒ Клиентские кластеры

Следует обратить внимание, что в настройках резервного копирования клиентских кластеров с полным набором данных требуется отключить использование резервной копии файловой системы тома пода для всех томов (defaultVolumesToFsBackup) (рисунок 41).

Рисунок 41 ‒ Настройка резервного копирования клиентских кластеров

Эти ресурсы могут быть полезны для восстановления контроля над клиентскими кластерами в случае отказа кластера управления, а также для восстановления клиентских кластеров.

Восстановление доступа к клиентским кластерам при потере кластера управления

В случае если все Control Plane-узлы кластера управления не отвечают и есть резервные копии неймспейсов клиентских кластеров в S3-хранилище, инфраструктурных провайдеров и ClusterRoles в кластере управления, необходимо:

  1. установить РОСА Кубис в соответствии с инструкцией по установке Руководства, где:
  • в качестве IP-адреса API-сервера должен быть использован IP-адрес не отвечающего кластера управления;
  • количество и характеристики узлов должны соответствовать параметрам не отвечающего кластера управления;
  • должен быть установлен модуль резервного копирования и восстановления;
  1. настроить доступ к S3-хранилищу с помощью интерфейса резервного копирования и восстановления в кластере управления(рисунки 42 и 43);

Рисунок 42 ‒ Страница "Хранилища"

Рисунок 43 ‒ Добавление хранилища

  1. восстановить резервную копию, содержащую данные неймспейсов клиентских кластеров, инфраструктурных провайдеров и ClusterRoles (рисунки 44‒45);

Рисунок 44 ‒ Восстановленные копии

Рисунок 45 ‒ Восстановление из резервной копии

Доступ к управлению клиентскими кластерами должен быть восстановлен

Восстановление при потере клиентского кластера

В случае если IP-адреса всех мастеров клиентского кластера недоступны, но сохранены данные конфигурации клиентского кластера в кластере управления и есть резервная копия клиентского кластера, рекомендуется:

  1. создать новый клиентский кластер с характеристиками неработоспособного кластера, теми же IP-адресами API-сервера и Ingress (рисунок 46);

Рисунок 46 ‒ Создание нового клиентского кластера

  1. установить модуль резервного копирования и восстановления (Velero) в режиме "Автоматический" (auto) (рисунок 47);

Рисунок 47 ‒ Настройка режима управления

  1. подключить S3-хранилище, в котором находится резервная копия сломанного кластера (рисунки 48, 49, 50);

Рисунок 48 ‒ Страница "Хранилища"

Рисунок 49 ‒ Добавление хранилища

Рисунок 50 ‒ Добавленное хранилище

  1. восстановить резервную копию клиентского кластера (рисунки 51, 52, 53).

Рисунок 51 ‒ Восстановление из резервной копии

Рисунок 52 ‒ Страница "Восстановленные копии"

Рисунок 53 ‒ Восстановленные копии

Восстановление при удалении клиентского кластера

В случае если IP-адреса всех мастеров клиентского кластера недоступны, данные конфигурации клиентского кластера утеряны, но есть резервная копия клиентского кластера, рекомендуется:

  1. поднять временный клиентский кластер (рисунок 54);

Рисунок 54 ‒ Клиентский кластер

  1. подключить S3-хранилище, в котором находится резервная копия неймспейсов клиентских кластеров, инфраструктурных провайдеров и ClusterRoles из кластера управления (рисунки 55, 56, 57);

Рисунок 55 ‒ Страница "Хранилища"

Рисунок 56 ‒ Добавление хранилища

Рисунок 57 ‒ Добавленное хранилище

  1. восстановить резервную копию клиентского кластера (рисунок 58, 59, 60);

Рисунок 58 ‒ Страница "Восстановленные копии"

Рисунок 59 ‒ Восстановление из резервной копии

Рисунок 60 ‒ Восстановленные копии

  1. записать конфигурацию клиентского кластера:
  • адрес API-сервера кластера и сведения о конфигурации безопасности доступны в Configmap kubeadm-config неймспейса kube-system (рисунок 61);

Рисунок 61 ‒ kubeadm-config

  • адрес Ingress доступен в SSC "Модуля управления внешними подключениями" (shturval-ingress-controller) (рисунок 62);

Рисунок 62 ‒ Модуль управления внешними подключениями

  1. после этого тестовый кластер можно удалить (рисунки 63‒64).

Рисунок 63 ‒ Удаление тестового кластера

Рисунок 64 ‒ Подтверждение удаления тестового кластера

  1. дальнейшие шаги соответствуют инструкции "Восстановление при потере клиентского кластера" (п. Восстановление при потере клиентского кластера).