Как восстановить потерянный кластер

Наличие регулярно создаваемых резервных копий может помочь оперативно восстановить работу Комплекса:

  • в случае потери кластера управления;
  • в случае потери клиентского кластера (все Master-узлы ‒ "NotReady");
  • в случае удаления клиентского кластера;
  • в случае потери критических данных клиентского кластера.

Рекомендуется настроить планировщик резервных копий как минимум для:

  • неймспейсов клиентских кластеров в кластере управления. Резервная копия должна включать все неймспейсные ресурсы неймспейсов клиентских кластеров (рисунок 43);

Рисунок 43 ‒ Неймспейсы клиентских кластеров в кластере управления

  • инфраструктурных провайдеров в кластере управления (рисунок 44);

Рисунок 44 ‒ Инфраструктурные провайдеры в кластере управления

  • ClusterRoles в кластере управления (рисунок 45);

Рисунок 45 ‒ ClusterRoles в кластере управления

  • клиентских кластеров с полным набором данных, необходимых для обеспечения жизнедеятельности развернутых приложений (рисунок 46).

Рисунок 46 ‒ Клиентские кластеры

Следует обратить внимание, что в настройках резервного копирования клиентских кластеров с полным набором данных требуется отключить использование резервной копии файловой системы тома пода для всех томов ("defaultVolumesToFsBackup") (рисунок 47).

Рисунок 47 ‒ Настройка резервного копирования клиентских кластеров

Эти ресурсы могут быть полезны для восстановления контроля над клиентскими кластерами в случае отказа кластера управления, а также для восстановления клиентских кластеров.

Восстановление доступа к клиентским кластерам при потере кластера управления

В случае если все Master-узлы кластера управления не отвечают и есть резервные копии неймспейсов клиентских кластеров в S3-хранилище, инфраструктурных провайдеров и ClusterRoles в кластере управления, необходимо:

  1. установить РОСА Кубис в соответствии с инструкцией по установке Руководства, где:
  • в качестве IP-адреса API-сервера должен быть использован IP-адрес не отвечающего кластера управления;
  • количество и характеристики узлов должны соответствовать параметрам не отвечающего кластера управления;
  • должен быть установлен модуль резервного копирования и восстановления;
  1. настроить доступ к S3-хранилищу с помощью интерфейса резервного копирования и восстановления в кластере управления(рисунки 48 и 49);

Рисунок 48 ‒ Страница "Хранилища"

Рисунок 49 ‒ Добавление хранилища

  1. восстановить резервную копию, содержащую данные неймспейсов клиентских кластеров, инфраструктурных провайдеров и ClusterRoles (рисунки 50‒51);

Рисунок 50 ‒ Восстановленные копии

Рисунок 51 ‒ Восстановление из резервной копии

Доступ к управлению клиентскими кластерами должен быть восстановлен

Восстановление при потере клиентского кластера

В случае если IP-адреса всех мастеров клиентского кластера недоступны, но сохранены данные конфигурации клиентского кластера в кластере управления и есть резервная копия клиентского кластера, рекомендуется:

  1. создать новый клиентский кластер с характеристиками неработоспособного кластера, теми же IP-адресами API-сервера и Ingress (рисунок 52);

Рисунок 52 ‒ Создание нового клиентского кластера

  1. установить модуль резервного копирования и восстановления ("Velero") в режиме "Автоматический" (auto) (рисунок 53);

Рисунок 53 ‒ Настройка режима управления

  1. подключить S3-хранилище, в котором находится резервная копия сломанного кластера (рисунки 54, 55, 56);

Рисунок 54 ‒ Страница "Хранилища"

Рисунок 55 ‒ Добавление хранилища

Рисунок 56 ‒ Добавленное хранилище

  1. восстановить резервную копию клиентского кластера (рисунки 57, 58, 59).

Рисунок 57 ‒ Восстановление из резервной копии

Рисунок 58 ‒ Страница "Восстановленные копии"

Рисунок 59 ‒ Восстановленные копии

Восстановление при удалении клиентского кластера

В случае если IP-адреса всех мастеров клиентского кластера недоступны, данные конфигурации клиентского кластера утеряны, но есть резервная копия клиентского кластера, рекомендуется:

  1. поднять временный клиентский кластер (рисунок 60);

Рисунок 60 ‒ Клиентский кластер

  1. подключить S3-хранилище, в котором находится резервная копия неймспейсов клиентских кластеров, инфраструктурных провайдеров и ClusterRoles из кластера управления (рисунки 61, 62, 63);

Рисунок 61 ‒ Страница "Хранилища"

Рисунок 62 ‒ Добавление хранилища

Рисунок 63 ‒ Добавленное хранилище

  1. восстановить резервную копию клиентского кластера (рисунок 64, 65, 66);

Рисунок 64 ‒ Страница "Восстановленные копии"

Рисунок 65 ‒ Восстановление из резервной копии

Рисунок 66 ‒ Восстановленные копии

  1. записать конфигурацию клиентского кластера:
  • адрес API-сервера кластера и сведения о конфигурации безопасности доступны в Configmap kubeadm-config неймспейса "kube-system" (рисунок 67);

Рисунок 67 ‒ kubeadm-config

  • адрес Ingress доступен в SSC "Модуля управления внешними подключениями" ("shturval-ingress-controller") (рисунок 68);

Рисунок 68 ‒ Модуль управления внешними подключениями

  1. после этого тестовый кластер можно удалить (рисунки 69‒70).

Рисунок 69 ‒ Удаление тестового кластера

Рисунок 70 ‒ Подтверждение удаления тестового кластера

  1. дальнейшие шаги соответствуют инструкции "Восстановление при потере клиентского кластера" (п. Восстановление при потере клиентского кластера).