Мониторинг и оповещения

Панель Наблюдение

РОСА Центр управления осуществляет в автоматическом режиме постоянный сбор данных о значениях разнородных элементов информации (параметров, статусов, событий и тому подобных), связанных с функционированием Комплекса. При этом каждый контролируемый элемент информации является отдельной метрикой мониторинга, а визуализация полученных данных осуществляется для пользователя на специально предназначенной панели Наблюдение.

Панель "Наблюдение" РОСА Центр управления доступна пользователю Комплекса в меню "Наблюдение → Обзор" панели навигации (рисунок 58).

Рисунок 58 – Панель Наблюдение

Панель "Наблюдение" содержит настраиваемый набор виджетов (модулей), отображающих информацию в графическом (диаграмма) и текстовом (таблица с данными) виде о состоянии управляемых узлов и иных объектов мониторинга РОСА Центр управления.

Для просмотра подробной визуальной статистической информации об отдельных метриках мониторинга можно воспользоваться меню "Наблюдение → Статусы хостов" панели навигации (рисунок 59).

Рисунок 59 – Обзор состояний узлов

Процессы

В РОСА Центр управления реализована возможность управления процессами, касающимися непосредственно работы Комплекса.

Для получения статистических данных о процессах и возможности управления ими следует выбрать в меню навигации пункт "Наблюдение → Задания ЦУ → Задачи" (рисунок 60). Выбрав один или несколько процессов, можно с помощью кнопки Действия завершить, приостановить или принудительно завершить процесс. В столбце "Операция" списка процессов операции можно отметить и принудительно завершить в зависимости от их статуса.

Рисунок 60 – Процессы РОСА Центр управления

Для просмотра данных о периодическом выполнении процессов РОСА Центр управления нужно перейти в меню "Наблюдение → Задания ЦУ → Повторяющиеся задания". Все ID-процессов с описанием параметров показываются в табличном виде.

Вызовы заданий

В РОСА Центр управления реализован механизм вызова заданий в соответствии с выбранными шаблонами заданий, поисковым запросами, расписанием запуска и прочими параметрами, позволяющими получать данные о конфигурациях и состояниях.

В меню навигации "Наблюдение → Задания" можно получить список выполненных, ранее запущенных или запланированных заданий с указанием статусов и статистики выполнения (рисунок 61). При нажатии на имя задания в рабочей области выдается подробный обзор о результатах выполнения и варианты дальнейших действий.

Рисунок 61 – Вызовы заданий

Для вызова или планирования нового задания необходимо нажать кнопку Выполнить задание и определить его параметры (рисунок 62):

  • категория и шаблон;
  • целевые узлы и входные данные;
  • дополнительные поля;
  • расписание и тип выполнения.

Для сохранения задание нажать кнопку Применить.

Рисунок 62 – Параметры вызова задания

Оповещения о событиях

Оповещения (сообщения, предупреждения) о контролируемых событиях РОСА Центр управления отображаются в интерфейсе Комплекса, а также (при необходимости и соответствующих настройках) могут быть отправлены пользователю по электронной почте.

Для просмотра списка полученных оповещений нужно нажать пиктограмму (колокол) на панели быстрого доступа, после чего для просмотра детальной информации о конкретном событии выбрать необходимое оповещение из общего перечня.

Следует обратить внимание, что в случае наличия сформированных и непрочитанных оповещений будет отображаться специальный индикатор красного цвета, который появится в правом верхнем углу пиктограммы (колокол).

Для автоматической рассылки оповещений по электронной почте сервер РОСА Центр управления должен быть интегрирован с внешним почтовым SMTP-сервером или настроен в качестве локального почтового агента MTA (например, sendmail) во вкладке "Email", доступной в меню "Управление Параметры" панели навигации. При этом используемые адреса электронной почты должны быть указаны в учетных записях пользователей Комплекса.

В свою очередь, в меню "Управление → Пользователи" на вкладке "Почтовые предпочтения" панели быстрого доступа каждый пользователь может выбрать только необходимые типы оповещений на основе событий (например, переход общего статуса узла в состояние сбоя (ошибки)), а для оповещений по расписанию (например, сводка аудита) указать частоту их получения по электронной почте. Кроме того, при необходимости пользователь вообще может отключить почтовую рассылку.

В общем случае управление оповещениями, связанными с событиями на узлах, осуществляется отдельно для каждого узла во вкладке "Дополнительно" (на странице с параметрами узла) через установку или снятие флажка "Включено". При этом в момент возникновения контролируемого события на Узле оповещается только владелец узла, который может быть как отдельным пользователем, так и группой пользователей.

Глобальный статус

Глобальный статус представляет собой общий статус конкретного узла. Статус может иметь одно из трех возможных значений: OK (ОК), Warning (Предупреждение) или Error (Ошибка).

OK означает, что никакие ошибки не были сообщены ни одним из подстатусов; и обозначается зеленым цветом.

Warning (Предупреждение) подразумевает, что пользователь должен проверить статус, поскольку, хотя ошибок не было обнаружено, некоторый подстатус вызвал предупреждение. Хорошим примером может быть отсутствие отчетов Puppet для узла, хотя узел настроен на отправку отчетов Puppet, поэтому он выделяется желтым цветом.

Error (Ошибка) указывает на то, что некоторый подстатус сообщает о сбое. Например, это может означать, что выполнение Puppet содержит неудачные ресурсы. Очевидно, это следует исправить, и пользователь получает предупреждение красным цветом.

Глобальный статус можно найти на странице обзора узлов, отображаемый в виде пиктограмм (статус) рядом с именем узла соответствующего цвета. Наведение указателя мыши на пиктограмму позволяет отобразить всплывающую подсказку с информацией о подстатусах, чтобы быстро получить дополнительные сведения.

Подстатусы

Подстатус мониторинга только часть возможностей узла. В настоящее время РОСА Центр управления поставляет только два подстатуса: подстатус сборки и подстатус конфигурации. Не все подстатусы являются актуальными для всех узлов, поэтому конфигурация рассматривается только в том случае, если узел использует систему управления конфигурацией, например, связан с каким-либо прокси-сервером Puppet. Подстатус сборки актуален для управляемых узлов, и в случае, если Комплекс работает в автоматическом режиме.

Можно увидеть глобальный статус узла со всеми подстатусами на странице деталей узла в таблице свойств. Следует обратить внимание, что плагины могут добавлять дополнительные подстатусы.

Каждый подстатус может определить свой набор возможных значений, которые отображаются в трех глобальных статусах. Подстатус сборки имеет два возможных значения – pending (ожидает) и built (построен), которые отображаются как глобальный статус "OK". Статус конфигурации более сложный, и его возможные значения и отображения описаны в таблице 1.

Поиск по статусам

В Комплексе можно искать Узлы по глобальному статусу. Вот некоторые примеры:

  • поиск всех узлов со статусом OK:
global_status = ok
  • поиск всех узлов, требующих внимания:
global_status = error or global_status = warning

Чтобы искать Узлы на основе статуса конфигурации, можно искать по последним метрикам отчетов, например:

  • найти Узлы, у которых есть хотя бы один ожидающий ресурс:
status.pending > 0
  • найти Узлы, которые перезапустили некоторый сервис во время последнего выполнения Puppet:
status.restarted > 0
  • найти Узлы с интересным последним выполнением Puppet (что-то произошло):
status.interesting = true