Модуль собирает статистику по типам доступности для компонентов кластера и Deckhouse. Позволяет оценивать степень выполнения SLA на эти компоненты, показывает данные о доступности в web-интерфейсе и предоставляет web-страницу статуса работы компонентов кластера.

С помощью Custom Resource UpmeterRemoteWrite можно экспортировать метрики доступности по протоколу Prometheus Remote Write.

Состав модуля:

  • agent — делает пробы доступности и отправляет результаты на сервер, работает на мастер-узлах.
  • upmeter — агрегатор результатов и API-сервер для их извлечения.
  • front
    • status — показывает текущий уровень доступности за последние 10 минут (по умолчанию требует авторизации, но её можно отключить).
    • webui — дашборд со статистикой по пробам и группам доступности (требует авторизации).
  • smoke-mini — постоянное smoke-тестирование с помощью StatefulSet, похожего на настоящее приложение.

Модуль отправляет около 100 показаний метрик каждые 5 минут. Это значение зависит от количества включенных модулей Deckhouse.

Интерфейс

Пример web-интерфейса:

Пример графиков по метрикам из upmeter в Grafana: