Модуль предназначен для базового мониторинга узлов кластера.

Обеспечивает безопасный сбор метрик и предоставляет базовый набор правил для мониторинга:

  • Текущей на узле версии Docker (и ее соответствия разрешенным для использования)
  • Общей работоспособности подсистемы мониторинга кластера (Dead man’s switch)
  • Доступных файловых дескрипторов, сокетов, свободного места и inode
  • Работы kube-state-metrics, node-exporter, kube-dns
  • Состояния узлов кластера (NotReady, drain, cordon)
  • Состояния синхронизации времени на узлах
  • Случаев продолжительного превышения CPU steal
  • Состояния таблицы Conntrack на узлах
  • Подов с некорректным состоянием (как возможное следствие проблем с kubelet) и др.