Потребление ресурсов


Агент мониторинга потребляет ресурсы в зависимости от количества и типа запущенных экспортёров, частоты сбора метрик и объема обрабатываемых данных.

В данной документации рассматриваются три типовых сценария работы агента с оценкой потребления CPU, RAM и Network.

Описание стенда

Для оценки потребления ресурсов агентами мониторинга использовалась виртуальная машина (ВМ) со следующими характеристиками:

Аппаратная конфигурация ВМ

Параметр

Значение

CPU

4 vCPU

RAM

8 ГБ

Диск

50 ГБ (SSD)

Сеть

1 Гбит/с

ОС

Astra linux 1.8

Условия тестов:

  • Холодный старт – замеры после перезапуска

  • Стабильная работа – усредненные значения за 1 час

  • Пиковая нагрузка – искусственное создание нагрузки (например, ошибки в логах)

Ограничения тестов:

  • Виртуальная среда может давать небольшую погрешность (~5-10%)

  • Network-трафик измерялся только на стороне агента (без учета сжатия)

Сценарий: базовый мониторинг системы

Конфигурация агента

  • node_exporter – сбор системных метрик

  • Частота сбора метрик: 30 секунд

Оценка ресурсов

Ресурс

Среднее потребление

Возможный разброс

Примечания

CPU

0.5–1.5% ядра

До 3% при высокой загрузке системы

Зависит от количества дисков, сетевых интерфейсов и частоты сбора метрик

RAM

30–50 МБ

До 80 МБ при большом количестве mount points или сетевых интерфейсов

Потребление растет при наличии множества устройств (/dev/sd*, eth*)

Network

5–15 КБ/с (в пике)

До 50 КБ/с при активном сборе сетевых метрик

Трафик зависит от количества метрик и их изменчивости

Примечание

  1. В большинстве случаев node_exporter работает стабильно и не создает значительной нагрузки.

  2. Потребление CPU может кратковременно возрастать при частых изменениях в системе (например, при высокой дисковой активности).

Сценарий: расширеный мониторинг системы + сбор логов

Конфигурация агента

  • node_exporter – сбор системных метрик

  • systemd_exporter – мониторинг состояния systemd-сервисов

  • vector – сбор и обработка логов (системные журналы и логи экспортёров)

  • Частота сбора метрик: 30 секунд

Оценка ресурсов

Ресурс

Среднее потребление

Возможный разброс

Примечания

CPU

2–5% ядра

До 10% при высокой нагрузке (много логов или сервисов)

vector может потреблять больше CPU при обработке большого объема логов

RAM

100–200 МБ

До 300 МБ при активном сборе логов

vector хранит буферы логов в памяти

Network

50–200 КБ/с

До 1 МБ/с при активной отправке логов

Зависит от объема логов и настроек vector

Примечание

  1. systemd_exporter добавляет небольшую нагрузку (0.5–2% CPU, 20–50 МБ RAM).

  2. vector может потреблять больше ресурсов, если логи пишутся с высокой частотой.

  3. В пиковых нагрузках (например, при ошибках в приложениях) потребление CPU и RAM может временно возрастать.

Сценарий: Полный стек мониторинга приближеный к реальной инфраструктуре

Конфигурация агента

  • node_exporter – сбор системных метрик

  • systemd_exporter – мониторинг состояния systemd-сервисов

  • blackbox_exporter - проверяет 50 HTTP/ICMP/TCP-таргетов

  • snmp_exporter - опрашивает 50 SNMP-устройств

  • cAdvisor - собирает метрики контейнеров

  • vector - собирает логи из /var/log, от экспортёров и rsyslog от 50 snmp устройств

  • Частота сбора метрик: 30 секунд

Оценка ресурсов

Ресурс

Среднее потребление

Возможный разброс

Примечания

CPU

10–25% ядра

До 40% при активном SNMP-опрашивании или большом количестве контейнеров

snmp_exporter и cAdvisor могут создавать высокую нагрузку.

RAM

400–800 МБ

До 1.5 ГБ при активном сборе логов и большом количестве метрик

cAdvisor и vector потребляют больше всего памяти.

Network

1–5 МБ/с

До 10 МБ/с при активном SNMP/blackbox-мониторинге

blackbox_exporter и snmp_exporter генерируют значительный трафик.

Примечание

  1. blackbox_exporter и snmp_exporter могут создавать высокую нагрузку на CPU при большом количестве таргетов.

  2. cAdvisor потребляет много памяти, если на сервере запущено много контейнеров.

  3. vector может требовать дополнительных ресурсов, если логи пишутся с высокой скоростью.

  4. В пиковых сценариях (например, при сбое SNMP-устройств или всплеске логов) потребление ресурсов может временно возрастать.