Изменения

1.4.0

Новые возможности

Мониторинг Kubernetes

Новый раздел для мониторинга Kubernetes-кластеров — состояние кластера, нод, подов и всех сущностей K8s в реальном времени.

  • Раздел мониторинга Kubernetes с визуализацией информации о кластерах

  • Интерфейс установки агента в кластер Kubernetes

  • Главная страница мониторинга Kubernetes с выбором кластера

  • Страницы мониторинга: общие сведения, ноды, пространства имён, Deployments, DaemonSets, StatefulSets, CronJobs, сервисы, поды

Монитор по логам

Новый тип монитора для алертинга на основе данных логов с визуальным конструктором запросов.

  • Визуальный конструктор: фильтрация, группировка, формулы расчёта метрик

  • Шаблоны формул для типовых сценариев

  • Автоматическая запись значений групп метрик

  • Валидация формул и SQL-запросов

  • Группировка по разным типам данных

  • Препросмотр отфильтрованных логов и трейсов

Монитор по трейсам

Новый тип монитора для алертинга на основе распределённых трейсов.

  • Визуальный конструктор запросов с шаблонами метрик

  • Шаблоны: Rate, Latency, Error Rate и другие

  • Формирование запросов и вывод графиков

Управление сбором трейсов

Ручной режим настройки сбора трейсов через UI — без правки конфигурационных файлов.

  • Указание процессов для мониторинга через UI (exe_path)

  • Сбор трейсов на основе технологии eBPF — нулевой код в приложение

  • Режим auto — автоматический выбор процессов для трейсинга

Эскалации по проблемам

Цепочки эскалаций теперь работают не только по инцидентам, но и по проблемам.

  • Настройка эскалации в правиле монитора

  • Автоматический запуск цепочки при появлении проблемы

  • Взятие проблемы в работу (acknowledgement) останавливает эскалацию

  • Эскалация при изменении критичности проблемы

  • Вывод эскалаций на UI, фильтрация по проблеме

Гибкие условия для мониторов

  • Все операторы сравнения для порогов: >, <, =, >=, <=

  • Интерфейс монитора метрик v2

  • Производные метрики (пишущий монитор)

  • Шаблоны формул

Сервис авторизации

Собственный Сервис авторизации для единого входа (SSO) в платформу.

  • Подключение к LDAP-каталогам (Active Directory, FreeIPA) и Keycloak через OIDC

  • Персонализированная страница авторизации

  • Автоматическое назначение роли Admin статическим пользователям

Прочие новые возможности

  • Экспортер Zabbix — интеграция данных из Zabbix-серверов

  • Metrics Explorer — страница для исследования доступных метрик

  • Тип графика «Текст» на дашбордах — размещайте пояснения и ссылки

  • Тип графика «Таблица» — доработки и поддержка аналитики

  • Таймлайн проблемы — визуальная шкала событий внутри проблемы

  • Мониторинг Termidesk - экспортёр с поддержкой API v6

Изменения

Мьюты и плановое обслуживание

  • Добавлена кнопка «Клонировать» в мьютах

  • Фильтры по мониторам и поиск по лейблам в плановом обслуживании

  • Комбинации лейблов в мьютах строго по И

  • Передача нескольких значений для лейблов мьютов

  • Отчётливая индикация мьюта всего монитора

  • Валидация в «По расписанию» в плановом обслуживании

  • На мониторе всегда отображается самый долгий мьют

Мониторы

  • Изменено название «Группа» на «Группировка» в интерфейсе

  • Улучшения в мониторе аномалий

  • Кнопка «Включить оповещения монитора» стала более понятной

  • Улучшена логика закрытия проблем при редактировании мониторов

  • Убраны лишние линии других групп с графиков на странице группы монитора

  • Доработки страницы групп монитора

Лицензирование

  • Trap, log и trace считаются как один активный хост

  • Поддержка АРМ и устройств

  • Убран преждевременный переход источников в not_licensed за 14 дней до окончания лицензии

  • Для типа АРМ доступны только разрешённые экспортеры

Дашборды

  • Оптимизирована загрузка данных графиков

  • Улучшен интерфейс списка дашбордов и файлового дерева

  • Более явное увеличение окна дашбордов

Карта хостов

  • Добавлено масштабирование

  • Исправлена опция «Скрыть хосты без группы»

Агент

  • Termidesk exporter обновлён до API v6

  • Добавлены джобы для Termidesk 2

  • Скрипт установки работает без sudo su

Bug fixes

Мониторы

  • Исправлено: при создании монитора все мониторы перезапускались и «голубели»

  • Исправлено: мониторы не удалялись

  • Исправлено: при редактировании монитора — 400 ошибка

  • Исправлено: монитор не срабатывал на значение метрики

  • Исправлено: при смене формулы появлялись левые группы метрик

  • Исправлено: дублирование групп при смене количества групп в мониторе логов

  • Исправлено: при смене группировки в мониторе происходило дублирование группы

  • Исправлено: при смене группировки оповещений не создавались новые проблемы

  • Исправлено: при смене порогов правила группа скакала с зелёной на красную

  • Исправлено: «Всего проблем» помечено красным в мониторе с Warning

  • Исправлено: 4 статуса внутри монитора

  • Исправлено: при переходе с OK до Critical проблема захватывает Warning

  • Исправлено: монитор с группировкой оповещений неправильно присылал no_data

  • Исправлено: нет легенды на графике для метрического монитора без группировки

  • Исправлено: стек правил работал неправильно

  • Исправлено: состояние групп меняло окрас при пересчёте монитора

  • Исправлено: не все параметры отображались верно после редактирования монитора аномалий

  • Исправлено: сбрасывались отредактированные поля при переходе на другой таб

  • Исправлено: имя группы попадало как unknown в активные проблемы

  • Исправлено: после удаления монитора нельзя было создать такой же

Мьюты

  • Исправлено: мьют не останавливал цепочку эскалаций

  • Исправлено: мьют оставался активным на проблеме после его удаления

  • Исправлено: не удалялся мьют

  • Исправлено: не редактировался мьют

  • Исправлено: мьюты по лейблам не работали

  • Исправлено: не мьютились проблемы групп заглушенных мьютом по лейблам

  • Исправлено: неправильно считалось время начала и конца мьюта

  • Исправлено: время отображалось как NaN

  • Исправлено: не отображались мьюты по расписанию

  • Исправлено: активные мьюты появлялись через 30–50 секунд

  • Исправлено: 400 при попытке создать мьют с датой окончания в прошлом

  • Исправлено: 500 ошибка при запросе мьютов с лейблами

  • Исправлено: починен приход первого оповещения о recovery после включения мьюта

K8s мониторинг

  • Исправлено зависание sdNotify в K8s агенте

  • Исправлена загрузка логов для K8s кластера

Трейсы

  • Исправлено: при запуске агента со сбором трейсов — 404 ошибка

  • Исправлено: при сохранении агента с авто-трейсами — ошибка в логах

  • Исправлено: отображались данные не из условий фильтрации трейса

  • Исправлено: не возвращались данные шаблона для трейсов

Лицензирование

  • Исправлено: при достижении лимита все экспортеры переходили в not_licensed

  • Исправлено: при обновлении лицензий источники перескакивали в not_licensed

  • Исправлено: не работал not_licensed для ARM (десктопов)

Оповещения и уведомления

  • Исправлено: не работало «Выключить оповещения уровня Warning»

  • Исправлены ошибки в notification-service

  • Исправлен ложный Bearer-токен при настройке webhook

  • Починены уведомления в MAX

Дашборды

  • Исправлено: не совпадал цвет на легенде и на графике

  • Исправлено: не редактировалось имя легенды

  • Исправлено: не прокручивалась легенда в графике метрик

  • Исправлена ошибка 401 при запросах к кластерной конфигурации БД метрик

Прочие исправления

  • Исправлена фильтрация по дополнительным фильтрам в логах

  • Исправлен 404 при поиске в Проблемах

  • Исправлен 503 на vmauth

  • Исправлено: не выводились события по No Data при фильтрации

  • Исправлена ошибка валидации конфига SMTP при запуске в контейнере

  • Исправлено: агенты зависали в статусе starting после удаления

  • Исправлено: в Termidesk экспортере лейблы перетирались лейблами из агента

  • Исправлена поехавшая верстка для длинных значений

  • Исправлены дубликаты в массиве лейблов

Исправления безопасности

  • Исправлена настройка CORS

  • Устранена уязвимость в Notification Service

  • Устранена уязвимость в Vite

  • Добавлено экранирование HTML-кода на странице «События»

  • Скрыта версия nginx

1.3.1

Новые возможности

  • Helm-chart для мониторинга ресурсов kubernetes — опубликован chart для установки агента в кластер

  • Улучшен интерфейс «Плановое обслуживание» — добавлена возможность фильтрации по монитору и улучшено быстродействие фильтров

  • Отображение лицензий типа АРМ — В интерфейс выведено количество лицензий для мониторинга автоматизированных рабочих мест

Bug fixes

  • Исправление ошибки при миграции данных с версии 1.1.0 — устранили ошибку возникающую при миграции с большим количеством данных

  • Исправлено пропадание данных в мониторах — добавили стабильности вкладке «мониторы», теперь данные отображаются корректнее

Технические улучшения

  • Для docker-compose версии выключены лишние собщения — Отключен трейсинг по дефолту для docker-compose версии и изменён уровень логирования по умолчанию на warning

1.3.0

Новые возможности

  • APM (Application Performance Monitoring) с распределенным трейсингом — добавлен полноценный мониторинг производительности приложений для отслеживания пути запросов через распределенные системы

  • Карта сервисов — визуализация зависимостей между сервисами с отображением времени отклика, автоматическим выделением проблемных участков и анализом узких мест

  • Карта хостов с встроенными графиками — отображение основных метрик в реальном времени прямо на карте хостов без перехода на отдельные страницы

  • Улучшенная работа с SNMP:

    • Редактирование шаблонов SNMP в UI — возможность редактировать конфигурации SNMP-экспортера непосредственно в интерфейсе без ручного редактирования конфигурационных файлов

    • Расшифровка SNMP traps — автоматическая расшифровка и понятное отображение SNMP-трапов для быстрого реагирования на события

    • Исправление генерации конфигурации для RFC1213-MIB — поддержка любых MIB-файлов

  • Настройка сбора трейсов из UI — настройка параметров сбора трейсов (HTTP и gRPC) непосредственно через интерфейс платформы

  • Страница установки агентов — упрощенная установка агентов одной командой с быстрым получением первых метрик после установки платформы

  • Централизованная настройка агентов — управление всеми параметрами агентов из единого интерфейса платформы

  • Улучшенный интерфейс:

    • Переработанное боковое меню — логическая группировка разделов, вынос часто используемых вкладок для ускорения навигации

    • Расширенный таймпикер — добавление большего количества временных диапазонов и истории запросов

    • Автообновление для произвольных интервалов — поддержка автообновления во вкладках «Проблемы», «События», «Дашборды» для любых временных диапазонов

    • Гибкая фильтрация в разделе «Проблемы» — расширенные возможности фильтрации событий по различным параметрам

  • Управление мьютами (подавлением оповещений) — новый интерфейс для создания, редактирования и управления правилами подавления алармов

Bug fixes

  • Исправление критической уязвимости в React 19.2.0 — устранение уязвимости безопасности в используемых компонентах интерфейса

  • Ускорение отображения трейсов — оптимизация производительности, скорость отображения трейсов увеличена в 15 раз

  • Добавление системы миграций баз данных — обеспечение безопасного обновления платформы без потери данных

  • Стабилизация работы всех типов мониторов — исправление проблем с работой адаптивных и стандартных мониторов

  • Общая оптимизация производительности системы — ускорение работы платформы и исправление проблем с производительностью

  • Исправление проблем с автоконфигурированием агентов — устранение ошибок при автоматической настройке агентов в различных средах

  • Улучшение стабильности инфраструктуры — исправление критических ошибок в основных компонентах платформы

Технические улучшения

  • Оптимизация инфраструктурных компонентов — улучшение стабильности и производительности базовых сервисов платформы

  • Улучшение обработки больших объемов данных — оптимизация работы с трейсами и метриками при высокой нагрузке

  • Унификация элементов интерфейса — улучшение консистентности и пользовательского опыта во всех разделах платформы

1.2.0

Новые возможности

  • Отображение умных порогов на графиках дашбордов — теперь можно использовать динамические пороги на основе исторических данных. Доступны алгоритмы MAD (среднее абсолютное отклонение) и StdDev (стандартное отклонение), которые автоматически учитывают тренды и сезонность метрик

  • Монитор нового типа: Адаптивный монитор — система может автоматически определять аномалии в поведении метрик без ручной настройки порогов, используя адаптивные алгоритмы

  • Новый раздел в UI: Трейсы — добавлен полноценный раздел для просмотра и анализа трейсов (трассировки запросов) с быстрой фильтрацией и визуализацией

  • Новый раздел в UI: Сигналы (SNMP-traps) — добавлен раздел для работы с SNMP-трапами с отображением и быстрой фильтрацией сигналов

  • Обновление раздела работы с логами — улучшена работа с логами: оптимизированы запросы, восстановлен конструктор фильтров, добавлена быстрая фильтрация и поиск

  • PromQL/MetricsQL валидация и подсказки — при создании запросов в графиках и дашбордах теперь доступны подсветка синтаксиса, автодополнение функций и операторов, проверка корректности запросов в реальном времени

  • Возможность отправки уведомлений в мессенджер MAX — добавлена поддержка отправки уведомлений в мессенджер MAX, аналогично Telegram

  • Темная тема — добавлена возможность переключения интерфейса на темную тему для комфортной работы в условиях слабого освещения

  • Оптимизация работы с логами — улучшена производительность запросов к логам, восстановлен конструктор фильтров, исправлены проблемы с отображением

  • Настройки для LLM-модели в UI — в разделе «Настройки» добавлена возможность настройки параметров подключения к LLM-моделям (API key, Base URL, модель) для использования AI-функций платформы

  • Улучшена работа с мониторами:

    • Добавлена возможность заглушения оповещений уровня Warning — теперь можно настроить монитор так, чтобы получать уведомления только критического уровня, игнорируя предупреждения

  • Убраны legacy-компоненты — удалены устаревшие компоненты системы (alertmanager, vmalert, event-adapter), скрыта страница «Проблемы(legacy)» для упрощения интерфейса

Bug fixes

  • Фикс бага с шаблонами SNMP — исправлена проблема, при которой при добавлении нового шаблона SNMP-Poll для одного устройства шаблон перезаписывался для всех остальных устройств. Теперь настройки каждого устройства сохраняются независимо

  • Фикс бага с лицензиями при отсутствии агентов — исправлена ошибка 404, возникавшая при загрузке лицензии, когда в системе еще нет агентов. Теперь лицензию можно загружать в любой момент

  • Восстановлена работа лицензирования при включенном автоконфигурировании — исправлены проблемы с автоконфигурированием агента, которые влияли на работу лицензирования

  • Добавлена возможность задавать символы кириллицы для пользователей в системе управления идентификацией — исправлен парсинг JWT токенов с кириллическими символами в именах и фамилиях пользователей. Теперь пользователи с русскими именами могут корректно работать во всех сервисах платформы

  • Исправлен баг с IPMI, возникающий при обновлении платформы — устранена проблема некорректной работы IPMI после обновления с версии 0.9 до 1.0

  • Исправлены ошибки с RBAC — исправлена проблема, при которой администратор мог случайно удалить группу Administrators, что блокировало доступ к админке. Теперь удаление критических групп запрещено

  • Исправлен баг с невозможностью скачать агент под Windows — устранена проблема скачивания vmagent и windows-exporter при установке агента на Windows

  • Устранена проблема отправки пустых полей при оповещении в каналы уведомлений — исправлен баг, при котором при отправке оповещения из монитора приходило пустое уведомление в email и другие каналы

  • Устранена проблема отправки уведомления при наличии несуществующего канала уведомления в цепочке эскалации — исправлена проблема, при которой при отправке оповещения на некорректную контактную точку (например, неверный email) цепочка эскалации прерывалась. Теперь эскалация продолжается даже при ошибках отправки

  • Устранена проблема SNMP-polling’а с разных устройств при наличии в агенте единой учетной записи, имеющей одинаковые данные для доступа к этим устройствам — исправлена проблема, при которой при использовании одной учетной записи для нескольких SNMP-устройств система не могла корректно обработать конфигурацию. Теперь можно использовать одну учетную запись для нескольких устройств

  • Исправлена проблема с отображением информации по трейсам — восстановлено отображение информации в таблице с трейсами во вкладке «Настройки»

  • Исправлена проблема с отображением проблем по хостам — теперь корректно отображаются активные проблемы для хостов на карте хостов

  • Исправлены проблемы с автоконфигурированием агента — устранены ошибки TLS, проблемы со сбором логов в агентах на дополнительных апстримах и в агенте, подключенном к прокси

  • Исправлена проблема с группировкой оповещений — устранен баг, при котором уведомления не отправлялись при включенной группировке оповещений в мониторе

  • Исправлены проблемы с отображением данных — устранены проблемы с отображением данных за промежуток времени в разделе «События», исправлено «съедание» части графика при возврате на страницу дашбордов

  • Исправлены проблемы безопасности — устранены уязвимости SQL injection в разделе «Проблемы (legacy)», улучшена безопасность обработки запросов

  • Исправлены проблемы с интерфейсом — исправлены проблемы с отображением шрифтов на карте хостов, улучшена читаемость имен хостов, унифицированы элементы интерфейса

  • Исправлены проблемы с агентами — устранены проблемы стабильности агента для приема трейсов, исправлены ошибки при работе с автоконфигурированием

  • Устранены уязвимости — закрыты уязвимости в используемых библиотеках (axios, golang.org/x/crypto, github.com/dgrijalva/jwt-go)