Настройки платформы мониторинга Astra Monitoring

Обзор

Раздел Настройки в веб-интерфейсе объединяет конфигурацию трёх ключевых подсистем: AI-ассистента, хранилища ClickHouse и базы метрик VictoriaMetrics.


AI-ассистент

AI-модуль обеспечивает интеллектуальную обработку запросов и автоматический анализ данных.

Параметры конфигурации

Параметр

Описание

Пример значения

Включено

Активация/деактивация AI-функций

ON / OFF

API ключ

Секретный ключ авторизации в Yandex Cloud

•••••••••••• (скрыт)

Base URL

Эндпоинт API Yandex Cloud LLM

https://llm.api.cloud.yandex.net/v1

Модель

URI используемой языковой модели

gpt://<folder_id>/yandexgpt/latest

Рекомендации по безопасности

  • Храните API-ключ в защищённом хранилище секретов (Vault, переменные окружения)

  • Проверьте сетевую доступность Base URL из контура платформы

  • Используйте версию /latest для автоматического получения обновлений модели


ClickHouse

ClickHouse служит основным хранилищем структурированных данных: логов, трейсов и сигналов.

Управление TTL для трейсов

Трейсы генерируют наибольший объём данных и требуют особого внимания:

  • Проблема: При TTL > 14 дней таблица traces_base может занимать сотни гигабайт

  • Последствия: Замедление запросов, переполнение дисков, рост расходов на инфраструктуру

  • Решение: Установите TTL 7–8 дней и настройте мониторинг размера таблицы

Перед изменением TTL в production-среде протестируйте настройки на staging-окружении.


VictoriaMetrics

VictoriaMetrics отвечает за хранение и обработку метрик производительности в реальном времени.

Ключевые метрики системы

Параметр

Описание

Типичное значение

Уникальные пары «метка = значение»

Общее количество уникальных label combinations

1–5 млн

Временные ряды (time series)

Количество активных метрик

100–500 тыс.

TTL хранения

Период хранения данных

240 часов (≈10 дней)

Оптимизация производительности

  • Ограничьте количество собираемых метрик — высокая cardinality замедляет запросы

  • Настройте retention policy в соответствии с требованиями SLA

  • Организуйте резервное копирование для критичных метрик