Мы занимаемся установкой и настройкой систем ИТ-мониторинга уже более 5 лет. Эти работы являются неотъемлемой частью внедрения системы, особенно когда предъявляются высокие требования к доступности сервисов. Сейчас подход к мониторингу существенно изменился. Если раньше было достаточно контролировать работу серверов физически, их доступность, загрузку по основным метрикам, то сейчас это необходимо делать и в отношении программных компонентов. Происходит это потому, что всё усложняется – и общая логика построения решений, и подход к их реализации. Все чаще используется микросервисная архитектура, что создаёт дополнительные требования к обеспечению производительности систем. Вот почему классические системы мониторинга нам уже не подходят, и мы используем такие современные решения как Zabbix, Prometheus, Newrelic и др. С их помощью собираются и обрабатываются метрики с конечных узлов, а администраторы получают полную информацию о работе системы и в случае инцидента направляют соответствующие уведомления.
Важно понимать, что уже на этапе разработки архитектуры приложения закладываются основные критерии мониторинга функциональности. Когда система вводится в эксплуатацию у заказчика, интегратор помогает правильно настроить основные метрики мониторинга, как системные, так и бизнес-приложений, что способствует бесперебойной работе уже на первых этапах.
Например, при новых внедрениях нашей системы «Рекорд» для управления дорожным хозяйством, мы сразу же настраиваем мониторинг по ключевым метрикам, уже «обкатанным» на предыдущих внедрениях, при этом мониторинг постоянно совершенствуется за счет добавления новых критериев контроля показателей работы системы и их агрегации для улучшенной визуализации полученных результатов.
Интересный проект был нами выполнен для банка «Ренессанс Кредит», где мы осуществили миграцию системы мониторинга Zabbix с проприетарной базы данных на СУБД PostgreSQL. Преимуществом предложенной схемы миграции было кратчайшее время недоступности системы мониторинга Zabbix, осуществляющей контроль работоспособности всех узлов вычислительной инфраструктуры. В банке более 3000 хостов, поэтому непрерывный контроль их нагрузки и уровня производительности является критичным для всей работы банка. Система агрегирует ключевые метрики, на основе которых строит графики и, анализируя эту информацию, администраторы следят за работой информационных систем и ресурсов. Заказчик был очень доволен результатом, поскольку получил и технические, и экономические выгоды. Была достигнута существенная экономия за счет оптимизации серверных мощностей, снижения стоимости лицензий на базовое ПО при высоком уровне масштабируемости и безопасности.
Резюмируя, скажем, что по мере усложнения технологий и систем, развивается и приобретает новые функциональные возможности и сам ИТ-мониторинг. Сейчас уже недостаточно собирать только метрики, теперь в обиход входит новый термин - observability (наблюдаемость) системы. Он отражает степень того, насколько хорошо и корректно внутреннее состояние системы отображается ее внешним представлением – например, журналами логов приложения. Таким образом, мониторинг, дополненный наблюдаемостью, не только сообщит нам об ошибке, но и даст ответ на вопрос, почему она произошла.
Руководитель группы инженеров службы внедрения и сопровождения компании «ФОРС – Центр разработки» (ГК ФОРС) Олег Константинов