– Олег, какие сейчас имеются средства для организации мониторинга инфраструктуры, приложений, бизнес-процессов?
– Исходя из своего опыта, вне зависимости от специфики элементов ИТ-инфраструктуры, я бы поделил мониторинг на проактивный и реактивный. Когда элементы ИТ-инфраструктуры перестают работать и требуют срочного исправления, чтобы восстановить предоставленную услугу, реактивный мониторинг помогает как можно скорее узнать, что не так или не работает.
При этом каждый компонент ИТ-инфраструктуры требует регулярного обслуживания для работы с максимальной эффективностью, и проактивный мониторинг позволяет отслеживать определенные показатели работоспособности в системах и принятия мер, пока не стало слишком поздно. И здесь имеет смысл систематизировать и консолидировать всю информацию обо всех объектах ИТ-инфраструктуры на единой платформе и совместить мониторинг с организацией обслуживания и ремонта активов разной сложности.
Зачастую руководство компаний очень мало знают о том, из чего состоит и как на самом деле работает их ИТ-среда. Они знают об этом только тогда, когда случаются сбои и бизнес находится под угрозой. Мониторинг ИТ-среды и централизованное управление активами предприятия от программного обеспечения до аппаратных систем и сетевого оборудования позволяет снизить риски и проактивно управлять сложными составными объектами.
ИТ-директор компании «Интерпроком» Олег Слядников
– Грамотно организованный мониторинг - каким он должен быть? Велико ли в нем участие человека, или большее значение имеют правильно подобранные средства автоматизации? Какими компетенциями должен обладать специалист, ответственный за мониторинг?
– Грамотно организованный мониторинг – это разумный мониторинг, который помогает обеспечивать доступность ИТ-систем и сервисов 24х7.
Например, вы прибыли в офис на машине, проехали на территорию парковки, зашли в здание по электронному пропуску, сели за свой рабочий стол, включили компьютер, открыли электронную почту, бизнес-приложения и начали свой обычный рабочий день. При этом вы уже использовали несколько различных сервисов, о которых даже не задумывались. Что произойдет, если откажет хотя бы один из элементов ИТ-инфраструктуры: оборудование, программное обеспечение, сетевые и другие ресурсы? - Вы захотите войти в офис, а ваш пропуск не сработает, электронные письма не будут уходить, бизнес-приложения не запустятся.
Разумная система мониторинга сегодня – это больше, чем система информирования о сбоях. Она должна, во-первых, быть способна как минимум автоматически устранять ряд проблем. Например, если сервер Domino говорит, что повредился индекс одной из почтовых баз, то система мониторинга помимо отправки сообщения системному администратору, должна запустить команду перестройки индекса. Если ситуация со сбоем произошла ночью, то сисадмин начинает свое утро не с поиска повреждённой базы и запуска процедуры восстановления, а получает сообщение, что ночью был сбой, система восстановлена. Администратор может заниматься поиском причин сбоя и выработкой подходов и методик его предотвращения в дальнейшем, что снижает необходимость ручного труда, и повышает эффективности работы ИТ-специалистов.
Во-вторых, недостаточно просто обеспечить работоспособность ИТ-инфраструктура, важно определить, какие области можно улучшить. Зная это, можно соответствующим образом настроить свою инфраструктуру, чтобы система работала с максимальной производительностью. Вы можете заранее определить любую уязвимую область до того, как вообще возникнет какая-либо проблема, что позволяет предотвратить простои и недоступность системы.
Немаловажный момент – это сбор и визуализация метрик обслуживаемых сервисов. И здесь встает задача глубокого анализа причин сбоя, воссоздание картины, предшествовавшей сбою, анализ окружения и определение методов предотвращения. Поэтому очень важно, чтобы система мониторинга формировала рекомендации по возможным причинам сбоя и дальнейшим действиям.
Не стоит забывать, что требуется не просто установить сервис мониторинга, но и настроить его так, чтобы уведомления были понятны специалистам поддержки. При этом их не должно быть слишком много, дабы не возникало «симптома привыкания», когда сообщение о проблеме от системы мониторинга тонет среди других информационных сообщений системы мониторинга. Мониторинг должен информировать специалиста только о возникновении исключительных ситуациях.
Да, пока мы не можем отдать полностью исправления ситуации автоматизированным системам, но уверен, что в будущем, в том числе с помощью машинного обучения, число кейсов, где необходимо участие человека, будет неуклонно снижаться.
– Какова роль интегратора в этом процессе? На каких участках помощь интегратора незаменима?
– С одной стороны, компания «Интерпроком» как традиционный системный интегратор осуществляет комплексное внедрение проектов, которая включает в себя установку и настройку системы мониторинга сервиса, помогаем с постановкой на учет в существующую систему мониторинга заказчика, оказываем консультации по выработке и определению метрик, алертов, шаблонов действий, регламентов.
С другой стороны, компания «Интерпроком» расширяет границы системной интеграции, в частности является единственным в России провайдером облачных сервисов HCL Cloud Hosting MSP, что накладывает еще большую ответственность за предоставление сервисов самого высокого уровня. Здесь роль интегратора по мониторингу облачной среды многократно возрастает, а помощь становится незаменимой, поскольку облачная среда провайдера становится неотъемлемой частью инфраструктуры заказчика и сбои в ее работе просто недопустимы, доступность облачных сервисов должна быть на уровне 24х7.
Задача системного интегратора не просто установить и настроить программное обеспечение. Мы отдаем в эксплуатацию законченный сервис, настроенный на максимальную отдачу и бесперебойную работу.
– Ваше экспертное мнение о перспективах развития направления мониторинга ИТ и роста его значимости для компаний в целом и разных категорий пользователей.
– С моей точки зрения, для бизнес-пользователей системы мониторинга должны быть «невидимками», а все ИТ-системы и сервисы должны быть всегда доступны и бесперебойно работать.
Мой опыт работы показывает, что системы стремительно движутся от реактивного мониторинга к прогнозному проактивному.
Мечта любого сисадмина – это умная систем мониторинга с использованием роботизированных сервисов, ИИ и машинного обучения, которая может не только удаленно фиксировать сбои и устранять их, заниматься классификацией ошибок, но и обладает возможностями глубокой прогнозной аналитики, работая с большими данными, включая Интернет вещей, с целью накопления и обработки статистических данных и прогнозирования вероятных поломок оборудования и сбоев систем, расследования инцидентов, анализа причин, которые привели к сбою в прошлом. Системы мониторинга смогут предпринимать все необходимые действия от самостоятельного исправления ситуации, до отправки заявок в поддержку, разработку, отдел закупок. Роль системного администратора трансформируется в роль оператора системы без необходимости совершать рутинные механические действия.
– Большое спасибо за беседу!