— Какие элементы сегодня становятся ключевыми для создания безопасной и отказоустойчивой корпоративной инфраструктуры? Какие новые вызовы можно отметить?
Системный архитектор департамента инфраструктурных решений ЛАНИТ Михаил Капустин: Сегодня ключевыми элементами корпоративной инфраструктуры становятся отказоустойчивая архитектура, сквозной мониторинг, автоматизация и встроенная безопасность. Речь уже не только о резервировании оборудования или каналов связи, а о комплексном подходе: отказоустойчивость должна быть заложена на уровне приложений, данных, сетевой архитектуры и процессов эксплуатации.

Системный архитектор департамента инфраструктурных решений ЛАНИТ Михаил Капустин
Фото: ГК ЛАНИТ
Отдельно стоит отметить роль так называемой наблюдаемости инфраструктуры. Без единой системы мониторинга, логирования и анализа инцидентов обеспечить стабильную работу ИТ-среды уже невозможно.
Среди новых вызовов мы видим, прежде всего, рост сложности инфраструктур из-за активного распространения гибридных сред, увеличение количества технических требований к платформам оркестрации и управления контейнерами, миграцию на микросервисную архитектуру, а также усиление требований к информационной безопасности.
Дополнительно на рынок влияет необходимость импортозамещения, когда заказчикам нужно не просто заменить один продукт другим, а зачастую пересобрать весь технологический стек.
Директор центра «Инфраструктура» компании «ЛАНИТ-Интеграция» (входит в группу ЛАНИТ) Александр Чупрунов: Ключевыми элементами становятся платформа виртуализации, кластеры высокой доступности, отказоустойчивые корпоративные сервисы, системы резервного копирования и восстановления, а также средства миграции виртуальных машин и репликации данных, включая сценарии георезервирования.

Директор центра «Инфраструктура» компании «ЛАНИТ-Интеграция»
(входит в группу ЛАНИТ) Александр Чупрунов
Фото: ГК ЛАНИТ
Основные вызовы связаны с усложнением ИТ-ландшафта и ограничениями рынка. Заказчики одновременно сталкиваются с ростом стоимости оборудования, дефицитом отдельных категорий «железа», недоступностью части зарубежного ПО и необходимостью проверять совместимость российских решений между собой, с прикладными системами и оборудованием.
Руководитель направления аутсорсинга компании «Онланта» (входит в группу ЛАНИТ) Акмал Болтаев: Сегодня создание безопасной и отказоустойчивой корпоративной инфраструктуры уже невозможно без отхода от классических периметровых моделей защиты, и ключевым элементом становится принцип Zero Trust, при котором ни один запрос внутри сети не считается доверенным по умолчанию, а микросегментация трафика и контроль доступа к данным выходят на первый план.

Руководитель направления аутсорсинга компании «Онланта» (входит в группу ЛАНИТ) Акмал Болтаев
Фото: ГК ЛАНИТ
Наряду с этим критически важна дисциплина инженерной культуры, выраженная в практиках Chaos Engineering, когда система регулярно принудительно тестируется на сбои, чтобы выработать иммунитет к отказам оборудования, а отказоустойчивость теперь обеспечивается не столько резервными серверами, сколько кодом, управляющим конфигурацией инфраструктуры, и возможностью восстановления не из бэкапов, а из логических реплик с откатом на секунды.
Однако новые вызовы существенно усложняют задачу: периметр размыт гибридными облаками и массовой удаленной работой, поэтому классические ping-мониторинги перестают давать объективную картину, а уход западных вендоров и кадровый голод заставляют инженеров осваивать российские аналоги в боевых условиях, что неизбежно порождает ошибки на этапе настройки кластеров высокой доступности. К тому же DDoS-атаки сместились на прикладной уровень, где злонамеренный трафик практически неотличим от легитимного, что требует уже не просто отсечки по сетевым портам, а поведенческого анализа и интеллектуальной фильтрации.
— Какие требования сегодня предъявляются к мониторингу корпоративной инфраструктуры? На каких участках их особенно сложно реализовать, какие решения позволяют этим требованиям соответствовать?
Михаил Капустин (ЛАНИТ): Сегодня мониторинг должен обеспечивать не только сбор данных, но и быстрое выявление причин инцидентов, сквозную видимость всех компонентов инфраструктуры и поддержку в режиме проактивного реагирования. Заказчикам важно видеть в едином контуре серверы, сеть, приложения (серверы приложений и любые среды исполнения), базы данных, контейнерные платформы и сервисы информационной безопасности.
Наиболее сложно эти требования реализовать в распределенных и высоко динамичных постоянно изменяемых средах. Например, в Kubernetes-кластерах, микросервисных системах и гибридной инфраструктуре, где часть сервисов работает локально, а часть – в облаке. Отдельная сложность – это интеграция ИТ-мониторинга и мониторинга ИБ.
С точки зрения гибкости применяемых настроек и соответствия требуемому функционалу сегодня лучше всего соответствуют комбинированные стеки, включающие инфраструктурный мониторинг, работу с метриками, логами и трассировками. В частности, как и раньше, широко применяются Zabbix, VictoriaMetrics, Prometheus, Grafana, OpenSearch, Jaeger, OpenTelemetry.
Основной тренд – переход от разрозненных инструментов к единой платформе наблюдаемости. По сути, возникает потребность в создании комплексных (зонтичных) систем мониторинга, которые позволяют увидеть общую картину состояния всей инфраструктуры.
Александр Чупрунов («ЛАНИТ-Интеграция»): Современный мониторинг должен давать целостное представление о состоянии инфраструктуры и бизнес-сервисов, показывать связи между компонентами и помогать быстро определять причины сбоев. Также растет значение превентивного контроля, который позволяет выявлять отклонения до того, как они повлияют на пользователей.
Наиболее сложно организовать мониторинг гибридных сред и систем, состоящих из решений разных поколений и производителей. Для этого применяются централизованные платформы, автоматическое обнаружение объектов, единая модель сервисов, корреляция событий и интеграция с системами управления обращениями и инцидентами.
Акмал Болтаев («Онланта»): Требования к мониторингу корпоративной инфраструктуры претерпели кардинальные изменения, и теперь заказчику нужно единое окно, где метрики, логи и трейсы собираются в одном интерфейсе без постоянных переключений между Zabbix, Grafana и ELK. Дашборды должны отражать не технические цифры загрузки процессора, а бизнес-показатели вроде скорости оформления заказа или времени ответа на транзакцию.
Наиболее сложно реализовать такие требования на двух участках. Первый — это распределенные транзакции в микросервисной архитектуре, где один запрос проходит через десяток сервисов в разных ЦОДах и облаках, и отследить его без внедрения распределенной трассировки с корреляцией через уникальный идентификатор практически невозможно, но для этого требуется доработка кода приложений, что далеко не все готовы делать.
Второй проблемный участок — мониторинг удаленных автоматизированных рабочих мест, которые находятся за NAT-ами и динамическими IP-адресами, где традиционный pull-опрос с сервера не работает, и именно здесь эффективным решением становится push-архитектура, когда агенты на устройствах самостоятельно отправляют данные в центральную очередь или облачное хранилище, минуя проблемы прямой доступности. Также серьезным подспорьем становится внедрение прогнозной аналитики на основе машинного обучения, которая позволяет предсказывать исчерпание дискового пространства или рост нагрузки по трендам, а не реагировать постфактум.
— Как меняется технологический стек для решения этих задач, в том числе и с точки зрения импортозамещения?
Михаил Капустин (ЛАНИТ): Технологический стек за последние годы меняется очень заметно. Основное направление – это отказ от западных коммерческих решений в пользу open-source и отечественных продуктов. Причем речь идет не только о системах мониторинга как таковых, но и об операционных системах, платформах виртуализации, инструментах автоматизации и средствах защиты информации. Многие заказчики рассматривают вариант внедрения целых экосистем, проверенных на отдельных решениях.
На практике рынок активно переходит на ПО, совместимое с Astra Linux, РЕД ОС, ALT Linux, а в части мониторинга и наблюдаемости – на стек из Zabbix, VictoriaMetrics, Grafana, Vector, OpenSearch, Jaeger, OpenTelemetry и их локализованных аналогов.
Важно, что импортозамещение сегодня – это уже не просто замена интерфейса или лицензии. Это перестройка архитектуры, чтобы она была управляемой, масштабируемой и независимой от внешних поставщиков в долгосрочной перспективе. Отдельно стоит обратить внимание на поддержку таких продуктов. Активно развиваются отечественные community-поддерживаемые решения, растет экспертиза специалистов в области open-source решений на базе архитектуры Linux, в то же время доля рынка, ранее охваченного продукцией Microsoft, активно снижается.
Александр Чупрунов («ЛАНИТ-Интеграция»): Технологический стек становится более модульным и все чаще опирается на открытые протоколы, стандартные форматы данных и API. При выборе российских решений заказчики оценивают их совместимость с операционными системами, СУБД, средствами виртуализации, контейнерными платформами и оборудованием, которое уже используется в инфраструктуре.
Импортозамещение таких систем обычно проводится поэтапно. Перед внедрением необходимо проверить интеграции, производительность и возможность переноса существующих настроек и процессов.
Акмал Болтаев («Онланта»): Технологический стек для решения задач мониторинга и отказоустойчивости меняется радикально, и главный драйвер изменений — безусловно, импортозамещение: если раньше основой виртуализации был VMware vSphere, то сейчас все чаще выбирают платформы ZVirt или OpenStack, работающие на российских дистрибутивах Linux вроде Astra Linux или РЕД ОС, а в контейнеризации вместо ушедшего Rancher приходят отечественные сборки Kubernetes, например, Deckhouse от компании «Флант». Базы данных мигрируют с Oracle и MSSQL на Postgres Pro Enterprise или Tarantool, при этом в сегменте мониторинга ситуация несколько проще, так как Zabbix и Prometheus остаются открытыми и доступными, но к ним теперь активно добавляют VictoriaMetrics для долгосрочного хранения метрик. Наряду с этими решениями все большую роль играют и российские вендоры — например, решения от Monq и ПО «Лаборатории Числитель», которые обеспечивают не только сбор и визуализацию метрик, но и глубокую интеграцию с отечественными ОС, СУБД и облачными средами, закрывая потребности в импортозамещенном мониторинге на уровне enterprise-сектора и госзаказчиков.
Самым узким местом импортозамещения остаются драйверы и модули ядра, особенно для китайского оборудования Huawei, которые не всегда корректно работают под российскими ОС, поэтому инженерам приходится внедрять прослойки для SNMP-опроса с тонкой настройкой парсинга нестандартных MIB-деревьев, а также активно использовать инструменты управления конфигурациями как код для версионирования всей инфраструктурной среды.
— Расскажите об опыте вашей компании.
Михаил Капустин (ЛАНИТ): Наша компания работает в данном направлении комплексно – на стыке инфраструктуры, автоматизации, мониторинга, информационной безопасности и, очень часто, прикладных решений собственной разработки. Мы проектируем и внедряем отказоустойчивые ИТ-среды, создаем системы мониторинга под ключ, а также помогаем заказчикам переходить на импортонезависимый стек с учетом адаптации выбранного базового ПО под их конкретные требования. Что касается последнего, то был опыт, когда нам требовалось адаптировать свободно-распространяемую платформу визуализации под высокие показатели назначения в части отрисовки элементов и их статусов на дашбордах. Из «коробки» это не выполнялось, но решилось через разработку собственного решения, которое позволяет на текущий момент в режиме реального времени обрабатывать несколько тысяч событий для сотен элементов на одном дашборде.
Среди типовых проектов – высоконагруженные корпоративные инфраструктуры, геораспределенные ИТ-среды с несколькими независимыми ЦОД, государственные системы, а также объекты с повышенными требованиями к безопасности и непрерывности работы.
Как правило, речь идет не о внедрении отдельного инструмента, а о построении полноценного контура наблюдаемости и эксплуатации.
Отдельно можно отметить проекты, связанные с миграцией с зарубежных решений на open-source, российские платформы, а также внедрение мониторинга в средах, где одновременно важны и отказоустойчивость, и соответствие требованиям регуляторов.
Акмал Болтаев («Онланта»): В нашей практике был реализован масштабный проект для крупного банка с территориально распределенной сетью отделений и удаленных рабочих мест. Заказчик столкнулся с тем, что система мониторинга состояния тысяч автоматизированных рабочих мест фактически отсутствовала, инженеры узнавали о сбоях только от звонков пользователей, а классические подходы к опросу устройств не работали из-за особенностей сетевой архитектуры и требований информационной безопасности.
Мы предложили архитектуру на основе push-модели, когда легковесные агенты на каждом рабочем месте самостоятельно передавали диагностическую информацию в центральную систему, а также реализовали кастомные сценарии проверки доступности критических банковских приложений, что позволило фиксировать проблемы до того, как они начинали влиять на операционную деятельность. Кроме того, мы интегрировали мониторинг с системой управления инцидентами и добавили прогнозные алгоритмы для выявления деградации оборудования, что дало возможность переходить на проактивную замену компонентов. В результате время реакции на инциденты сократилось в разы, нагрузка на службу поддержки снизилась, а руководство банка получило прозрачную картину состояния всей распределенной инфраструктуры в режиме реального времени с привязкой к ключевым бизнес-процессам.
— Как, по вашему прогнозу, будут меняться тенденции, связанные с построением и мониторингом корпоративной инфраструктуры, в ближайшее время?
Михаил Капустин (ЛАНИТ): В ближайшие годы мы ожидаем дальнейшего движения в сторону централизации наблюдаемости, автоматизации реагирования и интеграции мониторинга с процессами информационной безопасности. Мониторинг будет все меньше восприниматься как отдельная техническая функция и все больше – как инструмент управления устойчивостью бизнеса.
Также будет усиливаться роль AIOps-подходов: автоматической корреляции событий, интеллектуального алертинга, поиска первопричин инцидентов и предиктивной аналитики.
С точки зрения рынка продолжится укрепление отечественного и open-source стека. Заказчики будут выбирать не просто функциональные решения, а те платформы, которые обеспечивают технологическую независимость, масштабируемость и долгосрочную поддержку.
Александр Чупрунов («ЛАНИТ-Интеграция»): Мониторинг будет охватывать все больше компонентов инфраструктуры и активнее использовать автоматизацию. Системы смогут точнее выявлять аномалии, сопоставлять события из разных источников, прогнозировать потенциальные сбои и помогать определять их причины.
Также будет расти спрос на единые платформы управления гибридной инфраструктурой и на решения, позволяющие контролировать работоспособность бизнес-сервисов независимо от того, где размещены их компоненты.
Акмал Болтаев («Онланта»): В ближайшее время ключевым трендом станет массовое внедрение AIOps, когда алгоритмы машинного обучения и языковые модели будут не просто строить графики, а самостоятельно предлагать корректирующие действия, например, перезапускать контейнеры или менять параметры SQL-запросов при обнаружении аномалий, и это будет происходить без участия дежурного инженера, а логи будут автоматически переводиться с технического языка на человеческий с приложением готовых решений из базы знаний. Параллельно будет набирать силу концепция цифровых двойников инфраструктуры, когда любое обновление сначала прогоняется на виртуальной копии продакшена с воспроизведением прошлых пиковых нагрузок, и только после подтверждения безопасности изменений они применяются в реальной среде, что существенно снизит риски человеческих ошибок.
Все более заметным станет сращивание SecOps и NetOps: решения по мониторингу сетевого трафика будут одновременно использоваться и для выявления перегрузок каналов, и для поиска утечек данных, а системы NDR станут стандартом де-факто в любой крупной инфраструктуре, поскольку безопасность и производительность окончательно перестанут рассматриваться как изолированные дисциплины.
— Большое спасибо за беседу!