В «Вымпелкоме» создана система мониторинга ИТ-инфраструктуры на базе открытого ПО
«Вымпелком» в партнерстве с ИТ-компанией «Инфосистемы джет» преобразовал действовавшую систему мониторинга ИТ-инфраструктуры в единое и централизованное решение на основе открытого ПО Zabbix и Grafana. Сегодня оно помогает оператору связи отслеживать работу и прогнозировать состояние более 180 различных приложений и бизнес-сервисов — вся информация наглядно отражается на дашбордах и фиксируется в событиях мониторинга. Система стала основой для точного планирования развития ИТ-инфраструктуры.
Оказывая телекоммуникационные и облачные услуги, «Вымпелком» развивает фундамент своего ИТ-ландшафта — инфраструктуру. Наблюдаемость ландшафта, доступность сервисов, предсказание возникновения затруднений у клиентов, скорость диагностики и локализация нештатных ситуаций, влияние на клиентский опыт каждого потребителя для предоставления быстрой помощи — вот те новые задачи, которые призвана была решить создаваемая в «Вымпелкоме» система мониторинга. На первом этапе было инициировано построение единой системы мониторинга ИТ-инфраструктуры, поддерживающей бизнес-сервисы, включая и те, с которыми имеют дело клиенты оператора связи. Внедрение решения было доверено «Инфосистемы джет».
На момент старта проекта в «Вымпелкоме» уже использовалось несколько систем мониторинга. Они оценивали состояние отдельных сервисов и фрагментов ИТ-инфраструктуры, не создавая общей картины. Команда ИТ «Вымпелкома» разработала архитектуру будущего целевого решения и совместно со специалистами «Инфосистемы джет» объединили все фрагменты ИТ-инфраструктуры в единую систему на базе ПО Zabbix, включая системы хранения данных, сетевое оборудование, системы резервного копирования, серверы с различными операционными системами и пр. Опираясь на свой опыт и лучшие практики, инженеры ИТ-компании настроили способы сбора информации для нетипового оборудования, а также разработали «модель здоровья» — правила (триггеры), при достижении которых система сообщает о рисках сбоев.
Чтобы видеть состояние бизнес-сервисов, специалисты интегрировали систему мониторинга с существующей базой данных управления конфигурациями (CMDB). Это позволяет отслеживать влияние функционирования ИТ-компонентов на работу более 180 приложений и бизнес-сервисов. Например, работу личного кабинета, действий с балансом, предоставления абонентам различной информации — подключенных услуг, совершенных операций и пр. Так бизнес получил четкую картину о том, как дефицит емкостей и ресурсов влияет на конкретные бизнес-функции.
«Системы мониторинга ИТ-инфраструктуры обычно не используются за пределами ИТ-подразделения. Но не в нашем случае. Внедренное решение дает продуктовым командам и бизнесу понимание того, как работа инфраструктурного слоя и сервисов влияет на клиентский опыт наших потребителей, — отметил Сергей Агеев, директор по развитию сервисов «Вымпелкома». — Теперь ИТ-команда при обосновании затрат опирается на реальные данные, сопоставляя их с приоритетами компании и конкретных продуктовых команд, а не на экспертные прогнозы».
Визуализация работы ИТ-мониторинга на основе ПО Grafana имеет трехуровневую структуру. Комплексный дашборд представляет обзор девяти основных направлений. На втором уровне отображается суммарная статистика по каждому направлению. Третий уровень дает сведения о конкретных устройствах, их промежуточных наблюдаемых состояний с визуализацией текущей и предыдущей нагрузки и динамики ее изменений. Так специалисты «Вымпелкома» в одной консоли контролируют состояние всей ИТ-инфраструктуры по ключевым параметрам и индикаторам от бизнес-сервиса до датчика работы вентилятора. Выход метрики за пределы нормативного диапазона фиксируется в предупреждающем или аварийном событии.
«Open source решение Zabbix в связке с Grafana позволяет построить комплексную и функционально богатую систему. Созданное у "Вымпелкома" решение ИТ-мониторинга инфраструктуры сделало быстрым обнаружение событий, влияющих на работу сервисов, и помогает оперативно устранять их. В итоге это повышает доступность сервисов для почти 50 млн абонентов оператора связи», — сказал Алексей Акопян, руководитель направления ИТ-мониторинга «Инфосистемы джет».