Концепция проактивного мониторинга и управления объектами ИТ-инфраструктуры

Михаил Григорьевич Дубровин

УДК 004.05 М.Г. Дубровин

ГРНТИ 20.51.23 ФГАОУ ВО «Тюменский государственный университет»

КОНЦЕПЦИЯ ПРОАКТИВНОГО МОНИТОРИНГА И УПРАВЛЕНИЯ ОБЪЕКТАМИ ИТ-ИНФРАСТРУКТУРЫ

В статье производится обзор концепции проактивного мониторинга и управления объектами ИТ-инфраструктуры. На первом этапе рассматриваются существующие подходы к обслуживанию технических объектов. Исследования в области проактивного обслуживания с течением времени продолжают развиваться, находя применения в разных областях. Увеличение стоимости объектов ИТ-инфраструктуры, существенная зависимость организаций от эффективности объектов, повышение требований к бесперебойности делают актуальной задачу совершенствования существующих или разработки новых подходов к управлению объектами ИТ-инфраструктуры. Производится обзор основных понятий, целей и этапов проактивного мониторинга и управления в области обслуживания объектов ИТ-инфраструктуры. В заключительной части исследования предлагается интерпретация задач, которые должны быть решены с помощью системы проактивного мониторинга и управления. Определен следующий перечень последовательных задач: прогнозирование временных рядов, обнаружений аномалий, анализ корневых причин инцидентов, выработка решений на основе прецедентов. Ключевые слова: проактивный мониторинг, проактивное управление проблемами, ИТ-инфраструктура, прогнозирование временных рядов, обнаружение аномалий, анализ корневых причин, рассуждение на основе прецедентов.

M.G. Dubrovin

Tyumen State University

CONCEPT OF PROACTIVE MONITORING AND OBJECT MANAGEMENT OF IT INFRASTRUCTURE

The article provides an overview of the concept ofproactive monitoring and management of IT infrastructure facilities. At the first stage, existing approaches to servicing technical facilities are considered. Research in proactive service continues to evolve over time, finding applications in various fields. The increase in the cost of IT infrastructure facilities, the significant dependence of organizations on the efficiency of facilities, the increased requirements for uninterrupted operation make it urgent to improve existing or develop new approaches to managing IT infrastructure facilities. An overview of the basic concepts, goals and stages of proactive monitoring and management in the field of servicing IT infrastructure facilities is carried out. The final part of the study proposes an interpretation of the tasks that must be solved with the help of a proactive monitoring and control system. The following list of sequential tasks is defined: forecasting time series, detecting anomalies, analyzing the root causes of incidents, developing solutions based on precedents.

Keywords: proactive monitoring, proactive problem management, IT infrastructure, time series forecasting, anomaly detection, root cause analysis, case-based reasoning.

Введение

Во второй половине XX века активно обсуждались принципы обслуживания и мониторинга технических объектов [1,2]. Предложенная концепция обслуживания [2] разделяется на реактивный и проактивный подход. Проактивное обслуживание в свою очередь разделяется на два подкласса: превентивное и предиктивное обслуживание [2]. В следующей таблице приведено сравнительное описание типов обслуживания (Таблица 1). Тип обслуживания рекомендуется выбирать исходя из роли оборудования в инфраструктуре предприятия и стоимости незапланированных простоев.

Исследования в области проактивного мониторинга и управления с течением времени продолжают развиваться, находя применения в разных областях. В частности, рассматриваются задачи проактивного мониторинга и управления сложными техническими объектами, которые нашли применение в ракетно-космической отрасли, атомной энергетике, транспортно-логистической и военной сферах [3]. Другой пример касается применения принципов проактивного управления в системах поддержки принятий решений сложных систем [4]. В области проактивного управления ИТ-инфраструктурой, значительный вклад описан в открытой библиотеке ITIL [5]. ITIL (IT Infrastructure

Library) - библиотека, описывающая лучшие из применяемых на практике способы организации работы подразделений или компаний, занимающихся предоставлением услуг в области информационных технологий [6].

Таблица 1

Описание подходов к обслуживанию оборудования

Признак \ Тип обслуживания Реактивное Проактивное

Превентивное Предиктивное

Принцип обслуживания Обслуживание после выявления поломки или дефекта. Обслуживание с заранее определенными интервалами. Непрерывная диагностика и контроль состояния оборудования с целью обеспечения удобного планирования дальнейшего обслуживания и предотвращения непредвиденных отказов.

Оборудование Оборудование, у которого число отказов минимально, либо когда отказы не несут за собой серьезных материальных потерь. Некритическое оборудование с невысокой стоимостью непредвиденного простоя. Оборудование, у которого степень использования в производственной цепочке оценивается как высокая, а его отказ или длительный простой приводит к существенным финансовым потерям.

В настоящее время растет интеграция внедряемых на предприятиях информационных технологий (далее - ИТ) в единую ИТ-инфраструктуру с целью повышения эффективности производственных и бизнес-процессов. Вследствие такой интеграции происходит усложнение корпоративной ИТ-инфраструктуры организаций. В связи с ростом потребности в ИТ-системах, возрастает стоимость объектов ИТ-инфраструктуры, увеличиваются требования к эффективности и бесперебойности [7]. Данные факторы усложняют процесс управления функционированием ИТ-инфраструктуры и требуют больших экономических затрат.

Исходя из приведенной классификации типов обслуживания, для объектов ИТ-инфраструктуры более предпочтительно будет применять методы предиктивного обслуживания, которые являются подклассом проактивного подхода. С другой стороны, описанные проблемы управления ИТ-инфраструктурой делают актуальной задачу совершенствования существующих или разработки новых подходов к управлению.

Целью данного обзора является исследование основных понятий, целей и этапов проактивного мониторинга и управления в области обслуживания ИТ-инфраструктуры, основанных на методологии ITIL и трудов других исследований. В процессе обзора предложена интерпретация задач, которые должны быть решены с помощью системы проактивного мониторинга и управления.

Проактивный мониторинг и управление объектами ИТ-инфраструктуры

В ITIL версии 3 описана концепция управления проблемами, которые могут возникнуть при эксплуатации ИТ-инфраструктуры предприятия. Под проблемой понимается причина одного или нескольких инцидентов [6]. В свою очередь, инцидент - это незапланированное прерывание или снижение качества ИТ-услуг [6]. В ITIL различают два типа управления проблем: реактивное (Reactive Problem Management) и проактив-ное управление (Proactive Problem Management) (Рисунок 1) [5].

ITIL v.3

Рисунок 1. Управление проблемами. ITIL

Реактивное управление реагирует на уже произошедшие инциденты и сосредоточено на их устранении.

Проактивное управление - это непрерывный процесс, который не ожидает инцидента, чтобы реагировать на него, но занимается предотвращением их возникновения. Процесс проактивного управления состоит из двух операций [5]: анализ тенденций и планирование превентивных действий.

В рамках задачи анализа тенденций осуществляется наблюдение за инфраструктурой, позволяющее выявить любые нетипичные события, свидетельствующие о скрытых ошибках или уязвимостях. Для эффективного анализа тенденций ключевым фактором является наличие полной и достоверной информации о компонентах инфраструктуры и происходящих в ней событиях. Суть второй операции заключается в устранении и проведении корректирующих действий к обнаруженным уязвимостям и ошибкам.

Задачи управления проблемами объектов ИТ-инфраструктуры могут быть разделены на три последовательных этапа: обнаружение, локализация и устранение проблем [8].

Для управления объектами ИТ-инфраструктуры организаций используются различные автоматизированные средства мониторинга. В общем случае, под мониторингом понимается наблюдение за процессом с целью выявления его соответствия желаемому результату [9]. Понятие мониторинга различается в зависимости от сферы его применения.

Ссылаясь на официальный русскоязычный глоссарий библиотеки ITIL [6], определение понятия мониторинга ИТ-систем описывается следующим образом. Мониторинг - это постоянное наблюдение за конфигурационной единицей, ИТ-услугой или процессом, с целью обнаружения событий и обеспечения информированности о текущем состоянии [6]. Где под событием понимается любое значимое для наблюдателя изменение состояния объекта мониторинга.

Типичная система мониторинга объектов ИТ-инфраструктуры состоит из следующих шагов [10]:

1. Сбор данных. Осуществляется опрос объектов мониторинга с целью получения информации об их состоянии.

2. Хранение данных. Данные сохраняются в удобном формате, пригодном для дальнейшего отображения и анализа.

3. Визуализация. Визуализация предназначена для удобного отображения состояния и проведения ручного анализа динамики состояний объектов.

4. Анализ данных и построение отчетов. Данный этап подразумевает проведение автоматизированного анализа собранных данных и интерпретация его результатов.

5. Формирование оповещений. Этап предназначен для оповещения лиц, ответст-

венных за состояние объектов, о возможном нарушении планируемого состояния объектов, выявленных на предыдущем этапе.

Существующая парадигма разделения процесса управления на реактивный и про-активный подход соответствует разделению систем мониторинга на соответствующие типы [2,8].

Использование системы реактивного мониторинга предполагает получение информации о работе объектов ИТ-инфраструктуры в режиме реального времени [8]. Такой подход позволяет обнаружить множество аварийных ситуаций, прогрессирующих в системе. Диагностика и локализация ошибок производится после обнаружения неисправностей, таким образом, определяются только те инциденты, которые уже существуют в системе.

Системы проактивного мониторинга являются более совершенными [8] и позволяют прогнозировать критическое состояние систем на ранней стадии, а так же генерировать предупреждения и проводить другие корректирующие действия для предотвращения возникновения инцидентов. За счет этого системы проактивного мониторинга могут выявлять и предсказать гораздо больше проблем в ИТ-инфраструктуре, что позволяет устранять неполадки еще на этапе их зарождения и развития.

На основе концепции, описанной в ITIL можно выделить следующие основные цели системы проактивного мониторинга и управления объектов ИТ-инфраструктуры:

1. Уменьшение времени на выявление возможных инцидентов;

2. Уменьшение времени на локализацию причин появления инцидентов;

3. Уменьшение времени реагирования на возможные инциденты.

Далее предложена интерпретация тех задач, которые должны решаться с помощью системы проактивного мониторинга и управления объектами ИТ-инфраструктуры.

1. Прогнозирование временных рядов (Time series prediction).

Для анализа тенденций в состоянии объектов ИТ-инфраструктуры необходимо собрать статистическую информацию о параметрах, характеризующих их состояние. Статистическая информация представляется в виде метрик. Метрики - это показатели программной системы или физической вычислительной машины, под которой запущена система с разделением по времени. В статическом анализе метрики характеризуются как временные ряды [12]. Прогнозирование состояния объектов ИТ-инфраструктуры, выраженных с помощью временных рядов, заключается в определении будущего состояния объектов. К тому же, построение прогноза значений временного ряда является одним из основных подходов к обнаружению аномалий [13,14].

2. Обнаружение аномалий (Anomaly Detection).

Обнаружение аномалий является одной из основных задач системы проактивного управления, входящего в раздел анализа тенденций по методологии ITIL [5]. Аномалия - это участок временного ряда, на котором поведение объекта значительно отклоняется от типичного (ожидаемого) поведения [15]. Наличие данной подсистемы позволяет выявить возможные инциденты в работе объектов на ранней стадии их развития.

3. Анализ корневых причин (Root Cause Analysis).

Задача поиска корневых причин инцидентов непосредственно связана с обнаружением аномалий, но не заменяет его [16]. Некоторые методы детектирования аномалий в многомерных временных рядах могут сигнализировать только о наличии аномалии, но не способны указать, где возникло появление аномального состояния [17]. Основное назначение RCA заключается в локализации первопричины инцидента и реагировании на неё [16].

4. Выработка решений на основе прецедентов (Case-based reasoning)

При локализации причин инцидента для уменьшения времени восстановления

нормального состояния объектов ИТ-инфраструктуры требуется автоматизация деятельности администратора системы [8]. CBR является подходом, позволяющим решить новую, неизвестную задачу, используя или адаптируя решение уже известной задачи, т.е. используя уже накопленный опыт решения подобных задач [18]. В качестве прецедентов могут выступать аномальные события, которые привели к возникновению инцидентов. Наличие базы знаний инцидентов и их решений, интегрированной в систему мониторинга и управления, позволяет лицам, ответственным за работоспособность, системы быстрее реагировать на возникающие проблемы [8].

Заключение

Исследования в области предиктивного и проактивного мониторинга и управления представляют научный и практический интерес, находя применение в разных областях. Для анализа концепции проактивного мониторинга и управления в области обслуживания ИТ-инфраструктуры организаций, рассмотрены основные понятия, цели и этапы такого подхода, основываясь на методологии ITIL и трудах других исследований. Предлагается интерпретация задач, которые должны быть решены с помощью системы проактивного мониторинга и управления объектами ИТ-инфраструктуры. Определен следующий перечень последовательных задач: прогнозирование временных рядов, обнаружений аномалий, анализ корневых причин инцидентов, выработка решений на основе прецедентов.

Литература

1. Kinclaid L. R. Evolution of condition monitoring and the management of maintenance //Proceedings of International Conference on Condition Monitoring. 1987. Т. 1. С. 13-21.

2. Kothamasu R., Huang S. H., VerDuin W. H. System health monitoring and prognostics—a review of current paradigms and practices // The International Journal of Advanced Manufacturing Technology. 2006. Т. 28. № 9-10. С. 1012-1024.

3. Охтилев М. Ю., Соколов Б. В., Юсупов Р. М. Теоретические и технологические основы концепции проактивного мониторинга и управления сложными объектами // Известия Южного федерального университета. Технические науки. 2015. № 1 (162).

4. Тиханычев О.В. Об использовании принципа проактивного управления в системах поддержки принятия решений // Прикладная информатика. 2018. Т. 13. № 2 (74).

5. Steinberg R. A. et al. ITIL Service Operation 2011 Edition // TSO, London, 2011.

6. Словарь терминов ITIL на русском языке, версия 2.0, 29 июля 2011 г. на основе английской версии 1.0, 29 июля 2011. [Электронный ресурс] // ITSMF. URL: http://www.itsmforum.ru/reference/itil-glossary/ (Дата обращения: 04.12.2019)

7. Олейник А.И., ИТ-инфраструктура: учеб. метод. пособие / Олейник А.И., Сизов А.В. - М.: ИД Высшей школы экономики, 2012. 134 с.

8. Ролик А.И., Тимофеева Ю.С., Турский Н.И. Управление устранением неисправностей в ИТ-системах // Вестник НТУУ «КПИ». Информатика, управление и вычислительная техника. 2008. № 49. С. 95-108.

9. Ганеева Ж. Г. Определение понятия «мониторинг» в различных сферах его применения // Вестник Челябинского государственного университета. 2005. Т. 8. № 1.

10. Julian M. Practical Monitoring: Effective Strategies for the Real World. USA: O'Reilly Media, 2018. 151 р.

11. Дубровин М.Г., Глухих И.Н. Модели и методы проактивного мониторинга ИТ-систем // Моделирование, оптимизация и информационные технологии. 2018. Т. 6. № 1. С. 314324.

12. Белинский Н. В. Прогнозирование отказов программной системы на основе пространства метрик // Современные технологии в мировом научном пространстве. 2019. С. 11-16.

13. Jinka P., Schwartz B. Anomaly detection for monitoring: A statistical approach to time series anomaly detection. USA: O'Reilly Media, 2015. 73 р.

14. Freeman C. et al. Experimental Comparison of Online Anomaly Detection Algorithms // The 32nd International Flairs Conference. 2019.

15. Chandola V., Banerjee A., Kumar V. Anomaly detection: A survey // ACM computing surveys (CSUR). 2009. Т. 41. № 3. С. 15.

16. Silveira F., Diot C. URCA: Pulling out anomalies by their root causes // 2010 Proceedings IEEE INFOCOM. - IEEE, 2010. С. 1-9.

17. Gupta M. et al. Outlier detection for temporal data: A survey // IEEE Transactions on Knowledge and Data Engineering. 2013. Т. 26. № 9. С. 2250-2267.

18. Еремеев А.П., Варшавский П.Р. Моделирование рассуждений на основе прецедентов в интеллектуальных системах поддержки принятия решений // Искусственный интеллект и принятие решений. 2009. № 2. С. 45-57.

Сведения об авторе

Михаил Григорьевич Дубровин

асп.

ФГАОУ ВО «Тюменский государственный университет»

Тюмень, Россия

Эл. почта: [email protected]

Information about author

Mikhail Grigorevich Dubrovin

Postgraduate Tyumen State University

Tyumen, Russia

E-mail: [email protected]

УДК 004.822:81 Н.К. Николаев, А.В. Кириллович

ГРНТИ 28.23.39 Казанский федеральный университет

ИНСТРУМЕНТ НАВИГАЦИИ ПО ОБЛАКУ ЛИНГВИСТИЧЕСКИХ ОТКРЫТЫХ СВЯЗАННЫХ ДАННЫХ ДЛЯ РУССКОГО ЯЗЫКА И ЯЗЫКОВ НАРОДОВ РОССИИ

Работа посвящена адаптации RDF-браузера LodView для его использования в качестве инструмента навигации по облаку Лингвистических открытых связанных данных (LLOD) для русского языка и языков народов России. Выявлен ряд ограничений LodView, которые препятствуют такого рода использованию. Произведены доработки данного инструмента, призванные устранить обнаруженные ограничения.

Ключевые слова: LodView, RDF-браузер, Открытые связанные данные, Лингвистические открытые связанные данные

K. Nikolaev, A. Kirillovich

Kazan Federal University

NAVIGATION TOOL FOR LINGUISTIC LINKED OPEN DATA CLOUD IN RUSSIAN AND THE LANGUAGES OF RUSSIA

This paper is dedicated to using ofLodView RDF browser for navigation on the Linguistic Linked Open Data cloud in Russian and languages of Russia. We reveal several limitations of LodView, that prevents its using for this purpose. We updated the LodView for fix the recovered limitations. Keywords: LodView, RDF browser, Linked Open Data, Linguistic Linked Open Data

Введение

Языковые ресурсы используются для решения множества задач компьютерной лингвистики и автоматической обработки текста. К языковым ресурсам относятся тезаурусы, грамматические словари, фреймовые ресурсы, размеченные корпусы текстов, регистры языковых категорий и др.

Современным научным мейнстримом является интеграция лингвистических ресурсов на основе технологий Открытых связанных данных (LOD) [1, 2] в глобальном распределенном облаке Лингвистических открытых связанных данных (LLOD) [3, 4]. Данный подход имеет ряд преимуществ, включая решение проблемы синтаксической и семантической несовместимости и возможность совместного использования ресурсов для решения общей задачи.

Концепция проактивного мониторинга и управления объектами ИТ-инфраструктуры Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Михаил Григорьевич Дубровин

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Михаил Григорьевич Дубровин

CONCEPT OF PROACTIVE MONITORING AND OBJECT MANAGEMENT OF IT INFRASTRUCTURE

Текст научной работы на тему «Концепция проактивного мониторинга и управления объектами ИТ-инфраструктуры»