УДК004.031.6
АНАЛИЗ СОВРЕМЕННЫХ СИСТЕМ МОНИТОРИНГА
Т.А. Гайфулин, Д.С. Костомаров
Приведена общая классификация современных систем мониторинга. Рассмотрены основные аспекты применения и ограничения в использовании каждого типа с учетом характерных особенностей. Обозначено направление дальнейшего развития систем мониторинга в сторону самодиагностируемости и совершенствования надежности функционирования.
Ключевые слова: система мониторинга, самодиагностика, активный мониторинг, пассивный мониторинг.
На современном этапе развития человеческой деятельности важное место занимает ее всесторонний мониторинг. Суть его заключается в сборе необходимой информации и тщательном ее анализе. Регулярное проведение мониторинга обеспечивает своевременное выявление ошибок и, соответственно, их исправление в кратчайшие сроки. Но зачастую возникает ситуация, когда необходимо отслеживать состояние системы, к которой нет локального доступа. Отсутствие такого доступаможет быть вызвано как территориальной удаленностью системы, так и физическими ограничениями безопасности, поэтому возникла необходимость создания средств удаленного мониторинга.
Существующие системы мониторинга условно можно разделить на системы, реализующиеактивный и пассивный мониторинг. В данном случае под пассивным мониторингом понимается получение данных в режиме чтения, например, системы сбора данных о температуре, о загрузке процессора, о потреблении оперативной памяти.
Под активным мониторингом следует понимать мониторинг с элементами воздействия на среду (операционную систему, приложения, аппаратное обеспечение). Примеромможет служить система, которая при определенных внешних условиях или же при определенных значениях параметров выполняет корректирующее действие.
Системы мониторинга строятся по архитектуре клиент-сервер. Взаимодействиеклиента и сервера осуществляется с помощью стандартных, либо же собственныхпротоколов, а данные передаются через сети передачи данных.
Сервер хранит, использует и модифицирует текущую конфигурацию для выполнения мониторинга. Собственно, сервер проводит зондирование системы, даёт оповещения, если произошли сбои, сохраняет в своей конфигурации результаты зондирования для последующего вывода их в графическом виде. Сам по себе сервер не способен графически отображать
схему сети. Для получения графического изображения, а также некоторых видов оповещения о сбоях в системе, используется клиент.
Клиент не хранит никакой информации, кроме расположенной в оперативной памяти, т.е. предназначенной для отображения. Основное предназначение клиента - нарисовать красивую картинку и, в случае сбоев или других событий, отобразить это в клиентской консоли для удобного восприятия. Второе предназначение клиента - это графический интерфейс пользователя, предназначенный для конфигурирования сервера.
Большинство современных активных систем мониторинга IT-инфраструктуры используют одинаковый принцип:система мониторинга неким образом опрашивает оборудование или программное обеспечение, получает результат и сравнивает его либо с шаблоном, либо с заранее заданными предельно допустимыми значениями. Так, для определения доступности SMTP сервера, система мониторинга должна подключиться к серверу на 25 порт TCP, передать строку “hello my.monitoring.com” получить в ответ строку и отключиться от SMTP сервера. Далее проверить, содержит ли строка ответа сервера в начале трёхзначный код, начинающийся с цифры 2. Если это так, то сервер живой, если нет, система должна дать оповещение. Фактически, это метод сравнения по шаблону.
Другой пример - проверка загрузки процессора. Система мониторинга, чаще всего по SNMP [1], опрашивает сервер, получает значение текущей загрузки процессора, и сравнивает его с предельно допустимым максимальным значением, допустим 80. Если процессор загружен более чем на 80%, система мониторинга должна дать оповещение. Это - метод проверки предельно допустимых значений опрашиваемых величин.В любом случае, в процессе конфигурирования системы мониторинга необходимо задавать четкие критерии того, что надо считать нормальной работой оборудования или программного обеспечения, а что - сбоем, или ситуацией, которая может привести к сбою в ближайшем будущем.Такой принцип мониторинга работает в большинстве случаев. Однако, поройзадать критерии того, что считать сбоем, а что нормальной работой, слишком сложно или вообще невозможно.
Кроме вышеупомянутого SNMP, который специально былразрабо-тан для решения задач передачи данных в системах мониторин-га,практически у каждой системы мониторинга существуют и собственные реализации протоколов обмена данными, но SNMP является наиболее популярным и востребованным за счетрасширяемости и открытости интерфейса. Кроме этого, SNMP может быть использован какв активном мониторинге, так и в пассивном.
Для того, чтобы определить какой тип мониторинга стоит применять в том или ином случае необходимо рассмотреть более подробнообла-сти использования как пассивного мониторинга, так и активного.
Пассивный мониторинг. К данному классу относятся системы, которые используются для отслеживаниявозникновения неисправностей и/или нештатных ситуаций. После сбора информации с источников данных возможен ряддействий, среди которых - отображение полученной информации оператору, а в случае изменения параметров за пределы, определенные как «нормальные», принятие определенных шагов для устранения возникшей ситуации и нормализации параметров. Формат оповещения может быть разным: это и построение графиков, и генерация сообщений в приоритетном режиме для более оперативного отображения оператору и тому подобное.
Представителями подобных систем являются MRTG (MultiRouterTrafficGrapher) [2] и CACTI [3]. Неоспоримым преимуществом данных программных продуктов является их бесплатное использование. Автор MRTG создал его для контроля загруженности интерфейсов на сетевых устройствах (коммутаторы и маршрутизаторы) и, как следствие, MRTGстало популярным среди компаний, работающих в области связи. CACTI же предлагает более удобный интерфейс, но и требует большихзат-рат на установку и настройку. Однако, данные типы систем мониторинга не позволяют в режимереального времени отслеживать какие-либо показатели, но позволяют хранить статистикуи отображать ее в виде графиков.
В связи с тем, что в вычислительной системе ежесекундно случаются какие-либо события как в ОС, так и на аппаратном уровне, то в случае их незапланированного формата они должныбыть перехвачены. Например, срабатывание датчиков превышения температуры, датчиков движения, датчиков задымленности. Для отслеживания подобных событий можноис-пользовать такие системы мониторинга, как Nagios[4] и Zabbix [5]. Nagios сложен в пер-вичной настройке, но удобен при последующем использовании. Интерфейс Nagios ориентирован на наличие персонала, который следит за состоянием показателей системы. Данные поступают не в реальном времени, но время опроса элементов можно регулировать взависимости от потребностей. Удаленные системы опрашиваются посредством программных интерфейсов. Соответственно при наступлении каких-либо событий в интерфейсевыводятся соответствующие информационные сообщения. Данный программный продукториентирован именно на срабатывание определенных событий^ЬЫх имеет веб-интерфейс для администрирования и настройки. В отличие Nagios,Zabbix достаточно самостоятелен и сможет отправить уведомление на почту или sms с помощью gsm-модема, или даже попытаться самостоятельно поднять упавший сервис, выполнив заранее определенные действия.
Активный мониторинг. Активный мониторинг характеризуется тем, что на определенные события, которые происходят, существует заранее заданное действие, котороепредположительно приводит к решению возникшей проблемы. Таким образом, активный мониторинг характерен на-
личием обратной связи.Примерами таких системявляются HP OpenView [6] и IBM Tivoli [7]. Это комплексные системы, которые можно всовокуп-ности именовать интеллектуальными системами, генерирующими в зависимости отвозникновения событий активности ответные действия для восстановления требуемых показателей. В полной же мере в эту категорию попадают системы формата «умный дом»,которые активно производят мониторинг ситуации и могут совершать по заданной логикенеобходимые действия.
Кроме того, при выборе системы мониторинга следует учесть степень их защищенности от возникновения следующих критических факторов:
- отказ отдельных элементов или системы в целом;
- умышленное вредоносное воздействие на систему.
Еще одной немаловажной проблемой является то, что в таких системах чаще всего существует центральный сервер/диспетчер, который выполняет всю вычислительную нагрузку, и, в случае выхода его из строя, возникает угроза работоспособности всей системы. Способом устранения этой проблемы может являться создание самодиагностируемой системы, которая самостоятельно следила бы за состоянием своих узлов и, в случае необходимости, перераспределяла задачи вышедшего из строя узла.
Подводя итоги, можно сказать, что по мере модернизации производств, усложнения систем, увеличения доли автоматизации появляется необходимость контролировать вычислительные ресурсы. Таким образом, значимость систем мониторинга будет расти. Но с ростомроли систем мониторинга необходимо уделять большее внимание вопросам правильнойих работы и защиты. Причем это как классические ошибки (например, отказ датчиков), которыелегко диагностируются, так и умышленные воздействия для искажения результатов мониторинга или умышленный вызов отказа в обслуживании для предотвращения полученияданных системоймонито-ринга. Поэтому будет возрастать роль защиты систем удаленного мониторинга от внешних воздействий, в связи с чем стоит развивать существующие системы в сторону самодиагностики и прогнозирования возможных угроз безопасности.
Список литературы
1. A Simple Network Management Protocol (SNMP).[Электронный ре-сурс]иКЬ.: http://ru.wikipedia.org/wiki/SNMP (дата обращения 15.09.2013).
2. Shipway Steve. Using MRTG with RRDtool and Routers2. CheshireCatComputing, 2010.
3. CACTI[Электронный ресурс]http://www.cacti.net/(дата обращения
16.09.2013).
4. Josephsen David. Building a Monitoring Infrastructure with Nagios. Prentice Hall, 2007
5. OlupsRihards. Zabbix 1.8 Network Monitoring.Packt Publishing,
2010.
6. IBM Tivoli — Integrated Management software [Электронныйре-сурс] URL: http://www-01 .ibm.com/software/tivoli/solutions/ (дата обращения
17.09.2013) .
7. HPOpenView(HPOV) [Электронный ресурс]
URL:http://ru.wikipedia.org/wiki/HP OpenView (дата обращения 15.09.2013)
Гайфулин Тимур Альбертович, магистрант, timur.gayfulin@gmail.com, Россия, Тула, Тульский государственный университет,
Костомаров Денис Сергеевич, студент, denis.kostomarov@gmail.com, Россия, Тула, Тульский государственный университет.
ANALYSIS OF MODERN MONITORING SYSTEMS
T.A. Gayfulin, D.S. Kostomarov
The general classification of modern monitoring system. The main aspects of the use and limitations of each type of usewith specific characteristics.Denotes the direction of further development of monitoring systems in the direction of self-checking and improving reliability.
Key words: monitoring system, self-diagnosis, active monitoring, passive monitoring.
GayfulinTimurAlbertovich, undergraduate, timur.gayfulin@gmail.com, Russia, Tula, Tula State University
Kostomarov Denis Sergeevich, student, denis.kostomarov@gmail.com, Russia, Tula, Tula State University