ЦЕЛИ, ЗАДАЧИ И ПРОБЛЕМЫ СИСТЕМ МОНИТОРИНГА НА ЖЕЛЕЗНОДОРОЖНОМ ТРАНСПОРТЕ
В.В. Венгеров
Ростовский государственный университет путей сообщения, г. Ростов-на-Дону, Россия
В настоящее время в связи с широким развитием информационных систем и вычислительной техники на
железнодорожном транспорте (ж.д.т.) возникает необходимость контроля, диагностики и мониторинга работы вычислительных систем, сетей и комплексов, применяемых на ж.д.т.
Рассмотрим данную проблему на примере Ростовского информационно-вычисли-тельного центра (РИВЦ).
Работа Ростовского информационно-вычислительного центра (РИВЦ) ОАО «РЖД» заключается в сопровождении ряда дорожных информационных систем (ИС), а также оборудования, на котором они работают. Все оборудование РИВЦ делится на два комплекса:
- ЦВК (центральный вычислительный
комплекс), состоящий из трех мейнфреймов ІВМ е8єгіє8, 6 дисковых массивов ЕМС 8утте1хіх и 12 аналого-цифровых печатающих устройств (АЦПУ).
Характеристики мейнфреймов: от 2 до 4 центральных процессоров, от 8 до 32 Гб ОЗУ.
- Группа серверов НР (150 шт.)
различной модификации с хранилищами данных НР ЕУА. Характеристики серверов: от 1 до 4 центральных процессоров, от 1 до 8 Гб ОЗУ, от 36 Гб до 1 Тб дискового пространства. Также в настоящее время с целью экономии аппаратных ресурсов серверов применяется концепция
виртуализации (несколько виртуальных серверов на одном физическом) и концепция централизованного мониторинга.
Сопровождение данных комплексов заключается в обеспечении их непрерывной работы по схеме «24*7*365».
Приведем определения контроля,
диагностики и мониторинга вычислительных систем.
Контроль - процесс определения, оценки и сбора информации об отклонениях действительных показателей работы вычислительной системы от требуемых.
Диагностика - процесс распознавания
неисправности и обозначение ее с
использованием принятой технической
терминологии, а также процесс распознавания и оценки свойств,
особенностей и состояний системы,
заключающийся в целенаправленном
исследовании, истолковании полученных результатов и их обобщении в виде заключения (протокола).
Мониторинг - специально
организованное, систематическое
наблюдение за состоянием объектов, явлений, процессов в системе с целью их оценки, контроля или прогноза,
а также сбора статистики по работе системы.
Мониторинг, необходимый для
вычислительных систем ж.д.т., должен включать
в себя мониторинг трафика между системами, а также системами и внешними сетями передачи данных, мониторинг
загрузки системных ресурсов аппаратуры (жесткие диски, оперативная память,
процессорное время). Основной целью выполнения такого мониторинга является
рациональное распределение системных ресурсов (аппаратных) между
информационными системами ж.д.т., т. е. администрирование вычислительной
техники.
Объектами мониторинга на ж.д.т. являются серверы, на которых выполняются задачи информационных систем ж.д.т. Необходимо учитывать, что ресурсы,
потребляемые информационной системой, зависят от задач, входящих в ее
программный комплекс. Также объектами мониторинга являются удаленные серверы, находящиеся не
в ИВЦ, а на удаленных подразделениях дороги (станции, пункты и т. д.). В последнем случае необходим тщательный мониторинг трафика между такими
серверами и ИВЦ.
Приведем перечень информационных систем, входящих в комплекс АСУЖТ, и дадим понятие АСУЖТ.
АСУЖТ - человеко-машинная система, обеспечивающая эффективное
функционирование систем, в которых сбор и переработка информации, необходимой для различных функций управления,
осуществляется с применением средств автоматизации и вычислительной техники. Система, являющаяся частью АСУ,
выделенной по определенному признаку, называется подсистемой АСУ.
В АСУЖТ выделяют 18 основных глобальных подсистем, которые
ориентированы на определенный объект управления.
Среди этих подсистем можно выделить 3 основные группы:
- межотраслевые подсистемы, которые выполняют неспецифические функции для железнодорожного транспорта;
- выполняющие специфические функции управления для железнодорожного транспорта (эксплуатационная работа);
- выполняющие функции, связанные с эксплуатацией железных дорог.
В комплекс АСУЖТ входят такие информационные системы, как СИРИУС (Сетевая интегрированная российская информационно-управляющая система), АСОУП (автоматизированная система оперативного управления перевозками), АСУ ведения учета и анализа ГИД УРАЛ ВНИИЖТ, система автоматической
идентификации данных САИД ПАЛЬМА, ДИСКОР, АСУСС (автоматизированная система управления сортировочной
станцией), ДИСКОНТ (автоматизированная система управления контейнерными
перевозками), ДИСПАРК
(автоматизированная система управления вагонными парками), Экспресс, ОСКАР-М и ряд других.
В настоящее время в большинстве российских компаний задачи мониторинга и управления 1Т-инфраструктурой
выполняются с помощью набора разнородных программных средств, каждое их которых охватывает лишь строго определенную часть ^-инфраструктуры. Использование большого количества
программных средств различных
производителей ПО (в том числе разработанного самостоятельно) приводит к возрастанию сложности и увеличению трудозатрат на поддержание
работоспособности аппаратного и программного обеспечения ГГ-
инфраструктуры. Причинами возникшей ситуации являются неоднородность
используемого ПО, отсутствие
централизации собираемой информации, а также сложность поддержки
функционирования используемого ПО.
Наряду с этим, рост распределенности и гетерогенности ГГ-инфраструктуры
неизбежно сопровождается увеличением
сложности процедур мониторинга и
управления различными компонентами IT-инфраструктуры. Эта тенденция, в свою очередь, значительно увеличила время, которое сотрудники службы технической поддержки выделяют на выполнение
операций мониторинга и поддержки работоспособности компонентов
инфраструктуры. Сложившаяся ситуация требует внедрения организационных и технических решений, позволяющих
централизовать функции мониторинга и управления различными компонентами IT-инфраструктуры,
а также автоматизировать рутинные
операции по поддержке функционирования
объектов IT-инфраструктуры, выполняемые сотрудниками службы технической
поддержки.
Рассмотрим две наиболее широко применяемые системы мониторинга
программных и аппаратных средств на ж.д.т.: IBM Tivoli Monitoring и WhatsUp.
IBM Tivoli Monitoring применяется для построения комплексной системы,
реализующей функции централизованного мониторинга и управления разнородными объектами IT-инфраструктуры. Компания IBM - технологический лидер в области ПО для построения комплексных систем управления IT-инфраструктурой, что определяет использование передовых технологий при разработке и внедрении ПО.
Ipswitch WhatsUp является
высококачественным средством мониторинга сети и позволяет администраторам сети оценивать работоспособность и
производительность отдельных устройств и систем. Для представления данных, собранных в ходе мониторинга, специалисты могут использовать любой из полусотни графических или текстовых отчетов. WhatsUp позволяет сотрудникам IT-подразделений точнее представить процессы, происходящие в корпоративной сети, и эффективно управлять ею для обеспечения максимального уровня доступности жизненно важных сетевых служб.
Общим недостатком перечисленных выше средств мониторинга является недостаточная универсальность при работе на различных платформах, а также недостаточная функциональность при использовании платформы Windows.
Также проблемой применяющихся систем мониторинга является неполнота
выдаваемых системой отчетов и несовершенство методов ведения статистики.
В настоящий момент для качественной диагностики и мониторинга систем АСУЖТ требуется более универсальная система мониторинга, в основу алгоритма работы которой должен быть заложен качественный математический аппарат.
Необходимо провести тщательный анализ существующих методов диагностики, выбрать наиболее существенные показатели мониторинга и оптимальные методы
контроля и диагностики, на основании которых разработать алгоритм работы и схему системы мониторинга с необходимыми на сегодняшний день требованиями.