Научная статья на тему 'Методика построения правил выбора организационно-технических мероприятий при управлении работоспособностью сети передачи данных'

Методика построения правил выбора организационно-технических мероприятий при управлении работоспособностью сети передачи данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
83
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЕТЬ / ПЕРЕДАЧА ДАННЫХ / АВТОМАТИЗИРОВАННАЯ СИСТЕМА ДИСПЕТЧЕРСКОГО УПРАВЛЕНИЯ / ОРГАНИЗАЦИОННО-ТЕХНИЧЕСКИЕ МЕРОПРИЯТИЯ / РАБОТОСПОСОБНОСТЬ / ОШИБКА / ПРАВИЛА / NETWORK / DATA TRANSMISSION / AN AUTOMATED SYSTEM OF DISPATCHING MANAGEMENT / ORGANIZATIONAL AND TECHNICAL MEASURES / EFFICIENCY / ERROR / RULE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Крутолапов А. С., Поляков А. С.

Предложена методика выбора организационно-технических мероприятий по устранению нарушений в функционировании сети передачи данных автоматизированной системы диспетчерского управления средствами пожарной сигнализации и пожаротушения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHODOLOGY OF ELABORATION OF RULES OF SELECTION OF ORGANIZATIONAL AND TECHNICAL MEASURES IN PERFORMANCE DATA NETWORK CONTROL

The methodology of selection of organizational and technical measures to eliminate violations in the operation of data networks automated dispatch control of fire alarm and extinguishing systems is offered.

Текст научной работы на тему «Методика построения правил выбора организационно-технических мероприятий при управлении работоспособностью сети передачи данных»

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ, КОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ В ТЕОРИИ УПРАВЛЕНИЯ СЛОЖНЫХ ПРОЦЕССОВ

МЕТОДИКА ПОСТРОЕНИЯ ПРАВИЛ ВЫБОРА ОРГАНИЗАЦИОННО-ТЕХНИЧЕСКИХ МЕРОПРИЯТИЙ ПРИ УПРАВЛЕНИИ РАБОТОСПОСОБНОСТЬЮ СЕТИ ПЕРЕДАЧИ ДАННЫХ

А.С. Крутолапов, кандидат технических наук, доцент; А.С. Поляков, доктор технических наук, профессор, заслуженный деятель науки РФ.

Санкт-Петербургский университет ГПС МЧС России

Предложена методика выбора организационно-технических мероприятий по устранению нарушений в функционировании сети передачи данных автоматизированной системы диспетчерского управления средствами пожарной сигнализации и пожаротушения.

Ключевые слова: сеть, передача данных, автоматизированная система диспетчерского управления, организационно-технические мероприятия, работоспособность, ошибка, правила

METHODOLOGY OF ELABORATION OF RULES OF SELECTION OF ORGANIZATIONAL AND TECHNICAL MEASURES IN PERFORMANCE DATA NETWORK CONTROL

A.S. Krutolapov; A.S. Poliakov.

Saint-Petersburg university of State fire service EMERCOM of Russia

The methodology of selection of organizational and technical measures to eliminate violations in the operation of data networks automated dispatch control of fire alarm and extinguishing systems is offered.

Key words: network, data transmission, an automated system of dispatching management, organizational and technical measures, efficiency, error, rule

Классификация состояний сети и организационно-технических мероприятий

Современные автоматизированные системы диспетчерского управления построены в виде распределенных систем, базирующихся на сетях передачи данных (СПД), в ходе эксплуатации которых могут возникать различные нарушения работы их устройств, делающие сеть неработоспособной. Для возвращения сети в режим штатного

функционирования обслуживающий персонал должен провести определенные организационно-технические мероприятия (ОТМ). Для повышения оперативности принятия мер, способных вернуть СПД в режим штатного функционирования, необходимо проведение ее мониторинга с целью выявления ее состояния.

Классификация состояний сети и возможные организационно-технические мероприятия приведены в таблице.

Таблица

Множество составляющих сети Наименование группы проблем Конкретный признак некорректной работы Возможные ОТМ

С Отказ канала Через отрезок линии связи не проходят пакеты данных Замена, проверка соединения

Ненадёжность канала Превышенное количество ошибочных пакетов данных Замена, перепланировка, устранение источника деформации

S Недостоверная передача Превышение порога ошибок CRC, допустимого числа коллизий, ошибок длины кадра Перенастройка, переконфигурация, замена сетевого оборудования сегмента

Некорректное кадрирование Превышено допустимое количество ошибок кадрирования Перенастройка, переконфигурация, замена сетевого оборудования сегмента

Превышение диаметра Проявление ошибки позднего конфликта Удаление, замена оборудования, разбиение на несколько сегментов, иное изменение структуры сегмента

Потеря кадров Ошибка затянувшегося кадра Перенастройка, замена сетевого оборудования сегмента

Недоступность узла В узел не поступают кадры Перенастройка, переконфигурация, замена сетевого оборудования сегмента

L Любая проблема в сети Некорректная работа участка сети Произвести поиск признаков некорректной работы компонентов сети

TD, E Отказ Прекращается обработка поступающих пакетов Замена, переконфигурация

Высокая задержка реакции Превышены допустимые временные нормы к обработке данных Перенастройка, замена, переконфигурация

Некорректная работа Уровень ошибок на выходе выше, чем на входе Перенастройка, замена, переконфигурация

Можно выделить следующие проблемные ситуации, возникающие на канальном уровне передачи данных.

Проблемные ситуации неоднозначны и требуют классификации. Они зависят от типа сетевой составляющей. Если рассматривать диагностику сети с позиции протокола передачи данных, то точки контроля, имеющие доступ к контролируемым признакам, не располагаются на сетевых составляющих, относящихся к множеству каналов связи С. Однако проблему в составляющей сети множества С можно косвенно выявить, считав значение признаков прилегающих устройств.

Проблема отказа канала возникает, когда до сетевого устройства на одном конце отрезка линии связи не доходят пакеты данных в течение определённого промежутка времени от сетевого устройства на другом конце отрезка линии связи. В данном случае проблема заключена в канале передачи данных, который должен быть заменён.

Проблема ненадёжности канала возникает, когда сетевое устройство принимает превышенное количество пакетов с ошибками. В данном случае около канала может располагаться сильный источник электромагнитного поля, искажающий информацию, который должен быть определённым образом удалён от канала. Канал может быть повреждён или подвергнут превышенной степени деформации. В первом случае можно заменить канал, а во втором, помимо замены, можно попытаться решить проблему, устранив источник деформации.

Проблемы, касающиеся множества сетевых сегментов S, обычно вытекают из коллизий. В случаях возникновения коллизии, совпадающей с определённым сегментом, информация становится непригодной для использования.

Коммутаторы, объединяющие множества S, должны учитывать ошибки передачи кадров в сегментах на канальном уровне.

Коллизия недостоверной передачи имеет место в случае превышения лимита следующих ошибок канального уровня:

1. Ошибка CRC (циклический избыточный код (англ. Cyclic redundancy code)). При проверке контрольной суммы в данном случае выявляется ошибка. Если превышен порог CRC в течение промежутка времени, то можно констатировать проблему недостоверной передачи.

2. Превышение допустимого числа коллизий при посылке определённого кадра.

3. Ошибка длины. Превышенное количество кадров неожидаемой длины указывает на недостоверную передачу.

Проблема некорректного кадрирования возникает при превышенном количестве ошибок кадрирования (когда число бит не кратно 8).

Проблема превышения диаметра сегмента может возникнуть при проявлении ошибки позднего конфликта, когда коллизии обнаруживаются после 512 бита. Обычно это говорит о превышении диаметра сети или её фрагмента. Данная ошибка может указывать на превышение допустимых размеров сети, что также является отдельной проблемой.

Превышенное количество ошибок затянувшегося кадра указывает на наличие проблемы потери кадров.

В сегменте также можно выделить проблемы недоступности узлов. Это говорит о проблемах в каналах передачи или самом узле.

Одним из способов решения проблем в сетевом сегменте является уменьшение области коллизии путём деления на подсегменты добавлением коммутаторов. Подобного рода мероприятия можно отнести к расширению сети.

Для решения проблем, касающихся составляющих сети множества S, а также для выработки ОТМ для компонентов сегмента требуется детальный анализ составляющих проблемного сетевого сегмента.

Проблемы, касающиеся множества сетевых составляющих L, учитываются маршрутизаторами. Протокол ICMP (англ. Internet Control Message Protocol - протокол межсетевых управляющих сообщений) управляет передачей управляющих и диагностических сообщений между маршрутизаторами, определяя доступность и способность к ответу абонентов-адресатов, назначение пакетов, работоспособность

маршрутизаторов и так далее. При возникновении ошибки маршрутизатором отправляется ICMP пакет данных. Если определённый маршрутизатор часто отправляет ICMP пакеты данных, то это указывает на некорректное функционирование соответствующей подсети.

Существует группа проблем, относящихся к некорректной работе участка сети и конкретных её составляющих.

Для решения проблем, касающихся составляющих сети множества L, а также для выработки ОТМ требуется детальный анализ составляющих ее проблемной части.

О проблемах, относящихся к множеству составляющих TD и E, можно судить по статистике, собираемой протоколом SNMP (англ. Simple Network Management Protocol -простой протокол управления сетями) для каждого устройства.

Проблема отказа экземпляра оборудования возникает, когда устройство перестаёт обрабатывать приходящие к нему пакеты. В данном случае устройство следует заменить.

Проблема медленной работы экземпляра оборудования возникает, когда превышены допустимые временные нормы обслуживания пакетов конкретным устройством. Проблема может решиться заменой устройства, переконфигурацией фрагмента сети или перенастройкой устройства.

Проблема некорректной работы экземпляра оборудования возникает при искажении информации устройством (превышении допустимого уровня ошибок на выходе при условии корректности информации на входе устройства). Проблема может решиться заменой устройства, переконфигурацией фрагмента сети или перенастройкой устройства.

Описанные проблемы отрицательно влияют на производительность сети в целом. Необходимо выявить существующие в сети проблемы, локализовать их, и из имеющихся вариантов их решения составить комплекс ОТМ для возврата корректного функционирования сети передачи данных.

Схема задания правил и связанных с ними понятий

Работоспособное состояние сети описывает штатный режим её функционирования. Оно описывается обслуживающим персоналом. Однако проблемных ситуаций может быть достаточно много, причём каждая ситуация может характеризоваться огромным числом контролируемых признаков. Учесть это самостоятельно обслуживающий персонал не сможет. Поэтому при возникновении в сети неизвестной проблемной ситуации происходит её фиксация для дальнейшего исследования и обработки обслуживающим персоналом [1, 2].

Общий вид правила выбора организационно-технических мероприятий:

СРЛТ ^ А1 V А2 V... V Ат, А, = ап(^1 )Л...Л (г ), Г. е Т,

где СР - имя проблемной ситуации; Т - множество компонентов сети, создавших нештатную ситуацию (Т с ТВ и Е и С ), для которых явно определены ОТМ; А. - конкретный комплекс ОТМ над компонентами Т, способный привести сеть в режим штатного функционирования; а- конкретное ОТМ комплекса . над компонентом сети, относящимся к типу сетевой составляющей V, - количество мероприятий в комплексе I; I - тип конкретного сетевого компонента.

Схема задания ситуационных правил и правил выбора ОТМ представлена на рисунке.

Рис. Схема задания ситуационных правил и правил выбора организационно-технических мероприятий и связанных с ними понятий

После считывания с помощью точек контроля составляющих сети значений контролируемых признаков, начинается поиск среди хранимых ситуационных правил того правила, которое позволит идентифицировать проблему. Происходит поиск такого ситуационного правила, значения контролируемых признаков которого соответствуют ограничениям левой части правила. В этом случае наименование состояния сети берётся из правой части ситуационного правила.

В результате анализа значений контролируемых признаков составных частей сети может выясниться, что она не находится в работоспособном состоянии, причём данное состояние является неизвестным.

Если при анализе работы сети будет выявлено состояние, характеристики которого не описаны среди хранимых правил и состояний, то оно сохраняется и выдаётся для исследования. Обслуживающий персонал описывает новое состояние, формируя новые ситуационные правила и его наименование. Ситуационные правила составляются следующим образом:

- отыскиваются контролируемые признаки, значения которых имеют отклонения от тех параметров, которые указаны в ситуационном правиле, описывающем работоспособное состояние сети;

- значения контролируемых признаков группируются по проблемам;

- каждой проблеме присваивается имя.

Новые ситуационные правила добавляются к хранимым правилам и состояниям сети.

Затем происходит выявление альтернатив ОТМ, которые применяются в данной ситуации к каждому типу составляющих сети. Для этого нужно выполнить следующие действия:

1) используя новое ситуационное правило, найти объект, нарушающий функционирование СПД;

2) для каждой конкретной проблемной составляющей необходимо предложить ОТМ, способные решить проблему;

3) найти такие комплексы ОТМ, которые возвращают сеть в состояние корректного функционирования;

4) на основе наименований мероприятий выявленных комплексов и наименования текущей проблемы создать новое правило выбора ОТМ и добавить его к хранимым правилам;

5) повторить действия 1-4 для каждой дополнительно выявленной проблемной ситуации.

Выявление проблемной составляющей при поиске объекта, нарушающего функционирование СПД, производится с помощью нового ситуационного правила. Условия из левой части ситуационного правила и будут являться информацией, необходимой для локализации проблемы.

Происходит анализ комплексов ОТМ. В данном случае анализируется работа сети, к которой применён данный комплекс. Если сеть по показаниям значений признаков находится в работоспособном состоянии, то текущий комплекс ОТМ фиксируется.

Приоритетность предложенных вариантов комплексов ОТМ, способных вернуть сеть в режим штатного функционирования, выбирается с помощью экспертизы.

При анализе комплексов ОТМ для объектов, нарушающих функционирование сети, производится их сочетание. Мероприятия, способные решить проблему, добавляются к правилам выбора. Правила создаются посредством экспертизы, так как обслуживающий сеть персонал имеет наилучшее представление о том, как описать конкретное состояние сети и как оперативно устранить конкретный сбой в работе сети.

Литература

1. Еремеев А.П., Башлыков А. А. Экспертные системы поддержки принятия решений в энергетике. М.: МЭИ, 1994. 216 с.

2. Лысков О.Э., Константинов И.С. Методика задания правил для системы технической поддержки функционирования корпоративной сети // Известия. Орёл ГТУ. Сер.: Фундаментальные и прикладные проблемы техники и технологии: информационные системы и технологии. 2007. № 4/268(535). С. 301-305.

i Надоели баннеры? Вы всегда можете отключить рекламу.