Научная статья на тему 'МЕТОД ОЦЕНКИ ОТКАЗОУСТОЙЧИВОСТИ ЛОКАЛЬНОЙ СЕТИ НА ЭТАПЕ ЕЕ ПРОЕКТИРОВАНИЯ'

МЕТОД ОЦЕНКИ ОТКАЗОУСТОЙЧИВОСТИ ЛОКАЛЬНОЙ СЕТИ НА ЭТАПЕ ЕЕ ПРОЕКТИРОВАНИЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
80
19
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПРЕДЕЛЕННАЯ ВЫЧИСЛИТЕЛЬНАЯ СИСТЕМА / ВЕРОЯТНОСТЬ СРЫВА / СИСТЕМЫ МАССОВОГО ОБСЛУЖИВАНИЯ / СТАТИСТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Сотников Александр Васильевич

Приведены результаты исследования вероятностных характеристик отказоустойчивости распределенной вычислительной системы авиатренажера. Построена адекватная математическая модель локальной сети. Проведено аналитическое исследование вероятности срыва в распределенной системе с использованием методов теории массового обслуживания. Представлены результаты имитационного моделирования системы на ЭВМ.The study results of the probability characteristics of the fault-tolerance of the flight simulator distributed computing system have been presented. An adequate mathematical model of the local network has been built. The fault probability in the distributed system has been analytically studied using the queuing theory methods. The results of the computer simulation modeling have been presented.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Сотников Александр Васильевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «МЕТОД ОЦЕНКИ ОТКАЗОУСТОЙЧИВОСТИ ЛОКАЛЬНОЙ СЕТИ НА ЭТАПЕ ЕЕ ПРОЕКТИРОВАНИЯ»

УДК [53.072:004.732] :629.73

Метод оценки отказоустойчивости локальной сети на этапе ее проектирования

А.В.Сотников

Московский государственный институт электронной техники (технический университет)

Приведены результаты исследования вероятностных характеристик отказоустойчивости распределенной вычислительной системы авиатренажера. Построена адекватная математическая модель локальной сети. Проведено аналитическое исследование вероятности срыва в распределенной системе с использованием методов теории массового обслуживания. Представлены результаты имитационного моделирования системы на ЭВМ.

Исследование систем массового обслуживания (СМО) - специального класса математических моделей - представляет интерес при анализе функционирования таких сложных систем, как авиационные тренажеры, имеющие архитектуру промышленных локальных сетей, построенных на базе современных микроконтроллеров. В связи с назначением авиатренажера как модели реального самолета в различных условиях полета одним из основных требований к сети является быстродействие, достаточное для обеспечения заданного времени реакции системы на сигналы от различных устройств внут-рикабинного пространства (ручка управления двигателем, ручка управления самолетом, тумблеры и пр.). В процессе разработки подобных систем требуется определить: может ли сеть с данной пропускной способностью обеспечить работу авиатренажера в реальном масштабе времени.

Постановка задачи. Система содержит (рис.1) г узлов, включенных в сеть, которые генерируют потоки сообщений (пакетов) с ин-тенсивностями аг и приоритетами г (г = 1,...,г). Сообщения принимаются и обрабатываются мастер-устройством М. В любой момент времени только один узел передает сообщение, остальные ждут своей очереди. Передача сообщения не прерывается появлением пакета более высокого приоритета. Если хотя бы одно сообщение ожидает отправки дольше т, то происходит срыв (отказ системы). Необходимо определить минимальную пропускную способность канала, гарантирующую безотказную работу системы.

Полученная информация позволит выбрать подходящую скорость работы канала на стадии проектирования локальной сети авиатренажера.

Описание математической модели. С точки зрения теории массового обслуживания задачу можно свести к вероятностному исследованию характеристик одноканаль-ной приоритетной СМО с пуассоновскими входящими потоками требований. В частности, можно определить максимальное время обслуживания одного требования (или минимальную скорость сети), при котором для вероятности срыва за время Т выполняется неравенство:

Рср(Т) < 8, где 8 > 0.

© А.В.Сотников, 2009

Выбор конкретной СМО, представляющей математическую модель реальной системы, определяется характером протекающих в ней случайных процессов.

Рассмотрим одноканальную систему обслуживания, в которую поступают г независимых пуассоновских потоков требований [1] с интенсивностями а1,а2,...,аг соответственно. Длительности обслуживания требований - независимые в совокупности случайные величины, стохастически эквивалентные для требований /-го потока случайной величине В/, имеющей функцию распределения В/ (х) = Р(В/ < х) и плотность распределения Ь (х).

Требования /-го потока имеют более высокий приоритет, чем требования '-го потока при / < '. Рассмотрим относительный приоритет: прерывания обслуживания не допускаются, после окончания обслуживания следующим на прибор из очереди выбирается требование наивысшего приоритета. Требования одного приоритета обслуживаются в порядке поступления (дисциплина обслуживания БШО).

Анализ ограничений, налагаемых на время ожидания и на максимальную длину очереди, приводит к выводу, что имеем дело с системой с ожиданием. При этом, задав различные ограничения на ожидание, можно рассматривать системы следующих типов:

- чистая система с ожиданием (без ограничений);

- система смешанного типа с ограничением по времени ожидания (срыв наступает при превышении каким-либо требованием максимального времени пребывания в очереди);

- система смешанного типа с ограничением по длине очереди (срыв означает появление нового требования в момент, когда все места ожидания заняты);

- система смешанного типа с ограничением по времени ожидания и по длине очереди (срыв происходит при наступлении одного из двух указанных выше событий).

Заметим, что на интервале времени безотказной работы системы всех четырех типов эквивалентны. Поэтому в рамках поставленной задачи каждую из них можно рассматривать как чистую систему с ожиданием, работающую до первого срыва (понятие срыва определяется уже в соответствии с типом системы).

Используя обозначения, принятые для СМО [2], данную систему можно классифицировать как Мг / Ог /1/ да в случае, если число мест ожидания (длина очереди) не ограничено, или как Мг /Ог /1/m, если длина очереди ограничена числом m. Приоритет относительный.

Исследование системы аналитическими методами. Длина сообщения приоритета / может быть как фиксированной для каждого потока, так и случайной величиной. Пусть V - скорость сети (пропускная способность канала), В/ = / V - время обслуживания (время передачи сообщения), Ъ/ - плотность потока обслуженных требований приоритета /. Тогда

1 = М[В/ ] = -М [I/ ]. (1)

Ъ V

Вероятность срыва определяется параметрами Ъ/, каждый из которых зависит от V в силу (1). Выразив вероятность срыва через Ъь получим зависимость Рср (^^Х...Ъг (V)).

Задав некоторое 8 > 0 и рассматривая вероятность срыва за фиксированное время Т как функцию скорости сети, приходим к задаче поиска минимальной V, при которой Рср (V) < 8. В силу монотонности функции Рср (V) это значение единственно и является

решением уравнения Рср (V) = 8.

Для определения вероятности срыва исследуем одну из вероятностных характеристик системы Щ (^) - виртуальное время ожидания в момент времени I для требований

приоритета к - время, которое пройдет до начала обслуживания требования приоритета к, если его поместить в систему в момент t. Введем понятие «плохого» требования. Назовем поступившее требование приоритета / «плохим», если его время ожидания обслуживания превышает ¿т/. Появление «плохого» требования означает срыв (отказ) системы. Поскольку интерес представляет время безотказной работы системы (т.е. время до первого появления «плохого» требования) и не имеет значения, что происходило с ней после срыва, можно считать, что срыв приводит к аварийной остановке системы (на практике этого не происходит).

Вероятность срыва за промежуток времени [0, Т) есть вероятность того, что к моменту Т поступит «плохое» требование (приоритета /, / = 1, г ). Эта вероятность как вероятность суммы несовместных событий А/ (появление «плохого» требования приоритета / к моменту Т) равна сумме вероятностей поступления «плохого» требования каждого приоритета [1]. Таким образом, при фиксированной скорости V

Рср (Т) = р[^А ] = £р( А).

V/=1 ) /=1

Вероятности, стоящие под знаком суммы, определяются из следующих соображений. Разобьем интервал [0, Т) на малые промежутки {1к, tk + Atk), к = 0, п -1,

^ = 0, tn_

-1 + ^п-1 = Т . Появление «плохого» требования приоритета / за время Т означает наступление одного из несовместных событий - появление «плохого» требования приоритета / в момент, лежащий в пределах [^, tk + Atk), т. е.

Р( А) = Р&Ак1 = ¿Р( А/. ). (2)

V к=1 ) к=1

Событие Агк состоит в одновременном наступлении двух событий: требование поступило в момент к е [}к, tk + Atk); оно оказалось «плохим».

Вычислим первую вероятность. В силу стационарности пуассоновского потока событий она не зависит от tk, а определяется только длиной Atk и равна 1 - е а Ак . При

малых Atk можем записать: е а Ак - 1 - а/ Atk, пренебрегая членами более высокого порядка малости. Следовательно, первая вероятность равна а{Atk .

Вторая вероятность для требования приоритета /, поступившего в момент к, равна 1 - (^к, tmi), где (^ х) = Р(Щ^) < х), т.е. функция распределения случайной величины Ж(). На малом интервале [/к, /к + Atk ) вероятность Щ (£,к, tmi) приближенно считаем постоянной (т.е. не зависящей от выбора е [tk,tk + Atk)).

Перемножив полученные вероятности, найдем вероятность события А/к :

Р(а. ) - (1 - Щ (£к, т ))а,. Atk.

Учитывая (2), получаем:

Р(А,) (1 - Ж, П))а,Мк. (3)

к=1

Переходя к пределу интегральных сумм (3) при п ^ да, найдем Р(А,) :

Т Т ( Т \

Р(А,) = ](1 - Ж,(,ПУР^ = а,|(1 - Ж,(,= а, Т -¡Ж,(1,^

о о V о

Функция распределения Жк (/, х) виртуального времени ожидания ищется в виде преобразования Лапласа-Стилтьеса юк (5,1) [3], которое позволяет перейти от системы дифференциальных уравнений к системе алгебраических. Для нахождения юк (5,1) используют метод введения дополнительного события [2].

да

Пусть юк(5,() = Ме 5Жк() = ]е 5ХЖ'(1,х)ёх = 5¡е 5ХЖк(Г, х)ёх - преобразование Лап-

0 о

ласа-Стилтьеса функции Жк (/, х). Выражение для него известно из теории массового обслуживания [2] и определяется формулой

% (5,1) = е-к (5)1 {1 - цк (5)}р,(х)е"-к (5)хё:х - Е [1 - ру (цк (5))]]] (х)е"-к (5)^х \

У 0 }=к+1 0

где -к(5) =5 - ак + акРк (ц к(5)); ц к(5) =5 + о к-1- ок-1п к-l(5), Ц1(5) =5; пк-1(5) - преобразование Лапласа-Стилтьеса функции распределения Пк-1-периода ( Пк-1(х) ), которое определяется из функционального уравнения:

к-1

°к-1пк-1(5)=Е а,р,(5+о к-1- °к-1п к-1(5)х

г=1

да да

а преобразования Лапласа р0(д) = ]е~дхР0(х)ёх и р^(д) = ]е~дхР^(х)ёх определяются из

00

рекуррентных соотношений:

( ) + ^ 1 - р] (Цк+1(д)) ( ) -1 ( ) к 0— (4)

Р0 (д) + е —'—Тл—р^ Т=ц-+1 (q), к=0, г. (4)

}=к+1 ц к+1(д)

Существование стационарного предела Жк (/) ( к = 1, г) при / ^ да гарантируется выполнением неравенства:

г

^ а, Рк1 <

Е акРк1 <1

к=1

где Рк1 - первый начальный момент длительности обслуживания Вк .

да

Пример. Рассмотрим систему с конкретным распределением длительности обслуживания. Пусть время обслуживания требования приоритета к ( к = 1, г ) показательное с функцией распределения Бк (х) = 1 - е ЬкХ, преобразование Лапласа-Стилтьеса которой рк (5) = —Ьк—, тогда

5 + Ьк

¥к(5) = 5 - ак +—ТгЧг' Цк(5) = 5 + Ок-1 - Ок-1пк-1(5Х Ц1(5) = 5

ц к(5) + Ьк

а функциональное уравнение для Пк-1 (5) будет меть вид

к-1

_аЬ

Ок-1Пк-1(5) = V-—-

^5+о к-1- °к-1П к-1(5)+Ь

Если все параметры распределения времени обслуживания одинаковы: Ь, = Ь, то

5 + О к-1 + Ь - У (5 + О к-1 + Ь)2 - 4Ок-1Ь

Пк-1(5)=■

к-1

Цк(5) =1 (5 + Ок-1 -Ь +) •

2

Найдем Ро(х)иР](х). Преобразования Лапласа ро(д) и р](д) определяются из рекуррентных соотношений (4) при к = г:

Ро(д) = —) =-, 2 2 , ог = о

цг+1(д) д + сг -Ь +у(д +сг + Ь)2 -4огЬ

( 1 Л г _

Рк+1(д) = —(— - Ро(д) рк+1(д)+Ь)- V Р] ^ к =0'г -1 ц к+1(д)

V г

]=к+2

Ро( х) = П\ро(д)) = 1 + |е"(О г),

о

Рк+1( х) = ¿"1(ц к+1(д) + Ь)= 8(Г )(1 + Ок + Ь) +£°Ье-(а к +Ь)1Р1(2л-ОкЬг),

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где ./у (г) - функция Бесселя 1-го рода.

Полученные формулы справедливы для СМО с произвольным распределением времени обслуживания, описывающих широкий класс реальных систем. Однако их использование для поиска характеристик конкретной СМО может вызвать затруднения из-за необходимости решать функциональное уравнение для пк-1(5), сложность которого зависит от количества приоритетов г и вида функции Рк (5), а также в связи с поиском обратного преобразования Лапласа от функции юк (х, 5), успешность которого (возможность получения аналитического выражения в явном виде) зависит от самого образа.

Даже для таких простых и хорошо изученных типов систем, как марковские СМО [2, 4], в которых время обслуживания требований показательное, окончательные выражения довольно громоздки и требуют вычисления сложных интегралов от специальных функций. Поэтому на практике, когда абсолютной точности не требуется, можно

воспользоваться более доступным и гибким методом исследования конкретной СМО -статистическим моделированием работы системы на компьютере.

Статистическое моделирование СМО. Моделирование СМО сводится к получению реализаций случайных величин с показательным распределением и подсчету среднего времени ожидания в очереди в момент I и вероятности срыва за время Т [5, 6]. Проводя моделирование N раз по независимым последовательностям случайных чисел, можно оценить характеристики системы.

Компьютерное моделирование работы системы производилось в среде МайаЬ. Написана программа, в которой реализован моделирующий алгоритм. Для эксперимента выбрана система со следующими параметрами:

• число приоритетов: г = 5;

• входящие потоки требований - пуассоновские с интенсивностями:

а1 = 1/0,0667, а2 = 1/0,0668, а3 = 1/0,0669, а4 = 1/0,0670, а5 = 1/0,0671;

• максимальные времена ожидания = 0,05;

• средняя длительность обслуживания Ря = 0,01.

Значения всех параметров и единицы измерения условные, так как основной целью было изучение характера зависимости вероятности срыва от времени и от скорости сети.

В результате проведенного численного моделирования работы СМО получены вероятностные характеристики систем двух типов: с показательным и с регулярным временем обслуживания требований. На рис.2-4 представлены графики экспериментальных зависимостей исследуемых характеристик системы. Для системы с постоянными длительностями обслуживания требований (фиксированными для каждого потока) зависимость вероятности срыва от времени наблюдения (рис.2, кривая 2) характеризуется более пологим, чем при показательном времени обслуживания (рис.2, кривая 1), подъемом, что свидетельствует о меньшей скорости роста вероятности срыва. На графике зависимости вероятности срыва от скорости сети, представленном на рис.3, наблюдается более резкий спад и сдвиг кривой влево по сравнению с показательным распределением времени обслуживания (кривая 1). Следовательно, при той же скорости сети вероятность срыва заметно уменьшается, причем отказоустойчивость оказывается более чувствительной к изменению скорости сети.

Графики зависимостей среднего времени ожидания в очереди от момента поступления требования (см. рис.4) полностью идентичны в обоих случаях. Однако для регулярного обслуживания среднее время ожидания в стационарном режиме уменьшилось примерно в 2 раза. Из рис.4 видно, что среднее время ожидания обслуживания имеет стационарный предел для каждого приоритета.

Таким образом, минимальную скорость канала V, гарантирующую безотказную работу системы за время Т с вероятностью отказа, не превышающей 8, можно найти из экспериментальной зависимости вероятности срыва от скорости сети.

Повышению эффективности исследования реальных систем, в том числе сложных СМО, должно способствовать сочетание аналитических методов исследования их математических моделей с оценкой отдельных характеристик имитационным моделированием и обоснованием их точности на основе результатов, полученных аналитическими методами.

1

0,9 0,8 0,7 . 0.6 0,5 0,4 0,3 0,2 0,1

0

йн

1

0,9 0,8 0,7 , 0,6 0,5 0,4 0,3 0,2 0,1

0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5

0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

Т V

Рис.2. Зависимость вероятности срыва от времени Рис.3. Зависимость вероятности срыва от скорости наблюдения: кривая 1 - в системе с показательным сети при Т = 0,5: кривая 1 - в системе с показатель-временем обслуживания; кривая 2 - в системе ным временем обслуживания; кривая 2 - в системе с регулярным временем обслуживания с регулярным временем обслуживания

0,08 0,07 0,06 ^ 0,05 -I 0,04 0,03 0,02 0,01

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 Т а

0,04 0,035 0,03 ^ 0,025 0,02 0,015 0,01 0,005 0

0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 Т

Рис.4. Зависимость среднего времени ожидания обслуживания от момента поступления требования: а - в системе с показательным временем обслуживания; б - в системе с регулярным временем обслуживания

Класс реальных объектов, модели которых строятся в теории массового обслуживания, весьма широк. Благодаря этому рассмотренный метод исследования вероятностных характеристик отказоустойчивости применим не только при проектировании локальной сети авиатренажера, но и в процессе разработки других технических комплексов с распределенной структурой. Тот же подход, очевидно, можно использовать при создании бортовой вычислительной системы самолета, имитацией которого является авиатренажер. Аналогичные задачи возникают в промышленной автоматике, в автомобильной электронике, в производстве современных транспортных средств и т. д.

Для систем реального времени, критичных к задержкам реакции вычислительного блока на различные события, происходящие в системе, этот метод имеет особую ценность. Он обеспечивает разработчика информацией, позволяющей сделать разумный и обоснованный выбор скоростных характеристик канала передачи данных. Таким образом осуществляется грамотный и осознанный подход к проектированию распределен-

1

1

ной вычислительной системы. Исчезает необходимость действовать методом проб и ошибок, подбирая приемлемую скорость сети для обеспечения заданного быстродействия. При этом значительно снижаются временные и финансовые затраты на разработку, повышается надежность системы.

В работе показана эффективность имитационного моделирования при исследовании СМО. Поскольку выходные данные численного эксперимента содержат некоторую погрешность, достоверность результатов статистического моделирования во многом зависит от того, насколько строго можно контролировать ошибку. Поэтому одним из основных направлений дальнейшей работы предполагается теоретическое обоснование точности приводимых результатов с применением методов математической статистики.

Автор выражает благодарность Завьяловой И.Г. за помощь в работе.

Литература

1. Вентцель Е.С. Теория вероятностей. - М.: Наука, 1964. - 576 с.

2. МатвеевВ.Ф., УшаковВ.Г. Системы массового обслуживания. - М.: Изд-во МГУ, 1984. - 240 с.

3. Ivo Adan, Jacques Resing Queueing theory. - Department of Mathematics and Computing Science Eindhoven University of Technology, Netherlands, 2001. - 180 с.

4. Ивченко Г.И., Каштанов В.А., Коваленко И.Н. Теория массового обслуживания. - М.: Высшая школа, 1982. - 256 с.

5. Ермаков С.М., Михайлов Г.А. Курс статистического моделирования. - М.: Наука, 1976. - 320 с.

6. Cooper Robert B. Introduction to queueing theory. - Second ed. - Elsevier North Holland, 1981. - 347 с.

Статья поступила 3 декабря 2008 г.

Сотников Александр Васильевич - инженер-электроник НИИ вычислительных средств и систем управления МИЭТ. Область научных интересов: стохастическое моделирование систем массового обслуживания, цифровая обработка изображений, распознавание образов.

Информация для читателей журнала «Известия высших учебных заведений. Электроника»

С тематическими указателями статей за 1996 - 2008 гг., аннотациями и содержанием последних номеров можно ознакомиться на нашем сайте:

h ttp ://www. miet.ru/static/je/os. html

i Надоели баннеры? Вы всегда можете отключить рекламу.