УДК 004.324:185.4
В. А. Терсков, М. Ю. Касторный МЕТОД ОЦЕНКИ НАДЕЖНОСТИ ВЫ1ЧИСЛИТЕЛЬНЫ1Х СИСТЕМ
Рассматривается метод оценки надежности вычислительных систем управления различной конфигурации, работающих в реальном масштабе времени.
Основной характеристикой, формирующей техническую эффективность вычислительных систем реального времени, является надежность. Оценка надежности суперЭВМ, к которым относятся многопроцессорные вычислительные системы (МВС), работающие в реальном масштабе времени, часто производится посредством прогона типовых задач на изготовленных образцах. Однако на стадии проектирования данный способ вызывает большие трудности, связанные со значительными затратами времени и ресурсов на создание модели разрабатываемой МВС.
Известные методы оценки надежности МВС реального времени либо не учитывают характеристики алгоритмов, либо получены для оценки надежности МВС, состоящих из однородных процессоров, или МВС, состоящих из разнородных процессоров и имеющих одношинную организацию связи процессоров с общей оперативной памятью (ОП). В связи с этим возникает задача получения достаточно простых аналитических выражений для оценки надежности, учитывающих влияние как основных характеристик решаемых задач, так и основных параметров МВС.
Исследуемая многопроцессорная вычислительная система состоит из N типов процессоров, содержащих по от. (г = 1, ы) процессоров каждого типа. Процессоры объединяются с ОП посредством п шин, причем в предельном случае количество шин может быть равно количеству процессоров (полносвязный интерфейс). Количество блоков общей оперативной памяти определяется необходимым объемом этой памяти.
Предполагается, что суммарный поток отказов от шин и процессоров всех типов подчиняется пуассоновскому закону распределения с параметром V., а время восстановления шин и процессоров г-го типа - экспоненциальному закону с параметром т..
Процесс надежности функционирования МВС представлен замкнутой системой массового обслуживания (СМО) с ожиданием.
Каждый процессор в некоторые случайные моменты времени выходит из строя и нуждается в восстановлении. Поток отказов от процессоров каждого типа и шин интереса - простейший с параметром V. , где г = 1, 1,..., N +1. Интенсивность восстановления каждого вышедшего из рабочего состояния элемента вычислительной системы подчиняется экспоненциальному закону распределения с параметром ц.. Если вновь поступивший на восстановление запрос застанет обслуживающий прибор свободным, то запрос принимается на обслуживание. Если же поступивший запрос застанет обслуживающий прибор занятым, то он становится в очередь и ждет своего обслуживания. Дисциплина обслуживания - случайный равновероятный выбор из очереди.
Рассматриваемая СМО может находиться в следующих состояниях:
- ао,о,о,...,о - интерфейс и все процессоры неисправны и восстанавливаются. Вычислительный процесс остановлен;
- а1,0,0,...,0 - исправна одна шина интерфейса, а (т1 - 1) шин неисправны и восстанавливаются; все процессоры неисправны и восстанавливаются. Вычислительный процесс остановлен;
- 00,1,0,...,0 - все шины интерфейса неисправны и восстанавливаются; все процессоры, за исключением одного первого типа, неисправны и восстанавливаются. Вычислительный процесс остановлен;
- а0,0,1,...,0 - все шины интерфейса неисправны и восстанавливаются; все процессоры, за исключением одного второго типа, неисправны и восстанавливаются. Вычислительный процесс остановлен;
- а0,0,0,...,1 - все шины интерфейса неисправны и восстанавливаются; все процессоры, за исключением одного ^го типа, неисправны и восстанавливаются. Вычислительный процесс остановлен;
- ал,к,л,...,.ы+1 -j1 шин интерфейса исправны и участвуют в вычислительном процессе, а (т1 -j1) шин неисправны и восстанавливаются;j процессоров первого типа исправны и участвуют в вычислительном процессе, а (т2 - j2) процессоров неисправны и восстанавливаются; j процессоров второго типа исправны и участвуют в вычислительном процессе, а (т3 -j3) процессоров неисправны и восстанавливаются; ...; jN+1 процессоров ^го типа исправны и участвуют в вычислительном процессе, а (т -jN+1) процессоров неисправны и восстанавливаются;
- ат1,т1,т3,...,ты^1 - все процессоры и шины, входящие в состав вычислительной системы, исправны и участвуют в вычислительном процессе.
Используя правила составления системы дифференциальных уравнений, запишем систему дифференциальных уравнений рассматриваемой СМО: йР0 0 0 (г) Ы+1
0,°Г0 = -£ т цД0 0 (') + V! Р,0 0 « + VIР ,1 0 (') + •••
йг п
+У«+1^0,0.1 (0 =
йР, , , (г) ы+1
71 ..■/ы+1 =-У [(т. - .)ц. +v.]Р. . . (г) +
а? м 1 л ,3г ,-’-}ы+1у/
+(т1 - .1 + 1)Ц1р-1,]г,..ы+1 (г) + (т1 + .1 + 1)Ц2Р/,,.1 -1.- ++ + ...
+ (ты + 1 - .N + 1 + 1)цы + 1Р/1,.1..N+1 -1(г) +V1Pjl +1. .2..N+1 (г) +
....(1)
+v1 Р . +1 . (г)+...+V,,+1Р.
2 .Л! +1,...,.ы+1 4 / ы+1 .
йР„
m1,m1,...,mы+1
йг +Ц Рт
Л. +1,..■,Jы+\
(г) N+1
—=-У>р
г т
1+1(г),
m1,m1,...,mЫ+1
(г) + ^-1
т -l,m2,...,mN+l
(г) +
г=1
, (г) + ... + Мы+1Рт
1 (г).
1 т,т1 -1,...,mы+l ^ *^ы +1 ml,ml,...,mы+l
N +1
Число состояний СМО равно А = п (тг + 1) .
г=1
Для стационарного режима получим систему линейных уравнений:
Вестник Сибирского государственного аэрокосмического университета имени академика М. Ф. Решетнева
ы +1
-X Ш,Цр0,0,...,0 + V1p,0,..,0 + 'У2 Р0,1,...,0 + ." +VN+1P0,0,...,1 = 0
г=1
N+1
-1[(тг - . )Ц, + Vг■ рл,..,ы+1 +
+ (т1 - .1 + ЦЦ Р.-1.
Л 1, .1,..., .ы+1
+ (т1 .1 + 1)Ц2 Р,1, .2 -1,...,Лы+1 + ... + (ты+1 .N+1 +
+ 1)цы+1 Л - +^Р +■ •■- •■--■+... +
где Р. - вероятность нахождения системы в а'к-м состоянии.
Введем следующие обозначения: при
к ^ 1, = (тг - к)ЦгР%к,-1 + Vг'pk. Система уравнений (7) в
этих обозначениях имеет следующий вид: z = 0, г(. = = 0.
Таким образом, при всех к \ 1, 2к = 0.
т!
. , +v Р
ы+1 .1, .1 ,...Лы+1-1 1 .1 +1, .2,..., .N+1
+V Р + + V Р = 0
1 р1, .1 +1,..., .ы+1 "• ы+1 РЛ, .1,..., .ы+1 +1 ^
(2)
Р (т -л,)!
р.'- Р.
(8)
ы+1
Х^Р
— И т
т ,т1 ,...,ты+1
+ ц,Р .
т| -1.
т -1,т1 ,...,ты+1
+ ц, Р
1т
1 Ш1,т2 -1,...,ты+1
+Цы +1р
N +1 т1 ,т1 ,...,ты+1
-1 = 0.
Осуществляя обратную подстановку (8) в (3), с учетом биноминальных и полиномиальных коэффициентов [1] получим
шг! . „
РЛ Ро,о,,о, (9)
Р
N+1 _ ы+1
= п Р,. = п
г=1 ' г=1 (ш, -)!
Для решения системы уравнений (2) в общем виде где Р0,0,...,0 - вероятность нахождения СМО в состоянии
подстановку [1]
Р
п р.,
.1,.1,...,.ы+1 А А Л
=1
(3)
и перепишем систему линейных уравнений (2) в следующем виде:
N +1 ~~~ ~~~
“X [(т, - У, )Ц, +V, V,, Р,г ' + (т1 - -Л + 1)Ц1 Р7,-1Р/1 ' + (т2 - 72 + 1)
Л + (Ш2 - .1 + 1)Ц 1РЛРЛ,.1-1 ... Л + ... +
+ (ты+1 - ] N +1 + 1)-Цы+1 Рл р2... Ры+1 -1 +V1Р +1Р.1 ... Ры+1 +
а0,0,...,0 , которая определяется по условию нормировки.
Структура графа исходной СМО показывает, что переход в состояние аА,.,..., Лк+1 можно осуществить несколькими путями, причем вероятность нахождения в этом состоянии равна сумме вероятностей достижения его по каждому пути. Количество путей достижения состояния X. в общем случае соответствует полиномиальному коэффициенту [2] и равно
I!
+^Р Рл +1... Ры+1 + ... + VN+1 Р.1 Р.1 ... Р.ы+1 +1 = °.
(4)
(10)
п Л,!
Р0,
11 ы+1 1 • п
N+1 . / • \ I 1
л=0Ш п. • (т - Л)!
.2 =0,т2 г = 1 '
Лы=0,ты+1
Произведя подстановку (11) в (9), получим решение системы уравнений (2) в общем виде:
т , • л
—-------Р.'
I • ы+
1 • п
Р
ып1. • -Л)•'
I • ы+
1 • п
Х N+1 -~г . ч I
л=от п.• г=1 (т-л^
Л =0,т2 г=1 '
Перегруппируем (4) таким образом, чтобы Р, входи- где I = 0,1,..., X Л. Следовательно, ли в соответствующие выражения, содержащие Ш!, V,, ц,, т. е. произведем разделение переменных по индексам:
{(т -л+l)vl рл-1- [(ш1 - .1 ^ +
+ Ц1]р1 + Ц1 р1+1}р2...Р.ы +{(Ш2 --.2 + 1)V2Р.2-1 - [(Ш2 - .2 )V2 + Ц2 ]Р.2 +
+ Ц2Р2+1>рГ Р3- ...■ ^ы + ... +
+{(ты - .ы + 1)vыР.ы-1 - [(Шы - .ы )vN + цN ]ры +
+цыры+1}р1 ■ р2 •...• Ры-1 = 0. (5)
Система линейных уравнений (5) будет иметь решение только в том случае, когда выражения в фигурных скобках равны нулю, так как Р , ф 0 . Следовательно, можно записать
(ш1 - к + 1)Ц1 р1-1 - [(ш1 - Л)Ц1 +
+ vl]pl +vl р1+1 =
(Ш2 - ] 2 + 1)Ц2р2-1 - [(Ш2 - . )Ц2 +
+ V2]p2 + V2 Р 2+1 = 0
(Шы - .N + !)Цы^ы-1 - [(Шы --]N )Цы +^ ]ры +VNpЫ+1 = 0.
Каждое уравнение системы (6) представляет собой систему уравнений СМО, состоящей из т. источников требований одного типа с одним обслуживающим прибором.
С целью решения полученной системы уравнений (6) для г-го типа процессоров перепишем ее следующим образом:
ш. Цр0 =V,Pl,
[(ш, - к )ц, + Vг■ ]Р. = (Ш, - к + 1)Ц'Рк-1 + V г Р.+1, (7)
VІPL, =ЦгРП'-^
т1 •
(11)
(12)
Р,
.=0, Шы+1
Основными показателями надежности МВС являются РЕ - вероятность безотказной работы с заданной производительностью, к< - коэффициент готовности к работе с заданным уровнем производительности [3].
С учетом определенной вероятности р.,
нахож-
дения системы в состоянии а.,.,..., показатели надеж-
(6) ности микропроцессорных ЭВМ определяется следующим образом:
Р Е = X РЛ1
к=-
.=о,т1 .2 =0,Ш2
JN+1 =0,тК+1
Ре
Рг
(13)
(14)
Р - (1 - Р ) 1Р -1
Таким образом, в данной статье представлен аналитический метод расчета надежности функционирования многопроцессорных вычислительных систем, состоящих
г=1
+
г=1
из произвольного количества типов процессоров, произвольного числа процессоров каждого типа и произвольного количества шин интерфейса, объединяющих процессоры с оперативной памятью.
Библиографический список
1. Метод анализа одного класса систем массового обслуживания для оценки производительности много-
процессорных вычислительных систем / Л. П. Лобанов,
A. А. Кударенко, Н. В. Пивоваров, В. А. Терсков и др. // Программирование. 1988. № 5. С. 6-12.
2. Виленкин, Н. Я. Комбинаторика / Н. Я. Виленкин. М. : Наука, 1969. 328 с.
3. Погребинский, С. Б. Проектирование и надежность многопроцессорных ЭВМ / С. Б. Погребинский,
B. П. Стрельников. М. : Радио и связь, 1988. 168 с.
V. A. Terskov, M. Yu. Kastorny
THE ESTIMATING METHOD OF COMPUTING SYSTEMS RELIABILITY
The estimating method of reliability of computing systems of management of the various configuration, working in real time is considered.