Научная статья на тему 'Метод оценки надежности вычислительных систем'

Метод оценки надежности вычислительных систем Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
265
66
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Терсков В. А., Касторный М. Ю.

Рассматривается метод оценки надежности вычислительных систем управления различной конфигурации, работающих в реальном масштабе времени.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Терсков В. А., Касторный М. Ю.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE ESTIMATING METHOD OF COMPUTING SYSTEMS RELIABILITY

The estimating method of reliability of computing systems of management of the various configuration, working in real time is considered.

Текст научной работы на тему «Метод оценки надежности вычислительных систем»

УДК 004.324:185.4

В. А. Терсков, М. Ю. Касторный МЕТОД ОЦЕНКИ НАДЕЖНОСТИ ВЫ1ЧИСЛИТЕЛЬНЫ1Х СИСТЕМ

Рассматривается метод оценки надежности вычислительных систем управления различной конфигурации, работающих в реальном масштабе времени.

Основной характеристикой, формирующей техническую эффективность вычислительных систем реального времени, является надежность. Оценка надежности суперЭВМ, к которым относятся многопроцессорные вычислительные системы (МВС), работающие в реальном масштабе времени, часто производится посредством прогона типовых задач на изготовленных образцах. Однако на стадии проектирования данный способ вызывает большие трудности, связанные со значительными затратами времени и ресурсов на создание модели разрабатываемой МВС.

Известные методы оценки надежности МВС реального времени либо не учитывают характеристики алгоритмов, либо получены для оценки надежности МВС, состоящих из однородных процессоров, или МВС, состоящих из разнородных процессоров и имеющих одношинную организацию связи процессоров с общей оперативной памятью (ОП). В связи с этим возникает задача получения достаточно простых аналитических выражений для оценки надежности, учитывающих влияние как основных характеристик решаемых задач, так и основных параметров МВС.

Исследуемая многопроцессорная вычислительная система состоит из N типов процессоров, содержащих по от. (г = 1, ы) процессоров каждого типа. Процессоры объединяются с ОП посредством п шин, причем в предельном случае количество шин может быть равно количеству процессоров (полносвязный интерфейс). Количество блоков общей оперативной памяти определяется необходимым объемом этой памяти.

Предполагается, что суммарный поток отказов от шин и процессоров всех типов подчиняется пуассоновскому закону распределения с параметром V., а время восстановления шин и процессоров г-го типа - экспоненциальному закону с параметром т..

Процесс надежности функционирования МВС представлен замкнутой системой массового обслуживания (СМО) с ожиданием.

Каждый процессор в некоторые случайные моменты времени выходит из строя и нуждается в восстановлении. Поток отказов от процессоров каждого типа и шин интереса - простейший с параметром V. , где г = 1, 1,..., N +1. Интенсивность восстановления каждого вышедшего из рабочего состояния элемента вычислительной системы подчиняется экспоненциальному закону распределения с параметром ц.. Если вновь поступивший на восстановление запрос застанет обслуживающий прибор свободным, то запрос принимается на обслуживание. Если же поступивший запрос застанет обслуживающий прибор занятым, то он становится в очередь и ждет своего обслуживания. Дисциплина обслуживания - случайный равновероятный выбор из очереди.

Рассматриваемая СМО может находиться в следующих состояниях:

- ао,о,о,...,о - интерфейс и все процессоры неисправны и восстанавливаются. Вычислительный процесс остановлен;

- а1,0,0,...,0 - исправна одна шина интерфейса, а (т1 - 1) шин неисправны и восстанавливаются; все процессоры неисправны и восстанавливаются. Вычислительный процесс остановлен;

- 00,1,0,...,0 - все шины интерфейса неисправны и восстанавливаются; все процессоры, за исключением одного первого типа, неисправны и восстанавливаются. Вычислительный процесс остановлен;

- а0,0,1,...,0 - все шины интерфейса неисправны и восстанавливаются; все процессоры, за исключением одного второго типа, неисправны и восстанавливаются. Вычислительный процесс остановлен;

- а0,0,0,...,1 - все шины интерфейса неисправны и восстанавливаются; все процессоры, за исключением одного ^го типа, неисправны и восстанавливаются. Вычислительный процесс остановлен;

- ал,к,л,...,.ы+1 -j1 шин интерфейса исправны и участвуют в вычислительном процессе, а (т1 -j1) шин неисправны и восстанавливаются;j процессоров первого типа исправны и участвуют в вычислительном процессе, а (т2 - j2) процессоров неисправны и восстанавливаются; j процессоров второго типа исправны и участвуют в вычислительном процессе, а (т3 -j3) процессоров неисправны и восстанавливаются; ...; jN+1 процессоров ^го типа исправны и участвуют в вычислительном процессе, а (т -jN+1) процессоров неисправны и восстанавливаются;

- ат1,т1,т3,...,ты^1 - все процессоры и шины, входящие в состав вычислительной системы, исправны и участвуют в вычислительном процессе.

Используя правила составления системы дифференциальных уравнений, запишем систему дифференциальных уравнений рассматриваемой СМО: йР0 0 0 (г) Ы+1

0,°Г0 = -£ т цД0 0 (') + V! Р,0 0 « + VIР ,1 0 (') + •••

йг п

+У«+1^0,0.1 (0 =

йР, , , (г) ы+1

71 ..■/ы+1 =-У [(т. - .)ц. +v.]Р. . . (г) +

а? м 1 л ,3г ,-’-}ы+1у/

+(т1 - .1 + 1)Ц1р-1,]г,..ы+1 (г) + (т1 + .1 + 1)Ц2Р/,,.1 -1.- ++ + ...

+ (ты + 1 - .N + 1 + 1)цы + 1Р/1,.1..N+1 -1(г) +V1Pjl +1. .2..N+1 (г) +

....(1)

+v1 Р . +1 . (г)+...+V,,+1Р.

2 .Л! +1,...,.ы+1 4 / ы+1 .

йР„

m1,m1,...,mы+1

йг +Ц Рт

Л. +1,..■,Jы+\

(г) N+1

—=-У>р

г т

1+1(г),

m1,m1,...,mЫ+1

(г) + ^-1

т -l,m2,...,mN+l

(г) +

г=1

, (г) + ... + Мы+1Рт

1 (г).

1 т,т1 -1,...,mы+l ^ *^ы +1 ml,ml,...,mы+l

N +1

Число состояний СМО равно А = п (тг + 1) .

г=1

Для стационарного режима получим систему линейных уравнений:

Вестник Сибирского государственного аэрокосмического университета имени академика М. Ф. Решетнева

ы +1

-X Ш,Цр0,0,...,0 + V1p,0,..,0 + 'У2 Р0,1,...,0 + ." +VN+1P0,0,...,1 = 0

г=1

N+1

-1[(тг - . )Ц, + Vг■ рл,..,ы+1 +

+ (т1 - .1 + ЦЦ Р.-1.

Л 1, .1,..., .ы+1

+ (т1 .1 + 1)Ц2 Р,1, .2 -1,...,Лы+1 + ... + (ты+1 .N+1 +

+ 1)цы+1 Л - +^Р +■ •■- •■--■+... +

где Р. - вероятность нахождения системы в а'к-м состоянии.

Введем следующие обозначения: при

к ^ 1, = (тг - к)ЦгР%к,-1 + Vг'pk. Система уравнений (7) в

этих обозначениях имеет следующий вид: z = 0, г(. = = 0.

Таким образом, при всех к \ 1, 2к = 0.

т!

. , +v Р

ы+1 .1, .1 ,...Лы+1-1 1 .1 +1, .2,..., .N+1

+V Р + + V Р = 0

1 р1, .1 +1,..., .ы+1 "• ы+1 РЛ, .1,..., .ы+1 +1 ^

(2)

Р (т -л,)!

р.'- Р.

(8)

ы+1

Х^Р

— И т

т ,т1 ,...,ты+1

+ ц,Р .

т| -1.

т -1,т1 ,...,ты+1

+ ц, Р

1 Ш1,т2 -1,...,ты+1

+Цы +1р

N +1 т1 ,т1 ,...,ты+1

-1 = 0.

Осуществляя обратную подстановку (8) в (3), с учетом биноминальных и полиномиальных коэффициентов [1] получим

шг! . „

РЛ Ро,о,,о, (9)

Р

N+1 _ ы+1

= п Р,. = п

г=1 ' г=1 (ш, -)!

Для решения системы уравнений (2) в общем виде где Р0,0,...,0 - вероятность нахождения СМО в состоянии

подстановку [1]

Р

п р.,

.1,.1,...,.ы+1 А А Л

=1

(3)

и перепишем систему линейных уравнений (2) в следующем виде:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

N +1 ~~~ ~~~

“X [(т, - У, )Ц, +V, V,, Р,г ' + (т1 - -Л + 1)Ц1 Р7,-1Р/1 ' + (т2 - 72 + 1)

Л + (Ш2 - .1 + 1)Ц 1РЛРЛ,.1-1 ... Л + ... +

+ (ты+1 - ] N +1 + 1)-Цы+1 Рл р2... Ры+1 -1 +V1Р +1Р.1 ... Ры+1 +

а0,0,...,0 , которая определяется по условию нормировки.

Структура графа исходной СМО показывает, что переход в состояние аА,.,..., Лк+1 можно осуществить несколькими путями, причем вероятность нахождения в этом состоянии равна сумме вероятностей достижения его по каждому пути. Количество путей достижения состояния X. в общем случае соответствует полиномиальному коэффициенту [2] и равно

I!

+^Р Рл +1... Ры+1 + ... + VN+1 Р.1 Р.1 ... Р.ы+1 +1 = °.

(4)

(10)

п Л,!

Р0,

11 ы+1 1 • п

N+1 . / • \ I 1

л=0Ш п. • (т - Л)!

.2 =0,т2 г = 1 '

Лы=0,ты+1

Произведя подстановку (11) в (9), получим решение системы уравнений (2) в общем виде:

т , • л

—-------Р.'

I • ы+

1 • п

Р

ып1. • -Л)•'

I • ы+

1 • п

Х N+1 -~г . ч I

л=от п.• г=1 (т-л^

Л =0,т2 г=1 '

Перегруппируем (4) таким образом, чтобы Р, входи- где I = 0,1,..., X Л. Следовательно, ли в соответствующие выражения, содержащие Ш!, V,, ц,, т. е. произведем разделение переменных по индексам:

{(т -л+l)vl рл-1- [(ш1 - .1 ^ +

+ Ц1]р1 + Ц1 р1+1}р2...Р.ы +{(Ш2 --.2 + 1)V2Р.2-1 - [(Ш2 - .2 )V2 + Ц2 ]Р.2 +

+ Ц2Р2+1>рГ Р3- ...■ ^ы + ... +

+{(ты - .ы + 1)vыР.ы-1 - [(Шы - .ы )vN + цN ]ры +

+цыры+1}р1 ■ р2 •...• Ры-1 = 0. (5)

Система линейных уравнений (5) будет иметь решение только в том случае, когда выражения в фигурных скобках равны нулю, так как Р , ф 0 . Следовательно, можно записать

(ш1 - к + 1)Ц1 р1-1 - [(ш1 - Л)Ц1 +

+ vl]pl +vl р1+1 =

(Ш2 - ] 2 + 1)Ц2р2-1 - [(Ш2 - . )Ц2 +

+ V2]p2 + V2 Р 2+1 = 0

(Шы - .N + !)Цы^ы-1 - [(Шы --]N )Цы +^ ]ры +VNpЫ+1 = 0.

Каждое уравнение системы (6) представляет собой систему уравнений СМО, состоящей из т. источников требований одного типа с одним обслуживающим прибором.

С целью решения полученной системы уравнений (6) для г-го типа процессоров перепишем ее следующим образом:

ш. Цр0 =V,Pl,

[(ш, - к )ц, + Vг■ ]Р. = (Ш, - к + 1)Ц'Рк-1 + V г Р.+1, (7)

VІPL, =ЦгРП'-^

т1 •

(11)

(12)

Р,

.=0, Шы+1

Основными показателями надежности МВС являются РЕ - вероятность безотказной работы с заданной производительностью, к< - коэффициент готовности к работе с заданным уровнем производительности [3].

С учетом определенной вероятности р.,

нахож-

дения системы в состоянии а.,.,..., показатели надеж-

(6) ности микропроцессорных ЭВМ определяется следующим образом:

Р Е = X РЛ1

к=-

.=о,т1 .2 =0,Ш2

JN+1 =0,тК+1

Ре

Рг

(13)

(14)

Р - (1 - Р ) 1Р -1

Таким образом, в данной статье представлен аналитический метод расчета надежности функционирования многопроцессорных вычислительных систем, состоящих

г=1

+

г=1

из произвольного количества типов процессоров, произвольного числа процессоров каждого типа и произвольного количества шин интерфейса, объединяющих процессоры с оперативной памятью.

Библиографический список

1. Метод анализа одного класса систем массового обслуживания для оценки производительности много-

процессорных вычислительных систем / Л. П. Лобанов,

A. А. Кударенко, Н. В. Пивоваров, В. А. Терсков и др. // Программирование. 1988. № 5. С. 6-12.

2. Виленкин, Н. Я. Комбинаторика / Н. Я. Виленкин. М. : Наука, 1969. 328 с.

3. Погребинский, С. Б. Проектирование и надежность многопроцессорных ЭВМ / С. Б. Погребинский,

B. П. Стрельников. М. : Радио и связь, 1988. 168 с.

V. A. Terskov, M. Yu. Kastorny

THE ESTIMATING METHOD OF COMPUTING SYSTEMS RELIABILITY

The estimating method of reliability of computing systems of management of the various configuration, working in real time is considered.

i Надоели баннеры? Вы всегда можете отключить рекламу.