Научная статья на тему 'МОДЕЛЬ НАДЕЖНОСТИ МНОГОПРОЦЕССОРНЫХ АППАРАТНО-ПРОГРАММНЫХ КОМПЛЕКСОВ СИСТЕМ УПРАВЛЕНИЯ РЕАЛЬНОГО ВРЕМЕНИ С МУЛЬТИВЕРСИОННЫМ ПРОГРАММНЫМ ОБЕСПЕЧЕНИЕМ'

МОДЕЛЬ НАДЕЖНОСТИ МНОГОПРОЦЕССОРНЫХ АППАРАТНО-ПРОГРАММНЫХ КОМПЛЕКСОВ СИСТЕМ УПРАВЛЕНИЯ РЕАЛЬНОГО ВРЕМЕНИ С МУЛЬТИВЕРСИОННЫМ ПРОГРАММНЫМ ОБЕСПЕЧЕНИЕМ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
96
14
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АППАРАТНО-ПРОГРАММНЫЙ КОМПЛЕКС / МОДЕЛЬ / НАДЕЖНОСТЬ / СИСТЕМЫ УПРАВЛЕНИЯ РЕАЛЬНОГО ВРЕМЕНИ / ТЕОРИЯ МАССОВОГО ОБСЛУЖИВАНИЯ / МУЛЬТИВЕРСИОННОЕ ПРОГРАММИРОВАНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ефимов С.Н., Терсков В.А., Галушин П.В., Ярков К.В.

Надежность является критически важным параметром систем управления реального времени. На практике надежность аппаратно-программных комплексов, входящих в подобные системы, обеспечивается за счет создания избыточности аппаратных компонентов и мультиверсионного подхода к разработке программного обеспечения. Но избыточное резервирование аппаратных устройств и слишком большое число версий программного обеспечения могут привести к неоправданному росту стоимости создания и эксплуатации проектируемой системы управления. Рациональный подход к проектированию требует создания модели, позволяющей оценить надежность различных конфигураций аппаратно-программного комплекса на этапе проектирования. Предложена математическая модель надежности аппаратно-программных комплексов систем управления реального времени, построенная с использованием математического аппарата теории массового обслуживания и представляющая собой систему дифференциальных уравнений для вероятностей нахождения состояний системы, в которых неисправны те или иные компоненты аппаратно-программного комплекса. Из системы дифференциальных уравнений получена система линейных алгебраических уравнений для вероятностей состояний в установившемся режиме. Приведено аналитическое решение данной системы, что позволяет оценить надежность многопроцессорных аппаратно-программных комплексов с мультиверсионным программным обеспечением без существенных затрат вычислительных ресурсов. Приведены возможности использования полученных результатов для оптимизации надежности многопроцессорных аппаратно-программных комплексов с мультиверсионным программным обеспечением и предложены направления дальнейших исследований

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ефимов С.Н., Терсков В.А., Галушин П.В., Ярков К.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

RELIABILITY MODEL OF MULTIPROCESSOR HARDWARE-SOFTWARE COMPLEXES OF REAL-TIME CONTROL SYSTEMS WITH MULTI-VERSION SOFTWARE

Reliability is a critical parameter of real-time control systems. In practice, the reliability of hardware and software complexes included in such systems, is ensured by creating redundancy of hardware components and a multi-version approach to software development. But the redundant reservation of hardware devices and too many versions of software can lead to unjustified growth in the cost of creating and operating the projected control system. A rational approach to the design requires the creation of a model, which allows evaluating the reliability of different hardware and software complex configurations at the design stage. We proposed a mathematical reliability model of hardware and software complexes of real-time control systems, built with the use of mathematical apparatus of the queueing theory, which is a system of differential equations for the probability of finding states in the system, in which one or another component of the hardware and software complex is faulty. From the system of differential equations, the system of linear algebraic equations for probabilities of states in a steady-state mode was obtained. An analytical solution of this system is given, which allows us to evaluate the reliability of multiprocessor hardware-software complexes with multi-version software without significant expenditure of computational resources. Possibilities of using the results obtained to optimize the reliability of multiprocessor hardware-software complexes with multi-version software are presented and directions for further research are proposed

Текст научной работы на тему «МОДЕЛЬ НАДЕЖНОСТИ МНОГОПРОЦЕССОРНЫХ АППАРАТНО-ПРОГРАММНЫХ КОМПЛЕКСОВ СИСТЕМ УПРАВЛЕНИЯ РЕАЛЬНОГО ВРЕМЕНИ С МУЛЬТИВЕРСИОННЫМ ПРОГРАММНЫМ ОБЕСПЕЧЕНИЕМ»

УДК 004.3

DOI: 10.18698/0236-3933-2021 -4-41-58

МОДЕЛЬ НАДЕЖНОСТИ МНОГОПРОЦЕССОРНЫХ АППАРАТНО-ПРОГРАММНЫХ КОМПЛЕКСОВ СИСТЕМ УПРАВЛЕНИЯ РЕАЛЬНОГО ВРЕМЕНИ С МУЛЬТИВЕРСИОННЫМ ПРОГРАММНЫМ ОБЕСПЕЧЕНИЕМ

С.Н. Ефимов1 В.А. Терсков1 П.В. Галушин2 К.В. Ярков3

eflmov@bk.ru terskowa@mail.ru galushin@gmail.com yarkov_kv@krsk.irgups.ru

1 СибГУ им. М.Ф. Решетнева, г. Красноярск, Российская Федерация

2 СибЮИ МВД России, г. Красноярск, Российская Федерация

3 КрИЖТ ИрГУПС, г. Красноярск, Российская Федерация

Аннотация

Надежность является критически важным параметром систем управления реального времени. На практике надежность аппаратно-программных комплексов, входящих в подобные системы, обеспечивается за счет создания избыточности аппаратных компонентов и мультиверсионного подхода к разработке программного обеспечения. Но избыточное резервирование аппаратных устройств и слишком большое число версий программного обеспечения могут привести к неоправданному росту стоимости создания и эксплуатации проектируемой системы управления. Рациональный подход к проектированию требует создания модели, позволяющей оценить надежность различных конфигураций аппаратно-программного комплекса на этапе проектирования. Предложена математическая модель надежности аппаратно-программных комплексов систем управления реального времени, построенная с использованием математического аппарата теории массового обслуживания и представляющая собой систему дифференциальных уравнений для вероятностей нахождения состояний системы, в которых неисправны те или иные компоненты аппаратно-программного комплекса. Из системы дифференциальных уравнений получена система линейных алгебраических уравнений для вероятностей состояний в установившемся

Ключевые слова

Аппаратно-программный комплекс, модель, надежность, системы управления реального времени, теория массового обслуживания, мультиверсионное программирование

режиме. Приведено аналитическое решение данной системы, что позволяет оценить надежность многопроцессорных аппаратно-программных комплексов с мультиверсионным программным обеспечением без существенных затрат вычислительных ресурсов. Приведены возможности использования полученных результатов для оптимизации надежности многопроцессорных аппаратно-программных комплексов с мультиверсионным программ- Поступила 04.09.2020 ным обеспечением и предложены направления Принята 01.02.2021 дальнейших исследований © Автор(ы), 2021

Введение. Многие современные задачи управления, например управление воздушным движением или технологическими процессами, требуют создания систем управления реального времени[1, 2]— систем, способных реагировать на изменения в объекте управления и внешней среде в рамках требуемых временных ограничений. Многие современные системы управления такого класса реализуются в виде аппаратно-программного комплекса (АПК), т. е. набора аппаратных и программных средств, работающих совместно для выполнения одной или нескольких сходных задач.

С ростом сложности задач управления (например, увеличения числа управляемых объектов или учитываемых параметров) должна расти и производительность подобных комплексов. Рост производительности вычислительной техники исторически достигался за счет повышения тактовой частоты и увеличения числа процессоров, входящих в вычислительную систему.

На сегодняшний день можно констатировать, что возможности повышения тактовой частоты исчерпаны, это обусловлено физическими ограничениями [3]. Магистральным направлением стала разработка многоядерных процессоров. Таким образом, современные вычислительные системы вплоть до карманных компьютеров, по сути, являются многопроцессорными. То же относится и к аппаратному обеспечению систем управления реального времени.

Надежность — способность выдавать управляющее воздействие в рамках заданных временных ограничений с заданной вероятностью — является критически важным параметром систем управления реального времени. Невозможность выполнения системой управления задачи может быть обусловлена выходом из строя компонентов аппаратного обеспечения и проявлением дефектов программного обеспечения.

Традиционный метод оценки надежности подобных систем сводится к опытной эксплуатации изготовленных образцов при решении типовых задач. Однако на стадии проектирования данный метод приводит к значительным затратам времени и ресурсов. Более перспективным направлением представляется создание математических моделей, что позволит рассматривать множество вариантов архитектуры АПК за короткое время и без существенных затрат. Кроме того, открываются широкие возможности оптимизации архитектуры.

Надежность аппаратной части может быть обеспечена путем резервирования, т. е. введения в архитектуру системы избыточных вычислительных ресурсов. При этом пиковая (все компоненты исправны) производительность АПК будет больше минимально требуемой производительности, за счет чего повысится вероятность нахождения АПК в состояниях, в которых обеспечивается необходимый уровень производительности.

Не существует методов разработки нетривиального программного обеспечения, не содержащего дефектов. Создание надежной системы из ненадежных компонентов возможно только за счет введения избыточности. Но поскольку программные ошибки имеют внутреннюю природу и копии программы являются полностью идентичными, то простое дублирование компонентов не даст прироста надежности. Для того чтобы сбои в разных дублирующих друг друга модулях не возникали на одних и тех же входных данных, эти модули должны быть независимо разработаны [4], такой подход называют мультиверсионным программированием [5]. Очевидно, что надежность элементов архитектуры программного обеспечения с программной избыточностью возрастает с увеличением числа различных версий и повышением надежности среды их исполнения [6].

Таким образом, математическая модель надежности АПК системы управления реального времени должна допускать возможность применения мультиверсионного программирования и резервирования компонентов аппаратного обеспечения.

Постановка задачи. Традиционно надежность рассматривается для аппаратного и программного обеспечения отдельно, а общая надежность (вероятность безотказной работы) АПК определяется как произведение вероятности безотказной работы аппаратного обеспечения и вероятности безошибочной работы программного обеспечения.

Модель надежности аппаратного обеспечения многопроцессорной вычислительной системы может быть построена с использованием аппарата теории массового обслуживания как замкнутая система массового

обслуживания с ожиданием. Примеры подобных моделей могут быть найдены в [7, 8].

Вероятность безошибочной работы программного компонента, построенного из К версий методом мультиверсионного программирования, равна [9]:

Rs=pv

' к л

1-П(1 -рк)

к= 1

У

где ру — вероятность безошибочной работы алгоритма голосования; рк — вероятность безошибочной работы версии, к = 1, 2,..., К.

Однако рассматривая надежность аппаратного и программного обеспечений по отдельности, не учитывают взаимодействие между компонентами АПК.

Рассмотрим подход к определению надежности АПК на примере многопроцессорного вычислительного комплекса (МВК) с произвольным числом разнородных процессоров и шин интерфейса. В компоненты программного обеспечения МВК, надежность функционирования которых является критичной для системы, методом мультиверсионного программирования может быть введена программная избыточность. Процесс функционирования МВК можно представить в виде переходов между различными возможными состояниями в некотором интервале времени At. Подобные процессы могут быть описаны с помощью математического аппарата теории массового обслуживания.

Процесс функционирования такого МВК представляется замкнутой системой массового обслуживания (СМО) с ожиданием. Предполагается, что потоки отказов от шин и процессоров всех типов подчиняются экспоненциальному закону распределения с параметром V,-, а время восстановления шин и процессоров /-го типа — экспоненциальному закону с параметром (I/. Переход системы в состояние, в котором при определенной архитектуре аппаратной части МВК одна из версий критичного по надежности модуля программного обеспечения выдает неверный результат, определяется вероятностью безотказной работы разработанных версий.

Состояния рассматриваемой СМО будем обозначать следующим образом: — это состояние, в котором (шх - д) процессоров

первого типа исправны и участвуют в вычислительном процессе, а 71 процессоров неисправны и восстанавливаются; (т2 -72) процессоров второго типа исправны и участвуют в вычислительном процессе, а ]2

процессоров неисправны и восстанавливаются; (т^ ~ jN) процессоров ДГ-го типа исправны и участвуют в вычислительном процессе, а /м процессоров неисправны и восстанавливаются; (шдг+1-^+1) шин интерфейса исправны и участвуют в вычислительном процессе, а ¿N+1 шин

неисправны и восстанавливаются. Индекс безошибочности (величина, равная единице, если соответствующая версия программного обеспечения работает без ошибок, и нулю, если работает с ошибками) первой версии равен гь второй версии — Г2,..., К-й версии — гк• Индексы ^ изменяются от 0 до т,-, а индексы безошибочности могут принимать значения 0 или 1. Фрагмент графа состояний рассматриваемой СМО приведен на рис. 1.

Рис. 1. Фрагмент графа состояний СМО

Интенсивности переходов между состояниями, отличающимися только индексами безошибочности работы версий программного обеспечения, зависят от величин р1,р2> —> рк вероятностей корректной работы соответствующих компонентов программного обеспечения.

Аналитическая модель надежности АПК. Используя правила составления системы уравнений Колмогорова — Чепмена, запишем систему дифференциальных уравнений для вероятностей состояний рассматриваемой СМО. Приравнивая производные вероятностей в этих уравнениях нулю, получаем систему уравнений для стационарного режима:

N + 1

- X vI■Po', о,..., о + цЛ' о,..., о + 1,..., о + - + ^N+1 Во, о,..., 1 = 0;

«' = 1

N + 1

I" = 1

+ ^Ы+^ъ ¿2, .... ^ + 1-1 + }2, .... Ж + 1 + /2+1..... Ж + 1 + - + (!)

+ цлг+1-Рд, )2,..., +1 = 0;

N + 1

— X (■Моть »12..... ГПЫ +1 +^1Ргщ-1, Ш2,..., тдг+1 + У2-Рть Ш2-1,..., тдг-и +••• +

! =1

"1" УЫ+1Рт1, ГП2, ..., тн + 1 -1 = 0>

где

рг _ рП> Ъ>->ГК _|_р1-1>»2>-. »К

Л'П'-' jN+l - ;'2)..., ;лг+1 /ь/2.

гк: _|_р»1. »2.^ч ;'ь;2.-. "' л> ,/лг+Г

Система уравнений (1) является однородной, поэтому имеет бесконечное множество решений. Для обеспечения единственности решения необходимо заменить одно из уравнений системы (1) условием нормировки (сумма вероятностей всех состояний должна быть равна единице):

X Рл > к > •••> ж+1 = 1 •

л = (3)

;'2 = 0, т2

Л\Г+1 = 0,

Данная система линейных алгебраических уравнений может быть решена численно. При этом могут использоваться специализированные

методы для систем с разреженной матрицей левой части [10-12]. Однако более информативным было бы найти аналитическое выражение для стационарных вероятностей состояний. Оказывается, что для данной системы аналитическое решение действительно может быть найдено благодаря особенностям ее структуры:

N + 1

п р/;

р1\,п>-,гк __' = 1

Л.;'2. ;'АГ+1 N41

П р/г

= 0, т\ }2 = 0, тг

¡N+1 = 0, тлт+1

Вывод формулы (4). Для получения аналитического решения системы уравнений (1), дополненной условием нормировки (3), представим каждую искомую вероятность в виде произведения N+1 множителей, т. е. выполним подстановку

п> •■■> ;лг+1 = П (5)

!=1

и перепишем систему линейных уравнений (1) в следующем виде:

N+1

«=1

+ =0. (6)

Изменим порядок слагаемых в уравнении (6) так, чтобы Р^ входили в соответствующие выражения, содержащие и V/:

{У!^-! - (Щ+У!)^ + ^Р]1+1}Р^Р]3 ■■■Р]м+1 + + {v2P^2-l - ... -(ц2 +У2)Р;2 + Ц2Р;2+1}ВДЗ + - +

+ ••• ~ (цлг+1+УЛГ+1)Р]м+1 + ^N+1^+1+1}*

хРлрп-р1м= 0- (7)

Система линейных уравнений (7) будет иметь решение только в том случае, когда выражения в фигурных скобках равны нулю, так как в об-

1+1(1 -Рк)

к = \

щем случае вероятность ни одного состояния не равна нулю, т. е. Р^ Ф 0. Следовательно, приравнивая значения указанных выражений нулю, получаем следующее семейство уравнений:

_ 1 - (ц, + V,) Ря + щРм +1 = 0, г = 1,..., N + 1. (8)

При каждом конкретном значении г формула (8) является системой уравнений для стационарных вероятностей состояний процесса гибели и размножения. В целях решения полученной системы уравнений (8) перепишем ее следующим образом:

+ + (9)

где Р£ — вероятность нахождения системы в состоянии а1к. Введем обозначения:

гк=у{Р1-щР1+1, к> 1.

Система уравнений (9) в этих обозначениях принимает следующий вид:

г0 = 0;

гк-1 - гь = 0, к = 1, 2,..., щ;

2/и;-1 =0.

Можно показать, что при всех к > 1 имеет место равенство гк = 0. Откуда, согласно определению гк, следует соотношение

Следовательно,

(Ю)

Поскольку

V,- ~ • Р1 - — Р1 М - ^о»

то, применяя (10) с последовательным уменьшением значения к, получаем

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Ч = 9\Ч>

где р< =—. №

Следовательно, получим выражения:

Рл = ; Рп = Р^о

или в общем случае

5. — пЯ 5! Гц - Рг Л) •

Осуществляя обратную подстановку (11) в (5), получаем

Р' ■ ГЛ> J2,

N + 1 N + 1

= п рн= п р№,о,...,о, 1=1 1=1

(11)

(12)

где Ро,о,...,о — вероятность нахождения СМО в состоянии ао, о,..., о> которая определяется с учетом условия нормировки (3)

л -1

Ро, о,..., о =

N +1

I п р/г

= 0, »и ;'2 = 0, »12

1 = 1

= 0, тъг+1

Подставим это выражение в (12), получим решение системы уравнений (1), дополненной условием нормировки (3),

N + 1

Пр?

(13)

Р' ■

гп> П> •••> JN + 1

1=1

}\ = О, Ш1 j2 = О, /И2

N + 1

п Р?

1=1

=0, тдг+1

Зная вероятности Р^-нахождения системы в состоянии аЛ> 72. > можно определить вероятности всех состояний, отличающихся корректностью работы версий программного обеспечения. Вернемся к формуле (2):

pt _ р1> >2. —. ТС

->Ь b iN+l - rjb j2, jN+1

»2> •••> t: л> 72. •■■> 7N+1

+ р»1.1-П2.-. ПС + рП, П>-Л-гк jl'h'-'jN+l "' ji> ]2> •••> JN+1'

Поскольку версии программного обеспечения предполагаются разработанными независимо, а потоки отказов — ординарными, то между ве-

роятностями состояний, отличающихся только корректностью работы версий программного обеспечения, существуют следующие соотношения:

Р1 -»1.

л . )2 . ;лг+1

Рп ,1-

л. Ь

рп, »2. ...,1-чс

л.

■»п» »i.....г»:

v r J Л>П>~> JN+1

Л > J2> ■•■> jN + 1'

(14)

n1> »2> —.1С jl,j2,-,jN+l'

Здесь р1,р2>—>рк — вероятности корректной работы версий программного обеспечения.

Сложив уравнения (14), с учетом формулы (2) получим

рг . _рп,п,...,гк

}2> •••> JN + l + l

К

1+ X (1 -рк)

к = 1

Это соотношение позволяет выразить вероятности всех состояний, в которых некорректно работают версии программного обеспечения, через уже известную нам вероятность , :

рП. »2. —» Л> )2, ••■> jN + 1

Di .

ГЛ' J2> ••■>

к

1+ S (1 -pk) k = 1

ПС _Pjl'j2'-'jN + l jl'j2>-y)N + l К '

1+ Z (1-pO

&=i

nl. l-^. —. 1С Pjl>j2'--jN+l (1-P2) jl> j2>-> jN + 1 К '

1+ S (1-pO

k = 1

(1-рк)

Л. ;'2.к

1+ Е (1-рО

Подставляя в первое из этих уравнений формулу (13), получаем выражение

N +1

Пр?

pil. Г2,...,гк _ « = 1

Л> 72..... jw+l

ЛГ + 1 к

I ПР? 1+S(1 -рк)

71 = 0, ТП\ ¿=1 к=1

;'2 = 0, т2

Ж+1 = 0, тлг+1

Таким образом, справедливость формулы (4) доказана.

Л, П2>.... гк

Полученные выражения для вероятностей состояний а / ^ ^

в стационарном режиме позволяют определить любые характеристики надежности проектируемого АПК, в частности, вероятность безотказной работы, т. е. нахождение в состояниях, обеспечивающих требуемый уровень производительности и безошибочную работу модулей программного обеспечения, которые используются в наиболее важных циклах управления и к которым обращение происходит наиболее часто.

Дальнейшее увеличение надежности АПК до требуемого уровня возможно как за счет увеличения числа элементов аппаратной части (процессоров и шин интерфейса), так и за счет увеличения функционально-эквивалентных модулей (версий) программного обеспечения. Эти подходы при своем использовании будут приводить к увеличению числа состояний СМО и увеличению вероятности безотказной работы системы, вычисленной ранее, так как дополнительно прибавятся вероятности состояний, при которых одновременно обеспечивается и требуемая производительность аппаратной составляющей вычислительного комплекса, и безошибочная работа к версий определенных ранее модулей программного обеспечения.

Данное аналитическое решение позволяет получать оценки надежности проектируемых многопроцессорных АПК с мультиверсионным программным обеспечением без существенных затрат вычислительных ресурсов, характерных для численного решения систем линейных алгебраических уравнений большой размерности.

Приведенное аналитическое решение является довольно громоздким, поэтому для удобства его использования целесообразно реализовать данную модель в виде программной системы. Эта система позволит рассчитывать требуемые показатели надежности в зависимости от архитектуры и параметров АПК: числа процессоров и шин памяти, интенсивно-стей их выхода из строя и восстановления, числа и вероятностей безошибочной работы версий программного обеспечения.

Пример применения предложенной модели. Предложенный подход частично реализован в виде программной системы, вычисляющей показатели надежности с использованием формулы (4) при условии безошибочной работы модулей программного обеспечения.

Зададим начальные характеристики многопроцессорной вычислительной системы [7] (рис. 2). Выберем пределы изменения числа процессоров первого типа т\ для построения графика изменения производительности от 0 до 4.

Расчет параметров надежности многопроцессорного вычислительного комплекса

Статистика

Конфигурация системы:

Количество типов процессоров, N 3

Количество процессоров каждого типе, m[i] 3 21 Количество шин интерфейса,« 1

Коэффициент связности, i. Время выполнения операции процессорами каждого типа, ТО Вреия цикла оперативной памяти для процессоров, т

i."?i6äz9644 42?95i3e-oS

Для конфигурации [I, 2, 1]

0.35

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0.66 3 57

запросы ООО 0 0 1 0 10 0 11 :0 2 0 ¡0 2 1 .10 0 '10 1 110

Построение графика производительности:: :

Изменяем количество процессоров типа 1 от 0 до 4

Требуемый уровень производительности 2,8

Вероятность 0.679202331524604 0.004965042493090657 Q.03387945371Q2S74 0.0002 47312096104286 0.002 63994&99742376S7 1.23«11?343Эе8125е-05 0.26413425948182 IS 0.0019320165270352667 0.013175343109.544 54 S.637137070722233t-Q5 О.ООО6572023£7S37019S 4 .3071230043952634-06

Для конфигурации {2, 2, 1J

Пуск |

Вероятность работы МВС с требуемым уровнем производительности

О 0,679 0,886 0.9570,987

Запрсск

ООО io О 1 0 10 !0 1 1 ;0 2 О 0 2 1 10 0 ;i о 1 110 ill 12 0 jl 2 1 ;2 О О 2 О 1

г i о

Эероязнасть

0.6123071376873908 О.0Q44S0192645S72764 0.03055261356636439 0.00022347784217821386 О.00152400210188S1594 1 - 11473507&74881е-05 О,2381972279896186 О.0017422994732782966 0.011331571942475036 8.6908049735Э7203е-05 0.0005926674840664507 4 .3350S08656S9317e-06 0.0926322553292961 О.0006775609062748929 0,0046206113109«&13

Рис. 2. Окно программы «Расчет показателей надежности МВК»

На рис. 3 приведен график зависимости пиковой производительности МВК от числа процессоров первого типа (число процессоров второго типа Ш2 = 2, число процессоров третьего типа тз = 1). Видно, что с увеличением числа процессоров в вычислительной системе рост производительности замедляется. Это связано с увеличением длины очереди процессоров на обслуживание.

Зададим требуемый уровень производительности МВК равным 2,8. Используя значения предельных вероятностей состояний системы можно вычислить вероятность работы МВК с требуемым уровнем производительности.

Из рис. 3 следует, что первая конфигурация (т\ =0, тг = 2, тз = 1) не обеспечивает требуемый уровень производительности, поэтому искомая вероятность равна нулю. Остальные данные приведены в таблице.

Рис. 3. Зависимость производительности МВК от числа процессоров первого типа

Таким образом, наращивая аппаратную составляющую АПК, можно получать требуемую вероятность нахождения АПК в состояниях, при которых обеспечивается необходимый

0 12 3 Число процессоров (т -

уровень производительности системы управления реального времени.

Результаты вычислений

Число процессоров МВК (ть т2, ш3) (0,2,1) (1,2,1) (2, 2,1) (3,2,1) (4,2,1)

Вероятность работы МВК с уровнем производительности 2,8 0 0,679 0,886 0,957 0,987

Чтобы учесть ненадежную работу версий программного обеспечения, необходимо оценить величины вероятностей корректной работы компонентов программного обеспечения р\, р2>..., рк■ Очевидно, что в соответствии с формулой (4) снижение данных показателей будет уменьшать и вероятность работы МВК с требуемым уровнем производительности (см. таблицу).

Заключение и направления дальнейших исследований. Предложенная математическая модель может быть использована для автоматизации проектирования многопроцессорных АПК. На практике целесообразно стремиться к тому, чтобы проектируемая система управления реального времени имела наибольшую возможную надежность при условии, что система достигает целей управления, а затраты на ее создание и эксплуатацию не превосходят выделенные средства. Таким образом, приходим к задаче условной оптимизации, в которой целевая функция выражается через вероятности состояний, рассчитываемые в рамках предложенной модели по формуле (4). Несмотря на то что для показателей надежности многопроцессорного АПК существуют аналитические выражения, данная задача оптимизации имеет ряд неудобных особенностей: оптимизируемые переменные являются дискретными, наличие единственного экстремума не гарантированно, а объем пространства поиска быстро растет с ростом числа типов процессоров.

При решении подобных задач оптимизации хорошо зарекомендовали себя эволюционные алгоритмы оптимизации, например, генетический алгоритм [13], алгоритм генетического программирования [14], асимптотический вероятностный генетический алгоритм [15], а также их самонастраивающиеся модификации [16]. Поэтому исследование эффективности эволюционных алгоритмов при оптимизации надежности многопроцессорных АПК с мультиверсионным программным обеспечением может быть указано как возможное направление дальнейших исследований.

ЛИТЕРАТУРА

[1] Васильев В.А., Легков К.Е., Левко И.В. Системы реального времени и области их применения. Информация и космос, 2016, № 3, с. 68-70.

[2] Buttazzo G. Hard real-time computing systems: predictable scheduling algorithms and applications. New York, Springer, 2011.

[3] Kumar S. Fundamental limits to Moore's law.

URL: https://arxiv.org/abs/1511.05956 (дата обращения: 05.03.2020).

[4] Липаев B.B. Экономика производства программных продуктов. М., Синтег, 2011.

[5] Ковалев И.В., Соловьев Е.В., Ковалев Д.И. и др. Использование метода роя частиц для формирования состава мультиверсионного программного обеспечения. Приборы и системы. Управление, контроль, диагностика, 2013, № 3, с. 1-6.

[6] Ковалев И.В., Лосев В.В., Сарамуд М.В. и др. К вопросу реализации мультивер-сионной среды исполнения бортового программного обеспечения автономных беспилотных объектов средствами операционной системы реального времени. Вестник СибГАУ, 2017, № 1, с. 58-61.

[7] Ефимов С.Н., Терсков В.А. Реконфигурируемые вычислительные системы обработки информации и управления. Красноярск, Изд-во КрИЖТ ИрГУПС, 2013.

[8] Efimov S.N., Tyapkin V.N., Dmitriev D.D., et al. Methods of assessing the characteristics of the multiprocessor computer system adaptation unit /. Siberian Federal University. Mathematics & Physics, 2016, vol. 9, no. 3, pp. 288-295.

DOI: https://doi.org/10.17516/1997-1397-2016-9-3-288-295

[9] Avizienis A. The N-version approach to fault-tolerant software. IEEE Trans. Soft. Eng., 1985, vol.SE-ll.no. 12, pp. 1511-1517.

DOI: https://doi.Org/10.l 109/TSE.1985.231893

[10] Лашков A.A. Решение СЛАУ с разреженной матрицей методом приведения к блочному диагонально-окаймленному виду. Процессы управления и устойчивость, 2014, т. 1, № 1, с. 347-351.

[11] Юлдашев A.B., Гатиятуллин М.З. Сравнительное исследование эффективности ряда библиотек, реализующих алгоритмы решения разреженных матриц. Вектор науки Тольяттинского государственного университета, 2012, № 4, с. 130-134.

[12] Эварт Т.Е., Лазарева А.Б. Алгоритм решения систем линейных алгебраических уравнений с разреженными матрицами. Приволжский научный вестник, 2013, № 12-2, с. 91-92.

[13] Goldberg D.E. Genetic algorithms in search, optimization, and machine learning. New York, Addison-Wesley, 1989.

[14] Ефимов C.H., Егоров A.C., Семенкин E.C. Алгоритм генетического программирования с автоматически определяемыми функциями для выбора спецпроцессоров МВС интеллектуального анализа данных в режиме реального времени. Информационные технологии и математическое моделирование. Томск, Изд-во ТГУ, 2006, с. 223-225.

[15] Галушин П.В. Разработка и исследование асимптотического вероятностного генетического алгоритма. Журнал Сибирского федерального университета. Сер. Математика и физика, 2012, № 1, с. 49-56.

[16] Semenkin Е., Semenkina М. Stochastic models and optimization algorithms for decision support in spacecraft control systems preliminary design. Informatics in Control, Automation and Robotics, Lecture Notes in Electrical Engineering, 2014, vol. 283, pp. 51-65. DOI: https://doi.org/10.1007/978-3-319-03500-0_4

Ефимов Сергей Николаевич — канд. техн. наук, доцент кафедры информационно-управляющих систем СибГУ им. М.Ф. Решетнева (Российская Федерация, 660037, г. Красноярск, пр-т им. газеты Красноярский рабочий, д. 31).

Терсков Виталий Анатольевич — д-р техн. наук, профессор кафедры информационно-управляющих систем СибГУ им. М.Ф. Решетнева (Российская Федерация, 660037, г. Красноярск, пр-т им. газеты Красноярский рабочий, д. 31).

Галушин Павел Викторович — канд. техн. наук, доцент кафедры информационно-правовых дисциплин и специальной техники СибЮИ МВД России (Российская Федерация, 660131, г. Красноярск, ул. Рокоссовского, д. 20).

Ярков Константин Владимирович — аспирант кафедры управления персоналом КрИЖТ ИрГУПС (Российская Федерация, 660028, г. Красноярск, ул. Ладо Кецхо-вели, д. 89).

Просьба ссылаться на эту статью следующим образом:

Ефимов С.Н., Терсков В.А., Галушин П.В. и др. Модель надежности многопроцессорных аппаратно-программных комплексов систем управления реального времени с мультиверсионным программным обеспечением. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение, 2021, № 4 (137), с. 41-58. DOI: https://doi.org/10.18698/0236-3933-2021-4-41-58

RELIABILITY MODEL OF MULTIPROCESSOR HARDWARE-SOFTWARE COMPLEXES OF REAL-TIME CONTROL SYSTEMS WITH MULTI-VERSION SOFTWARE

S.N. Efimov1 V.A. Terskov1 P.V. Galushin2 K.V. Yarkov3

efimov@bk.ru terskowa@mail.ru galushin@gmail.com yarkov_kv@krsk.irgups.ru

1 Reshetnev University, Krasnoyarsk, Russian Federation

2 Siberian Law Institute of the Ministry of Internal Affairs of the Russia, Krasnoyarsk, Russian Federation

3 Krasnoyarsk Institute of Railway Transport branch of the ISTU, Krasnoyarsk, Russian Federation

Abstract

Reliability is a critical parameter of real-time control systems. In practice, the reliability of hardware and software complexes included in such systems, is ensured by creating redundancy of hardware components and a multi-version approach to software development But the redundant reservation of hardware devices and too many versions of software can lead to unjustified growth in the cost of creating and operating the projected control system. A rational approach to the design requires the creation of a model, which allows evaluating the reliability of different hardware and software complex configurations at the design stage. We proposed a mathematical reliability model of hardware and software complexes of real-time control systems, built with the use of mathematical apparatus of the queueing theory, which is a system of differential equations for the probability of finding states in the system, in which one or another component of the hardware and software complex is faulty. From the system of differential equations, the system of linear algebraic equations for probabilities of states in a steady-state mode was obtained. An analytical solution of this system is given, which allows us to evaluate the reliability of multiprocessor hardware-software complexes with multi-version software without significant expenditure of computational resources. Possibilities of using the results obtained to optimize the reliability of multiprocessor hardware-software complexes with multi-version software are presented and directions for further research are proposed

Keywords

Hardware complex, model, reliability, real-time control systems, queueing theory, n-version programming

Received 04.09.2020 Accepted 01.02.2021 © Author(s), 2021

REFERENCES

[1]Vasil'ev V.A., Legkov К.Е., Levko I.V. Real-time systems and their application. Informatsiya i kosmos [Information and Space], 2016, no. 3, pp. 68-70 (in Russ.).

[2] Buttazzo G. Hard real-time computing systems: predictable scheduling algorithms and applications. New York, Springer, 2011.

[3] Kumar S. Fundamental limits to Moore's law.

Available at: https://arxiv.org/abs/1511.05956 (accessed: 05.03.2020).

[4] Lipaev V.V. Ekonomika proizvodstva programmnykh produktov [Economics of software development]. Moscow, Sinteg Publ., 2011.

[5] Kovalev I.V., Solov'ev E.V., Kovalev D.I., et al. This article discusses a method particle swarm (MRCH) and the possibility of its application to the problem of forming multi-versioning software. Pribory i sistemy. Upravlenie, kontrol', diagnostika [Instruments and Systems: Monitoring, Control and Diagnostics], 2013, no. 3, pp. 1-6 (in Russ.).

[6] Kovalev I.V., Losev V.V., Saramud M.V., et al. To the question of implementation of multi-version execution environment software of onboard autonomous pilotless objects by means of real-time operating system. Vestnik SibGAU, 2017, no. 1, pp. 58-61 (in Russ.).

[7] Eflmov S.N., Terskov V.A. Rekonfiguriruemye vychislitel'nye sistemy obrabotki informatsii i upravleniya [Reconfigurable computing systems for information processing and management]. Krasnoyarsk, KrIZhT IrGUPS Publ., 2013.

[8] Eflmov S.N., Tyapkin V.N., Dmitriev D.D., et al. Methods of assessing the characteristics of the multiprocessor computer system adaptation unit. /. Siberian Federal University. Mathematics & Physics, 2016, vol. 9, no. 3, pp. 288-295.

DOI: https://doi.org/10.17516/1997-1397-2016-9-3-288-295

[9] Avizienis A. The N-version approach to fault-tolerant software. IEEE Trans. Soft. Eng., 1985, vol. SE-ll,no. 12, pp. 1511-1517.

DOI: https://doi.Org/10.l 109/TSE.1985.231893

[10] Lashkov A.A. Solution of SLAE with sparse matrix by reducing to a bordered blockdiagonal form. Protsessy upravleniya i ustoychivost' [Control Processes and Stability], 2014, vol. 1, no. 1, pp. 347-351 (in Russ.).

[11] Yuldashev A.V., Gatiyatullin M.Z. A comparative study of efficiency of several libraries implementing algorithms for solving sparse linear systems on NVidia GPUS. Vektor nauki Tol'yattinskogo gosudarstvennogo universiteta [Science Vector of Togliatti State University], 2012, no. 4, pp. 130-134 (in Russ.).

[12] Evart Т.Е., Lazareva A.B. Algorithm of solving systems of linear algebraic equations with sparse matrices. Privolzhskiy nauchnyy vestnik [Privolzhsky Scientific Journal], 2013, no. 12-2, pp. 91-92 (in Russ.).

[13] Goldberg D.E. Genetic algorithms in search, optimization and machine learning. New York, Addison-Wesley, 1989.

[14] Efimov S.N., Egorov A.S., Semenkin E.S. [Genetic programming algorithm with auto-detected functions for the selection of special processors MCS for data mining in real time]. Informatsionnye tekhnologii i matematicheskoe modelirovanie [Information Technologies and Mathematical Modelling], Tomsk, TGU Publ., 2006, pp. 223-225 (in Russ.).

[15] Galushin P.V. Design and analysis of asymptotic probabilistic genetic algorithm. Zhurnal Sibirskogofederal'nogo universiteta. Ser. Matematika ifizika [Journal of Siberian Federal University. Mathematics and Physics], 2012, no. 1, pp. 49-56 (in Russ.).

[16] Semenkin E., Semenkina M. Stochastic models and optimization algorithms for decision support in spacecraft control systems preliminary design. Informatics in Control, Automation and Robotics, Lecture Notes in Electrical Engineering, 2014, vol. 283, pp. 51-65. DOI: https://doi.org/10.1007/978-3-319-03500-0_4

Efimov S.N. — Cand. Sc. (Eng.), Assoc. Professor, Department of Information and Control Systems, Reshetnev University (Imeni gazety Krasnoyarskiy rabochiy prospekt 31, Krasnoyarsk, 660037 Russian Federation).

Terskov V.A. — Dr. Sc. (Eng.), Professor, Department of Information and Control Systems, Reshetnev University (Imeni gazety Krasnoyarskiy rabochiy prospekt 31, Krasnoyarsk, 660037 Russian Federation).

Galushin P.V. — Cand. Sc. (Eng.), Assoc. Professor, Department of Information and Legal Disciplines and Special Equipment, Siberian Law Institute of the Ministry of Internal Affairs of Russia (Rokossovskogo ul. 20, Krasnoyarsk, 660131 Russian Federation).

Yarkov K.V. — Post-Graduate Student, Department of Personnel Management, Krasnoyarsk Institute of Railway Transport branch of the ISTU (Lado Ketskhoveli ul. 89, Krasnoyarsk, 660028 Russian Federation).

Please cite this article in English as:

Efimov S.N., Terskov V.A., Galushin P.V., et al. Reliability model of multiprocessor hardware-software complexes of real-time control systems with multi-version software. Herald of the Bauman Moscow State Technical University, Series Instrument Engineering, 2021, no. 4 (137), pp. 41-58 (in Russ.). DOI: https://doi.org/10.18698/0236-3933-2021-4-41-58

i Надоели баннеры? Вы всегда можете отключить рекламу.