Научная статья на тему 'Событийные модели дублированных систем с версионно-временной избыточностью при кратных и парных дефектах программно-аппаратных средств'

Событийные модели дублированных систем с версионно-временной избыточностью при кратных и парных дефектах программно-аппаратных средств Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
157
29
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Харченко Вячеслав Сергеевич, Шурыгин Олег Викторович

Моделируются события, связанные с кратными и парными дефектами программных и аппаратных средств в дублированных структурах информационноуправляющих систем с временной и версионной избыточностью, не имеющих встроенных средств контроля каналов. Оценивается уровень контролепригодности и отказоустойчивости этих систем с применением детерминированных показателей. Даются рекомендации по выбору структур, которые отличаются количеством программных версий и алгоритмами обработки информации.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Харченко Вячеслав Сергеевич, Шурыгин Олег Викторович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The model of events of doubled systems with temporal and version redundancy at multiple and pair defects of hardware-software means

The events bound with multiple and pair defects software and hardware in the dual frames of I&C systems are modeled of a not having built-in monitoring facilities of channels in which one is applied combined structural (hardware), temporary and version redundancy. The testability and fault tolerance of these systems using the determined measures are estimated. The guidelines are given at the choice of frames, which one differ by quantity of software versions and processing algoritms of the information.

Текст научной работы на тему «Событийные модели дублированных систем с версионно-временной избыточностью при кратных и парных дефектах программно-аппаратных средств»

УДК 681.51+192:681.3.06

СОБЫТИЙНЫЕ МОДЕЛИ ДУБЛИРОВАННЫХ СИСТЕМ С ВЕРСИОННО-ВРЕМЕННОЙ ИЗБЫТОЧНОСТЬЮ ПРИ КРАТНЫХ И ПАРНЫХ ДЕФЕКТАХ ПРОГРАММНО-АППАРАТНЫХ СРЕДСТВ

ХАРЧЕНКО В. С, ШУРЫГИН О.В.___________

Моделируются события, связанные с кратными и парными дефектами программных и аппаратных средств в дублированных структурах информационно-управляющих систем с временной и версионной избыточностью, не имеющих встроенных средств контроля каналов. Оценивается уровень контролепригодности и отказоустойчивости этих систем с применением детерминированных показателей. Даются рекомендации по выбору структур, которые отличаются количеством программных версий и алгоритмами обработки информации.

1. Введение

В информационно-управляющих системах, важных для безопасности критических приложений (в частности, АЭС [1,2]), реализуется принцип единичного отказа. Для его выполнения необходимо выявить все возможные причины отказов при проектировании и обеспечить работоспособность при любом исходном событии — отказе элементов (программных и аппаратных средств). Для этого следует предусмотреть средства, позволяющие обнаружить, локализовать и парировать возможный отказ. Одним из методов решения такой задачи является использование различных видов избыточности — структурной или аппаратной (для парирования устойчивых отказов), временной (для защиты от сбоев) и версионной (для обеспечения устойчивости к дефектам программных средств). Удачным примером отказоустойчивых структур являются дублированные структуры с комбинированной избыточностью (ДСКИ) [3]. В этих структурах в двух каналах реализуются различные программно -аппаратные версии, результаты работы которых сравниваются и при несовпадении осуществляется повторный счет (по тем же или другим версиям).

Множество возможных состояний работоспособности ДСКИ содержит три характерные области. Первая - множество исправных состояний. Вторая — множество работоспособных состояний с разным объёмом неисправностей. Третья - множество неработоспособных состояний, переходы в которые отличаются разным объёмом потерь. Опасные состояния располагаются во второй и третьей областях. Для многих систем со сложной структурой, создаваемых на принципах многоверсионности, довольно сложно учесть все опасные состояния элементов системы и пути перехода в них и из них.

Выделение на стадии разработки объекта исходных событий - «аварий», порождаемых кратными отказами (двух и более элементов системы в один момент времени) и парными отказами (двух и более элементов системы в разные моменты времени — при повторном счете), требует больших усилий и затрат. Хотя вероятность возникновения кратных и парных отказов значительно меньше, чем одиночных, и при анализе технико-экономических потерь ими можно пренебречь, для анализа безопасности этого делать нельзя. Статистика аварий показывает, что именно при кратных и парных отказах наиболее высока вероятность переходов системы в опасные состояния. Даже если удалось учесть все одиночные отказы, обеспечить высокий уровень безопасности не удается [4].

В работах [3,5] были проведены исследования моделей отказоустойчивости различных структур ДСКИ при одиночных отказах и сбоях (событиях). Результаты показали, что наилучшей является трех-

версионная структура {А, Б; В, А, в которой при первом выполнении функций реализуются версии А, Б, при втором (в случае несовпадения результатов) — версии В и А . В случае двухверсионной реализации функций наиболее предпочтительной является структура {А, Б; Б, А.

Цель данной работы—исследование отказоустойчивости одноверсионных структур {А, А; А, А и наилучших (при одиночных событиях) двух-, трех- и четырехверсионныхДСКИ ({А, Б; Б, А, {А, Б; В, А, {А, Б; В, А) при кратных и парных событиях (отказах). При этом используются структурно-логическая модель ДСКИ, модели аппаратных средств (АС), модели дефектов программных средств (ПС) и детерминированные показатели достоверности (полноты) контроля, глубины диагностирования и отказоустойчивости, основанные на переборе событий, связанных с отказами, сбоями и программными дефектами различных компонент [5].

2. Основные положения и принятые допущения

На рис. 1 показаны элементы ДСКИ, где могут иметь место кратные и парные события.

Под кратным событием, происходящим в системе при выполнении версии Vij на интервале [0, т], будем понимать: сбои, устойчивые отказы АС, а также дефекты ПС, проявляющиеся во время Ц є 0, х; t2 є 0,х в различных каналах. Первая позиция индекса (i) версии V указывает на номер канала, вторая (j) -на номер интервала.

Под парным событием, происходящим в системе при выполнении версии Vij на интервалах [0, г], [г,2г], будем понимать: сбои, устойчивые отказы АС, а также дефекты ПС, проявляющиеся во время tn є 0,х; tj2 єх,2х в одном канале.

РИ, 2003, № 1

65

1 канал

2 канал

Рис.1. Элементы структуры, временные интервалы, где могут иметь место кратные и парные события

Расчёты детерминированных показателей с учётом влияния кратных и парных дефектов проводятся при следующих условиях и допущениях: кратное или парное событие за время анализа происходит одно; при совпадении результатов повтор не производится; кратное событие невозможно в одном канале; парное событие невозможно в двух каналах; средства сравнения абсолютно надежны.

Дефекты делятся на связанные и несвязанные. Связанные имеют место одновременно как в программной, так и в аппаратной компонентах. Несвязанные дефекты возникают или в программной, или в аппаратной компоненте.

3. Оценка влияния кратных и парных дефектов на детерминированные показатели

Оценка проводится с использованием моделей множеств событий, которые могут иметь место в рассматриваемых структурах при соблюдении введенных условий и допущений. Более тёмным цветом для всех моделей обозначено множество ПС. Темными точками на множествах АС и ПС обозначены возможные одиночные дефекты, сплошными линиями между тёмными точками на множестве АС показаны несвязанные кратные и парные дефекты. Во всех рассматриваемых моделях пунктирными линиями между тёмными точками на множестве ПС показаны несвязанные кратные и парные дефекты, а пунктирными линиями между тёмными точками на множествах АС и ПС показаны связанные кратные и парные дефекты. Буквами А, Б, В, Г указаны различные версии выполнения функции (рис. 2-9).

АС систем включают: совместные АС версий, образующие ядро системы (показаны пересечением множеств); индивидуальные АС версий - оболочки системы (например, средства хранения различных программ выполнения одноименных функций); средства сравнения, обеспечивающие сравнение результатов выполнения функций в каналах на первом и втором интервалах (на рис. 2-9 не показаны). К ядру относятся те средства, участвующие в реализации двух версий, отказ которых ведет к отказу канала. Отказ индивидуальных АС версий делает невозможным реализацию только одной из них.

Дефекты версий ПС состоят из: абсолютных дефектов, которые обусловливаются неполнотой, некорректностью технического задания и другими причинами, общими для всех программных версий (показаны пересечением множеств); относитель-

ных дефектов, характерных только для одной версии и обусловленных индивидуальными ошибками, внесенными при ее проектировании и не обнаруженными при тестировании; групповых дефектов, являющихся общими для двух и трех версий [6] (показаны пересечением двух, трёх множеств). В событийных моделях ДСКИ показана только основная часть множеств возможных кратных и парных событий из-за их большого количества в рассматриваемых двух-, трёх- и четы-рёхверсионных структурах. Подразумевается, что точки, обозначающие отказы, сбои АС, относительные, групповые, частично групповые (для че-тырёхверсионных структур), абсолютные дефекты ПС в разных каналах в один момент времени (при кратных событиях) или в одном канале в разные моменты времени (при парных событиях), соединены между собой линиями, указывающими на возможность возникновения различных связанных и несвязанных кратных и парных событий.

Модели множеств возможных кратных и парных событий в рассматриваемой одноверсионной структуре представлены на рис. 2 и 3.

На рис. 2 множества ПС обозначены АП, множества АС — Af , АА • Нижний индекс указывает номер канала, верхний индекс — принадлежность программным, аппаратным средствам. На рис. 3 обозначение нижнего индекса АС указывает временной интервал выполнения функции.

Рис. 2. Модель множеств возможных кратных событий в одноверсионной структуре

Рис. 3. Модель множеств возможных парных событий в одноверсионной структуре

66

РИ, 2003, № 1

Модели множеств возможных кратных и парных событий в рассматриваемых двух-, трех- и четырех-версионной структурах приведены на рис. 4-9 соответственно.

Рис. 4. Модель множеств возможных парных событий в двухверсионной структуре

Рис. 5. Модель множеств возможных кратных событий в двухверсионной структуре

Рис. 6. Модель множеств возможных кратных событий в трёхверсионной структуре

В результате анализа рассмотренных моделей событий построены диаграммы возможных значений числа событий М, значений полноты контроля, глубины диагностирования, уровня дефектоустойчивости для выбранных структур.

РИ, 2003, № 1

Рис. 7. Модель множеств возможных парных событий в трёхверсионной структуре

Рис. 8. Модель множеств возможных кратных событий в четырёхверсионной структуре

Рис. 9. Модель множеств возможных парных событий в четырёхверсионной структуре

67

На диаграммах по оси абсцисс показаны упрощенные схемы четырёх выбранных структур, где первая (вторая) строка соответствует версиям, выполняемым в первом (втором) канале на интервалах [0, т] и [т,2т]. Диаграмма возможных событий приведена на рис. 10.

М

Рис. 10. Диаграмма возможных кратных и парных событий в системах (парные события обозначены более плотной штриховкой)

По оси ординат приведено число возможных кратных и парных событий в системе М . Величины чисел М формируются исходя из анализа моделей множеств возможных кратных и парных событий в структурах различной версионности, учитывая, что в компонентах АС возможны сбои и отказы, а в компонентах ПС возможны проявления относительных, групповых и абсолютных дефектов.

Результаты вычислений частных детерминированных показателей [2] приведены в таблице.

Частные детерминированные показатели Варианты структур

А А А А А Б Б А А Б В А А Б В Г

Т А ^кр. 1 1 1 1

Т А ^пар . 1 1 1 1

Т А,П Ткр. 1 1 1 1

Т А,П Тпар. 1 1 1 1

Т П ^кр. 1 1 1 1

Т П ^пар. 0 1 1 1

0кр.А 0,125 0 0 0

А Опар. 0 0 0 0

Окр.^ 0 0 0 0

ОпЯр А’П 0 0 0 0

ОкрП - 0 0 0

°пар. 0 0 0 0

d^ 0,125 1 1 1

Йпар. 1 1 0,5 0,5

d А,П dm 0 0,66 0,66 0,142

Йпар.^ 0 0,5 0,36 0,2

dкp.П - 0,25 0,5 0,07

d П Чпар. 0 0,66 0,06 0

68

В таблице указаны следующие частные детермини-

А А

рованные показатели: LКр , Ьтр — полнота контроля несвязанных кратных и парных дефектов, соответственно, аппаратной компоненты; LmjP , ^КрП — полнота контроля связанных парных и кратных дефектов, соответственно, аппаратной и программной компоненты; Ь'Лар , Ь^р — полнота контроля несвязанных парных и кратных дефектов, соответственно, программной компоненты; q пар ,

—глубина диагностирования несвязанных парных и кратных дефектов, соответственно, аппаратной компоненты; q щр1, q КрП — глубина диагностирования связанных парных и кратных дефектов, соответственно, аппаратной и программной компоненты; q пар , q Кр — глубина диагностирования несвязанных парных и кратных дефектов, соответственно, программной компоненты; d пар , d кр — уровень дефектоустойчивости несвязанных парных и кратных дефектов, соответственно, аппаратной компоненты; d Пар, d КрП — уровень дефектоустойчивости связанных парных и кратных дефектов, соответственно, аппаратной и программной компоненты; d Пар , d Кр — уровень дефектоустойчивости несвязанных парных и кратных дефектов, соответственно, программной компоненты.

Оценка детерминированных показателей проведена путем сопоставления всех возможных кратных и парных событий в выбранных системах, при которых отказы и сбои, обусловленные дефектами аппаратных и программных средств, обнаруживаются, локализуются, парируются. Результаты вычислений и их сравнительный анализ приведен на рис. 11 в зависимости от варианта возникновения дефектов.

ЬкрЩкрД

1-.

0,8-

0,6-

0,4

0,2-

0-

■ЗУ

А А

А А

А Б

Б А

А Б

В А

А Б

В Г

LnapjQnaps dn

а

£Э С. ^:

“1 ZI л а

А А і К Б 1 К Б А Б

А А Б А В А В Г

б

Рис.11. Диаграмма полноты контроля, глубины диагностирования, уровня дефектоустойчивости при кратных (а) и парных (б) дефектах

РИ, 2003, № 1

4. Анализ результатов

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Анализ полученных моделей диаграмм различных показателей позволяет сделать обобщенные выводы о свойствах систем с комбинированной избыточностью:

— при кратных и парных дефектах полнота контроля во всех выбранных структурах максимальна. Это обусловлено тем, что разные дефекты программных и аппаратных средств каналов приводят к различным результатам выполнения функций;

— во всех выбранных структурах при кратных и парных дефектах глубина диагностирования мала ввиду того, что кратные и парные дефекты одновременно охватывают две версии. Обеспечить более высокую глубину диагностирования возможно, применяя тройной просчёт;

—уровень дефектоустойчивости увеличивается при переходе к двух- и трехверсионным структурам.

5. Выводы

Особенность исследованных структур - отсутствие встроенных средств контроля и возможность автоматической локализации неисправностей, которая достигается применением комбинированной (струк-турно-версионно-временной) избыточности в разных вариантах построения структур. Вследствие этого время поиска работоспособной конфигурации незначительно, что соответствует требованиям для систем, работающих в реальном масштабе времени. Поэтому для необслуживаемых систем с высокими требованиями безопасности и надёжности рекомендуется применять трех- и четырёхвер-сионные ДСКИ.

Для обслуживаемых систем, где важно зафиксировать факт неисправности и принять правильное решение для ее устранения, рекомендуется применять двух- и трехверсионные ДСКИ. Глубина диагностирования таких структур может быть увеличена применением модифицированного дуального программирования, где наряду с достаточно точной, но сложной основной программой используется менее точная, но простая резервная программа.

Таким образом, данный подход позволяет на этапах проектирования проводить анализ безопасности специальных архитектурных решений с применением многоверсионного программирования и тем самым управлять достижением требуемой надежности и безопасности информационно-управляю-щих систем.

Литература: 1. Ястребенецкий М.А., Розен Ю.В., Виноградская С.В., Гольдрин В.М., Спектор Л.И., Васильченко В.Н. Нормирование и оценка безопасности информационных и управляющих систем АЭС: регулирующие требования к ИУ С // Ядерная и радиационная безопас -ность. 2001. № 3. С. 3-11. 2. Харченко В. С., Ястребенецкий М.А., Васильченко В.Н. Нормирование и оценка безопасности информационных и управляющих систем АЭС: требования к программному обеспечению ИУС // Ядерная и радиационная безопасность. 2002. № 1. С.14-29. 3. Харченко В.С., Ильина О.В. Выбор архитектур дефектоустойчивых вычислительных систем с последовательно-параллельным выполнением задач // Электронное моделирование. 1998.№2. С.77-90. 4. ВоликБ.Г. О концепциях техногенной безопасности // Автоматика и телемеханика. 1998. №2. С. 165-170. 5. Харченко В.С. Шурыгин О.В. Детерминированная оценка показателей отказоустойчивости дублированных структур с временной и версионной избыточностью // Электронное моделирование. 2000. Т.22, №3. С.41-52. 6. Харченко В. С. Теоретические основы дефектоустойчивых цифровых систем с версионной избыточностью. Харьковский военный университет, 1996. 503с.

Поступила в редколлегию 03.11.2002

Рецензент: д-р техн. наук, проф. Кривуля Г.Ф.

Харченко Вячеслав Сергеевич, Заслуженный изобретатель Украины, д-р техн. наук, профессор, заведующий кафедрой компьютерных систем летательных аппаратов Национального Аэрокосмического университета им. Н.Е. Жуковского “ХАИ”. Научные интересы: надежность, живучесть и безопасность критических компьютерных систем и технологий. Адрес: Украина, 61070, Харьков, ул. Чкалова, 17, тел (0572) 44-25-14, 4423-56.

Шурыгин Олег Викторович, старший научный сотрудник лаборатории Научного метрологического центра (военных эталонов). Научные интересы: методы и средства обеспечения отказоустойчивости информационных систем управления, надежность воспроизведения и передачи физических величин. Адрес: Украина, 61000, Харьков, ул.Полтавский Шлях, 186, тел (057) 772-80-63

РИ, 2003, № 1

69

i Надоели баннеры? Вы всегда можете отключить рекламу.