Научная статья на тему 'Новые возможности для исследования эффективности стратегий технического обслуживания отказоустойчивых систем с комбинированным резервированием'

Новые возможности для исследования эффективности стратегий технического обслуживания отказоустойчивых систем с комбинированным резервированием Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
108
46
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Мандзий Б. А., Волочий Б. Ю., Озирковский Л. Д.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Новые возможности для исследования эффективности стратегий технического обслуживания отказоустойчивых систем с комбинированным резервированием»

Мандзий Б.А. , Волочий Б.Ю., Озирковский Л.Д. НОВЫЕ ВОЗМОЖНОСТИ ДЛЯ ИССЛЕДОВАНИЯ ЭФФЕКТИВНОСТИ СТРАТЕГИЙ ТЕХНИЧЕСКОГО ОБСЛУЖИВАНИЯ ОТКАЗОУСТОЙЧИВЫХ СИСТЕМ С КОМБИНИРОВАННЫМ РЕЗЕРВИРОВАНИЕМ

В практике проектирования радиоэлектронных систем ответственного назначения используются отказоустойчивые системы с комбинированным структурным резервированием, а именно:

отказоустойчивая система с мажоритарной структурой и со скользящим резервированием ее модулей [2]; отказоустойчивая система с мажоритарной структурой, модули которой имеют мажоритарную структуру и для всех модулей предусмотрен скользящий резерв.

Одной из задач надежностного проектирования отказоустойчивых систем является задача выбора стратегии ее технического обслуживания. При выборе стратегии технического обслуживания (ТО) нужно дать (иметь) ответ на такие вопросы:

1) Как строить отношения с ремонтником? Где находится ремонтник? ремонтник находится постоянно на объекте;

ремонтника вызывают в определенной ситуации (например, последний резервный модуль или последняя резервная подсистема включена в рабочую конфигурацию отказоустойчивой системы); ремонтник прибывает на объект по графику.

2) Что подлежит, и что не подлежит восстановлению в заданной конфигурации отказоустойчивой системы? Сколько ремонтников необходимо привлечь к проведению технического обслуживания отказоустойчивой системы?

Когда ремонтник получает информацию о состоянии очереди на ремонт?

Какой порядок (какая последовательность) выполнения ремонтных (восстановительных) работ? Какие условия накладываются на выполнение ремонтных (восстановительных) работ?

После выбора стратегии ТО необходимо определить (исследовать) при каких параметрах она обеспечивает заданную (требуемую) надежность отказоустойчивой системы. Или, при каких параметрах отказоустойчивой системы выбранная стратегия ТО с заданными параметрами будет обеспечивать требуемую надежность отказоустойчивой системы.

Исследование стратегии ТО для выбранной (заданной) отказоустойчивой системы проводится с целью решения следующих задач. Владелец объекта хочет определить, какое количество ТО и с каким периодом надо заказать для обеспечения требуемой надежности на заданном интервале эксплуатации отказоустойчивой системы. Фирма поставщик аппаратуры, хочет определить:

необходимое количество технических обслуживаний для обеспечения заданного уровня надежности на время гарантийного обслуживания и оценить экономическую целесообразность ТО. Если необходимое для аппаратуры количество ТО, превышает разумное (например, по экономическому критерию) значение, то может приниматься решение после какого срока эксплуатации следует осуществить полную замену аппаратуры.

максимальное количество объектов, которые можно закрепить за одним ремонтником (ремонтной бригадой), чтобы при заданной стратегии ТО надежность отказоустойчивых систем отвечала заданным требованиям.

В данной работе поставлена и решена задача разработки надежностных моделей отказоустойчивой системы с мажоритарной структурой и скользящим резервированием ее модулей [2, 5] для исследования эффективности стратегий ее технического обслуживания.

Рассмотрение такой отказоустойчивой системы в объединении со стратегиями ее технического обслуживания существенно усложняет и без того уже сложную задачу разработки надежностной модели [1]. Задача решается с применением технологии моделирования представленной в [3].

Формирование стратегий технического обслуживания отказоустойчивой системы с мажоритарной структурой и со скользящим резервированием ее модулей.

Стратегия 1. В конфигурации отказоустойчивой системы предусмотрено полное обновление модулей основного функционального назначения (МОФН). Количество ремонтов для модулей основного функционального назначения ограничено, что обусловлено ограничением на количество ремонтных комплектов запасных частей, которые выделены для технического обслуживания отказоустойчивой системы. Не предусмотрен ремонт: вос-

станавливающего органа, детектора рассогласования и модуля переключения.

В данной стратегии техническое обслуживание осуществляет 1 ремонтник (или 1 ремонтная бригада, если для ремонта одного МОФН отказоустойчивой системы необходимо привлекать более чем одного ремонтника). Квалификация ремонтника учитывается параметром: среднее значение интервала времени, необходимого на

ремонт МОФН. Ремонтник находится непосредственно на объекте и приступает к ремонтным работам после окончания процедуры обнаружения неисправного МОФН в ядре (аварийный ремонт). Профилактическое обслуживание отказоустойчивой системы в данной стратегии ТО не предусмотрено.

Неисправные МОФН после отказа поступают в ремонт, если ремонтник свободен. Если же ремонтник занят, то они образовывают очередь на ремонт. Модуль основного функционального назначения в очередь не ставится, если исчерпано допустимое количество ремонтов. Он изымается из конфигурации отказоустойчивой системы. Когда ремонтник заканчивает ремонт МОФН, он приступает к ремонту следующего неисправного МОФН, который находится в очереди. Для модулей ремонт всегда успешен и обеспечивает полное их обновление. Когда очередь неисправных МОФН отсутствует, то ремонтник находится в состоянии ожидания (дежурство).

Отремонтированный (обновленный) МОФН включается в резерв. Также существует ситуация, когда он включается в основное ядро (если там есть место), но тогда один МОФН из резерва также пополняет ядро (чтобы обеспечить непарное количество модулей) и происходит изменение правила принятия решения в восстанавливающем органе.

Продолжительность одного ремонта случайная величина. Поэтому время пребывания неисправных модулей в очереди также случайная величина. В данной стратегии ТО количество ремонтов для модулей ограничено. Это ограничение обусловлено (определяется): соглашением (контрактом) между владельцем объекта и фирмой

(ремонтным органом) на проведение ТО отказоустойчивой системы; финансированием, которое выделено на приобретение ремонтного комплекта запасных частей на время эксплуатации отказоустойчивой системы.

Стратегия 2. Эта стратегия отличается от стратегии 1 тем, что ремонтник не дежурит на объекте. Он прибывает на объект и приступает к ремонтным работам в момент предаварийной ситуации. Предаварийная ситуация в данной отказоустойчивой системе характеризуется (определяется) тем, что резерв исчерпан и в рабочей конфигурации мажоритарной структуры присутствуют 3 модуля (если начальное значение количества модулей в рабочей конфигурации было равным или большим 5, то уже состоялись все возможные изменения правила принятия решений; например, правило 3 с 5 переключено на правило 2 с 3). Ремонтник осуществляет аварийное восстановление всех неисправных МОФН отказоустойчивой системы. Профилактическое обслуживание МОФН отказоустойчивой системы в данной стратегии ТО не предусмотрено.

Неисправные МОФН после отказа поступают в очередь на ремонт. Там они "ждут" приезда ремонтника. Модуль основного функционального назначения в очередь не становится, если исчерпано допустимое количество ремонтов. В такой ситуации он изымается из конфигурации отказоустойчивой системы. Когда приезжает ре-

монтник, он начинает согласно очереди ремонтировать все модули. В модели принято, что за время ремонта неисправных модулей не успеет отказать еще один МОФН в ядре. Отремонтированные модули пополняют соответственно ядро и резерв. Для модулей ремонт всегда успешен и обеспечивает полное их обновление.

Когда очередь неисправных модулей исчерпана, то ремонтник покидает объект. Продолжительность ремонта одного МОФН, так и всех неисправных модулей, которые находятся в очереди, случайная величина. В стратегии ТО количество ремонтов для модулей ограничено.

Стратегия 3. Эта стратегия отличается от стратегии 1 тем, что ремонтник находится в офисе ремонтного органа на значительном расстоянии от объектов, которые он обслуживает. Ремонтник осуществляет ТО, для чего по графику прибывает на объект, на котором эксплуатируется данная отказоустойчивая система. Но время точно не определено. Лишь известный порядок (после п-го объекта) и ориентировочно время (в этом месяце или на этой неделе). Ремонтник (ремонтная бригада) осуществляет ТО отказоустойчивых систем для заданного (закрепленным за ним) количества объектов поочередно. Аварийный вызов (прибытие) ремонтника на объект в данной стратегии ТО не предусмотрен. Когда очередь неисправных модулей исчерпана, ТО отказоустойчивой системы на данном объекте считается законченным и ремонтник (ремонтная бригада) переезжает на следующий объект.

Продолжительность ТО на одном объекте случайная величина. Поэтому интервал времени между двумя последовательными посещениями ремонтником одного объекта также случайная величина с законом распределения (или средним значением), которое необходимо определить (при возможности, предусмотреть).

Если ремонтник приехал на объект, а там нет неисправных модулей, то он оставляет объект. Если ремонтник приехал на объект в момент или после катастрофического отказа, то он ничего не восстанавливает.

Допустимая продолжительность времени пребывания ремонтника на объекте ограничена, но достаточная для ремонта (восстановления) максимального количества неисправных МОФН отказоустойчивой системы, которые ремонтник может застать в очереди на ремонт.

В стратегии ТО количество ремонтов для МОФН, а соответственно и количество визитов, являются ограниченными.

Исследование стратегий ТО для данной отказоустойчивой системы должны дать ответ на следующие вопросы:

Какую квалификацию надо иметь ремонтнику на объекте для обеспечения заданного (нужного) уровня надежности отказоустойчивой системы.

Какое количество ремонтов для модулей основного функционального назначения необходимо предусмотреть, чтобы обеспечить заданный (нужен) уровень надежности отказоустойчивой системы.

Какое количество ТО, и с каким периодом (стратегия 3) надо заказать для обеспечения нужной надежности на заданном интервале эксплуатации отказоустойчивой системы. Какое количество ТО (профилактическое восстановление) необходимо предусмотреть для обеспечения заданного уровня надежности на время гарантийного обслуживания.

Какое максимальное количество объектов, можно закрепить за одним ремонтником (ремонтной бригадой), чтобы при заданной стратегии ТО надежность отказоустойчивых систем отвечала заданным требованиям?

Какое финансирование будут нуждаться в ремонтные (восстановительные) работы. Является ли экономически целесообразным техническое обслуживание. Если необходимое для аппаратуры количество ТО, превышает разумное (например, по экономическому критерию) значение, то может приниматься решение о полной замене аппаратуры после определенного срока эксплуатации.

Представленные стратегии могут иметь варианты реализации. Например, в стратегии 1 ремонтник, находясь на объекте, может приступать к ремонту неисправных модулей не после их отказа, а в момент предава-рийной ситуации, если подготовка к выполнению ремонтных работ занимает много времени. В стратегиях 2 и 3 ремонтник за время визита восстанавливает не все, а часть неисправных модулей.

Исследование эффективности выбранных стратегий технического обслуживания отказоустойчивой системы с мажоритарной структурой и скользящим резервированием ее модулей. Для исследования эффективности осуществлена разработка надежностных моделей согласно технологии моделирования представленной в [3 - 8], которые из-за их громоздкости в данной работе не приводятся.

Оценка надежности отказоустойчивой системы с мажоритарной структурой и скользящим резервированием ее модулей при первой стратегии технического обслуживания. Исследования проводятся с помощью программного модуля ASNA-2004, описание возможностей которого представлено в работе [4]. Для отказоустойчивой системы заданы следующие начальные значения параметров:

количество модулей в ядре п = 9;

количество модулей скользящего резерва т = 5;

интенсивность отказов одного модуля в ядре Хт= 0,00025 1/ч;

время между двумя проверками наличия неисправного модуля в ядре Т = 0,1 ч;

среднее значение интервала времени, необходимого на ремонт модуля Тг= 0,5 ч;

максимальное количество ремонтов для неисправных модулей S = 5.

Необходимо определить значение параметров, при которых среднее значение времени работы до катастрофического отказа Тзг составит 10000 ч. При заданных параметрах среднее значение времени до катастрофического отказа составляет 10094 ч, т.е. является близким к необходимому значению.

Рис. 1. Зависимость вероятности безотказной работы при различном количестве модулей в ядре при 1 стратегии технического обслуживания

Рис. 2. Зависимость вероятности безотказной работы при различном количестве модулей в резерве при 1 стратегии технического обслуживания

Проведем исследование зависимости среднего значения времени работы к катастрофическому отказу от количества модулей в ядре п и резерве m. Проведенные расчеты показывают (см. рис. 1 и 2), что среднее значение времени работы до катастрофического отказа отказоустойчивая система обеспечивает при наличии 9 модулей в ядре и 5 модулей в резерве.

Оценка надежности отказоустойчивой системы с мажоритарной структурой и скользящим резервированием ее модулей при второй стратегии технического обслуживания. Для отказоустойчивой системы заданы следующие начальные значения параметров:

количество модулей в ядре п = 9;

количество модулей скользящего резерва m = 4;

интенсивность отказов одного модуля в ядре Хт = 0,00035 1/ч;

время между двумя последовательными проверками наличия неисправного модуля в ядре Т = 0,1 ч; среднее значение интервала времени, необходимого на ремонт модуля Тг= 0,5 ч; среднее значение интервала времени, необходимого на приезд ремонтника Тп= 6 ч; максимальное количество ремонтов для неисправных модулей S = 5.

Необходимо определить значение параметров, при которых среднее значение времени работы до катастрофического отказа Тзг составит 10000 ч. При заданных параметрах среднее значение времени к катастрофическому отказу составляет 10084 ч, т.е. является близким к необходимому значению.

Проведем исследование зависимости среднего значения времени работы до катастрофического отказа от количества модулей в ядре п и резерве т. Проведенные расчеты показывают (см. рис. 3 и 4), что среднее значение времени работы до катастрофического отказа отказоустойчивая система обеспечивает при наличии 9

модулей в ядре и 4 модулей в резерве.

;

1,1=3 ' д \

9X53.4 Ч1|С "\\\ т=5

10589 час

И1=4

10084 час

:

Рис. 3. Зависимость вероятности безотказной работы при различном количестве модулей в ядре при 2-й стратегии технического обслуживания

Рис. 4. Зависимость вероятности безотказной работы при различном количестве модулей в резерве при 2-й стратегии технического обслуживания

Оценка надежности отказоустойчивой системы с мажоритарной структурой и скользящим резервированием ее модулей при третьей стратегии технического обслуживания. Для отказоустойчивой системы заданы следующие начальные значения параметров: количество модулей в ядре п = 9; количество модулей скользящего резерва т = 5;

интенсивность отказов одного модуля в ядре Хш= 0,0003 1/ч;

время между двумя проверками наличия неисправного модуля в ядре Т = 0,1 ч; среднее значение интервала времени, необходимого на ремонт модуля Тг = 0,5 ч; среднее значение интервала времени между приездами ремонтника Тм.г = 2 00 ч; максимальное количество ремонтов для неисправных модулей S = 5.

Необходимо определить значение параметров, при которых среднее значение времени работы до катастрофического отказа Тзг составит 10000 ч. При заданных параметрах среднее значение времени работы до катастрофического отказа составляет 10102 ч, т.е. является близким к необходимому значению.

Проведем исследование зависимости среднего значения времени работы к катастрофическому отказу от количества модулей в ядре п и резерве т. Проведенные расчеты показывают (см. рис. 5 и 6), что среднее значение времени работы до катастрофического отказа отказоустойчивая система обеспечивает при наличии 9 модулей в ядре и 5 модулей в резерве.

:

|ц=4 \'-Л

9876,3 час 111=6

10613 «,ас

ш=?

Ю102 1|ас

Рис. 5. Зависимость вероятности безотказной работы при различном количестве модулей в ядре при 3-й стратегии технического обслуживания

Рис. 6. Зависимость вероятности безотказной работы при различном количестве модулей в резерве при 3-й стратегии технического обслуживания

Таким образом, можно сделать вывод, что при заданных параметрах для обеспечения времени работы до катастрофического отказа 10000 часов рационально использовать вторую стратегию технического обслуживания, так как при этой стратегии для системы требуется меньшее количество модулей скользящего резерва и модули могут иметь меньшую надежность.

Оценка влияния количества предусмотренных ремонтов на надежность отказ о -устойчивой системы с мажоритарной структурой и скользящим резервированием ее модулей в сформированных стратегиях технического обслуживания . Для отказоустойчивой системы и стратегий ее технического обслуживания заданные значения параметров представлены в табл. 1.

Табл. 1. Параметры отказоустойчивой системы и сформированных стратегий ее технического обслуживания

Параметры Стратегии п ш Аш [1/год] Т± [год] Тг [год] Тп [год] Тм.п [год]

1 стратегия 9 5 0,00025 0,1 0,5 - -

2 стратегия 9 4 0,00035 0,1 0,5 6 -

3 стратегия 9 5 0,0003 0,1 0,5 - 200

Количество предусмотренных ремонтов S изменяется в пределах от 1 до 5. Результаты расчетов представлены на рисунках 7, 8, 9 и в таблице 2.

Табл. 2. Зависимость среднего значения времени работы до катастрофического отказа от количества предусмотренных ремонтов при выбраных стратегиях технического обслуживания

Количество предусмотренных ремонтов Среднее значение времени работы до катастрофического отказа, [ч]

1 стратегия 2 стратегия 3 стратегия

0 1467,1 1467,1 1467,1

1 1667,2 1795,1 1677,3

2 1867,3 2122,4 1966,0

3 2067,4 2449,9 2210,3

4 2267,5 2777,4 2425,0

5 2467,6 3104,9 2538,6

Рис. 7. Зависимость вероятности безотказной работы при различном количестве ремонтов при 1-й стратегии технического обслуживания

Рис. 8. Зависимость вероятности безотказной работы при различном количестве ремонтов при 2-й стратегии технического обслуживания

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 9. Зависимость вероятности безотказной работы при различном количестве ремонтов при 3-й стратегии технического обслуживания

При отсутствии технического обслуживания ^ = 0) для всех трех стратегий время работы до катастрофического отказа одинаково и составляет 1467,1 ч. Как мы видим, при заданных параметрах наихудший результат получен для 1 стратегии, когда ремонтник постоянно находится на объекте. Этот результат обусловлен тем, что ремонтник имеет относительно низкую квалификацию (средняя продолжительность ремонта одного модуля равняется 0,5 часа). Для 2-й и 3-й стратегии квалификация ремонтника повышена; за 0,5 часа должны быть отремонтированы все модули, которые находятся в очереди на ремонт. Наилучший результат при заданных параметрах обеспечивает стратегия 2, когда ремонтник будет приезжать на объект в предаварийной ситуации и будет возвращать систему в исходное состояние. При этой стратегии можно использовать модули с меньшей надежностью.

Таким образом разработанные по предложенной в работе [3] технологии надежностные модели дают возможность на этапе системотехнического проектирования радиоэлектронных систем:

выбрать оптимальную конфигурацию отказоустойчивой системы (количество модулей в ядре и количество резервных модулей) в зависимости от заданных показателей надежности;

количественно оценить и выбрать тот вариант стратегии технического обслуживания, который лучше всего подходит с точки зрения обеспечения высокой надежности при минимальных затратах

оптимизировать параметры выбранной стратегии технического обслуживания и т.п.

Следует отметить, что все вышеописанные исследования осуществляются при использовании программного модуля АБЫА 2004, который обеспечивает минимальные временные затраты на выполнение расчетов.

ЛИТЕРАТУРА

1. Каштанов В.А., Медведев А.И. Теория надежности сложных систем (Теория и практика). - Г.: Европейский центр по качеству, 2002. - 470 с.

2. Надежность и эффективность в технике. Справочник. Т. 4: Методы подобия в надежности / Под общ.

ред. Мельникова В.А., Северцева Н.А. - М.: Машиностроение, 1987. - 280с.

3. Волочий Б.Ю. Технология моделирования алгоритмов поведения информационных систем. - Львов: Изд-во Национального университета «Львовская политехника», 2004. - 220 с.

4. Мандзий Б.А., Волочий Б.Ю., Матичин А.В., Озирковский Л.Д. Концепция программного модуля для моделирования структуры и поведения информационых систем // Труды международного симпозиума «Надежность и качество», Пенза, 2006. - с. 13-15.

5. Мандзий Б.А., Беляев В.П., Волочий Б.Ю., Озирковский Л.Д. Надежностные модели мажоритарных деградирующих структур и структур с комбинированным резервированием // Труды международного симпозиума «Надежность и качество», Пенза, 1999. - с. 24-26.

6. Мандзий Б.А., Волочий Б.Ю., Малиновский А.В., Улыбин Д.А. Программное средство интерактивного

надежностного проектирования отказоустойчивой системы с комбинированным резервированием замещением //

НАДЕЖНОСТЬ И КАЧЕСТВО. Труды международного симпозиума / Под ред. Н.К. Юркова. - Россия, Пенза: Изд-во

Пенз. гос. ун-та, 2005. - С. 252 - 255.

7.Мандзий Б.А., Волочий Б.Ю., Матичин А.В., Озирковский Л.Д., Стецюк С.А., Улыбин Д.А. Модель системы межстанционной сигнализации DSS-1 цифровой системы коммутации ЕС-11 // Надежность и качество. Труды международного симпозиума / Под ред. Н.К. Юркова. - Россия, Пенза: Изд-во Пенз. гос. ун-та, 2004. - С. 211 - 217.

8. Мандзий Б.А., Волочий Б.Ю., Озирковский Л.Д., Улыбин Д.А. Моделирование функционального поведения информационных систем с учетом ненадежности аппаратных средств // Надежность и качество: Тр. межд. симпозиума / Под ред. Н.К. Юркова. - Пенза: Изд-во Пенз. гос. ун-та, 2003. - С. 59 - 63.

i Надоели баннеры? Вы всегда можете отключить рекламу.