Научная статья на тему 'Алгоритм парирования сбоев в бортовых цифровых вычислительных комплексах со структурно-временной избыточностью'

Алгоритм парирования сбоев в бортовых цифровых вычислительных комплексах со структурно-временной избыточностью Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
322
63
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
тестовый контроль / точка восстановления / бортовой цифровой вычислительный комплекс. / test control / recovery point / on-board computer.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Д. С. Викторов, Е. В. Самоволина

В настоящее время проблема обеспечения надежного функционирования бортовых цифровых вычислительных комплексов становится всё актуальнее. При проектировании бортовых цифровых вычислительных комплексов космических аппаратов необходимо обеспечить высокую производительность, минимальные массогабаритные и энергетические характеристики, наличие средств диагностики и парирования последствий отказов. Кроме того, к бортовым цифровым вычислительным комплексам космических аппаратов предъявляются такие требования, как высокая суммарная надежность системы, минимальные показатели времени обнаружения и парирования отказов. Для повышения надёжности управляющих систем существует много способов, основным из которых является структурное резервирование. Применение резервирования даёт возможность на основе введения избыточности, путём голосования выявить отказавшую систему и исключить её из конфигурации. Однако в бортовых цифровых вычислительных комплексах интенсивность отказов на порядок ниже, чем интенсивность сбоев. Это может привести к тому, что сбой, воспринятый системой как отказ, послужит причиной выведения из конфигурации исправного канала. Путём возвращения программы на предыдущую точку восстановления и прохождения фрагмента программы повторно появляется возможность классифицировать тип неисправности сбой/отказ. При данном подходе реконфигурация системы произойдёт только после безуспешных попыток пройти фрагмент программы n раз (как правило, в технике применяется повтор 7–8 раз). Целью работы является разработка алгоритма парирования сбоев в бортовых вычислительных системах с трёхканальной архитектурой, который предполагает комплексное применение тестового контроля и точек восстановления с различным доминированием в зависимости от количества исправных каналов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Д. С. Викторов, Е. В. Самоволина

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE ALGORITHM OF PARRY FAILURES IN THE ONBOARD DIGITAL COMPUTER COMPLEXES WITH THE STRUCTURAL AND TIME REDUNDANCY

Currently, the problem of ensuring reliable operation of onboard digital computing systems is becoming increasingly important. When designing on-Board digital computing systems of spacecraft, it is necessary to provide a combination of a number of indicators: high performance, minimal mass-size and energy characteristics, availability of diagnostic tools and parry the consequences of failures. In addition, one of the main requirements for the onboard digital computing complex of spacecraft is the high total reliability of the system, the minimum time for detection and parry of failures. To improve the reliability of control systems, there are many ways, the main of which is structural redundancy. The use of reservations makes it possible, through the introduction of redundancy, by voting to identify the failed system and exclude it from the configuration. However, in onboard digital computing complexes the failure rate is much lower than the failure rate. This can cause the failure to be perceived by the system as a failure and cause the system to exit the configuration of a healthy channel. By returning the program to the previous recovery point and passing the program fragment again, you can classify the type of failure/failure. Under this approach, the reconfiguration of the system will occur only after unsuccessful attempts to pass a fragment of the program n times (as a rule, the technique is used repeat 7–8 times). The aim of the work is to develop an algorithm for parrying failures in onboard computing systems with three-channel architecture, which involves the complex application of test control and recovery points with different dominance depending on the number of serviceable channels.

Текст научной работы на тему «Алгоритм парирования сбоев в бортовых цифровых вычислительных комплексах со структурно-временной избыточностью»

КОСМИЧЕСКОЕ ПРИБОРОСТРОЕНИЕ

УДК 623.1/.7

DOI 10.26732/2618-7957-2018-1-22-29

АЛГОРИТМ ПАРИРОВАНИЯ СБОЕВ В БОРТОВЫХ ЦИФРОВЫХ ВЫЧИСЛИТЕЛЬНЫХ КОМПЛЕКСАХ СО СТРУКТУРНО-ВРЕМЕННОЙ ИЗБЫТОЧНОСТЬЮ

Д. С. Викторов, Е. В. Самоволина

Военная академия воздушно-космической обороны имени Маршала Советского Союза Г. К. Жукова,

г. Тверь, Российская Федерация

В настоящее время проблема обеспечения надежного функционирования бортовых цифровых вычислительных комплексов становится всё актуальнее. При проектировании бортовых цифровых вычислительных комплексов космических аппаратов необходимо обеспечить высокую производительность, минимальные массогабаритные и энергетические характеристики, наличие средств диагностики и парирования последствий отказов. Кроме того, к бортовым цифровым вычислительным комплексам космических аппаратов предъявляются такие требования, как высокая суммарная надежность системы, минимальные показатели времени обнаружения и парирования отказов. Для повышения надёжности управляющих систем существует много способов, основным из которых является структурное резервирование. Применение резервирования даёт возможность на основе введения избыточности, путём голосования выявить отказавшую систему и исключить её из конфигурации. Однако в бортовых цифровых вычислительных комплексах интенсивность отказов на порядок ниже, чем интенсивность сбоев. Это может привести к тому, что сбой, воспринятый системой как отказ, послужит причиной выведения из конфигурации исправного канала. Путём возвращения программы на предыдущую точку восстановления и прохождения фрагмента программы повторно появляется возможность классифицировать тип неисправности сбой/отказ. При данном подходе реконфигурация системы произойдёт только после безуспешных попыток пройти фрагмент программы

п раз (как правило, в технике применяется повтор 7-8 раз). Целью работы является разработка алгоритма парирования сбоев в бортовых вычислительных системах с трёхканальной архитектурой, который предполагает комплексное применение тестового контроля и точек восстановления с различным доминированием в зависимости от количества исправных каналов.

Ключевые слова: тестовый контроль, точка восстановления, бортовой цифровой вычислительный комплекс.

Бортовой цифровой вычислительный комплекс (БЦВК) современных космических аппаратов (КА) отвечает за реализацию логики работы КА, предназначен для управления вычислительными процессами между модулями, обработки телеметрической информации (информации о состоянии) аппарата, координации работы модулей КА, диагностики, устранения отказов и состоит из большого количества программно-аппаратных компонент. Элементная база БЦВК функционирует на предельных тактовых частотах. Это является причиной того, что интенсивность сбоев на порядок выше интенсивности отказов 10-9_10-ю 1/с [1].

© Викторов Д. С., Самоволина Е. В., 2018

Надежное функционирование БЦВК обеспечивается использованием разных видов избыточности: структурной, временной, функциональной, информационной, версионной [2, 3]. Наиболее распространена в БЦВК структурная избыточность, которая используется для парирования отказов. Комплексное использование структурной и временной избыточности позволяет распознавать и парировать не только отказы, но и сбои как программных, так и аппаратных компонент. Это особенно важно для БЦВК летательных аппаратов, к которым наряду с высокими требованиями к надёжности и достоверности контроля функционирования предьявляются довольно жёсткие ограничения на массогабаритные и энергетические характеристики.

Д. С. Викторов, Е. В. Самоволина

Алгоритм парирования сбоев в бортовых цифровых вычислительных комплексах

Классические алгоритмы обеспечения надежного функционирования, которые базируются на структурной и временной избыточности, исследованы в работах [4-8] и др., однако их комплексному использованию уделялось недостаточно внимания. Данное обстоятельство обусловливает необходимость разработки алгоритма обеспечения отказоустойчивости БЦВК на основе комплексного использования структурной и временной избыточности.

При разработке алгоритма парирования сбоев в БЦВК приняты следующие допущения:

а) поток отказов всех элементов схемы простейший, последствия сбоев ликвидируются либо мажоритарными органами, либо повторным счётом участка программы обработки информации;

б) отказ любого элемента средств мажоритирова-ния, диагностирования и реконфигурации ведёт к отказу БЦВК;

в) интенсивности восстановления для отказов и сбоев являются неизменными;

г) восстановление сбившегося канала осуществляется путём повтора программы обработки информации с предыдущей точки восстановления (ТВ), при этом ТВ представляет собой периодически записываемое операционной системой в энергонезависимую память состояние всех полей основной памяти БЦВК.

Подобный подход применяется в большинстве известных работ по исследованию надёжности программно-аппаратных комплексов [1, 9, 10].

Предлагаемый алгоритм парирования сбоев представлен на рис. 1. Сущность алгоритма заключается в применении тестового контроля (ТК) и информации в ТВ (для защиты от сбоев) с различным доминированием в зависимости от количества исправных каналов.

Система начинает работу в трёхканальной конфигурации, при этом результатом вычислений является тот, который зафиксирован двумя каналами, при этом третий канал подвергается ТК. Если по результатам ТК канал признан исправным (сбой), то восстановление вычислительного процесса осуществляется по ТВ путём повтора последнего фрагмента программы обработки информации. При успешном восстановлении канала данные, характеризующие текущее состояние БЦВК из любого исправного канала, записываются в ТВ восстановленного канала.

В случае идентификации ТК отказа канала БЦВК реконфигурируется в двухканальную архитектуру.

В двухканальной конфигурации осуществляется периодическое сравнение результатов обработки данных в каналах. При несовпадении результатов вычислений оба канала прекращают обработку информации и предпринимается по-

пытка восстановления обоих каналов по ТВ путём «-кратного повторения вычислений с предыдущей ТВ. Если в результате этой операции удаётся получить одинаковые результаты вычислений в двух каналах, то БЦВК продолжает функционировать в двухканальной конфигурации (сбой в канале). В противном случае (отказ канала) оба канала подвергаются ТК с целью выявления отказавшего, который исключается из конфигурации, и БЦВК переходит на функционирование в одноканальной конфигурации.

Функционирование в одноканальной архитектуре предполагает наличие средств встро- 23 енного контроля для выявления неисправности канала. При получении сигнала от средств встроенного контроля о неисправности канала (сбой) осуществляется попытка его восстановления по ТВ путём с-кратного повторения фрагмента программы обработки информации. Если средства встроенного контроля обнаружат, что неисправность ликвидирована, то БЦВК продолжит обработку информации. При исчерпании лимита повторов фрагмента программы БЦВК признаётся отказавшей.

Таким образом, комплексное применение ТК и восстановления по ТВ с различным преобладанием в зависимости от количества исправных каналов позволяет классифицировать неисправности как сбой и отказ, что позволяет избежать неоправданного расхода резервных ресурсов и, следовательно, повысить надёжность БЦВК.

Проведём количественную оценку прироста надёжности от применения предложенного выше алгоритма, для чего разработаем модели надёжности БВС. При разработке модели примем дополнительное допущение об экспоненциальном законе распределения времени до отказа.

Принимая во внимание принятые допущения, математическая модель, описывающая поведение БЦВК для предложенного алгоритма, может быть описана марковской цепью с непрерывным временем и следующими дискретными состояниями:

^о - БЦВК исправно функционирует в 3-ка-нальной конфигурации;

- БЦВК копирует данные, характеризующие текущее состояние трёх исправных каналов в ТВ;

- БЦВК восстанавливает неисправный канал по ТВ;

53 - отказ одного канала;

54 - БЦВК исправно функционирует в 2-ка-нальной конфигурации;

55 - БЦВК копирует данные, характеризующие текущее состояние двух исправных каналов в ТВ;

56 - БЦВК восстанавливает вычислительный процесс двух каналов по ТВ;

Том 2

24

Рис. 1. Алгоритм парирования сбоев в БВС

57 - отказ второго канала;

58 - БЦВК исправно функционирует в 1-ка-нальной конфигурации;

59 - БЦВК копирует данные, характеризующие текущее состояние исправного канала в ТВ;

S10 - по сигналу от встроенных средств контроля БЦВК восстанавливает вычислительный процесс в канале по ТВ;

- встроенные средства контроля БЦВК выявили неисправность канала, и осуществляется попытка его восстановления функционирования путём с-кратного повторения вычислений с последней ТВ;

£12 - отказ БЦВК.

Граф переходов БЦВК, учитывающий интенсивности переходов, приведен на рис. 2.

Д. С. Викторов, Е. В. Самоволина

Алгоритм парирования сбоев в бортовых цифровых вычислительных комплексах

В соответствии с методикой расчёта марковских процессов имеем следующую систему уравнений:

р(t)/dt = -Р0(t)3^СБ -P0(t)3^отк -Po(t)А,та +

+ Р1(t )^ТВ + Р12 (t )^В3 + P2 (t )^В1;

Pi(t )/ dt = - Pi(t )^тв + Ро (t )Чв;

P-(t )/ dt = - P-(t )^В1 + Po(t )3^сб;

P3(t )/ dt = - P3(t )(d тк + Po(t )3^ отк;

P4 (t)/dt = -Р4(t)2A,отк -P4(t)2^сб ^('Biu +

+ =3 ( t;>ЦтК + +5 00(тВ + Р6 (t)(тВ; p5(t )/dt = - Р5 (t )цта + Р4 (t )4B; Рб (t)/dt = -Рб (p )|ата -К Р4 (t)2А,СБ; P7 (t)/dt = -P?(í)(d-jzj2 "H Р4tt)2?W P8(t )/dt = "P8(0^ -Pt (ОЧв ^8 (t отк --P8(t )(1-*)+,сб+А, отк ) + P9 (t )(тв +

+ Pio(t)(d

тв " P7 tt)( B2; P9 (t)/d9 = -P9(t) итв+Р8(0?-тв; Pl0 (t)/dt = -P-o (9)(-л, + Ps (О^СБ ; Pii(t)/dt = - Pi8 (t)c(d

Pl2 (t//dt = -Pi- tt))dB3 H" P8 ( t)(i - СБ " ^Отк ) "

+ Pii( О^тв

где лв1

Т

Т + Т I ТВ-ТВ ТВ ТК „

ЛВ2 = Т + Т ' ЛВ0 = Т

Т ТВ + Т ТК 1 Ц

цВ1 характеризует интенсивность восстановления трёхканальной БЦВК и предполагает проведение ТК неисправного канала с целью определения вида неисправности, повтор фрагмента программы обработки информации с последней ТВ и копирование данных, характеризующих состояние системы из исправного канала в восстановленный.

цВ2 описывает интенсивность восстановления двухканальной БЦВК и включает повтор фрагмента программы обработки информации с последней ТВ и проведение ТК обоих каналов для выявления отказавшего.

цВ3 характеризует интенсивность восстановления БЦВК после отказа последнего канала и предполагает рестарт системы.

В системе уравнений приняты следующие обозначения:

Р0 - вероятность безотказной работы БЦВК в трёхканальной конфигурации;

Р1 - вероятность нахождения БЦВК в состоянии формирования ТВ;

Р2 - вероятность возникновения сбоя в одном канале;

Р3 - вероятность отказа одного канала;

Р4 - вероятность безотказной работы БЦВК в двухканальной конфигурации;

Р5 - вероятность нахождения БЦВК в состоянии копирования ТВ;

Р6 - вероятность возникновения сбоя в канале при функционировании БЦВК в двухканаль-ной конфигурации;

Р7 - вероятность отказа канала при функционировании БЦВК в двухканальной конфигурации;

Р8 - вероятность безотказной работы БЦВК в одноканальной конфигурации;

Р9 - вероятность нахождения БЦВК в состоянии копирования ТВ;

Р10 - вероятность возникновения сбоя в канале;

Р11 - вероятность восстановления функционирования канала путём с-кратного повторения вычислений с ТВ;

Р12 - вероятность отказа БЦВК;

ТТВ - временной интервал, необходимый для формирования ТВ;

ТТК - время, затраченное на тестирование канала;

25

Рис. 2. Граф переходов БЦВК при правильном определении вида неисправности

Том 2

26

^та-тв - временной интервал между двумя соседними ТВ;

^ - время цикла обработки информации. Решая систему уравнений, следует учитывать, что модель описывает все возможные состо-

п

яния БЦВК, а следовательно, ^ р = 1. Из систе-

¿=1

мы уравнений можно вычислить вероятности нахождения БЦВК в любом возможном состоянии Г (7). Для БЦВК КА представляет интерес оценка вероятности безотказной работы за время 7, которая вычисляется по формуле

1<еЕ

где E - множество работоспособных состояний БЦВК, в которых система осуществляет обработку информации.

Предложенная модель предполагает применение идеальных по достоверности и безотказности средств встроенного контроля, что даёт весьма приблизительные результаты при оценке безотказности.

Значительный рост тактовых частот привёл к тому, что в ходе тестирования каналов может быть ошибочно классифицирован вид неисправности, т. е. сбой воспринят как отказ и наоборот. Для учёта ошибочной классификации вида неисправности в граф (рис. 2) добавлены следующие переходы:

^ ^ S0 и £7 ^ £4, интенсивность которых ^2цТК (характеризуют такое состояние БЦВК, при котором ТК классифицировал отказ канала как сбой);

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

S2 ^ Бл и £6 ^ £8, интенсивность которых ^3цТК (означает, что ТК классифицировал сбой канала как отказ).

При этом граф переходов БЦВК с учётом ошибочной классификации вида неисправности примет вид, представленный на рис. 3. Дискретные состояния в данном графе аналогичны графу на рис. 2.

Принимая во внимание методику расчёта марковских процессов, получим следующую систему дифференциальных уравнений:

ТВ

В3

р (1)^1 = -Р0 (03А.СБ - Ро№ОТК - рда

+ Р (1 Кв + Рз 0 )А^ТК + Р12 (1

+р2 (г )^В1;

Р(г )/ яг = - Рх(г )^ТВ + Ро (1 )^ТВ; р (г )/ яг = - Рг (г - Р2 (1 + Ро (1 )3Ь СБ; Рз (г )/ яг = - Рз (г тк + Ро (г )з^ отк;

Р4 (г)/яг = -Р4 (1 )2Хотк - Р4 (г)2^сб - Р4 (1 ТВ + + Рз (1 тк + Рг (1 + Р5 (1 ТВ +

+ Р6(1 ^ТВ + Р7 (1 >°2^ТК;

р5 (г)/яг = - Р5 (1 Кв + Р4 (1 ТВ;

Рб (г V яг = - Рб (1 Кв - Рб (1 ^Тк + Р4 (1 )2^ СБ;

Р7(0М = -Р7(Ф^В2 - Р7(^ТК + Р4(1)2^ОТк; Р8(г)/Л = -Р8(1)/^СБ - Р8 (О^ТВ - Р8 (0^ОТК -- Р,(1 )(1 - ДОСБ + * ОТК

) + Р7 (1 В2 +

+ Рб (1 )р)з^ТК + Р9 (1 )^ТВ + Р10 (1 ^ТВ;

Р9 (г )/ яг = - Р9 (г )цта + Р8 (1 ТВ; Р10 (г V яг = - Р10 (1 КВ + Р8 (1 )^СБ; Рп(г V яг = - Рп(г

ТВ + Р8 (1 Х^ОТК;

Р2 (г V яг = - Р12 (1 вз + Р8 (1 )(1 - ^)(^СБ + ^ОТК ) +

где D1 - вероятность правильной классификации неисправности ТК; D2 - вероятность того, что ТК классифицировал отказ как сбой; D3 - вероятность того, что ТК классифицировал сбой как отказ.

Рис. 3. Граф переходов с ошибочным определением ТК вида неисправности

Д. С. Викторов, Е. В. Самоволина

Алгоритм парирования сбоев в бортовых цифровых вычислительных комплексах

-

1 . Ч а Vs. \ \ X

X

в

1

10

100

103

104

t, ч

Рис. 4. Зависимость относительного выигрыша в снижении вероятности отказа при: а) D1 = 1, D2 = 0, D3 = 0; б) D1 = 0, D2 = 1, D3 = 0; в) D1 = 0, D2 = 0, D3 = 1

27

При моделировании значения переменных означают достоверность тестового контроля - D1, D2, D3 могут принимать значения 0 или 1.

В системе уравнений вероятности Р0, Р4, Р8 характеризуют безотказную работу БЦВК в трёх-канальной, двухканальной и одноканальной конфигурации соответственно.

Анализ системы уравнений позволяет предположить, что при увеличении увеличиваются значения вероятностей Р0, Р4, Р8 и БЦВК сохраняет работоспособность при любом количестве сбоев.

Учитывая, что в работе рассматриваются БЦВК КА, безотказность которых лежит в диапазоне 0,9...0,999, в качестве показателя для оценки эффективности разработанного алгоритма целесообразно применять показатель - относительный выигрыш 5Q в снижении вероятности отказа.

5Q =

Qo-(1 -[ Po + P4 + P ])

50 =

60 - 0 0о :

Qo

где Q - вероятность отказа БЦВК, реализующего предложенный метод структурно-временного резервирования;

Q0 - вероятность отказа БЦВК, относительно которой определяется относительный выигрыш 5Q в снижении вероятности отказа.

Следует учитывать, что БЦВК КА рассматриваются как невосстанавливаемые системы, поэтому согласно [2, 3] относительный выигрыш в снижении вероятности отказа целесообразно рассчитывать так:

В свою очередь, за Q0 примем вероятность отказа трёхканальной БЦВК без ТК и восстановления по ТВ, численные значения которых получены в [5].

На основании анализа данных об отказах и сбоях в БЦВК [1, 3] для моделирования были выбраны следующие базовые значения: ^ОТК = = 10-8 1/ч; = 10-9 1/ч; V = 103 1/ч; цТК = 104 1/ч; Цтв = 5 10-5 1/ч, Ттв = 10-4 ч, Ттв-тв = 10-3 ч, Ттк = 10-4 ч, Тц = 5 10-3 ч. Результаты моделирования зависимости относительного выигрыша в снижении вероятности отказа от времени эксплуатации при различной достоверности контроля представлены на рис. 4.

Результаты моделирования показали, что применение предложенного алгоритма позволяет повысить (до 45 % по показателю 5Q - относительный выигрыш в снижении вероятности отказа) надежность трёхканальных БЦВК со структурно-временной избыточностью.

Предлагаемый алгоритм ориентирован на идентификацию и парирование сбоев и отказов. Алгоритм может применяться в любых БЦВК с межканальными связями. Для его реализации необходимо обеспечить синхронную работу каналов БЦВК. Всё вышеперечисленное позволяет осуществить эффективную практическую реализацию предложенного алгоритма при жёстких ограничениях на массогабаритные и энергетические характеристики.

Список литературы

1. Kafka P. How Safe Is Safe Enough? / Kafka P.// Proceeding of 10th European Conference on Safety and Reliability, Munich, Germany, 13-17 September, 1999. Vol. 1. P. 385-390.

2. Харченко В. С. Модели и свойства многоальтернативных отказоустойчивых систем // Автоматика и телемеханика. 1992. №№ 12. C. 140-147.

28

№ 1 (23) 2018

Том 2

3. Харченко В. С., Литвиненко В. Г., Терещенков С. В., Мельников В. А. Обеспечение устойчивости управляющих вычислительных систем к физическим дефектам и дефектам программирования программно-аппаратных средств // Зарубежная радиоэлектроника. 1992. № 6. С. 18-35.

4. Доманицкий С. М. Построение надежных логических устройств. М. : Энергия, 1971. 212 с.

5. Черкесов Г. Н. Надёжность программно-аппаратных комплексов. СПб. : Питер, 2004. 472 с.

6. Разыграев А. П. Основы управления полетом космических аппаратов : учеб. пособие для втузов. 2-е изд., пере-раб. и доп. М. : Машиностроение, 1990. 480 с.

7. Микрин Е. А. Бортовые комплексы управления космическими аппаратами и проектирование их программного обеспечения. М. : Изд-во МГТУ им. Н. Э. Баумана, 2003. 336 с.

8. Красовский П. А. Метрология космических навигационных спутниковых систем : монография. Менделеево : ФГУП «ВНИИФТРИ», 2009. 216 с.

9. Основы теории полета космических аппаратов / под ред. Г. С. Нариманова, М. К. Тихонравова. М. : Машиностроение, 1972. 608 с.

10. Космический ракетный комплекс «Зенит» глазами его создателей / под ред. В. Н. Соловьева [и др.]. М. : МАИ, 2003. 216 с.

История статьи

Поступила в редакцию 16 марта 2018 г.

Принята к публикации 5 апреля 2018 г.

THE ALGORITHM OF PARRY FAILURES IN THE ONBOARD DIGITAL COMPUTER COMPLEXES WITH THE STRUCTURAL

AND TIME REDUNDANCY

D. S. Viktorov, E. V. Samovolina

Military Aerospace Defense Academy, Tver, Russian Federation

Currently, the problem of ensuring reliable operation of onboard digital computing systems is becoming increasingly important. When designing on-Board digital computing systems of spacecraft, it is necessary to provide a combination of a number of indicators: high performance, minimal mass-size and energy characteristics, availability of diagnostic tools and parry the consequences of failures. In addition, one of the main requirements for the onboard digital computing complex of spacecraft is the high total reliability

of the system, the minimum time for detection and parry offailures. To improve the reliability of control systems, there are many ways, the main of which is structural redundancy. The use of reservations makes it possible, through the introduction of redundancy, by voting to

identify the failed system and exclude it from the configuration. However, in onboard digital computing complexes the failure rate is much lower than the failure rate. This can cause the failure to be perceived by the system as a failure and cause the system to exit the configuration of a healthy channel. By returning the program to the previous recovery point and passing the program fragment again, you can classify the type of failure/failure. Under this approach, the reconfiguration of the system will occur only after unsuccessful attempts to pass a fragment of the program n times

(as a rule, the technique is used repeat 7—8 times). The aim of the work is to develop an algorithm for parrying failures in onboard computing systems with three-channel architecture, which involves the complex application of test control and recovery points with different dominance depending on the number of serviceable channels.

Keywords: test control, recovery point, on-board computer.

References

1. Kafka P. How Safe Is Safe Enough? [Kafka P. // Proceeding of 10th European Conference on Safety and Reliability]. Munich, Germany, 13-17 September, 1999, vol. 1. pp. 385-390. (In Russian)

2. Kharchenko V. S. Modeli i svojstva mnogoal'ternativnyh otkazoustojchivyh sistem [Models and properties of multialternative fault-tolerant systems]. Avtomatika I telemekhanika, 1992, no. 12, p. 140-147. (In Russian)

3. Kharchenko V. S., Litvinenko V. G., Tereshchenkova S. V., Melnikov V. A. Obespechenieustojchivostiupravlyayushchih vychislitel'nyh sistem k fizicheskim defektam i defektam programmirovaniya programmno-apparatnyh sredstv [The sustainability managers of computer systems to physical defects and defects of the programming hardware and software]. Foreign Radioelectronics, 1992, no. 6, p. 18-35. (In Russian)

Д. С. Викторов, Е. В. Самоволина

Алгоритм парирования сбоев в бортовых цифровых вычислительных комплексах

4. Domenici S. M. Postroenie nadezhnyh logicheskih ustrojstv [Building a reliable logical devices]. Moscow, Energy Publ., 1971. 212 p.

5. Cherkesov G. N. Nadyozhnost'programmno-apparatnyh kompleksov [Reliability of software and hardware systems]. St. Petersburg, Peter Publ., 2004. 472 p.

6. Razygraev A. P. Osnovy upravleniya poletom kosmicheskih apparatov : ucheb. posobie dlya vtuzov [The basics of flight control of spacecrafts: the Textbook. textbook for technical colleges]. 2nd ed., Rev. and extra. Moscow, Mashinostroenie Publ., 1990. 480 p.

7. Mikrin E. A. Bortovye kompleksy upravleniya kosmicheskimi apparatami i proektirovanie ih programmnogo obespecheniya [Onboard systems of spacecraft control and design of their software]. Moscow, Publishing house of MGTU they. N. Uh. Bauman, 2003. 336 р.

8. Krasovskii A. P. Metrologiya kosmicheskih navigacionnyh sputnikovyh sistem. Monografiya [Metrology, space navigation satellite systems. Monograph]. Mendeleevo, FSUE "VNIIFTRI", 2009. 216 p.

9. Osnovy teorii poleta kosmicheskih apparatov [Fundamentals of the theory of flight of space vehicles] (ed. by G. S. 29 Narimanov, M. K. Tihonravova). Moscow, Mechanical engineering Publ., 1972. 608 p.

10. Kosmicheskij raketnyj kompleks «Zenit» glazami ego sozdatelej [Space rocket complex "Zenit" through the eyes of its creators] (ed. V. N. Solovyov, e.a.). Moscow, MAI, 2003. 216 p.

Article history

Received 16 March 2018 Accepted 5 April 2018

i Надоели баннеры? Вы всегда можете отключить рекламу.