Научная статья на тему 'Определение возможных вариантов структуры заданного сбоеи отказоустойчивого комплекса в произвольной графовой структуре исходной системы'

Определение возможных вариантов структуры заданного сбоеи отказоустойчивого комплекса в произвольной графовой структуре исходной системы Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
34
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МНОГОМАШИННАЯ ВЫЧИСЛИТЕЛЬНАЯ СИСТЕМА / ОТКАЗОУСТОЙЧИВОСТЬ / РЕПЛИКАЦИЯ ЗАДАЧИ / ДИНАМИЧЕСКАЯ ИЗБЫТОЧНОСТЬ / ВЗАИМНОЕ ИНФОРМАЦИОННОЕ СОГЛАСОВАНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Лобанов Анатолий Васильевич

Использование необходимого механизма взаимного информационного согласования для организации отказоустойчивых вычислений в многомашинных вычислительных системах может значительно снижать их пропускную способность из-за присущей ему временной избыточности. Поэтому снижение такой избыточности в процессе выделения в исходной системе заданного отказоустойчивого комплекса является актуальной задачей и рассматривается в данной работе.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Лобанов Анатолий Васильевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Using a required technique of a mutual information coordination for fault-tolerant computing in multicomplex computer systems can significantly reduce their throughput due to inherent time redundancy. We consider how to reduce this redundancy while selecting a specified fault-tolerant complex in the initial system.

Текст научной работы на тему «Определение возможных вариантов структуры заданного сбоеи отказоустойчивого комплекса в произвольной графовой структуре исходной системы»

УДК 62-501.72:681.326.7

ОПРЕДЕЛЕНИЕ ВОЗМОЖНЫХ ВАРИАНТОВ СТРУКТУРЫ ЗАДАННОГО СБОЕ- И ОТКАЗОУСТОЙЧИВОГО КОМПЛЕКСА В ПРОИЗВОЛЬНОЙ ГРАФОВОЙ СТРУКТУРЕ ИСХОДНОЙ СИСТЕМЫ Лобанов Анатолий Васильевич

Д.т.н., с.н.с., ученый секретарь-начальник лаборатории, Акционерное общество "Научно-исследовательский институт "Субмикрон", 124460, РФ, Москва, Зеленоград, Георгиевский проезд., д. 5, строение 2, lav@se.zgrad.ru

Аннотация. Использование необходимого механизма взаимного информационного согласования для организации отказоустойчивых вычислений в многомашинных вычислительных системах может значительно снижать их пропускную способность из-за присущей ему временной избыточности. Поэтому снижение такой избыточности в процессе выделения в исходной системе заданного отказоустойчивого комплекса является актуальной задачей и рассматривается в данной работе.

Ключевые слова: многомашинная вычислительная система, отказоустойчивость, репликация задачи, динамическая избыточность, взаимное информационное согласование.

Введение. Наиболее перспективным способом обеспечения сбое- и отказоустойчивого выполнения целевой задачи в многомашинных вычислительных системах и сетях цифровых вычислительных машин (ЦВМ) является репликация этой задачи с использованием динамической избыточности. Репликация задачи состоит в парировании допустимых неисправностей посредством одновременного параллельного исполнения копий задачи на нескольких ЦВМ, составляющих комплекс, с обменом результатами и выбором из них правильного в предположении, что неисправными может быть только малая часть этих ЦВМ. Динамическая избыточность обеспечивает системное самообнаружение проявившихся неисправностей, их самоидентификацию по месту проявления и типу (сбой, программный сбой, отказ), самовосстановление целевой работы в сбившихся ЦВМ, самореконфигурацию системы, состоящую в изоляции отказавших ЦВМ и включения вместо них и втягивания в целевую работу системы запасных ЦВМ (при их наличии) либо осуществления управляемой самодеградации системы с переходом к безопасному останову при возникновении недопустимых неисправностей или исчерпании ресурсов. Ключевым механизмом такой организации вычислений является взаимное информационное согласование (ВИС), обеспечивающее во всех исправных ЦВМ системы согласование различающейся согласуемой информации разных ЦВМ системы таким образом, что в общей согласованной информации, одинаковой во всех исправных ЦВМ, согласованная информация каждой исправной ЦВМ совпадает с ее согласуемой информацией даже при возникновении враждебных (византийских) неисправностей ЦВМ допустимой кратности. В научной литературе рассматриваемая проблема широко известна как Проблема Византийских Генералов [5, 7, 8]. Развитие этой весьма важной проблемы для неполносвязных систем и сетей представлено в [1 -3].

Согласованная информация во всех исправных ЦВМ системы составляет основу согласованных, синхронизированных и, возможно, различающихся действий всех исправных ЦВМ системы по обеспечению ее сбое- и отказоустойчивости. Механизм ВИС включает многоразовый обмен согласуемой информацией между всеми ЦВМ системы, временные затраты (временная избыточность алгоритма ВИС) на который могут значительно снижать пропускную способность системы, и особенно неполносвязной системы, в целом представляющей собой комплекс. Такая система должна иметь определенные структурные особенности, обеспечивающие достаточные условия для построения алгоритма ВИС в таком комплексе. Эти условия и методы построения алгоритмов ВИС для комплексов неполносвязных систем представлены в [2, 3]. Поэтому снижение временной избыточности алгоритмов ВИС для неполносвязных систем является весьма актуальной задачей. В [1] рассматривается метод выделения комплекса с заданным уровнем сбое- и отказоустойчивости в графовой структуре исходной многомашинной вычислительной системы или сети ЦВМ и предлагается соответствующий алгебраический аппарат. Причем, процесс выделения заканчивается сразу после нахождения первого варианта искомого комплекса и не ставится задача оценки временной избыточности алгоритма ВИС для этого комплекса и, тем более, определения варианта комплекса с наилучшей оценкой временной избыточности. В [4] представлен метод оценки временной избыточности алгоритма ВИС для заданной неполносвязной системы.

Метод определения возможных вариантов структуры заданного сбое- и отказоустойчивого комплекса в произвольной графовой структуре исходной системы и выбор наилучшего варианта. Алгоритм А5, представленный на языке логических схем алгоритмов, предложенном А.А. Ляпуновым [6], который выполняет выделение всевозможных вариантов искомого комплекса, оценивает каждый из них по значению временной избыточности и выбирает вариант с наименьшим таким значением, имеет следующий вид:

¥1 |19 П2 Т18 ¥3 |17 П4 Т19 ¥5 I14 ^т!11 I16 П !15 ¥9 П10 Т12 ¥ц Т8 I10 ^12 П13 ^ ¥ 14

т6 I8 I13 ¥15 П16 Т8 ¥17 Т4 I2 ¥18 ОСТ I4 ¥19 Т2

Здесь символика и терминология взяты из [1]. Так, ц-й безусловный оператор или составной безусловный оператор обозначается через ¥ц, а г-й оператор условного перехода или составной оператор условного перехода, заканчивающийся оператором типа «если ..., то ..., иначе ...», - через Пг. Переходы в алгоритме отображаются стрелками. После выполнения очередного оператора и при отсутствии перехода выполняется следующий справа оператор. Переход задается точкой выхода (стрелка вверх) и точкой входа (стрелка вниз). Безусловный переход от ¥9 к г-му оператору имеет обозначение Тг, расположенное непосредственно за ¥ц, и обозначение I9, расположенное непосредственно перед обозначением г-го оператора. Оператор П9, оканчивающийся оператором условного перехода, например, «если ДА, то переход к оператору ¥г, иначе переход к оператору П?», в случае, когда оператору П в записи алгоритма предшествует оператор отображается записью П9 Т ¥г ... I9 П Окончание работы алгоритма отмечается сокращением ОСТ, обозначающим оператор остановки (окончания) действия алгоритма.

Далее в описании алгоритма используется понятие выбора очередного элемента (варианта), следующего по порядку относительно текущего элемента (варианта) в упорядоченном пронумерованном множестве таких элементов (вариантов). В результате

такого выбора очередной элемент (вариант) становится текущим элементом (вариантом).

При этом предполагается, что в этом упорядоченном множестве имеется как начальный

элемент (вариант), который выбирается на первом шаге в алгоритме выбора очередного

элемента (варианта) из данного множества, так и конечный элемент (вариант) такой, что если

этот элемент (вариант) является текущим, то выбор очередного элемента (варианта)

завершается формированием признака «текущий элемент (вариант) отсутствует».

Оператор определяет начало работы алгоритма, сопровождающееся заданием

исходного системного орграфа О (пронумерованные вершины отображают ЦВМ с

соответствующими номерами, дуги - симплексные межмашинные канала связи),

допустимого количества л неисправных ЦВМ в выделяемом комплексе, исходного значения

«пусто» для выходного параметра алгоритма «Лучший комплекс» (ЛК), значения

переменной 1:=1. Кроме того, в этом операторе определяются все вершины в исходном графе

О с полустепенью как входа, так и исхода не менее чем 3 л и строятся всевозможные 1 2

подмножества О , О ,... таких вершин, с мощностью каждого из них равной Зл+1. Эти подмножества являются кандидатами в множества основных вершин возможных вариантов искомого комплекса.

Оператор П2 - выбор очередного О и анализ его наличия.

¥3 - построение для очередного О всевозможных орподграфов оТ'(Л1', В1'-*) [1]. П4 -выбор очередного орподграфа оТ'] (Л1' - Б1'') и анализ его наличия.

- задание уровня г:=1 для вершин, требующих Ч2- и ЧЗ-достроек [1].

- определение состава вершин, требующих достроек на г-м уровне.

- определение всевозможных последовательностей достроек на г-м уровне. П8 - выбор очередной последовательности достроек г-го уровня.

- проведение Ч2- и ЧЗ-достроек очередной последовательности.

П10 - анализ условия «построение орграфа очередного варианта комплекса завершено?».

- оценка временной избыточности алгоритма ВИС для построенного орграфа очередного варианта искомого комплекса методом из [6]; сравнение полученной оценки с оценкой орграфа из ЛК. Если оценка лучше или если ЛК содержит значение «пусто», то занесение очередного варианта комплекса вместе с его оценкой в ЛК. ^12 - вычисление г:=г+1.

П13 - проверка условия «требуются достройки г-го уровня?».

¥14 - переход к 6-му оператору.

^15 - вычисление г:=г-1.

П16 - проверка условия «г=0?».

¥17 - переход к 4-му оператору.

¥18 - принятие решения «ЛК содержит комплекс с лучшей оценкой». ^19 - вычисление /:=/+1.

Заключение. Представленный алгоритм выделяет в графовой структуре исходной системы всевозможные варианты структуры искомого комплекса, соответствующего заданному уровню л его сбое- и отказоустойчивости. Комплекс обеспечивает возможность построения алгоритма взаимного информационного согласования в процессе осуществления репликации задачи с указанным уровнем сбое- и отказоустойчивости и использованием

динамической избыточности. Полнота такого выделения основана на полном переборе как всевозможных подмножеств O - кандидатов в множество основных вершин искомого комплекса, так и полного перебора вариантов структуры искомого комплекса для каждого из возможных множеств O1. Оценка временной избыточности каждого очередного построенного варианта искомого комплекса и сравнение ее значения с оценкой наилучшего найденного ранее варианта обеспечивают определение наилучшего варианта в процессе работы представленного алгоритма.

СПИСОК ЛИТЕРАТУРЫ

1. Ашарина И.В., Лобанов А.В. Выделение комплексов, обеспечивающих достаточные структурные условия системного взаимного информационного согласования в многокомплексных системах // Автоматика и телемеханика. №6. 2014. С. 115-131.

2. Ашарина И.В., Лобанов А.В., Мищенко И.Г. Взаимное информационное согласование в неполносвязных многомашинных вычислительных системах // Автоматика и телемеханика. 2003. №5. С. 190-198.

3. Ашарина И.В., Лобанов А.В. Взаимное информационное согласование в неполносвязных гетерогенных многомашинных вычислительных системах // Автоматика и телемеханика. 2010. № 5. С. 133-146.

4. Ашарина И.В. Подходы к оптимизации временных характеристик процесса взаимного информационного согласования в многомашинных вычислительных системах // В настоящем выпуске.

5. Генинсон Б.А., Панкова Л.А., Трахтенгерц Э.А. Отказоустойчивые методы обеспечения взаимной информационной согласованности в распределенных вычислительных системах // Автоматика и телемеханика. 1989. № 5. С. 3-18.

6. Ершов А.П. Введение в теоретическое программирование. М.: Наука, 1977. 288 c/

7. Barborak M., Malek M. The Consensus Problem in Fault-Tolerant Computing // ACM Comput. Surveys. June 1993. V. 25. № 2. P. 171-220.

8. Lamport L., Shostak R., Pease M. The Byzantine Generals Problem // ACM Trans. Progr. Lang. Syst. 1982. V. 4. № 3. P. 382-401.

УДК 62-501.72:681.326.7

IDENTIFICATION OF POSSIBLE OPTIONS FOR THE STRUCTURE OF A GIVEN FAULT-TOLERANT COMPLEX IN AN ARBITRARY GRAPH STRUCTURE OF

SOURCE SYSTEM Anatoly V. Lobanov

Dr., Joint-Stock Company "Research Institute "Submicron", State 2, Bld. 5, Georgievsky Pas, Zelenograd, Moscow, Russia, 124498

Abstract. Using a required technique of a mutual information coordination for fault-tolerant computing in multicomplex computer systems can significantly reduce their throughput due to inherent time redundancy. We consider how to reduce this redundancy while selecting a specified fault-tolerant complex in the initial system.

Keywords: multiprocessor systems, task replication, fault-tolerance, mutual information agreement, dynamic redundancy.

References

1. Asharina I.V., Lobanov A.V. Vydelenie kompleksov, obespechivajushhich dostatochnye strukturnye uslovija sistemnogo vzaimnogo informacionnogo soglasovanija v mnogokompleksnych sistemach [Extracting Complexes that Ensure Sufficient Structural Conditions for System Mutual Informational Agreement in Multicomplex Systems.] / Avtomatika i telemechanika = Automation and Remote Control, 2014, vol.75, no.6. Pp.1078-1089 (in Russian).

2. Asharina I.V., Lobanov A.V., Mishenko I.G. Vzaimnoe informacionnoe soglasovanie v nepolnosvjaznych mnogomasinnych vychislitel'nych sistemach [Mutual Informational Coordination in Incompletely Connected Multicomputer Systems] / Avtomatika i telemechanika = Automation and Remote Control, 2003, vol. 64, no. 5. Pp. 843-850 (in Russian).

3. Asharina I.V., Lobanov A.V. Vzaimnoe informacionnoe soglasovanie v nepolnosvjaznych geterogennych mnogomashinnych vychislitel'nych sistemach [Mutual Information Reconciliation in Non-fully Connected Heterogeneous Multicomputer Computational Systems] / Avtomatika i telemechanika = Automation and Remote Control, 2010, vol. 71, no. 5. Pp. 847-858 (in Russian).

4. Asharina I.V. Podhody k optimizacii vremennych characteristic processa vzaimnogo informacionnogo soglasovanija [Approaches to Optimize the Time Characteristics of the process of mutual informative agreement in multicomputer systems] / V nastojashhem vypuske (in Russian).

5. Geninson B.A., Pankova L.A., Trakhtengerts E.A. Otkazoustojchivye metody obespechenija vzaimnoj informacionnoj soglasovannosti v raspredelennych vychislitel'nyh sistemah [Fault-Tolerant Methods of Ensuring Interactive Consistency in Distributed Computing Systems.] / Avtomatika i telemechanika = Automation and Remote Control, 1989, vol. 50, no. 5, part 1, Pp. 579-590 (in Russian).

6. Ershov A.P. Vvedenie v teoreticheskoe programmirovanie [Introduction to Theoretical Programming], Moscow: Nauka = Science, 1977. 288 p. (in Russian).

7. Barborak M., Malek M. The Consensus Problem in Fault-Tolerant Computing // ACM Comput. Surveys. June 1993. V. 25. № 2. P. 171-220.

8. Lamport L., Shostak R., Pease M. The Byzantine Generals Problem // ACM Trans. Progr. Lang. Syst. 1982. V. 4. № 3. P. 382-401.

i Надоели баннеры? Вы всегда можете отключить рекламу.