Научная статья на тему 'Использование методов резервирования для повышения надежности многопроцессорных параллельноконвейерных систем'

Использование методов резервирования для повышения надежности многопроцессорных параллельноконвейерных систем Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
158
51
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Использование методов резервирования для повышения надежности многопроцессорных параллельноконвейерных систем»

2. Не требовать специальных знаний и усилий для ввода ответа, свести к минимуму рутинные операции по вводу ответа (использовать списки и т.п.).

3. Анализировать правильность ответа простых (без учета логики и хода решения задачи) тестовых заданий, информировать о допущенных ошибках, содержать информацию (подсказки), достаточную для их устранения.

4. Анализировать логику и ход решения сложных учебных задач, оказывать содействие при решении учебных задач, обеспечивая педагогически обоснованную помощь, с учетом характера затруднения и модели обучаемого, достаточную для того, чтобы решить задачу и усвоить способ ее решения.

5. Выдавать результат прохождения теста с комментариями о допущенных ошибках и рекомендациями для повторения теоретического материала (с учетом допущенных ошибок).

На основании вышеизложенного, можно сформулировать следующие выводы.

1. Для создания системы (программы) тестирования на этапе конструирования целесообразно использовать методику классической теории тестирования.

2. После создания банка тестовых вопросов необходима апробация теста и обработка полученных результатов в соответствии с аппаратом ШТ.

ЛИТЕРАТУРА

1. Кузовлева К.Т. Конструирование педагогических тестов на основе современных математических моделей. Материалы семинара «Новые информационные технологии в образовании». Владивосток: Центр НОТ ДВГУ, 1997. - 116 с.

2. Анастази А. Психологическое тестирование. Кн.1. - М.: Педагогика, 1982. - 320 с.

3. Аванесов В.С. Основы научной организации педагогического контроля в высшей школе. - М.: Труды Исследовательского центра Гособразования СССР, 1989. - 168 с.

4. Челышкова М.Б. Применение математических моделей для разработки педагогических тестов. - Учебное пособие. - М.: Исследовательский центр, 1995. - 48 с.

Е.Р. Мунтян

ИСПОЛЬЗОВАНИЕ МЕТОДОВ РЕЗЕРВИРОВАНИЯ ДЛЯ ПОВЫШЕНИЯ

НАДЕЖНОСТИ МНОГОПРОЦЕССОРНЫХ ПАРАЛЛЕЛЬНОКОНВЕЙЕРНЫХ СИСТЕМ

В данной работе ставится задача обеспечения отказоустойчивости многопроцессорных систем с перестраиваемой структурой. В настоящее время микропроцессоры являются высоконадежными элементами, однако надежность системы, состоящей из них, оказывается существенно ниже существующих требований. Следовательно, целесообразно создание программно-аппаратных средств для обеспечения отказоустойчивости системы, особенно если предполагается эксплуатация данной системы в исключительно-тяжелых условиях, в местах труднодоступных для человека. В таком случае можно говорить о крайней необходимости создания живучих отказоустойчивых многопроцессорных систем.

Необходимость обеспечивать высокую вычислительную мощность МПС и большую скорость их работы, а также желание наиболее полно использовать при этом возможности современной микроэлектроники, достоинства больших и сверхбольших интегральных схем привели к разработке большого количества ставших уже классическими архитектур многопроцессорных систем.

В результате многочисленных исследований были разработаны широко ныне известные архитектуры МПС, например, магистральные, конвейерные, векторные, кольцевые, матричные и т.д.

МПС параллельно-конвейерного типа представляет собой гибрид параллельной и конвейерной многопроцессорных систем. Параллельно-конвейерные многопроцессорные системы относятся к системам с жесткими межпроцессорными каналами. Процессоры в такой системе размещаются параллельными рядами. Информация между процессорами в таких структурах может передаваться от столбца к столбцу только в прямом направлении. Передача информации в обратном направлении либо между процессорами одного столбца невозможна.

Естественно предположить, что для функционирования такой системы потребуется введение коммутаторов, устройства управления, дополнительной памяти и т.д.

Итак, пусть наша система реализует математические операции, в качестве элементной базы будем использовать специализированный комплект для потоковых мультипроцессорных систем 4.К601ВЖ3 [1]. Составляющие системы расположим так, как это отображено на рис. 1, где приняты следующие обозначения:

КМ - коммутатор для осуществления связей между процессорами;

МП - микропроцессор 4.К601ВЖ3;

N - количество строк микропроцессоров;

М - количество столбцов микропроцессоров.

Рис. 1

Микропроцессор поразрядной обработки 4.К601ВЖ3-0034 реализует арифметические и логические операции над числами, представленными в избыточной системе счисления (1,-1,0). Для каждого МП будем предполагать наличие

встроенной схемы контроля и сигнала ошибки. В случае отказа i-го МП (i= 1, N) сигнал ошибки поступает в устройство управления полями процессора, где специальный драйвер генерирует для коммутатора сигнал отключения входов и выходов данного МП. Одновременно происходит перераспределение задачи между остальными процессорами. Такой подход приводит к деградации системы, что недопустимо в параллельно-конвейерных системах.

Универсальный матричный коммутатор (КМ) работает синхронно, адреса вводятся параллельно, используется матрица коммутации 32х32 и осуществляется передача цифровых сигналов.

Входная и выходная ортогональная память служит для запоминания входного слова данных и результата вычислений для каждого цикла работы системы. Введение такой памяти в систему вызвано необходимостью запоминания данных, в случае если произошел отказ МП и требуется повторить вычисления.

Ввиду сложности рассматриваемой системы, а также возможных исключительно-тяжелых условий эксплуатации (например, в условиях повышенной радиации, космических объектах, гидроустановках и так далее) возникает вопрос об определении уровня надежности для нее. Под надежностью вычислительной системы понимают ее свойство выполнять заданные функции при заданных режимах и условиях эксплуатации в течение требуемого промежутка времени.

Основной количественной характеристикой надежности является вероятность безотказной работы P(t) — вероятность того, что в системе при заданных режимах и условиях эксплуатации в течение заданного промежутка времени в устройстве не произойдет отказ.

Для того чтобы определить надежность работы системы, необходимо найти вероятность безотказной работы каждого элемента, являющегося составной частью данной системы. В данной работе мы ограничимся исследованием надежностных характеристик только вычислительных устройств, а именно микропроцессоров.

Итак, будем считать, что распределение отказов происходит по экспоненциальному закону, тогда вероятность безотказной работы каждого микропроцессора с учетом наличия 100000 элементов «И» в одной микросхеме может быть вычислена по формуле

Pi(t) = (e -l1)105 , (1)

где l - интенсивность отказов элемента за время его работы ti. В нашем случае интенсивность отказов микропроцессора низка ^=10"9, т.к. рассматриваются высоконадежные МП. В дальнейшем для упрощения будем обозначать вероятностные характеристики как независимые от времени, например Pi(t)=Pi.

При этом ti может принимать значения из временного интервала от 100 до

1000 часов. Вероятность безотказной работы для разрабатываемой системы будем

производить для системы с количеством строк процессоров N и количеством столбцов M по формуле

P0i = (Pi)N*M. (2)

По формулам (1) и (2) были произведены вычисления для определения вероятности безотказной работы самого микропроцессора и системы, состоящей из 24-х МП (N=8, M=3). Эти вычисления реализованы в виде программного обеспечения на языке Visual Basic. Результаты вычислений сведены в таблицу 1.

Таблица 1

Время работы МПС ^ Вероятность безотказной работы микропроцессора Вероятность безотказной работы МПС из 24-х микропроцессоров без резервирования P0i

100 0.99 0.789

200 0.98 0.619

300 0.97 0.487

400 0.961 0.383

500 0.951 0.301

600 0.942 0.237

700 0.932 0.186

800 0.923 0.147

900 0.914 0.115

1000 0.905 0.091

Анализируя табл. 1, можно сделать вывод о необходимости повышения надежности исследуемой МПС. Это может быть достигнуто при использовании известных способов резервирования, например структурного, временного и информационного. Используя временную избыточность, можно достичь хороших результатов [2]. Но для параллельно-конвейерной системы неприемлемы большие временные затраты на перенастройку КМ (порядка нескольких десятков тактов).

Информационная избыточность в некотором роде уже имеет место, т.к. код, который передается в МП, является избыточным, что уже позволяет контролировать определенный класс ошибок в вычислениях.

Поэтому обратим внимание на структурное резервирование, хотя это и влечет за собой аппаратные затраты. Очевидно, что наиболее подходящим для данной системы является резервирование дополнительными элементами для каждого столбца. Входы и выходы резервных процессорных элементов (РПЭ) должны иметь возможность быть подключенными к коммутаторам. Соответственно усложняется устройство управления полями процессора и наращивается коммутатор. Структура отказоустойчивой МПС параллельно-конвейерного типа изображена на рис. 2, где РЭ - резервный процессорный элемент.

В такой системе в случае отказа ьго МП ^=1^) устройство управления полями процессора генерирует для коммутатора сигнал отключения входов и выходов данного МП и подключения вместо него свободного РПЭ из этого столбца. При этом следует использовать нагруженный резерв. Это связано с невозможностью остановки вычислительного процесса или его длительных простоев.

В таком случае остановим свой выбор на резервировании с дробной кратностью. Основные и резервные МП находятся в рабочем режиме и осуществляют вычисления. При этом результат вычислений РПЭ нигде не учитывается. Все это дает возможность достаточно быстро (при минимальных задержках) ввести в работу МПС резервный элемент при выходе из строя основного МП.

Таким образом, производительность системы сохраняется до тех пор, пока не будут израсходованы все резервные элементы. Реконфигурация системы происходит за минимальное время. Использование ортогональной памяти позволяет системе вернуться на шаг назад в вычислениях в случае обнаружения ошибки.

Таким образом, можно говорить о создании самоорганизующейся отказоустойчивой МПС.

Вх.

орт. КМ

пам.

—►

У ГУ

І I

—►[О О о[

I

I

И

______________________________I

ООО

орт.

пам.

Устройство управления полями процессора

Системная

память

Устройство ввода-вывода

Пользователь

m1

Рис. 2

Рассчитаем вероятность безотказной работы вычислительной системы с учетом введенных m строк резервных МП при условии равных вероятностей отказов основных и резервных процессоров:

РР- =

11 і , m •

(Рі)(К+ m-»(К + т)!-£

k =0

(Pi) "-(-^

J!

(і - к)!-к!

ё і =0

(К + т- і)!-і!

м

(3)

Результаты вычислений по формуле (3) показали, что заданная вероятность безотказной работы МПС (уровень 0,98 - 0,99) при N=8, М=3 достигается при т=4 (для =1000 часов), т.е. для обеспечения отказоустойчивости рассмотренной

МПС следует ввести дополнительный резерв в составе 12 элементов.

Хотелось бы сравнить эффективность данного резервирования с таким видом избыточного резервирования, как дублирование. Вероятность безотказной работы системы с дублированием может быть вычислена по формуле

PDi = (^)ММ *(2-^)ММ . (4)

Соответствующие исследования показывают, что использование дублирования, несмотря на введение 100% аппаратной избыточности обеспечивает надежность системы ниже, чем при введении в систему 2-х или 3-х строк РПЭ. На рис. 3 изображены графики значений вероятности безотказной работы МПС при рассмотренных способах резервирования и без него. Оси абсцисс соответствует время работы системы, оси ординат - вероятность безотказной работы МПС.

Итак, графики, изображенные на рис. 3, доказывают, что поставленная задача создания отказоустойчивой параллельно-конвейерной МПС наиболее эффективно может быть решена применением резервирования с дробной кратностью. Этот подход позволяет не только повысить надежность системы, но и снизить общие аппаратные затраты (по сравнению с дублированием). Это имеет большое значение для рассматриваемых нами систем.

ЛИТЕРАТУРА

1. Гузик В.Ф., Золотовский В.Е. Проблемно-ориентированные высокопроизводительные вычислительные системы. Учебное пособие, Таганрог, Изд-во ТРТУ, 1998. 326 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. Самойленко А.П., Чекрыгина Е.Р. Принципы организации самодиагностирующихся многопроцессорных вычислительных систем. Известия ТРТУ №3, 2001.65-71 с.

В.Е. Золотовский, Е.В. Ляпунцова, П.В. Савельев

СИСТЕМА РАСПРЕДЕЛЁННЫХ ВЫЧИСЛЕНИЙ НА БАЗЕ ЛОКАЛЬНЫХ

СЕТЕЙ

Системы распределённых вычислений используются в тех случаях, когда для получения решения поставленной задачи на одном компьютере требуются большие временные затраты.

Один из путей сокращения временных расходов представляет собой распараллеливание процесса решения. В этом случае задача подразделяется на несколько частей, каждая из которых может выполняться независимо от других хотя бы на некотором промежутке вычислений. В процессе решения осуществляется обмен данными между подзадачами, что позволяет им производить следующий шаг вычислений. Таким образом, выполняя отдельные последовательности расче-

i Надоели баннеры? Вы всегда можете отключить рекламу.