Анализ вероятностно-временных характеристик отказоустойчивого программного обеспечения распределенных вычислительных систем

Царев Р. Ю.; Штарик А. В.; Штарик Е. Н.; Кочергина М. А.; Панфилова Т. А.

Unipotent Subgroup in Lie Type Groups // J. of Algebra. 2012. Vol. 349, № 1. P. 98-116.

11. Сулейманова Г. С. Сопряженность в конечной группе Шевалле типа E8 больших абелевых

унипотентных подгрупп // J. of Siberian Federal Univ. Mathematics & Physics. 2011. Vol. 4, № 4. P. 536-540.

12. Сулейманова Г. С. О сопряженности в группе Шевалле больших абелевых подгрупп унипотентной подгруппы // Фундамент. и прикл. математика. 2009. Т. 15, № 7. С. 205-216.

13. Сулейманова Г. С. Классы сопряженных в группе Шевалле типа F4 больших абелевых подгрупп унипотентной подгруппы // Владикавказ. мат. журнал. 2011. Т. 13, вып. 2. С. 45-55.

14. Стейнберг Р. Лекции о группах Шевалле. М. : Мир, 1975.

15. Carter R. Simple Groups of Lie Type. New York : Wiley and Sons, 1972.

16. Бурбаки Н. Группы и алгебры Ли. М. : Мир, 1972.

G. S. Suleymanova

EXEPTIONALY LARGE ABELIAN UNIPOTENT SUBGROUPS IN GROUPS OF LIE TYPE

Let G be a group of Lie type over a finite field K and let U be its unipotent subgroup. In the connectoin to the problem of description of large abelian subgroups in the group U of exceptional type, we discover large abelian subgroups in the group U of type 2E6, which are not G-ajoint to a normal subgroup in U. Some results on the Thopson subgroup are revised.

Keywords: group of Lie type, unipotent subgroup, large abelian subgroup.

УДК 681.34

Р. Ю. Царев, А. В. Штарик, Е. Н. Штарик, М. А. Кочергина, Т. А. Панфилова

АНАЛИЗ ВЕРОЯТНОСТНО-ВРЕМЕННЫХ ХАРАКТЕРИСТИК ОТКАЗОУСТОЙЧИВОГО ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ РАСПРЕДЕЛЕННЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ*

Представлено описание программного комплекса анализа вероятностно-временных характеристик отказоустойчивого программного обеспечения распределенных вычислительных систем с использованием ГЕРТ-сетей.

Ключевые слова: отказоустойчивое программное обеспечение, распределенные вычисления, ГЕРТ-сети.

На сегодняшний день распределенные вычислительные системы все чаще используются для решения управленческих, исследовательских и производственных задач. Одним из видов таких систем являются гетерогенные вычислительные системы высокой надежности для высокопроизводительных вычислений (системы обработки высокой пропускной способности), объединящие в единую вычислительную среду гетерогенные вычислительные ресурсы (суперкомпьютеры, серверы, рабочие станции, локальные и глобальные сети с различной пропускной способностью, хранилища данных и пр.), благодаря чему создается единая среда обработки информации и распределенных вычислений.

Большинство исследовательских задач, решаемых в сфере гетерогенных вычислений, направлено на разработку системы поддержки параллельных или распределенных вычислений, стремящихся прибли-

зить практическую продолжительность работы (производительность, коэффициент ускорения) к теоретически возможной для данного кластера.

Постановка задачи. Использование суперкомпьютера или специализированного кластера невозможно или малоэффективно в таких случаях, когда алгоритм программы нельзя эффективно преобразовать из последовательного в параллельный, время выполнения задачи сравнимо со временем создания параллельного алгоритма [1] или требуется решать множество одинаковых задач с различными входными данными, при этом время выполнения каждой задачи в отдельности невелико (не превышает нескольких часов). Для таких задач возможна разработка гетерогенной распределенной вычислительной системы (РВС), использующей узлы с высокой надежностью и отказоустойчивостью.

*Работа выполнена в рамках реализации ФЦП «Научные и научно-педагогические кадры инновационной России» на 2009-2013 гг.

Эффективное использование подобных РВС связано:

- с разработкой моделей и методов анализа вероятностно-временных характеристик распределенных вычислительных систем с недетерминированным поведением ее вычислительных узлов;

- подготовкой рекомендации по эксплуатации распределенных гетерогенных вычислительных систем для обеспечения эффективного выполнения приоритетных задач обработки информации.

Среда проведения анализа вероятностновременных характеристик отказоустойчивого программного обеспечения распределенных вычислительных систем. Для решения поставленных задач была разработана среда проведения анализа вероятностно-временных характеристик отказоустойчивого программного обеспечения распределенных вычислительных систем MGNetwork, созданная в среде разработки Delphi 6.0 с использованием следующих дополнительных библиотек:

- SimpleXML версии 1.0.1 (для работы с XML-документами);

- FatExpression версии 1.03 (для расчета произвольных математических выражений).

Среда MGNetwork на основе ГЕРТ-сети, описывающей отказоустойчивое программное обеспечение распределенных вычислительных систем и оформленной в XML-документе специального вида, позволяет:

- оценить характеристики и вещественные параметры ГЕРТ-сети [2]: вероятность выполнения стока сети, математическое ожидание и дисперсию времени выполнения всей сети или стока сети и т. д.;

- оценить агрегатные и стохастические параметры вещественных переменных оцениваемой системы: сумму, среднее, минимум, максимум, математическое ожидание и дисперсию;

- построить графики функций распределения и плотности распределения случайных величин (параметров оцениваемой системы);

- построить графики функций распределения и плотности распределения стохастических параметров ГЕРТ-сети;

- исследовать каждую реализацию отказоустойчивого программного обеспечения распределенных вычислительных систем и маршруты активации узлов;

- оценить параметры каждого узла: вероятность активации узла, математическое ожидание, дисперсию, распределения и плотности распределения стохастических параметров [3; 4].

Для использования продолжительности выполнения работ, заданных случайными величинами в сетях для метода критического пути (МКП) или ПЕРТ-сетях, был разработан и реализован алгоритм преобразования произвольной МКП-сети или ПЕРТ-сети в ГЕРТ-сеть.

Экспериментальная часть. Выполним сравнение результатов для работы двух узлов распределенной вычислительной системы Condor [5], полученных при помощи построенных моделей: узла 1 - компьютера,

размещенного в классе общего доступа; узла 2 - компьютера, размещенного в лаборантском кабинете класса (рис. 1-4, табл. 1).

500 1 000 1 500 2 000

Рис. 1. Функция распределения времени доступности узла 1

600 620 640 660 660 700 720 740

Рис. 2. Функция распределения времени недоступности узла 1

О 1 ООО 2 000 3 000 4 0

Рис. 3. Функция распределения времени доступности узла 2

Результаты моделирования представлены в табл. 2 и на рис. 5-8, где использованы следующие обозначения: Т_7. - время выполнения задачи, ч, на узле без сбоев и резервного копирования; Т_Я - интервал времени, ч, между выполнением резервных копий состояния задачи; Т (результат моделирования работы узла) - случайная величина времени выполнения задачи на соответствующем узле при данной периодичности выполнения РК состояния задачи; М(Т), с(Т) - математическое ожидание и среднеквадратичное отклонение времени выполнения задачи на узле; М(Т) / Т_2 - обратная величина ожидаемого коэффициента ускорения (коэффициента замедления).

Кривая 1 соответствует режиму запуска задачи без использования функции резервного копирования, кривые 2, 3 и 4 - режиму запуска задачи с выполнением резервных копий состояния системы каждые 2, 4 и 6 ч.

Протокол экспериментов приведен в табл. 3. Экс-данных задачах с продолжительностью выполнения 6 периментальная проверка проводилась не для всех

и 12 ч. Задачи запускались в режимах без резервного режимов запуска задач, поскольку тогда общая прокопирования (РК) и с резервным копированием каж- должительность эксперимента составляла бы более

дые 2, 4 и 6 ч. трех месяцев.

Таблица 1

Параметры моделей функционирования узлов распределенной вычислительной системы

Параметр Узел 1 Узел 2

Время миграции задачи, мин 10 10

Вероятность доступности узла в начале вычислений 0,583 6 0,778 2

Вероятность успешной миграции задачи с узла при необходимости 0,62 0,86

Таблица 2

Результаты оценки времени выполнения задачи на узлах распределенной вычислительной системы

^, ч Узел Т_К, ч Ы(Т), ч ст(Т), ч Ы{Т)!Т_1

12 1 Без РК 48,689 05 36,203 350 4,057 421

12 1 2 27,320 15 4,320 533 2,276 679

12 1 4 27,053 92 5,215 10 2,254 493

12 1 6 27,862 77 7,435 95 2,321 897

12 2 Без РК 15,292 17 6,736 75 1,274 347

12 2 2 27,544 32 7,524 95 2,295 360

12 2 4 22,549 13 7,144 30 1,879 094

12 2 6 21,881 88 7,573 25 1,823 490

6 1 Без РК 15,292 17 6,736 75 2,548 694

6 1 2 15,456 65 4,184 433 2,576 108

6 1 4 15,235 48 4,260 417 2,539 247

6 2 Без РК 10,877 53 6,331 567 1,812 922

6 2 2 14,593 75 5,620 233 2,432 292

6 2 4 13,493 50 5,581 150 2,248 917

* Обозначения см. в тексте.

Рис. 4. Функция распределения времени недоступности узла 2

Эксперименты проводились на специально соз-

1

0,9 0,8 0,7 0,6 I 0,5 0,4 0,3 0,2 0,1 0

360 860 1360 1360 2360

мин (время выполнения задачи на узле РГСОИ)

Рис. 5. Функции распределения времени выполнения задачи (T_Z = 6 ч) на узле 1 (обозначения см. в тексте)

1

0,9 0,8 0,7 0,6 ^ 0,5 0,4 0,3 0,2 0,1 0

360 860 1360 1860 2360

I, и и н (время выполнения задачи на узле РГСОИ|

Рис. 6. Функции распределения времени выполнения задачи (T_Z = 6 ч) на узле 2 (обозначения см. в тексте)

1

0,9

0,8

0,7

0,6

О,"'

и-

0,4

0,3

0,2

0,1

0

720 1220 1720 2220 2720 3220 3720

1 мин (время выполнения задачи на угле РГСОИ)

Рис. 7. Функции распределения времени выполнения задачи (T_Z = 12 ч) на узле 1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(обозначения см. в тексте)

1

0,9 0,8 0,7 0,6 £ 0,5 0,4 0,3 0,2 0,1 о

720 1220 1720 2220 2720 3220 3720

1, мин (время выполнения гадачи на угле РГСОИ)

Рис. 8. Функции распределения времени выполнения задачи (T_Z = 12 ч) на узле 2

(обозначения см. в тексте)

Таблица 3

Протокол выполнения задач на распределенной вычислительной системе Condor

T_Z, ч Узел T_R, ч № эксперимента T, ч

1 31,03

12 1 4 2 33,53

3 29,53

1 22,97

12 2 4 2 31,98

3 29,07

1 12,07

6 1 Без РК 2 23,72

3 11,50

1 12,10

6 1 2 2 19,87

3 20,03

1 18,83

6 1 4 2 12,68

3 14,30

1 8,55

6 2 Без РК 2 13,53

3 17,15

1 13,07

6 2 2 2 20,17

3 9,37

1 15,27

6 2 4 2 20,88

3 22,12

Полученные результаты не противоречат результатам моделирования. Однако небольшой объем выборки не позволяет использовать статистические методы проверки гипотезы ее соответствия аналитически построенному распределению.

Проведем анализ построенных функций распределения времени выполнения задач на узлах 1 и 2:

- для каждых узла и задачи существует такое значение периода выполнения резервного копирования, при котором среднеквадратичное отклонение времени выполнения задачи наименьшее;

- частое резервное копирование ведет к большим накладным расходам [6];

- желательно, чтобы математическое ожидание времени доступности узла было в два и более раз больше, чем периодичность выполнения резервного копирования;

- вероятность успешной миграции задачи с узла существенно повышает эффективность его работы. Увеличение этого параметра зависит от отказоустойчивости узла и сети передачи данных, объема передаваемых данных и поведения пользователя узла.

На основании графиков функций распределения времени выполнения задач на узле распределенной вычислительной системы (см. рис. 5-8) можно сделать следующие выводы:

- узел 2 не нуждается в частом резервном копировании при данной продолжительности решения задачи, тогда как узел 1 требует выполнения периодических резервных копий;

- для узов 1 и 2 выполнение резервного копирования каждые 2 ч значительно увеличивает общую продолжительность решения задачи;

- уменьшение интервала резервного копирования для узлов уменьшает дисперсию времени выполнения задачи.

Построенные функции распределения времени выполнения задачи позволяют:

- прогнозировать время выполнения задачи для разных узлов РВС с допустимой вероятностью;

- ранжировать узлы по вероятности завершения выполнения задачи за определенное время;

- выбрать оптимальный интервал времени выполнения резервных копий;

- формировать рекомендации по написанию заявки на ресурсы РВС.

Используя эти функции, можно рассчитать величину, обратную коэффициенту ускорения для узла системы:

узлу 1, Т_7. = 6 ч, резервное копирование с интервалом 4 ч.

К - ТТ-

Т к

(1)

где Т1 - время, необходимое для расчета задачи без использования РВС; Тк - время расчета задачи с использованием РВС; N - количество узлов системы обработки информации.

Функция распределения Р(у) случайной величины у = К имеет вид

0 ад ад у?1

Р(у) - | МЧ) | Л1 +| МЧ) | Л1 -

-ад у?1 0 -ад

0 ад

- | Л(*1 )(1 -р(уЧМ +1/1(11)р(у{\)&1, (2)

-ад 0

где /1, /2 - функции плотности распределения случайных величин Тк и Т1; Р1, Р2 - функции распределения случайных величин Тк и Т1.

Для представленных выше моделей Т1 = Т_7 - положительная константа, а Тк задано функцией распределения Р\(0, у = К строго больше нуля. Тогда

шт^,^/ у ) ад

Р(у) - I МЧЩ + I -

-ад шах(0,Г[/ у )

- Р (шт(о, Т1 / у)) + (1 - Р (шах(0, Т1 / у))) - (3)

- Р(0) +1 -Р1(Т1/у) -1 + Р(0)-Р(Т_7 /К,).

Пример функций распределения величины, обратной коэффициенту ускорения, приведен на рис. 9, где кривая 1 соответствует узлу 2, Т_7 = 6 ч, без резервного копирования; кривая 2 - узлу 2, Т_7 = 12 ч, без резервного копирования; кривая 3 - узлу 1, Т_7 = 12 ч, резервное копирование с интервалом 4 ч; кривая 4 -

Рис. 9. Функция распределения случайной величины, обратной коэффициенту ускорения (обозначения см. в тексте)

Полученная функция распределения коэффициента Р(К), в отличие от Р1(к), является относительной величиной, нормированной по времени выполнения задачи, которая при достаточно большом времени Т_7 характеризует стохастическую эффективность работы системы.

Функции распределения коэффициента ускорения Ке и К совпадают, поскольку для данной архитектуры РВС N = 1. Эти функции позволяют проводить группировку узлов по фактической производительности и выполнять приоритетные задачи с приемлемой вероятностью получения результата к требуемому моменту времени.

Предложенный подход к анализу вероятностновременных характеристик отказоустойчивого программного обеспечения распределенных вычислительных систем основан на использовании инструментальных средств в виде программной реализации моделей и методов анализа вероятностно-временных характеристик РВС с недетерминированным поведением вычислительных узлов.

Среда для проведения анализа вероятностновременных характеристик отказоустойчивого программного обеспечения распределенных вычислительных систем позволяет выполнять расчеты ГЕРТ-сетей, используя прямой и обратный алгоритмы ГЕРТ-сети [7], прямую свертку; имеет открытый формат ХМЬ-документа, описывающий структуру сети, что дает возможность ее задания в любом текстовом редакторе и дальнейшего создания специализированного программного обеспечения согласно визуальному построению ГЕРТ-сети. Еще одним достоинством этой среды является трассировка реализаций отказоустойчивого программного обеспечения РВС и анализа результатов этой трассировки.

Библиографические ссылки

1. Ковалев П. В., Лайков А. Н., Гриценко С. Н. Определение надежности мультиверсионного программ-

ного обеспечения с использованием методов анализа сетей // Вестник СибГАУ. 2009. Вып. 1 (22). Ч. 2. С. 55-60.

2. Царев М. Ю., Царев Р. Ю., Шевчук С. Ф. Модификация ГЕРТ-сети для анализа временных характеристик сетевых моделей // Вестник СибГАУ. 2009. Вып. 1 (22). Ч. 2. С. 74-78.

3. Ковалев П. В., Капчинский И. А., Гриценко С.

Н. Графоаналитический метод анализа мультиверси-онных архитектур программного обеспечения // Вестник СибГАУ. 2009. Вып. 3 (24). С. 37-39.

4. Ковалев И. В., Письман Д. М., Слободин М. Ю. Модели оценки времени выполнения задачи на кластере с последовательной и параллельной архитекту-

рой обмена данными // Системы упр. и информ. технологии. 2005. № 3 (20). С. 58-62.

5. Condor Version 6.6.10 Manual [Electronic resource]. URL: http://www.cs.wisc.edu/condor/manual/ v6.6/ (date of visit: 10.10.2012).

6. К вопросу формирования мультиверсионного программного обеспечения с учетом ресурсных ограничений / П. В. Ковалев, И. А. Капчинский, А. Н. Лай-ков, С. Н. Гриценко // Вестник СибГАУ. 2009. Вып. 2 (23). С. 70-74.

7. Письман Д. М. Сравнение производительности прямого и обратного алгоритмов расчета модифицированной ГЕРТ-сети // Фундамент. исслед. 2006. № 2. C. 45-47.

R. Yu. Tsarev, A. V. Shtarik, E. N. Shtarik, M. A. Kochergina, T. A. Panfilova

ANALYSIS OF PROBABILISTIC AND INTERIM CHARACTERISTICS OF FAULT TOLERANT SOFTWARE OF DISTRIBUTED COMPUTING SYSTEMS

The paper presents description of developed software system for analysis of probabilistic and interim characteristics of the fault tolerant software of distributed computing systems with the use of GERT-networks.

Keywords: fault tolerant software, distributed computing, GERT-network.

УДК 512.54

А. А. Шлепкин

О ПОДГРУППАХ СВОБОДНОЙ ДВУПОРОЖДЕННОЙ БЕРНСАЙДОВОЙ ГРУППЫ ПЕРИОДА ПЯТЬ

Получены достаточные условия существования в B(2, 5) двупорожденных подгрупп, не изоморфных B(2, 5).

Ключевые слова: проблема Бернсайда, вычислительная теория групп.

Одной из известных проблем теории групп является проблема Бернсайда о периодических группах фиксированного периода [1]. Эта проблема была поставлена английским математиком У. Бернсайдом в 1902 г. в следующей форме: пусть G - группа, порожденная m элементами, в которой каждый элемент в степени п равен единичному элементу группы. Будет ли такая группа конечной? Впоследствии эти группы получили название свободных бернсайдовых групп и обозначение B(m, п).

Перечислим известные к настоящему времени результаты по данным группам. Группа B(m, п) конечна для п = 2 (тривиальный случай), п = 3 [1], п = 4 (т = 2) [1], для m > 2 [2], п = 6 [3]. Группа В(т, п) бесконечна для нечетных п > 665 [4] и для достаточно больших четных п [5; 6].

В 1950 г. В. Магнусом была поставлена еще одна проблема, известная как ослабленная проблема Бернсайда. В ней требовалось выяснить, существует ли максимальная конечная периодическая группа В0(т, п) с данным числом порождающих элементов т и фиксированным периодом п. Связь ослабленной проблемы

Бернсайда с основной проблемой сводится к тому, что если бы не существовало бесконечных периодических групп, то В(т, п) была бы максимальной конечной периодической группой при этих т и п.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Решение ослабленной проблемы Бернсайда для периода 5 приведено в [7]. Для других показателей, наименьший из которых п = 5, вопрос о конечности остается открытым.

Наибольший интерес представляют двупорожден-ная группа периода 5 (группа В(2, 5), поскольку эта группа имеет наименьший показатель и наименьшее число порождающих элементов в сравнении с другими бернсайдовыми группами, конечность которых не определена. Отметим два вопроса о подгруппах группы В(2, 5), поставленные Б. Б. Симсом [8], ответы на которые до настоящего времени не известны:

- вопрос 1: существуют ли в В(2, 5) нециклические конечные подгруппы;

- вопрос 2: существуют ли в В(2, 5), при условии ее бесконечности, бесконечная двупорожденная подгруппа периода 5, не изоморфная В(2, 5)?

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Царев Р. Ю., Штарик А. В., Штарик Е. Н., Кочергина М. А., Панфилова Т. А.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Царев Р. Ю., Штарик А. В., Штарик Е. Н., Кочергина М. А., Панфилова Т. А.

ANALYSIS OF PROBABILISTIC AND INTERIM CHARACTERISTICS OF FAULT TOLERANT SOFTWARE OF DISTRIBUTED COMPUTING SYSTEMS

Текст научной работы на тему «Анализ вероятностно-временных характеристик отказоустойчивого программного обеспечения распределенных вычислительных систем»