Оценка показателей осуществимости решения задач на распределенных вычислительных системах

Павский Валерий Алексеевич; Павский Кирилл Валерьевич

2008

ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА Управление, вычислительная техника и информатика

№ 4(5)

ПРОЕКТИРОВАНИЕ И ДИАГНОСТИКА ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ

УДК 681.324

В.А. Павский, К.В. Павский

ОЦЕНКА ПОКАЗАТЕЛЕЙ ОСУЩЕСТВИМОСТИ РЕШЕНИЯ ЗАДАЧ НА РАСПРЕДЕЛЕННЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ*

Предлагается подход к расчету показателей осуществимости решения задач, характеризующих функционирование вычислительных систем в среднем.

В его основе лежат вероятностные процессы теории массового обслуживания. Полученные формулы обладают наглядностью и могут быть использованы при ручном счете. Установлена взаимосвязь между вероятностью решения сложной задачи и параметрами надежности системы.

Ключевые слова: Распределенные вычислительные системы, осуществимость решения задач.

При анализе эффективности функционирования вычислительных систем (ВС), как сосредоточенных, так и распределенных, используются показатели осуществимости [1, 2]. В зависимости от сложности задач и характера их поступления выделяют следующие режимы работы ВС: решение сложной задачи; обработка набора задач; обслуживание потока задач.

В работе предлагается подход к нахождению математических ожиданий и дисперсий, используемых в расчетах показателей осуществимости решения задач потока и набора.

2. Расчет показателей осуществимости решения задач на ВС

Рассмотрим абсолютно надежную распределенную ВС, состоящую из потенциально неограниченного числа элементарных машин (ЭМ) [2], на которую поступает поток простых задач интенсивностью а и интенсивностью в решения. (Простая задача представляется последовательной программой [2].)

Предполагается, что потоки поступлений и решения задач пуассоновские с параметрами а и в соответственно.

Требуется вычислить математическое ожидание А,{() числа задач, находящихся в системе [2], и соответствующую дисперсию А(г) в момент времени ?е[0, да) при начальных условиях

д. (0) = /, Ц (0) - 0, / 6 Е0 = {0,1,2,...}. (1)

* Работа выполнена при поддержке РФФИ, гранты № 07-07-00142, № 06-07-89089, № 08-08-00300, № 08-07-00022.

Пусть Рк(?) - вероятность того, что в момент времени ЇЄ [0, да) в ВС к задач находится на обслуживании, к е Е0°. Тогда система дифференциальных уравнений, в системе массового обслуживания М/М/да [4] имеет вид

а

аг

Рк (г) - -(^к + Нк ) ' Рк (г) + ^к-1 ' Рк-1 (г) + Нк+1 ' Рк+1 (г) , (2)

^ 0 , Ик > 0 , Но = 0 , к е £0°.

Р() = 0, г є £Г® .

Случай 1. Пусть ВС - высокопроизводительная, следовательно, можно считать, что каждая задача, поступившая в систему, сразу начинает обслуживаться. Полагая в системе (2)

К = а, и* = к -р,

получаем систему уравнений [3, 4]

аРк (г)

&

■--(а + к-в)• Рк(г) + а-Рк-1(г) + (к + 1)-0-рк+1(г).

Введем производящую функцию

^ 7

£(2, I) = 2 ^" • Рк () .

к=0

Система (3) сводится к следующему уравнению в частных производных:

+и г-1) М"».«(г-1) р (г,,).

01 дг

При начальных условиях (с учетом (1))

£(2,0) = 2г' .

Из (4) имеем

д д2 д (д 2

А() = ^р(1,/), Д (/) = ^р(1,г) р(1,г) -1 ^р(1,г)

дz дг2 дг \дг

(3)

(4)

(5)

(6)

Преобразование уравнения (5), с учетом (6), приводит к системе обыкновенных дифференциальных уравнений [3]:

(і) + Р-4 (і) = а,

аі

Лі

[ Д (г) + А (г) - А (г)] + 2р [ д (г) + А (г) - А (г)] = 2а • А (і)

(7)

с начальными условиями (1).

Решение системы (7) записывается в виде

А (*) = а (1 - е*) + І • е-в',

Д (I) = (1 - е-в') Ів + І • е-в'|.

(8)

Характер вхождения вычислительной системы в стационарный режим работы при обслуживании потока задач иллюстрируют рис. 1 и 2.

а

На рис. 1 приведены графики функций А;(г) (тонкие линии) и А;(У) + ст(?) (жирные линии) для а = 10 ч-1, в = 0,1 ч-1, г = 0, 50, 90; а(г) = у/О,- (). Стационарный режим функционирования ВС достигается практически через ? = 40 ч; учет дисперсии существенен, так как тах ст(?) = 10.

Адо(()

Рис. 1

Для практических расчетов можно пользоваться формулами A ±VD = lim[ A (t) ±4Dt) ] = a I P^VOIP .

В ситуации, представленной на рис. І, имеем A ± sfD = 100 ± 10.

На рис. 2 при а = І0 ч-1, в = 0,2 ч-1 и различных начальных условиях стационарный режим функционирования ВС достигается через t« З5 ч, max a(t) = І0.

Рис. 2

Случай 2. Изучим функционирование ВС невысокой производительности в режиме обработки пакета, состоящего из г простых задач. Выделенный ресурс составляет г ЭМ. В этом случае, полагая а = 0, получаем вместо уравнения (5) следующее:

^m.+ etz-і) -SzH . 0 , F (z,0). zi.

dt dz

Из (9), с учетом (б), после необходимых преобразований получим систему d

(9)

A- (t) + p ■ A (t) = 0,

[Dt (t) + A2 (t) - A (t)] = 2P- A (t).

(l0)

Решение системы (l0) при начальных условиях (l) имеет вид

Ai(t) = i exp(-p t), Di(t) = i exp(-pt)[l - exp(-pt)]. (ll)

Вычислим, например, время, через которое от начального набора i задач в ВС останется их половина. Из (ll) имеем

i/2 = i exp(-P t), тогда t = ln 2/p, дисперсия Di(t) = i/4, a = 4i /2.

0 2 4 6 8 ч

Рис. 3

На рис. 3 представлена зависимость числа решенных простых задач от времени ї, если начальный набор состоял из г=10 задач, выделенный ресурс состоит из 10 ЭМ, р = 1 ч-1. Время, необходимое для решения половины задач, находящихся в системе, ї = 1п 2 « 0,69 ч, а « 1,6. Следовательно, за 42 мин будет решено от 3,4 до 6,6 задач из 10, при суммарной интенсивности решения г'Р = 10 ч-1.

Случай 3. Рассмотрим решение набора і (>0) сложных задач на ВС. Сложная задача (представлена параллельной программой [2]) решается на всем выделенном ресурсе.

Пусть выделенный ресурс составляет п ЭМ, тогда интенсивность решения задачи будем считать равной п -в , где Р - интенсивность решения задачи на одной ЭМ (оцениваются потенциальные возможности ВС [1, 2]).

Так как задачи сложные, то они решаются последовательно.

Обозначим через р (і) вероятность того, что к моменту времени ї в ВС находится к задач (включая обслуженную), к є Е0.

В такой постановке система (2) записывается в виде

\рк '(г) = -пР-рк) + пР-рк+1 )> к є Е1 _1> (12)

[Рс () = п-Р-Рі(/); р'(?) = -п-в-р(і), ( )

с начальными условиями

р (0) = 1, Рк (0) = 0, к * і.

Условие нормировки, являющееся следствием системы уравнений, имеет вид

Е рк() =1, {є [0, да).

к=0

Вводя производящую функцию

п 7

рі) = X ^к • Рк () ,

к=0

систему (12) приводим к уравнению

2= п-Р-(! - *) • (^ І) - Р0 (г)), 0) = , (13)

из которого, после необходимых преобразований, получаем, с учетом (6), систему

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

а_

1 . (14)

-А, (г) = -п -р- (1 - р (г)),

:[ Д (г) + А2 (г) + А- (г) ] = -2п -р- А- (г)

-Ж1

с начальными условиями (1).

Для нахождения Р0 (г) вернемся к системе (12). Приведем точное решение.

ГО

Применяя преобразование Лапласа (/(л) = |е-*'* ■ /()Л, где /() - функция ог-

0

раниченного изменения [3]) к уравнению (13), получим

2 • (я • Ё(г, я) - г1) = пР-(1 - г) • (Ё(г, я) - Р0 (я)), Яе(У) > 0 , (15)

или ГМ = 21+1 - П в (1 - 2) •Р (5) . (16)

5 • 2 - П • Р • (1 - 2)

Так как нуль в знаменателе существует внутри круга | г |= |п Р /(я + п Р)| < 1, то с необходимостью в числителе имеем

Р (•*) = *-1 [п -Р /(в + п -Р)]г'. (17)

Подставляя правую часть формулы (17) в (16) и разделив полученный числитель на знаменатель, будем иметь

Р(г, в) = в• [п • р /(в + п • р)]г' + £ -к • [п • р /(в + п • р)]к . (18)

к=0

Взяв обратное преобразование Лапласа, предварительно разложив правую часть (18) на простейшие рациональные дроби, получим

р (г, г) = 1 - ехр (-п-Р-г) • (п-Р-г)г-к /(г - к)!+ ехр(-пР-г) • гг-к • (пР-г)к / к!

к=1 к=0

Учитывая, что

1 Эк

р (.) = -й -р- ^ (0,.),

находим искомое решение

р0(г) = 1-ехр(-«-Р-г)• £ (п к,^ ,

к=0 к!

Р(?) = (”'Р'!),|* • ехР(-«-Р-О, к е Е1. (19)

(г - к)!

Таким образом, решение системы (14) имеет вид

I (п -В- г у-к

4(г) = ехр(-п• р• г)• Ё к —, ,

к=1 (г - к)!

А (г) = ехр(-п • р • г) • Ё к2 • (п;р-г{ - (4(г))2.

к=1 (г - к)!

(20)

Обратимся к системе (14). Если число г задач велико, то можно считать, что г ^ ж, тогда Р0 () ^ 0 , V? е [0, да). При Р (г) = 0 система (14) имеет очевидное решение

(4 (0 =1 - п-Р-г> (21)

{Д. (г) = п -р-г, г < I / п-р, ()

в котором п -р- г, при г ^ ж, есть параметр случайного процесса Пуассона.

Погрешность приближенного решения (21) для 4 (г) находится по формуле

(п В-г)к

Л; (г) = ехр(-п-Р-г) - 2 (* - к)--- ---- .

к=;+1 к !

Формула (21) может быть использована при экспресс-анализе функционирования ВС.

Из (21) следует, что среднее время, необходимое для решения г сложных задач набора, гср = г / (п Р) при стандартном отклонении о = 41. Например, при выделенном ресурсе п = 100 ЭМ время, необходимое для решения набора из 400 задач при р = 0,1 ч-1, составит гср = 400 / (100 • 0,1) = 40 ч. С учетом отклонения, а = 7400 = 20 ч, для среднего времени решения набора задач имеем оценку:

= 40 ± 20 ч.

Учитывая, что Р0 (г) является распределением Эрланга порядка г [4], для которого

М^ = г /(п-Р), = г /(п-Р)2

(£ - полное время нахождения последней обслуженной задачи набора в ВС), получаем более точную оценку 7ср = 40 ± 2 ч.

3. Условие осуществимости решения сложной задачи на живучей ВС

При построении моделей функционирования ВС, в которых число элементарных машин было невелико и решаемые задачи простые, влияние надежности на организацию процесса решения задач (в целях упрощения математических моделей) можно было считать несущественным [4].

Для большемасштабных ВС такие упрощения привели бы к ошибкам принципиального характера. В связи со сказанным, вывод условия, позволяющего оценить осуществимость решения сложных задач на большемасштабных ВС с учетом их надежности, практически необходим. В самом деле, выход из строя ЭМ приводит к реконфигурации ВС тем чаще, чем больше число N ЭМ в системе; кроме того, с увеличением N время реконфигурации ВС увеличивается.

Обозначим через X интенсивность отказов одной ЭМ, а через р - интенсивность восстановлений отказавшей ЭМ одним восстанавливающим устройством.

Рассмотрим вычислительные системы со структурной избыточностью [2, 3]. Они представляют программно настроенную конфигурацию [2], в которой:

а) выделена основная подсистема из п ЭМ и подсистема из (N - п) ЭМ, подчиненная основной и составляющая структурную избыточность;

б) основная подсистема предназначена для решения сложных задач, представленных параллельными программами из п ветвей, а подчиненная система - для решения фоновых задач;

в) функции отказавшей ЭМ основной подсистемы берет на себя любая исправная ЭМ структурной избыточности.

Под восстановлением будем понимать комплекс мер, связанных с бесперебойной работой ВС (контроль, (само)диагностика, реконфигурация, избыточность и др. [2]). Время, необходимое для реализации этих мер, учтено в параметре р.

Если восстанавливающая система является высокопроизводительной, то условие осуществимости решения задач на ВС можно записать в виде

^ - п)-р / (п-Х) > 1. (22)

Физический смысл неравенства состоит в том, что суммарное время восстановления всегда должно быть больше, чем суммарное время отказов ЭМ.

Если задача сложная (т.е. решается на всех элементарных машинах), п ^ да , и реконфигурация ВС происходит со всеми оставшимися работоспособными ЭМ, то неравенство (11), в конце концов, нарушается (то есть система перестает самовос-станавливаться). Для его выполнения необходимо, чтобы реконфигурация осуществлялась на ограниченной подсистеме (объем которой сводил бы к минимуму межмашинные взаимодействия). Один из таких вариантов реконфигурации обеспечивает крупноблочное распараллеливание сложных задач [2].

Условие осуществимости (22) в большей мере имеет методологическое значение, хотя оно может использоваться и для практических оценок.

В самом деле, пусть сложная задача решается на ВС со структурной избыточностью. Поскольку условие (22) получено из вероятностной модели, то его выполнение зависит от вида случайного процесса, которому принадлежат параметры модели; в рассматриваемом случае процесс описывается схемой Бернулли (соответствующие формулы в переходном режиме получены в [3]).

Из (22) имеем

^ - п) > N-1 / (X + р).

Пусть N - n - случайная величина, характеризующая число ЭМ структурной

избыточности. Зададим Х = 10-4 ч-1, р = 10 ч-1, а) N = 104, б) N = 105, в) N = 106, тогда решение осуществимо с вероятностью

а) P{0 < N - n < 1} = (ц • (X + ц)N + N -X- цN-1 /(X + ц)N) « 0.99 ;

б) P{0 < N - n < 5} * 0.98 ;

в) P{0 < £ < x} > 0.99 .

Для нахождения x, числа ЭМ структурной избыточности (при x > 10), для

оценки можно воспользоваться интегральной теоремой Муавра - Лапласа [4]. Зададим доверительную вероятность у = 0.99, тогда Р{0 < N - n < x} = у . Используя указанную теорему, имеем

Ф ((x - N • p)lslN • p • (1 - p)) -Ф ((0 - N • р)ЦN • p • (1 - p)) ~ 0.9935, (23)

где p = X /(X + p), Ф(y) - нормированная нормальная функция распределения. Решая трансцендентное уравнение (23), находим x = 18 .

Следовательно, число ЭМ структурной избыточности определяется практическими соображениями и подтверждается вероятностями, значения которых должны быть близкими к единице. Обратно, если задать вероятность (назовем ее доверительной), то можно оценить число ЭМ структурной избыточности.

Замечание. Условие осуществимости основано на модели, описывающей состояния системы в текущий момент времени, что может вызвать сомнения в правомерности ее использования, поскольку модель не учитывает продолжительности решения задачи. Мы считаем, что было бы неразумным отвергать этот подход, так как с вероятностью сколь угодно близкой к единице он дает простой алгоритм поддержки необходимой производительности ВС в любой момент времени, что и определяет осуществимость решения задачи.

Заключение

Показано, что полученные аналитические формулы можно использовать при анализе эффективности функционирования ВС. Предложенный подход позволяет с единых методологических позиций вычислять моменты (центральные и начальные) не менее второго порядка, не вычисляя вероятности состояний системы, что особенно важно для анализа функционирования многомашинных ВС.

ЛИТЕРАТУРА

1. Евреинов Э.В., Хорошевский В.Г. Однородные вычислительные системы. Новосибирск: Наука, 1978.

2. ХорошевскийВ.Г. Архитектура вычислительных систем. М.: МГТУ им. Баумана, 2005.

3. Павский В.А., Павский К.В., Хорошевский В.Г. Вычисление показателей живучести распределенных вычислительных систем и осуществимости решения задач // Искусственный интеллект. 2006. № 4. С. 28 - 34.

4. Клейнрок Л. Вычислительные системы с очередями. М.: Мир, 1979.

Статья представлена кафедрой информационных технологий в исследовании дискретных структур радиофизического факультета Томского государственного университета и оргкомитетом 7-й Российской конференции с международным участием «Новые информационные технологии в исследовании сложных структур», поступила в научную редакцию 8 октября 2008 г.

Оценка показателей осуществимости решения задач на распределенных вычислительных системах Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Павский Валерий Алексеевич, Павский Кирилл Валерьевич

Похожие темы научных работ по математике , автор научной работы — Павский Валерий Алексеевич, Павский Кирилл Валерьевич

Estimation of realizability parameters of solving problems on distributed computer systems

Текст научной работы на тему «Оценка показателей осуществимости решения задач на распределенных вычислительных системах»