2008
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА Управление, вычислительная техника и информатика
№ 4(5)
ПРОЕКТИРОВАНИЕ И ДИАГНОСТИКА ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ
УДК 681.324
В.А. Павский, К.В. Павский
ОЦЕНКА ПОКАЗАТЕЛЕЙ ОСУЩЕСТВИМОСТИ РЕШЕНИЯ ЗАДАЧ НА РАСПРЕДЕЛЕННЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ*
Предлагается подход к расчету показателей осуществимости решения задач, характеризующих функционирование вычислительных систем в среднем.
В его основе лежат вероятностные процессы теории массового обслуживания. Полученные формулы обладают наглядностью и могут быть использованы при ручном счете. Установлена взаимосвязь между вероятностью решения сложной задачи и параметрами надежности системы.
Ключевые слова: Распределенные вычислительные системы, осуществимость решения задач.
При анализе эффективности функционирования вычислительных систем (ВС), как сосредоточенных, так и распределенных, используются показатели осуществимости [1, 2]. В зависимости от сложности задач и характера их поступления выделяют следующие режимы работы ВС: решение сложной задачи; обработка набора задач; обслуживание потока задач.
В работе предлагается подход к нахождению математических ожиданий и дисперсий, используемых в расчетах показателей осуществимости решения задач потока и набора.
2. Расчет показателей осуществимости решения задач на ВС
Рассмотрим абсолютно надежную распределенную ВС, состоящую из потенциально неограниченного числа элементарных машин (ЭМ) [2], на которую поступает поток простых задач интенсивностью а и интенсивностью в решения. (Простая задача представляется последовательной программой [2].)
Предполагается, что потоки поступлений и решения задач пуассоновские с параметрами а и в соответственно.
Требуется вычислить математическое ожидание А,{() числа задач, находящихся в системе [2], и соответствующую дисперсию А(г) в момент времени ?е[0, да) при начальных условиях
д. (0) = /, Ц (0) - 0, / 6 Е0 = {0,1,2,...}. (1)
* Работа выполнена при поддержке РФФИ, гранты № 07-07-00142, № 06-07-89089, № 08-08-00300, № 08-07-00022.
Пусть Рк(?) - вероятность того, что в момент времени ЇЄ [0, да) в ВС к задач находится на обслуживании, к е Е0°. Тогда система дифференциальных уравнений, в системе массового обслуживания М/М/да [4] имеет вид
а
аг
Рк (г) - -(^к + Нк ) ' Рк (г) + ^к-1 ' Рк-1 (г) + Нк+1 ' Рк+1 (г) , (2)
^ 0 , Ик > 0 , Но = 0 , к е £0°.
Р() = 0, г є £Г® .
Случай 1. Пусть ВС - высокопроизводительная, следовательно, можно считать, что каждая задача, поступившая в систему, сразу начинает обслуживаться. Полагая в системе (2)
К = а, и* = к -р,
получаем систему уравнений [3, 4]
аРк (г)
&
■--(а + к-в)• Рк(г) + а-Рк-1(г) + (к + 1)-0-рк+1(г).
Введем производящую функцию
^ 7
£(2, I) = 2 ^" • Рк () .
к=0
Система (3) сводится к следующему уравнению в частных производных:
+и г-1) М"».«(г-1) р (г,,).
01 дг
При начальных условиях (с учетом (1))
£(2,0) = 2г' .
Из (4) имеем
д д2 д (д 2
А() = ^р(1,/), Д (/) = ^р(1,г) р(1,г) -1 ^р(1,г)
дz дг2 дг \дг
(3)
(4)
(5)
(6)
Преобразование уравнения (5), с учетом (6), приводит к системе обыкновенных дифференциальных уравнений [3]:
(і) + Р-4 (і) = а,
аі
Лі
[ Д (г) + А (г) - А (г)] + 2р [ д (г) + А (г) - А (г)] = 2а • А (і)
(7)
с начальными условиями (1).
Решение системы (7) записывается в виде
А (*) = а (1 - е*) + І • е-в',
Д (I) = (1 - е-в') Ів + І • е-в'|.
(8)
Характер вхождения вычислительной системы в стационарный режим работы при обслуживании потока задач иллюстрируют рис. 1 и 2.
а
На рис. 1 приведены графики функций А;(г) (тонкие линии) и А;(У) + ст(?) (жирные линии) для а = 10 ч-1, в = 0,1 ч-1, г = 0, 50, 90; а(г) = у/О,- (). Стационарный режим функционирования ВС достигается практически через ? = 40 ч; учет дисперсии существенен, так как тах ст(?) = 10.
Адо(()
Рис. 1
Для практических расчетов можно пользоваться формулами A ±VD = lim[ A (t) ±4Dt) ] = a I P^VOIP .
В ситуации, представленной на рис. І, имеем A ± sfD = 100 ± 10.
На рис. 2 при а = І0 ч-1, в = 0,2 ч-1 и различных начальных условиях стационарный режим функционирования ВС достигается через t« З5 ч, max a(t) = І0.
Рис. 2
Случай 2. Изучим функционирование ВС невысокой производительности в режиме обработки пакета, состоящего из г простых задач. Выделенный ресурс составляет г ЭМ. В этом случае, полагая а = 0, получаем вместо уравнения (5) следующее:
^m.+ etz-і) -SzH . 0 , F (z,0). zi.
dt dz
Из (9), с учетом (б), после необходимых преобразований получим систему d
(9)
A- (t) + p ■ A (t) = 0,
[Dt (t) + A2 (t) - A (t)] = 2P- A (t).
(l0)
Решение системы (l0) при начальных условиях (l) имеет вид
Ai(t) = i exp(-p t), Di(t) = i exp(-pt)[l - exp(-pt)]. (ll)
Вычислим, например, время, через которое от начального набора i задач в ВС останется их половина. Из (ll) имеем
i/2 = i exp(-P t), тогда t = ln 2/p, дисперсия Di(t) = i/4, a = 4i /2.
0 2 4 6 8 ч
Рис. 3
На рис. 3 представлена зависимость числа решенных простых задач от времени ї, если начальный набор состоял из г=10 задач, выделенный ресурс состоит из 10 ЭМ, р = 1 ч-1. Время, необходимое для решения половины задач, находящихся в системе, ї = 1п 2 « 0,69 ч, а « 1,6. Следовательно, за 42 мин будет решено от 3,4 до 6,6 задач из 10, при суммарной интенсивности решения г'Р = 10 ч-1.
Случай 3. Рассмотрим решение набора і (>0) сложных задач на ВС. Сложная задача (представлена параллельной программой [2]) решается на всем выделенном ресурсе.
Пусть выделенный ресурс составляет п ЭМ, тогда интенсивность решения задачи будем считать равной п -в , где Р - интенсивность решения задачи на одной ЭМ (оцениваются потенциальные возможности ВС [1, 2]).
Так как задачи сложные, то они решаются последовательно.
Обозначим через р (і) вероятность того, что к моменту времени ї в ВС находится к задач (включая обслуженную), к є Е0.
В такой постановке система (2) записывается в виде
\рк '(г) = -пР-рк) + пР-рк+1 )> к є Е1 _1> (12)
[Рс () = п-Р-Рі(/); р'(?) = -п-в-р(і), ( )
с начальными условиями
р (0) = 1, Рк (0) = 0, к * і.
Условие нормировки, являющееся следствием системы уравнений, имеет вид
Е рк() =1, {є [0, да).
к=0
Вводя производящую функцию
п 7
рі) = X ^к • Рк () ,
к=0
систему (12) приводим к уравнению
2= п-Р-(! - *) • (^ І) - Р0 (г)), 0) = , (13)
из которого, после необходимых преобразований, получаем, с учетом (6), систему
а_
1 . (14)
-А, (г) = -п -р- (1 - р (г)),
:[ Д (г) + А2 (г) + А- (г) ] = -2п -р- А- (г)
-Ж1
с начальными условиями (1).
Для нахождения Р0 (г) вернемся к системе (12). Приведем точное решение.
ГО
Применяя преобразование Лапласа (/(л) = |е-*'* ■ /()Л, где /() - функция ог-
0
раниченного изменения [3]) к уравнению (13), получим
2 • (я • Ё(г, я) - г1) = пР-(1 - г) • (Ё(г, я) - Р0 (я)), Яе(У) > 0 , (15)
или ГМ = 21+1 - П в (1 - 2) •Р (5) . (16)
5 • 2 - П • Р • (1 - 2)
Так как нуль в знаменателе существует внутри круга | г |= |п Р /(я + п Р)| < 1, то с необходимостью в числителе имеем
Р (•*) = *-1 [п -Р /(в + п -Р)]г'. (17)
Подставляя правую часть формулы (17) в (16) и разделив полученный числитель на знаменатель, будем иметь
Р(г, в) = в• [п • р /(в + п • р)]г' + £ -к • [п • р /(в + п • р)]к . (18)
к=0
Взяв обратное преобразование Лапласа, предварительно разложив правую часть (18) на простейшие рациональные дроби, получим
р (г, г) = 1 - ехр (-п-Р-г) • (п-Р-г)г-к /(г - к)!+ ехр(-пР-г) • гг-к • (пР-г)к / к!
к=1 к=0
Учитывая, что
1 Эк
р (.) = -й -р- ^ (0,.),
находим искомое решение
р0(г) = 1-ехр(-«-Р-г)• £ (п к,^ ,
к=0 к!
Р(?) = (”'Р'!),|* • ехР(-«-Р-О, к е Е1. (19)
(г - к)!
Таким образом, решение системы (14) имеет вид
I (п -В- г у-к
4(г) = ехр(-п• р• г)• Ё к —, ,
к=1 (г - к)!
А (г) = ехр(-п • р • г) • Ё к2 • (п;р-г{ - (4(г))2.
к=1 (г - к)!
(20)
Обратимся к системе (14). Если число г задач велико, то можно считать, что г ^ ж, тогда Р0 () ^ 0 , V? е [0, да). При Р (г) = 0 система (14) имеет очевидное решение
(4 (0 =1 - п-Р-г> (21)
{Д. (г) = п -р-г, г < I / п-р, ()
в котором п -р- г, при г ^ ж, есть параметр случайного процесса Пуассона.
Погрешность приближенного решения (21) для 4 (г) находится по формуле
(п В-г)к
Л; (г) = ехр(-п-Р-г) - 2 (* - к)--- ---- .
к=;+1 к !
Формула (21) может быть использована при экспресс-анализе функционирования ВС.
Из (21) следует, что среднее время, необходимое для решения г сложных задач набора, гср = г / (п Р) при стандартном отклонении о = 41. Например, при выделенном ресурсе п = 100 ЭМ время, необходимое для решения набора из 400 задач при р = 0,1 ч-1, составит гср = 400 / (100 • 0,1) = 40 ч. С учетом отклонения, а = 7400 = 20 ч, для среднего времени решения набора задач имеем оценку:
= 40 ± 20 ч.
Учитывая, что Р0 (г) является распределением Эрланга порядка г [4], для которого
М^ = г /(п-Р), = г /(п-Р)2
(£ - полное время нахождения последней обслуженной задачи набора в ВС), получаем более точную оценку 7ср = 40 ± 2 ч.
3. Условие осуществимости решения сложной задачи на живучей ВС
При построении моделей функционирования ВС, в которых число элементарных машин было невелико и решаемые задачи простые, влияние надежности на организацию процесса решения задач (в целях упрощения математических моделей) можно было считать несущественным [4].
Для большемасштабных ВС такие упрощения привели бы к ошибкам принципиального характера. В связи со сказанным, вывод условия, позволяющего оценить осуществимость решения сложных задач на большемасштабных ВС с учетом их надежности, практически необходим. В самом деле, выход из строя ЭМ приводит к реконфигурации ВС тем чаще, чем больше число N ЭМ в системе; кроме того, с увеличением N время реконфигурации ВС увеличивается.
Обозначим через X интенсивность отказов одной ЭМ, а через р - интенсивность восстановлений отказавшей ЭМ одним восстанавливающим устройством.
Рассмотрим вычислительные системы со структурной избыточностью [2, 3]. Они представляют программно настроенную конфигурацию [2], в которой:
а) выделена основная подсистема из п ЭМ и подсистема из (N - п) ЭМ, подчиненная основной и составляющая структурную избыточность;
б) основная подсистема предназначена для решения сложных задач, представленных параллельными программами из п ветвей, а подчиненная система - для решения фоновых задач;
в) функции отказавшей ЭМ основной подсистемы берет на себя любая исправная ЭМ структурной избыточности.
Под восстановлением будем понимать комплекс мер, связанных с бесперебойной работой ВС (контроль, (само)диагностика, реконфигурация, избыточность и др. [2]). Время, необходимое для реализации этих мер, учтено в параметре р.
Если восстанавливающая система является высокопроизводительной, то условие осуществимости решения задач на ВС можно записать в виде
^ - п)-р / (п-Х) > 1. (22)
Физический смысл неравенства состоит в том, что суммарное время восстановления всегда должно быть больше, чем суммарное время отказов ЭМ.
Если задача сложная (т.е. решается на всех элементарных машинах), п ^ да , и реконфигурация ВС происходит со всеми оставшимися работоспособными ЭМ, то неравенство (11), в конце концов, нарушается (то есть система перестает самовос-станавливаться). Для его выполнения необходимо, чтобы реконфигурация осуществлялась на ограниченной подсистеме (объем которой сводил бы к минимуму межмашинные взаимодействия). Один из таких вариантов реконфигурации обеспечивает крупноблочное распараллеливание сложных задач [2].
Условие осуществимости (22) в большей мере имеет методологическое значение, хотя оно может использоваться и для практических оценок.
В самом деле, пусть сложная задача решается на ВС со структурной избыточностью. Поскольку условие (22) получено из вероятностной модели, то его выполнение зависит от вида случайного процесса, которому принадлежат параметры модели; в рассматриваемом случае процесс описывается схемой Бернулли (соответствующие формулы в переходном режиме получены в [3]).
Из (22) имеем
^ - п) > N-1 / (X + р).
Пусть N - n - случайная величина, характеризующая число ЭМ структурной
избыточности. Зададим Х = 10-4 ч-1, р = 10 ч-1, а) N = 104, б) N = 105, в) N = 106, тогда решение осуществимо с вероятностью
а) P{0 < N - n < 1} = (ц • (X + ц)N + N -X- цN-1 /(X + ц)N) « 0.99 ;
б) P{0 < N - n < 5} * 0.98 ;
в) P{0 < £ < x} > 0.99 .
Для нахождения x, числа ЭМ структурной избыточности (при x > 10), для
оценки можно воспользоваться интегральной теоремой Муавра - Лапласа [4]. Зададим доверительную вероятность у = 0.99, тогда Р{0 < N - n < x} = у . Используя указанную теорему, имеем
Ф ((x - N • p)lslN • p • (1 - p)) -Ф ((0 - N • р)ЦN • p • (1 - p)) ~ 0.9935, (23)
где p = X /(X + p), Ф(y) - нормированная нормальная функция распределения. Решая трансцендентное уравнение (23), находим x = 18 .
Следовательно, число ЭМ структурной избыточности определяется практическими соображениями и подтверждается вероятностями, значения которых должны быть близкими к единице. Обратно, если задать вероятность (назовем ее доверительной), то можно оценить число ЭМ структурной избыточности.
Замечание. Условие осуществимости основано на модели, описывающей состояния системы в текущий момент времени, что может вызвать сомнения в правомерности ее использования, поскольку модель не учитывает продолжительности решения задачи. Мы считаем, что было бы неразумным отвергать этот подход, так как с вероятностью сколь угодно близкой к единице он дает простой алгоритм поддержки необходимой производительности ВС в любой момент времени, что и определяет осуществимость решения задачи.
Заключение
Показано, что полученные аналитические формулы можно использовать при анализе эффективности функционирования ВС. Предложенный подход позволяет с единых методологических позиций вычислять моменты (центральные и начальные) не менее второго порядка, не вычисляя вероятности состояний системы, что особенно важно для анализа функционирования многомашинных ВС.
ЛИТЕРАТУРА
1. Евреинов Э.В., Хорошевский В.Г. Однородные вычислительные системы. Новосибирск: Наука, 1978.
2. ХорошевскийВ.Г. Архитектура вычислительных систем. М.: МГТУ им. Баумана, 2005.
3. Павский В.А., Павский К.В., Хорошевский В.Г. Вычисление показателей живучести распределенных вычислительных систем и осуществимости решения задач // Искусственный интеллект. 2006. № 4. С. 28 - 34.
4. Клейнрок Л. Вычислительные системы с очередями. М.: Мир, 1979.
Статья представлена кафедрой информационных технологий в исследовании дискретных структур радиофизического факультета Томского государственного университета и оргкомитетом 7-й Российской конференции с международным участием «Новые информационные технологии в исследовании сложных структур», поступила в научную редакцию 8 октября 2008 г.