УДК 519.87
В. А. Гончаренко
Военно-космическая академия им. А. Ф.Можайского Санкт-Петербург
АНАЛИЗ РЕАКТИВНОСТИ УЗЛА ВЫЧИСЛИТЕЛЬНОЙ СЕТИ В УСЛОВИЯХ ИНТЕРВАЛЬНОЙ НЕОПРЕДЕЛЕННОСТИ
Анализируются вероятностно-временные характеристики узла вычислительной сети в условиях интервальной неопределенности исходных данных. Предложен метод расчета характеристик узла сети массового обслуживания с интервально заданными параметрами распределений времени между моментами поступления входных заявок и времени их обслуживания в узле.
При решении задач анализа и проектирования вычислительных сетей одной из важных проблем является наличие достоверных исходных данных для расчета. Зачастую эти данные известны с той или иной степенью неопределенности, обусловленной сложностью и изменчивостью процессов, протекающих в исследуемой сети, а также субъективными и объективными трудностями процесса сбора, обработки и интерпретации информации о функционировании сети.
Упрощение модели исследуемой системы (например, замена случайных или недостоверных величин постоянными) ведет к потере части имеющейся информации и искажению результатов. В этой связи возникает необходимость разработки моделей и методов, учитывающих различные виды неопределенности исходных данных при возможности их наложения: недоопределенность, нестабильность, неточность, случайность, нечеткость, размытость, неполноту, многозначность, недостаточность и т.д. При этом дополнительно возникают проблемы, связанные с анализом чувствительности и устойчивости моделей по отношению к возмущениям [1].
Одним из методов, позволяющим описывать различные виды неопределенности, является интервальный подход [2], при котором неопределенные параметры 9г- е 0 модели задаются в виде диапазона возможных значений [9г-, 9г- ]. Это могут быть границы произвольного
(случайного) изменения параметров, доверительные интервалы, построенные с заданной надежностью для 9г- по результатам наблюдений за реальным узлом [1], экспертные оценки возможных значений параметров проектируемой системы, допустимые отклонения параметров узла от номинальных значений и т. д., в зависимости от характера рассматриваемой неопределенности.
В настоящей статье предлагается метод расчета характеристик реактивности узла сетевой модели массового обслуживания с интервальной неопределенностью информации о параметрах исходных распределений.
Рассмотрим отдельный узел сетевой модели с бесконечной очередью и дисциплиной обслуживания БШО. Пусть по результатам обработки исходных данных определено, что распределения времени между моментами поступления в узел заявок и времени обслуживания в узле близки к экспоненциальным, но при этом соответствующие параметры X и д принимают значения в известных пределах [а, Ь] и [с, й]. Задача состоит в получении вероятностно-временных характеристик узла с учетом интервальной неопределенности.
При использовании усредненных детерминированных значений параметров экспоненциальных распределений ^ = (а + Ъ)/2 и д = (с + ё)/2 приходим к известной модели типа Ы/Ы/1. Однако при этом никак не учитывается реальный уровень неопределенности исходных данных, что может привести к существенным погрешностям.
Используем рандомизационный подход, предложенный в работе [3]. Рассматривая экспоненциальную модель как базовую, допустим возможность отклонения от нее в окрестности моделей с параметрами, изменяющимися в заданных выше пределах, а сами параметры X и д будем считать случайными и непрерывно распределенными в этих диапазонах. Тогда для условных плотностей распределений интервалов времени между моментами поступления в узел заявок а(*, X | X) и времени их обслуживания в узле Ъ(х, д | д) (при условии, что случайные параметры X и д приняли фиксированные значения X и д) имеем
а(*, X | X) = Xe~Xг, I > 0, а < X < Ъ ;
Ъ(х, д | д) = де~дх, х > 0, с <д< ё.
Так как сведения о характере изменения параметров X ид отсутствуют, будем исходить из принципа максимума энтропии [4], считая их возможные значения равновероятными. Для их представления используем равномерное распределение, что соответствует максимальной неопределенности информации. Плотности распределений случайных параметров X и д определяются как
г Ш = /1/(Ъ - а), X е [а,Ъ], = Ш - с), д е [с,ё],
Ж ) [0, Xe[а,Ъ]; /2(д) |0, дй[с,ё].
Задача нахождения вероятностно-временных характеристик узла сети для частных случаев, когда только один из параметров является случайным, была рассмотрена в работе [3]. Используя обобщенную формулу полной вероятности для непрерывного случая, можно определить безусловные плотности распределений а(*) и Ъ(х) :
а(*) = К-1 (^ = (1 + а0^ + (1+ Ъ)^ , (1)
а (Ъ - а)*2
ё (1 + сх) е-сх + (1 + ёх) е-ёх
Ъ(х) = Где дх/2 (д)ёд = ^--^^-. (2)
; (ё - с)х2
По физическому смыслу полученные величины а(*) и Ъ( х) являются плотностями распределения, усредненными по случайному параметру, и имеют собственные начальные моменты:
а = 1п(^а). а = Ъ-1 - ак-1 )к! > 1; с а1 = ' ак = к>1; Са ^
а 2
Г- 1; а^
Р1 = !пМ£1; вк = ^-1,к> 1, Я,=
ё - с к (к - 1)(ё - с)(сё)к-1 Р У
02 )2
-1. (3)
01
Используем для нахождения характеристик узла, как и в работе [3], метод спектрального разложения интегрального уравнения Линдли [5], основное соотношение которого имеет следующий вид:
А* (-^)Б* (^) -1 = ^+ ((5), (4)
где А (5) и Б* (5) — преобразования Лапласа — Стилтьеса (ПЛС) исходных плотностей распределений а(*) и Ъ(х); (5) — рациональная аналитическая функция от 5 без нулей в Яе 5 > 0 ; (5) — рациональная аналитическая функция от 5 без нулей в Яе 5 < 2 ;
lim Y+ (s)/s = 1 для Re s > 0 ; lim (s)/s = -1 для Re s < Z .
s—s—0
ПЛС Aa (s) и B* (s) для выражений (1) и (2) будут иметь вид
A (s) = 1 - sa(s); B* (s) = 1 - sß(s), (5)
где a(s) = ln[(b + s)/(a + s)]/(b - a) и ß(s) = ln[(d + s)/(c + s)]/(d - c).
Тогда после подстановки уравнений (5) в выражение (4) и некоторых преобразований получим следующее соотношение:
s[1/ ß(s) - 1/ a( s) - s] = Y+ (s) (6)
1/ a(s)/ß( s) Y- (s) 1 }
Сложность определения функций Y+ (s) и (s) заключается в том, что левая часть
соотношения (6) не является рациональной функцией от s, хотя и удовлетворяет условиям аналитичности. Используя теорему Руше [5], можно показать, что числитель левой части выражения (6) имеет, кроме нулевого корня, еще только один корень s1 < 0, причем он является действительным. Уравнение
1/ ß(s) -1/ a(-s) - s = 0 (7)
является трансцендентным и разрешимо относительно s в частных случаях (a = b или/и c - d — соответственно узлы типа M/G/1, О/Ы/1 или M/M/1).
Для решения задачи общего типа (О/О/1) используем следующий прием: по аналогии с решением для узла типа G/M/1 найдем корень уравнения (7), но выраженный через переменную s :
s1(s) = a - e(b-a)/(1/ß(s)-s) - 1 •
Тогда для функций Y+ (s) и (s) можно предложить следующее спектральное разложение:
Y+ (s) = sß(s) (s - s1 (s)), (s) = (s - s1(s)Va(-s) .
^^ 1 1/ß(s) -1/ a(-s) - s
Данное разложение является универсальным и в частных случаях (M/G/1, О/Ы/1 или M/M/1) трансформируется в полученные в работе [3] соответствующие решения для частных типов узлов. Используя данные функции, найдем основные характеристики отдельного узла сети с неопределенными параметрами:
— вероятность нулевого ожидания (вероятность „застать" узел незанятым)
= lim
(s) = Гb - a Y
= Ib-Öß! - aß1; \e 1 у
— ПЛС плотности распределения времени ожидания обслуживания заявки в очереди
Ж *( 5) =-Г-;
^ (5 - 51 (5))в(5)'
— ПЛС плотности распределения периода простоя
у*(5) = 1 - 5(1 - а(5Vв(-5) - 5а(5))
5 + (-5)
Обозначив Ж * (5) = г0/ Н (5), У * (5) = 1 - Е( я)/Е (5), запишем выражения для их начальных моментов и и^ соответственно:
1 к (А
®к = -Е .(-1)' +1 Н(3)(0)Шк-7;
г0 3=143)
и = Е(к1( 3Р (. )(0) и + ( 1) к+1Е(к )(0) к Р (0) к- К } Р(0)
(8)
(9)
где Е(3 )(0), Р(3 )(0) и Н(3)(0) — производные .'-го порядка по 5 соответствующего выражения в точке 5 = 0 , которые можно вычислить с помощью предлагаемого ниже рекуррентного алгоритма.
Шаг 1. Вычисление производных к-го порядка от функций ч(5) = (Ъ - а)/(1/0(5) - 5) и Ч(-5) в точке 5 = 0 :
Ч(к )(0) = (-1)к (Ъ - аМ-^(^1(-1)3 0зЧ(к-Л(0),
к+1 3=1'
Ч(к) (-0) = (Ъ - а)вк±1 - Е Гк1р Ч к-3) (-0). к +1 3=1//3
Шаг 2. Вычисление производных к-го порядка от функций у(5) = еч(5) и у(-5) в точке
5 = 0:
у( к )(0) = Е (к " 1]ч( 3)(0) у(к ^ )(0),
3=113 -V
у(к )(-0) = Е Гк Л (3 )(-0) у(к -3 )(-0).
3=113 -V
Шаг 3. Вычисление производных к-го порядка от функций 51 (5) = а - (Ъ - а)¡(у(5) -1) и
51 (-5) в точке 5 = 0 :
51(к )(0) =
к (
ау(к )(0) -Е .У(3 )(0) 51(к - 3 )(0)
3=043)
51(к )(-0) =
ау(к )(-0) -£ Гк]у(3 )(-0) 51( к - 3 )(-0)
3=0\3) _
Шаг 4. Вычисление производных к-го порядка от функции Н(5) = (5 - 51 (5))0(5) в точке
(у(0) -1), (у(-0) -1).
5=0:
к (кЛ
н(к)(0) = (-1)к+1 вк + Е - (-О
3=043)
3 +1
в 3 +1
3 +1
(к-1)
(0).
Шаг 5. Вычисление производных к-го порядка от функции Е(5) = 5(1 - а(5)/0(-5) - 5а(5)) в точке 5 = 0 :
Е(к )(0) =
Е 4кЬ 3 а3вк-3 - Ек1 Е^вк-3
3=043) 3=043) 3 + 1
Шаг 6. Вычисление производных к-го порядка от функции Р(5) = 5 + 51(-5) в точке
5=0:
Р'(0) = 1 + 51' (0); Р(к)(0) = 51(к)(0), к > 1.
Выведем формулу среднего времени ожидания обслуживания в узле:
Ш1 =в
г0
Г1 + У—а)2(Р2/2 -в12)е(Ь-а )в ^
2р1
(е(Ь-а )в1 -1)2
Для расчета характеристик сетей массового обслуживания представляет интерес вычисление времени пребывания заявки в узле и времени между моментами выхода заявок из узла.
ПЛС плотностей распределения времени пребывания заявки в узле G* (5) и времени между выходными заявками В* (5) определяются как
0\ 5) = Ж * (5) В* (5) = Г0(1/в( - 5) ,
(5 - 51(5))в(5)
В*(5) = (1 - Го + ГоУ* (5))В* (5).
С учетом выражений (3), (8) и (9) могут быть также получены значения начальных моментов распределения времени пребывания заявки в узле ук и распределения времени между выходными заявками 5к:
£ (кЛ £ (к\
г к = ^ • Ш • - •; 5 к = р£ + го ц . в - •и.
у=0Ч-// •=14• У
Коэффициент вариации для выходного потока определяется выражением
С5=>/Са2 + 2(Вр- (а -р1)ш1)/а12 .
Пример. На вход узла вычислительной сети поступает рабочая нагрузка с интенсивностью, изменяющейся в диапазоне от 0,05 до 0,2 заданий/с. Средняя интенсивность обслуживания заданий колеблется от 0,25 до 0,5 заданий/с. Требуется найти характеристики реактивности узла и коэффициенты вариации потоков.
При использовании усредненных значений параметров и модели Ы/Ы/1 получим Са = С р = С5 =1 и а1=8 с, в1=2,667 с, г0 =0,667 с, ш1 =1,333 с, у1=4,0 с, а при использовании интервальной модели узла получим следующие значения характеристик: а1 =9,242 с, а2 =200 с, Са=1,158, в1 =2,773 с, р2 =16 с, С р =1,04, г0 =0,668 с, ш1=1,352 с, у1=4,125 с, С5 =1,154.
Из результатов расчета видно, что математические ожидания случайных величин смещены относительно модели, свободной от возмущений, коэффициенты вариации при этом больше единицы. После прохождения через обслуживающий прибор потока заявок с коэффициентом вариации Ср < Са коэффициент С5 станет меньше Са.
Для оценки степени неопределенности параметров можно использовать коэффициенты Аа = (Ь - а)/(Ь + а) , Ар = (ё - с)/(ё + с), принимающие значения от 0 до 1, для приведенного
примера Аа =0,6, Ар =0,33. Анализ показал также, что характеристики модели более чувствительны к неопределенности параметров обслуживания, чем к неопределенности параметров входного потока.
СПИСОК ЛИТЕРАТУРЫ
1. Ивановский В. Б. Чувствительность среднего времени ожидания к нестабильности потоков в синхронных сетях // Автоматика и вычислительная техника. 1989. № 1. С. 48—52.
2. Кузнецов В. П. Интервальные статистические модели. М.: Радио и связь, 1991. 352 с.
3. Гончаренко В. А., Смагин В. А. О влиянии неопределенности параметров распределений на характеристики узла сети // Изв. вузов. Приборостроение. 1993. Т. 36, № 7—8. С. 39—45.
Метод проектирования процесса распределения реляционной базы данных 39
4. Kouvatsos D. D. A maximum entropy analysis of the G/G/1 queue at equilibrium // J. Opl. Res. Soc. 1988. Vol. 39, N 2. P. 183—200.
5. Клейнрок Л. Теория массового обслуживания. М.: Машиностроение, 1979. 432 с.
Рекомендована кафедрой Поступила в редакцию
электронной вычислительной техники 02.07.07 г.
УДК 004.4'22, 004.65
В. Б. Новосельский
Санкт-Петербургский государственный университет информационных технологий, механики и оптики
МЕТОД ПРОЕКТИРОВАНИЯ ПРОЦЕССА РАСПРЕДЕЛЕНИЯ РЕЛЯЦИОННОЙ БАЗЫ ДАННЫХ
Рассматривается вопрос распределения реляционной базы данных по узлам вычислительной сети. Предлагается генетический алгоритм решения задачи проектирования, позволяющий учесть взаимозависимость схем фрагментации данных, размещения фрагментов и стратегий исполнения запросов. Исследуются качество получаемых решений и вычислительная сложность алгоритма.
Технологии баз данных (БД) в настоящее время используются практически во всех организациях. Все большую значимость приобретают процессы децентрализации, требующие создания приложений, доступ к которым осуществляется из различных географических мест. Увеличиваются требования к оперативности и достоверности информации. Задачи информационной интеграции БД и проектирования географически распределенных БД (РБД) являются наиболее актуальными для разработчиков программного обеспечения в течение почти трех десятилетий.
Большинство авторов под проектированием РБД понимают фрагментацию и размещение, т.е. разбиение БД на фрагменты и принятие решения о том, где будут храниться эти фрагменты. Однако проектирование схем фрагментации и размещения отношений реляционной базы данных основывается на информации о способах и методах использования РБД. Эти методы зависят от стратегии исполнения запросов, которая, в свою очередь, должна учитывать схемы фрагментации и размещения. Следовательно, проектирование схем фрагментации и размещения, а также определение стратегии исполнения запросов должны производиться одновременно. Таким образом, задачу проектирования РБД следует формулировать так: для заданной логической схемы БД, множества запросов и конфигурации вычислительной сети (ВС) описать схему фрагментации, схему размещения фрагментов и сформировать стратегии исполнения каждого запроса таким образом, чтобы оптимизировать целевую функцию.
Все три задачи, входящие в процесс проектирования РБД, NP-полные [1, 2], т.е. с ростом размерности задач их вычислительная сложность растет экспоненциально. Во многих работах (например, [3—5]) отмечается, что для решения задач кластеризации и компоновки наиболее успешно применяются генетические алгоритмы.
В основу генетических алгоритмов положены идеи естественного отбора в биологических популяциях. В таких алгоритмах любое решение задачи синтеза представляется особями, которые характеризуются хромосомами. Хромосомы состоят из генов, значениями генов являются значения проектных параметров. Направленный перебор решений осуществляется с помощью генетических операторов выбора родителей, скрещивания, мутации, селекции,