Эвристический алгоритм решения задачи оптимального размещения
информационных ресурсов
А. Н. Скоба, Айеш Ахмед Нафеа Айеш (Ирак), В.К. Михайлов Южно-Российский государственный политехнический университет (НПИ)
им.М. И. Платова, Новочеркасск
Аннотация: В данной статье для решения задачи оптимального распределения информационных ресурсов по узлам распределённой информационной системы по критерию минимума среднего времени реакции системы на запросы пользователей был предложен оригинальный эвристический алгоритм, использующий представление о базах данных, как о точках многомерного пространства, а об узлах, в которых эти базы размещаются как о кластерах. Представлены результаты численных экспериментов в зависимости от типа используемой архитектуры распределённой системы и от способа обеспечения целостности данных.Численные эксперименты показали достаточно высокую эффективность предложенного алгоритма
Ключевые слова: распределённая информационная система, распределённая база данных, локальная вычислительная сеть, нелинейная комбинаторная оптимизация, интенсивности формирования запросов, множество запросов на чтение информации, матрица вероятностей формирования запросов пользователями, матрица распределения отношений по узлам локальной вычислительной сети, матрица объёмов считываемой информации , средний объём информации циркулирующей между пользователем и отношением, архитектура «файл-сервер», двухуровневая архитектура «клиент-сервер», блокировка базы данных, время реакции систиемы.
Как было отмечено в работах [1,2], одной из важных задач, без решения которой невозможна разработка распределённой информационной системы, является рациональная организация вычислительного процесса, реализованного в среде ЛВС. В процессе работы ЛВС поддерживает распределённую базу данных (РБД) [3], которая обладает несомненными преимуществам перед централизованной (меньшее время ответа для пользователей, меньшее время блокировки записей, более простое планирование заявок). Однако при проектировании таких систем будут существовать большие общие пересекающиеся массивы данных, в которых определенная информация будет присутствовать многократно. Неоптимальное обращение с информационными ресурсами может с одной стороны увеличить время реакции системы на запросы пользователей, а с
другой стороны, может стать очень дорогим для пользователей [3]. Поэтому в одной из задач, возникающих при проектировании распределённой информационной системы на базе ЛВС, является задача оптимального размещения информационных ресурсов (частей РБД) по узлам ЛВС, включающая выбор топологии сети, критерия эффективности, конструирование математической модели, разработку алгоритма оптимизации и ее программную реализацию.
Исходными данными для моделирования являлись [ 4-7]: множество узлов сети - и={и1,...,и8,...,ип}; множество пользователей -А={А1,...,А8,...,Ап};множество отношений - К={К1,...Д|,...Да};множество интенсивностей формирования запросов - Л={Х1,.,Х8,.,Хп}; множество запросов на чтение - 0={0ь...,0/,...,0ч};множество объёмов отношений -У={Уь...,У],...,Уа};скорость считывания в узлах -
УУ={УУь...,УУ8,...,УУп};скорость записи в узлах -
У0={У01,...,У08,...,У0п};скорость передачи данных по каналу связи - 0; постоянная задержка при передаче данных по каналу связи - 0О; постоянная задержка при обработке в узле - а0; производительность процессора и2-го узла - Ри2 = 1, п); матрица вероятностей формирования запросов пользователями - ^ = ||/А ^ = ||= 1, п, / = 1, д), где элемент ^ представляет собой вероятность того, что Б-й пользователь сформировал 1-й запрос;
матрица объёмов считываемой информации В =
Ь
Ь
(( = 1, д, ] = 1, а),
где Ы-объём считываемой информации по 1-му запросу на чтение из ]-го
отношения;
8(В) = Цб^ )| = ||8]. 11(/ = 1, д, ] = 1, а), где
5,.- =
[1, если / - й запрос обращается к ] - му отношению, О, такого отношения нет,
:
причём Х^ц = 1,1 = 1,У; матрица распределения отношений по узлам ЛВС -
/ =1
X =
= Х/Л/ = 1
, Л, к = 1, п),
гДе х/к =
[1, если Я/ е ик, 10 - в противном случае,
причём
Х х/к =11 =1Л.
к=1
Таким образом задача оптимального размещения РБД по узлам ЛВС по критерию среднего времени реакции системы сводится к задаче
при ограничении
>
I = 1
(1)
к = 1
Подробный расчёт величины Г = Г (и, К, Ж, А, V, 0. , ¥0РИ, Г, Б) в
зависимости от особенностей используемой архитектуры распределённой системы был выполнен в работах [4-7].
Как показал проведённый анализ, задача (1) является задачей нелинейной комбинаторной оптимизации с булевыми переменными. Ввиду того, что функция Г имеет сложный вид, а так же ввиду отсутствия в настоящее время
эффективных алгоритмов решения такого класса задач (кроме как метод полного перебора) [8-10], для решения задачи (1) может быть применен разработанный авторами эвристический алгоритм, основанный на численном прогнозировании поведения целевой функции и использующий представления о базах данных, как о точках многомерного пространства, а об узлах, в которых эти базы размещаются как о кластерах. Обозначим
X
Я/ик
-вероятность того, чтоьй пользователь обратится ч _ _
к 7-му отношению;К. = 3!ЛЕ/^О = 1л.у= Ы)-средний объем информации,
П
циркулирующий между /-м пользователем и 7-м отношением.
1. Полагаем Кц — А^1, &),к=0.
2. Выбираем для У/=1,й: Кщ=тах\КЛ (/= 1п) и отношение /^помещаем в
7 '
¿-ю ПЭВМ.
3. Вычисляем значения {7^} (г= 1,тг), по формуле (7), а значение Гпо формуле (8) работы [4] . Если кф0 - переходим на шаг 7, в противном случае - на следующий шаг.
4. Полагаем = Т.
_ _^ -■ _
5. Выбираем 7^=тах {Г ' '},/=1гпи А'|=тах({^}/{^,,-}), где {^Г,,^}: / 1.
6. Если или {£^}/{1£^}={0},то переходим на шаг 8, иначе отношение Я. помещаем в (х-ю ПЭВМ, полагаем к=к+1п переходим на шаг 3.
7. Если Т<Т- переходим на шаг 4, в противном случае полагаем К^ =-1и переходим на шаг 5.
8. Конец. (Полученное распределение X и будет оптимальным). Целессообразно пункты алгоритма 1-3 выполнять уже на этапе конструирования исходных данных, что совершенно очевидно приведёт к уменьшению количества итераций алгоритма и соответственно, к уменьшению временных затрат на его работу.
Данный алгоритм был программно реализован на языке С# при следующих исходных данных: скорость считывания в ^-м узле
:
VVs е [б0000;100000] КБ/сек, s = 1, n ; скорость записи в оперативную память
[7 7
1x10 ;3 х10 КБ/сек, s = 1, n; производительность
процессора s-го узла PUs е
2,5 х109; 3,5 х109
операций/сек, s = 1, n;
скорость передачи данных по каналу связи бе [1000; 10000] КБ/с; постоянная задержка при передаче по каналу 00 = 3 х 10^0; постоянная задержка при обработке в узле а0 = 3х10-бс; объёмj-го отношения Vj е [50000; 150000] КБ, j = 1, d; объём считываемой информации bij е [1; 1000] КБ (l = 1, q, j = 1, d), j = 1, d по l-му запросу на чтение из j-го отношения, по l-му запросу на
чтение из j-го отношения; bij е [1; 500] КБ (l = 1, q, j = 1, d) - объем информации, получаемый после процессорной обработки по I — му запросу на чтение из j — го отношения. Расчет проводился на компьютере на базе процессора фирмы Intel, с тактовой частотой 3,0 ГГц. В таблицах 1-3 приведены некоторые результаты машинных экспериментов, полученных для решения задачи оптимального размещения информационных ресурсов по узлам распределённой информационной системы: в таблице№ 1-на базе файл-серверной архитектуры при отсутствии блокировок , в таблице№ 2-на базе файл-серверной архитектуры с учётом влияния блокировок на уровне всей базы данных , в таблице№ 3-без учёта влияния блокировок на базе двухуровневой архитектуры «клиент-сервер», в таблице №4- с учётом влияния блокировок на базе двухуровневой архитектуры «клиент-сервер» .
Таблица №1
Размерность задачи nxdxq Начальное значение ^ Число итераций МПП Значение Время решения задачи МПП,с Число итераций э> Значение . ]|(л) Время решения задачи ЭА,с
3x4x5 6,7718 81 1,8644 7,1 1 1,8787 1,02
6x8x10 1,6890 6® 0,6991 216 3 0,6298 16,35
8x13x15 2,4534 а ха - - 5 1,5490 142,6
10x15x20 1,0437 1015 - - 8 0,4417 1182,4
Таблица №2
Размерность задачи nxdxq Начальное значение Число итераций МПП Значение _л(г) Время решения задачи МПП,с й и ц а р е н к о ч О £ К 1 Ч Значение Время решения задачи ЭА,с
3x4x5 7,8916 81 2,9403 7,7 2 2,8697 1,37
6x8x10 3,1814 0,7993 245 6 0,7303 40,35
8x13x15 14,5347 а13 - - 10 11,7819 207,6
10x15x20 34,8739 - - 14 14,3618 1908,6
Таблица №3
й я й я
и и и и
ц н с, ц н
Размерность задачи nxdxq е о н Т е и а р е н к Г (и и е ше е а ,ПП а р е н к Т (и и е ше е а с,
ь ачал Н н е аче н Число МПП н е аче н СП я м е р т и ачи д а з о л с и !=Г А Г) н е аче н СП я м е р В и ачи д а
3x4x5 5,0956 81 1,4501 6,6 1 0,3379 1,00
6x8x10 1,0773 0,4511 216 4 0,0658 11,35
8x13x15 9,2486 31Б - - 7 1,5490 93,6
10x15x20 21,0437 - - 8 6,4048 1106,4
Таблица №4
Размерность задачи nxdxq Начальное значение Число итераций МПП Значение _л(г) Время решения задачи МПП,с й и ц а р е н к о ч О 1 К * ^ О Значение Время решения задачи ЭА,с
3x4x5 7,7018 81 1,8644 5,7 1 1,4576 1,00
6x8x10 2,3895 б0 1,6991 216 3 1,6298 16,35
8x13x15 12,4534 а13 - - 6 7,5209 178,6
10x15x20 25,0437 - - 12 11,4417 1158,0
Здесь МПП -метод полного перебора; ЭА - эвристический алгоритм; Т' г:-
среднее время реакции системы для оптимального размещения РБД, полученного МПП; 7 - среднее время реакции системы для оптимального
размещения РБД, полученного ЭА.
Анализ полученных результатов работы алгоритма показал, что наличие в модели блокировки на уровне всей базы данных для небольших размерностей задачи размещения информационных ресурсов не оказывает существенного влияния на реактивность работы всей системы в целом, однако, с ростом размерности задачи, влияние времени блокировки на её реактивность становится более значительным и данную величину нужно учитывать при конструировании реальных вычислительных систем.
Литература
1.Бойко В.В., Савенков В.М. Проектирование баз даных информационных систем.М.: Финансы и статистика, 1989. 351с.
2.Кузнецов Н.А., Кульба В.В., Косяченко С.А. Методы анализа и синтеза модульных информационно-управляющих систем. М.: ФИЗМАТЛИТ, 2002. 880с.
3.Цегелик Г.Г. Системы распределённых баз данных. Львов: СВИТ,1990. 167с.
4.Скоба А.Н., Состина Е.В. Математическая модель оптимального размещения распределенной базы данных по узлам ЛВС на базе файл-серверной архитектуры. // Инженерный вестник Дона. 2015. № 2. URL: ivdon.ru/ru/ magazine/archive/n2y2015/2881.
5.Скоба А.Н., Логанчук М.Л. Математическая модель функционирования распределённой информационной системы на базе архитектуры «файл-сервер» с учётом влияния блокировок // Инженерный вестник Дона.2015. №3. URL:ivdon.ru/ru/magazine/archive/n3y2015/3276.
6.Скоба А.Н., Состина Е.В. Математическая модель оптимального размещения распределенной базы данных по узлам ЛВС на базе двухуровневой клиент-серверной архитектуры. // Инженерный вестник Дона. 2015. № 2. URL: ivdon.ru/ru/ magazine/archive/n2y2015/2882.
7.Скоба А.Н., Панфилов А.Н. Модель оптимального размещения информационных ресурсов по узлам распределенной информационной системы предприятия на базе двухуровневой архитектуры "клиент-сервер" с учетом влияния блокировок // Изв. вузов. Электромеханика. 2017. Т. 60, № 2. С. 77-84.
8. Antunes C.H. et al. A Multiple Objective Routing Algorithm for Integrated Communication Network // Proc. ITC-16.-1999.V.3b. pp.1291-1300.
9. Chakka R., Harrison P.G. A Markov modulated multi-server queue with negative customers. Ihe MM CPP/GE/c/LG-queue // Acta Informatika/-2001.-v.37. pp.785-799.
10.Круглый З.Л. Алгоритмы расчёта моделей структур вычислительных систем с различными классами заданий // Управляющие системы и машины. 1989. №4. С.22-24.
References
1. Bojko V.V. Proektirovanie baz danyh informacionnyh sistem [Design of bases of these information systems]. Moscow, Finansy i statistika, 1989, 351p.
2. Kuznecov N.A., Kul'ba V.V., Kosjachenko S.A. Metody analiza i sinteza modul'nyh informacionno-upravljajushhih sistem [Metods of the analysis and synthesis of modular management information systems]. Moscov, FIZMATLIT Publ., 2002, 880p.
3. Cegelik G.G. Sistemy raspredeljonnyh baz dannyh [Systems of the distributed database]. Lviv, SVIT publ., 1990, 167p.
4. Skoba A.N., Sostina E.V. Inzenernyj vestnik Dona (Rus), 2015, № 2. URL: ivdon.ru/ru/ magazine/archive/n2y2015/2881.
5. Skoba A.N., Loganchuk M.L. Inzenernyj vestnik Dona (Rus), 2015. №3. URL:ivdon.ru/ru/magazine/archive/n3y2015/3276.
6. Skoba A.N., Sostina E.V. Inzenernyj vestnik Dona (Rus), 2015. № 2. URL: ivdon.ru/ru/ magazine/archive/n2y2015/2882.
7. Skoba A.N., Panfilov A.N. Izv. vuzov. Jelektromehanika. 2017. T. 60, № 2. pp. 77-84.
8. Antunes C.H. et al. A Multiple Objective Routing Algorithm for Integrated Communication Network. Proc. ITC-16. 1999.V.3b. pp.1291-1300.
9. Chakka R., Harrison P.G. A Markov modulated multi-server queue with negative customers. Ihe MM CPP/GE/c/LG-queue. Acta Informatics. 2001. v.37. pp.785-799.
10. Kruglyj Z.L. Upravljajushhie sistemy i mashiny. 1980. №4. pp.22-24.