Научная статья на тему 'Выбор вариантов организации распределения запросов в системах предоставления информационных услуг'

Выбор вариантов организации распределения запросов в системах предоставления информационных услуг Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
202
37
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПРЕДЕЛЁННЫЕ ВЫЧИСЛИТЕЛЬНЫЕ СИСТЕМЫ / РАСПРЕДЕЛЕНИЕ ЗАПРОСОВ / КЛАСТЕР / ОПТИМИЗАЦИЯ / DISTRIBUTED COMPUTING SYSTEMS / LOAD BALANCING / CLUSTER / OPTIMIZATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Богатырев Иван Юрьевич, Голубев Владимир Анатольевич, Нестеров Дмитрий Алексеевич

Произведён анализ вариантов организации распределения запросов в кластере информационного сервиса, позволяющего при наименьших издержках на диспетчеризацию максимизировать производительность кластера (минимизировать время обслуживания запросов в системе).

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Богатырев Иван Юрьевич, Голубев Владимир Анатольевич, Нестеров Дмитрий Алексеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CHOICE OF QUERY DISTRIBUTION OPTIONS IN INFORMATION SERVICES SYSTEMS

The analysis of query distribution options for information services cluster, which allows to maximize the clusters performance at the lowest cost to load balancing (to minimize time of service in the system), is performed.

Текст научной работы на тему «Выбор вариантов организации распределения запросов в системах предоставления информационных услуг»

УДК 004.75

ВЫБОР ВАРИАНТОВ ОРГАНИЗАЦИИ РАСПРЕДЕЛЕНИЯ ЗАПРОСОВ В СИСТЕМАХ ПРЕДОСТАВЛЕНИЯ ИНФОРМАЦИОННЫХ УСЛУГ

В.А. Богатырев1, И.Ю. Голубев2, Д.А, Нестеров3

1 Санкт-Петербургский государственныйуниверситет сервиса и экономики (СПбГУСЭ), 191015,

Санкт-Петербург, ул. Кавалергардская, 7 , лит. А;

2Националъный исследователъскийуниверситет информационных технологий, механики и

оптики, 197101, Санкт-Петербург, пр. Кронверкский, 49;

3Санкт-Петербургский государственный лесотехнический университет,

194021, Санкт-Петербург, Институтский пер., 5

Произведён анализ вариантов организации распределения запросов в кластере информационного сервиса, позволяющего при наименьших издержках на диспетчеризацию максимизировать производительность кластера (минимизировать время обслуживания запросов в системе).

Ключевые слова: распределённые вычислительные системы, распределение запросов, кластер, оптимизация.

CHOICE OF QUERY DISTRIBUTION OPTIONS IN INFORMATION SERVICES SYSTEMS

V.A. Bogatyrev, I.Yu. Golubev, D.A. Nesterov

St. -Petersburg state university of service and economy (SPbSUSE), 191015, St.-Petersburg, streetKavalergardsky, 7, lit. A ;

National Research University of Information Technologies, Mechanics and Optics,

197101, St.-Petersburg, avenue Kronverksky, 49;

St.-Petersburg state forest technical university, 194021, St.-Petersburg, Institutskiyper., 5

The analysis of query distribution options for information services cluster, which allows to maximize the clusters performance at the lowest cost to load balancing (to minimize time of service in the system), is performed.

Keywords: distributed computing systems, load balancing, cluster, optimization.

Введение Постановка задачи

Развитие сферы услуг, в том числе ин- Рассмотрим распределённую вычисли-

формационного сервиса, сопровождается по- тельную систему, объединяющую n серверов, m

стоянным возрастанием требований к эффек- из которых реализуют функцию диспетчериза-

тивности систем хранения обработки и переда- ции. Запросы, приходящие в систему, попадают

чи данных [1], одними из основных путей до- в один из серверов-диспетчеров (выбранный

стижения высокой производительности, отка- случайным образом), где случайно перераспре-

зоустойчивости и надёжности которых являют - деляются между серверами-исполнителями,

ся кластеризация и динамическое распределе- выполняющими обработку запросов. При этом

ние запросов [2 - 7]. каждый сервер-диспетчер обрабатывает долю

Кластер представляет собой вычисли- распределяемых им запросов g самостоятельно. тельную систему, состоящую из нескольких Ставится задача выбора вариантов ор-

связанных между собой компьютеров, исполь- ганизации распределения потока запросов

зуемых в результате диспетчеризации как еди- между серверами кластера, при которых дости-

ный, унифицированный компьютерный ресурс. гается минимум среднего времени пребывания

Обеспечение эффективности информа- запросов T в системе. ционного сервиса требует выбора рациональных вариантов организации диспетчеризации Оценка времени пребывания

запросов в распределенных системах, консоли- запросов в системе

дирующих кластеры хранения и обработки ин- Предположим, что поток запросов, по-

формации. ступающий в кластер, является простейшим, а

длительности диспетчеризации, передачи дан-

ных и обслуживания распределены по экспоненциальному закону. Исследуемую распределенную вычислительную систему представим сетью массового обслуживания, изображённой на рис. 1.

Рисунок 1. Модель массового обслуживания кластера

Запросы, поступающие в группу серверов-диспетчеров S0 с интенсивностью X, с вероятностью g обслуживаются в этих же серверах, а с вероятностью (1—§) перераспределяются через сеть кластера (^) на обработку в группу серверов-исполнителей S1. Каждый сервер и сеть кластера представим одноканальными системами массового обслуживания (СМО).

Рассмотрим варианты организации распределения запросов, когда приоритеты запросов на диспетчеризацию и собственно решение функциональных задач одинаковы (бесприори-тетная дисциплина обслуживания, ДО); когда запросы на диспетчеризацию имеют относительный либо абсолютный приоритет над функциональными запросами и когда функциональные запросы имеют относительный либо абсолютный приоритет относительно задач диспетчеризации.

Среднее время пребывания запросов в системе вычисляется как:

Т = 0 + д(} + (1-д)(Ь + М), (1)

где D - среднее время пребывания запроса в системе до окончания его диспетчеризации, Q - среднее время пребывания в системе запроса, обрабатываемого сервером-

диспетчером, после окончания его диспетчеризации, L и M - среднее время пребывания перераспределённого запроса в сети кластера и в сервере-исполнителе соответственно.

Для исследуемых вариантов организации распределения запросов среднее время пребывания запроса в системе до окончания его

диспетчеризации при бесприоритетной ДО рассчитывается [8]:

Б, =

+ bQ,

m-(Xb0+gkb2)

где Ь0 - средняя длительность диспетчеризации запроса, Ь2 - средняя длительность обработки запроса.

При ДО с относительными и абсолютными приоритетами запросов на диспетчеризацию имеем:

т-ХЬ0

+ ь0.

Если запросы на обработку имеют от-

носительный приоритет, то:

=

\Ь$+д\Ь2

+ Ь0.

(!_^2 )(т_(ЛЬо+аЛЬ2))

В случае, когда запросы на обработку имеют абсолютный приоритет:

дхь2ь0

Иг =

(1 -^£1)(т-(АЬ0+дАЬ2)) 1~дЛЬ2

+ ь0.

Среднее время пребывания в системе запроса, обрабатываемого сервером-

диспетчером, после окончания его диспетчеризации, при бесприоритетной ДО рассчитывается:

АЬ^+дЛЬ|

+ Ъ-у

т-{\Ь0+^кЪ2) ' ъ если реализуется ДО с относительными приоритетами запросов на диспетчеризацию, то:

\Ь%+дХЬ1

+ Ь-у

(1 -^){т-(кЬ0+д\Ь2))

При ДО с абсолютными приоритетами

запросов на диспетчеризацию имеем:

\Ьд+д\Ь2

(1 -^-)(т-(\Ь0+д\Ь2)) 1-^Ьо

В случае ДО с относительными или абсолютными приоритетами запросов на обработку:

С4 = <25 = #^ + й2.

Средние задержки перераспределённого запроса в сети кластера и в сервере-исполнителе получим на основе известной формулы для среднего времени пребывания запроса в СМО типа M/M/1 [8]: г ъ± ь2

м

1-

(1-д)Л.Ь2>

где Ь 1 - средняя длительность передачи запроса по сети кластера.

Исследование проводится в условиях

отсутствия в системе перегрузок:

ХЬ°+зХЬ2 < 1, (1 -д)Щ < 1, (1~3)ХЬ2 < 1.

44

нииттс

Выбор вариантов организации распределения запросов в системах предоставления

информационных услуг

Выбор количества серверов-диспетчеров

Предположим, что n=10 шт., b0=0,2 с, b:=0,05 с, b2=1 с, g=0.1.

В результате расчётов, выполненных в системе математических расчетов Mathcad Prime 2.0, получены зависимости среднего времени пребывания запросов в системе от количества серверов, выполняющих функции диспетчеризации, представленные на рис. 2. На рис.2 кривые 1-5 соответствуют вариантам организации распределения запросов, когда приоритеты запросов на диспетчеризацию и собственно решение функциональных задач одинаковы; когда запросы на диспетчеризацию имеют относительный либо абсолютный приоритет над функциональными запросами и когда функциональные запросы имеют относительный либо абсолютный приоритет относительно задач диспетчеризации.

Х=2.5 1/с; б) Х=5 1/с

Из представленных графиков видно, что существует оптимальное количество серверов -диспетчеров, зависящее от ДО и интенсивности входного потока.

Наиболее эффективной с точки зрения минимального среднего времени пребывания

запросов в системе является ДО с относительным приоритетом запросов на диспетчеризацию.

Выбор доли обрабатываемых серверами-диспетчерами запросов

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В предположении, что m=3, получена зависимость среднего времени пребывания запросов в системе от доли обрабатываемых серверами-диспетчерами запросов, представленная на рис. 3. На рис.3 кривые 1-5 представляют варианты дисциплин диспетчеризации в порядке соответствующе предыдущему рисунку.

Рисунок 3. Доля обрабатываемых диспетчерами запросов: а) Х=2.5 1/с; б) Х=5 1/с

Из представленных графиков видно, что существует оптимальное значение g, зависящее от интенсивности входного потока.

Интенсивность потока может измеряться в реальном масштабе времени, в процессе функционирования исследуемой системы. Таким образом, задача оптимизации распределения запросов может решаться динамически. Измерение нагрузки замедляет работу системы, поэтому целесообразность адаптивной оптимизации требует обоснования.

Оптимизация распределения

запросов

Поиск решения по оптимальному варианту распределения запросов проведем по критерию минимума среднего времени пребывания:

Т = п\тдТ(т,д,\),

где среднее время пребывания вычисляется на основании формулы (1).

В результате оптимизации находится количество серверов-диспетчеров т и доля запросов g, обрабатываемая в этих серверах, которые позволяют достичь минимума среднего времени пребывания запросов в системе.

Проведём пример оптимизации распределения запросов для рассматриваемых ДО в серверах-диспетчерах при Х=5 1/с, «=10 шт., Ь0=0,35 с, &1=0,05 с, Ь2=1.

В результате расчётов установлено, что для бесприоритетной ДО оптимальным количеством диспетчеров является т!=3, а доля обрабатываемых ими запросов - gl=0.038, для ДО с относительными приоритетами запросов на диспетчеризацию - т2=10, g2=1, для ДО с абсолютными приоритетами запросов на диспетчеризацию - т3=3, g3=0.052, для ДО с относительными приоритетами запросов на обработку

- т4=3, g4=0.03, для ДО с абсолютными приоритетами запросов на обработку - т5=3, g5=0.023.

Среднее время пребывания запросов в системе при указанных оптимальных значениях соответвенно равно: Т=4.312, Т2=4.124,

Т3=4.34, Т4=4.281, Т5=4.495.

Заключение

Проанализировано влияние организации распределения запросов на эффективность вычислительного кластера информационного сервиса, показана эффективность разделения функций диспетчеризации между несколькими компьютерами кластера.

Показана эффективность организации в серверах-диспетчерах дисциплины обслуживания с относительным приоритетом запросов на диспетчеризацию над функциональными запросами.

Предложенные в статье рекомендации могут быть использованы при оптимизации дисциплин диспетчеризации и обслуживания запросов в системах распределенного предоставления информационного сервиса.

Литература

1. Таненбаум Э., Ван Стеен М. Распределенные системы. Принципы и парадигмы. - СПб.: Питер. -2003. - 877 с.

2. Gaeta M, Konovalov M, Shorgin S. Development of mathematical models and methods of task distribution in distributed computing system // Reliability: Theory & Applications. 2006, №.4, Vol.1, pp.16-21.

3. Богатырев В.А., Богатырев C.B., Лепеш Г.В. Критерии оптимальности объединения машин и агрегатов в системы // Технико-технологические проблемы сервиса. -2009. - №2. - С. 30-35.

4. Богатырев ВА., Богатырев С.В. К анализу и оптимизации серверных систем кластерной архитектуры с балансировкой нагрузки // Приборы и системы. Управление, контроль, диагностика. - 2010. - № 2. -С. 4-9.

5. Богатырев В.А. Надежность вариантов размещения функциональных ресурсов в однородных вычислитель ных сетях // Электронное моделирование.

- 1997. - № 3. - С. 21-27.

6. Богатырев В.А., Голубев И.Ю. Оптимизация распределения запросов в системе кластеров при сочетании аналитического и имитационного моделирования // Научно-технический вестник информационных технологий, механики и оптики. - 2012. -№ 5. - С. 79-83.

7. Bogatyrev V.A., Bogatyrev S.V., Golubev I.Yu. Optimization and the Process of Task Distribution between Computer System Clusters // Automatic Control and Computer Sciences. - 2012. - № 3 (Vol. 46), - pp. 103-111.

8. Алиев Т.П. Основы моделирования дискретных систем. - СПб.: СПбГУ ИТМО, 2009. - 363 с.

1 Голубев Иван Юрьевич - аспирант кафедры вычислительной техники национального исследовательского

университета информационных технологий, механики и оптики, моб.: +7-911-777-71-29, email:

www.golubev@mail.ru;

2 Богатырев Владимир Анатольевич, д.т.н., профессор кафедры Прикладных и информационных технологий СПбГУСЭ, моб.: +7(911) 726 02 26, email: Vladimir.bogatyrev@gmail.com;

3 Нестеров Дмитрий Алексеевич - инженер Санкт-Петербургского государственного лесотехнического университета, моб.: +7(921)922 97 86, email: dimon666n@mail.ru.

46

нииттс

i Надоели баннеры? Вы всегда можете отключить рекламу.