Научная статья на тему 'Обзор систем параллельной обработки заявок'

Обзор систем параллельной обработки заявок Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
278
51
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СИСТЕМА МАССОВОГО ОБСЛУЖИВАНИЯ / РАСЩЕПЛЕНИЕ ЗАЯВОК / ПАРАЛ-ЛЕЛЬНОЕ ОБСЛУЖИВАНИЕ ЗАЯВОК / ПАРАЛЛЕЛЬНАЯ ОБРАБОТКА / ВРЕМЯ ОТКЛИКА / QUEUING SYSTEM / SPLITTING OF REQUESTS / PARALLEL SERVICE OF REQUESTS / PARALLEL PROCESSING / RESPONSE TIME

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Горбунова А.В., Зарядов И.С., Самуйлов К.Е., Сопин Э.С.

Данная работа является первой в серии из двух статей, посвящённых обзору систем массового обслуживания вида «fork-join» (в западной классификации) или системам с расщеплением запросов. Указанная система является естественной моделью для многих других реальных систем. В статье описаны особенности построения этой модели и родственных ей систем, основные их характеристики. Отдельное внимание уделяется методам анализа времени отклика системы. Поскольку точное выражение для среднего времени отклика известно только для случая двух приборов, в статье приведено подробное описание подхода к получению точного выражения этой характеристики. Для случая, когда число приборов больше двух, различными методами получены аппроксимации среднего времени отклика,что объясняется сложностью исследований из-за существующей зависимости между очередями под запросов в силу общих моментов поступления. В работе представлено несколько методов приближенного анализа: различные варианты эмпирической аппроксимации, т.е. методы, уточняющие полученные характеристики благодаря использованию результатов имитационного моделирования; интерполяция с помощью предельных значений загрузки системы в случаях с отличными от экспоненциального распределениями для входящего потока и времени обслуживания.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A Survey on Queuing Systems with Parallel Servingof Customers

This paper is the first in a series of two articles devoted to the review of “fork-join” (inthe western classification) queuing systems or systems with the splitting of incoming queries.This system is a natural model for many other real systems. The article describes the fork-joinqueueing model construction and main characteristics of this model. Special attention is paid tomethods of analysis of the response time of the system. Since the exact expression for the meanresponse time is known only for the case of two servers, the article gives a detailed descriptionof the approach to obtaining an accurate expression of this characteristic. For the case whenthe number of servers is more than two, approximations of the mean response time are obtainedby different methods, which is explained by the complexity of the studies due to the existingdependence between the queues of subqueries due to common arrival moments. The paperpresents several methods of approximate analysis: various variants of empirical approximation,i.e. methods that refine the obtained characteristics by using the results of simulation modeling;interpolation methods using system load limit values in cases when the incoming flow and servicetime distributions are not exponential.

Текст научной работы на тему «Обзор систем параллельной обработки заявок»

УДК 519.21

DOI: 10.22363/2312-9735-2017-25-4-350-362

Обзор систем параллельной обработки заявок А. В. Горбунова*, И. С. Зарядов*1", К. Е. Самуйлов*, Э. С. Сопин*1"

* Кафедра прикладной информатики и теории вероятностей Российский университет дружбы народов ул. Миклухо-Маклая, д. 6, Москва, Россия, 117198 ^ Институт проблем информатики Федеральный исследовательский центр «Информатика и управление» РАН ул. Вавилова, д. 44, кор. 2, Москва, Россия, 119333

Данная работа является первой в серии из двух статей, посвящённых обзору систем массового обслуживания вида «fork-join» (в западной классификации) или системам с расщеплением запросов. Указанная система является естественной моделью для многих других реальных систем. В статье описаны особенности построения этой модели и родственных ей систем, основные их характеристики. Отдельное внимание уделяется методам анализа времени отклика системы. Поскольку точное выражение для среднего времени отклика известно только для случая двух приборов, в статье приведено подробное описание подхода к получению точного выражения этой характеристики. Для случая, когда число приборов больше двух, различными методами получены аппроксимации среднего времени отклика, что объясняется сложностью исследований из-за существующей зависимости между очередями подзапросов в силу общих моментов поступления. В работе представлено несколько методов приближенного анализа: различные варианты эмпирической аппроксимации, т.е. методы, уточняющие полученные характеристики благодаря использованию результатов имитационного моделирования; интерполяция с помощью предельных значений загрузки системы в случаях с отличными от экспоненциального распределениями для входящего потока и времени обслуживания.

Ключевые слова: система массового обслуживания, расщепление заявок, параллельное обслуживание заявок, параллельная обработка, время отклика

1. Введение

Название исследуемой системы с параллельной обработкой запросов или с расщеплением запросов не имеет утвердившегося в русском языке терминологического аналога, в англоязычной же литературе используется термин «fork-join queueing system» [1—3]. Интерес к указанной системе объясняется тем, что она является естественной моделью для многих других реальных систем. В качестве примеров можно привести сферу обслуживания, медицинские приложения, производственные системы, системы облачных вычислений и др. [4]. Если же говорить об информационных технологиях, то прежде всего стоит упомянуть распределённые вычисления, технология которых оказала значительное влияние и на концепцию облачных вычислений, а также параллельные вычисления, например обработку пакетов данных, телефонных вызовов и др. Однако, несмотря на широкий спектр задач, которые решаются с помощью систем массового обслуживания с параллельной обработкой запросов, и их популярность среди зарубежных авторов, в нашей стране данная система исследовалась значительно меньше [4-9]. Статья организована следующим образом: в разделе 2 описываются особенности построения системы с расщеплением запросов и родственных ей систем, в разделе 3 подробно описан метод точного анализа среднего времени отклика для случая расщепления на два подзапроса, в разделе 4 представлены два метода аппроксимации среднего времени отклика, в

Статья поступила в редакцию 22 июня 2017 г.

Исследование выполнено при финансовой поддержке Минобрнауки России (соглашение № 02.А03.21.0008) и при финансовой поддержке РФФИ в рамках научных проектов № 15-07-03051, 15-07-03608.

заключении кратко подведены итоги и анонсировано содержание второй части работы.

2. Системы параллельного обслуживания заявок

Общая идея функционирования системы fork-join (рис. 1) заключается в следующем: на вход поступает поток заявок (запросов) Т\,72,..., в момент поступления в точке «расщепления» (англ. fork point) заявка Ti, i = 1, то разделяется на К родственных заявок (подзапросов): STf = STuSTl2 = ST2,..., ST% = STK, каждая из которых отправляется в очередь на обслуживание к приборам или серверам с номерами 1,2,... ,К соответственно. Предполагается, что запросы имеют одну и ту же структуру и каждый сервер предназначен для выполнения конкретных задач: подзапрос STk может обслуживаться только на к-м сервере, к = 1,К. Обработанные подзапросы попадают в буфер синхронизации, где дожидаются родственных им подзапросов. В момент поступления последнего родственного подзапроса одного из запросов происходит их синхронизация, т.е. объединение, после чего обработанный запрос покидает систему. Здесь и далее будем считать,что синхронизация происходит мгновенно.

Рис. 1. Система массового обслуживания типа fork-join

Стоит отметить, что описанную модель рассматривают и как сеть массового обслуживания (СеМО): после расщепления подзапросы одновременно поступают на вход ветвей, которые представляют собой одноканальные системы массового обслуживания (СМО) с очередями. Однако данный подход предполагает дальнейший переход к рассмотрению независимых СМО, что является упрощающим допущением в силу существующей зависимости между очередями подзапросов вследствие общих моментов поступления. Тем не менее таких сложностей не возникает для случая, когда каждая подсистема состоит из бесконечного числа приборов [6,7].

Анализ SPM (splitting and matching queueing system) системы массового обслуживания в [10] является одной из самых ранних работ на эту тему. В ней рассматриваются авиапассажиры и их багаж, которые прибывают вместе на самолёте в аэропорт, но разделены до тех пор, пока пассажиры не получат свои вещи в зоне выдачи багажа. В этой статье анализируется система с двумя ветвями DIM|1, т.е. с детерминированным входящим потоком и экспоненциальным временем обслуживания на каждом из серверов.

SM (split-merge queueing system) система является одним из вариантов fork-join системы массового обслуживания (рис. 2). Её отличие заключается в том, что на

свободные серверы не поступит ни один подзапрос следующего запроса до того момента, пока не обслужатся все подзапросы текущего запроса [11], т.е. происходит блокировка каждого освободившегося сервера до окончания обработки всех задач запроса.

Рис. 2. Система массового обслуживания типа split-merge

FF (fission-fusion queueing system) система — это ещё одна разновидность fork-join системы (рис. 3). Если допустить, что все подзапросы ST\, ST%,..., STk являются идентичными и неразличимыми: STk = ST, к = 1 ,К, то запрос может покинуть систему после обработки любых К подзапросов, иначе говоря, подзапросы могут

Рис. 3. Система массового обслуживания типа fission-fusion

Модель независимых серверов (independent server model, ISM) представляет собой многоканальную систему массового обслуживания. Для обслуживания поступившего запроса требуется случайное число серверов, не превышающее их общее количество, причём обслуживание очередного запроса не может начаться до тех пор, пока число свободных серверов не станет по крайней мере равно числу серверов, требуемых для обслуживания. В частности, в работе [12] рассматриваемая система состоит из однородных серверов, времена обслуживания являются независимыми и имеют экспоненциальное распределение. Входящий поток является пуассоновским,

а число серверов, требуемых для обработки запроса, определяется некоторой вероятностью. Запросы обслуживаются в порядке поступления (First Come First Served, FCFS) и могут покинуть систему только после освобождения всех затребованных серверов. Поскольку времена обслуживания на отдельных серверах являются независимыми, то сервер, закончивший обслуживание запроса, становится доступным для других задач. Таким образом, время обслуживания запроса является максимумом случайного числа экспоненциально распределённых случайных величин. Для модели были получены такие характеристики, как распределение времени обслуживания, распределение числа занятых серверов, а также достаточные условия для существования стационарного распределения.

В случае модели группового обслуживания (team service model, TSM), так же как и в случае ISM системы, для обработки задач требуется наличие нескольких свободных серверов одновременно, но при этом серверы начинают обслуживание этих задач и освобождаются одновременно [13,14].

Также существует такой вариант fork-join системы, когда поступающие на вход в систему несколько потоков запросов делятся на подзапросы и отправляются на обслуживание на серверы в соответствии с заданной матрицей вероятностей, т.е. запросы поступают как К независимых потоков, затем делятся на части, которые распределяются по серверам в соответствии с некоторой стратегией (политикой), которая и определяется матрицей [15,16].

Первые результаты исследования fork-join системы массового обслуживания были получены для случая расщепления заявки на два подзапроса ST1, ST2 с пуассо-новским входящим потоком и экспоненциальным временем обслуживания на обоих серверах [17]. Однако несмотря на марковость предположений анализ fork-join систем массового обслуживания даже для случая К = 2 затруднителен по следующим причинам: процессы поступления подзапросов на серверы коррелируют; модель описывается двумерной цепью Маркова с бесконечным числом состояний для каждой размерности.

В силу указанных выше факторов точного решения для распределения числа подзапросов STk, к = 1, К в fork-join системе не было найдено. Но при этом для случая пуассоновского входящего потока и экспоненциальных времён обслуживания можно получить явные выражения для маргинальных вероятностей [4].

Приближенное же решение для распределения числа подзапросов в случае очередей неограниченных размеров может быть получено для достаточно большой ёмкости накопителя — такой, что вероятность потери запросов в связи с этой большой ёмкостью будет пренебрежимо мала, и в данном случае будут применимы итерационные численные методы решения систем линейных уравнений большой размерности [18].

Большинство авторов в своих работах исследуют один из основных показателей качества функционирования подобных систем массового обслуживания — время отклика Wk,max = max(£i,... ,£k), где — случайная величина времени пребывания

подзапроса STk в системе до его попадания в буфер синхронизации, к = 1, К. Стоит сразу отметить, что точное выражение для среднего времени отклика было получено только для fork-join системы с двумя ветвями М\М|1 (К = 2) в [1] с помощью результатов работы [17]. Для случая К > 2 с помощью различных методов были получены аппроксимации среднего времени отклика.

3. Анализ системы с двумя ветвями M|M|1

Модель цепи Маркова с непрерывным временем для fork-join системы с двумя ветвями М|М|1 и накопителем неограниченной ёмкости рассматривается в [17]. Этот анализ был расширен для ветвей М|G|2 в [19]. Для изучения стационарного и нестационарного режимов основной краевой задачи (дифференциальное уравнение

вместе с набором дополнительных ограничений) в работе [19] использовались методы исследования функций комплексной переменной, представленные, например, в [20]. В ходе последующего обсуждения более подробно остановимся на анализе статьи [17], поскольку она ведёт к точному решению задачи для fork-join системы с двумя ветвями М\М|1.

Итак, рассмотрим fork-join систему, попадая в которую запрос расщепляется на К = 2 подзапроса, входящий поток является пуассоновским с интенсивностью Л = 1, а интенсивности обслуживания на двух серверах удовлетворяют условию: 1 < ^ , гарантируя, что со временем система не переполнится, т.е. число подзапросов не устремится к бесконечности. Поведение системы описывается непрерывным марковским процессом X(t) = {x1(t),x2(t), t ^ 0}, где Xk(t) — число подзапросов к-го типа, соответственно к = 1, 2. Указанные состояния интерпретируются следующим образом: если X(t) = {(i,j),i,j ^ 0} в некоторый момент времени t, то в системе находится i заявок 1-го типа, т.е. STi, и j заявок 2-го типа, т.е. ST2, а Pi,j — стационарная вероятность указанного состояния. Далее записывается система уравнений равновесия в терминах двойной производящей функции Р(z,w) = £г Е, Pi,i^ [17,21,22]:

Q(z,w)P(z,w) = N(z,w), \z\, И < 1,

где

Q(z, w) = 1 + ^I^ZW — — ^2Z — z2w2, N(z, w) = ¡i2z(w — 1)P(z, 0) + ^w(z — 1)P(0, w).

Анализ производящей функции позволяет получить выражения для Р (z, 0) и

Р(0,w), которые для симметричного случая ц1 = = Ц равны между собой:

р 0) = р <0-г) = <1)

Также с помощью преобразований производящей функции в граничных точках: Р(z, 0) и Р(0, w), в [17] были получены асимптотические выражения для стационарных вероятностей состояний pi,0 и po,j при i ^ ^ то соответственно. Это ещё раз свидетельствует о том, что данная задача требует более совершенных математических методов решения.

Используя результаты анализа в [17], среднее время отклика для fork-join системы с двумя симметричными ветвями выводится в Приложении B в [1]. Интенсивность пуассоновского входящего потока имеет значение Л, интенсивности обслуживания на двух серверах раны р, т.е. = ^ = р, причём X < р, так, что нагрузка на каждый из серверов р = X/jj, меньше единицы:

Е [W2,max] = Щ — р Е [Wi,max] = [Wi,max]

8

12 — р

где Щ = 1,5,Е \Ш1тах\ = (ц -А) 1 — среднее время отклика для СМО М\М|1 [2224].

Вывод Е [^2,шах] основан на наблюдении, что эта величина есть сумма времени пребывания в системе М\М\1, т.е. ^1,тах, и времени, проведённого подзапросом в системе после обслуживания на сервере в ожидании второго, и до ухода из неё (время синхронизации) Б: Е ,тах] = Е [^\,тах] + Е].

Согласно формуле Литтла, N = 2АЕ [Б], где N — это среднее число подзапросов, которые обслужились на приборе и ждут свою пару [22-24]. Через qk обозначим

вероятность того, что число подзапросов во второй очереди превышает число подзапросов в первой очереди на к. Благодаря симметрии qk = д-к, к ^ 1 и, таким ^ 1 ^ образом, N = 2 ^ к с\к, следовательно Е[Б] = — ^ к дк.

к=1 * к=1 Из уравнений, представленных в [1], можно получить:

Qk = Pi'°-

(2)

i=k

Тогда qk = дк+1 + Рк,о, где рк,о — это вероятность того, что в первой очереди находится к подзапросов, а во второй — ноль. Далее с учётом формулы (1) можем записать:

р(z, 0) = Р^ z) = Р(z) = £/ = ((11_ ^ ■

(3)

i=0

Затем подставляем в формулу для времени синхронизации выражение для ^ из (2) и меняем порядок суммирования:

СЮ СЮ с^ v

Е [51 = I т,* Z Р*'0 = Т £ яо = 1Z

1 A (i + 1)г

к=1 г=к

i=1 к=1

Т ^ 2

г=1

~Pi,0.

(4)

Потом вычисляем значения первой и второй производной при г = 1 от выражения для производящей функции Р(х, 0), полученном в (3) и от выражения, которое записывается исходя из определения этой функции:

dP (z)

dz

1 ^ d2P(z)

= 2Р = 1^ гPi>о,

*=1 2 г=1

dz 2

3Р2

z=1

4(1 _р)

р = г2 Pi,о iPi,o-

i=1

i=1

Теперь можем подставить полученные формулы в (4):

Е[5] = 2Т

=2Т (£_*И)=8Т4т_РР), (5)

следовательно, среднее время отклика определяется следующим выражением:

Е [W~2,max] = Е [W1,mx] + Е[5] =

12 _ р 1 8 у _Т

12 _ р

Е [W1,max] .

4. Аппроксимация времени отклика 4.1. Эмпирическая формула аппроксимации

Один из способов аппроксимации времени отклика для fork-join системы с К ветвями М\М|1 и одинаковыми интенсивностями обслуживания на серверах был предложен в [1]. Идея предложенного метода аппроксимации появилась из наблюдения за поведением времени отклика при проведении численных экспериментов.

Верхнюю границу для среднего времени отклика можно получить, сделав допущение о независимости случайных величин времён пребывания подзапросов в системе, или, что тоже самое, рассмотреть СеМО, состоящую из К независимых параллельно функционирующих систем М \М \1. Данное предположение подтверждается приведённым в [1] доказательством того факта, что случайные величины времён

пребывания подзапросов в системе являются положительно ассоциированными. По определению [25] две случайные величины £ и г] являются положительно ассоциированными, если Е[/(^)д(г])] > Е[/ (&]Е[д(г))], т.е. ковариация любых пар неубывающих функций /ид является неотрицательной, а одно из свойств положительно ассоциированных случайных величин ^1,^2,... заключается в том, что [25]

р( max fi > ^ < 1 - П Р (ii <х).

V^K J Ы

1=1

Нижняя граница для среднего времени отклика получается, если «пренебречь» очередями (т.е. для значений р близких к нулю): в этом случае время отклика будет являться максимумом К независимых одинаково распределённых случайных величин (н.о.р.с.в.) со средним 1/ц. Таким образом, имеем:

Як (\/ц) < Е [Жк.тах] < НкЕ[Ш],

к

где Як = Е 1/^ — это частичная сумма гармонического ряда. Верхняя и нижняя

¿=1

границы растут с одной и той же скоростью Як, иными словами, для больших значений К границы имеют порядок 0(1пК). Поэтому, зная значение Е ,тах] , можем записать: Е \WK,max] & Як(р)Е [Ш2,тах] , где Як(р) — это коэффициент масштабирования, растущий со скоростью 0(1пК). Следовательно, аппроксимация времени отклика может быть представлена в следующем виде: Як = &(р) + 3(р)Як. Поскольку по определению Я (р) = 1, то, подставив это значение в предыдущее выражение, получим, что 3(р) = (1 — а(р)) /Я2, таким образом,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Як(р) = а(р)+1 — ®(р)Як, К > 2. Я

Посредством имитационного моделирования в [1] определяется значение а(р) ~ 4р/11. Окончательно имеем

Е [WKmax]

Нк 4 / Hk \

нк + 1U1 - Нк)р

V ^ • ^ < 2. (6)

Полученное приближение, исходя из численного анализа, проведённого авторами, имеет погрешность аппроксимации, не превышающую 5% для значений 2 ^ К ^ 32.

В статье [26] исследуется аналогичная fork-join система с К ветвями М\М|1. Полученная аппроксимация является средним арифметическим верхней и нижней оценок. В качестве верхней оценки используется видоизменённое выражение для верхней оценки из вышеупомянутой работы [1]. Нижняя оценка получается при анализе эквивалентной величины времени отклика, но для системы с непараллельной организацией очереди [27]. Итак,

i Л. K i

1(нк+, £ щЦ ^ < нк

;(Нк+" tw-У))

Далее вычисляется среднее арифметическое полученных оценок, в результате чего имеем:

Е [WX,max] « 1

Нк +

р

2(1 -р)

£

\k=i

1

к

к — р

+ (1 — 2р)^2

1

к=1

к( к — р)

(7)

4.2. Интерполяция с помощью предельных значений загрузки системы

В [28] предложен другой метод аппроксимации времени отклика — комбинация методов интерполяции высокой и слабой входных нагрузок (heavy and light traffic interpolation approximations). Указанные техники в отличие от описанного выше метода не используют результаты имитационного моделирования, однако их применение может быть расширено и до анализа fork-join систем не только с экспоненциальным временем обслуживания или c пуассоновским входящим потоком.

Для рассматриваемой задачи найти решение в аналитическом виде очень затруднительно, однако возможно получить асимптотические формулы для искомых характеристик. Интерполяция слабой загрузкой системы является результатом её работы в режиме слабой нагрузки, т.е. когда интенсивность входящего потока Л очень мала. В этом случае целесообразно обратиться к разложению в ряд Тэйлора характеристик производительности системы (в частности, функции распределения времени отклика — как функции от Л — в окрестности нуля), с помощью которого можно определить неизвестные величины в представлении исследуемой функции в виде полинома от Л порядка п. Рассматриваются только полиномы нулевой и первой степени. Если же говорить об интерполяции с помощью высокой загрузки, то для fork-join системы речь идёт об анализе такого режима, в котором значение Л очень близко к значению Ключевым параметром при интерполяции с помощью метода высокой нагрузки является параметр ft, два крайних значения которого интерпретируются как два предельных случая: если ft = 0, то это означает, что входящий поток является детерминированным, если ft = 1, то время обслуживания — детерминированное, а ветви fork-join системы являются К независимыми DIGI|1 и GI|D|1 СМО, соответственно.

Таким образом, благодаря исследованию поведения функции времени отклика в граничных значениях загрузки системы удаётся, в отличие от метода, описанного в [1], не прибегая к численным экспериментам для определения констант в интерполяционной формуле, определить их точные выражения в замкнутой форме.

Для случая fork-join системы с К ветвями М|М|1 аппроксимация времени отклика имеет вид:

Е [WX,max]

где

НК + (vK — Нк) Л

1 0 К > 2, (8)

V — Л

v.=£(ю (—Е(;)

г=1 v 7 m=1 v 7

В случае распределения Эрланга второго порядка для входящего потока с функцией распределения А(х) = 1 — (1 + 2Ах)е-2Хх, х ^ 0 и для времени обслуживания с функцией распределения В(х) = 1 — (1 + 2цх)е-2^х, х > 0:

Е [WK,max]

* + (£ — *) *

1 0 ^ Л < v, К = 2, 3,..., (9)

* — Л'

где

FK = -

ад (—т)

г=1 4 ' т=0 4 '

т!

2Гт+, '

К = 2,3,

Также в работе [28] для того, чтобы получить оценку среднего времени отклика в случаях с другими распределениями для входящего потока и времени обслуживания, метод интерполяции высокой нагрузки был модифицирован, и анализировались три значения ключевой константы 3 = 0,1/2,1, что привело к квадратичной интерполяции, благодаря которой, в сочетании с методом низкой нагрузки, были получены формулы аппроксимации среднего времени отклика для следующих немарковских случаев:

— распределение Эрланга второго порядка для входящего потока с функцией распределения А(х) = 1 — (1 + 2Ах)е-2Хх, х ^ 0 и экспоненциальное время обслуживания с функцией распределения В(х) = 1 — е-^х, х ^ 0:

Е [^K,max]

Hk +(2VK — -HK — -) -

K + V3 K 6 K u) V

i

v — -

0 К = 2, 3,...

пуассоновский входящий поток с функцией распределения А(х) = 1 — е-Хх, х ^ 0 и распределение Эрланга второго порядка времени обслуживания с функцией распределения В(х) = 1 — (1 + 2цх)е-2^х, х > 0:

Е [WK,max]

Fk +(! — HK + 2Vk — FA -K + V6 12 + 3 K K) v

V — —

0 К = 2, 3,

а также для гиперэкспоненциального входящего потока и экспоненциального времени обслуживания, пуассоновского входящего потока и гиперэкспоненциального времени обслуживания, формулы для которых в силу их громоздкости приводить не будем.

i

5. Заключение

В статье рассмотрены особенности построения систем массового обслуживания с расщеплением запросов. Представлен метод точного анализа среднего времени отклика (К = 2), а также его аппроксимации. Во второй части работы будут рассмотрены другие подходы к приближенному анализу времени отклика: матрично-геометрический метод, анализ с помощью порядковых статистик для различных типов распределения времени пребывания подзапросов в системе.

Литература

1. Nelson R., Tantawi A. N. Approximate Analysis of Fork/Join Synchronization in Parallel Queues // IEEE Transactions on Computers. — 1988. — Vol. 37. — Pp. 739743.

2. Thomasian A. Analysis of Fork/Join and Related Queueing Systems // ACM Computing Surveys (CSUR). — 2014. — Vol. 47, No 2. — Pp. 17:1-17:71.

3. Tsimashenka I., Knottenbelt W. J. Reduction of Subtask Dispersion in Fork-Join Systems // Computer Performance Engineering. — Springer Berlin Heidelberg, 2013. — Pp. 325-336.

4. Аппроксимация времени отклика системы облачных вычислений / А. В. Горбунова, И. С. Зарядов, С. И. Матюшенко, К. Е. Самуйлов, С. Я. Шоргин // Информатика и её применения. — 2015. — Т. 9, вып. 3. — С. 32-38.

5. Вышенский С. В., Григорьев П. В., Дубенская Ю. Ю. Идеальный синхронизатор маркированных пар в сети разветвление-объединение // Обозрение прикладной и промышленной математики. — 2008. — Т. 15, № 3. — С. 385-399.

6. Моисеева С. П., Ивановская И. А. Исследование математической модели параллельного обслуживания заявок смешанного типа // Известия Томского политехнического университета. Управление, вычислительная техника и информатика. — 2010. — Т. 317, № 5. — С. 32-34.

7. Моисеева С. П., Жидкова Л. А. Исследование системы параллельного обслуживания кратных заявок простейшего потока // Известия Томского политехнического университета. Управление, вычислительная техника и информатика. — 2011. — Т. 17, № 4. — С. 49-54.

8. The Estimation of Probability Characteristics of Cloud Computing Systems with Splitting of Requests / A. V. Gorbunova, I. S. Zaryadov, S. I. Matushenko, E. S. Sopin // Proceedings of the Nineteenth International Scientific Conference Russia: Distributed computer and communication networks: control, computation, communications (DCCN-2016). — Vol. 3. — 2016. — Pp. 467-472.

9. Оценка вероятностных характеристик системы облачных вычислений с расщеплением запросов / А. В. Горбунова, И. С. Зарядов, С. И. Матюшенко, Э. С. Со-пин // Информационные технологии и математическое моделирование (ИТММ-2016): Материалы XV Международной конференции имени А. Ф. Терпугова. — 2016. — С. 167-172.

10. Mandelbaum M., Itzhak A.-B. Introduction to Queueing with Splitting and Matching // Israel Journal of Technology. — 1968. — Vol. 6, No 5. — Pp. 376-382.

11. Duda A., Czachorski T. Performance Evaluation of Fork and Join Synchronization Primitives // Acta Informatica. — 1987. — Vol. 24, No 5. — Pp. 525-533.

12. Green L. A Queueing System in which Customers Require a Random Number of Servers // Operations Research. — 1980. — Т. 28, № 6. — С. 1335-1346.

13. Omahen K. J., Schrage L. A Queueing Analysis of a Multiprocessor System with Shared Memory // Proc. of the Symposium on Computer Communication Networks and Teletraffic. — 1972. — Pp. 77-88.

14. Thomasian A., Avizienis A. Dynamic Scheduling of Tasks Requiring Multiple Processors // Proceedings of the 11th IEEE Computer Society International Conference (COMPCON'75 Fall). — 1975. — Pp. 77-80.

15. Javidi T. Cooperative and Non-Cooperative Resource Sharing in Networks: a Delay Perspective // IEEE Transactions on Automatic Control. — 2008. — Vol. 53, No 9. — Pp. 2134-2142.

16. Kumar A., Shorey R. Performance Analysis and Scheduling of Stochastic Fork-Join Jobs in a Multicomputer System // IEEE Transactions on Parallel and Distributed Systems. — 1993. — Vol. 10, No 4. — Pp. 1147-1164.

17. Flatto L., Hahn S. Two Parallel Queues Created by Arrivals with Two Demands I // SIAM Journal on Applied Mathematics. — 1984. — Vol. 44, No 5. — Pp. 1041-1053.

18. Queueing Networks and Markov Chains: Modeling and Performance Evaluation with Computer Science Applications / G. Bolch, S. Greiner, H. de Meer, K. S. Trivedi. — John Wiley & Sons, 2006. — P. 896.

19. Baccelli F. Two Parallel Queues Created by Arrivals with Two Demands: the М| G| 2 Symmetrical Case // INRIA Rapport de Recherche. — 1985. — Vol. 426.

20. Boyce W. E., DiPrima R. C. Elementary Differential Equations and Boundary Value Problems. — John Wiley & Sons, 2012. — P. 809.

21. Башарин Г. П. Введение в теорию вероятностей. — Москва: РУДН, 1990. — 228 с.

22. Бочаров П. П., Печинкин А. В. Теория массового обслуживания. — Москва: Изд-во РУДН, 1995. — С. 529.

23. Башарин Г. П. Лекции по математической теории телетрафика. — Москва: РУДН, 2009. — 342 с.

24. Queueing Theory / P. P. Bocharov, C. D'Apice, A. V. Pechinkin, S. Salerno. — Brill

Academic Publishers, 2004. — P. 457.

25. Barlow R. E., Proschan F. Statistical Theory of Reliability and Life Testing: Probability Models. — John Wiley & Sons, 1981. — P. 290.

26. Varki E., Merchant A., Chen H. The M\M|1 Fork-Join Queue with Variable Sub-tasks .— http://www.cs.unh.edu/~varki/publication/2002-nov-open.pdf.

27. Varki E. Response Time Analysis of Parallel Computer and Storage Systems // IEEE Transactions on Parallel and Distributed Systems. — 2001. — Vol. 12, No 11. — Pp. 1146-1161.

28. Varma S., Makowski A. M. Interpolation Approximations for Symmetric Fork-Join Queues // Performance Evaluation. — 1994. — Vol. 20. — Pp. 245-265.

UDC 519.21

DOI: 10.22363/2312-9735-2017-25-4-350-362

A Survey on Queuing Systems with Parallel Serving

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

of Customers

A. V. Gorbunova*, I. S. Zaryadov*t, K. E. Samouylov*, E. S. Sopin*t

* Department of Applied Probability and Informatics Peoples' Friendship University of Russia (RUDN University) 6 Miklukho-Maklaya St., Moscow, 117198, Russian Federation ^ Institute of Informatics Problems Federal Research Center "Computer Science and Control" Russian Academy of Sciences 44-2 Vavilova St., Moscow, 119333, Russian Federation

This paper is the first in a series of two articles devoted to the review of "fork-join" (in the western classification) queuing systems or systems with the splitting of incoming queries. This system is a natural model for many other real systems. The article describes the fork-join queueing model construction and main characteristics of this model. Special attention is paid to methods of analysis of the response time of the system. Since the exact expression for the mean response time is known only for the case of two servers, the article gives a detailed description of the approach to obtaining an accurate expression of this characteristic. For the case when the number of servers is more than two, approximations of the mean response time are obtained by different methods, which is explained by the complexity of the studies due to the existing dependence between the queues of subqueries due to common arrival moments. The paper presents several methods of approximate analysis: various variants of empirical approximation, i.e. methods that refine the obtained characteristics by using the results of simulation modeling; interpolation methods using system load limit values in cases when the incoming flow and service time distributions are not exponential.

Key words and phrases: queuing system, splitting of requests, parallel service of requests, parallel processing, response time

References

1. R. Nelson, A. N. Tantawi, Approximate Analysis of Fork/Join Synchronization in Parallel Queues, IEEE Transactions on Computers 37 (1988) 739-743.

2. A. Thomasian, Analysis of Fork/Join and Related Queueing Systems, ACM Computing Surveys (CSUR) 47 (2) (2014) 17:1-17:71.

3. I. Tsimashenka, W. J. Knottenbelt, Reduction of Subtask Dispersion in Fork-Join Systems, in: Computer Performance Engineering, Springer Berlin Heidelberg, 2013, pp. 325-336.

4. A. V. Gorbunova, I. S. Zaryadov, S. I. Matyushenko, K. E. Samouylov, S. Ya. Shorgin, The Approximation of Response Time of a Cloud Computing System, Informatics and applications 9 (2015) 32-38, in Russian.

5. S. V. Vyshenski, P. V. Grigoriev, Yu. Yu. Dubenskaya, Ideal Synchronizer for Marked Pairs in Fork-Join Network, Review of applied and industrial mathematics 15 (3) (2008) 385-399, in Russian.

6. S. P. Moiseeva, I. A. Ivanovskaya, Analysis of the Mathematical Model of Parallel Service of Mixed Type Requests, Bulletin of the Tomsk Polytechnic University. Control, Computer Science and Technology 317 (5) (2010) 32-34, in Russian.

7. S. P. Moiseeva, L. A. Zhidkova, Investigation of the Parallel Service System with Multiple Claims of the Poisson Process, Bulletin of the Tomsk Polytechnic University. Control, Computer Science and Technology 17 (4) (2011) 49-54, in Russian.

8. A. V. Gorbunova, I. S. Zaryadov, S. I. Matushenko, E. S. Sopin, The Estimation of Probability Characteristics of Cloud Computing Systems with Splitting of Requests, in: Proceedings of the Nineteenth International Scientific Conference Russia: Distributed computer and communication networks: control, computation, communications (DCCN-2016), Vol. 3, 2016, pp. 467-472.

9. A. V. Gorbunova, I. S. Zaryadov, S. I. Matushenko, E. S. Sopin, The Estimation of Probability Characteristics of Cloud Computing Systems with Splitting of Requests, in: Proceedings of the 15th International Conference named after A. F. Terpugov: Information technologies and mathematical modelling (ITMM-2016), 2016, pp. 167172, in Russian.

10. M. Mandelbaum, A.-B. Itzhak, Introduction to Queueing with Splitting and Matching, Israel Journal of Technology 6 (5) (1968) 376-382.

11. A. Duda, T. Czachorski, Performance Evaluation of Fork and Join Synchronization Primitives, Acta Informatica 24 (5) (1987) 525-533.

12. L. Green, A Queueing System in which Customers Require a Random Number of Servers, Operations Research 28 (6) (1980) 1335-1346.

13. K. J. Omahen, L. Schrage, A Queueing Analysis of a Multiprocessor System with Shared Memory, in: Proc. of the Symposium on Computer Communication Networks and Teletraffic, 1972, pp. 77-88.

14. A. Thomasian, A. Avizienis, Dynamic Scheduling of Tasks Requiring Multiple Processors, in: Proceedings of the 11th IEEE Computer Society International Conference (COMPCON'75 Fall), 1975, pp. 77-80.

15. T. Javidi, Cooperative and Non-Cooperative Resource Sharing in Networks: a Delay Perspective, IEEE Transactions on Automatic Control 53 (9) (2008) 2134-2142.

16. A. Kumar, R. Shorey, Performance Analysis and Scheduling of Stochastic Fork-Join Jobs in a Multicomputer System, IEEE Transactions on Parallel and Distributed Systems 10 (4) (1993) 1147-1164.

17. L. Flatto, S. Hahn, Two Parallel Queues Created by Arrivals with Two Demands I, SIAM Journal on Applied Mathematics 44 (5) (1984) 1041-1053.

18. G. Bolch, S. Greiner, H. de Meer, K. S. Trivedi, Queueing Networks and Markov Chains: Modeling and Performance Evaluation with Computer Science Applications, John Wiley & Sons, 2006.

19. F. Baccelli, Two Parallel Queues Created by Arrivals with Two Demands: the M|G|2 Symmetrical Case, INRIA Rapport de Recherche 426.

20. W. E. Boyce, R. C. DiPrima, Elementary Differential Equations and Boundary Value Problems, John Wiley & Sons, 2012.

21. G. P. Basharin, Introduction to Probability Theory, PFUR, Moscow, 1990, in Russian.

22. P. P. Bocharov, A. V. Pechinkin, Queueing Theory, PFUR, Moscow, 1995, in Russian.

23. G. P. Basharin, Lectures on the Mathematical Theory of Teletraffic, PFUR, Moscow, 2009, in Russian.

24. P. P. Bocharov, C. D'Apice, A. V. Pechinkin, S. Salerno, Queueing Theory, Brill Academic Publishers, 2004.

25. R. E. Barlow, F. Proschan, Statistical Theory of Reliability and Life Testing: Probability Models, John Wiley & Sons, 1981.

26. E. Varki, A. Merchant, H. Chen, The M|M|1 Fork-Join Queue with Variable

Subtasks.

URL http://www.cs.unh.edu/~varki/publication/2002-nov-open.pdf

27. E. Varki, Response Time Analysis of Parallel Computer and Storage Systems, IEEE Transactions on Parallel and Distributed Systems 12 (11) (2001) 1146-1161.

28. S. Varma, A. M. Makowski, Interpolation Approximations for Symmetric Fork-Join Queues, Performance Evaluation 20 (1994) 245-265.

© Горбунова А. В., Зарядов И. С., Самуйлов К.Е., Сопин Э.С., 2017 Для цитирования:

Горбунова А. В., Зарядов И. С., Самуйлов К. Е., Сопин Э. С. Обзор систем параллельной обработки заявок // Вестник Российского университета дружбы народов. Серия: Математика. Информатика. Физика. — 2017. — Т. 25, № 4. — С. 350-362. — DOI: 10.22363/2312-9735-2017-25-4-350-362.

For citation:

Gorbunova A. V., Zaryadov I.S., Samouylov K. E., Sopin E. S. A Survey on Queuing Systems with Parallel Serving of Customers, RUDN Journal of Mathematics, Information Sciences and Physics 25 (4) (2017) 350-362. DOI: 10.22363/2312-9735-2017-25-4-350362. In Russian.

Сведения об авторах:

Горбунова Анастасия Владимировна — ассистент кафедры прикладной информатики и теории вероятностей РУДН (e-mail: gorbunova_av@rudn.university, тел.: +7(495)9550927)

Зарядов Иван Сергеевич — кандидат физико-математических наук, доцент кафедры прикладной информатики и теории вероятностей РУДН, старший научный сотрудник ИПИ ФИЦ ИУ РАН (e-mail: zaryadov_is@rudn.university, тел.: +7(495)9550927)

Самуйлов Константин Евгеньевич — профессор, доктор технических наук, заведующий кафедрой прикладной информатики и теории вероятностей РУДН (e-mail: samuylov_ke@rudn.university, тел.: +7(495)9550956)

Сопин Эдуард Сергеевич — кандидат физико-математических наук, доцент кафедры прикладной информатики и теории вероятностей РУДН, старший научный сотрудник ИПИ ФИЦ ИУ РАН (e-mail: sopin_es@rudn.university, тел.: +7(495)9550927)

Information about the authors:

Gorbunova A. V. — assistant of Department of Applied Probability and Informatics of Peoples' Friendship University of Russia (RUDN University) (e-mail: gorbunova_av@rudn.university, phone: +7(495)9550927) Zaryadov I. S. — Candidate of Physical and Mathematical Sciences, assistant professor of Department of Applied Probability and Informatics of Peoples' Friendship University of Russia (RUDN University); Senior Researcher of Institute of Informatics Problems of Federal Research Center "Computer Science and Control" Russian Academy of Sciences (e-mail: zaryadov_is@rudn.university, phone: +7(495)9550927) Samouylov K. E. — professor, Doctor of Engineering Science, head of Department of Applied Probability and Informatics of Peoples' Friendship University of Russia (RUDN University) (e-mail: samuylov_ke@rudn.university, phone: +7(495)9550956) Sopin E. S. — Candidate of Physical and Mathematical Sciences, assistant professor of Department of Applied Probability and Informatics of Peoples' Friendship University of Russia (RUDN University); Senior Researcher of Institute of Informatics Problems of Federal Research Center "Computer Science and Control" Russian Academy of Sciences (e-mail: sopin_es@rudn.university, phone: +7(495)9550927)

i Надоели баннеры? Вы всегда можете отключить рекламу.