Научная статья на тему 'Метод расчета длительности обработки задач в системе массового обслуживания с учетом процессов Split-Join'

Метод расчета длительности обработки задач в системе массового обслуживания с учетом процессов Split-Join Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
120
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПРЕДЕЛЕННАЯ ОБРАБОТКА ДАННЫХ / ПАРАЛЛЕЛЬНЫЕ ЗАПРОСЫ / ПРОЦЕСС ОБСЛУЖИВАНИЯ SPLIT-JOIN / РАСПРЕДЕЛЕНИЕ МАКСИМУМА СЛУЧАЙНЫХ ВЕЛИЧИН / ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ ПО ЧЕБЫШЕВУ-ЛАГЕРРУ / DISTRIBUTED DATA PROCESSING / CONCURRENT REQUESTS / SPLIT-JOIN SERVICE PROCESS / DISTRIBUTION OF MAXIMUM OF RANDOM VARIABLES / NUMERICAL INTEGRATION BY CHEBYSHEV-LAGUERRE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Рыжиков Ю. И., Лохвицкий В. А., Хабаров Р. С.

Предложен метод расчета длительности обработки исходной заявки в многоканальной системе массового обслуживания с учетом разделения заявки на независимые подзадачи и их параллельной обработки с последующим объединением результатов. Длительность указанного процесса представляется как распределение максимума случайных длительностей выполнения подзадач. Начальные моменты искомого распределения определяются путем численного интегрирования по полуоси с весом Чебышева Лагерра; результаты расчетов сопоставляются с полученными при имитационном моделировании.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Method of calculating task treatment duration in queueing system with consideration of Split-Join processes

A method is proposed for calculating the processing time of initial task in multi-channel queueing system with consideration of the task separation into independent subtasks that are treated parallelly with further assembling of the results. The process duration is represented as the distribution of the maximum from the random durations of the subtasks processing. The starting moments of the desired distribution are found by numerical integration along the semi-axis with the Chebyshev-Laguerre weight. Results of numerical calculations are compared with data obtained by simulations.

Текст научной работы на тему «Метод расчета длительности обработки задач в системе массового обслуживания с учетом процессов Split-Join»

ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА

УДК 519.64; 004.75; 004.94 DOI: 10.17586/0021-3454-2019-62-5-419-423

МЕТОД РАСЧЕТА ДЛИТЕЛЬНОСТИ ОБРАБОТКИ ЗАДАЧ В СИСТЕМЕ МАССОВОГО ОБСЛУЖИВАНИЯ С УЧЕТОМ ПРОЦЕССОВ SPLIT-JOIN

Ю. И. Рыжиков1,2, В. А. Лохвицкий2, Р. С. Хабаров2

1 Санкт-Петербургский институт информатики и автоматизации РАН, 199178, Санкт-Петербург, Россия

2Военно-космическая академия им. А. Ф. Можайского, 197198, Санкт-Петербург, Россия

E-mail: xabarov.r@yandex.ru

Предложен метод расчета длительности обработки исходной заявки в многоканальной системе массового обслуживания с учетом разделения заявки на независимые подзадачи и их параллельной обработки с последующим объединением результатов. Длительность указанного процесса представляется как распределение максимума случайных длительностей выполнения подзадач. Начальные моменты искомого распределения определяются путем численного интегрирования по полуоси с весом Чебышева — Лагерра; результаты расчетов сопоставляются с полученными при имитационном моделировании.

Ключевые слова: распределенная обработка данных, параллельные запросы, процесс обслуживания Split-Join, распределение максимума случайных величин, численное интегрирование по Чебышеву — Лагерру

Введение. Эффективность функционирования распределенных информационно-вычислительных систем определяется многими факторами, в том числе возможностями декомпозиции целевой задачи и параллельного выполнения подзадач. Примерами параллельного выполнения подзадач являются технология параллельных запросов в реляционных системах управления базами данных [1], поточная обработка больших данных на основе модели организации распределенных вычислений MapReduce [2] и др.

Подобный процесс разделения задачи на подзадачи с параллельным их выполнением и последующим объединением результатов называется Split-Join [3]. Общее время выполнения такой задачи определяется длительностью этапов ее декомпозиции и объединения результатов, а также временем решения самой трудоемкой из подзадач.

Процессам Split-Join посвящено множество публикаций [4—14]. Так, в работе [7] получено точное решение по определению максимума времени обслуживания независимых каналов с экспоненциальным распределением времени и различной интенсивностью, а также аппроксимации для случая общего распределения. В работе [8] упомянутое распределение получено для гомогенных и гетерогенных серверов, причем представление его в матрично-экспоненциальной форме позволяет найти как первый момент, так и моменты высших порядков. Указанный способ, однако, характеризуется высокой вычислительной сложностью, что обусловлено входящими в него трудоемкими операциями обращения и кронекеровым произведением матриц. Применение кронекеровой алгебры связано со значительным дополнительным расходом памяти, а также множеством избыточных операций с нулевыми операндами.

Таким образом, актуальность разработки эффективных методов расчета моментов распределения времени обслуживания заявок в системе массового обслуживания (СМО) с учетом процессов Split-Join не вызывает сомнений.

Суть метода. Требуется рассчитать начальные моменты распределения длительности обслуживания заявки в СМО с учетом ее разделения на N задач с последующим объединением результатов. Искомые моменты {gm} могут быть выражены через дополнительную функ-

_*

цию распределения (ДФР) F максимального времени облуживания задач. Поэтому практический расчет целесообразно вести согласно следующему выражению:

ю ю ю

gm = JtmdF(t) = mJtm-1F(t)dt = Jtm-1(1-F*(t))dt, m = 1Д (1)

0 0 0

*

где F (t) — функция распределения максимума случайной величины, которая определяется как

N

F *(t) = П Fr (t).

i=1

Здесь F (t), i = 1, N, — функция распределения времени обработки i-й задачи. Тогда

<х>

gm =J tm-1(F*(t))dt, m = 1,3, (2)

0

_*

где F (t) — ДФР максимума времени обслуживания заявки с использованием Split-Join.

Поскольку интеграл (2) может не иметь аналитического представления, воспользуемся

формулой для численного интегрирования по полуоси с весом Чебышева — Лагерра [15]:

ю п

J xVxf (x)dx Akf (Xk),

0 k=1

где абсциссы [xk}, k = 1,n, являются корнями многочлена L(nS\x) = 0, здесь

LS)( x) = ( -1)nx-sexdn ( x( s+n) e-x ), dx

а коэффициенты {Ak}, k = 1, n, определяются согласно выражению

n !T(s + n +1)

Ak =

(4s)) (xk)

хк

где Г — гамма-функция.

Для {Хк} и |Ак | при различных значениях э и п существуют справочные таблицы [15].

_*

Заменим обозначение х на V и представим функцию /(V) как ^ (V)в1. Тогда выражение (2) для gm примет следующий вид:

= т^АкТ*(1к)ек, т = 1,2,... (3)

к=1

Степень вычисляемого момента можно учесть как отдельно (выбором таблицы для соответствующего э), так и унифицированным методом, включив степенной множитель в интегрируемую функцию:

gm = т^т~ХАкр\гкУк, т = 1,2,... (4)

к =1

2

Экспериментальная проверка точности метода. Проверку точности разработанного численного метода выполним с помощью имитационного моделирования (ИМ) на основе следующих исходных данных:

— заявка разделяется на 3 подзадачи;

— случайная длительность выполнения каждой задачи задана ^-распределением с параметрами y1 = 0,3, y2 = 0,7, = 0,15, = 0,7 .

Для нахождения моментов методом ИМ был произведен 1 млн испытаний. На каждом шаге генерировались подряд три случайные величины с гиперэкспоненциальной функцией распределения при указанных выше параметрах. Выбиралась максимальная из реализаций, после чего происходило накопление моментов времени обслуживания.

Расчеты производились по формулам (3) и (4); сопоставление результатов, полученных при расчете и при имитационном моделировании, показано в таблице.

Начальные моменты ИМ Расчет

с умножением на tk с использованием s=1, 2

f А А, % f А А, %

fx 6,264-10 6,239-10 2,493-10-2 3,980-10-1 6,239-10 2,493-10-2 3,980-10-1

f2 7,864-101 7,648-Ю1 2,160-10 2,747-10 7,697-Ю1 1,670-10 2,124-10

f3 1,561-103 1,412-103 1,484-102 9,512-10 1,463-103 9,782-101 6,268-10

Погрешность А вычислялась по отношению к результатам ИМ. Заметим, что результат ИМ не является 100 %-ным эталоном, поскольку датчики равномерно распределенных чисел не идеальны, а конечные результаты содержат статистическую погрешность.

Как видно из таблицы, результаты расчетов хорошо согласуются с результатами имитационного моделирования. При этом хотя несколько меньшую погрешность показывает расчет с использованием дополнительных таблиц для s = 1, 2, унифицированный метод расчета моментов по формуле (4) представляется более удобным для практического применения.

Заключение. Разработанный метод позволяет рассчитать начальные моменты распределения максимума случайных величин и может использоваться для определения времени обслуживания заявки в СМО с учетом процессов Split-Join. Метод обладает сравнительно невысокой вычислительной сложностью при достаточной для практического применения точности получаемого решения.

В дальнейшем предложенный метод предполагается использовать для представления исходной многоканальной системы типа GI/G/n с учетом процесса Split-Join в виде однока-нальной СМО типа GI/G/1 с распределением времени обслуживания на основе максимума случайных длительностей выполнения подзадач. Последующий расчет такой системы может быть выполнен известными методами [16].

Исследования, выполненные по данной тематике, проводились при финансовой поддержке бюджетной темы № 0073-2018-0004.

список литературы

1. Кайт Т. Oracle для профессионалов: архитектура, методики программирования и особенности версий 9i, 10g и 11g: Пер. с англ. М.: Изд. дом „Вильямс", 2011. 848 с.

2. Dean J., Ghemawat S. MapReduce: Simplified Data Processing on Large Clusters. San Francisco, CA, 2004. P. 1—13.

3. Шрайбер Т. Дж. Моделирование на GPSS. М.: Машиностроение, 1980. 592 с.

4. Olvera-Cravioto M., Ruiz-Lacedelli O. Parallel Queues with Synchronization [Электронный ресурс]: <https://arxiv.org/pdf/1501.00186.pdf>, 2014.

5. Flatto L., Hahn S. Two parallel queues created by arrivals with two demands // SIAM Journal on Appl. Math. 1979. Vol. 44. P. 1041—1053.

6. Wright P. E. Two parallel processors with coupled inputs // Advances in Appl. Probability. 1992. Vol. 24. P. 986—1007.

7. Harrison P. G., Zertal S. Queueing models with maxima of service times // Proc. of Intern. Conf. on Modelling Techiniques and Tools for Computer Performance Evaluation, Urbano, IL, USA. 2003. P. 152—168.

8. Fiorini P., Lipsky L. Exact analysis of some split-merge queues // Performance Evaluation Rev. 2015. Vol. 43, N 2. P. 51—53.

9. Baccelli F. Two parallel queues created by arrivals with two demands. The M/G/2 symmetrical case // Tech. Rep. INRIA-Rocquencourt. 1985. N 426.

10. Baccelli F., Makowski A. M., Shwartz A. The fork-join queue and related systems with synchronization constraints // Advanced in Appl. Probability. 1989. Vol. 21. P. 629—660.

11. Nelson R., Tantawi A.N. Approximate analysis of fork/join synchronization in parallel queues // IEEE Transact. on Computers. 1988. Vol. 37. P. 739—743.

12. Qiu Z., Perez J.G., Harrison P. G. Beyond the mean in fork-join queues: Efficient approximation for response-time tails // Performance Evaluations. 2015. Vol. 91. P. 99—106.

13. Wang Р., Li J., Shen Z., Zhou Y. Approximations and Bounds for (n, k) Fork-Join Queues: A Linear Transformation Approach // Proc. of the 18th IEEE/ACM Intern. Symp. on Cluster, Cloud and Grid Computing (CCGRID), Washington, DC, USA, 2018.

14. Alomari F., Menasce D. A. Efficient response time approximation for multiclass fork and join queues in open and closed queueing networks // IEEE Transact. on Parallel and Distributed Systems. 2014. Vol. 25. P.1437—1446.

15. Крылов В. И., Шульгина Л. Т. Справочная книга по численному интегрированию. М.: Наука, 1966. 372 с.

16. Рыжиков Ю. И. Алгоритмический подход к задачам массового обслуживания. Монография. СПб: ВКА им. А. Ф. Можайского, 2013. 496 с.

Юрий Иванович Рыжиков

Владимир Александрович Лохвицкий Роман Сергеевич Хабаров

Поступила в редакцию 27.08.18 г.

Сведения об авторах

— д-р техн. наук, профессор; СПИИРАН, лаборатория информационных технологий в системном анализе и моделировании; ВКА им. А. Ф. Можайского, кафедра математического и программного обеспечения; E-mail: ryzhbox@yandex.ru

— докторант; ВКА им. А. Ф. Можайского, кафедра математического и программного обеспечения; E-mail: lokhv_va@mail.ru

— адъюнкт; ВКА им. А. Ф. Можайского кафедра математического и программного обеспечения; E-mail: xabarov.r@yandex.ru

Ссылка для цитирования: Рыжиков Ю. И., Лохвицкий В. А., Хабаров Р. С. Метод расчета длительности обработки задач в системе массового обслуживания с учетом процессов Split-Join // Изв. вузов. Приборостроение. 2019. Т. 62, № 5. С. 419—423.

METHOD OF CALCULATING TASK TREATMENT DURATION IN QUEUEING SYSTEM WITH CONSIDERATION OF SPLIT-JOIN PROCESSES

Yu. I. Ryzhikov1,2, V. A. Lokhvitsky2, R. S. Khabarov2

1St. Petersburg Institute for Informatics and Automation of the RAS, 199178, St. Petersburg, Russia 2Mozhaisky Military Space Academy, 197198, St. Petersburg, Russia E-mail: xabarov.r@yandex.ru

A method is proposed for calculating the processing time of initial task in multi-channel queueing system with consideration of the task separation into independent subtasks that are treated parallelly with further assembling of the results. The process duration is represented as the distribution of the maximum from the random durations of the subtasks processing. The starting moments of the desired distribution

are found by numerical integration along the semi-axis with the Chebyshev-Laguerre weight. Results of

numerical calculations are compared with data obtained by simulations.

Keywords: distributed data processing, concurrent requests, Split-Join service process, distribution

of maximum of random variables, numerical integration by Chebyshev-Laguerre

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

REFERENCES

1. Kyte Th. Expert Oracle Database Architecture: Oracle Database Programming 9i, 10g, and 11 g, Techniques and Solutions Apress Berkely, CA, 2010.

2. Dean J., Ghemawat S. MapReduce: Simplified data processing on large clusters, San Francisco, CA, 2004, pp. 1-13.

3. Schriber T.J. Simulation Using GPSS, NY, Wiley, 1974.

4. Olvera-Cravioto M., Ruiz-Lacedelli O. Parallel queues with synchronization, <https://arxiv.org/pdf/1501.00186.pdf>, 2014.

5. Flatto L., Hahn S. SIAM Journal on Appl. Math., 1979, vol. 44, pp. 1041-1053.

6. Wright P.E. Advances in Applied Probability, 1992, vol. 24, pp. 986-1007.

7. Harrison P.G., Zertal S. Proc. of Intern. Conf.on Modelling Techiniques and Tools for Computer Performance Evaluation, Urbano, IL, USA, 2003, pp. 152-168.

8. Fiorini P., Lipsky L. Performance Evaluation Rev., 2015, no. 2(43), pp. 51-53.

9. Baccelli F. Tech. rep. INRIA-Rocquencourt, 1985, no. 426.

10. Baccelli F., Makowski A.M., Shwartz A. Advanced in Applied Probability, 1989, vol. 21, pp. 629-660.

11. Nelson R., Tantawi A.N. IEEE Transact. on Computers, 1988, vol. 37, pp. 739-743.

12. Qiu Z., Perez J.G., Harrison P.G. Performance Evaluations, 2015, vol. 91, pp. 99-106.

13. Wang P., Li J., Shen Z., Zhou Y. Approximations and Bounds for (n, k) Fork-Join Queues: A Linear Transformation Approach, Proceedings of the 18th IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing (CCGRID), Washington, DC, USA, 2018.

14. Alomari F., Menasce D.A. IEEE Transact. on Parallel and Distributed Systems, 2014, vol. 25, pp. 1437-1446.

15. Krylov V.I., Shul'gina L.T. Spravochnaya kniga po chislennomu integrirovaniyu (Reference Book on Numerical Integration), Moscow, 1966, 372 p. (in Russ.)

16. Ryzhikov Yu.I. Algoritmicheskiy podkhod k zadacham massovogo obsluzhivaniya (Algorithmic Approach to Queuing Tasks), St. Petersburg, 2013, 496 p. (in Russ.)

Data on authors

Yuriy I. Ryzhikov

Vladimir A. Lokhvitsky Roman S. Khabarov

For citation: Ryzhikov Yu. I., Lokhvitsky V. A., Khabarov R. S. Method of calculating task treatment duration in queueing system with consideration of Split-Join processes. Journal of Instrument Engineering. 2019. Vol. 62, N 5. P. 419—423 (in Russian).

DOI: 10.17586/0021-3454-2019-62-5-419-423

Dr. Sci., Professor; St. Petersburg Institute for Informatics and Automation of the RAS, Laboratory of Information Technologies in System Analysis and Modeling; Mozhaisky Military Space Academy, Department of Mathematics and Software; E-mail: ryzhbox@yandex.ru Doctoral Student; Mozhaisky Military Space Academy, Department of Mathematics and Software; E-mail: lokhv_va@mail.ru Adjunct; Mozhaisky Military Space Academy, Department of Mathematics and Software; E-mail: xabarov.r@yandex.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.