Научная статья на тему 'Анализ некоторых характеристик СМО m|g|1|r с гистерезисным управлением для исследования перегрузок SIP-сервера'

Анализ некоторых характеристик СМО m|g|1|r с гистерезисным управлением для исследования перегрузок SIP-сервера Текст научной статьи по специальности «Математика»

CC BY
185
35
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
SIP-СЕРВЕР / ПОРОГОВОЕ УПРАВЛЕНИЕ / THRESHOLD CONTROL / ПОЛУМАРКОВСКИЙ ПРОЦЕСС / SEMI-MARKOV PROCESS / ВРЕМЯ ВОЗВРАТА ИЗ РЕЖИМА ПЕРЕГРУЗКИ / RETURN TIME / SIP-SERVER / FINITE-CAPACITY QUEUE

Аннотация научной статьи по математике, автор научной работы — Гайдамака Юлия Васильевна, Закирова Рената Илгизаровна

В современных телекоммуникационных сетях существует ряд задач, среди которых выделяют задачу поиска наиболее эффективного механизма управления перегрузками на SIP-серверах. В общем случае перегрузки связаны с тем, что интенсивность поступления вызовов на SIP-сервер превышает возможности по их обработке. Проблемы такого рода могут привести к снижению производительности SIP-сервера, а также могут быть причиной его полного отказа. В стандартах комитета IETF в зависимости от типа перегрузок выделяют ряд решений проблемы, среди которых: увеличение числа SIP-серверов, механизм 503, метод просеивания потока, метод снижения скорости. Однако оптимального решения для управления перегрузок на SIP-сервере не найдено. В работе предлагается упрощённый механизм контроля перегрузок, который позволяет осуществить управление интенсивностью поступления вызовов на SIP-сервер путём ввода порога снижения нагрузки. Разработана упрощённая математическая модель в виде системы массового обслуживания типа M|G|1|r с пороговым управлением нагрузкой. Получено стационарное распределение вероятностей состояний системы методом вложенных цепей Маркова. Описан алгоритм для расчёта вероятностно-временных характеристик, таких как вероятность потери заявки, средняя длина очереди модели, время возврата из режима перегрузки в режим нормальной нагрузки. Численно решена оптимизационная задача, которая заключается в минимизации данной характеристики, проведён эксперимент, а также численный анализ полученных результатов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Гайдамака Юлия Васильевна, Закирова Рената Илгизаровна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Analysis of a Finite-Capacity M|G|1|r Queue with Threshold Overload Control

One of the main challenges faced by telecommunications industry today is an issue of searching for the most effective overload control mechanisms on SIP servers. Generally, overload occurs in SIP networks when SIP servers have insufficient resources to handle all SIP messages they receive to handle all incoming SIP traffic. Such problems can decrease performance of SIP server or even cause its crash. The IETF offers several solutions depending on types of overloads: to increase the number of SIP servers, through 503 (Service Unavailable) response code (IETF RFC 3261), rate-based overload control, loss-based overload control. However, SIP servers are still vulnerable to overload. In this paper we have built and analyzed the M|G|1|r queue with one level hysteretic input load control. Stationary distribution has been achieved based on the Embedded Markov chain method. Approach that allows computation of probability of loss and an average length of queue is developed. Another important parameter, the return time from overloading states to normal state is also considered. A numerical example illustrating the control mechanism that minimizes this characteristic is given to demonstrate some optimization issues.

Текст научной работы на тему «Анализ некоторых характеристик СМО m|g|1|r с гистерезисным управлением для исследования перегрузок SIP-сервера»

УДК 621.39

Анализ некоторых характеристик СМО М|G|1|r с гистерезисным управлением для исследования перегрузок

SIP-сервера

Ю. В. Гайдамака, Р. И. Закирова

Кафедра систем телекоммуникаций Российский университет дружбы народов ул. Миклухо-Маклая, д. 6, Москва, Россия, 117198

В современных телекоммуникационных сетях существует ряд задач, среди которых выделяют задачу поиска наиболее эффективного механизма управления перегрузками на SIP-серверах. В общем случае перегрузки связаны с тем, что интенсивность поступления вызовов на SIP-сервер превышает возможности по их обработке. Проблемы такого рода могут привести к снижению производительности SIP-сервера, а также могут быть причиной его полного отказа.

В стандартах комитета IETF в зависимости от типа перегрузок выделяют ряд решений проблемы, среди которых: увеличение числа SIP-серверов, механизм 503, метод просеивания потока, метод снижения скорости. Однако оптимального решения для управления перегрузок на SIP-сервере не найдено.

В работе предлагается упрощённый механизм контроля перегрузок, который позволяет осуществить управление интенсивностью поступления вызовов на SIP-сервер путём ввода порога снижения нагрузки. Разработана упрощённая математическая модель в виде системы массового обслуживания типа М|G|1|r с пороговым управлением нагрузкой. Получено стационарное распределение вероятностей состояний системы методом вложенных цепей Маркова. Описан алгоритм для расчёта вероятностно-временных характеристик, таких как вероятность потери заявки, средняя длина очереди модели, время возврата из режима перегрузки в режим нормальной нагрузки. Численно решена оптимизационная задача, которая заключается в минимизации данной характеристики, проведён эксперимент, а также численный анализ полученных результатов.

Ключевые слова: SIP-сервер, пороговое управление, полумарковский процесс, время возврата из режима перегрузки.

1. Введение

Вследствие высокой популярности услуг в телекоммуникационной сети, архитектура которой поддерживает протокол SIP, могут возникать перегрузки, связанные с тем, что интенсивность поступления вызовов на SIP-сервер превышает возможности по их обработке. Перегрузки можно разделить на две категории: сервер - клиент и сервер - сервер. Проблема перегрузок типа клиент - сервер может решиться увеличением числа SIP-серверов, для контроля перегрузок типа сервер - сервер существует несколько механизмов. Так, спецификация RFC 3261 [1] описывает механизм 503, который в случае, когда сервер не может обработать запрос, предусматривает передачу уведомляющего об этом сообщения 503 Service Unavailable серверу-отправителю. Кроме того, выделяют три типа управления:

— механизм сквозного управления, который предусматривает сбор информации по маршруту о состоянии всех узлов и ограничение поступающей по маршруту нагрузки как можно ближе к источнику;

— механизм межузлового управления, который осуществляет контроль перегрузок только между соседними узлами [2-4];

Статья поступила в редакцию 25 ноября 2013 г.

Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта №12-07-00108.

Авторы выражают благодарность профессору Самуйлову К. Е. за внимание к работе и ряд важных замечаний, а также ассистенту кафедры систем телекоммуникаций Сопину Э. С. за помощь в проведении исследований.

— механизм локального контроля перегрузок, который предполагает, что сервер на основе мониторинга текущего уровня использования своих ресурсов принимает решение о сбросе части нагрузки.

В статье построен пороговый механизм межузлового управления нагрузкой. Статья организована следующим образом. В разделе 2 построена упрощённая математическая модель процесса обработки сообщений БГР-сервером в терминах теории массового обслуживания. В разделе 3 получено стационарное распределение вероятностей для рассматриваемой модели. Раздел 4 содержит описание вероятностно-временных характеристик, таких как вероятность потери заявки, средняя длина очереди, время возврата из режима перегрузки в режим нормальной нагрузки. Агоритм для расчёта вероятностно-временных характеристик приведен в разделе 5 статьи. В разделе 6 рассматривается пример численного анализа.

2. Описание математической модели

Рассматривается однолинейная система массового обслуживания (СМО), состоящая из одного обслуживающего прибора, буферного накопителя ёмкости г с порогом снижения перегрузки Ь (рис. 1). Поток заявок, поступающих на прибор, является пуассоновским с интенсивностью Л. Если поступающая заявка застаёт прибор свободным, она немедленно начинает обслуживаться, в противном случае заявка занимает место в накопителе. В случае, если мест в накопителе нет, заявка теряется. Длительность обслуживания является случайной величиной (СВ) с произвольной функцией распределения (ФР) В(х) и средним < оо.

г Ь В (х)

Рис. 1. СМО с пороговым управлением нагрузкой

Порог снижения перегрузки Ь служит для предотвращения частых переключений между режимами функционирования системы — режимом нормальной нагрузки и режимом перегрузки. В случае, когда длина очереди п в буфере достигает значения г, система переходит в режим перегрузки. Возврат в нормальный режим функционирования происходит не сразу, а при снижении длины очереди до значения Ь. Описанный механизм относится к механизмам гистерезисного (порогового) управления перегрузкой и является частным случаем механизма из [5], где исследована СМО М\М|1|г с несколькими группами порогов.

На рис. 2 показана зависимость входящего потока заявок от длины очереди, что отражает описанный выше механизм гистерезисного управления.

„ а = о ^

Ч * * \ 4 а=1 \ \ \ —*-►

Ь -1 Ь

г -1

Рис. 2. Гистерезисное управление нагрузкой

Множество состояний СМО (рис. 1) с интенсивностью входящего потока \(й, п) (рис. 2) представляет собой объединение двух множеств: X = Хо и Х1, где Хо = {(ё,п) : ё =0, 0 ^ п ^ г — 1} — множество состояний нормальной нагрузки, Х1 = {(й,п) : (I = 1, Ь ^ п ^ г} — множество состояний перегрузки.

Л

0

п

г

Введём случайный процесс (СП) £(t) — число заявок в СМО в момент времени t. Пусть tk, к ^ 0, — моменты ухода заявок из системы [6]. Обозначим = £,(tk + 0), тогда последовательность , к ^ 0} образует вложенную цепь Маркова (ЦМ).

Введём стационарное распределение СП £(t) и ЦМ , к > 0}: PdJ = lim Р{£(t)= j}, j = 0,... ,r + 1, d G{0,1},

i—^^o

qdJ = lim P{Z(tk + 0)= j}, j = 0,... ,r, d G{0,1}. i—

Получение аналитических формул для стационарных вероятностей состояний СП £ (t) позволит находить основные вероятностно-временные характеристики системы, такие как вероятность потери заявки, средняя длина очереди, среднее время нахождения системы в множествах Х° и Х\ [7].

3. Стационарное распределение вероятностей

Построим граф переходных вероятностей для ЦМ , к ^ 0} (рис. 3), и для нахождения стационарных вероятностей СП £(£) воспользуемся методом, предложенным в [8].

ß

ß

1,L ) (1 ,L+1 ) ( 1,r-^) 1,r 1111 Рис. 3. Граф переходных вероятностей ЦМ , к ^ 0}

Нетрудно убедиться, что стационарное распределение {qa,j }f=o°'.!r имеет вид

q°,j = q°,°kj, j = 0,... ,L - 1, q°,j = q°,°(kj - a!q°t°), j = L,...,r - 1, qi,r = a\q°,°,

где kj и hj вычисляются по рекуррентным формулам

(1)

1

kj = -1 (kj-! - ßj-i bßi-i

k0 = 1, ki =

j-1

1 - ßo

ßo ;

(2)

j = 2,... ,L - 1,

1 1 / j

ho = i, hj = — i hj-i - hi-ißj-i+1

ßo

al =

i=i / r— l

ar + Y^ h^r—i+i

_i=l_

r— i

1 + X} hi — Lttr—i+l

i=L

1

Q0,0 = ~i r—l •

X kj + ai X hj—l + (r - L + 1)ai

j = 1,...,r - L - 1, (3)

(4)

-. (5)

j=o

= L

Отметим, что од — вероятность поступления в СМО не менее, чем I заявок за случайное время наблюдения, распределённое в соответствии с функцией распределения В(х),

сю

ai = У (1 — В(х)) exp

\i „i—i с —Хх АХ dx, I > 1, £ ai = Xb(l).

(I - 1)!

i=i

При этом — вероятность поступления в СМО ровно I заявок за случайное время наблюдения, распределённое в соответствии с функцией распределения В (х),

^ сю

А = [ ехр-Лж ^<1х, I > 1, £ Рг = 1,

I ' 1=0

а соотношение величин ai и ßi определяется в виде ai+l = 1 - X ßj, ^ ^ 0.

0=0

Однако для практических целей интерес представляют стационарные вероятности по времени P^j = lim Р{£(t) = j}, d G {0,1}, поскольку именно эти

' t—

вероятности определяют распределение очереди в момент поступления заявки в систему.

Введём величину С — цикл восстановления, который определяется по формуле [9]

11

С = (^ + b(l^ qo,o + (1 - qo,o) b(l) = b(l) + ^qo,o.

(6)

В результате получаем стационарное распределение вероятностей СП через стационарное распределение вероятностей ЦМ к > 0}:

Po,o = p0,j =

С

-1

Л

С—l X

Qo,o,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

min(j,r — l)

qo,o aj + Qo,i aj—i+i

=1

j = 1,...,r,

P^

С

-l

l,r + l

qo,o

(r \ r—l /

\b(l) - g aj + g i

r—i+l ^

Xb(l) - £ од i=l /

Pl>3 = С (—l)b(l)qlr, j = L,...,r.

А

4. Вероятностно-временные характеристики

Зная стационарное распределение вероятностей Р'^, можно рассчитать такие вероятностно-временные характеристики (ВВХ) системы, как средняя длина очереди в режиме нормальной нагрузки и в режиме перегрузки, соответственно, (^о и ^х, и вероятность потери заявки ж:

г— 1 г

Яо = £ зРо,3, Ях = £ зРх,3,

3=1 3=Ь

г+1

ж = Р(Хх) = £ Рх,3 = Рх,г+1 + (г — Ь + 1)С —1Ь(1)дх>г.

3 = Ь

Ещё одной важной характеристикой является время возврата. Данная характеристика определяется как среднее время возврата из множества состояний перегрузки (множество Х1) в множество состояний нормальной нагрузки (множество Хо) [5], и представляет собой интервал от момента первого попадания в состояние (1,г) множества перегрузки до момента первого выхода из множества состояний перегрузки в состояние (0, Ь — 1) нормальной нагрузки. Среднее время возврата т вычисляется по формуле

г = — ^'(8)18=о, (8)

где

<р(з) = Рг—ь+1(з). (9)

Здесь (р(в) — преобразование Лапласа-Стилтьеса (ПЛС) ФР времени возврата, а р(в) — ПЛС ФР В(х).

С учётом (9) формула (8) для расчёта среднего времени возврата будет иметь вид:

т = (г — Ь + 1)Ь(1). Дисперсия среднего времени возврата рассчитывается по формуле

Бт = (г —

5. Алгоритм расчёта вероятностно-временных характеристик

На основании полученных выше формул алгоритм вычисления стационарного распределения сводится к следующим шагам.

ТТТяг 1. Вычисление а^, ^, ] = 0,...,г. Алгоритм вычисления данных величин зависит от вида соответствующих функций распределения. Величины ^, ] ^ 0 связаны с ПЛС /3(в) следующим соотношением:

Рз = (—тР(Л(Х), 3 > 0,

которое при явном задании функции В(х) даёт возможность получить расчётные формулы.

ТТТяг 2. Вычисление величин к^, Н^, ] ^ 0 по формулам (2), (3). ТТТяг 3. Вычисление величины «4 по формуле (4).

ТШаг 4. Вычисление стационарных вероятностей {qdj}'j=о0'1\ по формулам

(5) и (1). ' "'"

ТТТаг 5. Вычисление величины С по формуле (6).

ШШаг 6. Вычисление стационарных вероятностей [Ра^ }^=1°,1}.+1 по формулам (7).

6. Пример численного анализа

Рассмотрим пример, где время обслуживания распределенно по экспоненциальному закону В(х) = 1 — ехрПЛС $(з) = —-—, а время возврата для моде- + 8

ли типа М\М|1|г с пороговым управлением нагрузкой имеет вид т = (г — Ь+1)—-1.

Перейдём к численному анализу времени возврата. В качестве исходных данных использовались значение поступающей нагрузки р = 1, 2, среднее время обслуживания сообщений --1 =5 мс и объём буферного накопителя г = 150.

Решается оптимизационная задача, которая заключается в нахождении таких значений порога Ь снижения перегрузки, для которых время возврата т было бы минимальным, с учётом двух ограничений.

Первое ограничение накладывается на вероятность к попадания в множество состояний перегрузки. Как видно из рис. 4, при условии к < 0, 2 порог Ь принимает значение от 1 до 150, что соответствует тому, что при выбранном диапазоне значений порога Ь система будет находиться в режиме перегрузки менее 20% от среднего времени цикла.

ш СО

Порог снижения перегрузки, Ь

Рис. 4. Зависимость вероятности ж от порога Ь

Второе ограничение определяется как условие, накладываемое на среднее время цикла управления тобщ, которое представляет собой средний интервал от момента попадания процесса в множество Х° состояний нормальной нагрузки из множества Х1 состояний перегрузки до момента следующего попадания процесса в множество Х° из множества Х1. Для избежания осцилляций системы между состояниями нормальной нагрузки и состояниями перегрузки время общ следует максимизировать.

Времена тобщ и т связаны следующим соотношением:

= + Р (Х°) = г

тобщ = т + Тр (Х1) = р (Х1).

В рассмотренном примере второе ограничение имеет вид гобщ ^ 0,45 с. Заметим, что значение 0,45 с в данном случае выбрано для иллюстрации метода, а при расчёте реальных систем должно удовлетворять требованиям международных стандартов.

Как видно из рис. 5, накладываемому ограничению соответствует диапазон значений порога Ь € (1;136).

со

0

к

S

1

ф

т го

I

I

ч

ф

ср

О

! I I : I \ I

врем я цик ла,

Среднее общ

Среднее время пребыван режиме перегрузки, ия в X

0. 45 с

..... i Г"4 —1

О 20 40 60 80 100 120 140

Порог снижения перегрузки, L

Рис. 5. Зависимость среднего времени возврата тобщ от порога L

Построив график зависимости среднего времени возврата т относительно выбора порога L £ (1; 136), получили решение оптимизационной задачи: т(136) = 0,075 с. Таким образом, минимальное время 0, 075 с пребывания системы в множестве состояний перегрузки достигается при значении порога L = 136.

160

ф

н

m о s 140

р к

у з

s у р 120

р г

п Ф

s ч: Ф р Ф п \о 100

р я 80

Ф S

т н II

о ф

а н ií S 60

н

с; : с а 40

я го

я н р о 20

: п

Ф

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

р О 0

12 3 4

Поступающая нагрузка, р

Рис. 6. Зависимость средней длины очереди при пороге снижения нагрузки

Ь = 136 от поступающей нагрузки

Далее для порога снижения перегрузки Ь =136 построен график зависимости средней длины очереди Q от поступающей нагрузки р (рис. 6). Перегиб на графике при р = 1,1 объясняется тем, что в этот момент система переходит в режим перегрузки. При увеличении значений р средняя длина очереди в режиме нормальной нагрузки убывает, поскольку вероятности пребывания системы в состояниях множества нормальной нагрузки падают. Аналогично средняя длина очереди в режиме перегрузки растёт. Таким образом, средняя длина очереди при заданных значениях г = 150, Ь = 136, р =1, 2 принимает значение = 138.

Задачей дальнейших исследований может стать построение и анализ модели с несколькими группами порогов, а также исследование сквозного механизма управления перегрузками БГР-серверов.

Литература

1. Rosenberg J., Schulzrinne H., Camarilla G. et al. RFC 3261 — SIP: Session Initiation Protocol. — 2002. — http://www.ietf.org/rfc/rfc3261.txt.

2. Hilt V., Noel E., Shen C., Abdelal A. Design Considerations for Session Initiation Protocol (SIP) Overload Control. — 2011. — http://tools.ietf.org/html/ rfc6357.

3. Hilt V. Session Initiation Protocol (SIP) Overload Control. — 2012. — http:// tools.ietf.org/html/draft-ietf-soc-overload-control-11.

4. Williams P. M. Session Initiation Protocol (SIP) Rate Control // IETF. — 2012. — http://tools.ietf.org/html/ draft-ietf-sipcore-event-rate-control-09.

5. Абаев П. О., Гайдамака Ю. В., Самуилов К. Е. Гистерезисное управление нагрузкой в сети SIP-серверов. // Вестник РУДН. Серия «Математика. Информатика. Физика». — 2011. [Abaev P. O., Gaidamaka Yu. V., Samouylov K. E. Load Control technique with Hysteresis in SIP Signaling Server. — Moscow: PFUR, 2011. — (in russian). ]

6. Бочаров П. П., Печинкин А. В. Теория массового обслуживания. — М.: РУДН, 1995. [Bocharov P.P., Pechinkin A. V. Queueing Theory. — M.: PFUR, 1995. — (in russian). ]

7. Вентцель Е. С., Овчаров Л. А. Теория случайных процессов и ее инженерные приложения. — М.: Наука, 1990. [Ventsel' E.S., Ovcharov L.A. The Theory of Stochastic Processes and its Engineering Applications. — Moscow: Nauka, 1990. — (in russian). ]

8. Takagi H. Analysis of a Finite-Capacity M/G/1 Queue with a Resume Level // Perform. Eval. — 1985. — Vol. 5, No 3. — Pp. 197-203.

9. Ивченко Г. И., Каштанов В. А., Коваленко И. Н. Теория массового обслуживания. — М.: Высшая школа, 1982. [Ivchenko G. I., Kashtanov V. A., Kovalenko I. N. Queueing Theory. — Moscow: Vysshaya Shkola, 1982. — (in russian). ]

UDC 621.39

Analysis of a Finite-Capacity M|G|1|r Queue with Threshold

Overload Control Y. V. Gaidamaka, R. I. Zakirova

Telecommunication Systems Department Peoples' Friendship University of Russia 6, Miklukho-Maklaya str., Moscow, Russia, 117198

One of the main challenges faced by telecommunications industry today is an issue of searching for the most effective overload control mechanisms on SIP servers. Generally, overload occurs in SIP networks when SIP servers have insufficient resources to handle all SIP messages they receive to handle all incoming SIP traffic. Such problems can decrease performance of SIP server or even cause its crash.

The IETF offers several solutions depending on types of overloads: to increase the number of SIP servers, through 503 (Service Unavailable) response code (IETF RFC 3261), rate-based overload control, loss-based overload control. However, SIP servers are still vulnerable to overload.

In this paper we have built and analyzed the M|G|1|r queue with one level hysteretic input load control. Stationary distribution has been achieved based on the Embedded Markov chain method. Approach that allows computation of probability of loss and an average length of queue is developed. Another important parameter, the return time from overloading states to normal state is also considered. A numerical example illustrating the control mechanism that minimizes this characteristic is given to demonstrate some optimization issues.

Key words and phrases: SIP-server, threshold control, finite-capacity queue, semi-Markov process, return time.

i Надоели баннеры? Вы всегда можете отключить рекламу.