Научная статья на тему 'ПРИМЕНЕНИЕ EM-АЛГОРИТМА ДЛЯ АППРОКСИМАЦИИ ГИПЕРЭКСПОНЕНТАМИ ПЛОТНОСТЕЙ ВЕРОЯТНОСТЕЙ КОРРЕЛИРОВАННОГО ТРАФИКА'

ПРИМЕНЕНИЕ EM-АЛГОРИТМА ДЛЯ АППРОКСИМАЦИИ ГИПЕРЭКСПОНЕНТАМИ ПЛОТНОСТЕЙ ВЕРОЯТНОСТЕЙ КОРРЕЛИРОВАННОГО ТРАФИКА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
48
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
EM-АЛГОРИТМ / РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН / КОРРЕЛЯЦИЯ / АППРОКСИМАЦИЯ / QOS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Буранова М.А., Карташевский И.В.

Точная оценка параметров качества обслуживания в современных инфокоммуникационных сетях является весьма важной задачей. В работе предложено использование гиперэкспоненциальных распределений для решения задачи аппроксимации произвольной плотности вероятностей в системе G/G/1 для случая, когда предполагается аппроксимация системой типа H2/H2/1. Для определения параметров плотности вероятностей гиперэкспоненциального распределения предлагается использовать EM-алгоритм, который дает достаточно простые варианты использования для некоррелированных потоков. В данной работе предложен вариант реализации алгоритма ЕМ для определения параметров гиперэкспоненциального распределения при наличии корреляционных свойств анализируемого потока.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Буранова М.А., Карташевский И.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF EM-ALGORITHM FOR APPROXIMATION OF CORRELATED TRAFFIC PROBABILITIES DENSITY BY HYPEREXPONENTS

An accurate assessment of the quality of service parameters in modern information communication networks is a very important task. This paper proposes the use of hyperexponential distributions to solve the problem of approximating an arbitrary probability density in the G/G/1 system for the case when the approximation by a system of the type H2/H2/1 is assumed. To determine the parameters of the probability density of the hyperexponential distribution, it is proposed to use EM-algorithm that provides fairly simple use cases for uncorrelated flows. In this paper, we propose a variant of the EM algorithm implementation for determining the parameters of the hyperexponential distribution in the presence of correlation properties of the analyzed flow.

Текст научной работы на тему «ПРИМЕНЕНИЕ EM-АЛГОРИТМА ДЛЯ АППРОКСИМАЦИИ ГИПЕРЭКСПОНЕНТАМИ ПЛОТНОСТЕЙ ВЕРОЯТНОСТЕЙ КОРРЕЛИРОВАННОГО ТРАФИКА»

УДК 519.872 DOI:10.31854/1813-324X-2021-7-4-10-17

Применение EM-алгоритма для аппроксимации гиперэкспонентами плотностей вероятностей коррелированного трафика

М.А. Буранова1 *, И.В. Карташевский1 Э

поволжский государственный университет телекоммуникаций и информатики, Самара, 443010, Российская Федерация *Адрес для переписки: buranova-ma@psuti.ru

Информация о статье

Поступила в редакцию 18.09.2021 Поступила после рецензирования 11.10.2021 Принята к публикации 18.10.2021

Ссылка для цитирования: Буранова М.А., Карташевский И.В. Применение ЕМ-алгоритма для аппроксимации гиперэкспонентами плотностей вероятностей коррелированного трафика / / Труды учебных заведений связи. 2021. Т. 7. № 4. С. 10-17. DOI:10.31854/1813-324X-2021-7-4-10-17

Аннотация: Точная оценка параметров качества обслуживания в современных инфокоммуникационных сетях является весьма важной задачей. В работе предложено использование гиперэкспоненциальных распределений для решения задачи аппроксимации произвольной плотности вероятностей в системе G/G/1 для случая, когда предполагается аппроксимация системой типа И2/И2/1. Для определения параметров плотности вероятностей гиперэкспоненциального распределения предлагается использовать EM-алго-ритм, который дает достаточно простые варианты использования для некоррелированных потоков. В данной работе предложен вариант реализации алгоритма ЕМ для определения параметров гиперэкспоненциального распределения при наличии корреляционных свойств анализируемого потока.

Ключевые слова: ЕМ-алгоритм, распределения случайных величин, корреляция, аппроксимация, QoS.

Введение

Традиционно для оценки параметров качества обслуживания используют методы теории массового обслуживания [1], при этом в простейшем случае такие системы представляются математической моделью системы обработки потоков на основе М/М/1, где интервалы времени между пакетами и интервалы длительности пакетов представляют собой последовательности независимых случайных величин с показательными плотностями вероятностей. Учитывая, что трафик современных приложений, обрабатываемый в 1Р-сети, отличается от простейшего потока и обладает фрактальными свойствами [2, 3], системы обработки таких потоков следует описывать моделью 6/6/1. Следует учесть, что для потоков, генерируемых современными приложениями, часто характерно наличие корреляций внутри структур трафика [2, 3].

Использование известных математических подходов для оценки параметров качества обработки трафика современных приложений может привести к ошибочным результатам, потому что большинство подходов по оценке QoS основано на предположении отсутствия корреляций внутри струк-

тур потоков [1, 4-6]. При этом есть многочисленные доказательства того, что для современного трафика характерно наличие корреляционных свойств [7-10]. Это связано с характером формирования потоков, поведением пользователей, агрегированием потоков, сетевым управлением и т. д.

В то же время, работ по оценке параметров функционирования сетей с учетом обработки коррелированных потоков весьма мало, что осложняет возможность получения точных прогнозов функционирования инфокоммуникационных сетей в современных условиях. Существуют некоторые подходы к оценке параметров функционирования с учетом автокорреляции потоков, например, в работах [7-9, 11]. Но представленные подходы не всегда дают требуемую точность и связаны с необходимостью выполнения сложных вычислений.

Одним из возможных вариантов использования методов классической теории массового обслуживания при обработке коррелированного трафика является вариант аппроксимации системы б/б/1 системой Я2/Я2/1 [12], имеющей гиперэкспонен-циально распределенное время поступления и об-

служивания. В [13, 14] было установлено, что применение смеси экспоненциальных распределений являются теоретически обоснованным подходом к моделированию IP-трафика. Получение аппроксимации такого типа возможно при использовании подходов кластерного анализа, например, алгоритма EM (аббр. от англ. Expectation-Maximization), который позволяет определить параметры распределений и число экспонент аппроксимации реальной системы.

Кроме алгоритма EM, существуют и другие подходы по определению параметров экспоненциальных распределений, такие как определение параметров по двум моментам (среднее, дисперсия) исходного распределения для независимых случайных величин [15]. При использовании данного подхода возможно получение аналитических выражений начальных моментов гиперэкспоненциальных распределений до второго порядка.

EM-алгоритм часто применяют в разнообразных задачах оптимизации, он является удобным инструментом реализации итерационной процедуры поиска экстремума целевой функции с использованием численных методов. Такие подходы востребованы при поиске оценок максимального правдоподобия параметров вероятностных моделей в случае, если есть предположение о присутствии в модели скрытых переменных.

EM-алгоритм является весьма эффективным для нахождения аппроксимации наблюдаемых реализаций как одномерных, так и многомерных распределений, но применение EM-алгоритма, как правило, используется для разделения смеси нормальных распределений. Однако в теории очередей чаще всего используется показательное распределение, так как параметры, описывающие поведение трафика в современной IP-сети, являются непрерывными случайными величинами, принимающими неотрицательные значения.

Ранее в работах [6, 15] были представлены подходы по определению параметров гиперэкспоненциальных распределений с использованием EM-алгоритма для систем с некоррелированными реализациями мгновенных значений случайных величин. Применение алгоритма ЕМ в случае наличия корреляционных свойств потока случайных величин вызывает безусловный интерес.

Реализация EM-алгоритма для некоррелированных величин

Основными составляющими при оценке параметров QoS c использованием теории очередей являются следующие случайные величины: интервалы времени между пакетами и длины пакетов обрабатываемого в системе потока. Реализации потоков данных случайных интервалов времени обычно описываются различными распределениями для положительных случайных величин.

Смеси распределений являются весьма эффективным механизмом для описания плотностей распределения вероятностей любой реализации случайной величины в случае, если описание конкретным законом распределения с достаточной точностью вызывает затруднения.

Плотность вероятностей показательного распределения имеет вид:

/(х) = !е-Хх,

где Я - параметр распределения, имеющий смысл интенсивности потока.

Если произвольную плотность вероятностей в системе 6/6/1 на любой позиции в (в данном рассмотрении) обозначить как w(x), то задача аппроксимации w(x) с использованием гиперэкспоненциальных распределений может быть представлена в виде:

w(x) « Нк(х) = fi(x),

(1)

где /¿(х) - функция правдоподобия /-ой компоненты смеси, /¿(х) = Я; е-Я;Ж, р£ > 0 - априорная вероятность:

1.

Для определения параметров гиперэкспоненциальных распределений можно воспользоваться подходом, основанным на использовании ЕМ-алго-ритма [15-17], который может реализовывать получение достоверных оценок максимального правдоподобия для многих приложений, включая оценку параметров плотности смеси.

Будем предполагать, что в выражении (1) вид функций /¿(х) известен, а параметры р^ и Я; неизвестны, совокупность которых обозначим вектором 0 = (р1,- рк; Я1,- Як).

Теперь при разделении смеси (1) будем решать задачу статистического оценивания параметров 0 по известной реализации случайной величины Х -(х1, ••• ,хм). Предполагая независимость значений X;, в рамках модели (1) логарифм функции правдоподобия ¿(0; х) параметра 0 имеет вид [18]:

logL(0; х) = ^Пфе(*/) =

7 = 1

N /К

(2)

_/=1 М=1

Далее, следуя [18], введем в рассмотрение ненаблюдаемую случайную величину У, которая играет роль индикатора выбора компоненты плотности /е!у(х/), где у принимает значения у,- 6 (1,2,...,^) ненаблюдаемой случайной величины У. Другими

к

1=1

1=1

словами, предположим, что в процессе поступления х¡, } = 1,... , реализуется также ненаблюдаемое значение уу 6 (1,2, ...,К).

Рассмотрим теперь совместную плотность случайных величин Х и У, обозначаемую как фе(х,у). С учетом того, что маргинальная плотность величины У равна фе(0 = -¿, I = 1, —,К, для условной плотности случайной величины Х при фиксированном У = I можно записать фе(х|[) = [¿(х; 0;).

Для полной функции правдоподобия, учитывающей присутствие в эксперименте случайной величины У, следует:

\^(0; х,у) = ^^^О^уО =

1=1

N

= ^1^фв(х1,уу) = ^^[^^УуЖСуО] =

1=1

N

= ^\щ\ру.Гу.(ху.; 0у.)] =

1=1

N N

= ^ + ^ ^Гу1(ху{; 0у)

1=1

(3)

1=1

1=1

C учетом вышеприведенных выражений для ф,д( 0 и фв(х^) = [¿(х; 0^) совместная плотность фе(х,у) записывается как:

фе(х,У) = Ру[у(х; 0у^> = ^О^ЖС^Ь

и на основе формулы Байеса для апостериорной вероятности того, что наблюдение х получено в соответствии с распределением, задаваемым компонентой Л, можно получить:

. , . . ф8(х,У) феО|х) = ~Тх-

Ру[у(х; 0у)

фХв(х) ЦМЬ; 01У

Далее, учитывая независимость реализаций Х и У, последняя формула записывается в виде:

N N

феО|х) = ^^ фв(У^) = ^

1=1

1=1

ру}[у} (х1; 0у¡) 1?=М(ху; 01)

(4)

Как показано в [18], если определить условное среднее (по возможным итерациям) логарифма полной функции правдоподобия при известном значении наблюдаемой компоненты X, то максимизация этого условного среднего методом неопределенных множителей Лагранжа дает следующие формулы для формирования оценок максимального правдоподобия на каждой (т)-ой итерации алгоритма:

Р1

(т+1)

N

=-У

N ¿.I

Р^ЛЪ; 0(т))

и^рГт. 0(т)'

(5)

х

(т+1)

У N // \х]Ух] У N ) (Х})

, 1 = 1,., К.

(6)

В формуле (6) учитывается, что при гиперэкспоненциальной аппроксимации ^(х) = Х1 е~Ххх и для модели Н2 (х) оцениванию подлежат только три параметра: р, Х1, Х2, т.к. модель Н2(х) может быть представлена в виде:

д(х;р, Х1, Х2) = рХ1е-х1х + (1 - р)Х2е-х^х.

С введением обозначения д(х; р, Х1, Х2) формулы (5) и (6) могут быть записаны проще:

( т+1)

N

=-У -

N ¿.I

=1

Р^Ш-; ТЫ) д(т)(х])

yN \х])'х]

Х(т+1) = ^ ^ ,

N // \х])

д(т)(х¡)

(7)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(8)

У"=

1

Рассмотренный подход применим для последовательностей с независимыми (в крайнем случае некоррелированными) случайными величинами. В случае наличия корреляции внутри последовательностей необходимо применять другие подходы.

Реализация ЕМ-алгоритма для коррелированных величин

Известно, что при вычислении оценок максимального правдоподобия для ненаблюдаемых параметров априорная информация играет очень важную роль. Для последовательности (х1,х2,... ,хм), которая обладает корреляционными связями соседних элементов, коэффициент корреляции Я = = Я(хк-1,хк) является необходимой информацией для построения оценок плотностей вероятностей смеси.

Поэтому на этапе определения априорных сведений о последовательности (х1,х2,... .х^,) целесообразно получить оценку одномерной плотности вероятностей 0/(х) и ее первых двух моментов тх, а2, а также коэффициента корреляции соседних элементов Я. Кроме того, для инициализации вычислений при нулевой итерации (т = 0) следует в последовательности (х1,х2,... ,хц) задать элемент х0 (возможно х0 = 0), т.е. для д(х;р, Х^^, Х2) задать значения Х1, Х2 и р. Значение отсчета х0, в принципе, может выбираться произвольно, главное, чтобы это значение было сопоставимо с тх.

Если (х1,х2,... - заданная последовательность временных интервалов, то, очевидно, что Хх = т-1 имеет смысл интенсивности наступления некоторых событий. Тогда при нулевой итерации (т = 0) при обработке отсчета х0 можно ограничиться заданием одного параметра интенсивности

(например, Я1 ), т. к. Я1 и Я2 связаны очевидным соотношением:

Ài Л2

À =_1 2_

Х pÀ2 + (1 - p)V

(9)

из которого при заданном Я1 и априорно известном Яж можно легко определить Я1.

Выбор значения для Я1 достаточно произволен, но всегда надо следить за тем, чтобы полученное из (9) значение Я1 было положительным. В противном случае необходимо изменить выбор для Я1. Выбор значения р из интервала (0,1) также достаточно произволен, но обычно выбирается р = 0,5.

Корреляционные свойства последовательности (х1,х2,.,хи) благодаря рекуррентности формул (7) и (8) могут быть явно учтены в этих формулах, если установить аналитическую связь соседних элементов последовательности.

Это можно сделать при использовании уравнения регрессии, записанного в виде [11]:

= Дх^ + тж(1 - Д) + (аж71-Д2) 5, (10)

где 5 - случайная нормально распределенная величина с нулевым средним и единичной дисперсией, не коррелированная с .

Учтем теперь выражение (10) в рекуррентном соотношении (8). Выпишем несколько первых слагаемых из числителя выражения при I = 1, включив в него слагаемое для х0, служащее для инициализации процесса вычислений:

•*1 Zife) -^2

(11)

ЛОО • *1 = ЛОО 1

1(Х2-Шх(1-Д)-5(2))] =

^/1(Х1)[Х2-С(2)].

(12)

где С(2) = тж(1 - Д) + (аж^Г—К2)5(2) - случайная величина, которая должна генерироваться в данном случае на втором шаге вычислений, когда проводятся вычисления, связанные с элементом последовательности х2.

Очевидно, для произвольного :

1

/1(Xj)Xj = -/1(Xj)[xj+1 - G

(¿+1)

].

(13)

Стоящее в правой части выражения (13) значение /!(х;) вычисляется по информации о Я1, полученной на предыдущей итерации вычислений:

/1(т)(х0 = я1т-1)е-Я1

(т-1)х£

(14)

Соответственно:

5(ш)(х.) = р(ш_1)я(-_1)е_я1 + + (1 - р(т_1))я1т_1)е_я2т-1)"г.

Теперь можно определить порядок действий при реализации соотношений (7) и (8).

1) Методами статистического анализа, реализованного соответствующими программными продуктами, определяется плотность вероятностей ^(х), аппроксимирующая истинную плотность анализируемой выборки. Определяются также моменты шж, и коэффициент корреляции соседних элементов Д. При этом предполагается, что следующим шагом аппроксимации является выбор функции:

5(х) = р/1(х) + (1-р)/2(х).

2) Осуществляется выбор исходных данных р, Я1(0),Я2(0) для Хо.

3) Текущие вычисления производятся по формулам (7) и (8) с использованием (10) и (12). Особенностью вычислений является то, что на каждом шаге необходимо генерировать нормальную случайную величину со средним значением шж(1 - Д) и дисперсией а|(1 - Д2).

4) Выбор момента останова вычислений можно выбирать следующим образом.

Если ошибку аппроксимации на каждом (у)-шаге представить в виде:

£(v=>gb(v)(*o] - sOg^-^xo]

e(v) =

(v)

^(Ц^^ЧХ;)]

Рассмотрим формирование значения /1(х£)х; в формуле (8) с учетом соотношения (10). Например, при обработке х1:

где при фиксированном N должно выполняться (у)тах < N , то при выполнении условия е(1/) < < £порогоше, можно считать алгоритм сходящимся и фиксировать полученные значения р^Д^Д^. В противном случае следует искать другую «траекторию» вычислений, задав другое начальное значение х0 [18]. При данном вычислении и значение £порогоше, изменив которое, можно получить сходящийся алгоритм, оказывает влияние на сходимость алгоритма.

Анализ ошибки аппроксимации при выполнении условия е^) < £порогоше можно осуществить, используя для оценивания ошибки аппроксимации меру Кульбака - Лейблера [19]:

Д = Y w(x;)ln^).

Анализ точности аппроксимации через параметр Д целесообразно проводить для выбора среди сходящихся «траекторий» наилучшей, т. е. обладающей наименьшим значением Д.

Моделирование работы ЕМ-алгоритма

при коррелированной реализации случайных

величин

Проверка работоспособности рассмотренного алгоритма расчета параметров аппроксимирующей плотности (1) при коррелированной выборке была проведена на основе эксперимента, реализованного методом статистического моделирования. Для простоты моделирования была выбрана последовательность случайных событий с интервалами времени между событиями, имеющими логнор-мальное распределение с заданным коэффициентом корреляции соседних интервалов.

Плотность вероятностей логнормального распределения имеет вид:

( Ï = 1 ( 1п2Л

тж = Сто'Vë, ст| = е(е - 1)ст2.

Такой вывод основан на более подробном анализе корреляционных свойств сгенерированной трассы, представленном на рисунке 1 и на сравнении данных результатов с результатами, полученными в работах [9, 21].

"k 1,2

1

0,8 0,6 0,4 0,2 0

0,484

1

0,7

| | l ^ °,183 0,145 0,116 2345678 k

0,363

0,264

Моделирование стационарного логарифмически-нормального случайного процесса с заданным коэффициентом корреляции Д можно осуществить следующим образом [20]:

- моделируется нормальный стационарный случайный процесс {у£}, I = 1, 2,... с коэффициентом корреляции:

р = 1п(1 + (е - 1)Д),

- каждый элемент последовательности у£ подвергается преобразованию х = еу для получения последовательности {х£}, ¿ = 1, 2,..

При этом нормальный процесс с заданным коэффициентом корреляции моделируется разностным уравнением первого порядка:

у(п) = ао?(п) + ¿1у(п - 1),

где а0 = ст0^1 - р2; Ь1 = р; ^(п) - последовательность нормальных случайных чисел с нулевым средним и единичной дисперсией - N(0,1).

Итак, если положить, что Д = 0,7, то при ст0 = 1 получается а0 = 0,613, Ь1 = 0,79.

Сгенерированная трасса из 5000 логнормальных интервалов с коэффициентом корреляции соседних интервалов Д = 0,7, c начальными условиями, согласованными с (9), в виде:

Яж = 0,606, р = 0,5, Я1 = 0,5, Я2 = 0,77

при обработке алгоритмом ЕМ по формулам (7) и (8) с Епороговое = 0,01 дала при (V) = 499 следующие результаты:

р = 0,45, Я1 = 2,72, Я2 = 2,78.

Это означает, что для трассы с коэффициентом корреляции соседних элементов Д = 0,7 вместо модели плотности в виде гиперэкспоненциального распределения д(х; р, Я1, Я2) можно использовать (в рамках допустимой погрешности) просто экспоненциальное распределение с показателем Я « 2,75.

Рис. 1. Коэффициенты корреляции последовательности

Fig. 1. Sequence Correlation Coefficients

В этих работах рассмотрены методы синтеза параметров гиперэкспоненциального распределения Н2(х) при полном учете корреляционных свойств последовательности (таких, как на рисунке 1), который основан на использовании индекса дисперсии интервалов (или отсчетов) последовательности. Практически все результаты в данных работах указывают на то, что одна из экспонент в распределении Н2 (х) в данной ситуации присутствует с весом р из интервала (0,95 ... 0,98). Поэтому для достаточно простой модели плотности вероятностей мгновенных значений коррелированной последовательности случайных интервалов времени может использоваться экспоненциальная плотность с показателем, учитывающим корреляционные свойства последовательности. Справедливость данного утверждения демонстрируют результаты, показанные на рисунке 2, где приведены плотности распределений вероятностей при полученных значениях параметров гиперэкспоненциальных распределений для коррелированного трафика (/^(О), для некоррелированного трафика (/й(0), а также в случае использования экспоненциальной плотности распределений коррелированного трафика (/1exp(t)) и некоррелированного трафика (/2exp(t)).

1

0,8 0,6

0,4

0,2

0

0 2 4 6 8 10

Рис. 2. Плотности распределений вероятностей

Fig. 2. Densities of Probability Distributions

t

Анализ полученных результатов (см. рисунок 2) показывает, что график плотности экспоненциального распределения практически совпал с графиком плотности гиперэкспоненциального распределения для некоррелированной последовательности, и весьма близок для коррелированной последовательности.

Использование ЕМ-алгоритма подтвердило вывод о том, что при рекуррентном формировании оценок максимального правдоподобия для параметров гиперэкспоненциального распределения при априорной неопределенности относительно значений этих параметров, оценивания параметров гиперэкспоненциального распределения при наличии корреляционных свойств у рассматриваемых последовательностей.

Заключение

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В работе представлена методика аппроксимации распределения смеси гиперэкспонентами для систем обработки коррелированного потока с использованием ЕМ-алгоритма. В результате были

получены выражения для программной реализации ЕМ-алгоритма для случаев некоррелированных и коррелированных потоков.

Проверка на основе использования методов статистического моделирования работоспособности представленного EM-алгоритма для коррелированных последовательностей была проведена для случайных величин, имеющих логнормальное распределение с коэффициентом корреляции соседних интервалов Я = 0,7. Результаты проверки показали точность в пределах порогового значения £порогоше = 0,01. Были получены следующие параметры гиперэкспоненциального распределения: р = 0,45, Х1 = 272, Х2 = 2,78. Данные результаты согласуются с решениями, полученными на основе других подходов оценивания параметров гиперэкспоненциальных распределений.

Установлено, что для достаточно простой модели плотности вероятностей мгновенных значений коррелированной последовательности случайных величин может использоваться экспоненциальная плотность с параметром, учитывающим корреляционные свойства последовательности.

Список используемых источников

1. Kleinrock L. Queueing Systems. Vol. I. Theory. John Wiley & Sons, 1975. 432 p.

2. Шелухин О.И., Тенякшев A.M., Осин А.В. Фрактальные процессы в телекоммуникациях. М.: Радиотехника, 2003. 480 с.

3. Буранова М.А. Исследование статистических характеристик самоподобного телекоммуникационного трафика // Инфокоммуникационные технологии. 2012. Т. 10. № 4. С. 35-41.

4. Kartashevskiy V., Kireeva N., Buranova M., Chupakhina L. Study of queuing system G/G/1 with an arbitrary distribution of time parameter system // Proceedings of the 2nd International Scientific-Practical Conference Problems of Infocommunications Science and Technology (PIC S&T, Kharkiv, Ukraine, 13-15 October 2015). IEEE, 2015. DOI:10.1109/INFOCOMMST.2015. 7357297

5. Kartashevskiy V., Buranova M. Analysis of Packet Jitter in Multiservice Network // Proceedings of the 5th International Scientific-Practical Conference Problems of Infocommunications Science and Technology (PIC S&T, Kharkiv, Ukraine, 9-12 October 2018). IEEE, 2015. PP. 797-802. DOI:10.1109/INFOCOMMST.2018.8632085.

6. Буранова М.А., Карташевский В.Г., Латыпов Р.Т. Оценка джиттера в системе G/M/1 на основе использования гиперэкспоненциальных распределений // Инфокоммуникационные технологии. 2020. Т. 18. № 1. С. 13-20. DOI:10.18469/ikt.2020.18.1.02

7. Kartashevskiy I., Buranova M. Calculation of Packet Jitter for Correlated Traffic // Proceedings of the 19th International Conference on Next Generation Wired/Wireless Networking (NEW2AN 2019) and Proceedings of the 12th Conference on Internet of Things and Smart Spaces (ruSMART, 2019, St. Petersburg, Russia, 26-28 August 2019). Lecture Notes in Computer Science. Computer Communication Networks and Telecommunications. Vol. 11660. PP. 610-620. Cham: Springer, 2019. DOI:10.1007/978-3-030-30859-9_53.

8. Vishnevskii V.M., Dudin A.N. Queueing Systems with Correlated Arrival Flows and Their Applications to Modeling Telecommunication Networks // Automation and Remote Control. 2017. Vol. 78(8). PP. 1361-1403. DOI:10.1134/S000511 791708001X

9. Balcioglu B., Jagerman D.L., Altiok T. Approximate mean waiting time in a Gl/D/1 queue with autocorrelated times to failures // IIE Transactions. 2007. Vol. 39. Iss. 10. PP. 985-996. DOI:10.1080/07408170701275343

10. Бузов А.Л., Букашкин С.А. Специальная радиосвязь. Развитие и модернизация оборудования и объектов. М.: Радиотехника, 2017. 448 с.

11. Balcioglu B., Jagerman D.L., Altiok T. Merging and splitting autocorrelated arrival processes and impact on queueing performance // Performance Evaluation. 2008. Vol. 65. Iss. 9. PP. 653-669. DOI:10.1016/j.peva.2008.02.003

12. Keilson J., Machihara F. Hyperexponential waiting time structure in hyperexponential HN /HK/1 system // Journal of the Operation Society of Japan. 1985. Vol. 28(3). PP. 242-250.

13. Feldmann A., Whitt W. Fitting Mixtures of Exponentials to Long-Tail Distributions to Analyze Network Performance Models // Performance Evaluation. 1998. Vol. 31. Iss. 3-4. PP. 245-279. DOI:10.1016/S0166-5316(97)00003-5

14. Buranova M., Ergasheva D., Kartashevskiy V. Using the EM-algorithm to approximate the Distribution of a Mixture by Hyperexponents // Proceedings of the International Conference on Engineering and Telecommunication (EnT, Dolgoprudny, Russia, 20-21 November 2019). IEEE, 2019. DOI:10.1109/EnT47717.2019.9030551

15. Baird S.R. Estimating mixtures of exponential distributions using maximum likelihood and the EM algorithm to improve

simulation of telecommunication networks. University of British Columbia, 2002. URL: https://open.library.ubc.ca/ collections/ubctheses/831/items/1.0090805 (дата обращения 18.10.2021)

16. Королев В.Ю. ЕМ-алгоритм, его модификации и их применение к задаче разделения смесей вероятностных распределений. Теоретический обзор. М.: ИПИ РАН, 2007. 94 с.

17. Воронцов К.В. Математические методы обучения по прецедентам (теория обучения машин) URL: http ://www.machinelearning.ru/wiki/images/6/6d/Voron-ML-1.pdf (дата обращения 18.10.2021)

18. Ip E.H. A Stochastic EM Estimator in the Presence of Missing Data: Theory and Practice. PhD Dissertation. Stanford University, 1994. 127 p.

19. Kullback S., Leibler R.A. On information and sufficiency // The Annals of Mathematical Statistics. 1951. Vol. 22. PP. 79-86.

20. Быков В.В. Цифровое моделирование в статистической радиотехнике. М.: Советское радио, 1971. 328 с.

21. Карташевский И.В., Сапрыкин А.В. Анализ времени ожидания заявки в очереди для системы массового обслуживания общего вида // T-Comm: Телекоммуникации и транспорт. 2018. Т. 12. № 2. С. 4-10. DOI:10.24411/2072-8735-2018-10024

* * *

Application of EM-Algorithm for Approximation of Correlated Traffic Probabilities Density by Hyperexponents

M. Buranova1 *, I. Kartashevskiy1

1Povolzhskiy State University of Telecommunications and Informatics, Samara, 443010, Russian Federation

Article info

DOI:10.31854/1813-324X-2021-7-4-10-17 Received 18th September 2021 Revised 11th October 2021 Accepted 18th October 2021

For citation: Buranova M., Kartashevskiy I. Application of EM-Algorithm for Approximation of Correlated Traffic Probabilities Density by Hyperexponents. Proc. of Telecom. Universities. 2021;7(4):10-17. (in Russ.) DOI:10.31854/ 1813-324X-2021-7-4-10-17

Abstract: An accurate assessment of the quality of service parameters in modern information communication networks is a very important task. This paper proposes the use of hyperexponential distributions to solve the problem of approximating an arbitrary probability density in the G/G/1 system for the case when the approximation by a system of the type H2/H2/I is assumed. To determine the parameters of the probability density of the hyperexponential distribution, it is proposed to use EM- algorithm that provides fairly simple use cases for uncorrelated flows. In this paper, we propose a variant of the EM algorithm implementation for determining the parameters of the hyperexponential distribution in the presence of correlation properties of the analyzed flow.

Keywords: EM-algorithm, distributions of random variables, correlation, approximation, QoS.

References

1. Kleinrock L. Queueing Systems. Vol. I. Theory. John Wiley & Sons; 1975. 432 p.

2. Sheluhin O.I., Tenyakshev A.M., Osin A.V. Fractal Processes in Telecommunications. Moscow: Radiotehnika Publ.; 2003. 480 p. (in Russ.)

3. Buranova M.A. Research of statistical characteristics of the self-similar telecommunication traffic. Infokommunikacionnie tehnologii. 2012;10(4):35-40. (in Russ.)

4. Kartashevskiy V., Kireeva N., Buranova M., Chupakhina L. Study of queuing system G/G/1 with an arbitrary distribution of time parameter system. Proceedings of the 2nd International Scientific-Practical Conference Problems of Infocommunications Science and Technology, PICS&T, 13-15 October 2015, Kharkiv, Ukraine. IEEE; 2015. DOI:10.1109/INFOCOMMST.2015.7357297

5. Kartashevskiy V., Buranova M. Analysis of Packet Jitter in Multiservice Network // Proceedings of the 5th International Scientific-Practical Conference Problems of Infocommunications Science and Technology, PIC S&T, 9-12 October 2018, Kharkiv, Ukraine. IEEE; 2018. p.797-802. DOI:10.1109/INFOCOMMST.2018.8632085

6. Buranova M.A., Kartashevskiy V.G., Latypov R.T. Estimation of jitter in the G/M/1 system based on the use of hyperexponential distributions. Infokommunikacionnie tehnologii. 2020;18(1):13-20. (in Russ.) DOI:10.18469/ikt.2020.18.1.02

7. Kartashevskiy I., Buranova M. Calculation of Packet Jitter for Correlated Traffic. Proceedings of the 19th International Conference on Next Generation Wired/Wireless Networking, NEW2AN 2019, and Proceedings of the 12th Conference on Internet of Things and Smart Spaces, ruSMART 2019, 26-28 August 2019, St. Petersburg, Russia. Lecture Notes in Computer Science. Computer Communication Networks and Telecommunications. vol.11660. p.610-620. Cham: Springer; 2019. DOI:10.1007/978-

3-030-30859-9_53

8. Vishnevskii V.M., Dudin A.N. Queueing Systems with Correlated Arrival Flows and Their Applications to Modeling Telecommunication Networks. Automation and Remote Control. 2017;78(8):1361-1403. DOI:10.1134/S000511791708001X

9. Balcioglu B., Jagerman D.L., Altiok T. Approximate mean waiting time in a GI/D/1 queue with autocorrelated times to failures. IIE Transactions. 2007;39(10):985-996. DOI:10.1080/07408170701275343

10. Buzov A.L., Bukashkin S.A. Special Radio Communication. Development and Modernization of Equipment and Facilities. Moscow: Radiotekhnika Publ.; 2017. 448 p. (in Russ.)

11. Balcioglu B., Jagerman D.L., Altiok T. Merging and splitting autocorrelated arrival processes and impact on queueing performance. Performance Evaluation. 2008;65(9):653-669. D01:10.1016/j.peva.2008.02.003

12. Keilson J., Machihara F. Hyperexponential waiting time structure in hyperexponential HN /HK/1 system. Journal of the Operation Society of Japan. 1985;28(3):242-250.

13. Feldmann A., Whitt W. Fitting Mixtures of Exponentials to Long-Tail Distributions to Analyze Network Performance Models. Performance Evaluation. 1998;31(3-4):245-279. DOI:10.1016/S0166-5316(97)00003-5

14. Buranova M., Ergasheva D., Kartashevskiy V. Using the EM-algorithm to approximate the Distribution of a Mixture by Hyperexponents. Proceedings of the International Conference on Engineering and Telecommunication, EnT, 20-21 November 2019, Dolgoprudny, Russia. IEEE; 2019. DOI:10.1109/EnT47717.2019.9030551

15. Baird S.R. Estimating mixtures of exponential distributions using maximum likelihood and the EM algorithm to improve simulation of telecommunication networks. University of British Columbia; 2002. Available from: https://open.library.ubc.ca/ collections/ubctheses/831/items/1.0090805 [Accessed 18th October 2021]

16. Korolyov V.Yu. The EM-Algorithm, its Modifications, and Their Application to the Problem of Separating Mixtures of Probability Distributions. Theoretical Review. Moscow: Institute of Informatics Problems of the Russian Academy of Sciences Publ.; 2007. 94 p. (in Russ.)

17. Voroncov K.V. Mathematical Teaching Methods on Precedents. (in Russ.) Available from: http://www.machinelearning.ru/ wiki/images/6/6d/Voron-ML-1.pdf [Accessed 18th October 2021]

18. Ip E.H. A Stochastic EM Estimator in the Presence of Missing Data: Theory and Practice. PhD Dissertation. Stanford University; 1994. 127 p.

19. Kullback S., Leibler R.A. On information and sufficiency. The Annals of Mathematical Statistics. 1951;22:79-86.

20. Bykov V.V. Digital Modeling in Statistical Radio Engineering. Moscow: Soviet radio Publ.; 1971. 328 p. (in Russ.)

21. Kartashevskiy I.V., Saprykin A.V. Waiting time analysis for the request in general queuing system. T-Comm. 2018;12(2):

4-10. (in Russ.) DOI:10.24411/2072-8735-2018-10024

БУРАНОВА Марина Анатольевна

Сведения об авторах:

кандидат технических наук, доцент, доцент кафедры информационной безопасности Поволжского государственного университета телекоммуникаций и информатики, buranova-ma@psuti.ru

https://orcid.org/0000-0003-2986-8252

КАРТАШЕВСКИИ Игорь Вячеславович

доктор технических наук, профессор кафедры программного обеспечения и управления в технических системах Поволжского государственного университета телекоммуникаций и информатики, ivk@psuti.ru ИИрБ: //orcid.org/0000-0002-1388-4867

i Надоели баннеры? Вы всегда можете отключить рекламу.