Электронный журнал «Труды МАИ». Выпуск № 76
www.mai. ru/science/trudy/
УДК 519.872.8
Исследование адекватности моделей самоподобного трафика, используемых для оценки качества обслуживания в сети
Благов А.В.
Самарский государственный аэрокосмический университет имени академика С.П.
Королева, СГАУ, Московское шоссе 34, Самара, 443086, Россия e-mail: alex_ssauprof@mail. ru
Аннотация
Статья посвящена вопросу исследования качества обслуживания в информационных сетях при помощи имитационных моделей. Автором предлагается метод построения и анализа двумерного распределения очереди в заданной системе массового обслуживания, входным потоком в которую является трафик. Метод апробируется на разработанных модификациях моделей телекоммуникационного трафика: "Input M/G/ro" и "On-Off Sources". Предложенный в статье подход построения двумерного распределения очереди в заданной системе массового обслуживания может использоваться для исследования одного из параметров качества обслуживания в сети - вариации задержки (джиггера).
Ключевые слова: самоподобный трафик, моделирование трафика, модель "Input M/G/ro", модель "On-Off Sources", вариация задержки (джиттер), система массового обслуживания.
1. Введение
Проблема прогнозирования поведения трафика в сетях телекоммуникаций является особенно значимой в связи с колоссальным развитием информационных сетей. До середины 90-х годов теоретическую базу для проектирования систем распределения информации обеспечивала теория телетрафика. Однако было установлено Leland и W.Wilinger в 1994 г., M. Crovella в 1996 г.), что потоки в сетях передачи пакетов данных имеют несколько иную, чем принято в классической теории телетрафика, структуру - самоподобную [1]. Практически актуальными представляются задачи построения имитационной модели самоподобного сетевого трафика для её использования в программах имитационного моделирования при исследованиях характеристик моделей реальных сетей, проводимых на стадии проектирования. Кроме того, хорошая модель может служить не только для имитации реального трафика, но и выявлять его структуру, параметры порождающих трафик источников, ситуацию в сети, по которой трафик распространялся и т.д. В настоящее время исследователями предлагаются большое количество различных моделей самоподобного сетевого трафика [2, 3, 4]. Как правило, в качестве проверки адекватности и работоспособности той или иной модели предлагается соответствие различных статистических характеристик, таких как параметр Херста (описывающий степень самоподобия) [5], математическое ожидание, автокорреляционная функция и одномерное распределение трафика. Реже встречаются оценки средней и максимальной длины очереди [3]. Однако во многих случаях, например, при исследовании качества обслуживания в сети, в
частности, при исследовании такого показателя как вариация задержки - джиттер, большее значение имеет оценка характеристик других порядков.
Целью статьи является представление методики проверки адекватности моделей самоподобного трафика, заключающейся в исследовании двумерного распределения очереди, создаваемой трафиком в заданной системе массового обслуживания.
2. Краткое описание моделей и исследуемого материала
Модели сетевого трафика "Input M/G/ro" и "On-Off Sources" построены следующим образом: предположим, что в системе с дискретным временем t е информация передаётся пакетами одинакового размера, а трафик Y = (...,Y^,Y0,Y,•••) -это случайный процесс дискретного времени, где Y - количество пакетов, прибывших в некоторую точку за временной шаг [t -1, t). Пакеты эти производятся множеством независимых друг от друга источников. В модели "On-Off Sources" источников заданное конечное число N, и каждый из них то производит пакеты, то на некоторое время замолкает, а в модели "Input M/G/ro" число источников бесконечно, но каждый производит пакеты в течение одного конечного промежутка времени, а потом замолкает.
В модели "Input M/G/ro" новые источники возникают в системе в каждом временном окне, образуя пуассоновский поток с параметром Л:
Pr^ = к}= *-ЛЛ, к е Z + (1)
где Лг - это число новых источников трафика, появившихся в системе во временном окне t. Каждый источник имеет конечное время работы в системе, после истечения которого он исчезает из системы. Время работы источников является случайной величиной г, имеющей распределение с «тяжёлым хвостом»:
'У, к = 1,
Рг{г = к)=] А к = 2,3... ' (2)
(к + х У+2'
где x и у - подлежащие определению константы, A - нормировочная константа, а р - параметр, связанный с коэффициентом самопододия соотношением H=1-р/2 [6].
Кроме того, каждый источник имеет определенную скорость генерации пакетов £ (п), в общем случае £ (п) = 1. В усовершенствованной модели скорость генерации пакетов определяется следующим образом:
к | т |
Рг{7 = к}-£Рт Рг^£п = к\
т / 1 п
т=2 I п=1
Рг{£ = к} =-
Р1
где 7 - это телекоммуникационный трафик, представленный как случайный процесс, значение которого в каждом временном окне равно суммарной интенсивности генерации информации всеми находящимися в данный момент в системе источниками:
г Л
7 = Е2Х, (г - к)I(Гк, > г - к).
к=-ад г=1
Коэффициент Р определяется соотношениями:
Р0 = Рг{7, = 0},
Pr Yt = 1} = APr{S = 1}, и т.д. Подробный вывод приводится в работе [2].
Модель "Input M/G/ro" хорошо работает для генерации глобальных (TCP трафика) трасс [6].
В модели "On-Off Sources" N - независимых источников. Каждый из них имеет два состояния: состояние активности (ON), в котором источником генерируются данные, и состояние молчания (OFF), в котором источник ничего не производит. Эти периоды попеременно сменяют друг друга. Вероятность застать индивидуальный источник в активном состоянии и в состоянии молчания есть:
_ Mr р = Mv
PON = ^ 7Т~, POFF = , , , , ,
Mr + Mv Mr + Ми
где r - длительность ON периодов источников, является реализацией случайного процесса, имеющего распределение с тяжелым хвостом (2), а и - длительность OFF
Л
периодов, имеющего распределение Пуассона: Pr{v = к }= е Л Л' к е Z +'
Как и в модели "Input M/G/ro" каждый источник имеет скорость генерации пакетов, определенную для каждого ON периода. Модель "On-Off Sources" неплохо работает для генерации локальных сетей (Ethernet трассы) [7]. В усовершенствованной модификации модели "On-Off Sources" - OFF период имеет пуассоновское распределение времени:
п MV Л 3 POFF POFF = - = - ■ Л = -=-Mr .
Mr + Mv Mr + Л PON
В качестве исследуемого материала используем как трассы трафика локальных сетей (трассы Ethernet трафика), так и глобальных (трассы TCP трафика). Глобальные TCP трассы: dec-pkt-1.tcp, dec-pkt-2.tcp, dec-pkt-3.tcp, dec-pkt-4.tcp, LBL-PKT-4.TCP, LBL-PKT-5.TCP [8] - представлены трассами часовой записи трафика между Digital Equipment Corporation (DEC - американская компьютерная компания) и остальным Интернетом (первые две) и трассой часовой записи трафика между Lawrence Berkeley Laboratory (национальная лаборатория имени Лоуренса в Беркли) и остальным Интернетом (последняя). Обозначим их как: глоб.1, глоб.2, ..., глоб.6 - соответственно. Трассы локальных Ethernet сетей представлены трассами часовой записи трафика из коллекции корпорации Bellcore (компания, производящая средства связи, и ведущая научные исследования в этой области): BC-pAug89.TL, BC-pOct89.TL [8], а именно трассами трафика в опорной магистрали корпоративной локальной сети Bellcore. Обозначим их: лок.1 и лок.2.
Помимо указанных выше широко известных трасс, возьмем для исследования еще одну Ethernet трассу часовой записи в магистрали локальной сети Metromax-Самара (ГК «MetroМах» компания, предоставляющая телекоммуникационные услуги), снятую в ноябре 2007 г.. Обозначим её лок.3.
Каждая трасса представляется процессом с дискретным временем, значение которого в определенный момент времени - сумма размеров всех пакетов, прибывших в данном временном окне (шаге дискретизации) [2].
Более подробное описание моделей, их модификаций, включающих аппроксимацию автокорреляционной функции (АКФ), и экспериментов приводится в работах [2,6,7].
3. Построение и анализ двумерного распределения очереди в заданной
системе массового обслуживания
Близкое сходство таких характеристик натурного и смоделированного трафика, как одномерное распределение и АКФ, дает некоторую оценку адекватности предложенных моделей [2,7]. Однако во многих случаях, например, при исследовании вариации задержки - джиттера [9], большее значение имеет, двумерное распределение очереди, которое создается данным трафиком при прохождении через систему массового обслуживания (СМО). В такой СМО интенсивность обслуживания примем равным среднему количеству поступающих требований (в нашем случае выборочному среднему), деленному на коэффициент р, который будем варьировать в пределах от 0 до 1 в различных испытаниях. При этом ожидающие требования образуют очередь Qt (в момент времени /).
Данная характеристика, двумерное распределение очереди, вводится для получения вероятностной оценки разброса времени прохождения пакетного телекоммуникационного трафика через требуемый сегмент информационной сети. Оценка двумерного распределения очереди О определяется следующим образом:
1 I
Рг ^ = а, а2 = Ъ} = РгМ2 (а, Ъ) = Рг,(а, Ъ) , (3)
где а и Ь - меняются от 0 до некоторой максимальной длины очереди 0ш
^шах •
Исследуем близость таких двумерных распределений очереди, используя натурный и смоделированный трафик как входные потоки в СМО.
По результатам проведенных экспериментов с исследуемыми трассами
с различными значениями At = tY —t2 (в нашем случае мы брали равным 10, 100 и 1000) и коэффициента р (от 0,3 до 0,8) можно отметить относительно близкие результаты для трафика глобальных трасс при использовании модели "Input M/G/ro" и для трафика локальных трасс при использовании модели "On-Off Sources" (рис. 1, 3, 4). При моделировании трафика локальных трасс с использованием модели "Input M/G/ro" наблюдаются большие расхождения (рис. 2).
Рис. 1. Графическое сравнение элементов первого ряда двумерного распределения
очереди трафика натурной и смоделированной трассы глоб.1 (р =0,4 At = 1000)
Рис. 2. Графическое сравнение элементов первого ряда двумерного распределения очереди трафика натурной и смоделированной трассы лок.1 (р=0,4 А? = 1000)
0,0035
0,0025
0,002 —
0,003 --
0,0025 --1- -
0,002 - -П- -■-
-ШЕЕЕЕЕЫ
□
□ ^д2
Рис. 3. Графическое сравнение элементов первого ряда двумерного распределения очереди трафика натурной и смоделированной трассы лок.1 (р=0,4 А? = 1000)
Рис. 4. Графическое сравнение элементов первого ряда двумерного распределения очереди трафика натурной и смоделированной трассы лок.2 (р=0,4 At = 1000)
Для более строгой оценки осуществим проверку гипотезы Я0 о том, что два двумерных распределения очереди при использовании натурного и смоделированного трафиков подчиняются одному и тому же распределению, т.е. подобны. Осуществим проверку данной гипотезы по критерию Колмогорова-Смирнова.
Статистика данного критерия определяется как:
Оп,т = su.pl ^ ( х)-^ (х )|,
п
где ^п(1) (х) = ^(*(1) -*) - эмпирическая функция распределения, построенная по
/=1
первой выборке (в нашем случае по одномерному распределению натурного
х
т . .
трафика), а х(2) -х) - эмпирическая функция распределения,
г=1
построенная по второй выборке (в нашем случае по одномерному распределению трафика смоделированного).
Обозначим через Я0 гипотезу о том, что две исследуемые выборки подчиняются одному и тому же распределению случайной величины. Тогда для введённой статистики:
Vt > 0: lim Pr
где K (t) - функция Колмогорова.
Г I nm ,ч . ТТ Л -D < 11 Ип
i n.m I 0
v in + m j
= K (t),
Если статистика . \——Dnm превышает квантиль распределения Колмогорова
V n + m '
t i_a, то нулевая гипотеза H0 отвергается с вероятностью ошибки а. Иначе гипотеза принимается на уровне значимости а .
Полученные результаты проверки гипотезы по критерию Колмогорова-Смирнова запишем в таблицы 1, 2, 3.
^ I nm
В таблице 1 показаны значения статистики J-Dn m при проведении
V n + m '
экспериментов над глобальными трассами с использованием модификаций модели "Input M/G/ro" В данном случае гипотеза принимается как на уровне значимости 0,05, так и на 0,1 лишь при использовании модификации модели "Input M/G/ro" с аппроксимацией АКФ.
Таблица 1 - Значение статистик двумерных распределений очереди в СМО по критерию Колмогорова-Смирнова (моделирование трафиков по «Input M/G/ro»).
Эксперименты над глобальными трассами
Трасса, нагрузка СМО и интервал времени в двумерном значение статистики 1 nm D \ Dn,m \n + m значение статистики 1 nm D \ Dn,m \ n + m значение статистики 1 nm d л! n,m V n + m
распределении (модельный трафик по базовой "Input M/G/ro") (модельный трафик по разработанной модификации "Input M/G/ro", без аппроксимации АКФ) (модельный трафик по разработанной модификации "Input M/G/ro", с аппроксимацией АКФ)
Р=0,4 Л=100 1,748 0,183 0,131
глоб.1 А=100 1,884 0,201 0,139
р=0,8 А=100 3,707 0,705 0,615
А=100 3,726 0,757 0,674
Р=0,4 А=100 2,593 0,011 0,009
глоб.2 А=100 2,706 0,010 0,009
р=0,8 А=100 7,056 0,551 0,388
А=100 7,063 0,559 0,405
Р=0,4 А=100 2,736 0,236 0,147
глоб.5 А=100 2,679 0,239 0,142
р=0,8 А=100 2,144 1,223 0,954
А=100 2,141 1,135 0,679
Р=0,4 А=100 2,758 0,254 0,097
глоб.6 А=100 2,699 0,304 0,070
р=0,8 А=100 4,898 1,451 1,117
А=100 4,394 1,563 1,188
В таблице 2 показаны значения статистики nm Dnm при проведении
\ n + m m
экспериментов над локальными трассами с использованием модификаций модели "Input M/G/ro" Гипотеза при этом отвергается для всех модификаций.
Таблица 2 - Значение статистик двумерных распределений очереди в СМО по критерию Колмогорова-Смирнова (моделирование трафиков по «Input M/G/ro»).
Эксперименты над локальными трассами
Трасса, нагрузка СМО значение значение значение
и интервал времени в двумерном статистики 1 nm D \1 n, m \n + m статистики 1 nm d \ n + m статистики 1 nm d a! n,m \n + m
распределении (модельный трафик по базовой "Input M/G/ro") (модельный трафик по разработанной модификации "Input M/G/ro", без (модельный трафик по разработанной модификации "Input M/G/ro", с
аппроксимации АКФ) аппроксимацией АКФ)
Р=0,4 Л=10 3,620 1,762 1,703
лок.1 Л=10 3,619 1,695 1,705
р=0,8 0°= 10 5,443 3,231 3,021
Л=10 5,296 3,159 3,163
Р=0,4 Л=10 3,562 1,702 1,704
лок.2 Л=10 3,473 1,940 2,039
р=0,8 Л=10 6,085 2,110 1,988
Л=10 6,379 2,097 2,102
Р=0,4 Л=10 6,923 2,244 2,304
лок.3 Л=10 6,656 2,361 2,321
р=0,8 Л=10 7,039 2,329 2,486
Л=10 6,924 2,804 2,575
В таблице 3 показаны значения статистики nm Dnm при проведении
\ n + m n'm
экспериментов над локальными трассами с использованием модификаций модели "On-off Sources ". В данном случае гипотеза принимается как на уровне значимости 0,05, так и на 0,1 при использовании модификации модели с аппроксимацией АКФ.
Таблица 3 - Значение статистик двумерных распределений очереди в СМО по критерию Колмогорова-Смирнова (моделирование трафиков по «On-Off
Sources»)
Трасса, нагрузка СМО значение значение значение
и интервал времени в статистики I- статистики I- статистики I-
двумерном nm D Л/ n,m \ n + m nm D \ n + m nm d \ n + m
распределении (модельный (модельный (модельный
трафик по трафик по трафик по
базовой "On- разработанной разработанной
off Sources") модификации "On-off Sources" без аппроксимации АКФ) модификации "On-off Sources" с аппроксимацией АКФ).
P=0,4 Л=100 2,437 0,140 0,077
Aug Л=100 2,571 0,148 0,086
p=0,8 Л=100 5,223 0,691 0,604
Л=100 5,083 0,668 0,629
P=0,4 Л=100 3,983 0,548 0,173
Oct Л=100 3,898 0,420 0,250
P=0,8 Л=100 3,342 0,156 0,110
Л=100 3,023 0,139 0,091
Met- P=0,4 Л=100 7,532 0,928 0,209
ro- Л=100 7,251 0,701 0,280
P=0,8 Л=100 7,621 1,561 0,412
max Л=100 7,523 1,261 0,423
По полученным результатам оценки двумерного распределения очереди в заданной СМО можно сделать выводы о преимуществах разработанной модификации модели "Input M/G/ro" над базовой моделью при моделировании глобальных трасс, и преимуществе разработанной модификации модели "On-off Sources" при моделировании трасс локальных.
Двумерное распределение очереди в заданной СМО позволяет получить некоторую вероятностную оценку минимального и максимального разброса времени прохождения пакета через определенный узел телекоммуникационной сети. Узел в данном случае имитировала СМО. Другими словами, с помощью заданной СМО моделируется система, работающая в дискретном времени, позволяющая получить вероятностную оценку джиггера в сети.
4. Выводы
Исследование адекватности моделей самоподобного трафика должно иметь комплексный подход. Помимо сравнительного анализа по степени самоподобия и таких статистических характеристик как одномерное распределение и АКФ [2, 6] бывает важно исследование статистик больших порядков. Предложенный в данной статье метод построения и анализа двумерного распределения очереди в заданной СМО может служить для демонстрации практической необходимости имитации трафика, являясь при этом достаточно простым в реализации и логически подходящим к такому объекту как телекоммуникационный трафик. Имеет место применение подобного метода по отношению к имитационным моделям
самоподобного трафика для исследования вариации задержки - джиттера [9].
Полученные результаты позволяют использовать разработанные имитационные модели для генерации трафика с заданными статистическими характеристиками. Предложенный анализ очереди в заданной СМО дает вероятностную оценку джиттера в телекоммуникационных сетях. Он может быть использован при проектировании сетей, а также разработке методов распределения пропускной способности каналов и уменьшения потерь информационных пакетов, для систем, где важно качество обслуживания.
Библиографический список
1. Шелухин О.И., Тенякшев А.М., Осин А.В. Фрактальные процессы в телекоммуникациях. М.: Радиотехника, 2003. 480 с.
2. Благов А.В., Привалов А.Ю. Модификации моделей типа «входная M/G/ro» и «On-Off источники» для имитационного моделирования самоподобного телекоммуникационного трафика. М.: Электронный журнал «Труды МАИ», 2010. № 39. URL: http://www.mai.ru/science/trudy/published.php?ID=14802
3. Mondragon R.J., Arrowsmith D.K., Pitts J.M. Chaotic map for traffic modeling and queuing analysis. Netherlands: Performance evaluation, vol. 43, 2001. Pp. 223-240.
4. Громов Ю.Ю,. Земской Н.А., Иванова О.Г., Лагутин А.В. Фрактальный анализ и процессы в компьютерных сетях Тамбов: Изд-во технич. ун-та, 2007. - 65с.
5. Park K., Willinger W., Wiley Ed. Self-similar Network Traffic and Performance
Evaluation. New-York: John Wiley & Sons Inc., 2000. 556 p.
16
6. Privalov A.Yu., Blagov A.V. Some Models Parameters Calculation for Simulation of Network Traffic Marginal Distribution and Self-similarity. Madrid: 23 European conference on modeling and simulation, 2009. Pp. 18-24.
7. Благов А.В., Привалов А.Ю. Моделирование самоподобного телекоммуникационного трафика локальных сетей. Телекоммуникации, №6. М.: Наука и технологии, 2011. С. 7-13.
8. Internet Traffic Archive. URL: http://ita.ee.lbl.gov.
9. Благов А.В. Построение имитационных моделей самоподобного телекоммуникационного трафика. Вестник Самарского государственного аэрокосмического университета имени академика С.П. Королёва, 2011. -№2(26). С. 201-210.