Научная статья на тему 'ИССЛЕДОВАНИЕ АДЕКВАТНОСТИ МОДЕЛЕЙ САМОПОДОБНОГО ТРАФИКА, ИСПОЛЬЗУЕМЫХ ДЛЯ ОЦЕНКИ КАЧЕСТВА ОБСЛУЖИВАНИЯ В СЕТИ'

ИССЛЕДОВАНИЕ АДЕКВАТНОСТИ МОДЕЛЕЙ САМОПОДОБНОГО ТРАФИКА, ИСПОЛЬЗУЕМЫХ ДЛЯ ОЦЕНКИ КАЧЕСТВА ОБСЛУЖИВАНИЯ В СЕТИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
13
6
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
САМОПОДОБНЫЙ ТРАФИК / МОДЕЛИРОВАНИЕ ТРАФИКА / МОДЕЛЬ "INPUT M/G/∞" / МОДЕЛЬ "ON-OFF SOURCES" / ВАРИАЦИЯ ЗАДЕРЖКИ (ДЖИТТЕР) / СИСТЕМА МАССОВОГО ОБСЛУЖИВАНИЯ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Благов Александр Владимирович

Статья посвящена вопросу исследования качества обслуживания в информационных сетях при помощи имитационных моделей. Автором предлагается метод построения и анализа двумерного распределения очереди в заданной системе массового обслуживания, входным потоком в которую является трафик. Метод апробируется на разработанных модификациях моделей телекоммуникационного трафика: “Input M/G/∞” и “On-Off Sources”. Предложенный в статье подход построения двумерного распределения очереди в заданной системе массового обслуживания может использоваться для исследования одного из параметров качества обслуживания в сети - вариации задержки (джиттера).

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Благов Александр Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «ИССЛЕДОВАНИЕ АДЕКВАТНОСТИ МОДЕЛЕЙ САМОПОДОБНОГО ТРАФИКА, ИСПОЛЬЗУЕМЫХ ДЛЯ ОЦЕНКИ КАЧЕСТВА ОБСЛУЖИВАНИЯ В СЕТИ»

Электронный журнал «Труды МАИ». Выпуск № 76

www.mai. ru/science/trudy/

УДК 519.872.8

Исследование адекватности моделей самоподобного трафика, используемых для оценки качества обслуживания в сети

Благов А.В.

Самарский государственный аэрокосмический университет имени академика С.П.

Королева, СГАУ, Московское шоссе 34, Самара, 443086, Россия e-mail: alex_ssauprof@mail. ru

Аннотация

Статья посвящена вопросу исследования качества обслуживания в информационных сетях при помощи имитационных моделей. Автором предлагается метод построения и анализа двумерного распределения очереди в заданной системе массового обслуживания, входным потоком в которую является трафик. Метод апробируется на разработанных модификациях моделей телекоммуникационного трафика: "Input M/G/ro" и "On-Off Sources". Предложенный в статье подход построения двумерного распределения очереди в заданной системе массового обслуживания может использоваться для исследования одного из параметров качества обслуживания в сети - вариации задержки (джиггера).

Ключевые слова: самоподобный трафик, моделирование трафика, модель "Input M/G/ro", модель "On-Off Sources", вариация задержки (джиттер), система массового обслуживания.

1. Введение

Проблема прогнозирования поведения трафика в сетях телекоммуникаций является особенно значимой в связи с колоссальным развитием информационных сетей. До середины 90-х годов теоретическую базу для проектирования систем распределения информации обеспечивала теория телетрафика. Однако было установлено Leland и W.Wilinger в 1994 г., M. Crovella в 1996 г.), что потоки в сетях передачи пакетов данных имеют несколько иную, чем принято в классической теории телетрафика, структуру - самоподобную [1]. Практически актуальными представляются задачи построения имитационной модели самоподобного сетевого трафика для её использования в программах имитационного моделирования при исследованиях характеристик моделей реальных сетей, проводимых на стадии проектирования. Кроме того, хорошая модель может служить не только для имитации реального трафика, но и выявлять его структуру, параметры порождающих трафик источников, ситуацию в сети, по которой трафик распространялся и т.д. В настоящее время исследователями предлагаются большое количество различных моделей самоподобного сетевого трафика [2, 3, 4]. Как правило, в качестве проверки адекватности и работоспособности той или иной модели предлагается соответствие различных статистических характеристик, таких как параметр Херста (описывающий степень самоподобия) [5], математическое ожидание, автокорреляционная функция и одномерное распределение трафика. Реже встречаются оценки средней и максимальной длины очереди [3]. Однако во многих случаях, например, при исследовании качества обслуживания в сети, в

частности, при исследовании такого показателя как вариация задержки - джиттер, большее значение имеет оценка характеристик других порядков.

Целью статьи является представление методики проверки адекватности моделей самоподобного трафика, заключающейся в исследовании двумерного распределения очереди, создаваемой трафиком в заданной системе массового обслуживания.

2. Краткое описание моделей и исследуемого материала

Модели сетевого трафика "Input M/G/ro" и "On-Off Sources" построены следующим образом: предположим, что в системе с дискретным временем t е информация передаётся пакетами одинакового размера, а трафик Y = (...,Y^,Y0,Y,•••) -это случайный процесс дискретного времени, где Y - количество пакетов, прибывших в некоторую точку за временной шаг [t -1, t). Пакеты эти производятся множеством независимых друг от друга источников. В модели "On-Off Sources" источников заданное конечное число N, и каждый из них то производит пакеты, то на некоторое время замолкает, а в модели "Input M/G/ro" число источников бесконечно, но каждый производит пакеты в течение одного конечного промежутка времени, а потом замолкает.

В модели "Input M/G/ro" новые источники возникают в системе в каждом временном окне, образуя пуассоновский поток с параметром Л:

Pr^ = к}= *-ЛЛ, к е Z + (1)

где Лг - это число новых источников трафика, появившихся в системе во временном окне t. Каждый источник имеет конечное время работы в системе, после истечения которого он исчезает из системы. Время работы источников является случайной величиной г, имеющей распределение с «тяжёлым хвостом»:

'У, к = 1,

Рг{г = к)=] А к = 2,3... ' (2)

(к + х У+2'

где x и у - подлежащие определению константы, A - нормировочная константа, а р - параметр, связанный с коэффициентом самопододия соотношением H=1-р/2 [6].

Кроме того, каждый источник имеет определенную скорость генерации пакетов £ (п), в общем случае £ (п) = 1. В усовершенствованной модели скорость генерации пакетов определяется следующим образом:

к | т |

Рг{7 = к}-£Рт Рг^£п = к\

т / 1 п

т=2 I п=1

Рг{£ = к} =-

Р1

где 7 - это телекоммуникационный трафик, представленный как случайный процесс, значение которого в каждом временном окне равно суммарной интенсивности генерации информации всеми находящимися в данный момент в системе источниками:

г Л

7 = Е2Х, (г - к)I(Гк, > г - к).

к=-ад г=1

Коэффициент Р определяется соотношениями:

Р0 = Рг{7, = 0},

Pr Yt = 1} = APr{S = 1}, и т.д. Подробный вывод приводится в работе [2].

Модель "Input M/G/ro" хорошо работает для генерации глобальных (TCP трафика) трасс [6].

В модели "On-Off Sources" N - независимых источников. Каждый из них имеет два состояния: состояние активности (ON), в котором источником генерируются данные, и состояние молчания (OFF), в котором источник ничего не производит. Эти периоды попеременно сменяют друг друга. Вероятность застать индивидуальный источник в активном состоянии и в состоянии молчания есть:

_ Mr р = Mv

PON = ^ 7Т~, POFF = , , , , ,

Mr + Mv Mr + Ми

где r - длительность ON периодов источников, является реализацией случайного процесса, имеющего распределение с тяжелым хвостом (2), а и - длительность OFF

Л

периодов, имеющего распределение Пуассона: Pr{v = к }= е Л Л' к е Z +'

Как и в модели "Input M/G/ro" каждый источник имеет скорость генерации пакетов, определенную для каждого ON периода. Модель "On-Off Sources" неплохо работает для генерации локальных сетей (Ethernet трассы) [7]. В усовершенствованной модификации модели "On-Off Sources" - OFF период имеет пуассоновское распределение времени:

п MV Л 3 POFF POFF = - = - ■ Л = -=-Mr .

Mr + Mv Mr + Л PON

В качестве исследуемого материала используем как трассы трафика локальных сетей (трассы Ethernet трафика), так и глобальных (трассы TCP трафика). Глобальные TCP трассы: dec-pkt-1.tcp, dec-pkt-2.tcp, dec-pkt-3.tcp, dec-pkt-4.tcp, LBL-PKT-4.TCP, LBL-PKT-5.TCP [8] - представлены трассами часовой записи трафика между Digital Equipment Corporation (DEC - американская компьютерная компания) и остальным Интернетом (первые две) и трассой часовой записи трафика между Lawrence Berkeley Laboratory (национальная лаборатория имени Лоуренса в Беркли) и остальным Интернетом (последняя). Обозначим их как: глоб.1, глоб.2, ..., глоб.6 - соответственно. Трассы локальных Ethernet сетей представлены трассами часовой записи трафика из коллекции корпорации Bellcore (компания, производящая средства связи, и ведущая научные исследования в этой области): BC-pAug89.TL, BC-pOct89.TL [8], а именно трассами трафика в опорной магистрали корпоративной локальной сети Bellcore. Обозначим их: лок.1 и лок.2.

Помимо указанных выше широко известных трасс, возьмем для исследования еще одну Ethernet трассу часовой записи в магистрали локальной сети Metromax-Самара (ГК «MetroМах» компания, предоставляющая телекоммуникационные услуги), снятую в ноябре 2007 г.. Обозначим её лок.3.

Каждая трасса представляется процессом с дискретным временем, значение которого в определенный момент времени - сумма размеров всех пакетов, прибывших в данном временном окне (шаге дискретизации) [2].

Более подробное описание моделей, их модификаций, включающих аппроксимацию автокорреляционной функции (АКФ), и экспериментов приводится в работах [2,6,7].

3. Построение и анализ двумерного распределения очереди в заданной

системе массового обслуживания

Близкое сходство таких характеристик натурного и смоделированного трафика, как одномерное распределение и АКФ, дает некоторую оценку адекватности предложенных моделей [2,7]. Однако во многих случаях, например, при исследовании вариации задержки - джиттера [9], большее значение имеет, двумерное распределение очереди, которое создается данным трафиком при прохождении через систему массового обслуживания (СМО). В такой СМО интенсивность обслуживания примем равным среднему количеству поступающих требований (в нашем случае выборочному среднему), деленному на коэффициент р, который будем варьировать в пределах от 0 до 1 в различных испытаниях. При этом ожидающие требования образуют очередь Qt (в момент времени /).

Данная характеристика, двумерное распределение очереди, вводится для получения вероятностной оценки разброса времени прохождения пакетного телекоммуникационного трафика через требуемый сегмент информационной сети. Оценка двумерного распределения очереди О определяется следующим образом:

1 I

Рг ^ = а, а2 = Ъ} = РгМ2 (а, Ъ) = Рг,(а, Ъ) , (3)

где а и Ь - меняются от 0 до некоторой максимальной длины очереди 0ш

^шах •

Исследуем близость таких двумерных распределений очереди, используя натурный и смоделированный трафик как входные потоки в СМО.

По результатам проведенных экспериментов с исследуемыми трассами

с различными значениями At = tY —t2 (в нашем случае мы брали равным 10, 100 и 1000) и коэффициента р (от 0,3 до 0,8) можно отметить относительно близкие результаты для трафика глобальных трасс при использовании модели "Input M/G/ro" и для трафика локальных трасс при использовании модели "On-Off Sources" (рис. 1, 3, 4). При моделировании трафика локальных трасс с использованием модели "Input M/G/ro" наблюдаются большие расхождения (рис. 2).

Рис. 1. Графическое сравнение элементов первого ряда двумерного распределения

очереди трафика натурной и смоделированной трассы глоб.1 (р =0,4 At = 1000)

Рис. 2. Графическое сравнение элементов первого ряда двумерного распределения очереди трафика натурной и смоделированной трассы лок.1 (р=0,4 А? = 1000)

0,0035

0,0025

0,002 —

0,003 --

0,0025 --1- -

0,002 - -П- -■-

-ШЕЕЕЕЕЫ

□ ^д2

Рис. 3. Графическое сравнение элементов первого ряда двумерного распределения очереди трафика натурной и смоделированной трассы лок.1 (р=0,4 А? = 1000)

Рис. 4. Графическое сравнение элементов первого ряда двумерного распределения очереди трафика натурной и смоделированной трассы лок.2 (р=0,4 At = 1000)

Для более строгой оценки осуществим проверку гипотезы Я0 о том, что два двумерных распределения очереди при использовании натурного и смоделированного трафиков подчиняются одному и тому же распределению, т.е. подобны. Осуществим проверку данной гипотезы по критерию Колмогорова-Смирнова.

Статистика данного критерия определяется как:

Оп,т = su.pl ^ ( х)-^ (х )|,

п

где ^п(1) (х) = ^(*(1) -*) - эмпирическая функция распределения, построенная по

/=1

первой выборке (в нашем случае по одномерному распределению натурного

х

т . .

трафика), а х(2) -х) - эмпирическая функция распределения,

г=1

построенная по второй выборке (в нашем случае по одномерному распределению трафика смоделированного).

Обозначим через Я0 гипотезу о том, что две исследуемые выборки подчиняются одному и тому же распределению случайной величины. Тогда для введённой статистики:

Vt > 0: lim Pr

где K (t) - функция Колмогорова.

Г I nm ,ч . ТТ Л -D < 11 Ип

i n.m I 0

v in + m j

= K (t),

Если статистика . \——Dnm превышает квантиль распределения Колмогорова

V n + m '

t i_a, то нулевая гипотеза H0 отвергается с вероятностью ошибки а. Иначе гипотеза принимается на уровне значимости а .

Полученные результаты проверки гипотезы по критерию Колмогорова-Смирнова запишем в таблицы 1, 2, 3.

^ I nm

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В таблице 1 показаны значения статистики J-Dn m при проведении

V n + m '

экспериментов над глобальными трассами с использованием модификаций модели "Input M/G/ro" В данном случае гипотеза принимается как на уровне значимости 0,05, так и на 0,1 лишь при использовании модификации модели "Input M/G/ro" с аппроксимацией АКФ.

Таблица 1 - Значение статистик двумерных распределений очереди в СМО по критерию Колмогорова-Смирнова (моделирование трафиков по «Input M/G/ro»).

Эксперименты над глобальными трассами

Трасса, нагрузка СМО и интервал времени в двумерном значение статистики 1 nm D \ Dn,m \n + m значение статистики 1 nm D \ Dn,m \ n + m значение статистики 1 nm d л! n,m V n + m

распределении (модельный трафик по базовой "Input M/G/ro") (модельный трафик по разработанной модификации "Input M/G/ro", без аппроксимации АКФ) (модельный трафик по разработанной модификации "Input M/G/ro", с аппроксимацией АКФ)

Р=0,4 Л=100 1,748 0,183 0,131

глоб.1 А=100 1,884 0,201 0,139

р=0,8 А=100 3,707 0,705 0,615

А=100 3,726 0,757 0,674

Р=0,4 А=100 2,593 0,011 0,009

глоб.2 А=100 2,706 0,010 0,009

р=0,8 А=100 7,056 0,551 0,388

А=100 7,063 0,559 0,405

Р=0,4 А=100 2,736 0,236 0,147

глоб.5 А=100 2,679 0,239 0,142

р=0,8 А=100 2,144 1,223 0,954

А=100 2,141 1,135 0,679

Р=0,4 А=100 2,758 0,254 0,097

глоб.6 А=100 2,699 0,304 0,070

р=0,8 А=100 4,898 1,451 1,117

А=100 4,394 1,563 1,188

В таблице 2 показаны значения статистики nm Dnm при проведении

\ n + m m

экспериментов над локальными трассами с использованием модификаций модели "Input M/G/ro" Гипотеза при этом отвергается для всех модификаций.

Таблица 2 - Значение статистик двумерных распределений очереди в СМО по критерию Колмогорова-Смирнова (моделирование трафиков по «Input M/G/ro»).

Эксперименты над локальными трассами

Трасса, нагрузка СМО значение значение значение

и интервал времени в двумерном статистики 1 nm D \1 n, m \n + m статистики 1 nm d \ n + m статистики 1 nm d a! n,m \n + m

распределении (модельный трафик по базовой "Input M/G/ro") (модельный трафик по разработанной модификации "Input M/G/ro", без (модельный трафик по разработанной модификации "Input M/G/ro", с

аппроксимации АКФ) аппроксимацией АКФ)

Р=0,4 Л=10 3,620 1,762 1,703

лок.1 Л=10 3,619 1,695 1,705

р=0,8 0°= 10 5,443 3,231 3,021

Л=10 5,296 3,159 3,163

Р=0,4 Л=10 3,562 1,702 1,704

лок.2 Л=10 3,473 1,940 2,039

р=0,8 Л=10 6,085 2,110 1,988

Л=10 6,379 2,097 2,102

Р=0,4 Л=10 6,923 2,244 2,304

лок.3 Л=10 6,656 2,361 2,321

р=0,8 Л=10 7,039 2,329 2,486

Л=10 6,924 2,804 2,575

В таблице 3 показаны значения статистики nm Dnm при проведении

\ n + m n'm

экспериментов над локальными трассами с использованием модификаций модели "On-off Sources ". В данном случае гипотеза принимается как на уровне значимости 0,05, так и на 0,1 при использовании модификации модели с аппроксимацией АКФ.

Таблица 3 - Значение статистик двумерных распределений очереди в СМО по критерию Колмогорова-Смирнова (моделирование трафиков по «On-Off

Sources»)

Трасса, нагрузка СМО значение значение значение

и интервал времени в статистики I- статистики I- статистики I-

двумерном nm D Л/ n,m \ n + m nm D \ n + m nm d \ n + m

распределении (модельный (модельный (модельный

трафик по трафик по трафик по

базовой "On- разработанной разработанной

off Sources") модификации "On-off Sources" без аппроксимации АКФ) модификации "On-off Sources" с аппроксимацией АКФ).

P=0,4 Л=100 2,437 0,140 0,077

Aug Л=100 2,571 0,148 0,086

p=0,8 Л=100 5,223 0,691 0,604

Л=100 5,083 0,668 0,629

P=0,4 Л=100 3,983 0,548 0,173

Oct Л=100 3,898 0,420 0,250

P=0,8 Л=100 3,342 0,156 0,110

Л=100 3,023 0,139 0,091

Met- P=0,4 Л=100 7,532 0,928 0,209

ro- Л=100 7,251 0,701 0,280

P=0,8 Л=100 7,621 1,561 0,412

max Л=100 7,523 1,261 0,423

По полученным результатам оценки двумерного распределения очереди в заданной СМО можно сделать выводы о преимуществах разработанной модификации модели "Input M/G/ro" над базовой моделью при моделировании глобальных трасс, и преимуществе разработанной модификации модели "On-off Sources" при моделировании трасс локальных.

Двумерное распределение очереди в заданной СМО позволяет получить некоторую вероятностную оценку минимального и максимального разброса времени прохождения пакета через определенный узел телекоммуникационной сети. Узел в данном случае имитировала СМО. Другими словами, с помощью заданной СМО моделируется система, работающая в дискретном времени, позволяющая получить вероятностную оценку джиггера в сети.

4. Выводы

Исследование адекватности моделей самоподобного трафика должно иметь комплексный подход. Помимо сравнительного анализа по степени самоподобия и таких статистических характеристик как одномерное распределение и АКФ [2, 6] бывает важно исследование статистик больших порядков. Предложенный в данной статье метод построения и анализа двумерного распределения очереди в заданной СМО может служить для демонстрации практической необходимости имитации трафика, являясь при этом достаточно простым в реализации и логически подходящим к такому объекту как телекоммуникационный трафик. Имеет место применение подобного метода по отношению к имитационным моделям

самоподобного трафика для исследования вариации задержки - джиттера [9].

Полученные результаты позволяют использовать разработанные имитационные модели для генерации трафика с заданными статистическими характеристиками. Предложенный анализ очереди в заданной СМО дает вероятностную оценку джиттера в телекоммуникационных сетях. Он может быть использован при проектировании сетей, а также разработке методов распределения пропускной способности каналов и уменьшения потерь информационных пакетов, для систем, где важно качество обслуживания.

Библиографический список

1. Шелухин О.И., Тенякшев А.М., Осин А.В. Фрактальные процессы в телекоммуникациях. М.: Радиотехника, 2003. 480 с.

2. Благов А.В., Привалов А.Ю. Модификации моделей типа «входная M/G/ro» и «On-Off источники» для имитационного моделирования самоподобного телекоммуникационного трафика. М.: Электронный журнал «Труды МАИ», 2010. № 39. URL: http://www.mai.ru/science/trudy/published.php?ID=14802

3. Mondragon R.J., Arrowsmith D.K., Pitts J.M. Chaotic map for traffic modeling and queuing analysis. Netherlands: Performance evaluation, vol. 43, 2001. Pp. 223-240.

4. Громов Ю.Ю,. Земской Н.А., Иванова О.Г., Лагутин А.В. Фрактальный анализ и процессы в компьютерных сетях Тамбов: Изд-во технич. ун-та, 2007. - 65с.

5. Park K., Willinger W., Wiley Ed. Self-similar Network Traffic and Performance

Evaluation. New-York: John Wiley & Sons Inc., 2000. 556 p.

16

6. Privalov A.Yu., Blagov A.V. Some Models Parameters Calculation for Simulation of Network Traffic Marginal Distribution and Self-similarity. Madrid: 23 European conference on modeling and simulation, 2009. Pp. 18-24.

7. Благов А.В., Привалов А.Ю. Моделирование самоподобного телекоммуникационного трафика локальных сетей. Телекоммуникации, №6. М.: Наука и технологии, 2011. С. 7-13.

8. Internet Traffic Archive. URL: http://ita.ee.lbl.gov.

9. Благов А.В. Построение имитационных моделей самоподобного телекоммуникационного трафика. Вестник Самарского государственного аэрокосмического университета имени академика С.П. Королёва, 2011. -№2(26). С. 201-210.

i Надоели баннеры? Вы всегда можете отключить рекламу.