Научная статья на тему 'Моделирование самоподобного трафика'

Моделирование самоподобного трафика Текст научной статьи по специальности «Математика»

CC BY
554
106
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Привалов А. Ю., Баева М. В.

Предложен метод имитационного моделирования сетевого телекоммуникационного трафика, обладающего самоподобными свойствами. Для генерируемого трафика может быть задан параметр Херста, характеризующий самоподобные свойства и одномерное распределение вероятностей.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SELF-SIMILAR TRAFFIC MODELING AND SIMULATION

Method for self-similar telecommunication traffic simulation is presented. It allows to simulate traffic with given Hurst parameter and given marginal probability distribution.

Текст научной работы на тему «Моделирование самоподобного трафика»

УДК 519

МОДЕЛИРОВАНИЕ САМОПОДОБНОГО ТРАФИКА

© 2006 А.Ю. Привалов, М.В. Баева Самарский государственный аэрокосмический университет

Предложен метод имитационного моделирования сетевого телекоммуникационного трафика, обладающего самоподобными свойствами. Для генерируемого трафика может быть задан параметр Херста, характеризующий самоподобные свойства и одномерное распределение вероятностей.

Введение

Целью статьи является исследование одного из возможных подходов к моделированию самоподобного трафика в сетях передачи данных. Поскольку самоподобная природа сетевого трафика затрудняет его анализ и моделирование классическими методами, последнее десятилетие специалисты уделяли большое внимание разработке новых моделей, подходов и методов решения такого рода задач. На сегодняшний день получен ряд важных и интересных результатов в этой области (см., например, [1-3]), некоторые из которых послужили отправной точкой данной работы.

Одним из популярных способов моделирования трафика, обладающего заданными самоподобными свойствами, является использование модели "Input M/G/œ ". Поскольку русская терминология в данной области ещё не сформировалась, будем использовать пословный перевод, и называть ее "моделью типа входная M/G/ГГ". Популярность этой модели обусловлена рядом её достоинств. Во-первых, она относительно проста и ее легко использовать для генерации искусственных трасс трафика произвольной длины, во-вторых она дает простое физическое обоснование самоподобных свойств трафика (такое, например, как наличие долговременных зависимостей и т.д.).

В данной работе мы рассмотрим один из возможных подходов к моделированию самоподобного трафика с заданными статистическими характеристиками с использованием модели "входная M/G/ГГ".

Основные определения

В дальнейшем изложении нам понадобятся определение самоподобия и достаточное условие самоподобия в широком смысле. В данном параграфе мы приведём необходимые определения, а также подробное описание исходной модели "входная M/G/ГГ".

Пусть X = {X} = (...,X1,X2,...) стационарный в широком смысле случайный процесс дискретного времени,

^ I{....,-1,0,1,...}.

Пусть л = EXt <<х>, xt = Xt - л (центрированный процесс), дисперсия и автокорреляционная функция процессов X и x есть:

varXt = varxt = a2 = Ex2t < да, (1)

rx (k ) =

E ( xtxt+k )

(2)

¡u, ox , rx (k) не зависят от t вследствие стационарности Xt и xt. Пусть

Xt(M) - _ ( Xtm-m+\ + ... + Xtm ) ,t G I, . (3)

1

т

Процесс X(т) = (...,Х(т),X2т),...)- стационарный в широком смысле случайный процесс с дискретным временем, обозначим

через гХт) ^) автокорреляционную функцию

процесса Х{(п).

Определение 1: Процесс X называется асимптотически самоподобным второго порядка с параметром Херста Н = 1 - Р / 2 ,

0<bb<1, если для всех k е I1 = {1,2,...}

lim 4m) (k) = - ((k + 1)2-ß - 2k 2-ß + (k -1)2-ß) = g (k). 2

(4)

Свойство: (доказано в [1]) Если lim rXm)(k)/ k ~ß = const, тоГда

(m) >m-ß = const •

1) limvar X(m) /

2) lim rXm\k ) = g (k ), kG t. (5)

Именно асимптотическое самоподобие второго порядка мы исследуем в данной работе, и далее будем называть его просто самоподобием.

Опишем модель трафика "входная M/G/ ГГ", обладающую самоподобными свойствами. Пусть имеется некоторый пуассоновский

процесс с интенсивностью X, и пусть At - количество пуассоновских событий в интервале [t, t +1), t g 1_ю . Обозначим через

A = (...A_1, A0, A1,...) последовательность независимых одинаково распределённых случайных величин At с пуассоновским законом

2 k

распределения Pr{At = k} = e "Я / k!. Предположим, что At - количество новых активных источников информационного трафика, появившихся в некоторой сети связи во временном окне t. Каждый такой источник имеет период активности в сети, после окончания которого он исчезает. Длина периода активности ("время жизни в сети") источника i, возникшего во временном окне t

(i = 1,2,...At ) - это случайная величина

ttj g I. Кроме того, каждый источник имеет свою скорость генерации информации в течение активного периода (измеряемую в условных единицах, называемых ячейками), которая описывается как случайный процесс

Stj (n), где n - время от начала этого периода, St j (n) g 10, n g 10. Пусть случайные пары

( Tt,i, Stj (n) ) независимы, одинаково распределены и не зависят A.

Определим сетевой трафик как случайный процесс Y = (...^_1з Y0, Y1,...), * А*

^ = 1 I !!к/< _ > * -к),

к = -го г = 1

(6)

где 1(.) индикатор события:

I (тк. > t - к) =

1, если т7 . > t - к

к, I

0, иначе

то есть значение случайного процесса Yt в момент времени t является суммарной интенсивностью генерации ячеек от всех активных

источников. Если EYt < го, то процесс Yt стационарный и эргодический.

Одним из самых простых, и в тоже время интересных для практики случаев является случай постоянной скорости, одинаковой для всех источников, когда

Stл (n) = R = const, а времена жизни источников являются независимыми одинаково распределёнными случайными величинами.

Теорема: (доказана в [1] ). Если для указанного выше частного случая для распределения времени жизни источника выполняется условие

const

lim Prjr > n} = —— , 1<а<2,

n

(7)

то процесс Yt будет асимптотически самоподобным второго порядка процессом с параметром Херста

H = (3 - а)/2.

(8)

Даже такой простой случай представляет богатые возможности для моделирования трафика, обладающего нужными статистическими характеристиками. Однако, он имеет и определённые ограничения. В частности,

одномерное распределение процесса Yt всегда является Пуассоновским с параметром Л = Я Ег. (9)

Модель трафика с источниками случайной скорости

Основное уравнение

Рассмотрим ситуацию, когда скорости источников не являются одинаковыми. Пусть

Stл (п) = Stл, где все Stл - независимые и одинаково распределенные случайные переменные, принимающие значения в 11. Как ранее

упоминалось, тгл тоже независимые и одинаково распределенные случайные величины, и Stл и т,л не зависят и друг от друга. Тогда не трудно показать, что:

да

EY = X ES £ Рг{т > п} = X ES Ет п = 0

да

= X ES2£Рг{т > п} = X ES2Ет, (10)

п=0

да

rY(к) = X ES2 £Рг{т > п + к} п = 0

Для этого случая нетрудно доказать теорему, аналогичную теореме из предыдущего параграфа. Используя эти результаты, можно получить процесс с заданной автокорреляционной функцией и одномерным распределением. Для этого необходимо решить следующую задачу - по заданному одномерному распределению трафика найти распределение вероятностей для скорости одного источника.

Для вывода основного уравнения воспользуемся аппаратом производящих функций. Пусть скорость отдельного источника имеет производящую функцию

да

ф500 = £Рг^ = к} • гк. (11)

k=1

Обозначим количество активных источников в момент времени I за . Как ранее

отмечалось, согласно (13) одномерное распределение случайного процесса является пуассоновским с параметром Л, поэтому производящую функцию процесса Yt можно записать как:

ф 7 (г) = £ ВД = k}(ф 5 (Г)) k =

k=0

= £

е

Лk (Ф , (г))4

к=0

4!

= ехр(Л(Ф я (г) -1)) ,(12)

1

откуда Ф 5 (г) = 1 + л 1П( Ф / (г)). (13)

Это и есть основное уравнение, связывающее распределение вероятностей для общего трафика с распределением вероятностей скорости одного источника в рассматриваемой модели.

Нахождение распределения

вероятности источника

Использовать полученное уравнение можно различными способами. Здесь мы представим некоторые результаты для случая, когда распределение вероятностей трафика задано в численной форме. Вид распределения неизвестен. Такой случай будет иметь место в ситуации, когда одномерное распределение процесса можно оценить по экспериментальным данным, например, построению гистограммы.

Для получения точных результатов нам необходимо сделать следующее ограничение. А именно, скорость источника не может быть

нулевой, т.е. Рг{£ = 0} = 0 . Это условие имеет вполне понятный физический смысл - источник не считается активным, если в процессе передачи пакеты от этого источника отсутствуют.

Пусть нам заданы параметр Херста Н и

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

набор вероятностей Рг^ = к}, к е 10. Введём обозначение:

Лк

Рк = ехР(-Л)—, к!

(14)

Нетрудно видеть, что, учитывая условие ненулевой скорости источника, можно записать Рг{^ = 0} = p0.

Отсюда Л = - ^(Рг{^ = 0}). (15)

Кроме того, Рг{^ = 1} = ^ Рг^ = 1} , тогда

Pr{S=1}="

Pr{Y = 1}

Pi

(16)

Продолжая подобные рассуждения далее, получаем

РОД = 2} = р РОД = 2} + р2 РОД + 52 = 2}

где и - независимые одинаково распределённые случайные переменные с минимальным значением 1. Значит,

Pr{^i + S 2 = 2} = (Pr{S = 1})2

и

Pr{S = 2} =

РОД = 2} - p2(Pr{S = 1})2 Pi

. (17)

Pr{Y = k} -£ Pm РГ jZ Sn = k l

Pr{S = k} =-—--- ,(18)

мы провели дискретизацию с шагом 15 миллисекунд. Значение процесса равно сумме размеров пакетов, прибывающих в систему в течение соответствующего временного интервала, делённой на размер условной ячейки (использованный размер ячейки 100 байт).

Чтобы применить рассматриваемый подход, для каждого из полученных процессов дискретного времени находим эмпирические оценки математического ожидания и дисперсии, а также оцениваем параметр Херста методом частичных дисперсий. По параметру Херста из (8) можно определить необходимое аа, и учитывая, что

Используя такой подход легко получить общее выражение для Рг{5 = ^ :

Pr{r = n} =

const

n

n = 1,2,...

P1

где Pr{Z Sn = k} может быть найдена, как m-

n=1

кратная свёртка моментов конечной последовательности Pr{S=1}, Pr{S=2}, ...,Pr{S=k-m}, где все эти вероятности известны из предыдущих итераций. Такая итерационная процедура является одним из возможных подходов к численному решению основного уравнения при условии ненулевой скорости источника.

Имитационное моделирование

Применим полученные формулы для имитационного моделирования самоподобного трафика с заданным одномерным распределением. Для экспериментов были выбраны трассы известной коллекции трасс трафика Ethernet фирмы "Bellcore". Приведем результаты экспериментов с трассами из файлов "BC-pOct89.TL" и "BC-pAug89.TL". Файлы типа TL состоят из записей, каждая из которых включает два поля данных, где первое поле - время появления пакета (в секундах, с 6 цифрами после запятой), а второе -размер пакета в байтах. В каждом из использованных файлов содержится 1000000 таких записей.

Чтобы преобразовать полученные данные в случайный процесс дискретного времени,

обеспечить выполнение (7).

Затем из (15) находим ЬЬ, а из (9) 11. Распределение скорости источника вычисляется итерациями (18). Соответствующие вычисления были проделаны для каждой из исследуемых трасс.

Необходимо заметить, что итерационная процедура (18), применённая к данным, полученным из гистограммы реального процесса, может на некотором шаге выдать отрицательное значение для очередной вероятности. Это означает, что для имеющихся данных основное уравнение не может быть решено точно. Для нахождения некоторого приближения, нами использовалась следующая эвристическая процедура: каждый раз, когда итерация (18) давала отрицательный результат, соответствующая вероятность принималась равной 0, и вычисления продолжались. Итерации останавливались, когда сумма всех найденных вероятностей становилась больше 1. Последняя вероятность корректировалась так, чтобы сумма равнялась 1.

Описанная выше процедура использовалась для получения распределения скорости источника, которое использовалось в программе имитационного моделирования для генерации искусственных трасс трафика.

На рис.1 и 2 изображены реальные одномерные распределения реального и сгенерированного с помощью программы имитационного моделирования трафиков для исследуемых трасс. В табл. 1 и 3 приведены

Рис. 1. Начальная часть одномерных распределений Рис. 2. Начальная часть одномерных распределений реального трафика файла "ВС-рОй89.Ти' реального трафика файла "ВС-рАид89.Ти'

и смоделированного трафика и смоделированного трафика

Таблица 1. Значения статистических характеристик для трафика файла "ВС-рОй89.Ти'

и смоделированного трафика

EYt var Yt H

Real 57,10 2555,03 0,91

Simul 50,89 2796,9 0,74

Таблица 2. Начальная часть распределения скорости источника для файла "ВС-рАид89.Ти', использовавшаяся при имитационном моделировании

k 1 2 3 4

Pr{S=k} 0,2062 0,1477 0,0292 0,1005

k 5 6 7 8

Pr{S=k} 0,0109 0,1339 0,0067 0,2987

Таблица 3: Значения статистических характеристик для трафика файла "ВС-рАид89.Ти'

и смоделированного трафика

EYt var Yt H

Real 22,47 1004,03 0,83

Simul 10,04 706,76 0,70

моменты процессов и значения их параметра Херста. В табл. 2 представлена начальная часть распределения скорости источника, вычисленная в соответствии с рассмотренной процедурой.

Из приведённых данных видно, что предложенный метод хорошо аппроксимирует одномерные распределения процесса (в их начальной части), но первые два момента смоделированного процесса могут весьма сильно отличаться от исходных.

Выводы

Представленные модель "входная M/G/ œ " и метод имитационного моделирования яв-

ляются удобным средством для генерации самоподобного трафика в ситуации, когда важно одномерное распределение на начальном участке. Повышение точности аппроксимации первых моментов может являться предметом дальнейшего изучения.

Благодарности

Данная работа выполнена при частичной финансовой поддержке Гранта президента Российской Федерации для молодых докторов наук МД-1639.2005.9 и при частичной финансовой поддержке Гранта Научно-образовательного центра "Математические основы дифракционной оптики и

обработки изображений" Самарского государственного аэрокосмического университета для молодых учёных, студентов и аспирантов.

СПИСОК ЛИТЕРАТУРЫ

1. Self-Similar Network Traffic and Performance Evaluation. / Ed. by K. Park and W. Willinger.

New York: Wiley, 2000.

2. V Paxson and S. Floyd. Wide Area Traffic: The Failure of Poisson Modeling. // IEEE/ ACM Trans. Networking, 1995, 3 (3).

3. N.Likhanov, B. Tsybakov and N. D. Georganas. Analysis of an ATM buffer with self-similar ("fractal") input traffic. // IEEE INFOCOM'95, Boston, pp. 985-992, April, 1995.

SELF-SIMILAR TRAFFIC MODELING AND SIMULATION

© 2006 A.Yu. Privalov, M.V. Baeva Samara State Aerospace University

Method for self-similar telecommunication traffic simulation is presented. It allows to simulate traffic with given Hurst parameter and given marginal probability distribution.

i Надоели баннеры? Вы всегда можете отключить рекламу.