Научная статья на тему 'Многоуровневая on/off модель Интернет трафика корпоративной сети спутниковой связи'

Многоуровневая on/off модель Интернет трафика корпоративной сети спутниковой связи Текст научной статьи по специальности «Математика»

CC BY
491
124
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Шелухин О. И., Лукьянцев Д. А.

Предложена многоуровневая ON/OFF-модель и алгоритм вычисления параметров модели на основе измерений реального трафика.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Multilevel ON/OFF-model of the Internet traffic in the enterprise satellite communication network

Multilevel on/off-model and its parameter estimation algorithm based on real traffic traces is proposed.

Текст научной работы на тему «Многоуровневая on/off модель Интернет трафика корпоративной сети спутниковой связи»

УДК 621.395

МНОГОУРОВНЕВАЯ ON/OFF МОДЕЛЬ ИНТЕРНЕТ-ТРАФИКА КОРПОРАТИВНОЙ СЕТИ СПУТНИКОВОЙ СВЯЗИ

О.И. Шелухин, Д. А. Лукьянцев

Предложена многоуровневая ON/OFF-модель и алгоритм вычисления параметров модели на основе измерений реального трафика.

Multilevel on/off-model and its parameter estimation algorithm based on real traffic traces is proposed.

Постановка задачи. Исследования Интернет-трафика [1, 2, 3 ,4, 5, 6, 7, 8] показали, что совокупный трафик, передаваемый с использованием TCP(Transmission Control Protocol) или НТТР (Hyper Text Transfer Protocol) не только монофрак-тален (самоподобен), но также и мультифрактален, а Интернет-трафик является монофрактальным на больших временных интервалах (5... 10 минут и больше), главным образом вследствие того, что распределение размеров файлов, передаваемых через Internet, является распределением с тяжелыми хвостами [9, 10, 11, 12]. Мультифрактальное поведение на малых временных интервалах обусловлено прежде всего динамикой протоколов управления потоками TCP, сетевых перегрузок, потери пакетов и повторной передачи пакетов.

Существует большое число протоколов, разработанных и используемых в Интернете для различных целей. Однако трафик, управляемый TCP (протокол управления передачей), доминирует уже на протяжении десятилетий. TCP обладает хорошо известным механизмом управления для надежной связи и избежания перегрузок [15]. Чтобы избежать перегрузки «узкого» маршрутизатора, размер всплеска (размер пакетов) ограничивается некоторым размером окна перегрузочного управления. TCP определяет размер окна в соответствии с его текущим состоянием и возникающими потерями пакетов. Алгоритм изменения размера окна зависит от версий TCP (например Reno и Tahoe). В частности, размер окна для TCP/Reno имеет малое начальное значение (1MSS

- максимальный размер сегмента от англ. Maximum Segment Size) и увеличивает свой размер на один MSS после получения подтверждения

от получателя. Этот этап называется «медленным стартом». TCP прекращает этап медленного старта и переходит к этапу избежания перегрузки, если счетчики TCP (потери пакетов или размеры окон) превышают значение параметра порога медленного старта, называемого ssthresh (slow start threshold). Стандартное значение для ssthresh устанавливается равным 64 Кбайт и его величина изменяется до половины минимума из двух значений

- текущего размера окна перегрузки или размера окна получателя.

Пакетные потери TCP рассматривает как показатель того, что сеть перегружена. На этапе избежания перегрузки TCP медленно увеличивает свой размер окна на один пакет в течение каждого времени полного оборота и уменьшает свой размер окна до половины при обнаружении новой потери пакета.

Рассмотрим типичный web-трафик, передаваемый через Интернет. Так как большинство объектов на обычной web-странице являются небольшими графическими или текстовыми файлами, соответствующее TCP-соединение обычно передает информацию на большей части времени своего существования, находясь на этапе медленного старта, и структура поступления пакетов во многом схожа с ON/OFF-процессом. TCP отправляет серию пакетов за время ON-периода. OFF-период грубо приравнивается к времени полного оборота в сети (Round-Trip Time (RTT)). Отметим, что исходный ON/OFF-процесс [15] моделирует время жизни TCP-сеанса и время обдумывания пользователя.

Для моделирования трафика на малых масштабах времени при одном TCP-соединении предлагается многоуровневая ON/OFF-модель (рис.1), имитирующая характер функционирования типичного соединения в Интернете.

P [T >t ]=

Рис. 1. Модель трафика для одной TCP сессии

Верхний уровень - это ON/OFF-процесс, моделирующий время жизни TCP-сеанса (T11) и время раздумывания пользователя (T10). Чтобы охватить поведение TCP-механизма, существует и другой ON/OFF-процесс внутри ON-периода T11 для ON/OFF-процесса верхнего уровня. Такой подход имитирует структуру всплесков поступлений временем активности (длительность всплеска T21) и временем отсутствия активности (T20) в рамках одного и того же TCP-соединения. Интенсивность пакетов B, Байты/А, в T21 предполагается постоянной.

Величины T11 и T21 описываются распределениями «Парето I» с параметрами (K11, a11) и (K21, a21) соответственно: T11 е Pareto (K11, a11) и T21 е Pareto (K21, a21). Дополнительная функция распределения Парето I имеет вид

(K/t)a , апёе t > K,

1, апёе t < K.

Интервалы времени раздумывания пользователя T10 и времени отсутствия активности T20 выбраны в виде экспоненциально распределенных случайных величин 710econst exp(1/ A,10), T20econst exp(1/ A^0) со средними значениями 1/X10 и 1/X20 соответственно. Все эти случайные величины статистически независимы друг от друга. Искусственный трафик генерируется, объединением N независимых многоуровневых ON/OFF- процессов со скоростью передачи B, Байт/с.

Оценка параметров и согласование модели

Для оценки параметров предлагаемой модели трафика необходима следующая информация, описывающая формат реальных трасс Интернета, наблюдаемых в «узком» маршрутизаторе:

временная метка: время поступления пакета; размер пакета: длина пакета; адрес источника: IP-адрес хоста-источника; адрес назначения: IP-адрес хоста назначения; порт источника: номер TCP-порта источника; порт назначения: номер TCP-порта назначения; TCP флаг: показывает SYN, SYN-ACK и FIN пакеты.

Каждое ТСР-соединение можно выделить, используя пару источник - получатель (1Р-адрес источника, 1Р-адрес получателя). Объединенный трафик X формируется при помощи временной метки и соответствующего ей размера пакета, который соответствует /-му временному интервалу. Временной интервал между БУК- и БУК- пакетами некоторого ТСР-сеанса определяется как время'' Л Л жизни сеанса. Подобным образом время между ^ ^ БУК и БУК-АСК- пакетами задает величину времени полного оборота. Исходя из этих наблюдений, можно оценить следующие статистические характеристики:

среднюю интенсивность трафика (МХ/); автокорреляционную функцию Я(к); логарифмическую диаграмму Ц ; среднее время полного оборота (МГ20); среднее время сеанса (МГц).

Имея реальную трассу Интернета, можно оценить соответствующие параметры модели, сгенерировать с помощью нее искусственную трассу трафика и показать, что искусственный трафик имеет схожие статистические свойства и характер построения очередей по отношению к трассе реального трафика. Т О А

В соответствии с определением многоуровне^ вой модели, объединенный трафик может быть записан на основе суммы независимых и одинаково распределенных индикаторных функций.

Общее число байт многоуровневого ОК/ОТТ-процесса определяется выражением

г ш п

и (г )=В (и )Ук (и )Л , (1)

0 к=1

где ик(г) и ¥]() - индикаторные функции, определяемые как

Щг) =1 {к-е соединение находится в состоянии ОК в момент г};

Ук(г) =1 {к-е соединение находится в состоянии «Активное» в момент времени г}.

Отдельный ОК/ОТТ-процесс можно рассматривать как частный случай многоуровневого ОК/ОТТ-процесса установкой В = 1 и ¥к(г) = 1 для

всех t. Следовательно, общее число байт одноуровневого ОК/ОРР-процесса на интервале [0, Т) определяется как

Т N

YТ(u¥и . (2)

0 к=1

Для больших N и Т агрегированный кумулятивный процесс {7 (Т?), ?>0} статистически ведет себя как

ЕТ11 -^ТНу[ЙеитБн (0,

TN=-

(З)

ЕТ11+ ЕТю

где Н = (3 - о11)/2 - показатель Херста; Бн(t) -стандартное фрактальное броуновское движение.

Выражение (3) иллюстрирует связь между показателем Херста Н (параметр самоподобности) и параметром формы аи (параметр распределения Парето), а также объясняет, что самоподобность Интернета-трафика в основном обусловлена тяжелым хвостом распределения размеров файлов, которые обычно передаются по сети Интернет.

Поскольку ОК/ОРР-процесс более низкого уровня существует только за время ОК-периода процесса более высокого уровня, то при условии шах(ЕТ21, ЕТ20) << ЕТц можно получить следующее соотношение между 7(0 и Y ():

llm=YSt)=M[V]B .

— Y (t)

а=2Н-1=2-а11. В [15] рассмотрен асимптотически объективный и эффективный способ оценки наклона логарифмической диаграммы в пределах некоторой области. Применим этот метод для вычисления параметра модели аи через оценку наклона а на больших временных интервалах. Аналогичные рассуждения проведем при рассмотрении трафика X] на малых временных интервалах. Если предположить, что Тц>>Т21 и Т20, то в поведении трафика на малых временных интервалах доминирует нижний уровень ОК/ОРР-процесса У{(). Когда рассматривается верхний уровень ОК/ОРР-процесса ик^) на малых временных интервалах, ик(^ ведет себя как постоянная величина. Поэтому можно записать:

N

Иш7(?) = ИшБ [ ^ ик(и)¥к(u)du «

t — G

t—G J

G k=1

N

(4)

При t ^ да агрегированный кумулятивный трафик многоуровневого ON/OFF-процесса Y(t) статистически ведет себя как ФБД.

Чтобы согласовать статистические свойства 2-го порядка для реального трафика, оценим параметры модели на основе реальной трассы. Вместо использования кумулятивного процесса Y(t) определим процесс приращений Xi для исследуемого трафика.

Процесс приращений Y(t) определяется как

X=Y((i +1)D)-Y(iD), i=0,1,2,3,.... (5)

где A - минимальное интересуемое временное разрешение.

Процесс приращений Xi рассматривается как общая байтовая нагрузка, поступающая на интервале [i A, (i+1) A).

В случае, когда t ^ да, агрегированный интегральный трафик многоуровневого ON/OFF- процесса Y(t) статистически подобен фрактальному броуновскому движению.

Логарифмическая диаграмма процесса Xi на больших временных интервалах имеет наклон

* B^Uk(0)lim jv(u)du , (6)

k=1 0

где приращение процесса Y(t) определяется как

Xt = Y ((i + 1)A) - Y (iA) =

(i+1)A N

= B j Juk(u)Vk(u)du, i = 0,1,2,3,.... (7)

iA k=1

На малых временных интервалах это ON/OFF- процесс другого (нижнего) уровня. Из-за структуры многоуровневой ON/OFF-модели на логарифмической диаграмме в области малых временных интервалов имеется другая линейная область. Это обусловлено ON/OFF-процессами нижнего уровня. В области малых временных интервалов для оценки параметра модели а21 можно также использовать способ оценки наклона логарифмической диаграммы в пределах некоторой области.

Параметр Кц оценивается 1-м моментом времени продолжительности сессии:

Кп= ^ MT11.

а11

(8)

В отличие от оценки К11 методом подбора средней продолжительности сессии Тц, у записей реального трафика не существует управляющего пакета, указывающего на начало и конец каждого активного периода Т2і. Примем, что при наблюдении за процессом на малых временных интервалах ON/OFF-процесс верхнего уровня всегда сохраняет свое состояние. Параметр К21 оценивается нормированной функцией автокорреляции Л„(ґ) из X

При t ^ 0, полагая, что функция U(t) является константой, автокорреляционная функция многоуровневого ON/OFF-процесса имеет вид

R(t)*N(AB)2E[U2(0)]E[V(0) V(t)].

Тогда n11(t) = Р [V(t) = 1 |V(0) = 1] и нормированная автокорреляционная функция Rn(t) преобразуется к виду

R (t) = R0 * E [V(0)V(t)] = n () R(0)~ E [V2(0)]

Pr [V (t) = 1, V (0) = 1] .. n ...

= —i_w---------------J = _(t), при t ^ 0. (9)

Pr[V(0)] = 1 nw, F W

Предположим, что V(t) - стационарный

ON/OFF- процесс, и уравнение восстановления

для nn(t) выглядит как t

Пц(t)=G1c(t)+jF1c(t-u)dHw(u), (10)

0

где G1c(t) =P [остаток жизни первого ON- интервала > t при условии, что в момент t= 0 находится в ON состоянии];

F1c = P[T21 >t ] - дополнительная функция распределения (ДФР);

Hio(u) = ^ 1(F1 * F0 ) k q - функция восстановления, соответствующая распределению времени между восстановлениями F1 *F0, знак * обозначает свертку, а Fi(t), i = 1,0, является ДФР ON-и OFF- периодов соответственно.

Важное значение имеет поведение Rn(t) около t=0, при котором справедлива аппроксимация

Rn (t) * G1c (t) при t^ 0.

Учитывая, что T21 имеет распределение Pareto(K21, a21), получаем

G1c (t) - j( Kf

а2

Параметр К2\ может быть оценен при помощи следующей методики:

К21 = Д (а21 К (Д))1/(а21-1) при 0,

где Яп(Д): = £ХгХг+1/£Х2 .

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

/ /

Показано, что при малых t функции Яп (?) и

О1о (?) хорошо соответствуют реальным записям

трафика. Для оценки параметра 1/А,20 или (что равноценно) среднего периода отсутствия активности требуется измерить из экспериментальной трассы время полного оборота в сети. Оно может быть получено из реальной трассы на основе ин-

тервала времени между и 8УК-ЛСК-

пакетами, следующими в начале каждого ТСР-сеанса. В рассматриваемой модели, время полного оборота равно ОРР-периоду Т20 модели нижнего уровня:

1/^20 =МТ20. (12)

Предполагая, что соединения независимы, можно записать

R1 =

MT

11

MT11 + MT10

и RR2 =

MT

21

MT21 + MT20

Тогда

МХ; = N Д БК1К2, (13)

МХ;2 = N (Д Б)2 Я1Я2, (14)

и параметр В, оценивающий постоянную скорость передачи данных в период активности Т21, выражается формулой

B =

MXf A MX i

(15)

If \^21 1fa21~1

21 ' du=K-------1 ‘a21+1. (11)

Оценка статистических характеристик Интернет-трафика в спутниковой сети

На рис. 2 показана топология сети и сильно перегружающийся маршрутизатор ^о8-сервер) сетевой системы. Оценим параметры модели трафика данных с искусственного спутника земли (ИСЗ) на наземную станцию (от Интернет до пользователя) и сгенерируем искусственную запись трафика предлагаемой модели с соответствующими параметрами. Были проанализированы и сравнены с предлагаемой моделью как минимум десять очень длинных записей (более часа) с высоким временным разрешением (1с).

В результате экспериментальных измерений были получены следующие параметры модели: Кп = 1,27с; К21 = 0,54 мс; аи = 1,35; а21=1,77; 1/^10=167,55 с; 1/^20=128,75 мс; Б=1926 Байт/мс; N=1000.

Как было показано выше, самоподобность Интернет-трафика главным образом обусловлена тем, что распределение размеров файлов, которые обычно передаются через Интернет, является распределением с «тяжелым хвостом». Поэтому большой интерес представляет распределение Парето в течение ОК- периода.

В [10]показано, что плотность распределения

вероятностей (ПРВ) Парето ю р (?)=аКа? ~а-1 может

быть аппроксимирована взвешенной суммой N функций ПРВ с экспоненциальным распределением со средними у7^«=0,1,.. .,N-1.

LM1-1

Спутниковый Мар шрутизатор

модем

PC PC

Рис. 2. Топология сети и сильно загруженного шлюза

Определим случайную переменную У., = £ И1 Х , где Хп имеет экспоненциальную

м 4^^п=0 п

функцию плотности распределения:

Поэтому рассмотрим а-е моменты случайной переменной YN :

ю X :=— exp

Xn Yn

Y

(16)

/

Тогда плотность распределения вероятности

YN равна

M [YN ]=G (N )1 ^ N M [Xa ]. Пусть N^a), тогда lim M[YN]=-1=^M[X0a].

N ^да 1-0y

(19)

(20)

N-1

(17)

/

(t )=G (N )^0n -V- exp

n=0 Y '

где параметр 0 - фактор веса.

Поскольку для ПРВ должно выполняться равенство

Поскольку Х0 имеет экспоненциальное распределение, то М[Ха ] <да для всех а < да. Можно выбрать фактор масштаба у = 2, тогда весовой фактор 0=2-а. Среднее значение смешанной ПРВ равно

^-1а п Уп

,0 ®Yn (t)=1,

M[Yn ] = G(N)Y “0

< d n = 0

1-0

то получим фактор нормализации G(N)=- N •

1-0

Заметим, что а-е моменты распределения Парето расходятся, когда а > а, т.е.

/•да /*да

М[Ра]=| ?аюР (?У?=аКа I Га-1+аdt, (18)

Лк Лк

Для определения среднего значения распределения Парето с параметрами аК/(а-1) получим

1 - (0y)N а-1

v = G( N )-

(21)

1 -0у аК

Аппроксимация распределения Парето взвешенной суммой экспоненциальных распределений изображена на рис. 3.

Рис. 3. Аппроксимация ПРВ Парето суммой взвешенных экспоненциальных распределений с различными N

Предложена многоуровневая ОМОРР-модель и алгоритм вычисления параметров модели на основе измерений реального тра вой ОМОРР-модели сост вать схему получения уровне и установить соеди В предлагаемую модель

1ка. Идея многоуровне-^ в том, чтобы имитиро-гетов ^СР на нижнем дения на верхнем уровне. елючены такие парамет-

ры сети, как время передачи туда и обратно, скорость передачи данных, а^акже параметры распределений Парето. Он

Показано, что распределение Парето в течении ON- периода может аппроксимироваться взвешенной суммой экспоненциальных распределений.

ЛИТЕРАТУРА Н

1. Taqqu M., Teverosky ^., Is network traffic self-

similar or multifractal. № Fractals, vol. 5, no. 1, 1997, pp. 63-73. fi

2. Riedi R. V’ehel J.L., Multifract^l properties of tcp

traffic: A numerical study. Tech. Rep. 3129, INRIA, Feb. 1997. Д

3. Paxson V., Floyd S., Why we don’t know how to simulate the internet in Winter Simulation Conference, 1997, pp. 1037-1044.

4. Erramilli A., Narayan O., Willinger W., Experimental queueing analysis withlong-range dependent packet traffic, IEEE/ACM Transactions on Networking, vol. 4, no. 2,

1996, pp. 209-223.

5. Veres A., Boda M., The chaotic nature of TCP congestion control, in Proceedings of INFOCOM, 2000, pp. 1715-1723.

6. Crovella M., Bestavros A., Explaining world wide web traffic self-similarity, Tech. Rep. 1995-015, CS Dept. Boston University, 1995.

7. Guo L., Crovella M., Matta I., TCP congestion control and heavy tails, Tech. Rep. 2000-017, CS Dept. Boston University, Mar. 2000.

8. Guo L., Crovella M., Matta I., How does TCP generate pseudo-selfsimilarity, Tech. Rep. 2001-014, CS Dept. Boston University, 2001.

9. Crovella M.E., Bestavros A., Self-similar in world

wide web traffic: Evidence and possible causes,

IEEE/ACM Transactions on Networking, vol. 5, no. 6,

1997, pp. 835-846.

10. Grossglauser M., Bolot J., On the relevance of long-range dependence in network traffic, IEEA/ACM Transactions on Networking, vol. 7, no. 5, 1999, pp. 629-640.

11. Willinger W., Taqqu M.S., Sherman R., Wilson D.V., “Self-similarity through high-variability: statistical analysis of Ethernet LAN traffic at the source level,” IEEE/ACM Transactions on Networking, vol. 5, no. 1, 1997, pp. 71-86.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

12. Makowski A.M., Bounding on-off sources-variability ordering and majorization to the rescue, Tech. Rep. ISR TR2001-13, ISR Univ. of Maryland, 2001.

13. Resnick S., Heavy tail modeling and teletraffic data, in Annals of Statistics 25:1805-1869, 1997.

14. Gilbert A.C., Willinger W., Feldman A., Scaling analysis of conservative cascades with application to network traffic, IEEE Transactions on Information Theory, vol. 45, no. 3, 1999, pp. 971-991.

Поступила 01.11.2005 г.

о

i Надоели баннеры? Вы всегда можете отключить рекламу.