Научная статья на тему 'Мультифрактальный анализ самоподобного WAN-трафика'

Мультифрактальный анализ самоподобного WAN-трафика Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
388
183
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шелухин О. И., Осин А. В.

Исследованы мультифрактальные свойства WAN-трафика на основании анализа экспериментальнополученных статистических характеристик составляющих трафика Internet (протоколы IP, http, TCP, UDP); показано, что масштабная структура в WAN-трафике может быть разбита на две категории: масштабирование на больших масштабах времени с самоподобностью и масштабирование на малых масштабах времени с мультифрактальным масштабированием.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On the basis of experimental statistics analysis for components of Internet-traffic (IP, http, TCP, UDP) the multifractal properties of the WAN traffic are examined; It was shown that the WAN traffic scaling structure can be break in two categories, namely scaling on the large time scales with self-similarity and scaling on the small time scales with multifractal scaling. Постановказадачи

Текст научной работы на тему «Мультифрактальный анализ самоподобного WAN-трафика»

УДК 621.396.67

Мультифрактальный анализ самоподобного WAN-трафика

О.И. Шелухин, А.В. Осин

Исследованы мультифрактальные свойства WAN-трафика на основании анализа экспериментально полученных статистических характеристик составляющих трафика Internet (протоколы IP, http, TCP, UDP); показано, что масштабная структура в WAN-трафике может быть разбита на две категории: масштабирование на больших масштабах времени с самоподобностью и масштабирование на малых масштабах времени с мультифрактальным масштабированием.

On the basis of experimental statistics analysis for components of Internet-traffic (IP, http, TCP, UDP) the multifractal properties of the WAN traffic are examined; It was shown that the WAN traffic scaling structure can be break in two categories, namely scaling on the large time scales with self-similarity and scaling on the small time scales with multifractal scaling.

Постановка задачи

Современные исследования измерений трафика большого количества реальных телекоммуникационных сетей [1-6], проведенные с высоким разрешением, доказывают, что сетевой трафик является самоподобным (фрактальным) по структуре, т.е. пульсирующим в широких пределах временного масштаба.

Рассмотрим два из наиболее часто встречаемых сетевых окружений: локальные сети (LAN) и глобальные сети (WAN).

Самоподобность LAN-трафика приводит к структурным моделям, которые могут быть сведены к ON/OFF-источникам (также известным как пакетные серии ) с характерным свойством: их ON- и/или OFF-периоды подчиняются распределениям с «тяжелыми хвостами» ( РТХ) с бесконечной дисперсией. Наложение ON/OFF-процессов определяет непосредственную связь между характеристиками самоподобности на макроскопическом уровне и тяжело-хвостовыми явлениями, наблюдаемыми на микроскопическом уровне, т.е. между объединенным потоком трафика и структурой трафика, которая присуща отдельным парам «источник-получатель» [1, 2].

Сети WAN, в отличие от LAN, обеспечивают взаимосвязь между пользователями (например, центральные ЭВМ для различных LAN), которые расположены, как правило, в различных географических регионах. Самая известная WAN - это Интернет (глобальная сеть, объединяющая более десяти миллионов хостов и пользователей). Доказательство самоподобности WAN-трафика представлено в [3-6], где на основе анализа нескольких различных трасс WAN-трафика показана неадекватность традиционных моделей экспоненциального (пуассоновского) трафика при описании ключевых моментов поведения WAN-трафика.

Взаимосвязь между размерами файлов и самоподобным трафиком была исследована в [7], а также подтверждена в [8], где показано, что самоподобность в WWW-трафике может возникать благодаря тяжело-хвостовому распределению файловых размеров, присутствующему в Web.

Позже были предприняты попытки получения структурных моделей для WAN-трафика, в том числе такое же приведение к ON/OFF-моделям для отдельных пар «источник-получатель», и описания WAN-трафика на уровне отдельных приложений, например, TELNET, FTP и HTTP.

В [9] показано, что самоподобный трафик может возникать в результате высокоуровневости комплексной системы, в которой размеры файлов, передаваемых через сеть, имеют тяжело-хвостовое распределение. Наложение множества подобных пересылок типа клиент/сервер в сетевом окружении также порождает самоподобный трафик. Этот причинный механизм в значительной степени связан с изменениями сетевых ресурсов (критическая пропускная способность и вместимость буфера), топологии, с вмешательством постороннего трафика с несходными характеристиками и с изменениями в распределении времен между поступлениями файловых запросов.

Таким образом, для LAN, так же, как и для WAN, самоподобность объединенного сетевого трафика является прямым результатом структурных моделей, которые повторяют сетевую динамику на нижних сетевых уровнях и определяют характеристики трафика на этих уровнях, что подтверждено реальными измерениями трафика с высоким разрешением. Полученные модели являются простыми и экономичными, давая возможность получить требуемые свойства, которые были бы устойчивы к постоянно изменяющимся условиям сети.

Вместе с тем ряд исследований, например [10], отмечают, что не все можно трактовать так однозначно. Реальные процессы, в частности, в сети Интернет, не являются стационарными, что чрезвычайно важно и должно учитываться при описании трафика. В этих исследованиях помимо оценок долговременной зависимости и маргинальных распределений с тяжелым хвостом предлагается добавить нестационарность как одну из основополагающих характеристик WAN-трафика.

Широкое распространение мультимедийного трафика только усложнило ситуацию, способствуя появлению самоподобного сетевого трафика.

Статистический анализ трафика WAN на уровне приложений

Обоснование подходов структурного моделирования для WAN-трафика требует проверки совместимости измеренного WAN-трафика на уровне приложения как с пуассоновскими моментами поступления сеансов, так и с временами жизни сеансов. Подробная информация относительно структуры поступлений пакетов в пределах сессии важна для определения того, является ли статистически самоподобный предельный процесс подходящим для точного описания реального WAN-трафика. С этой целью необходимо провести опытные исследования. Применительно к приложениям WAN целесообразно останавливаться на измеренных трафиковых трассах. В то время как FTP-трафик все еще занимает основную часть доступной пропускной способности WAN, http-трафик продолжает увеличиваться в масштабе и начинает смещать FTP с лидирующей позиции. Качественно отличается от них TELNET-сервис с гораздо меньшим занятием пропускной способности, но генерирующий большое число пакетов, часто по пакету на нажатую клавишу.

Что касается стохастических свойств поступлений сетевых сеансов, то по результатам исследований видно, что моменты поступлений сетевых сеансов явно имеют суточный цикл. Например, пик сеансов TELNET наблюдается в дневные часы и имеет достаточно низкий уровень ранним утром, что почти идентично по строению со структурой вызовов, наблюдаемой в традиционной телефонии. В [12] показано, что поступления TELNET- и FTP-сеансов хорошо моделируются неоднородными пуассоновскими процессами с интенсивно-стями, которые постоянны в пределах часа, но могут изменяться от одного часа к другому.

Мультифрактальный анализ WAN-трафика.

В некоторых исследованиях было обнаружено, что

масштабная структура в измеренном WAN-трафике может быть разбита на две категории: масштабирование на больших масштабах времени с самоподобностью и масштабирование на малых масштабах времени с мультифрактальным масштабированием [13-15]. Переход от мультифрак-тального масштабирования к самоподобному возникает на масштабах времени, соизмеримых с обычным временем полного оборота в сети [14, 15]. В некоторых работах также рассматриваются физические объяснения и последствия таких свойств трафика [16].

Использование мультифракталов для моделирования сетевого трафика достаточно ново и на данный момент доступно лишь несколько результатов. В частности, в [17, 18] показано, что, хотя самоподобность и адекватно описывает LAN-трафик, трассы WAN-трафика обладают более общими, мультифрактальными свойствами, потому что в WAN на малых и средних масштабах времени влияние сетевой динамики может преобладать над поведением пользователей. Масштабное поведение, выявленное в WAN-трафике, может быть воспроизведено при помощи каскадной конструкции, т.е. мультипликативного процесса, который назначает вес на последовательно уменьшающихся временных интервалах в соответствии с некоторым распределением (зависящим от уровня деления). В пределе, когда число уровней деления стремится к бесконечности, такая процедура позволит сгенерировать мультифрактал [19].

Самоподобность трафика Internet. В настоящее время доминирующим типом обслуживания Internet является best-effort обслуживание, которое означает, что полоса пропускания разделяется поровну среди всех потоков трафика, а управление передачей смещено к оконечным узлам канала связи. В то же время Internet изначально базируется на взаимодействии клиентов с серверами, которые обеспечивают индивидуальными услугами пользователей Internet, а также приложения, работающие на персональных компьютерах и мобильных терминалах, запрашивающих услуги.

Узлы сети и терминалы делят информационный поток на пакеты, к которым добавляются заголовки и хвосты для адресации и контроля информации на пути следования от приложения к физической среде. В обратной последовательности заголовки и хвосты отсекаются для обеспечения приложений информацией. Различные приложения используют различные протоколы передачи в зависимости от их требований к трафику (напри-

мер, TCP и UDP). Эти протоколы используют со-кеты для связи с уровнем приложения. Между протоколами передачи и протоколами уровня соединения в Internet находится IP-протокол.

Измерения канала связи в коммерческой Internet-магистрали в течение двух периодов (24-часового и 7-дневного) показали, что в совокупном Internet-трафике доминирует Web-трафик, с долей TCP-составляющей для большей части трафика - 95% [17]. Наибольшей частью TCP-трафика в измеренных соединениях является Web-трафик, который доминирует как единственное Internet-приложение, с клиент-серверным составляющим для более половины байт (65-80 %), пакетов (5575 %), и потоков (65-75 %). До изобретения Web большая часть TCP-трафика состояла из передач файлов FTP, электронной почты и некоторых интерактивных приложений. После внедрения WWW, который основан на протоколе передачи гипертекста HTTP на уровне приложения и TCP на уровне передачи, Web-трафик стал доминирующим в совокупном Internet-трафике.

Обычно Internet-трафик разделяется на TCP и UDP (по используемому протоколу передачи) или на Web, TELNET, FTP или e-mail (по программе). Кроме того, каждая из этих частей трафика состоит из многих мультиплексированных потоков от различных соединений. Один пользователь может запускать одно или большее число потоков одновременно (например, параллельные соединения в одной сессии с целью ускорения или запуск с одного браузера нескольких сессий).

Хотя TCP-трафик в настоящее время доминирует в Internet, но имеется значительная доля UDP-трафика, который также применяется для связи между серверами. UDP удобен для услуг реального времени и может использоваться в комбинации с RTP-протоколом.

Проведем анализ масштабирования IP-трафика, останавливаясь на характеристиках составляющих агрегированного трафика на транспортном и на прикладном уровнях.

Покажем, что корреляционная структура агрегированного трафика в основном определяется составляющими с наибольшей дисперсией и корреляциями на исследуемых масштабах времени.

Результаты экспериментальных исследований

На рис. 1 показана интенсивность трафика, байт/с, для типичного потока IP-трафика и его основных составляющих (TCP, UDP, HTTP) на интервалах разбиения 100 мс. Структура сети, в которой проводились измерения, приведена в работе [11].

Рис. 1. Интенсивность IP-, TCP-, UDP- и HTTP-трафика

Как видно, всплески трафика можно наблюдать на всем интервале измерения, и можно сделать вывод, что сильные всплески на коротком интервале времени могут возникать в любое время суток, поэтому хорошо известная концепция «часа наи-

большей нагрузки», используемая в телефонии, не применима. Анализ данных говорит о том, что TCP-данные транспортного уровня доминируют в трафике и характер этих данных определяет характеристики IP-трафика.

Анализ масштабирования. Рассмотрим мультифрактальные и монофрактальные (например самоподобные) масштабные структуры компонент Internet-трафика. По введенной выше терминологии временной ряд {X, i = 1, 2, ..., n} называется мультифрактальным, если логарифмы функций разбиения Sm(q) или абсолютные моменты (что эквивалентно) зависят линейным образом от логарифма уровня агрегирования m, т.е.

Sm(q) = <q)log(m) + c,(q),

где Sm(q) = 2П% 1|q при Z« = Zj=1X(Jt^;

Ci(q) = const.

Масштабное поведение также может быть протестировано при помощи методов, основанных не вейвлет-представлении. Дискретное вейвлет-преобразование представляет собой ряд X размера n на масштабном уровне j при помощи набора вейвлет-коэффициентов dX(j, к), к = 1, 2, ..., nj, где П = 2-jn.

Определим q-й порядок логарифмической диаграммы (q-LD) как логарифмически-линейный график оцененного q-го момента

jUj (q ) = 1/nj dX (j, k)|q октавы j. Линейность

логарифмических диаграмм при различном порядке моментов q говорит о масштабном свойстве ряда, т.е. справедливо выражение

log2 Uj (q) = ja(q) + c2 (q), где a(q) - показатель масштабирования; c2(q) = const; a(q) - зависимость, выявляющая тип масштабирования.

Результаты мультифрактального анализа наиболее характерных составляющих (IP, TCP, UDP, HTTP) Internet-трафика представлены на рис. 2-5.

На рис. 2 изображены логарифмические диаграммы вейвлет-коэффициентов с вычтенным средним значением для различного порядка q с шагом 0,5.

На рис. 3 представлены мультифрактальные спектры Лежандра для q е [0,5; 4] с шагом 0,5 для диапазона изменения интервала разбиения от 1 до 1000 значений на интервал.

Логарифмы функций разбиения Sm(q) и функции T(q) для различных видов трафика представлены на рис. 4 и 5 соответственно.

Рис. 2. Логарифмические диаграммы вейвлет-коэффициентов с вычтенным средним значением для различного порядка д с шагом 0,5

Проведенная оценка функции масштабирования т(д) на рис. 5, основанная на функциях разбиения, показанных на рис. 4, также подтверждает сделанные предположения относительно муль-тифрактального масштабирования.

Рис. 3. Мультифрактальные спектры Лежандра для q е [0,5; 4] с шагом 0,5

При исследовании рядов данных для протоколов транспортного уровня масштабный анализ показал, что трафик этих протоколов обладает свойством ДВЗ. В случае TCP обнаружено, что его масштабная структура подобна масштабной

структуре IP-трафика, а оцененные функции i(q), показанные на рис. 5, имеют сходство с теми, что получены для IP-трафика. Поэтому можно сделать вывод, что TCP-трафик также проявляет мультиф-рактальное масштабирование. Аналогичные выводы справедливы и для протокола UDP.

Анализ масштабной структуры протоколов уровня приложений, в частности HTTP, показал, что функция масштабирования i{q) является выпуклой кривой, что говорит о присутствии муль-тифрактальности. Оцененная функция i{q) подобна такой же, как и для IP- и TCP-трафика. Заметим, что трафик SMTP не проявляет масштабной структуры.

Представленные результаты подтверждают выводы, сделанные в [7, 6, 9], о том, что WAN-трафик является ДВЗ, а также позволяют утверждать, что WAN-трафик обладает сложной муль-тифрактальной структурой не только на малых, но и на больших масштабах времени. Более того, анализ показывает, что агрегирование состоит из составляющих с сильно отличающимся масштабным поведением (без масштабирования, с муль-тифрактальным и с монофрактальным масштабированием).

На транспортном уровне и TCP и UDP проявляют ДВЗ и содержат мультифрактальную структуру. Обнаружено, что другие протоколы на этом уровне соответствуют КВЗ без свойств масштабирования.

Можно сделать вывод о том, что исследованный IP-трафик является ДВЗ, поскольку содержит составляющие с различными свойствами масштабирования, а это приводит к сложной мультифрак-тальной структуре агрегированного WAN-трафика, даже на больших масштабах времени.

Вейвлет-анализ демонстрирует, что Internet-трафик монофрактален в больших масштабах времени (5-10 мин и больше), что обусловлено, главным образом, медленным убыванием «хвоста» распределения размеров файлов, передаваемых по Internet [7, 8, 20, 21]. Однако поведение трафика в малых масштабах времени намного сложней и является мультифрактальным [22-25], что обусловлено прежде всего динамикой протоколов, таких как контроль потоков TCP, сетевых перегрузок, потерь пакетов и повторных передач пакетов. В [25] монофрактальное поведение на больших масштабах времени объясняется совокупностью значительного количества независимых ON/OFF-потоков. Продолжительности ON- и OFF- интервалов в их моделях имеют распределение с мед-

Рис. 4. Логарифмы функций разбиения Sm(q)

Рис. 5. Зависимость функции z(q) для различных видов трафика

ленно убывающим хвостом, которые соответствуют полной времени передачи одного файла и времени обдумывания пользователя соответственно.

Мультифрактальное поведение 1п1егпе1;-трафика в малых масштабах времени, главным образом, воздействует на механизм управления ТСР-потоками. Соответствующие параметры связи, такие как время хода туда и обратно (ЯТТ), продол-

жительность сеанса TCP и активное время импульса играют важную роль в поведении трафика.

Таким образом, масштабная структура в WAN-трафике может быть разбита на две категории: масштабирование на больших масштабах времени с самоподобностью и масштабирование на малых масштабах времени с мультифрактальным масштабированием. Переход от мультифрактального мас-

штабирования к самоподобному возникает на масштабах времени порядка обычного времени полного

оборота в сети.

ЛИТЕРАТУРА

1. Leland W.E., Taqqu M.S., Willinger W., Wilson D.V., On the self-similar nature of Ethernet traffic, Computer Communications Review, 23:183-193,1993. Proceedings of the ACM/SIGCOMM'93, San Francisco, September 1993. Reprinted in Trends in Networking -Internet, the conference book of the Spring 1995 Conference of the National Unix User Group of the Netherlands (NLUUG). Also reprinted in Computer Communication Review, 25, No. 1 (1995), 202-212, a special anniversary issue devoted to "Highlights from 25 years of the Computer Communications Review".

2. Leland W.E., Taqqu M.S., Willinger W., Wilson D.V., On the self-similar nature of Ethernet traffic (extended version), IEEE/ACM Trans. Networking, 2:1-15, 1994.

3. Paxon V., Floyd S., Wide-area traffic: The failure of Poisson modelling, In Proceedings of the ACM Sig-comm '94, рр. 257-268, London, UK, 1994.

4. Paxson V., Floyd S., Wide-Area Traffic: The Failure of Poisson Modelling, IEEE/ACM Transactions on Networking 3 (1995), рр. 226-244.

5. Addie R., Zukerman M., Neame T., Fractal traffic: measurements, modelling and performance evaluation, In Proc. IEEE INFOCOM '95, 1995, pp. 977-984.

6. Norros I., A storage model with self-similar input. Queueing Syst., 16:387-396, 1994.

7. Park K., Kirn G., Crovella M., On the relationship between file sizes, transport protocols, and self-similar network traffic, In Proc. IEEE International Conference on Network Protocols, 1996, pp. 171-180.

8. Crovella M., Bestavros A., Self-similarity in World Wide Web traffic: evidence and possible causes, In Proc. ACM SIGMETRICS '96, 1996, pp. 151-160.

9. Park K., Kim G., Crovella M. E., The protocol stack and its modulating effect on self-similar traffic, in Self-Similar Network Traffic Analysis and Performance Evaluation, K. Park and W. Willinger (eds), Wiley-Interscience, 1999.

10. Cao J., Cleveland W. S., Lin D., Sun D. X., On the non-stationarity of Internet traffic, АСМ SIGMETRICS vol.29, no.1, 2001, pp.102-112.

11. Шелухин О.И., Тенякшев А.М., Осин А.В. Фрактальные процессы в телекоммуникациях. Монография/Под ред. О.И. Шелухина. М.: Радиотехника, 2003.

12. Willinger W., Paxson V., Taqqu M.S., Self-similarity and heavy tails: structural modeling of network traffic, In J. Adler, R. E. Feldman, and M. S. Taqqu, editors, A practical guide to heavy tails: statistical techniques and applications. Birkhauser, 1998.

13. Feldmann A., Gilbert A.C., Willinger W., Data Networks as Cascades: Investigating the Multifractal Nature of Internet WAN Traffic, ACM Computer Communication Review, 28:42-55, September 1998.

14. Feldmann A, Gilbert A.C., Willinger W, Kurtz T.G, The Changing Nature of Network Traffic: Scaling Phenomena, ACM Computer Communication Review, 28:5-29, April 1998.

15. Gilbert A.C., Willinger W., Feldmann A., Scaling analysis of conservative cascades, with applications to network traffic, IEEE Trans. Inform. Theory, 45(3):971-991, April 1999.

16. Riedi R.H., Willinger W., Toward an improved understanding of network traffic dynamics, in Self-Similar Network Traffic Analysis and Performance Evaluation, Park K. and Willinger W. (eds), Wiley-Interscience, 1999.

17. Feldmann A., Gilbert A.C., Willinger W., Data Networks as Cascades: Investigating the multifractal nature of Internet WAN traffic, Proc. 1998 ACM SIGCOMM, pp.42-55.

18. Holley R., Waymire E.C., Multifractal Dimensions and Scaling Exponents for StronglyBounded Random Cascades, Annals of Applied Probability, 1992, vol 2, pp 819-845.

19. Jia-Shiang Jou, Multifractal Internet Traffic Model and Active Queue Management. PhD dissertation, Faculty of the Graduate School of the University of Maryland, 2003.

20. KrunzMM, Makowski A.M., Modeling video traffic using M/G/® input processes: A compromise between Markovian and LRD models, IEEE Journal on Selected Areas in Communications, 1998, vol. 16, no. 5, pp. 733-748.

21. Riedi R., V'ehel J.L., Multifractal properties of tcp traffic: A numerical study, Tech. Rep. 3129, INRIA, Feb. 1997.

22. Feldmann A., Gilbert A.C., Huang P., Willinger W., Dynamics of IP traffic: A study of the role of variability and the impact of control, in Proceedings of SIG-COMM, 1999, pp. 301-313.

23. Veitch D., Backar J., Wall J., Yates J., Roughan M., Online generation of fractal and multi-fractal traffic, in PAM2000 Workshop on Passive and Active Networking, Hamilton, New Zealand, 2000.

24. Gao J., Rubin I., Multiplicative multifractal modeling of long-range dependent traffic, in Proceedings of ICC, 1999.

25. Taqqu M., Willinger W., Sherman R., Proof of a fundamental result in self-similar traffic modeling, Computer Communication Review, 1997, vol. 27, no. 2, pp. 5-23.

Поступила 22. 09. 2006 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.