Научная статья на тему 'The imitation means of Modeling of self-similar Traffic'

The imitation means of Modeling of self-similar Traffic Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
136
80
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Sheluhin O. I., Rasumov A. M.

Visually-interactive means of the analysis, modelling and generation of the self-similar traffic telecommunications system networks are considered; the technology based on FARIMA-processes for generation a monodress monofractal and multifractal of the traffic is analysed.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «The imitation means of Modeling of self-similar Traffic»

УДК 621.396.67

Имитационные средства моделирования самоподобного трафика

О. И. Шелухин, Я. М. Разумов

Рассмотрены визуально-интерактивные средства анализа, моделирования и генерации самоподобного трафика телекоммуникационных сетей; проанализирована трехэтапная технология, основанная на FARIMA-процессах для генерации монофрак-тального и мультифрактального трафика.

Visually-interactive means of the analysis, modelling and generation of the self-similar traffic telecommunications system networks are considered; the technology based on FARIMA-processes for generation a monodress monofractal and multifractal of the traffic is analysed.

Постановка задачи

Моделирование сетевого трафика является необходимой частью исследований производительности сети на основе имитаций, например таких, как исследование планируемой пропускной способности. Точная информация о нагрузках важна для успешного проектирования эффективных по затратам, высокопроизводительных сетей.

Последние данные об анализе трафика сети показали, что сетевой трафик является долговременно зависимым (ДВЗ) (LRD) [1]. Проще говоря, свойство ДВЗ означает, что трафик имеет недегенеративную (non-degenerative) автокорреляционную структуру и что существуют структуры пульсирующего трафика, которые выглядят идентично во многих временных масштабах (четвертого или высших порядков величин, от миллисекунд до минут и более).

Исследования показали, что трафик локальной сети является самоподобным (self-similarity), что является частным случаем ДВЗ-го поведения. Свойство самоподобности сетевого трафика оказалось довольно распространенным и было обнаружено в существующих WAN-, TCP/IP-трафиках

[11], в сжатом видеотрафике [5], трафике сигнализации, Web-трафике, трафике frame relay и трафике ATM- сетей.

По данным более поздних работ, мультиф-рактальная структура, характерна для Интернет-трафика [4]. В мультифрактальном трафике поведение масштабированного трафика различно на различных временных масштабах (шкалах), что противоречит общему уравнению временного масштабирования, как частного случая монофрак-тального (т.е. самоподобного) трафика. Эти различия вызваны комбинацией многочисленных воздействий на трафик, происходящих на аппаратном, протокольном и сетевом уровнях, которые, как известно, работают в различных временных масштабах [3]. Ключевые различия между моно-фрактальным и мультифрактальным трафиками показаны ниже в таблице.

В настоящее время разработаны многочисленные математические модели коррелированного и ДВЗ-трафика [1,2].

Целью работы является описание пакета прикладных программ визуально-интерактивного моделирования сетевого трафика.

Таблица. Ключевые различия между монофрактальным и мультифрактальным трафиками

Монофрактальный трафик Мультифрактальный трафик

Характеристики масштабируемости трафика одинаковы во многих или всех временных масштабах Характеристики масштабируемости трафика изменяются во временных масштабах

Один параметр (называемый показателем Херста) достаточен для описания общих характеристик масштабируемости Требуется большое число параметров для описания характеристик масштабируемости трафика в различных временных масштабах

Показатель Херста является константой и определен для заданной временной выборки трафика Показатель Херста может изменяться во времени даже в заданной временной выборке трафика

График дисперсии имеет форму прямой линии и дает оценки показателя Херста в интервале (0,5.. .1) График дисперсии имеет кусочно-линейную или нелинейную форму

Функции программного обеспечения

Разработанные программы выполняют три главные функции: анализ, моделирование и генерация трафика.

Термин “трафик” здесь подразумевает любую временную последовательность данных (т.е. набор наблюдений, отсортированных по времени). Под временной последовательностью в дальнейшем понимается трасса сетевого трафика, представляющего собой набор битов (или байтов, пакетов), переданных по сети за фиксированный промежуток времени. Будем предполагать, что эти значения неотрицательны.

Под термином “опытная трасса” подразумевается временная последовательность, полученная путем измерений реальной сети (например, LBLTCP-трассы TCP/IP-трафика из лаборатории Lawrence Berkeley [11] или трассы локальной сети Bellcore [8]).

Термином “синтезированная трасса” обозначается сгенерированная трасса (т.е. сгенерированная с использованием статистических моделей трафика). Рассматриваемые средства генерации трафика предназначены для моделирования и анализа стационарных временных последовательностей (т.е. таких, которые не имеют значительных скачков, периодических и циклических изменений в данных).

Под “анализом трафика” имеется в виду процесс ввода временных последовательностей и их анализа с помощью графических или статистических методов, подробно рассмотренных в [1,2].

Под “моделированием трафика” подразумевается процесс получения основных характеристик трассы (среднее, дисперсия, структура корреляции). Для ПО эти характеристики сводятся к трем параметрам трафика [10]: средней скорости передачи, бит/с, коэффициенту Норроса -отношению дисперсии трафика к среднему значению при посекундном делении временной шкалы, бит/с, и показателю Херста H (безразмерная величина), 0,5< H <1,0.

В разработанном ПО характеристики трафика получаются с использованием вейвлет-коэффициентов и коэффициентов масштабирования в основанных на вейвлетах моделях.

Под “генерацией трафика” понимается процесс использования установившейся статистической модели трафика и генерации искусственной временной последовательности (т.е. последовательности выборок), которая имеет схожие с оригинальной последовательностью статистические

характеристики. Может быть сгенерировано множество временных последовательностей с различным случайным набором данных. Каждый запуск производит независимую реализацию статистической модели трафика (т.е. временную последовательность), которую можно затем сохранить в файл и использовать, например, в исследованиях производительности сети на основе имитаций.

Системные требования

Средства моделировании трафика были разработаны и могут быть использованы в UNIX-подобных средах с X-окнами. Программы анализа, моделирования и генерации трафика написаны на C/C++. Интерфейс пользователя написан в Tcl/Tk.

Для установки и запуска программ необходимо следующее предустановленное ПО: cc, gcc, g++, tcl (версии 8.0 или выше), tk (версии 8.0 или выше), mktclapp, gnuplot (средство построения графиков) и gs (Post Script редактор, также известный как ghostscript, gsview or gsview 32).

По аппаратным требованиям, объем RAM должен быть более 32 Мбайт, так как возможен анализ больших наборов данных (около 220 точек). Требуется соответствующая емкость дискового пространства (около 10-100 Мбайт) для хранения опытных и/или синтезированных трасс.

Программные средства

На рис. 1 показан интерфейс программы, состоящий из трех главных блоков, соответствующих генерации монофрактального трафика (а), его модификации - генерации мультифрактального трафика (б) и анализ синтезированного мультивейв-летного трафика (в).

Программное средство синтеза монофрактального трафика synTraff. Верхний блок, изображенный на рис. 1,о, предназначенный для генерации монофрактального трафика. Он имеет поле для ввода имени генерируемого файла, три полосы прокрутки и поле ввода для указания трех параметров трафика -параметра Херста, дисперсии и среднего, а также числа генерируемых точек данных. Блок имеет две кнопки, одна для генерации трафика в соответствии с выбранными параметрами (результат содержит последовательность положительных реальных чисел, представляющих собой coдepжaниe(volumes) трафика), а другая -для сброса параметров к принятым по умолчанию. Полосы прокрутки имеют заданные пределы, для предостережения от ввода пользователем неверных параметров. Долговременная последовательность генерируется с использованием FARIMA

\Генератор синтезированного трафика

Имя файла полученных данных;

ВНЕ

Показатель Керста: 0*8

0.5 0.6 0.7 0.6 0.9 1.0

Дисперсия ; 0«50

0.0 0.2 0.4 0.6 0.В 1.0

Количество данных: 10

1

10 100 1000 10000

Сгенерировать |

Апроксимированное среднее ; Jl00000

Сброс

Sprinkle Cascade

Coarse тра Фин (Вх * д *): Обновленный трафик (Вых,д*): j.spr

НТ: 1*00

0.0 0.2 0.4 0.Є 0.8 1.0

Подинтервал; 10

Sprinkle

Сброс

Имя файла данных; Заголовок (Опц .);

К-предел профиля (Опц.>: [ АК лаги lags (Опц.); Предел распределения; |

Распределений: 100

10 100 1000

♦ МР; Импульсы

По умолчанию

Профиль

Автокорреляция

R/S Статистика

Марг * Распред *

□ программе

а)

тш

Генератор трафика на основе мультивейвлетной модели

Внимание: Количество данных в исходном файле должно быть степенью 2, а минимальное количество равно 32,

Имя файла для анализа;

Имя проанализированного файла; Проанализировать | Название рисунка (опц.); Нарисовать I

Сравнить

Примечание: Для постройки проанализированного файла, укатите имя файла в поле Имя файла для анализа' и нажмите Построить'. Для сравнения 2-х проанализированных файлов введите имя первого файла в поле ‘Имя файла для анализа' а второго в Имя проанализированного файла' и нажмите 'Сравнить'*

Gauss FARIMA

Sprinkle Cascade

Имя проанализированного файла: Имя синтезированного файла;

Параметр Hurst; 0,80

ZlJ

0.5 0.6 0.7 0.8 0.9 1.0

Стартовый уровень; 5

Дисперсивность (Variability); 0*50

0.0 0.2 0.4 0.6 0.0 1.0

Файл данных; Заголовок (Опц,); К-предел (Опц*): AC lags (Opt*); Нач * X распр,; Кон* X распр,;

Распределения;

т

МР; Импульсы МР; Гистограмма

HP; Линии HP; Точки

Рів токорре ляция

R/S Статистика

Марг* распред.

б)

^WsynTraff и®®

Внимание: Число данных в исходном файле эдолтно быть

степенью а минимальное число равно 128.

Имя исходного файла:

Имя проанализированного 0/Р файла: |.№апг

Проанализировать | Сброс

Имя проанализированного 0/Р файла: '

Имя синтезированного файла :

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Синтезировать Сброс

И мя файла данных: По умолчанию

Заголовок (Опц +):

ІК предел профиля (Опц.): Профиль 0 прогрпмме

АК лаги lags <0пц.): 1

Начальное К распред.: нв токорреляция

Конечное X распред.:

Распределений: 100 13/Э Статистика

(■UJB

1 1000 Дисперсия Выход

♦ HP: Импульсы V" МР: Линии Марг*распред.

v HP: Столбцы v МР: Точки

«)

Рис. 1. Графический пользовательский интерфейс: а - монофрактальный трафик (яупТгай); б - мультифрактальный трафик (МєупТгаЕО; в - анализ спектрального трафика ^8упТгаЕ0

процесса (от англ. Fractional Auto-Regressive Integrated Moving Average) [13].

Средний блок предназначен для преобразования трафика в большей временной шкале к трафику в меньшей временной шкале. Например, пользователь может сначала сгенерировать временную последовательность данных в одной временной шкале (например 1,0-секундные выборки трафика), а затем переконвертировать его в более низкую временную шкалу (например 0,01-секундные выборки трафика) путем случайного распределения «массы» каждой выборки большей шкалы среди некоторого числа подынтервалов (например 100). Блок имеет три вкладки, соответствующие двум различным методам переконвертирования -Sprinkle и Cascade. Хотя каскады сами по себе являются моделями для генерации сетевого трафика, здесь они могут использоваться для переконверта-ции трафика, сгенерированного FARIMA-моделью, или для генерации собственного трафика. Для генерации чисто каскадного трафика часть верхнего блока используется для указания параметров синтезируемого трафика перед запуском переконвертирования.

Если не выбрана первичная генерация, операция переконвертации требует указания имени исходного файла, который имеет большой масштаб (опытный или синтезированный), имя файла для переконвертированного файла и подынтервал переконвертирования. Последний вводится полосой прокрутки “Подынтервал”. Остальные параметры переконвертирования различаются для каждой методики. Для метода Sprinkle пользователь должен указать значение threshold value, используя полосу прокрутки. Изменяя значение threshold, пользователь может контролировать smoothness или дисперсивность переконвертированного трафика. Для метода Cascade необходимыми параметрами являются среднее и стандартная девиация (STD) входного трафика. Путем изменения этих параметров пользователь может изменять гистограмму и дисперсивность трафика. Однако, если пользователь не хочет изменять эти данные, то он может просто нажать на кнопку «Вычислить», чтобы программа вычислила и подставила эти значения автоматически.

После ввода параметров переконвертирования для выбранной модели пользователь может нажать на кнопку «переконвертировать» или сбросить параметры, нажав на «Сброс».

Нижний блок на рис. 1,а предназначен для просмотра статистических свойств трафика (гра-

фиков профиля, маргинального распределения, автокорреляции, дисперсии и -статистики). Пе-

ред построением указанных графиков, путем нажатия на соответствующие кнопки, пользователь должен указать имя трафика для анализа. Пользователь может изменить диапазоны графиков (диапазоны осей, типы линий) с помощью ввода данных в соответствующие поля. Перед изменением диапазонов пользователь может просмотреть значения, нажав на кнопку «По умолчанию».

Пример сгенерированного (и проанализированного) программой монофрактального трафика 8упТга£Г приведен на рис. 2,а,г,ж. Опытная трасса трафика (трасса трафика StarWarsVI [15]), на котором он основан, показана на рис. 2,б,д,з. На рис. 2,е,е,и представлена трасса мультифрактального трафика, сгенерированного (и проанализированного) в MsynTraff. Из монофрактального и мультифрактального сгенерированных трафиков видно, что они довольно хорошо совпадают с характером опытной трассы.

Программное средство анализа синтезированного трафика WsynTraff. На рис. 1,в показан интерфейс инструмента WsynTraff. Подобно synTraff этот интерфейс имеет три блока, представляющих три основные функции программы. Однако первые два блока отличны от аналогичных в synTraff.

Верхний блок предназначен для построения WIG-мoдeли опытной трассы. Блок имеет два поля для ввода имени файла опытной трассы: одно для анализа, а другое - для имени файла проанализированного трафика. В блоке есть кнопки, предназначенные для анализа указанной трассы, а также для очистки полей.

Средний блок предназначен для генерации мультифрактального вейвлет-трафика на основе проанализированного файла, созданного программой. Блок имеет два поля ввода: одно для указания имени файла анализа, а второе для указания имени сгенерированного файла трассы. В блоке есть две кнопки: “Синтезировать” - для синтеза трафика, и “Очистить” - для очистки содержимого полей.

Нижний блок предназначен для анализа и построения статистических свойств синтезированного или опытного трафиков. Этот блок похож на аналогичный в synTraff. Одним из преимуществ WIG-мoдeли является то, что она быстрая: время для генерации пропорционально O(N) для N точек. Одним из недостатков является то, что она генерирует отрицательные значения [1, 12]. По этой причине ее не использовали для генерации трафика в наших имитациях.

Рис 2. Сравнение синтезированных трасс, полученных посредством synTraff (а, г, ж) и MsynTraff с опытной трассой (б, д, з) при 1,0-секундной детализации: а, б, в - профили трафиков; г, д, е - автокорреляционные функции; ж, з, и - маргинальное распределение

Программное средство синтеза мультифрак-тального трафика MsynTraff. На рис. 1,6 показан интерфейс программы MsynTraff. Верхний блок предназначен для конструирования и анализа мультифрактальной вейвлет-модели (MWM) опытного трафика. Здесь расположены поля для указания имени опытного файла при анализе модели и выходного файла с результатами анализа. При конструировании MWM-мoдeли пользователь может выбрать просмотр его вейвлет-характеристик либо выбрать сравнение вейвлет-характеристик для двух MWM-мoдeлeй. С помощью инструмента MsynTraff можно построить шесть графиков, на которых представлены средние значения коэффициентов масштабирования, дисперсии коэффициентов масштабирования, средние значения вейвлет-коэффициентов, дис-

персии вейвлет-коэф-фициентов, средние значения нормированных коэффициентов и дисперсии нормированных коэффициентов. Для построения графиков для одной MWM-мoдeли пользователь вводит имя файла в поле «Имя файла для анализа» и нажимает на кнопку «Нарисовать». Для построения графиков сравнения для двух MWM-моделей пользователь вводит имена файлов в поля «Имя файла для анализа» и «Имя проанализированного файла» и нажимает на «Сравнить». Пользователь также может указать заголовок рисунка. Пример графиков сравнения, построенных с использованием ПО MsynTraff, показан на рис. 3.

Средний блок предназначен для генерации мультифрактальных вейвлет-трасс трафика, основанных на файле анализа. MWM-мeтoд предполагает гауссовское распределение случайных сге-

Рис. 3. Результаты сравнения MWM-мoдeлeй для оригинальной (пунктир) и синтезированной (сплошная кривая) трассы: а - средние значения коэффициентов масштабирования Ць б - дисперсия коэффициентов масштабирования Ць в - средние значения вейвлет-коэффициентов Wj/C; г - дисперсия вейвлет-коэффициентов Wj/C; д - Средние значения нормированных вейвлет коэффициентов Ак; е - дисперсия нормированных вейвлет коэффициентов Ак

сгенерированных точек данных грубого (coarse-grain) масштаба (т. е. внутренний (“seeding”) уровень 5 полного представления бинарного дерева вейвлет-модели с 32-мя независимо выбранными случайными значениями перед генерацией трафика) [12]. Однако программа посредством слайдера “Стартовый уровень” позволяет пользователю

указать уровень бинарного дерева, в котором начинаются (seed) случайные значения, а также следующие (новые) опции для генерации точек данных грубого масштаба: Gaussian, FARIMA,

Sprinkle, Cascade. Независимо от выбранной модели пользователь должен указать имя файла анализа и имя сгенерированного файла. После указания

параметров пользователь нажимает на кнопку «Синтезировать» для генерации.

Нижний блок такой же, как и в WsynTraff. Он предназначен для анализа статистических свойств синтезированного или опытного трафиков.

По реализации, MWM-мoдeль генерирует только неотрицательные значения выборок [12], что позволяет его использовать для моделирования трафика сети. Как и у WIG-мoдeли, время работы пропорционально O(N) для генерации (анализа) N точек данных, что позволяет работать с большими наборами данных (например, 220 точек данных).

Таким образом, показано, что сетевой трафик является долговременно зависимым, а также более мультифрактален по своей природе, чем монофрак-тален. Подобная корреляционная структура трафика является его важным свойством, и ее необходимо моделировать в исследованиях производительности сети на основе имитаций.

Представленный набор инструментов для моделирования трафика позволяет генерировать и анализировать монофрактальный и мультифрак-тальный трафики. Средства моделирования трафика основаны на технике моделирования, описанной в [1, 2, 4, 6, 9, 12, 13], и имеют простой графический интерфейс, написанный на Tcl/Tk. Эти программные средства полезны для генерирования независимых монофрактальных и мультифрактальных потоков, а также при исследования производительности сети [1, 2].

В настоящее время доступны только UNIX-версии этих средств [14].

ЛИТЕРАТУРА

1. Sheluhin O.I., Smolskiy S.M., Osin A.V. Self-similar processes in telecommunications. - John Wiley & Sons, 2007.

2. Шелухин О.И., Тенякшев A.M., Осин A.B. Фрактальные процессы в телекоммуникациях / Под ред. О.И. Шелухина. - М.: Радиотехника, 2003.

3. Feldmann A., Gilbert A., Huang P. and Willinger W. Dynamics of IP traffic: A Study of the Role of Variability and the Impact of Control. - Proceedings of the 1999 ACM SIGCOMM Conference, Cambridge, MA, pp. 301-313, August 1999.

4. Feldmann A., Gilbert A. and Willinger W. Data Networks as Cascades: Investigating the Multifractal Nature of Internet WAN Traffic. - Proceedings of the 1998 ACM SIGCOMM Conference, Vancouver, Canada, pp. 42-55, August 1998.

5. Garrett M., Willinger W. Analysis, Modeling, and Generation of Self-Similar VBR Video Traffic. - Proceedings of the 1994 ACM SIGCOMM Conference, London, UK, pp. 269-280, August 1994.

6. Jagerman D., Melamed B. The Transition and Autocorrelation Structure of TES Processes Part I: General Theory. - Stochastic Models, vol. 8, No. 2, pp. 193-219, 1992.

7. Jagerman D., Melamed B. The Transition and Autocor-

relation Structure of TES Processes Part II: Special Cases. - Stochastic Models, vol. 8, No.3,

pp. 499-527, 1992.

8. Leland W., Taqqu M., Willinger W. and Wilson D. On the Self-Similar Nature of Ethernet Traffic (Extended Version). - IEEE/ACM Transactions on Networking, vol. 2, No. 1, pp. 1-15, February 1994.

9. Ma S., Ji C. Modeling Video Traffic in the Wavelet Domain. - Proceedings of 17-th Annual IEEE Conference on Computer Communications, INFOCOMM, San Francisco, CA, pp. 201-208, March 1998.

10. Norros I. On the Use of Fractional Brownian Motion in the Theory of Connectionless Networks. - IEEE Journal on Selected Areas in Communications, vol. 13, No. 6, pp. 953-962, August 1995.

11. Paxson V., Floyd S. Wide Area Traffic: The Failure of Poisson Modeling. - Proceedings of the 1994 ACM SIGCOMM Conference, London, UK, pp. 257268, August 1994.

12. Ribeiro V., Riedi R., Crouse M. and BaraniukR. Simulation of Non-Gaussian Long-Range-Dependent Traffic Using Wavelets. - Proceedings of the 1999 ACM SIGMETRICS Conference, Atlanta, GA, pp. 1-12, May 1999.

13. Williamson C. Synthetic Traffic Generation Techniques for ATM Network Simulations. - Simulation Journal, vol. 72, No. 5, pp. 305-312, May 1999.

14. Williamson C. The synTraff Suite of Traffic Modeling Toolkits, software and documentation available from URL - http://www.cs.usask.ca/faculty/carey/software.

15. http://trace.eas.asu.edu/preencoded/Star_Wars_VI/Star_ Wars_VI.html.

Поступила 13. 12. 2007 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.