АНАЛИЗ САМОПОДОБНЫХ СВОЙСТВ РАЗНОРОДНОГО ТРАФИКА
Р.В. Суханов
ООО «Байтсервис», г. Москва, Россия
Процессы, обладающие самоподобными свойствами, в отличие от других случайных процессов, например пуассоновского, характеризуются наличием последействия. При этом самоподобный процесс является пульсирующим, т. е. во время относительно низкой скорости поступления событий возможны большие всплески. Одним из важнейших параметров, являющимся по сути индикатором и характеризующим степень самоподобия, является параметр Херста (Н), впервые введенным Гарольдом Эдвином Херстом. В зависимости от значений параметра Херста выделяют два типа случайных процессов:
- при 0 < = Н < = 0,5 - случайный процесс не обладает самоподобием;
- при Н > 0,5 - процесс обладает длительной памятью и является самоподобным.
С целью определения самоподобных свойств трафика были проведены исследования в типовой сети провайдера: осуществлен набор статистических данных разнородного трафика, вычислены различными методами значения параметра Херста и произведено сравнение полученных результатов с вычис-
ленными подобным образом значениями Н для случайного процесса - гауссовского шума.
Для представления табличных данных в виде определенных значений использована программа PRTG Traffic Grapher. Она позволяет фиксировать полученные значения трафика в файл формата «.csv», в котором данные разделены специальным знаком - разделителем, позволяющим импортировать их в специальную программу для статистической обработки. В качестве последней использована SELFIS, разработанная Thomas Karagiannis. Значения отсчетов идеального гауссова шума для аналогичного исследования временного ряда были получены в этой же оболочке с помощью программы Fractan, разработанной В. Сычевым. Метод получения результатов основан на центральной предельной теореме.
На рисунке 1 представлен агрегированный временной ряд в программе SELFIS с общим количеством отсчетов равным 65 535, представляющий собой замеры входящего трафика, исследованного в сети провайдера на протяжении нескольких суток.
Рис. 1. Статистика загрузки канала
Определим значение Н для входящего трафика семью способами [1; 2].
Метод расчета совокупного различия (Aggregate Variance) показал значение параметра H = 0.836. На логарифмическом гра-
фике (рис. 2) выборочная дисперсия относительно уровня агрегирования - прямолинейная зависимость с наклоном «В» больше, чем -1. В этом случае Н=1 + В/2.
Метод расчета нормированного размаха показал значение Н = 0.864.
На рисунке 3 приведена логарифмическая зависимость статистики от числа агрегированных точек.
Рис. 2. Результаты расчета методом совокупного различия
8.94
У.40 " ^
7.87
7.34
6.80
6.27 °
5.74
5.20
4.67 °
4.14
3.60
3.07 / -
2.54
2.01 »
1.47
0.94
0.41
пп
-0.65
=1.18 0.35 1.51 2.07 3.83 4.33 7.31 3.47 ЭтбЗ
Исследуемый трафик Метод Нормированного размаха Параметр Херста : 0.864
Коэфф. корреляции 97 52%
Рис. 3. Результаты расчета методом нормированного размаха
Метод расчета с использованием периодограмм (Periodogram) показал значение Н=0.955. На рисунке 4 приведена логарифмическая зависимость спектральной плотности временных рядов от частоты. Периодо-грама определяется:
.?=!
12 .
где V - частота, N - длина временного ряда, X - фактическое значение временного ряда.
Рис. 4. Результаты расчета методом использования периодограмм
Метод расчета на основе абсолютных моментов (Absolute Moments) показал значение H=0.733. Агрегированные значения X(m) определяются, используя разные размеры блоков m.
На логарифмическом графике (рис. 5) уровень агрегирования в зависимости от первого абсолютного момента агрегированного X (т) характеризуется прямой линией с наклоном Н-1.
3.92
3.69
3.45 41— Метод Абсолютные моменты
3.22
2.98 „ Параметр Херста : 0.733
2.75
2.52 О а Коэфф. корреляции □□.□□/0
2.28
2.05
1.81
1.58 4
1.35 в
1.11
0.88 ' -
0.64
0.41
0.18
П ПК
-0.28
-0.52
Рис. 5. Результаты расчета методом на основе абсолютных моментов
Метод расчета разности остатков (рис. 6) уровень агрегирования в зависимо-
(Variance of Residuals) показал значе- сти от средней дисперсии остатков есть пря-
ние H=1.160. На логарифмическом графике мая с наклоном H/2.
23.2 Иггпрлурмкш Tnaftiwif
21.8
20.4 ^ Метод Разница остатков
19.0
17.6 Параметр Херста : 1.160
162 пп ссо/
14.9 Коэфф, корреляции : уа.оо/о
13.5
12.1
10.7
9.36
7.98
6.60
5.21
3.83
2 44
1.06
-1.70
-3.08 2.С7 3.G8 4.80 5т§і ,-n
U.J4 ТтиЗ — Зт26
Рис. 6 Результаты расчета методом разности остатков
Метод расчета энергии всплесков (Abry-Veicth Estimator) дал значение H=0.989. Учет энергии всплесков, в различных масштабах, позволяет определить общую оценку Н.
Метод расчета минимальных значений (Whittle Estimator) дал значение H=0.930. Он основан на минимизации функции правдоподобия, которая применяется к периоду временных рядов, дает оценку H и приводит зависимость на доверительном интервале.
Каждый из перечисленных выше семи методов обладает своей точностью и погрешностью расчетов. Для минимизации
возникающих погрешностей при расчетах общего среднего значения, а также в качестве дополнительного аргумента в пользу предположения о самоподобном характере трафика, исследованного в сети провайдера, проведем вычисления тех же показателей на основе автокорреляционной функции и средней взаимной информации (по сути -взаимная энтропия) с использованием программы Fractan.
Результаты расчетов Н с помощью программы Fractan приведены на рисунке 7.
Полученное значение Н = 0.9649, фрактальная размерность D=2 - ^1.0351.
Показатели Херста исследуемого трафика
у/ /Г
Ху
1од 10 (»> -1 4
Показатель Херста Н = 0.9649 ± 0.2549 | Фрактальная размерность 0 = 2 - Н = 1.0351 ± 0.2549
Рис. 7. Показатели Херста исследуемого трафика
Процесс X принято считать самоподобным, если для достаточно больших к его автокорреляционная функция не вырождается при т ^-<х>, т. е. на всем протяжении
где процесс Х(т) получен усреднением исходного процесса по неперекрывающимся блокам размера т. У несамоподобного (сто-
хастического) процесса, напротив, при т^-да автокорреляционная функция вырождается. Если же процесс строго самоподобен, то при усреднении по блокам размера т его автокорреляционная функция существенно не меняет своего значения. Это относится и к средней взаимной информации.
Их характер изменения приведен на рисунке 8.
Рис. 8. Характер зависимостей автокорреляционной функции и средней взаимной информации
Вычислим значение параметра Херста, автокорреляционную функцию и среднюю взаимную информацию для случайного процесса - гауссовского шума и сравним полученные результаты со значениями для реального трафика. Для этого с помощью программы Fractan смоделируем случайный процесс, по своим статистическим характеристикам (Mean, Variance, Std,
Skewness, Kurtosis) приближенный к реальному трафику сети провайдера, полученные значения импортируем в программу SELFIS.
На рисунке 9 представлен полученный агрегированный временной ряд с общим количеством отсчетов равным 33 322, представляющий собой случайные величины гауссовского шума.
Рис. 9. Агрегированный временной ряд для гауссовского процесса
Проведем вычисление значения Н для гауссовского шума ранее рассмотренными выше семью способами.
Метод расчета совокупного различия (Aggregate Variance) показал значение параметра H = 0.492 (рис. 10).
5.30
4.74
4.17
3.61
3.04
2.47
1.91
1.34
0.7В
П ?1
-U.J4
-0.91
-1.47
-2.04
-2.60
-3.17
-3.74
-4.30
-4.87
-5.43 j.33 41 2.ии о. 03 4.GG G.74 j.83 7.31 8.33
Гауссовский шум
Метод Совокупного различия Параметр Херста ; 0.492
Коэфф, корреляции : 99.69%
Рис. 1O. Метод расчета совокупного различия для гауссовского процесса
Другие методы дают следующие результаты:
- метод расчета нормированного размаха - Н = 0.517;
- метод расчета с использованием периодограмм - Н = 0.502;
- метод расчета на основе абсолютных моментов - Н = 0.383;
- метод расчета на основе разности остатков - Н = 0.506;
- метод расчета энергии всплесков - Н =
0.544;
- метод расчета минимальных значений - Н = 0.500.
Расчеты показателя Херста, проведенные с помощью программы Fractan, показали
значение Н = 0.3650, фрактальную размерность D=2-H=1.6350.
Полученные несколькими способами и разными программами значения оценок показателя
Херста (Н) как для реального трафика, так и для случайного процесса в виде гауссовского шума сведены в таблицу 1, в которой приведены усредненные значения для всех методов расчета Н.
Таблица 1
Усредненные значения оценок показателя Херста
Вид трафика Методы оценки показателя Хэрста
ПО «SELFIS» ПО {^гайап» Среднее значение Херста
Сов. различие Норм. размах Период. Абсол. моменты Разница остатков Энерг. всплесков Мин. значения
Реальный трафик 0.836 0.864 0.955 0.733 1.160 0.989 0.930 0.964 0.929
Гауссовский шум 0.492 0.517 0.502 0.383 0.506 0.544 0.500 0.365 0.476
Как видно, для реального трафика среднее значение показателя Херста Н=0.929, для случайного гауссовского шума Н=0.476.
Таким образом, на основании полученных результатов можно сделать вывод о том, что реальный разнородный трафик имеет сложный характер, похожий на случайный, но при этом обладает свойствами самоподобия, что позволяет применять алгоритмы и методы эффективного использования ресур-
сов телекоммуникационных сетей за счет прогнозирования его поведения.
Литература
1. Петров В.В. Статистический анализ сетевого трафика. М., 2003.
2. Шелухин О.И., Тенякшев А.М., Осин А.В. Фрактальные процессы в телекоммуникациях: монография / под ред. О.И. Шелухина. М., 2003.