Cloud of Science. 2019. T. 6. № 1 http:/ / cloudofscience.ru
Анализ взаимного влияния информационных потоков в магистральном интернет-канале
С. В. Поршнев, Д. А. Божалкин, Е. В. Овечкина
Уральский федеральный университет имени первого Президента России Б. Н. Ельцина
620002, Екатеринбург, ул. Мира, 19
e-mail: [email protected]
Аннотация. Обсуждаются результаты исследования влияния информационных потоков в магистральном интернет-канале, проведенного на основе анализа 15-и минутных дампов интернет-трафика, находящихся в свободном доступе в архиве MAWI [1]. При этом выделены три класса информационных потоков, в зависимости от объемов переданной данными потоками информации: «Мыши», «Мулы» и «Слоны». В соответствие с авторской методикой для каждого из выбранных классов потоков получены случайные последовательности (СП) Nt, К, К, содержащие упорядоченные во времени значения количества пакетов и объемов информации, переданных в течение заданного временного интервала, а также среднего объема переданной информации, приходящейся на один пакет. Продемонстрировано, что вопреки устоявшимся представлениям, фрактальными (самоподобными) свойствами обладают не СП /V . К. Vr но их накопленные суммы и получены оценки их показателей Херста. Построены регрессионные модели, описывающие зависимости показателей Херста накопленных сумм СП Nf, К. К от объемов информации и числа пакетов, переданных каждым из выбранных классов пользователей, которые позволяют оценивать взаимное влияние информационных потоков, создаваемых «Мышами», «Мулами» и «Слонами», друг на друга. Установлено, что значения объемов информации, переданной в течение 15 минут каждым из классов пользователей, связаны детерминированными линейными зависимостями. Это свидетельствует о возможности разработки механизмов балансировки объемов передаваемой информации, призванных повысить качество обслуживания пользователей данным каналом, на основе управления скоростью передачи информации каждого из выделенных классов пользователей в зависимости от текущих значений показателей Херста накопленных сумм СП N,, К. К. Приведен пример подобного алгоритма.
Ключевые слова: интернет-трафик, случайная последовательность, самоподобный процесс, показатель Херста.
1. Введение
В связи с увеличением количества новых классов телекоммуникационных устройств и соответствующих им сервисов увеличиваются как объемы передаваемых информационных потоков (например, по данным Cisco Visual Networking Index (наглядные показатели Сети) объемы передаваемого Интернет-трафика увеличились со 100 ГБ за одни сутки в 1992 г. до 16000 Гб за 1 секунду в 2014 г. [2]), так и усложнением собственно структуры трафика (в настоящее время не более 60% от общего объема трафика генерируется персональными компьютерами, в то время как его остальной объем обеспечивают смартфоны, планшеты, телевизоры, бытовая техника (интернет вещей) и др.).
В этой связи закономерно возрастают требования к гибкости и масштабируемости компьютерных сетей (КС), которые, зачастую представляют собой не классические (по сути, статические), но коммуникационные сети с динамически изменяющейся архитектурой. В этой связи классические подходы описания и настройки КС, основанные на распределенном управлении устройствами традиционных КС (например, виртуальные сети VLAN), не соответствуют современному уровню развития виртуализации серверов и систем хранения данных, а также требованиям крупного бизнеса и сервис-провайдеров (AT&T, Verizon, Google, Facebook, Microsoft и др.).
Для решения вышеперечисленных проблем, возникающих как на этапе проектирования, так и эксплуатации сетей нового поколения, в том числе виртуальных программно-конфигурируемых сетей — SDN (Software-defined Networking), необходимо понимать, какие типы сессий информационного обмена проходят через каналы передачи данных, каковы их размеры, длительность и частоты возникновения, как они взаимодействуют между собой, а также влияют на загрузку данного канала передачи информации. (Здесь и далее сессия: двунаправленный информационный обмен между приложением отправителя, инициировавшим соединение, и приложением получателя; поток — пакеты всех сессий одного класса, проходящих через канал, на временном интервале, равном окну агрегации.)
Напомним, что на начальном этапе развития КС продолжительное время считалось, что трафик в компьютерных сетях описывается классическим Пуассонов-ским распределением. Однако в 1993 г. W. Leland, M. Taqqu, W. Willinger и D. Wilson впервые опубликовали экспериментальные результаты [3], которые по их мнению, свидетельствовали о самоподобии интернет-трафика. Отметим, что данная работа, в известной мере, на многие годы вперед определила цель практически всех проводившихся далее исследований свойств реального интернет-трафика — подтверждение самоподобия интернет-трафика, передаваемого в КС с различными конфигурациями и скоростями передачи данных (см., например, [4-8] и др.). Одна-
ко в подавляющем большинстве известных работ нам не удалось обнаружить результатов проверки применимости модели фрактального броуновского движения к случайным последовательностям (СП), содержащим вычисленные на временных интервалах конечной длительности значения тех или иных характеристик трафика (объемов переданной информации, числа переданных пакетов и др.), которые можно рассматривать как дискретные последовательности, содержащие «мгновенные» значения изучаемых характеристик интернет-трафика.
При этом в ряде случаев авторами были использованы либо:
- устаревшие дампы трафика, полученные в 90-х ХХ в. [9], либо модели трафика, утратившие свою актуальность [10, 11],
- искусственно синтезированный трафик для локальных вычислительных сетей (ЛВС) с относительно простой архитектурой [12-14],
- трафик, синтезированный с помощью программных реализаций известных математических моделей (пуассоновская модель (SPSS [15]), on-off-модель [16], жидкостная модель [17] и гибридная жидкостная модель [18]) или программы-генераторы трафика (NS-2, NS-3 [19]) (При этом очевидно, что свойства синтетического трафика с неизбежностью отличаются от свойств реальных информационных процессов, протекающих в корпоративных ЛВС или высокоскоростных магистралях.)
Таким образом, задача исследования количественных характеристик современного интернет-трафика с использованием более сложных представлений о структуре информационных потоков и их взаимном влиянии друг на друга является актуальной задачей. В статье изложены результаты исследования взаимного влияния информационных потоков, переданных в высокоскоростном магистральном интернет-канале, проложенном между США и Японией.
2. Методика исследования 2.1. Объект исследования
В качестве объекта исследования были выбраны ежедневные пятнадцатиминутные дампы Интернет-трафика, переданного в магистральном Интернет-канале, проложенном между США и Японией, в период с 27.10.2014 по 02.11.2014 г. Анализированные данные были извлечены из архива дампов интернет-трафика MAWI (Measurement and Analysis on the WIDE Internet) [1], в котором размещается актуальная информация о текущем состоянии Интернет-канала, начиная с 1999 г. Средний размер файлов, размещенных в архиве MAWI, составляет порядка 10 гигабайт. Для сохранения конфиденциальности информации об источнике, получателе трафика и его контенте в выкладываемых дампах обезличиваются сведения о реаль-
ных -адресах отправителей и получателей пакетов (при сохранении соответствия между виртуальными адресами отправителя и получателя пакетов), а содержание соответствующих пакетов (полезная нагрузка) заменяется данными, сгенерированными случайным образом, с сохранением при этом оригинального размера пакетов. Это исключает возможность анализа контента передаваемых пакетов, однако обеспечивает возможность извлечения и последующего анализа количественных характеристик интернет-трафика (номеров портов, использованных протоколов, размеров пакетов, объемов переданной данным пользователем информации и т. д.).
2.2. Выбор групп сессий, создающих информационные потоки
Для классификации сессий информационного обмена, следуя [20], мы разделили пользователей исследуемого интернет-канала на следующие классы:
1) класс А — «Слоны», к которому были отнесены пользователи, создавшие сессии с объемами переданных данных — не менее 10 Мбайт (P2P, тор-ренты, скачивание больших файлов);
2) класс B — «Мулы», к которому были отнесены пользователи, создававшие сессии с объемом переданных данных от 0,3 до 10 Мбайт (просмотр видеороликов, прослушивание музыки, скачивание файлов небольших размеров);
3) класс С — «Мыши», к которому были отнесены пользователи, создававшие сессии с объемом переданных данных менее 0,3 Мбайта (ICQ-сообщения, просмотр WEB-страниц и т. д.).
Принадлежность сессии информационного обмена к соответствующему классу пользователей определялась на основе анализа объемов данных, переданных за время ее существования.
2.3. Технология классификации потоков
Для анализа дампа интернет-трафика авторами была создана соответствующая технология, подробное описание которой приведено в [21]. В соответствии с данной технологией исследование дампа интернет-трафика проводится в два этапа. На первом этапе осуществляется семантический анализ файлов, извлекаемых из ар-х^а MAWI, который обеспечивал нахождение в нем информации о соответствующих пакетах и ее автоматическую передачу в рабочее пространство пакета MATLAB. Для переноса параметров пакетов дампа (необходимых, в том числе, для определения сессий информационного обмена выбранных классов) в среду MATLAB в обсуждаемой технологии используется специализированный программный инструмент [22], подробно описанный в [23]. В связи с тем, что максимальный (для используемой в исследованиях ЭВМ) объем данных, который можно
разместить в рабочем пространстве MATLAB, не нарушив при этом стабильности его работы, составляет 400 Мбайт (это соответствует объемам информации, передаваемой на временном интервале длительностью около 1 мин), исходный файл дампа трафика делился на части соответствующих длительностей, которые обрабатывались по отдельности.
После перенесения в MATLAB данных о соответствующих пакетах вычислялись объемы сессий, в которых они были созданы, и далее на основе этой информации осуществлялось отнесение данной сессии к одному из выбранных классов пользователей, осаждавшихся выше. При этом принималось во внимание, что:
- сессия состоит из пакетов, передаваемых приложениями отправителя и получателя, в прямом и обратном направлении;
- объем трафика равняется суммарному объему пакетов, переданных в течение сессии.
Для отнесения конкретного пакета к соответствующей сессии и вычислению объема передаваемой в ней информации использовались следующие данные, извлекаемые из дампа:
- время прохождения пакета через узел записи дампа;
- размер пакета (включая передаваемые данные);
- IP-адрес отправителя пакета;
- IP-адрес получателя пакета;
- порт отправителя пакета;
- порт получателя пакета;
- тип протокола.
2.4. Аппаратные средства технологии работы с дампом
В связи с тем, что время обработки дампов интернет-трафика на одноядерном процессоре составило около 960 часов, в технологии, описанной в предыдущем разделе, были применены параллельные вычисления, реализованные на многоядерном суперкомпьютере УРАН Института математики и механики УрО РАН. Использование 120 ядер 15 вычислительных модулей, имеющих следующие технические характеристики:
- два 4-х ядерных процессора Intel® Xeon® E5450 (3.0 GHz);
- оперативная память PC2-5300, Registered DDR2-667 объемом 16 GB;
- кэш-память 2x6 MB Level 2 cache (5400 Sequence),
обеспечило сокращение времени обработки одного файла дампа интернет-трафика в более чем 100 раз (до 7-8 часов) в сравнении со случаем использования центрального процессора.
3. Свойства трафика, передаваемого в магистральном интернет-канале
Результатом обработки файла, содержащего дамп интернет-трафика, в соответствии с описанной выше технологией, являлись упорядоченные во времени СП, содержащие «Мгновенные» значения числа пакетов N и объемов данных V, переданных в течение 15 минут каждым из описанных выше классов пользователей, в соответствующие дни. Далее на интервалах длительностью т = 0.1,1.0 с (окна агрегации) вычислялись интегральные значения анализируемых СП и проводился анализ плотностей и функций распределения, а также значений показателя Херста СП №,0!^{1,0}, где для краткости в фигурных скобках указан используемый размер окна агрегации.
3.1. Статистические свойства временных рядов Nj, V
Анализ статистических свойств СП N , V [24, 25] показал, что изученные случайные последовательности относятся к классу СП с ограниченной областью рассеяния. При этом для аппроксимации плотности распределения (ПР) СП {0,1! следует использовать аппроксимацию Розенблатта-Парзена [26, 27], для СП N■-['№! ,Vi{10! — метод мнимых источников, в соответствии с которым ПР ищется в виде линейной комбинации функций распределений с центрами, совпадающими с положением мнимых источников (рис. 1):
/ьлв (х; н с1) = л
(1)
ф( х; н, с, I) + 2 Ф2и+1 (х; н, с, I) + 2 Ф2» (х; н, с, ¡)
_ и=0 п =1
где л — нормировочный коэффициент, определяемый из условия:
ь
I (£ н, с, ¡Ж= 1; (2)
а
ф(х; н, с, I) = ехр[-(х-н)2/2с2];
Фгя+1(х; н, с, 1) = ехр[- (х - х2„+1)2/2с2 ]; Ф±и (х; н, с, I) = ехр[-(х - х±п )2/2о2 ];
где х±я+1, х±я вычисляются по формулам
= ±4П + Хо, х21п+! = ±(4и + 2)1 - Хо, (3)
а для оценки параметров плотности распределения СП Nf'№! ,Vi!1'°! использовались генетические алгоритмы [28, 29].
1 1 1 1
41 9," ч 02
9 9 1 1 1 1 1 1 1 1 ■ 1 1 • | 1 | : | 1 9 1 1 1 1 1 9 • * 1 ■ ■
4/ + Ц -2/-Ц -/ О Ц / 2/-Ц 4/ + М
Рисунок 1. К иллюстрации метода мнимых источников
Результаты вычисления параметров ФР СП, содержащих агрегированные значения N, V, переданных в течение временного интервала, равного длительности окна агрегации, представлены в табл. 1 и 2. (Здесь ц, а — средние по семи дням значения параметров распределения).
Таблица 1. Параметры ФР СП N, вычисленные по дампу трафика в каждый из 7 дней
Класс т ц |Ц'_-Р|.100% ц а |а'Га|-100% а
1=1 1=2 1=3 1=4 1=5 1=6 1=7 1=1 1=2 1=3 1=4 1=5 1=6 1=7
«Мыши» 0.1 9813 1.60 5.92 2.59 1.30 0.09 1.07 9.19 1772 26.72 27.91 2.02 9.71 4.66 36.05 25.64
1 97901 1.33 6.04 2.36 1.54 0.25 0.61 8.98 8992 18.03 26.44 12.28 7.04 0.75 17.34 33.12
«Мулы» 0.1 666 54.05 68.70 45.11 8.58 53.94 66.41 56.09 434 21.31 8.17 16.74 2.32 24.67 4.61 14.13
1 7409 42.41 51.60 30.23 1.96 27.68 47.77 50.75 2915 21.53 1.14 2.13 0.82 4.50 17.14 7.07
«Слоны» 0.1 3004 34.42 4.62 6.22 24.45 16.55 38.10 35.74 722 10.50 0.25 17.63 48.54 14.48 20.30 35.84
1 30029 34.51 4.66 6.20 24.40 16.53 38.15 35.74 5663 1.45 0.88 18.46 54.38 13.35 13.09 33.85
Таблица 2. Параметры ФР СП V, вычисленные по дампу трафика в каждый из 7 дней
Класс т ц |цСц|.100% ц а | а — а | | -100% а
1=1 1=2 1=3 1=4 1=5 1=6 1=7 1=1 1=2 1=3 1=4 1=5 1=6 1=7
«Мыши» 0.1 555543.79 3.30 1.05 10.83 9.89 19.85 3.52 32.70 2444194.95 2.40 17.25 4.57 4.96 11.17 8.02 9.99
1 4084729.38 3.76 6.02 21.23 17.96 33.50 15.17 59.77 24441716.74 2.49 17.23 4.46 4.99 11.31 8.30 9.55
«Мулы» 0.1 467893.92 8.26 2.63 7.50 3.56 28.93 14.24 14.53 706542.71 51.48 77.74 21.53 19.94 65.29 48.16 57.25
1 3394353.41 2.25 1.35 7.68 9.54 16.44 8.09 6.41 7434381.93 45.97 68.95 17.26 15.37 35.08 57.25 55.21
«Слоны» 0.1 933262.70 11.61 4.31 15.78 58.04 13.45 20.67 42.36 3449532.25 43.09 8.01 10.35 23.87 13.80 42.10 36.32
1 7414378.04 1.16 5.67 14.87 68.46 9.83 13.33 43.26 34470949.62 43.41 8.07 10.15 23.11 13.95 42.03 36.36
Данные, представленные в табл. 1-2, позволили оценить вариативность параметров ФР ц, а относительно средних значений ц, а изученных СП (табл. 3), а
также вычислить значения коэффициентов пропорциональности между ц 0, а10 и ц015 а015 соответственно, а,ап (табл. 4).
Таблица 3. Максимальные значения вариаций параметров ПФР СП N, V
СП Класс Ац01, % Аао.1, % АЦ1.0, % Ааю, %
N «Мыши» 9.19 30.05 8.98 31.20
«Мулы» 68.70 24.67 51.60 21.53
«Слоны» 38.10 48.54 38.15 54.38
V «Мыши» 17.25 32.70 17.23 59.77
«Мулы» 77.74 28.93 68.95 16.44
«Слоны» 43.09 58.04 43.41 68.46
Таблица 4. Коэффициенты пропорциональности между ц 0, а10 и ц015 а.
СП Класс «ц «а
N «Мыши» 9.98 5.01
«Мулы» 11.12 6.72
«Слоны» 10.00 7.80
V «Мыши» 9.99 7.35
«Мулы» 10.52 7.25
«Слоны» 9.99 7.94
Из табл. 1-3 видно, что изученные СП вне зависимости от размера окна агрегации т в разные дни являются СП с ограниченными областями рассеяния, в то время как оценки параметров их ФР ц, а оказываются отличными друг от друга, что, с нашей точки зрения, свидетельствует о их нестационарности. Из табл. 4 видно, что использованная процедура агрегации СП , V не является масштабно-инвариантной по параметру а, что позволяет сделать обоснованный вывод о том, статистические свойства изученных СП оказываются зависящими от размера окна агрегации т. Таким образом, полученные результаты позволяют поставить под сомнение правомерность использования самоподобных моделей интернет-трафика для описания СП N, V. В то же время известно [30], что случайные величины с ограниченной областью рассеяния в случае их использования в соответствующих вычислительных алгоритмах порождают фрактальное броуновское движение. В этой связи мы провели исследование фрактальных свойств накопленных сумм СП N, V, результаты которого представлены в следующем разделе.
4. Свойства показателей Херста накопленных сумм СП Ni, Vi
Оценка показателя Херста накопленных сумм СП N, V осуществлялась в соответствии с алгоритмом HCALC [31], предусматривающим получение оценки значения показателя Херста по зависимости накопленной дисперсии приращений обобщенного броуновского движения от длины приращения. Листинг т-функции, возвращающей значение показателя Херста ВР, вычисленного в соответствие с алгоритмом HCALC, приведен в [32].
В ходе проведенных исследований в каждый из дней наблюдений для каждого класса накопленных сумм СП Nj, V вычислялись значения показателя Херста, как по каждой из накопленных сумм СП для ранее выбранных значений окон агрегации 0,1 и 1,0 с («глобальное» значение показателя Херста Нтак и усредненные по ансамблям оценки показателей Херста Н{Т^, вычисленные на 9-и непересекающихся частях накопленных сумм СП N¡, V (табл. 5). При этом были использованы следующие параметры алгоритма HCALC:
— длина приращения Ртах = 20;
— число отчетов, по которым осуществляется вычисление накопленной дисперсии, Ь = 9000 для всей СП и Ь = 1000 для частей СП N , V;
— координата вектора, начиная с которой вычисляется накопленная дисперсия, ^ьп = 1 для всей СП и = 1 8001 с шагом 1000 для частей СП
N., V.
7 ' 7
Таблица 5. Показатели Херста накопленных сумм СП N¡ V в каждый из дней наблюдений
(окна агрегации 0.1 и 1 сек)
День Класс СП N СП V
Н !01! HN Н !10! HN н N н N Н !01! Н !10! н г н г
1 Мыши 0.645 0.903 0.636 0.896 0.926 0.980 0.911 0.973
Мулы 0.871 0.956 0.862 0.953 0.852 0.948 0.840 0.944
Слоны 0.923 0.975 0.902 0.967 0.936 0.981 0.915 0.974
2 Мыши 0.719 0.933 0.695 0.917 0.957 0.986 0.944 0.978
Мулы 0.893 0.964 0.872 0.957 0.850 0.948 0.834 0.942
Слоны 0.912 0.973 0.899 0.967 0.907 0.974 0.893 0.967
3 Мыши 0.732 0.933 0.704 0.918 0.864 0.962 0.835 0.950
Мулы 0.856 0.962 0.848 0.956 0.810 0.945 0.814 0.943
Слоны 0.834 0.949 0.821 0.940 0.825 0.946 0.818 0.939
4 Мыши 0.672 0.919 0.661 0.911 0.828 0.949 0.801 0.942
Мулы 0.873 0.966 0.858 0.958 0.856 0.960 0.843 0.953
Слоны 0.883 0.967 0.867 0.961 0.879 0.967 0.864 0.961
Таблица 5. Окончание
День Класс СП м, СП V
Н !0 1} 11N Н !10} -дал) н N -а0! н N Н !01} Н !10} -дал) ну -а°} ну
5 Мыши 0.632 0.904 0.620 0.897 0.824 0.954 0.793 0.941
Мулы 0.883 0.959 0.871 0.954 0.860 0.952 0.839 0.944
Слоны 0.873 0.959 0.863 0.953 0.893 0.968 0.868 0.956
6 Мыши 0.766 0.953 0.724 0.935 0.811 0.944 0.775 0.928
Мулы 0.885 0.965 0.864 0.951 0.852 0.956 0.835 0.944
Слоны 0.909 0.976 0.860 0.956 0.917 0.979 0.865 0.958
7 Мыши 0.667 0.921 0.646 0.908 0.784 0.938 0.758 0.923
Мулы 0.850 0.960 0.843 0.952 0.823 0.948 0.812 0.940
Слоны 0.874 0.963 0.858 0.953 0.873 0.964 0.862 0.956
На основе результатов, представленных в табл. 5, также были вычислены средние по всем дням значения показателя Херста накопленных сумм СП N, у для каждого класса пользователей (табл. 6, 7).
Таблица 6. Средние за 7 дней наблюдений значения показателя Херста для накопленных
сумм СП N (окна агрегации 0,1 и 1 сек)
н !°л! N н1 N н м N н м N
Мыши 0.690+0.049 0.669+0.039 0.923+0.018 0.911+0.013
Мулы 0.873+0.039 0.859+0.011 0.962+0.016 0.954+0.008
Слоны 0.886+0.031 0.867+0.027 0.966+0.010 0.956+0.009
Таблица 7. Средние за 7 дней наблюдений значения показателя Херста для накопленных
сумм СП V (окна агрегации 0,1 и 1 сек)
н !°л! н1 н м у н м
Мыши 0.856+0.064 0.831+0.071 0.959+0.018 0.947+0.013
Мулы 0.843+0.019 0.831+0.013 0.951+0.005 0.944+0.003
Слоны 0.890+0.036 0.968+0.011 0.869+0.030 0.958+0.011
Из табл. 6 видно, что оценки показателей Херста Н{0' 1}, Н{0' 1} и Н^ 0!, Н^ 0! для всех классов пользователей и каждого из выбранных значений окон агрегации согласуются друг с другом — значения соответствующих показателей Херста отличаются друг от друга не более чем на 10%. При этом оценки параметров Херста Н{0' 1},Н{!'0! и Н{0' 1}, Н{1'0} соответственно, оказываются отличными друг от друга. Наиболее значимыми указанные отличия, достигающие 30%, оказываются у класса «Мыши». У классов «Мулы» и «Слоны» отличия данных величин не превосходят 10%.
Из табл. 7 видно, что оценки показателей Херста Н{0' 1!, Н{0' 1! и Н{1' 0!, Н{1'0} для классов «Мыши» и «Мулы» каждого из выбранных значений окон агрегации согласуются друг с другом — расхождения между значениями соответствующих показателей Херста отличаются друг от друга не более чем на 3%, для класса «Слоны» — на 7%. При этом отличие оценки параметров Херста Н{л) и Н{Ц'№}, и НN1 и Н соответственно, оказываются отличными друг от друга. Наиболее значимыми указанные отличия, достигающие 30%, оказываются у класса «Мыши». У классов «Мулы» и «Слоны» отличия оценок данных величин не превосходят 10%.
Принимая внимание, относительную близость оценок глобальных и усредненных показателей Херста для каждого из классов пользователей и выбранных окон агрегации, можно считать данные показатели устойчивыми к локальным вариациями параметрам информационных потоков и использовать их далее при анализе взаимного влияния информационных потоков, передаваемых в высокоскоростном магистральном интернет-канале, друг на друга.
5. Исследование взаимного влияния информационных потоков в магистральном интернет-канале, создаваемых различными группами пользователей друг на друга
Для выявления возможных взаимосвязей информационных потоков, передаваемых в магистральном интернет-канале, были использованы показатели Херста накопленных сумм СП Nj,Vj и К — СП, состоящей из отношений соответствующих членов СП Nj,Vr Физический смысл СП К — средний объем информации, переданной одним пакетом.
В ходе проведенных исследований проверялась гипотеза о том, что взаимосвязь информационных потоков, передаваемых в магистральном интернет-канале, проявляется в наличии зависимостей показателей Херста каждого из классов пользователей как от интегральных характеристик вычисляемых по всему пятнадцатиминутному дампу интернет-трафика информационного потока, создаваемого данным классом пользователей: объема переданной информации V, числа переданных пакетов N, объема переданной информации одним пакетом V, так и информационных характеристик потоков, создаваемых другими классами пользователей, т. е.:
^y{Mice} __^-^{Mice} рт {Mules} ^{Elefants} ^
ц{Mules} __^-^{Mice} ^{Mules} ^{Elefants} ^
{Elefants} {Mice} {Mules} {Elefants}
{Mice} {Mice} {Mules} {Elefants}
{Mules} {Mice} {Mules} {Elefants}
yy{Elefants} _^^y{Mice} ^y{Mules} ^y{Elefants} ^
lice; _ j- 'lcc! j/-{Mules} ^/-{Elefants} j
Mules} _ j- ^ 'lcc' j/"{Mules} ^/-{Elefants} j
j_j ! l:lci<n]ls; _ j ' ^p/-{Mice} j/ ¡Mules; j^{Elefants} ^
ц{Mice} _ j.- ^у ! \ 11со; у ¡Mules; j^{Elefants} ^ ¡Mules ; _ y e ^ ^y ¡Mice; у ¡Mules; j^{Elefants} ^ tt{Elefants} _ is /r/^Mice} г/ ¡Mules; xT {Elefants} \
П N ~ 5 * )■
Исходные данные, использовавшиеся в проведенном нами исследовании, представлены в табл. 8-10.
Таблица 8. Исходные данные для идентификации функций Fvl, FV1, F3
День Класс пользователей Объем переданной информации Н !0 1} Н !10} HV -!<U} н v -!1.0} н v
Мыши 30996017241 0.926 0.98 0.911 0.973
1 Мулы 8118004515 0.852 0.948 0.840 0.944
Слоны 37638020936 0.936 0.981 0.915 0.974
Мыши 28494531094 0.957 0.986 0.944 0.978
2 Мулы 7462853381 0.8500 0.948 0.834 0.942
Слоны 34600502042 0.907 0.974 0.893 0.967
Мыши 22566213503 0.864 0.962 0.835 0.950
3 Мулы 6769864050 0.810 0.945 0.814 0.943
Слоны 29336077554 0.825 0.946 0.818 0.939
Мыши 26623867248 0.828 0.949 0.801 0.942
4 Мулы 7987160174 0.856 0.960 0.843 0.953
Слоны 34611027422 0.879 0.967 0.864 0.961
Мыши 24346132026 0.824 0.954 0.793 0.941
5 Мулы 6376367911 0.860 0.952 0.839 0.944
Слоны 29563160317 0.893 0.968 0.868 0.956
Мыши 18022343530 0.811 0.944 0.775 0.928
6 Мулы 4095987165 0.852 0.956 0.835 0.944
Слоны 20479935829 0.917 0.979 0.865 0.958
Мыши 18424280953 0.784 0.938 0.758 0.923
7 Мулы 4187336580 0.823 0.948 0.812 0.940
Слоны 20936682901 0.873 0.964 0.862 0.956
Таблица 9. Исходные данные для идентификации функций ^, ^т, ^
День Класс пользователей Число переданных пакетов Н !01} Н N Н !10} Н N —!0 .1} н N —!1 .0} н N
1 Мыши 100880771 0.645 0.903 0.636 0.896
Мулы 7964271 0.871 0.956 0.862 0.953
Слоны 21238057 0.923 0.975 0.902 0.967
2 Мыши 97548380 0.719 0.933 0.695 0.917
Мулы 10545770 0.893 0.964 0.872 0.957
Слоны 23727984 0.912 0.973 0.899 0.967
3 Мыши 94385082 0.732 0.933 0.704 0.918
Мулы 7451453 0.856 0.962 0.848 0.956
Слоны 22354361 0.834 0.949 0.821 0.940
4 Мыши 98676762 0.672 0.919 0.661 0.911
Мулы 7790270 0.873 0.966 0.858 0.958
Слоны 23370812 0.883 0.967 0.867 0.961
5 Мыши 89766552 0.632 0.904 0.62 0.897
Мулы 9974061 0.883 0.959 0.871 0.954
Слоны 24935153 0.873 0.959 0.863 0.953
6 Мыши 87350886 0.766 0.953 0.724 0.935
Мулы 4367544 0.885 0.965 0.864 0.951
Слоны 17470177 0.909 0.976 0.86 0.956
7 Мыши 81001426 0.667 0.921 0.646 0.908
Мулы 4050071 0.850 0.960 0.843 0.952
Слоны 16200285 0.874 0.963 0.858 0.953
Таблица 10. Исходные данные для идентификации функций , -^уъ,
День Класс пользователей Объем информации. приходящейся на один пакет Н !01} Н !10} —!0 .1} н V —!1 0} н V }
1 Мыши 307253967 0.926 0.980 0.911 0.973
Мулы 1019302844 0.852 0.948 0.840 0.944
Слоны 1772196991 0.936 0.981 0.915 0.974
2 Мыши 292106654 0.957 0.986 0.944 0.978
Мулы 707663144 0.850 0.948 0.834 0.942
Слоны 1458214964 0.907 0.974 0.893 0.967
3 Мыши 239086653 0.864 0.962 0.835 0.95
Мулы 908529283 0.810 0.945 0.814 0.943
Слоны 1312320075 0.825 0.946 0.818 0.939
4 Мыши 269808883 0.828 0.949 0.801 0.942
Мулы 1025273757 0.856 0.960 0.843 0.953
Слоны 1480950983 0.879 0.967 0.864 0.961
Таблица 10. Окончание
День Класс пользователей Объем информации. приходящейся на один пакет Н !01} Н V Н !10} Н V —!0 .1} н V —!1 0} н V }
5 Мыши 271216073 0.824 0.954 0.793 0.941
Мулы 639295030 0.860 0.952 0.839 0.944
Слоны 1185601692 0.893 0.968 0.868 0.956
6 Мыши 206321243 0.811 0.944 0.775 0.928
Мулы 937823835 0.852 0.956 0.835 0.944
Слоны 1172279794 0.917 0.979 0.865 0.958
7 Мыши 227456253 0.784 0.938 0.758 0.923
Мулы 1033892060 0.823 0.948 0.812 0.940
Слоны 1292365075 0.873 0.964 0.862 0.956
Таблица 11. Исходные данные для идентификации функций , ГН5,
Объем информации,
День Класс приходящейся на Н !01} Н N Н !10} Н N —!0 .1} н N —!1 0} н N
пользователей один пакет
данного класса
1 Мыши 100880771 0.645 0.903 0.636 0.896
Мулы 7964271 0.871 0.956 0.862 0.953
Слоны 21238057 0.923 0.975 0.902 0.967
2 Мыши 97548380 0.719 0.933 0.695 0.917
Мулы 10545770 0.893 0.964 0.872 0.957
Слоны 23727984 0.912 0.973 0.899 0.967
3 Мыши 94385082 0.732 0.933 0.704 0.918
Мулы 7451453 0.856 0.962 0.848 0.956
Слоны 22354361 0.834 0.949 0.821 0.940
4 Мыши 98676762 0.672 0.919 0.661 0.911
Мулы 7790270 0.873 0.966 0.858 0.958
Слоны 23370812 0.883 0.967 0.867 0.961
5 Мыши 89766552 0.632 0.904 0.620 0.897
Мулы 9974061 0.883 0.959 0.871 0.954
Слоны 24935153 0.873 0.959 0.863 0.953
6 Мыши 87350886 0.766 0.953 0.724 0.935
Мулы 4367544 0.885 0.965 0.864 0.951
Слоны 17470177 0.909 0.976 0.86 0.956
7 Мыши 81001426 0.667 0.921 0.646 0.908
Мулы 4050071 0.850 0.960 0.843 0.952
Слоны 16200285 0.874 0.963 0.858 0.953
На первом этапе были построены многомерные линейные модели зависимостей (3) вида
г = ах + а2У + азг,
коэффициенты которых при соответствующих переменных есть корреляции между показателям Херста накопленных сумм СП N,у, представленных в табл. 5, и количеством переданных пакетов (СП N), объемами переданных данных (СП Vi), средними объемами переданных данных на пакет (СП ¥1) . Выбор данного вида модели обусловлен очевидными физическими соображениями, состоящими в том, что значение показателя Херста при х = у = г = 0, т. е. отсутствии информационных потоков, должно равняться 0. Коэффициенты моделей представлены в табл. 12-17.
Таблица 12. Параметры линейных регрессионных моделей, описывающих зависимости между значениями показателей Херста накопленных сумм СП у и объемами переданной информации каждым из рассматриваемых классов пользователей1
Модель Я2 ау{Шк] Оу {Мге} ау {Ми1е} г»{Ми1ез} оу
7г{» .1}{м8е} Ну 0.986 0.980 5.995 2.076 -9.509 7.731
тг{1 .0}{м15е} Ну 0.976 0.967 7.085 2.994 -12.148 11.151
—{0.1}{М15е} ну 0.988 0.983 5.797 1.888 -9.128 7.031
—{1 . 0}{М8е} ну 0.977 0.968 6.912 2.902 -11.657 10.810
тт{0 .1}{Ми1е8} пу 0.975 0.965 6.454 2.701 -11.534 10.060
тт{1 .0}{Ми1е8} Ну 0.972 0.960 7.123 3.257 -12.449 12.132
—{0 .1}{Ми1е8} ну 0.975 0.964 6.191 2.700 -10.735 10.057
{1 .0}{№&1} ну 0.972 0.961 6.990 3.214 -12.049 11.972
тт{0.1}{Е1ейп1} ну 0.979 0.971 7.531 2.606 -14.849 9.707
тг{1 .0}{Е1ейШ} ну 0.974 0.964 7.563 3.172 -13.826 11.815
—{0 .1}{Е1е£й} ну 0.980 0.973 7.049 2.480 -13.341 9.237
—{1 .0}{Е1ейп1} ну 0.975 0.965 7.366 3.099 -13.224 11.543
1 Здесь и далее в табл. 13-17: Я2 — коэффициент детерминации модели; Я— скорректированный на объем выборки коэффициент детерминации; а — оценки коэффициентов линейной регрессии; S — стандартные ошибки коэффициентов линейной регрессии.
Таблица 13. Параметры линейных регрессионных моделей, описывающих зависимости между значениями показателей Херста накопленных сумм СП N и объемами переданной информации каждым из рассматриваемых классов пользователей
Модель Я2 ак(М15е) [М^е} ау !Ми1е} г^Ми^} ьу
гг!0.1}!М15е} Н N 0.958 0.941 5.307 2.888 —9.602 10.758
гг!1.0}!М15е} Н N 0.969 0.956 7.071 3.335 —12.687 12.423
—!0.1}!М15е} н N 0.962 0.947 4.980 2.655 —8.670 9.889
—!1.0}!М15е} н N 0.969 0.957 6.923 3.250 —12.304 12.107
гт-!0.1}!Ми1е5} Н N 0.974 0.964 6.663 2.855 —11.877 10.634
гт-!1.0}!Ми1е5} Н N 0.971 0.960 7.193 3.305 —12.552 12.311
—!0.1}!Ми1ея} н N 0.974 0.964 6.523 2.815 —11.552 10.484
—!1.0}!Ми1к} н N 0.972 0.961 7.089 3.241 —12.265 12.070
гт-!0.1}!Е1е&п1} н N 0.978 0.970 7.306 2.655 —14.058 9.889
гг-!1.0}!Е1ей]]1} н N 0.974 0.963 7.471 3.198 —13.518 11.911
—!0.1}!Е1ейй} н N 0.980 0.972 6.894 2.507 —12.793 9.338
—!1.0}!Е1ейл1} н N 0.974 0.964 7.292 3.118 —12.978 11.615
Таблица 14. Параметры линейных регрессионных моделей, описывающих зависимости между значениями показателей Херста накопленных сумм СП V и числом переданных
пакетов каждым из рассматриваемых классов пользователей
Модель Я2 с с Ь^Ми1е=> ^СЕ^ш) |Е1еГап1}
гг!0.1}!М15е} HУ 0.998 0.997 1.157 0.245 1.892 1.823 —1.688 1.575
гг!1.0}!М15е} HУ 0.997 0.995 0.916 0.336 —2.553 2.498 1.389 2.159
—!0.1}!М15е} hу 0.998 0.997 1.205 0.233 2.734 1.731 —2.311 1.496
-!1.0}!М1я:} hу 0.998 0.996 0.921 0.316 —2.275 2.350 1.220 2.031
Г7-!0.1}!Ми1е5} nу 0.997 0.995 0.709 0.321 —3.113 2.388 1.946 2.063
Г7-!1.0}!Ми1е5} Hу 0.997 0.995 0.778 0.346 —4.293 2.572 2.562 2.223
—!0.1}!Ми1е5} ш 0.998 0.996 0.700 0.286 —3.198 2.126 1.957 1.837
!1.0}!Ми1к} hу 0.997 0.995 0.776 0.334 —4.158 2.483 2.492 2.146
Г7-!0.1}!Е1еЙ1]1} Hу 0.996 0.993 1.010 0.396 —1.888 2.945 0.426 2.545
гг-!1.0}!Е1еЙ1]1} Hу 0.997 0.994 0.896 0.375 —3.611 2.787 1.890 2.409
—!0.1}!Е1еЙД} 0.996 0.994 0.977 0.356 —1.558 2.649 0.357 2.289
—!1.0}!Е1еЙл1} 0.997 0.995 0.893 0.360 —3.391 2.674 1.779 2.311
Таблица 15. Параметры линейных регрессионных моделей, описывающих зависимости между значениями показателей Херста накопленных сумм СП N и числом переданных
пакетов каждым из рассматриваемых классов пользователей
Модель Я2 Я1$ ЫМ^е} ^{МЫе*} г»{Ми1ез} ^{ИеЙ«} о {Е^ап!}
гг{0. 1}{м15е} HN 0.994 0.989 0.686 0.383 -3.476 2.847 1.458 2.460
тг{1 .0}{м15е} HN 0.997 0.994 0.803 0.370 -4.321 2.748 2.331 2.375
—{0. 1}{М15е} н N 0.995 0.992 0.653 0.319 -3.108 2.368 1.377 2.047
—{1.0}{М15е} н N 0.997 0.995 0.780 0.350 -4.249 2.603 2.354 2.250
гт-{0.1}{Ми1е5} Н N 0.997 0.994 0.741 0.339 -3.098 2.518 1.939 2.176
Г7-{1.0}{Ми1е5} Н N 0.997 0.995 0.797 0.356 -4.237 2.649 2.508 2.289
—{0.1}{Ми1е5} н N 0.997 0.995 0.721 0.328 -3.178 2.435 1.993 2.104
—{1.0}{Ми1е5} н N 0.997 0.995 0.791 0.350 -4.060 2.598 2.436 2.246
гг{0.1}{Е1ейп1} н N 0.997 0.994 1.020 0.361 -1.913 2.685 0.375 2.320
7:г!1.0}!E1efant} н N 0.997 0.995 0.897 0.365 -3.670 2.711 1.893 2.343
—{0Л}{ЕМап!} н N 0.997 0.994 0.948 0.346 -1.587 2.570 0.482 2.221
—{1.0}{Е1ейп1} н N 0.997 0.995 0.876 0.356 -3.462 2.645 1.871 2.286
Таблица 16. Параметры линейных регрессионных моделей, описывающих зависимости между значениями показателей Херста накопленных сумм СП у и объемом информации, приходящейся на один пакет, переданного каждым из рассматриваемых классов
пользователей
Модель Я2 ЯЫ) а {М.5е} с {М1=е} а¥ {Ми1е} с ^^{МЫег} а {ИеГап!} {Ие£ап!}
гг{0.1}{М15е} Ну 0.995 0.992 3.508 1.486 0.328 0.226 -0.252 0.377
гг{1.0}{М15е} Ну 0.997 0.995 5.156 1.320 0.724 0.201 -0.744 0.335
-{0.1}{М15е} ну 0.995 0.992 3.146 1.444 0.253 0.220 -0.154 0.366
—{1.0}{М15е} ну 0.997 0.995 5.005 1.268 0.693 0.193 -0.703 0.322
гт-{0.1}{Ми1е5} Ну 0.998 0.996 4.979 1.035 0.706 0.157 -0.782 0.262
гт-{1.0}{Ми1е5} Ну 0.998 0.996 5.520 1.173 0.854 0.178 -0.902 0.297
—{0.1}{Ми1е5} ну 0.998 0.996 4.770 1.005 0.697 0.153 -0.746 0.255
{1.0}{Ми1е8} ну 0.998 0.996 5.422 1.152 0.835 0.175 -0.876 0.292
гт-!0.1}!ЕМа1]1} Ну 0.996 0.993 4.625 1.381 0.666 0.210 -0.657 0.350
гт-!1.0}!ЕМап!} Ну 0.997 0.995 5.420 1.269 0.824 0.193 -0.851 0.322
—{0.1}!E1efant} ну 0.997 0.996 4.425 1.109 0.621 0.169 -0.604 0.281
—{1.0}{ЕМап!} ну 0.998 0.996 5.288 1.178 0.798 0.179 -0.816 0.299
Таблица 17. Параметры линейных регрессионных моделей, описывающих зависимости между значениями показателей Херста накопленных сумм СП N и объемом информации, приходящейся на один пакет, переданным каждым из рассматриваемых классов
пользователей
Модель Я2 Яш1з ау (М15е) ^ (М^е} (Ми1е} (Ми1ег} ау (Не^пО ву (Е1еЬй}
тт(0.1}(М15е} 0.988 0.980 3.729 1.900 0.689 0.289 -0.649 0.482
тт(1.0}(М15е} пЫ 0.996 0.993 5.307 1.507 0.863 0.229 -0.888 0.382
—{0.1}{М1я:} м n 0.991 0.984 3.570 1.636 0.635 0.249 -0.599 0.415
—:(1.0}(М18е} мы 0.996 0.994 5.241 1.395 0.844 0.212 -0.872 0.354
гтчолкмлж} Мы 0.997 0.994 5.187 1.250 0.731 0.190 -0.816 0.317
гг(1.0}(Ми1ев} М N 0.997 0.995 5.562 1.248 0.859 0.190 -0.906 0.317
-(0.1}(Ми1е8} м N 0.997 0.995 5.073 1.154 0.723 0.176 -0.799 0.293
—(1.0}(Мй1е8} м N 0.998 0.996 5.494 1.202 0.837 0.183 -0.884 0.305
гт-(0.1}(Е1е£т1} м N 0.997 0.994 4.481 1.332 0.669 0.203 -0.633 0.338
гт-(1.0}(Е1е£й} м N 0.997 0.995 5.354 1.275 0.828 0.194 -0.843 0.323
—(0.1}(Е1ейЩ} м N 0.998 0.996 4.500 1.101 0.624 0.167 -0.622 0.279
—(1.0}(Е1ейШ} м N 0.998 0.996 5.322 1.188 0.802 0.181 -0.827 0.301
Из табл. 12-17 следует.
1. Переменная, соответствующая объему информации, переданной классом «Слоны» отсутствует в регрессионных моделях, описывающих зависимости между значениями показателей Херста накопленных сумм СП V и объемами переданной информации каждым из рассматриваемых классов пользователей, а также в регрессионных моделях, описывающую зависимости показателя Херста накопленных сумм СП N от объемов переданной информации каждым из классов пользователей, что свидетельствует о наличии близкой к функциональной зависимости между объемами переданной информации классами «Мыши», «Мулы» и «Слоны».
2. Среднее значение скорректированного коэффициента детерминации Я^. = 0.964, что свидетельствует о статистической значимости построенных регрессионных моделей, а также о наличии сильной зависимости между показателями Херста накопленных сумм изученных СП и объемами переданной пользователями информации.
Для объяснения причины, обусловившей отсутствие в регрессионных моделях, описывающих зависимости между значениями показателей Херста накопленных сумм СП V, N и объемами переданной информации каждым из рассматриваемых
классов пользователей, переменных, соответствующих «Слонам», были изучены корреляционные связи между объемами информации, переданной «Слонами», и объемами информации, переданной «Мышами» и «Мулами» (табл. 18).
Таблица 18. Объем информации, переданный каждым из классов пользователей
в каждый из 7 дней
День Объем информации, переданной классом «Мыши» Объем информации, переданной классом «Мулы» Объем информации, переданной классом «Слоны»
1 30996017241 8118004515 37638020936
2 28494531094 7462853381 34600502042
3 22566213503 6769864050 29336077554
4 26623867248 7987160174 34611027422
5 24346132026 6376367911 29563160317
6 18022343530 4095987165 20479935829
7 18424280953 4187336580 20936682901
Анализ данных, представленных в табл. 18, показал, что между значениями объемов переданной информации каждым из классов пользователей имеет место линейная зависимость вида
у{ЕЫап^} = 0 625 . у{М1се} ^ 25 . у!Ми1е®} (4)
с коэффициентом детерминации Я2, равным 1, чем объясняется исключение одной из переменных из регрессионных моделей, параметры которых представлены в табл. 12, 13. С физической точки зрения (4) является следствием «закона сохранения общего объема переданной информации» в исследованном высокоскоростном магистральном канале, являющегося суммой объемов переданной информации каждым из выбранных классов пользователей, который, как очевидно, не может превосходить некоторого максимального объема, определяющегося техническими характеристиками канала передачи. Полученный результат свидетельствует о возможности разработки механизмов балансировки объемов передаваемой информации для повышения качества обслуживания пользователей каналом (проактивного контроля загрузки канала), например, за счет управления скоростью передачи информации каждого из выделенных классов пользователей в зависимости от текущих значений характеристик информационных потоков, вычисляемых в реальном режиме времени. Для этого, принимая во внимание полученные подтверждения существования зависимостей показателей Херста накопленных сумм временных рядов Л^., у, у, от объемов переданной информации каждым из классов пользователей, а также соответствующих количеств переданных пакетов, представляется
перспективным использование этих показателей при решении рассматриваемой задачи.
Блок-схема одного из возможных алгоритмов проактивного контроля загрузки канала передачи информационных потоков представлена на рис. 2.
Рисунок 2. Блок-схема алгоритма проактивного контроля нагрузки канала передачи информационных потоков
Алгоритм (см. рис. 2) основан на сравнении глобального показателя Херста накопленных сумм СП V, порожденных активностью пользователей класса «Мыши», с известным пороговым значением выбранного показателя, которое, так же как и значение скорости передачи данных для каждого из выбранных классов пользователей для каждой конкретной сети, выборе длительности временных интервалах должны определяться экспериментально. Алгорим оказывается более чувствительным к локальным изменениям показателей балансируемых информационных потоков.
Отметим, что данный алгоритм можно реализовать в реальном режиме времени. Действительно, в проведенном исследовании проводилась обработка файлов с 15-и минутными дампами интернет-трафика, содержащего только на 1Р и ТСР уровнях значения более 300 показателей, в то время как для идентификации информационных потоков, создаваемых каждым из классов пользователей, оказывается достаточным использовать, как показано в [21], всего 7 параметров: 1Р-адрес отправителя и получателя пакета, порты отправителя и получателя пакета, размер пакета. При этом подавляющая часть времени была затрачена на поиск в исходных файлах, содержащих дампы интернет-трафика, необходимых параметров, в то время как время выполнения собственно вычислительных операций составляло порядка нескольких миллисекунд.
6. Заключение
На основе анализа 15-и минутных дампов интернет-трафика, находящихся в свободном доступе в архиве MAWI [1], проведено исследование влияния информационных потоков, создаваемых в магистральном интернет-канале пользователями, относящимися в зависимости от объемов информации, переданной инициированными ими потоками, к классам «Мыши», «Мулы» или «Слоны».
В соответствии с авторской методикой для каждого из выбранных классов потоков получены случайные последовательности (СП) содержащие упорядоченные во времени значения числа пакетов и объемов информации, переданных в течение заданного временного интервала, а также среднего объема переданной информации, приходящейся на один пакет.
Продемонстрировано, что вопреки устоявшимся представлениям, фрактальными (самоподобными) свойствами обладают не СП Nj, У^ У^ но их накопленные суммы, и получены соответствующие оценки их показателей Херста. Построены регрессионные модели, описывающие зависимости показателей Херста накопленных сумм СП Nj,Уj,Уj от объемов информации и числа пакетов, переданных каждым из выбранных классов пользователей, по которым можно оценивать взаимное влияние информационных потоков, создаваемых «Мышами», «Мулами» и «Слона-
ми», друг на друга. Установлено, что значениями объемов информации, переданной в течение 15 минут каждым из классов пользователей, связаны детерминированными линейными зависимостями. Это свидетельствует о возможности разработки механизмов балансировки объемов передаваемой информации, призванных повысить качество обслуживания пользователей данным каналом, на основе управления скоростью передачи информации каждого из выделенных классов пользователей в зависимости от текущих значений показателей Херста накопленных сумм СП Nf, Vf, Vf и приведен пример подобного алгоритма.
Литература
[1] MAWI Working Group Traffic Archive [Электронный ресурс] http://mawi.nezu. wide.ad.jp/mawi
[2] Cisco Visual Networking Index: Forecast and Methodology, 2014-2019. — San Jose : Cisco Systems, 2015.
[3] Leland W. E. et al. On the self-similar nature of ethernet traffic // Proc. ACM SIG COMM'93. — San Francisco, 1993. P. 183-193.
[4] Соломицкий М. Ю. Возможный подход к разработке модели трафика конвергентной телекоммуникационной сети // Applicable Information Models. 2011. № 22. P. 189-198.
[5] Федорова М. Л., Леденева Т. М. Об исследовании свойства самоподобия трафика мультисервисной сети // Вестник Воронежского государственного университета. Серия «Системный анализ и информационные технологии». 2010. № 1. С. 46-54.
[6] Ложковский А. Г., Ганифаев P. A. Оценка параметров качества обслуживания самоподобного трафика энтропийным методом // Научные труды ОНАС им. А. С. Попова. 2008. № 1. С. 57-62.
[7] Султанов А. Х., Габдрахманов А. А., Габдрахманова Н. Т. Использование нейросе-тевых моделей для прогнозирования интенсивностей самоподобного трафика телекоммуникационной сети // Вестник УГАТУ, 2011. Т. 15. № 2(42). С. 93-98.
[8] Karpukhin A., Griciv D., Nikulchev E. Simulation of chaotic phenomena in infocommu-nication systems with the TCP protocol // Journal of Theoretical and Applied Information Technology. 2018. Vol. 96. No. 15. P. 5080-5093.
[9] Петров В. В. Структура телетрафика и алгоритм обеспечения качества обслуживания при влиянии эффекта самоподобия: дисс. ... канд. тех. наук. М., 2004. С. 4-8.
[10] Лемешко А. В. Тензорная модель многопутевой маршрутизации агрегированных потоков с резервированием сетевых ресурсов, представленная в пространстве с кривизной // Наука и техника, 2004. № 4(40). С. 12-18.
[11] Бахарева Н. Ф., Карташевский И. В., Тарасов В. Н. Анализ и расчет непуассонов-ских моделей трафика в сетях ЭВМ // Инфокоммуникационные технологии. 2009. № 4. С. 61-66.
[12] Шелухин О. И., Савелов А. В. Имитационное моделирование аномалий трафика в локальной компьютерной сети // T-Comm — Телекоммуникации и Транспорт. 2013. Т. 7. № 10. С. 103-110.
[13] Киреева Н. В., Чупахина Л. Р. Частный случай исследования параметров трафика сети для определения законов распределения времени передачи пакетов // Международный журнал прикладных и фундаментальных исследований. 2015. № 5. С. 395-397.
[14] Треногин Н. Г., Соколов Д. Е. Фрактальные свойства сетевого трафика в клиент-серверной информационной системе // Вестник НИИ СУВПТ. 2003. С. 163-172.
[15] Lihua N., Xiaorong C., Qian H. ARIMA model for traffic flow prediction based on wavelet analysis // 2010 2nd International Conference on Information Science and Engineering (ICISE). — IEEE, 2010. P. 1028-1031.
[16] Кучук Г. А., Можаев О. О. Прогнозирование трафика для управления перегрузками интегрированной телекоммуникационной сети // Радиоэлектронные и компьютерные системы. 2006. № 6 (18). С. 261-271.
[17] Гребенкин М. К., Поршнев С. В. Влияние активности пользователей сети Интернет на свойства мультисервисного трафика // Научно-технические ведомости СПбГПУ, Сер.: Информатика. Телекоммуникации. Управление. 2011. № 1(115). С. 7-12.
[18] Гребенкин М. К., Поршнев С. В. Гибридная жидкостная модель магистрального Интернет-канала. — LAP LAMBERT Academic Publishing, 2012.
[19] Shi J. et al. There is a will, there is a way: a new mechanism for traffic control based on VTL and VANET // 2015 IEEE 16th International Symposium on High Assurance Systems Engineering (HASE). — IEEE, 2015. P. 240-246.
[20] Pellicer-Lostao C., Morato D., Popez-Ruiz R. Modelling user's activity in a real-world complex network // International Journal of Computer Mathematics. 2008. Vol. 85. P. 1287-1298.
[21] Поршнев С. В., Божалкин Д. А. Технология семантического анализа дампа трафика информационных потоков в компьютерных сетях // Информационные технологии. 2014. № 11. С. 12-19.
[22] Поршнев С. В., Божалкин Д. А. Семантический анализатор дампов трафика информационных потоков в компьютерных сетях / Свидетельство о гос. регистрации программы для ЭВМ № 2015611426, 29.01.2015.
[23] Поршнев С. В., Божалкин Д. А., Копосов А. С. Опыт использования суперкомпьютера для обработки дампов сетевого трафика магистрального интернет-канала //
Информационные технологии. 2016. № 1. С. 42-47.
[24] Porshnev S. V., Koposov A. S., Bozhalkin D. A. The research of a network traffic in a backbone internet channel // Proceedings of 2015 IEEE International Siberian Conference on Control and Communications. — SIBCON, 2015. P. 1-5.
[25] Поршнев С. В., Божалкин Д. А., Копосов А. С. Исследование особенностей потоков сетевого трафика в магистральном интернет-канале // Электросвязь. 2016. № 2. С. 16-23.
[26] Поршнев С. В., Божалкин Д. А., Копосов А. С. Особенности информационных потоков в магистральном интернет-канале: анализ статистических характеристик зависимостей объема пакетов от времени // Материалы 25-ой Международной Крымской конференция СВЧ-техника и телекоммуникационные технологии. КрыМиКо, 2015. С. 333-335.
[27] Porshnev S. V., Koposov A. S., Bozhalkin D. A. Features of information flows in the backbone Internet-channel: the analysis of the statistical characteristics of the relationship between the number of packets and the time // Proceedings of 2015 9th IEEE International Conference on Application of Information and Communication Technologies. — AICT, 2015. P. 437-440.
[28] Поршнев С. В., Копосов А. С. Методика использования генетических алгоритмов в задаче оценки параметров распределений с ограниченной областью рассеяния //
Современные проблемы науки и образования. 2014. № 4. С. 116-122.
[29] Поршнев С. В., Копосов А. С. О выборе математических моделей распределений ограниченных случайных последовательностей // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. 2012. № 10(84). С. 298-312.
[30] Поршнев С. В., Божалкин Д. A. О возможности использования случайных величин с ограниченной областью рассеяния для генерации фрактального броуновского движения // Системы управления и информационные технологии, 2017. № 1(51). С. 2332.
[31] Кроновер Р. М. Фракталы и хаос: в динамических системах. Основы теории. — М. : Постмаркет, 2000.
[32] Поршнев С. В., Степаненко В. А., Калмыков А. А., Владимиров В. А., Дядькова С. Н. Диагностика газоперекачивающих агрегатов на основе анализа технологической информации. — Екатеринбург: УрО РАН, 2007. 203 с.
Авторы :
Сергей Владимирович Поршнев — доктор технических наук, профессор, директор Учебно-научного центра «Информационная безопасность», Уральский федеральный университет имени первого Президента России Б. Н. Ельцина
Даниил Александрович Божалкин — аспирант, Уральский федеральный университет имени первого Президента России Б. Н. Ельцина
Елена Владимировна Овечкина — кандидат технических наук, доцент, доцент Учебно-научного центра «Информационная безопасность», Уральский федеральный университет имени первого Президента России Б. Н. Ельцина
The backbone internet channel traffic flows mutual influence analysis
Porshnev S. V., Bozhalkin D. A., Ovechkina E. V.
Ural Federal University named after the first President of Russia B. N. Yeltsin Mira st., 32, Ekaterinburg, Russia, 620002 e-mail: [email protected]
Abstract. Results of backbone internet channel informational flows mutual influence research, based on 15 minutes long free access MAWI archive [1] internet-traffic damps are discussed. Informational flows are divided into three classes: "Elephants" "Miles" and "Mice", based on the traffic value transmitted by the flow. In accordance with the author's methodology, random sequences (RS) N/T Vt, Vt, containing the time-ordered values of the number of packets and the amount of information transmitted during a given time interval, as well as the average amount of information transferred per packet were obtained for each of the selected classes of streams. It is demonstrated that, contrary to well-established notions, the fractal (self-similar) properties are possessed not by (RS) Nf, Vf, Vf, but their accumulated sums. Estimates of their Hurst indices are obtained. Regression models, that describes the dependencies of the Hurst indices of the accumulated amounts of the (RS) Nr VrVr based on the amount of information and the number of packets transmitted by each of the selected user classes, which allow to evaluate the mutual influence of the information flows created by Mice, Mules and Elephants, on each other, were defined. It is demonstrated that the values of transmitted for 15 minutes intervals information are connected with deterministic linear dependencies. This demonstrates the possibility of developing mechanisms for channel load balancing, based on transfer information amount control of each of the selected classes of users depending on the current values of the Hurst indicators of accumulated sums of the (RS) NIT Vn Vn that can be used to improve the quality of service for users of this channel. Algorithm example is provided.
Keywords: internet-traffic, random sequences, self-similar process, Hurst index.
References
[1] MAWI Working Group Traffic Archive. http://mawi.nezu.wide.ad.jp/mawi
[2] Cisco Visual Networking Index: Forecast and Methodology, 2014-2019. Cisco Systems. San Jose, CA, 2015.
[3] Leland W. E. et al. (1993) On the self-similar nature of ethemet traffic. Proc. ACM SIG COMM'93. San Francisco, CA. P. 183-193.
[4] Solomitskiy M. Yu. (2011) Vozmozhnyy podkhod k razrabotke modeli trafika konvergentnoy telekom-munikatsionnoy seti. Applicable Information Models. Sofia: ITHEA. No. 22. P. 189-198. [In Rus]
[5] Fedorova M. L., Ledeneva T. M. (2010) Vestnik Voronezhskogo gosudarstvennogo universiteta. Seriya «Sistemnyy analiz i informatsionnyye tekhnologii». 1:46-54. [In Rus]
[6] Lozhkovskiy A. G., Ganifayev P. A. (2008) Nauchnyye trudy ONAS im. A. S. Popova. 1: 57-62. [In Rus]
[7] Sultanov A. Kh., Gabdrakhmanov A. A., Gabdrakhmanova N. T. (2011) Vestnik UGATU, 15:2(42): 9398. [In Rus]
[8] Karpukhin A., Griciv D., Nikulchev E. (2018) Journal of Theoretical and Applied Information Technology. 96(15):5080-5093.
[9] Petrov V. V. Struktura teletrafika i algoritm obespecheniya kachestva ob-sluzhivaniya pri vliyanii effekta samopodobiya. Tesis. M., 2004. P. 4-8. [In Rus]
[10] Lemeshko A. V. (2004) Nauka i tekhnika, 4(40):12-18. [In Rus]
[11] Bakhareva N. F., Kartashevskiy I. V., Tarasov V. N. (2009) Infokommunikatsionnyye tekhnologii. 4:6166. [In Rus]
[12] Shelukhin O. I., Savelov A. V. (2013) T-Comm — Telekommunikatsii i Transport. 7(10): 103-110.
[13] Kireyeva N. V., Chupakhina L. R. (2015) Mezhdunarodnyy zhurnal prikladnykh i funda-mental'nykh issledovaniy. 5:395-397. [In Rus]
[14] Trenogin N. G, Sokolov D. E. (2003) Vestnik NII SUVPT. P. 163-172. [In Rus]
[15] Lihua N., Xiaorong C., Qian H. (2010) ARIMA model for traffic flow prediction based on wavelet analysis. Information Science and Engineering (ICISE), 2010 2nd International Conference on. IEEE. P. 1028-1031.
[16] Kuchuk G. A., Mozhaev O. O. (2006) Radioelektronnyye i komp'yuternyye sistemy. 6(18):261-271. [In Rus]
[17] Grebenkin M. K., Porshnev S. V. (2011) Nauchno-tekhnicheskiye vedomosti SPbGPU, Ser.: Informatika. Telekommunikatsii. Upravleniye. 1(115):7-12. [In Rus]
[18] Grebenkin M. K., Porshnev S. V. (2012) Gibridnaya zhidkostnaya model' magistral'nogo Internet-kanala. LAP LAMBERT Academic Publishing. [In Rus]
[19] Shi J. et al. (2015) There is a will, there is a way: a new mechanism for traffic control based on VTL and VANET. High Assurance Systems Engineering (HASE), 2015 IEEE 16th International Symposium on. IEEE. P. 240-246.
[20] Pellicer-Lostao C., Morato D., Popez-Ruiz R. (2008) International Journal of Computer Mathematics. Bristol: Taylor & Francis, 85:1287-1298.
[21] Porshnev S. V., Bozhalkin D. A. (2014) Informatsionnyye tekhnologii. 11:12-19. [In Rus]
[22] Porshnev S. V., Bozhalkin D. A. Semanticheskiy analizator dampov trafika informatsionnykh potokov v komp'yuternykh setyakh. Svidetel'stvo o gosudarstvennoj registracii programmy dlja JeVM no. 2015611426. Opubl. 29.01.2015. [In Rus]
[23] Porshnev S. V., Bozhalkin D. A., Koposov A. S. (2016) Informatsionnyye tekhnologii. 1:42-47.
[24] Porshnev S. V., Koposov A. S., Bozhalkin D. A. (2015) The research of a network traffic in a backbone internet channel. Proceedings of 2015 IEEE International Siberian Conference on Control and Communications. SIBCON. P. 1-5.
[25] Porshnev S. V., Bozhalkin D. A., Koposov A. S. (2016) Elektrosvyaz'. 2:16-23. [In Rus]
[26] Porshnev S. V., Bozhalkin D. A., Koposov A. S. (2015) Osobennosti informatsionnykh potokov v magis-tral'nom internet-kanale: analiz statisticheskikh kharakteristik zavisimostey ob"yema paketov ot vremeni. Materialy 25-oy Mezhdunarodnoy Krymskoy konferentsiya SVCH-tekhnika i telekommu-nikatsionnyye tekhnologii. KryMiKo. P. 333-335. [In Rus]
[27] Porshnev S. V., Koposov A. S., Bozhalkin D. A. (2015) Features of information flows in the backbone Internet-channel: the analysis of the statistical characteristics of the relationship between the number of packets and the time. Proceedings of 2015 9th IEEE International Conference on Application of Information and Communication Technologies. AICT. P. 437-440.
[28] Porshnev S. V., Koposov A. S. (2014) Sovremennyye problemy nauki i obrazovaniya. 4:116-122. [In Rus]
[29] Porshnev S. V., Koposov A. S. (2012) Politematicheskiy setevoy elektronnyy nauchnyy zhurnal Ku-banskogo gosudarstvennogo agrarnogo universiteta. 10(84):298-312. [In Rus]
[30] Porshnev S. V., Bozhalkin D. A. (2017) Sistemy upravleniya i informatsionnyye tekhnologii, 1(51 ):23-32. [In Rus]
[31] Kronover R. M. (2000) Fraktaly i khaos: v dinamicheskikh sistemakh. Osnovy teorii. Moscow, Postmarket. [In Rus]
[32] Porshnev S. V., Stepanenko V. A., Kalmykov A. A., Vladimirov V. A., Dyad'kova S. N. (2007) Diagnosti-ka gazoperekachivayushchikh agregatov na osnove analiza tekhnologicheskoy informatsii. Yekaterinburg: UrO RAN. [In Rus]