Научная статья на тему 'Исследование сетевого трафика магистрального интернет-канала'

Исследование сетевого трафика магистрального интернет-канала Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
765
66
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАГИСТРАЛЬНЫЙ КАНАЛ / СЕТЕВОЙ ТРАФИК / САМОПОДОБИЕ / АНАЛИЗ СЕТЕВЫХ ПАКЕТОВ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Поршнев Сергей Владимирович, Гребенкин Михаил Константинович

Выполнен анализ образцов сетевого трафика высокоскоростного Интернет-канала. Рассмотрены статистические свойства сетевого трафика и их зависимость от величины окна агрегации по времени

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Some samples of network traffic of high-speed Internet link have been analyzed. Statistic properties of the traffic samples as well as their dependence on the aggregation on time are considered

Текст научной работы на тему «Исследование сетевого трафика магистрального интернет-канала»

Работа выполнена в рамках АВЦП «Развитие научного потенциала высшей школы» (НИР 2.2.2.4/4278).

Автор выражает благодарность доктору физико-математических наук, профессору математического фа-

культета Алтайского государственного университета Ольге Николаевне Гончаровой за плодотворные дискуссии по вопросам математического моделирования и численного исследования.

СПИСОК ЛИТЕРАТУРЫ

1. Якушев, В.П. На пути к точному земледелию [Текст] / В.П. Якушев. -СПб.: Изд-во ПИЯФ РАН, 2002. -458 с.

2. Якушев, В.П. Оценка технологий точного земледелия: аналитический обзор [Текст] / В.П. Якушев, Р.А. Полуэктов, Э.И. Смоляр [и др.] // Агрохим. вестник. -2002. -№ 3. -С. 36-40.

3. Полуэктов, Р.А. Динамические модели агроэко-системы [Текст] / Р.А. Полуэктов. - Л.: Гидрометеоиз-дат, 1991. -312 с.

4. Полуэктов, Р.А. Модели продукционного процесса сельскохозяйственных культур [Текст] / Р.А. Полуэктов, Э.И. Смоляр, В.В. Терлеев [и др.]. -СПб.: Изд-во С.-Петерб. ун-та, 2006. -396 с.

5. Шеин, Е.В. Курс физики почв [Текст] / Е.В. Шеин. -М.: Изд-во МГУ, 2005. -432 с.

6. Марчук, Г.И. Методы расщепления [Текст] / Г.И. Марчук. -М.: Наука, 1988. -264 с.

7. Гончарова, О.Н. Метод расщепления по физическим процессам для расчета трехмерных задач конвекции [Текст] / О.Н. Гончарова // Изв. АлтГУ -2007. -№ 1(53). -С. 39-44.

8. Самарский, А.А. Разностные схемы с операторными множителями [Текст] / А.А. Самарский, П.Н. Ва-бищевич, П.П. Матус. -Минск: Изд-во ЗАО «ЦОТЖ», 1998. -442 с.

9. Яненко, Н.Н. Метод дробных шагов решения многомерных задач математической физики [Текст] / Н.Н. Яненко. -Новосибирск: Наука, 1967. -196 с.

10. Самарский, А.А. Методы решения сеточных уравнений [Текст] / А.А. Самарский, Е.С. Николаев. -М.: Наука, 1978. -590 с.

УДК 004.942

С.В. Поршнев, М.К. Гребенкин

исследование сетевого трафика магистрального интернет-канала

Большинство исследовательских групп в области телекоммуникаций сходятся во мнении о самоподобии сетевого трафика. Эти свойства достаточно подробно изучены в ряде работ, выполненных в 90-х гг. XX в., например, в [1]. Однако с тех пор произошло радикальное изменение технических характеристик оборудования сети Интернет и предоставляемых сетевых сервисов. Во-первых, на несколько порядков увеличилась скорость передачи данных в магистральных каналах (от единиц Мбит/с до сотен Гбит/с). Во-вторых, качественно изменилась структура трафика: если раньше поток формировался за счет листания веб-страниц (неравномерная загрузка каналов), то сейчас основной вклад в объем трафика дают почти непрерывные потоки, такие, как Р2Р и просмотр видеконтента [2]. Оба указанных фактора приводят к уменьшению бурстности трафика. Отметим также, что сегодня необходимо учитывать устанавливаемые провайдерами режи-

мы ограничения скорости (теперь нет необходимости платить за скаченные объемы, и каждый пользователь имеет строго определенную верхнюю границу скорости), которые также приводят к сглаживанию суммарного потока [3]. Известен ряд современных работ, посвященных исследованию особенностей магистральных Интернет-каналов, авторам которых не удалось обнаружить самоподобные свойства сетевого трафика. Например, в работе [2] показано, что на больших отсчетах порядка нескольких секунд самоподобные свойства проявляются, а на более малых окнах агрегации данные свойства не наблюдаются и распределение сетевого трафика близко к распределению Пуассона.

Цель данного исследования - изучить актуальные (датированные текущим годом) образцы трафика, действующего магистрального Интернет-канала, а также изучить самоподобные свойства данного трафика, в т. ч. их зависимость

от величины окна агрегирования исходных временных рядов.

Постановка задачи

В настоящее время опубликовано достаточно большое количество работ, посвященных исследованию свойств Интернет-трафика, например, [4]. Однако при анализе временных рядов становится очевидным, что «качество» имеющихся у исследователей данных оказывает влияние на получаемые количественные оценки. Здесь одним из наиболее важных параметров является степень агрегирования исследуемых данных. Отметим, что современное сетевое оборудование ориентировано на получение усредненных отчетов за длительные временные периоды с минимальными затратами вычислительных ресурсов. В связи с этим многим исследователям приходится иметь дело с достаточно крупными временными отсчетами (десятки и сотни минут).

Необходимо решить задачу повышения детализации получаемых данных за счет отказа от использования стандартных отчетов о загрузке канала и перехвата реального трафика целиком с его последующей обработкой. Очевидно, что получить такие данные сложнее, т. к. необходимо обрабатывать значительные массивы данных (десятки и сотни гигабайт), передаваемых по современным высокоскоростным Интернет-каналам, и обеспечивать при этом сокрытие персональных данных конкретных пользователей, участвующих в процессе передачи данных.

В ходе проводимых исследований анализировались дампы сетевого трафика магистрального канала передачи между США и Японией,

выложенные для свободного скачивания и изучения [5]. Дампы содержит информацию о пакетах, переданных в течение 15 мин в рассматриваемом Интернет-канале. Отметим, что данные образцы трафика не содержат сведений о пользователях сети Интернет, поскольку здесь реальные IP-адреса, первоначальное содержимое предаваемых пакетов, а также вся личная информация были заменены на случайным образом разыгранные данные. Однако структура трафика (размеры пакетов, их направление, протокол передачи) полностью сохранена и соответствует реальному трафику.

Анализ данных показал, что основная доля информации передается по протоколам TCP (~ 90 %) и UDP(= 10 %). Это позволяет предположить, что свойства современного трафика обусловлены главным образом именно алгоритмами работы протокола TCP. Следовательно, можно ожидать, что полученные результаты позволят лучше понять работу основного протокола сети Интернет.

Методика

Для анализа данных использована методика, реализующаяся следующей последовательностью действий.

1. Разделение исходного дампа трафика с помощью утилиты tcpdump на файлы объемом 300 Мб каждый (разбиение исходных файлов размером 2-3 Гб вынужденное, связанное с тем, что дальнейшая обработка требует значительных объемов используемой оперативной памяти).

2. Выделение в исходном трафике входящего потока данных на маршрутизатор и исходящего потока данных из маршрутизатора. В таблице при-

Примеры данных о входящих и исходящих пакетах

Входящий пакет Ethernet II, Src: Cisco_7c:b0:00 (00:16:9c:7c:b0:00), Dst: Cisco e3:34:00 (00:0e:39:e3:34:00) Internet Protocol, Src: 20.37.84.141 (20.37.84.141), Dst: 205.37.159.220 (205.37.159.220) Transmission Control Protocol, Src Port: http (80), Dst Port: 31142 (31142), Seq: 1, Ack: 1, Len: 1448

Исходящий пакет Ethernet II, Src: Cisco e3:34:00 (00:0e:39:e3:34:00), Dst: Cisco_7c:b0:00 (00:16:9c:7c:b0:00) Internet Protocol, Src: 204.45.100.103 (204.45.100.103), Dst: 147.114.12.197 (147.114.12.197) Transmission Control Protocol, Src Port: 51632 (51632), Dst Port: http (80), Seq: 1, Ack: 1, Len: 1460

веден фрагмент данных из заголовков перехвачен- ление входящего и исходящего потока трафика. ных пакетов. Из приведенного дампа видно, что не- 3. Анализ с помощью пакета Wireshark по-

смотря на проведенную процедуру обезличивания лученных образцов трафика, формирование дан-

трафика, в дампе присутствуют МАС-адреса маги- ных о размерах поступивших пакетов и времени

стральных маршрутизаторов (00:0е:39:е3:34:00 и их прибытия.

00:16:9с:7с:Ь0:00). Проверяя адреса назначения в 4. Перенос данных в математический пакет

каждом из пакетов, становится возможным разде- МА^АВ и объединение полученных данных

Рис. 1. Логарифм функции распределения нормированных временных рядов при различных размерах окна агрегации по времени: а - 10 мкс; б - 20 мкс; в - 40 мкс; г -80 мкс

в два больших массива, содержащих информацию о мгновенных значениях объемов передаваемых данных в течение 900 с в каждом из двух направлений (дискретность отсчетов 10 мкс).

5. Агрегирование, т. е. усреднение данных по блокам заданной длины [6], содержащих значения объемов переданной информации в определенные интервалы времени (10, 20, 40, 80, 160, 320, 640 и 1280 мкс).

а) ...

Входящий трафик

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,3 0,9 1

Исходящий трафик

' 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0 ?, 1

б)

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,6 0,9 1

6. Исследование статистических свойств и, в частности, выраженности самоподобия для каждого из полученных временных рядов.

Результаты расчетов

В ходе исследования были проанализированы дампы сетевого трафика, зарегистрированные 5-7 марта 2011 г. [5]. Аналогичные результаты получены для каждого из трех исследуемых дам-

б)

О 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9

г)

ш"

Входящий трафик

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0 6; 0,9 I

т4

ИТ*

Исходящий трафик

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,6 0,9 1

Рис. 2. Логарифм функции распределения нормированных временных рядов при различных размерах окна агрегации по времени: а - 160 мкс; б - 320 мкс; в - 640 мкс; г - 1280 мкс

0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1

,1 0,2 0,3

0,5 0,6 0,7

Рис. 3. Логарифм функций распределения случайного временного ряда с распределением Парето: а - не агрегированный временной ряд; б - временной ряд с окном агрегации 10 отсчетов; в - временной ряд с окном агрегации 20 отсчетов; г - временной ряд с окном агрегации 40 отсчетов

пов трафика (длительности 15 мин, 900 000 отсчетов каждый).

Также были проанализированы временные ряды, содержащие информацию о мгновенных значениях объемов переданных данных, длительностью равной 1/10 от длительностей полных дампов (90 с, 90 000 отсчетов). Типичные реализации анализа функций распределения рассматриваемых временных рядов представлены на рис. 1 и 2.

Из рис. 1 и 2 видно, что функции распределения оказываются зависящими от размера окна агрегации. При увеличении размера окна агрегации происходит уменьшение вариаций функции распределения.

Функции распределения входящего и исходящего потоков трафика в целом подобны. Это подтверждает, в т. ч., правомерность работ [7-9], в которых авторы предложили выявлять возникновение сетевых аномалий Интернет-трафика на основе сравнения ряда количественных характеристик входящего и исходящего потоков (использование автокорреляционных функции, вейвлет-спектров и т. д.).

Чтобы определить, при каком окне агрегирования функция распределения принимает наиболее стабильную форму, использовались стандартные методы оценки [10]. Для количественного описания зависимостей, приведенных на рис. 1 и 2, было проведено исследование возможности аппроксимации данных полиномами 2-7 степеней. При этом оказалось, что наименьшую дисперсию остатков имеют полиномы 5 степени. Из рис. 1 и 2 видно, что флуктуации логарифма функции распределения (среднеквадратические отклонения остатков полинома 7 степени) уменьшаются при увеличении размера окна агрегации. При окне агрегации равном 1280 мкс отношение СКО остатков к общей энергии временного ряда (для исходящего потока трафика) оказывается равным 3,9-10-3. Видно, что при задании параметров источника Интернет-трафика в ходе его моделирования на временных интервалах более 1 мс наблюдаемые флуктуации функции распределения можно не учитывать.

Проведено сравнение статистических свойств временного ряда, описывающего передачу реального Интернет-трафика, и случайного временного ряда, имеющего распределение Парето (рис. 3).

4

Рис. 4. Зависимость log5(АХ) = f (log | At |), вычисленная по всей длине каждого из анализируемых временных рядов Варианты окна агрегации: А - 10 мкс, Б - 20 мкс, В - 40 мкс, Г - 80 мкс, Д - 160 мкс, Е - 320 мкс, Ж - 640 мкс, З - 1280 мкс

Из сравнения рис. 1 и 2 с данными, представленными на рис. 3, можно сделать вывод о том, что свойства функций распределения рассматриваемых временных рядов оказываются существенно отличными друг от друга.

Таким образом, полученные результаты позволяют сделать следующий важный вывод: Интернет-трафик магистрального канала имеет распределение отличное от распределения Па-рето. Следовательно, для описания современных высокоскоростных каналов передачи данных требуется привлечение новых математических моделей (например, жидкостной модели [11]), а также идентификация этих моделей и оценка их адекватности на основе экспериментальных данных.

Наличие временных реализаций реального Интернет-трафика позволили провести проверку распространенной гипотезы о возможности описания Интернет-трафика в рамках нелинейной динамики [6]. Для этого, используя зависимости log 5(AX) = f (log | At |) (рис. 4), были получены оценки значений показателя Херста для различ-

ных размеров окна агрегации. (Значение показателя Херста здесь определялось как тангенс угла наклона прямой, аппроксимирующей зависимость log 5(AX) = f (log | At |). Оказалось, что полученные значения показателя Херста, изменяющиеся в диапазоне 0,7^0,8, не зависят от окна агрегации. Следовательно, анализируемые временные ряды являются самоподобными.

Таким образом, проведенный анализ статистических свойств реального трафика магистрального Интернет-канала (США-Япония) позволил сделать следующие выводы.

Статистические свойства входящего и исходящего трафиков оказываются подобными.

Распределение значений объемов переданной информации в заданный интервал времени описывается функциями, отличными от распределения Парето.

Самоподобные свойства сетевого трафика магистральных Интернет-каналов сохраняются при различных размерах окна агрегации данных.

СПИСОК ЛИТЕРАТУРЫ

1. Городецкий, А.Я Фрактальные процессы в компьютерных сетях: Учеб. пособие. [Текст] / А.Я. Городецкий, В.С. Заборовский. -СПб.: Изд-во СПбГТУ, 2000. -102 с.

2. Gupta, H. Modeling, Analysis & Simulation of Computer and Telecommunication Systems [Текст] / H. Gupta, A. Mahanti, V.J. Ribeiro // IEEE International Symp. - London ACM, 2009.- P. 1-10.

3. Поршнев, С.В. К выбору допустимого размера всплеска в режиме обеспечения гарантированной скорости доступа к сети Интернет [Текст] / С.В Поршнев, М.К. Гребенкин // Естественные и технические науки. -М.: Спутник-Плюс, 2010. -№ 6. -С. 475-480.

4. Гуда, А.Н. Модели оценки параметров телекоммуникационного трафика в автоматизированных информационно-управляющих системах [Текст] / А.Н.

Гуда, М.А. Бутакова, Н.А. Москат // Вопросы современной науки и практики. -М.:Ун-т имени В.И. Вернадского, 2010. -№ 4-6(29). -С. 71-87.

5. MAWI Working Group Traffic Archive [Электронный ресурс]. Режим доступа: http://mawi.wide.ad.jp/mawi/

6. Шелухин, О.И. Моделирование информационных систем [Текст] / О.И. Шелухин, А.М. Тенякшев, А.В. Осин. -М.: Радиотехника, 2005. -368 с.

7. Афонцев, Э.В. Опыт построения методик обнаружения вирусной сетевой активности [Текст] / Э.В. Афонцев, С.В. Поршнев // Вестник УГТУ-УПИ. 50-летие радиотехнического образования на Урале. Сер. Радиотехническая. -Екатеринбург: ГОУ ВПО УГТУ-УПИ, 2004. -№20 (50). -С. 215-217.

8. Афонцев, Э.В. Изучение свойств самоподобия временных рядов в задаче обнаружения аномаль-

ного сетевого трафика [Текст] / Э.В. Афонцев, С.В. Поршнев // Науч. тр. VIII отч. конф. ученых ГОУ ВПО УГТУ-УПИ. Сб. статей. -Екатеринбург: ГОУ ВПО УГТУ-УПИ, 2005. -Ч.1. -С. 381-382.

9. Афонцев, Э.В. Спектральные свойства аномального Интернет-трафика [Текст] / Э.В. Афонцев, С.В. Поршнев // Информационные технологии. -2006. -№12. -С. 66-69.

10. Поршнев, С.В. Компьютерный анализ и интерпретация эмпирических зависимостей: Учебник [Текст] / С.В. Поршнев, Е.В. Овечкина, М.В. Мащенко [и др.] // -М.:ООО «Бином-Пресс», 2009.-336 с.

11. Liu, Y. Fluid Models and Solutions for Large-Scale IP Networks [Текст] / Y. Liu [etc.] // SIGMETRICS. Performance Evaluation Review. -NY: ACM, 2003.- Vol. 31. -Iss. 1. -P. 91-101.

УДК 519.876.5

С.Б. Коныгин

границы применимости метода вероятностного клеточного

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

автомата при моделировании физико-химических систем

на атомно-молекулярном уровне

В связи с бурным развитием вычислительной техники в последнее время все большее внимание привлекают к себе методы прямого имитационного моделирования различных процессов на атомно-молекулярном уровне. Сюда можно отнести, например, известные методы ab initio или молекулярной динамики, позволяющие решить ряд важных практических задач, недоступных традиционным подходам статистической физики [1]. Однако здесь существует проблема одновременного учета в модели разнородных физико-химических процессов (ФХП) (например, проблема учета химических реакций в методе молекулярной динамики). Для решения указанной проблемы предложен новый вариант метода вероятностного клеточного автомата (ВКА) [2], моделирующего физико-химические процессы путем прямой имитации элементарных актов перестройки атомно-молекулярной структуры конденсированных сред [3-5].

Согласно базовому принципу предложенного метода микроструктуре моделируемой системы ставится в соответствие сетка ячеек ВКА. Частицам ставятся в соответствие состояния ячеек S, а

случайным процессам перестройки - переходы 3 ячеек между состояниями [3]:

5 = {I, А, В, ...}, (1)

] = {(I, А ),(1, В), (А, В), ...}. (2)

Случайные переходы на каждом шаге моделирования реализуются с вероятностями Ж, определяемыми на основании базовых физических принципов (например, термоактивационные, квантовомеханические) [3]:

™ = {™1Л, ™2В, ™АВ, ..}. (3)

Прямое имитационное моделирование переходов осуществляется с помощью генератора случайных чисел. Интегральные параметры системы, необходимые для дальнейшего использования, определяются путем статистической обработки состояний ячеек ВКА [3].

В связи с тем, что моделирование проводится на атомно-молекулярном уровне рассмотрения, неизбежно возникает вопрос о возможностях и ограничениях данного метода. Поэтому настоящая статья посвящена краткому рассмотрению

i Надоели баннеры? Вы всегда можете отключить рекламу.