Научная статья на тему 'Нейросетевая прогнозная модель интенсивностей самоподобного трафика телекоммуникационной сети с пакетной передачей данных'

Нейросетевая прогнозная модель интенсивностей самоподобного трафика телекоммуникационной сети с пакетной передачей данных Текст научной статьи по специальности «Математика»

CC BY
134
47
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЛИНЕЙНАЯ ДИНАМИКА / ТЕОРЕМА ТАКЕНСА / НЕЙРОННЫЕ СЕТИ / МНОГОСЛОЙНЫЙ ПЕРСЕПТРОН / ВРЕМЕННЫЕРЯДЫ / ТРАФИК СЕТИ GIGABIT ETHERNET / САМОПОДОБИЕ

Аннотация научной статьи по математике, автор научной работы — Габдрахманов Артур Айратович, Габдрахманова Наиля Талгатовна

Исследованы статистические характеристики интенсивностей трафика сети GigabitEthetnet. Доказана самоподобная природа реального сетевого трафика. Изучены возможности использования для идентификации трафика сети GigabitEthetnetнейросетевых технологий. Описан алгоритм построения модели, приведен анализ адекватности построенной модели. С помощью построенной модели получены прогнозные значения итенсивностей трафика на несколько шагов впередI

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Габдрахманов Артур Айратович, Габдрахманова Наиля Талгатовна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

n this paper the intensity of self-similar traffic of Gigabit Ethernet was researched. For this we use the measurement of real network. The research proves the selfsimilar nature of real traffic. Opportunity to use neural network to indicate the traffic of Gigabit Ethernet was shown. Our findings are, that our mathematical model is able to predict the intensity of traffic for some steps to forth

Текст научной работы на тему «Нейросетевая прогнозная модель интенсивностей самоподобного трафика телекоммуникационной сети с пакетной передачей данных»

СПИСОК ЛИТЕРАТУРЫ

1. Васильев, В.И. Интеллектуальные системы защиты информации [Текст]/В.И. Васильев.-М.: Машиностроение, 2010. -152 с.

2. ADAM: Detecting Intrusions by Data Mining [Текст]/ Proc. of the IEEE Workshop on Information Assurance and Security, West Point, NY, June 5-6, 2001. -Р. 11-16

3. Wang, H. Detection SYN flooding attacks [Текст]/ H. Wang, D. Zhang, K. Shin//Proc. of the IEEE Infocom. Conf., 2002.-P. 1530-1539.

4. Brugger, S.T. Data mining methods for network intrusion detection [Текст]/З.Т. Brugger.-University of California, Davis, 2004.-65 р.

5. Dewan Md., Farid Attacks Classification in Adaptive Intrusion Detection using Decision Tree [Текст]/ Far-id Dewan Md., Nouria Harbi, Emna Bahri [et al.]//World

Academy of Science, Engineering and Technology.-March 2010. -Iss. 63.-P. 86-90.

6. Гарусев, М.Л. Методы Data Mining в автоматизированном построении профиля пользователя защищаемой автоматизированной системы [Текст]/ М.Л. Гарусев//Научно-технический вестник СПбГУ-ИТМО.-2006.-№ 25.-С. 127-134.

7. Lee, W. Data mining approaches for intrusion detection [Текст]/Ж Lee, Salvatore J.Stolfo//Proc. of the 7th USENIX Security symp.-San ¿Antonio, Texas, Jan. 26-29, 1998.-Р.6.

8. Барсегян, А.А. Методы и модели анализа данных: OLAP и Data Mining [Текст]/ Барсегян А.А., Куприянов М.С., Степаненко В.В. [и др.]. -СПб.: БХВ-Петербург, 2004.-336 с.

УДК 004.732

А.А. Габдрахманов, Н.Т. Габдрахманова

НЕЙРОСЕТЕВАЯ ПРОГНОЗНАЯ МОДЕЛЬ ИНТЕНСИВНОСТЕЙ САМОПОДОБНОГО ТРАФИКА ТЕЛЕКОММУНИКАЦИОННОЙ СЕТИ С ПАКЕТНОЙ ПЕРЕДАЧЕЙ ДАННЫХ

Прогнозирование трафика телекоммуникационной сети с пакетной передачей данных играет значительную роль при разработке алгоритмов, повышающих качество обслуживания сети ^оБ). Провайдеры телекоммуникационных услуг, например, заинтересованы в возможностях долгосрочного прогнозирования загрузки собственной сети для планирования ее своевременного развития. В настоящее время переход к новым технологиям в сетях телекоммуникации сопровождается появлением новых, неизученных, сложных явлений. Исследования измерений интенсивностей трафика в сетях Интернет и в других сетях [1-4] показали, что трафик в них является самоподобным случайным процессом. Из этого следует, что широко используемые в настоящее время методы моделирования и расчета сетевых систем, основанные на использовании пуассоновских потоков, не дают полной и точной картины происходящего в сети. Данная статья посвящена исследованию процессов в сетях, построению прогнозных моделей и формированию на базе полученного

математического описания этих процессов предложений по управлению сетевым трафиком.

Для исследования на эффект самоподобия был взят пограничный коммутатор второго уровня организации, ориентированной на предоставление услуг магистральной связи. Трафик, поступающий на каждый порт устройства, представляет собой суммированный трафик от групп клиентов определенного района. Структурная схема проведения измерений приведена на рис. 1.

Статистика снята при помощи программы Cacti, протокол SNMP-Interface statistic. График интенсивностей, измеренных на порту GE 0, приведен на рис. 2. Измерения производились в течение недели.

Сетевой трафик, приведенный к эквидистантной форме по оси времени (с помощью процедуры агрегирования), представляет собой некоторый временной ряд (реализацию дискретного случайного процесса). Поэтому анализ сетевого трафика фактически сводится к задаче обработки временного ряда. На первом этапе решения

Рис.1. Схема проведения измерений

задачи получены оценки статистических характеристик временного ряда, позволяющие судить о наличии самоподобия в изучаемом процессе. Известно, что непрерывный стохастический процесс Х(?) считается статистически самоподобным с параметром Н (0,5 < Н < 1), если для любого положительного числа а процессы Х(?) и а НX (а) будут иметь идентичные распределения, т. е. иметь одинаковые статистические свойства для всех положительных целых п:

{X (О, X (?2),..., X (гя )}~{а-НХ ад а-Н X К),..., а-Н X (Мп)}.

в

Отношение ~ обозначает асимптотическое равенство в смысле распределения. Практически статистическая самоподобность подразумевает, что выполняются следующие условия:

Е[ X а)]

среднее E[X (t)] = -дисперсия Var[X (t)] =

Var[ X (at)]

(1) (2)

функция автокорреляции R(t,x) = (3)

a

где H - параметр Херста (Hurst), показывает «степень» самоподобности. Значение H = 0,5 показывает отсутствие самоподобности. Для фрактальных процессов, обладающих протяженной зависимостью статистик, значение параметра Херста лежит в диапазоне 0,5 < Н < 1.

Согласно проведенным вычислениям, параметр Херста исследуемого временного ряда Н=0,9. Исследования автокорреляционной функции интенсивностей трафика свидетельствуют о медленно убывающей зависимости между величинами интенсивностей трафика в разные моменты времени. Произведенные расчеты по формулам (1)-(3) временных рядов с различным уровнем агрегирования также подтвердили самоподобный характер процесса.

Самоподобные процессы обладают сложным поведением, согласующимся с понятием детерминированного хаоса. Эволюцию системы можно наблюдать не только как функцию времени, но и

Рис. 2. График интенсивностей трафика на порту GE 0

н

a

как траекторию системы в фазовом пространстве. Фазовое пространство - многомерное пространство, где каждое измерение соответствует определенной системной переменной. Каждая точка в фазовом пространстве соответствует уникальному состоянию системы. Режим детерминированного хаоса также характеризуется аттрактором, но траектория такого аттрактора непериодическая (не замыкается) и режим функционирования неустойчив (малые отклонения от начальных условий нарастают экспоненциально). Ф. Такен-сом такие аттракторы названы «странными». Согласно теореме Такенса [5], можно восстановить параметры динамической системы по единственной реализации (временному ряду) с помощью изучения траектории системы в р-мерном фазовом пространстве, координатами которого являются компоненты следующего вектора:

¥.Р=\Х.,...,Х. 1, (4)

I [ I 1-{р-\)\

где р - лаг. Вектор (4) лага р называется линией задержки. Данная операция называется погружением аттрактора в пространство размерности р. Результатом успешного погружения является выявление определенных закономерностей в поведении траектории системы в пространстве данной размерности. Смысловая трактовка состоит в следующем: в каждый определенный момент система проходит подобные условия - внутреннее и внешнее состояние системы. Предсказание эксплуатирует этот принцип: используя наблюдаемое поведение системы, можно предсказать ее будущее поведение, когда схожие условия появятся вновь. Линия временной задержки представляет историю (эволюцию) системы. Теорема Такенса предполагает, в принципе, нелинейную авторегрессию в форме:

х(( + 1) = у(х(0, хЦ - 1), ..., хЦ - р + 1)), (5)

где у(-) - некоторая нелинейная функция своих аргументов.

Таким образом, задача прогнозирования временного ряда сводится к задаче оценки нелинейной функции у(-) от многих переменных по набору примеров, заданных историей временного ряда. Детальный анализ теоремы Такенса показывает, что при ее использовании накладываются некоторые дополнительные ограничения, в частности, на вид функции у(-). Реально эта функция должна зависеть от меньшего числа параметров, т. е. опреде-

лять отображение в себя некоторой m-мерной поверхности в р-мерном пространстве [5]. Это обстоятельство в полной мере «учитывается» персептроном, т. к. структура многослойных пер-септронов оказывается такой, что позволяет строить проекции малой размерности.

Ниже приведены основные результаты решения задачи построения прогнозной нейросетевой модели (НСМ).

Постановка задачи. Дан временной ряд самоподобного процесса:

|Х(0, t е },

где X(t) - интенсивность трафика в момент времени t. Необходимо построить по экспериментальным данным математическую модель для вычисления прогнозных значений X(t) на Т шагов вперед с заданной точностью.

Пустьр - размерность фазового пространства. Тогда вектор входных переменных Z(t) = {t, X(t), X(t - 1), ...,X(t - (p - 1))}; вектор выходных переменных Y (t) = {X (t +1), X (t + 2), X (t + 3)}.

Необходимо построить отображение вида:

Y (t) = F (Z (t)),

где F () - оператор нейросетевого отображения.

Основные этапы решения задачи.

1 этап. Решена задача предобработки и нормировки реально измеренных данных интенсив-ностей трафика на порту GE0.

Для нашей задачи выбрана нормировка, использующая статистические характеристики данных, такие, как выборочная средняя и дисперсия:

х =———, х =—Ух^а2 =—— Т(ха-х)2.

■ ' I pZ-i i > , р 1 . 1 /

СТ. Г а=1 Г— 1а=1

2 этап. Выбор модельной структуры.

Для решения поставленной задачи предлагается использовать нейронные сети типа многослойный персептрон (MLP). Архитектура нейросети: многослойный персептрон с двумя скрытыми слоями. Функция активации нейронов скрытого слоя - гиперболический тангенс; выходного слоя - линейная функция. Алгоритм обучения: алгоритм обратного распространения ошибки. При выбранной модельной структуре нейросети процедура обучения представляет собой отображение множества экспериментальных данных на множество параметров (весовых коэффициентов) нейросетевой модели с целью получения оптимального в силу некоторого критерия, выходного сигнала.

Таблица 1 Фрагмент значений векторов выходных данных

Х(Н-1) ХЛ(Н-1) Х(*+2) Хл(Г+2) Х(*+3) Хл(н-3)

1 -0,67854 -0,69324 -0,70211 -0,68568 -0,66604 -0,67567

2 -0,70211 -0,70213 -0,66604 -0,69251 -0,68107 -0,6839

3 -0,66604 -0,71813 -0,68107 -0,7069 -0,68861 -0,70014

4 -0,68107 -0,70917 -0,68861 -0,69946 -0,71239 -0,69284

5 -0,68861 -0,71327 -0,71239 -0,70218 -0,70119 -0,69562

6 -0,71239 -0,72433 -0,70119 -0,71211 -0,69074 -0,70412

Таблица 2

Относительные ошибки и ошибки вычисления НСМ

ЕЦ+1) Еотн (н-1), % Е{1+2) Еотн (Н-2), % ЕЦ+З) Еотн 0+3), %

1 0,014705 -2 -0,01644 2 0,009621 -1

2 1Д4Е-05 0 0,026462 -А 0,002827 0

3 0,052086 -8 0,025828 -4 0,011527 -2

4 0,028104 -4 0,010851 -2 -0,01955 3

5 0,024655 -4 -0,01021 1 -0,00558 1

6 0,011939 -2 0,010922 -2 0,013381 -2

3 этап. Обучение и тестирование сети.

При построении НСМ весь массив данных разбит на три массива: обучающая, валидацион-ная и тестовая выборка. По данным обучающей и валидационной выборки построены НСМ с ранним остановом.

Результаты тестирования представлены на рис. 3 и в табл. 1, 2.

В табл. 2 использованы следующие обозначения: - ошибка вычисления НСМ: Е^+№) = = Х(Г+М)-ХЛ(Г+Ы), где Х(Г+Ы) - регламентированное значение интенсивности в точке Еотн - относительная ошибка вычисления НСМ: Еотн

Хл((+Ы) - вычисленное НСМ значение интенсивности в точке

Рис. 3. График результатов тестирования нейросети

Полученные результаты свидетельствуют о том, что для решения задачи прогнозирования интенсивностей сомоподобного трафика телекоммуникационной сети с пакетной передачей данных можно использовать нейросетевые технологии. Ошибка прогноза не превышает 4 %.

Возможность прогнозирования интенсивно-

стей самоподобного трафика сети позволяет получить данные для решения задачи управления -задачи формирования алгоритма предотвращения перегрузки.

Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований, проект 10-01-00381-а.

СПИСОК ЛИТЕРАТУРЫ

1. Leland, W.E. On the Self-Similar Nature of Ethernet Traffic [Текс^/W.E. Leland, M.S. Taqqu [et al.]// Proc. ACM SIG COMM'93.-San Fransisco, CA, 1993. -P. 183-193.

2. Шелухин, О.И. Самоподобие и фракталы. Телекоммуникационные приложения [Текст]/О.И. Шелухин, А.В. Осин, С.М. Смольский; Под ред. О.И. Шелухина.-М.: Физматлит, 2008.-368 с.

3. Крылов, В.В. Теория телетрафика и ее прило-

жения [Текст]/В.В. Крылов, С.С. Самохвалова.-СПб.: БХВ-Петербург, 2005.-288 с.

4. Городецкий, А.Я. Информатика. Фрактальные процессы в компьютерных сетях: Учеб. пособие [Текст]/А.Я. Городецкий, В.С. Заборовский.-СПб.: СПбГТУ, 2000.

5. Хайкин С. Нейронные сети: полный курс [Текст]/ С. Хайкин; Пер. с англ.-М.: Изд. Дом «Ви-льямс», 2006.-2-е изд.-1104 с.

УДК 658.512:004.42,658.512:519.87

К.Г. Жуков, Д.Н. Бутусов

КОРРЕКЦИЯ ПОГРЕШНОСТИ РЕШЕНИЯ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ ВТОРОГО ПОРЯДКА

Один из способов описания динамических систем - представление в виде передаточной функции. Передаточные функции высокого порядка могут быть представлены в виде передаточных звеньев второго и первого порядка. При подобном представлении имеет смысл повысить точность реализации каждого звена системы, что приведет к уменьшению общей погрешности. В работе [2] рассматривается способ перехода от передаточной функции к системе уравнений в нормальной форме Коши, называемый методом совместного интегрирования.

Пусть управляемая система с одним входом и одним выходом (Б1БО-система) задана следующей передаточной функцией:

W(S) =

Y(S)

со

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(1)

X(S) S2 + 2qooS + со2 Запишем выражение (1) в виде дифференци-

ального уравнения второго порядка:

d2y „ dy 2 2 / \ —Y + 2qs>— + or1 у = в) x(t). dt dt

(2)

Выполним следующие преобразования над выражением (2):

+ 2сю— = со2х(0 - ю2у. Л2 Л

Разделим обе части выражения на ю:

¿г со Л

Вынесем оператор — за скобки в левой части: dt

— (-т1- + 2$У) = <о*(0 - <ву ■ йг йг со

Приняв выражение в скобках за у1, получим следующую систему уравнений:

at

(3)

Аналитическое решение для системы (3) имеет вид:

у2 (Г) = -£.-".- -в"" совСЫ) +1. (4)

i Надоели баннеры? Вы всегда можете отключить рекламу.