Научная статья на тему 'Метод прогнозирования изменения трафика с использованием нейросетевой модели'

Метод прогнозирования изменения трафика с использованием нейросетевой модели Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
674
129
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОНТАКТ-ЦЕНТР / САМОПОДОБНЫЙ ТРАФИК / ИНТЕНСИВНОСТЬ ТРАФИКА / ПРОГНОЗИРОВАНИЕ / НЕЙРОННАЯ СЕТЬ / РЕЗУЛЬТАТЫ ТЕСТИРОВАНИЯ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Покровская М. А.

Для обеспечения эффективной работы контакт центра, он должен иметь уровни эффективности управления доступными ресурсами. Одним из возможных решений может быть метод прогнозирования, который позволит избежать перегрузки веб сервера. Предлагается использовать модель нейронной сети для прогнозирования изменений трафика. Для исследования использованы данные реально существующих сетей связи.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Покровская М. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Метод прогнозирования изменения трафика с использованием нейросетевой модели»

У

ТЕХНОЛОГИИ

Метод прогнозирования изменения трафика с использованием нейросетевой модели

Ключевые слова: контакт-центр, самоподобный трафик, интенсивность трафика, прогнозирование, нейронная сеть, результаты тестирования.

Для обеспечения эффективной работы контакт-центра, он должен иметь уровни эффективности управления доступными ресурсами. Одним из возможных решений может быть метод прогнозирования, который позволит избежать перегрузки веб-сервера. Предлагается использовать модель нейронной сети для прогнозирования изменений трафика. Для исследования использованы данные реально существующих сетей связи.

Покровская МА,

аспирант очного обучения МТУСИ по кафедре

Сети связи и системы коммутации, mari.pokrovskaya@gmail.com

Основная трудность в описании функционирования мультимедийного контакт-центра и, особенно, УУеЬ-подсистемы контакт-центра, согласно ряду экспериментальных исследований [1-3], заключается в том, что поступающие запросы имеют самоподобный характер и, как следствие, медленнозатухающие распределения интервалов времени как между поступающими запросами, так и между обработанными запросами. На качественном уровне самоподобие проявляется в том, что появляется медленно-убывающая зависимость между величинами трафика в различные периоды времени, и в том, что трафик имеет выбросы, которые выглядят статистически подобными при различных масштабах времени. Использование классических пуассоновских моделей в этом случае приводит к недооценке реальной нагрузки. Именно поэтому прогнозирование трафика в контакт-центрах является комплексной и актуальной задачей.

Перспективным подходом к прогнозированию функционирования контакт-центров является применение теории нейронных сетей. У данного метода прогнозирования есть три неоспоримых преимущества, которые становятся особенно актуальными, когда речь заходит о прогнозировании самоподобных случайных процессов: во-первых - отсутствие формальной модели; во-вторых - быстрая адаптация к изменяющимся условиям; третье - возможность работы с зашумленными данными.

Задача прогнозирования методом нейронных сетей решается с помощью таких свойств, как обобщение и нахождение скрытых зависимостей между накопленными данными. В случае, если такая зависимость реально существует, и будущие значения могут быть предопределены предыдущими, нейронная сеть может найти такую зависимость и выполнить прогноз с определенной точностью. Анализ сетевого трафика, в таком случае, сводится к задаче обработки временного ряда [2].

Для решения поставленной задачи будем использовать реальные данные с порта \УеЬ-сервера. Предварительно необходимо провести подготовительную работу - скорректировать аномальные точки и осуществить нормировку всех данных. Общий принцип нормировки данных для построения нейросе-тевых моделей состоит в максимизации энтропии входов и выходов. Как было показано в [4], для нормировки данных можно воспользоваться их статистическими характеристиками, такими как выборочная средняя и дисперсия;

(1)

= х.—х,

х, = —--------

Р-1Т

(2)

(3)

где х, - нормировочная компонента, а номер строки,

/ - номер столбца.

В момент времени I входной вектор состоит из объемов трафика за предыдущие п отметок времени; выходной вектор состоит из значений трафика в последующие ш моментов времени: вектор входных данных: 2(1)={1, Х(0, Х(1-1), ... Х(1-5)}; вектор выходных данных: У(1)={Х(1+1), Х(1+2), Х(И-З)}. Получаем матрицу входных/выходных нормированных векторов (в примере используется 500 значений для входных данных, в статье для наглядности приводится выборка из 12 значений (см. табл. 1 и 2).

Таблица 1

Массив векторов входных данных

N 1 х(Ч-5) х(1-4) х(1-3) х(1-2) х(М) Х(0 I

1 1820 111 129 122 124,5 116 128

2 1821 129 122 124,5 116 128 125

3 1822 122 124,5 116 128 125 123,5

4 1823 124,5 116 128 125 123,5 118

5 1824 116 128 125 123,5 118 130

6 1825 128 125 123,5 118 130 122 1

7 1826 125 123,5 118 130 122 118

8 1827 123,5 118 130 122 118 136

9 1828 118 130 122 118 136 123 1

10 1829 130 122 118 136 123 125,5

11 1830 122 118 136 123 125,5 132

12 1831 118 136 123 125,5 132 120

Таблица 2

N х(1+1) х*(1+1) х(1+2) х*(1+2) х(1+3) х*0+3)

1 125 125,13 123,5 123,45 118 117,14

2 123,5 123,37 118 117,39 130 131,11

3 118 116,99 130 130,9 122 121,77

4 130 130,98 122 121,73 118 117,14

5 122 121,61 118 117,39 136 138,02

6 118 116,99 136 137,78 123 122,94

7 136 138,01 123 122,89 125,5 125,83

8 123 122,79 125,5 125,74 132 133,37

9 125,5 125,71 132 133,19 120 119,45

10 132 133,2 120 119,43 118 117,14

11 120 119,27 118 117,39 120,5 120

12 118 116,99 120,5 120,01 118 117,14

Для решения поставленной задачи использовалась одна из архитектур нейронной сети - многослойный персеп-трон (МРЬ), который, как было доказано в [5], позволяет решать наиболее комплексные задачи произвольной сложности. Многослойным персептроном называют нейронную сеть прямого распространения. Входной сигнал в таких сетях распространяется в прямом направлении от слоя к слою.

т

ТЕХНОЛОГИИ

Примером многослойного персептрона является следующая модель нейронной сети, показанная на рис. 1.

В>1Ход

Выход

Выход

Рис. 1. Модель нейронной сети с двумя скрытыми слоями

Многослойный персептрон имеет три основных отличительных признака.

1.Каждый нейрон сети имеет нелинейную функцию активации. При этом функция должна быть гладкой, т.е. дифференцируемой во всех точках. В нашем случае используется сигмоидальная функция активации нейронов, показанная на рис. 2. Наличие нелинейности очень важно, так как в противном случае отображение «вход-выход» можно свести к обычному однослойному персегггрону.

,*<<»)

0.8 ~~г

0.6 (

0,4 / е° — е~а

0.2 / >

-1 -0.8 -0,6 -0.4 -0,2 I 0 0.2 0.4 0.6 0.8 1 а

I -0.2

-0.4

J -0.6

-0.8 1 -

нейронов второго скрытого слоя; ~ функции акти-

вации нейронов первого И второго слоев; Н’|ш и>,(| 1 и>30 *

начальное возбуждение /-го, к-го нейрона первого, второго и выходного слоев; и>, и’,т - весовые коэффициенты.

Моделирование проводилось в среде С8Ьагр. Функция активации нейронов скрытого слоя — сигмоидальная, выходного слоя - линейная функция. Весь массив данных делился на 3 выборки - обучающую, валидационную и тестовую. В приведенном примере сеть обучалась на части выборки (порядка 200 значений), при этом контролировалась на валидационной выборке (150 значений). Работа происходила на значениях, не участвующих в обучении, - это основной принцип достоверности модели. В процессе исследования нейросетевой модели менялось количество нейронов в скрытых слоях и количество эпох обучения, на каждом шаге определялась среднеквадратичная ошибка, которая и являлась индикатором, позволяющим выбрать конкретное соотношение нейронов для скрытых слоев. В итоге были получены следующие результаты:

Для прогнозирования на три шага вперед оптимальное количество нейронов в первом скрытом слое - 6, во втором слое — 3. Графики результатов тестирования представлены на рисунках 3-5. Результаты обучения представлены в табл.3.

140

120

100

80

x(t)

predict

60

01Л01Л01Л01Л01Л01Л01ЛОЯ01ЛОЛ01ЛОЛ01ЛСХЛ оонтнгчк^тгп'^-'лтлююг^г'оооостстюог-к-нгмгмтт vjvlvf 4f vtvf Vt^MVt^Lni/TLnLntrjLTlLn

Рис. 3. Г рафик результатов тестирования нейронной сети с прогнозированием на один шаг вперед

Рис. 2. Вид сигмоидальной функции активации нейронов

2. Имеется несколько скрытых слоев. Многослойный персептрон содержит один или несколько слоев скрытых нейронов, не являющихся частью входа или выхода сети. Эти нейроны позволяют сети обучаться решению сложных задач, последовательно извлекая наиболее важные признаки из входного образа.

3.Су шествует высокая связность. Это значит, что каждый нейрон в любом слое сети связан со всеми нейронами (узлами) сети предыдущего слоя. Сигнал передается по сети исключительно в прямом направлении слева направо, от слоя к слою.

В случае многослойного персептрона с двумя скрытыми слоями нейронная сеть строит отображение вида: У*(1)=Р(Х(1))=

А(Чо + X + X^-/(Х »*'./*;(') + »«’,„,))) * (4)

* 1 т I

где / = 1,2,..., п — число нейронов входного слоя; т = 1,2,... М- число нейронов первого скрытого слоя; к= 1,2, ...К - число

140

120

100

80

60

IV-

X(t)

predict

о/талз/ол^лэлсто/о/о/о/о/огол

CP—t—Tsr4tTf>sKfr-fV\I3iQ'H^4aXPTTCDr-t—г^глгп

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ис. 4. График результатов тестирования нейронной сети с прогнозированием на два шага вперед

140

120

100

80

60

-------predict

OUDCNOO^frO VOfNOO^TOVOfNOO^O VOfNOO^ ОЧЭГМ о о г-н тн гч го m ^ 1Л ч> г^. оо сг» <т> о о t-ч гм eg m

Рис. 5. График результатов тестирования нейронной сети с прогнозированием на три шага вперед

т

Таблица 3

Результаты обучения нейронной сети

Параметры сети Тестовая выборка Вапидационная выборка

Количество эпох 1000 1000

Минимальная нормированная среднеквадратичная ошибка прогнозирования на 3 шага вперед 0,0194657564 0,0425628048

Минимальная нормированная среднеквадратичная ошибка прогнозирования на 2 шага вперед 0,0191698545 0,0430861704

Минимальная среднеквадратичная ошибка при прогнозировании на 1 шаг вперед 0,0180768402 0,0429483209

Выводы

1. Полученные результаты показывают, что для решения задачи прогнозирования изменения трафика в контакт-центрах, в основе которого лежат самоподобные процессы, перспективно использовать метод нейронных сетей, обладающий высокой способностью обобщения.

2.Возможность прогнозирования самоподобного трафика в дальнейшем позволит оперативно решать задачу управления перегрузками на \Veb-cepBepax контакт-центров.

ТЕХНОЛОГИИ

Литература

1. IVlandelbaum, A., Massey, W.A. and Reiman, М.I. (1998), Strong approximations for Markovian service networks,Queueing Systems: Theory and Applications (QUESTA) 30, pp. 149-201.

2. Лившиц К.И., Шнферлекер И.Ю. Диффузионная аппроксимация математической модели деятельности некоммерческого фонда при релейном управлении капиталом // Вестник ТГУ, 2006. №293. - С. 38-44.

3. Crovella М. Е., Bestavros A. Self-similarity in world wide web traffic evidence and possible causes // Proc. of the 1996 ACM S1GMETR1CS: Intern, conf. on Measurement and modeling of computer systems. May, 1996 and IEEE/ACM Trans on Networking, 1997. V.5, №6. pp. 835-846.

4. Veres A., Kenesi Zs., Molnar S., Vattay G. On the Propagation of Long-Range Dependence in the Internet // Proc. ACM SIG-COMM 2000. Stockholm, Sweden, Sep. 2000.

5. Kugiumtzis D., Boudourides M. Chaotic Analysis of Internet Ping Data: Just a Random Generator // SOEIS meeting at Bielefeld, March 27-28, 1998.

6. Foag J., Wild T. Traffic Prediction Algorithm for a Speculative Network Processor // 17th Intl. Symposium for High Performance Computing Systems and Applications HPCS 2003. Sherbrooke, May 2003.

7. Trajkovic L., Neidhardt A. Internet traffic prediction // Centre for Systems Science, Simon Fraser University, Vol. 12, Issue 1. Mar. 2000.

Method of predicting changes in traffic using the neural network model

Pokrovskay MA, MTUCI, mari.pokrovskaya@gmail.com

Abstract

To ensure the effective operation of the contact-center it must have the levels of effective management of its resources. One possible solution might be the method of prediction which will allow to avoid the overload of Web-server. In this paper it is offered to use the neural network model for prediction of traffic changes. For the research It is used the data of the real existing network, calculated mean-square errors and graphed the plots of one, two and three steps prediction.

Keywords: contact-center, self-similar traffic, traffic intensity, prediction, the neural network, the test results.

i Надоели баннеры? Вы всегда можете отключить рекламу.