НЕЙРОСЕТЕВАЯ МОДЕЛЬ ОЦЕНКИ СОСТОЯНИЯ РАСПРЕДЕЛЕННОЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ
Скорик Фадей Александрович
соискатель лаборатории проблем компьютерной безопасности Санкт-Петербургского института информатики и автоматизации РАН
(СПИИРАН), г. Санкт-Петербург Е-mail: work_bk@bk. ru Саенко Игорь Борисович д-р техн. наук, профессор, вед. науч. сотр. лаборатории проблем компьютерной безопасности Санкт-Петербургского института информатики и автоматизации РАН ( СПИИРАН), г. Санкт-Петербург
E-mail: [email protected]
NEURAL STATEMENT ASSESSMENT MODEL FOR A DISTRIBUTED
INFORMATION SYSTEM
Fadey Skorik
Applicant of Laboratory of Computer Security Problems, St. Petersburg Institute for
Informatics and Automation of RAS (SPIIRAS), St. Petersburg
Igor Saenko
Ph.D., Professor, Leading research scientist of Laboratory of Computer Security Problems, St. Petersburg Institute for Informatics and Automation of RAS (SPIIRAS),
St. Petersburg
АННОТАЦИЯ
В статье рассматривается прогностическая модель оценки состояния распределенной информационной системы, построенная при помощи аппарата искусственных нейронных сетей. Рассмотрена методика обучения нейронной сети, предназначенной для прогнозирования временных рядов. Получена статистическая оценка ошибок обучения. Показано, что предложенная модель позволяет с достаточной точностью выявлять критические элементы системы.
ABSTRACT
The article considers the predictive model of statement assessment for a distributed information system, built using the artificial neural networks. The method of training the neural network that is designed for time series’ prediction is discussed. The statistical estimation of learning errors is obtained. It is showed that the model allows sufficient accuracy to identify the critical elements of the system.
Ключевые слова: прогностическая модель; искусственная нейронная сеть, временные ряды.
Keywords: the predictive model; the artificial neural networks; time series.
Под распределенной информационной системой (РИС) будем понимать территориально распределенную программно-аппаратную систему, предназначенную для автоматизации целенаправленной деятельности конечных пользователей и обеспечивающую, в соответствии с заложенной в нее логикой, возможность получения, модификации и хранения информации. Способность РИС выполнять свои функции напрямую зависит от состояния ее программного обеспечения и аппаратного оборудования, на основе которого она развернута. Следовательно, необходим постоянный мониторинг состояния РИС с целью выявления ее «узких мест» и отказов программных и технических средств, способных оказать влияние на ее работоспособность [4—5].
Прогнозирование внештатных ситуаций, как правило, требует существенных вычислительных затрат [6]. Одним из направлений уменьшения затрат на прогнозирование и минимизации требуемых на это ресурсов является использование моделей, основанных на искусственных нейронных сетях (ИНС). Аппарат ИНС подразумевает минимальное участие аналитика, так как для всех нейросетевых моделей характерна способность к обучению, а алгоритмы обучения адаптируются (подстраивают свои весовые коэффициенты) в соответствии со структурой данных, представленных для обучения [3]. Поэтому целью настоящей работы является разработка и тестирование нейросетевой модели для оценки состояния РИС.
Исходными данных для обучения ИНС являются:
• конфигурация и текущее состояние программного обеспечения и оборудования;
• статистическая информация о производительности и загруженности каждого узла сети;
• статистическая информация об использовании приложений.
Эти данные можно получить при помощи стандартных SNMP—клиентов, входящих в состав общего программного обеспечения РИС. После завершения обучения их можно использовать в качестве исходных данных для прогноза.
В задачах прогнозирования временные ряды рассматриваются как последовательности измерений, упорядоченные в неслучайные моменты времени, отвечающие следующим условиям: 1) периодизации развития;
2) сопоставимости значений; 3) соответствии периодов интенсивностям процессов; 4) отсутствию пропусков. Только при выполнении этих условий можно говорить, что последовательность является временным рядом и для нее применимы соответствующие методы анализа и прогнозирования [1].
Нейросетевое моделирование временных рядов заключается в формировании ИНС определенной структуры, описывающей поведение исследуемой системы в моменты времени, а прогнозирование заключается в предсказании будущего поведения системы по предыстории. Обучение таких ИНС заключается в подстройке весовых коэффициентов на основании изменения фактической погрешности прогнозирования на итерациях [2].
Предложим для прогнозирования временных рядов в РИС обобщеннорегрессионную ИНС, реализующую методы ядерной аппроксимации. Выход сети может рассматриваться как ожидаемое значение модели в данной точке пространства входов, связанное с плотностью вероятности совместного распределения входных и выходных данных. В точку расположения каждого обучающего наблюдения помещается гауссова ядерная функция. Каждое наблюдение свидетельствует о некоторой уверенности в том, что поверхность отклика в данной точке имеет определенную высоту, и эта уверенность убывает при отходе в сторону от точки. Сеть копирует внутрь себя все обучающие наблюдения и использует их для оценки отклика в произвольной точке. Окончательная выходная оценка сети получается как взвешенное среднее выходов по всем обучающим наблюдениям, где величины весов отражают расстояние от этих наблюдений до той точки, в которой производится оценивание.
Обобщенно-регрессионная сеть имеет два скрытых слоя: слой радиальных элементов и слой элементов, которые формируют взвешенную сумму для соответствующего элемента выходного слоя. В выходном слое определяется взвешенное среднее путем деления взвешенной суммы на сумму весов. В качестве радиальной функции применяется функция Г аусса.
Входной слой передает сигналы на первый промежуточный слой нейронов, являющихся радиально симметричными. В нем формируются взвешенные суммы для всех элементов выходного слоя и сумма весов, вычисляемая специальным элементом.
Выходной слой делит взвешенные суммы на сумму весов и выдает окончательный прогноз.
Достоинством обобщенно-регрессионной сети является определенность ее структуры — сеть фактически вмещает в себя все обучающие данные. С другой стороны, такая структура ИНС является ее недостатком — при большом объеме обучающих данных скорость работы сети падает по причине заметного увеличения сложности архитектуры [7].
Выходное значение сети имеет вероятностный смысл, поэтому его легче интерпретировать. При небольшом объеме входных данных сеть очень быстро обучается.
Обучение сети необходимо выполнять отдельно для каждого временного ряда, так как попытка прогнозирования ряда, на котором сеть не была обучена, приведет к ошибочному результату.
В качестве алгоритма обучения лучше всего использовался модифицированный алгоритм обратного распространения ошибки с автоматической коррекцией длины шага обучения.
По итогам тестирования нейросетевой модели в локальной вычислительной сети, состоящей из 10 узлов, получены следующие статистические результаты: математическое ожидание ошибки 0,01275;
дисперсия ошибки 0,00115; СКО ошибки 0,01264. Это позволяет сделать вывод, что предложенная нейросетевая модель позволяет осуществить достаточно
точный прогноз поведения HBC, что затруднительно сделать при помощи линейных моделей традиционного технического анализа, поскольку имеются элементы нелинейности и хаотичности, проявляющиеся при совместной работе большого количества обособленных элементов системы.
Список литературы:
1. Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление. М:. Мир, 1974. — С. 16.
2. Горбань А.Н. Обобщенная аппроксимационная теорема и вычислительные возможности нейронных сетей // Сибирский журнал вычислительной математики. — 1998. — Т. 1, № 1. — С. 12.
3. Козадаев А.С., Арзамасцев А.А. Прогнозирование временных рядов с помощью аппарата искусственных нейронных сетей. Краткосрочный прогноз температуры воздуха // Вестник Тамбовского университета. — 2006 — № 3. — С. 299.
4. Котенко И.В., Саенко И.Б., Полубелова О.В., Чечулин А.А. Применение технологии управления информацией и событиями безопасности для защиты информации в критически важных инфраструктурах // Труды СПИИРАН. —2012. — Вып.1 (20). — C. 27—56.
5. Котенко И.В., Саенко И.Б., Полубелова О.В., Чечулин А.А. Технологии управления информацией и событиями безопасности для защиты компьютерных сетей // Проблемы информационной безопасности. Компьютерные системы. — 2012. — № 2. — C. 57—68.
6. Саенко И.Б., Скорик Ф.А. Определение допустимости масштаба операций при проведении распределенных вычислений // 66-я научно-техническая конференция, посвященная Дню радио. 19—29 апреля 2011 г. Труды конференции. Санкт-Петербург. — 2011. — С. 88—89.
7. Солдатова О.П., Семенов В.В. Применение нейронных сетей для решения задач прогнозирования [Электронный ресурс]. Режим доступа: http://zhumal.apc.rclam.rn/articlcs/2006/136.pdf. (дата обращения: 18.01.13)