Научная статья на тему 'Синтез прогнозных моделей на основе нейронной сети'

Синтез прогнозных моделей на основе нейронной сети Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
136
29
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
прогнозирование / метод нечетких правил / погрешность / нечетко-нейронная система прогнозирования / prediction / illegible procedure approach / inaccuracy / fuzzy-neuron prediction system

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Губин М. В.

Рассмотрены основные вопросы построения нечетко-нейронных систем прогнозирования. Предложено использование нейронных сетей для объединения результатов прогнозирования различными методами.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PREDICTION PATTERNS SYNTHESIS ON NEURON NETWORK BASE

This work is devoted to the main problems of fuzzy-neuron prediction systems construction. The author suggests using neuron networks to unite the prediction results, which were found with different ways.

Текст научной работы на тему «Синтез прогнозных моделей на основе нейронной сети»

УДК 521.345

синтез прогнозных моделей на основе нейронной сети

ГУБИН М.В., асп.

Рассмотрены основные вопросы построения нечетко-нейронных систем прогнозирования. Предложено использование нейронных сетей для объединения результатов прогнозирования различными методами.

Ключевые слова: прогнозирование, метод нечетких правил, погрешность, нечетко-нейронная система прогнозирования.

prediction patterns synthesis on neuron network base

M.V. GUBIN, postgraduate

This work is devoted to the main problems of fuzzy-neuron prediction systems construction. The author suggests using neuron networks to unite the prediction results, which were found with different ways.

Key words: prediction, illegible procedure approach, inaccuracy, fuzzy-neuron prediction system.

Актуальность усовершенствования существующих и разработки новых методов прогнозирования обусловлена существенным их значением при решении важных проблем управления производством, планирования, экономики, социологии и т.д. Также необходимо отметить отсутствие какой-либо всеобъемлющей методики построения прогнозных систем и их дальнейшего анализа (получение показателей качества и достоверности прогноза). Зачастую авторы того или иного метода не могут дать четкого «рецепта» построения прогнозирующей системы. Отчасти это объясняется тем, что ряд методов имеет трудно формализуемую реализацию (например, прогнозирование с использованием нечеткой логики, как правило, требует привлечения экспертов; прогнозирование на ней-росетевых моделях упирается в проблему выбора структуры, размера, алгоритма обучения нейронной сети), а отчасти, возможно, тем, что подобная проблема просто не ставилась. Между тем от выбора метода и его реализации (определения структуры и параметров прогнозирующего алгоритма) зависит успешность разрешения проблемы. Например, в [1] показана зависимость выводов, получаемых посредством нечеткой экспертной системы, от формы функций принадлежности, выбор которой осуществляется, как правило, произвольно.

В настоящее время существует достаточно большое количество методов прогнозирования, и каждый из методов, как правило, содержит в себе некоторое количество конструкционных параметров. Обычно авторы прогнозных моделей не дают обоснования выбора того или иного метода моделирования. Можно отметить, что в этом просматривается влияние «моды» на те или иные методы, а также информация об успешном опыте применения данного метода для решения аналогичных задач. Вместе с тем подобным основанием могут стать результаты сравнительного анализа различных методов прогнозирования применительно к конкретной задаче, выполненного на основе идей, являющихся развитием идей А. Г. Ивахненко о самоорганизации сложных моделей. Поскольку сравнение моделей из разных классов имеет смысл при условии оптимальности каждой из них в своем классе, то для решения предварительно необходимо найти для каждого класса несколько лучших с точки зрения выбранного критерия моделей. В свою очередь, данная задача приводит к необходимости создания программного комплекса, осуществляющего поиск опти-

мальных прогнозирующих моделей в некотором множестве. Данный программный комплекс должен обладать свойством расширяемости, а также позволять осуществлять сравнение на основе ряда различных критериев. Необходимо отметить, что создание данного комплекса позволит осуществлять выбор удачных гибридных моделей (т.е. моделей, сочетающих в себе достоинства двух или более методов).

В качестве иллюстрации плодотворности идеи построения синтетических методов прогнозирования рассмотрим нечетко-нейронный (fuzzy-neural) подход к прогнозированию. Достоинством прогнозирующих систем на основе нечеткой логики является то, что база знаний (правил) легко интерпретируется и может быть на любом этапе скорректирована экспертом; к недостаткам можно отнести их неспособность к обучению. К достоинствам нейронных сетей относятся обучаемость и способность к адаптации, однако знания распределяются по всей сети и не могут быть интерпретированы. Используя идеи этих подходов, возможно сконструировать гибриды, объединяющие наилучшие свойства обоих подходов и в то же время свободные от их недостатков.

При решении большинства прикладных задач информацию, необходимую для построения нечеткой системы, можно разделить на две части: численную, поступающую от датчиков, и лингвистическую, поступающую от эксперта. Значительная часть нечетких систем использует второй вид знаний, представляемых в виде базы нечетких правил. В случае, когда возникает необходимость спроектировать нечеткую систему, но в наличии имеются только численные данные, мы сталкиваемся с серьезными проблемами (а такая ситуация является весьма распространенной в задаче прогнозирования). Для решения этой задачи можно использовать следующий, один из простейших, но в то же время весьма универсальный метод построения базы нечетких правил на основе численных данных [2, 3, 4]. Схематично он может быть представлен в виде последовательности этапов:

1. Разбиение пространств входных и выходных сигналов на нечеткие множества. Зная диапазоны, в которых изменяются входные и выходные сигналы, для осуществления данного этапа необходимо задаться только количеством и формой функций принадлежности нечетких множеств.

2. Построение нечетких правил. Для каждой пары (х, у) из обучающего множества определим степе-

ни принадлежности всех входных и выходных сигналов к нечетким множествам, выделенным на этапе 1. Нечеткие множества, дающие максимальные значения функций принадлежности, образуют нечеткое правило.

3. Приписывание степеней истинности правилам. Для каждого элемента обучающего множества может быть сформулировано одно правило, поэтому при большой длине обучающего множества часть из этих правил окажется противоречивой, т.е. правила будут иметь одинаковые посылки, но различные выводы. Эта проблема может быть решена путем вычисления для каждого правила степени истинности с последующим выбором из правил с одинаковыми посылками того, у которого она окажется выше. Для правил вида

R:IF(xi это Ai AND Х2 это A2) THEN (y это В)

степень истинности определяется как

SP(R) = Ца1 (xi) • ЦА2 (Х2) -МУ).

4. Создание множества нечетких правил. Множество нечетких правил будет содержать правила, отобранные на предыдущем этапе.

Процесс формирования правил в соответствии с предложенным алгоритмом в значительной степени зависит от размещения функций принадлежности нечетких множеств, от их количества и вида. Подбор наилучшего размещения и вида функций принадлежности представляет собой самостоятельную проблему. В качестве одного из путей ее решения можно предложить использование самоорганизации для поиска оптимального вида и количества функций принадлежности. Другой вариант - представить систему нечеткого управления в виде многослойной сети с прямым распространением сигнала. В ходе обучения такой сети подбираются оптимальные значения для центров и ширины функций принадлежности. Для ее обучения используется алгоритм обратного распространения ошибки.

Структуру сети (см. рисунок) можно представить следующим образом:

Слой И. Каждый его элемент реализует функцию принадлежности нечеткого множества, например функцию Гаусса. В этот слой поступают входные сигналы, а на выходе формируются значения функции принадлежности для этих сигналов, т.е. в этом слое осуществляется фаззификация.

Слой 12. Конфигурация связей этого слоя соответствует базе правил, а мультипликаторы - блоку вывода. На выходе слоя формируется результат вывода. Количество элементов этого слоя равно количеству правил.

Слои L3 и L4. Оба слоя представляют собой реализацию блока дефаззификации (в данном примере применяется метод среднего центра). На выходе слоя 4 формируется «четкое» выходное значение.

Отметим, что обоснованием выбора функции Гаусса в качестве функции принадлежности в слое 1, а также правила Ларсена в блоке вывода (слой 2) является обеспечение дифференцируемости функций активации нейронов для последующего применения алгоритма обратного распространения ошибки. В случае наличия в структуре модуля нечеткого управления функций min и max, возможно использование подходов, позволяющих применять алгоритм обратного распространения ошибки:

1) погрешность передается на все узлы предыдущего слоя, с которыми данный элемент связан, одинаково;

2) погрешность распространяется только к тем элементам, которые выработали максимальное (минимальное) значение;

3) погрешность распространяется пропорционально входным значения таким образом, чтобы значение погрешности возрастало с приближением сигнала к его максимальному / минимальному значению.

Наконец, возможно применение метода обучения, не требующего дифференцируемости функций активации нейронов, например генетического алгоритма для минимизации среднеквадратической ошибки на обучающем множестве.

Описанная структура имеет много общего с нейронными сетями: она представляет собой многослойную сеть, основанную на идее нечеткого вывода. В отличие от «чистых» нейронных сетей, каждый слой в целом и отдельные составляющие его элементы, так же, как и конфигурация связей, имеют физическую интерпретацию. Это свойство является важным, поскольку знания не распределяются по сети и могут быть легко локализованы и при необходимости откорректированы экспертом.

В рамках исследования предлагается следующий подход к синтезу нового метода прогнозирования, заключающегося в комбинировании уже существующих методов. Подобное комбинирование будем осуществлять на основе многослойной нейроноподобной сети, «нейроны» 1-го скрытого слоя которой представляют собой реализации некоторых методов прогнозирования. Для обучения можно использовать рекуррентный метод наименьших квадратов. Улучшить качество функционирования методов прогнозирования можно посредством предобработки входных данных. В качестве предобработки предлагается вейвлет-преобразование с целью фильтрации шума, а затем какой-либо метод понижения размерности входных данных, например метод главных компонент.

Заключение

1. Предложено использование программного комплекса для сравнительного анализа методов прогнозирования.

2. Рассмотрен нечетко-нейронный подход к прогнозированию. Предложены способы разрешения проблем при обучении нейронно-нечеткой сети, содержащей недифференцируемые функции min и max.

3. Для исключения ненужной или малозначимой информации предложено использование методов

фильтрации и методов понижения размерности входных данных.

4. Предлложена методика синтеза прогнозной модели на основе искусственной многослойной НС, первый слой нейронов в которой представляет собой множество различных методов.

Список литературы

1. Губин М.В., Коровин Д.И. О проблеме выбора нечетких функций при проведении анализа методами нечеткой логики // Вестник научно-промышленного общества. Вып. 6. -М.: Изд-во «Алев-В», 2002.

2. Рутковская Д., Пилиньский М., Рутковский Л.

Нейронные сети, генетические алгоритмы и нечеткие системы: Пер. с польск. И.Д. Рудинского. - М.: Горячая линия -Телеком, 2004.

3. Wang L.X., Mendel J.M. Generating Fuzzy Rules by Learning from Examples // IEEE Transactions on Systems, Man, and Cybernetics. - November/December 1992. - Vol.22. - № 6. - Р.1414-1427.

4. Wang L.X. Adaptive Fuzzy Systems and Control - Design and Stability Analysis. - Prentice Hall: Englewood Cliffs, 1994.

i Надоели баннеры? Вы всегда можете отключить рекламу.