УДК 681.51.01 Игумнов Иннокентий Васильевич,
аспирант кафедры «Автоматизированные системы», Иркутский национальный исследовательский технический университет,
тел. 89027600385, e-mail: rtif555@gmail.com Куцый Николай Николаевич, д. т. н., профессор кафедры «Автоматизированные системы», Иркутский национальный исследовательский технический университет,
тел. 89149178520, e-mail: kucyinn@mail.ru
ПРИМЕНЕНИЕ МЕТОДА НЕЛДЕРА - МИДА ПРИ НАСТРОЙКЕ НЕЙРОННЫХ СЕТЕЙ, РЕАЛИЗУЮЩИХ ПИД-ЗАКОН РЕГУЛИРОВАНИЯ
I. V. Igumnov, N. N. Kucyi
APPLICATION OF NELDER - MEAD METHOD WHEN CONFIGURING THE NEURAL NETWORKS THAT IMPLEMENT PID REGULATION
Аннотация. Рассмотрена задача параметрической оптимизации синаптических весов применительно к автоматическим системам регулирования, содержащим звенья с нейронными сетями, реализующими ПИД-закон регулирования. Для её решения предлагается методика определения параметров нейронной сети.
Представлена структурная схема исследуемой автоматической системы и показана архитектура нейронной сети.
Достаточно подробно описаны этапы алгоритма, построенного на основе метода Нелдера - Мида, которые определяют решения задачи параметрической оптимизации рассмотренной автоматической системы. Особое внимание уделено построению начальных симплексов, что в значительной мере определяет успешность применения такого алгоритма.
Приведены результаты настройки автоматической системы на достижение минимума интегральных критериев качества, при использовании таких функций активации нейронной сети, как гиперболический тангенс, сигмоидальная (рациональная), линейная.
Ключевые слова: нейронная сеть, ПИД-регулятор, метод Нелдера - Мида, интегральный квадратичный критерий, интегральный модульный критерий.
Abstract. The problem ofparametric optimization of synaptic weights applied to the automatic control system containing links to the neural networks that implement PID regulation. To solve this problem the technique of determining the parameters of the neural network is proposed.
A structural diagram of the investigated systems is presented and architecture of the neural network is shown.
The article describes in sufficient detail algorithm steps built on the basis of the Nelder-Mead method, which determine the solution of the problem ofparametric optimization of the considered automatic system. Particular attention is paid to the construction of the initial simplex, which greatly determines successful application of this algorithm.
The results of the automatic adjustment system to achieve the minimum of integral quality criteria, using these activation functions of the neural network as the hyperbolic tangent, sigmoid (rational), linear are presented.
Keywords: neural network, PID controller, Nelder-Mead method, integral quadratic criterion, integrated modular criterion.
Введение
В настоящее время при реализации ПИД-закона регулирования находят применение искусственные нейронные сети (ИНС) [1-2]. Следовательно, возникают задачи структурной и параметрической оптимизации, которые зависят от выбранной архитектуры нейросети и критерия оптимизации [2]. В данной работе рассматривается решение задачи, в которой структура нейронной сети задана и необходимо определить её параметры, под которыми понимаются значения весовых коэффициентов и вид активационной функции.
1. Постановка задачи
Для решения задачи параметрической оптимизации предлагается методика определения параметров нейронной сети. Из заданного набора активационных функций последовательно выбирается одна из них, затем с помощью метода Нел-дера - Мида вычисляются значения весовых коэффициентов, которые определяют минимальное значение принятого критерия.
Аналогичным образом поступают со следующей выбранной активационной функцией. Методом сравнительного анализа отбирается та акти-вационная функция, которая обеспечивает наилучшее значение выбранного критерия.
Указанный выше метод Нелдера - Мида по сравнению с других методами (например, метод обратного распространения ошибки, метод покоординатного спуска, метод случайной стрельбы) следующими обладает достоинствами [3]:
- он является метода нулевого порядка;
- это наиболее быстрый и наиболее надежный из неградиентных методов оптимизации нейронных сетей, которые позволяют наиболее эффективно решать поставленную нами задачу.
Изложим вкратце суть этого метода применительно к рассматриваемой задаче.
Метод Нелдера-Мида предназначен для минимизации функционалов f (в настоящей работе f представляет собой критерий качества), состоя-
Информатика, вычислительная техника и управление
щих из п действительных переменных (количество настраиваемых весов), с использованием лишь вычисляемых на каждой итерации значений минимизируемого функционала / (метод нулевого порядка). Как и многие другие методы, метод Нелдера - Мида на каждой итерации поискового процесса хранит невырожденный симплекс - геометрический объект в п-мерном пространстве ненулевого объема, являющийся выпуклой оболочкой, натянутой на п+1 вершину [2].
Каждая итерация рассматриваемого метода поиска минимума начинается с построения симплекса, который представляет собой многогранник, имеющий п+1 вершину, и вычисленные в них значения функционала /. Затем многогранник дополняется одной либо несколькими точками вместе со значениями функционала / в них, после чего координаты одной из вершин многогранника изменяются. Итерационный процесс завершается тогда, когда вершины симплекса и вычисленные в них значения функционала при сравнении с предыдущей итерацией удовлетворяют некоторым условиям сходимости, конкретизация которых имеет вид [4]
1 И+1 1/ <-"4 (х(кУ) - /(х(к^ ^
П +11"!
(1)
где в - произвольное малое число, х, - значения весовых коэффициентов, / = 1, 2, ..., п+1 - номер вершины симплекса, хс - значения весовых коэффициентов в центре тяжести симплекса, /(х(к5) - значение целевой функции в центре тяжести многогранника на к-й итерации, к = (1,2,3,....) - номер итерации.
Также для метода Нелдера - Мида применяются следующие коэффициенты: а, у, в -отражения, растяжения, сжатия соответственно
[4].
2. Описание системы
В качестве иллюстрации вышеизложенной методики рассмотрим пример.
Для искусственной нейронной сети с одним выходом и с одним внутренним скрытым слоем [2] необходимо найти значение весовых коэффициентов и вид активационной функции, обеспечивающие минимальное значение для каждого из интегральных критериев: квадратичного и модульного критерия. Активационные функции нейронной сети (НС) взяты из набора наиболее распространенных наборов [1, 2]: гиперболический тангенс (ГТ), сигмоидальная (рациональная) функция (С), линейная функции (Л). На рис. 1 показана структурная схема автоматической системы, в которой регулирующим устройством является искусственная нейронная сеть. На вход НС поступает значение ошибки е(0, а также её первая производная и интеграл, соответственно е J в(?) . Выход НС
является сигнал ц' (¿).
Искусственная нейронная сеть представлена наиболее распространенной и простой версией НС для ПИД-регуляторов [5, 2] и состоит из трех нейронов Н\, Н2 и Нз (рис. 2).
Передаточная функция объекта регулирования в настоящей работе использована как базовая, относительно которой будут сравниваться результаты проведенных здесь с результатами [1]:
Ж (р) = 0,08-
-23 р
(2)
(54,7 р +1) - (9,1 р +1)
Эксперимент проводился на имитационной модели системы, в которой задающее воздействие ) = 0 , а возмущение ф(^) = 1. В данном случае задача нейронной сети состоит в формировании управляющего воздействия, назначение которого состоит в компенсации сигнала ф(^) .
2. Описание алгоритма
Для выбора начального симплекса метода Нелдера - Мида применен способ максимально возможного влияния отдельного параметра [3]. Сущность его заключается в следующем: каждая точка симплекса отражает максимально возможное влияние 5 (^ Ф 0) отдельного параметра (приоритетного синаптического веса) на выход НС. Но при этом не учитывается архитектура НС, что в общем случае может негативно сказаться на работе алгоритма, сформированного на основе метода Нелдера-Мида. Для устранения этого недостатка в настоящей работе в описанный выше способ внесено несколько дополнений. Во-первых, НС представляется в виде ориентированного графа, где вершинами графа считаются вход(ы) НС, нейроны и выход(ы) НС. Во-вторых, для каждой точки симплекса строятся пути, соединяющие все вершины-входы со всеми вершинами-выходами, при этом содержащие приоритетную дугу (приоритетный вес), и оформляется набор дуг, входящих в эти пути. Если приоритетная дуга соединяет вершину-вход с вершиной-нейроном, к этому набору добавляются дуги, соединяющие эту же вершину-нейрон с другим вершинами-входами. В-третьих, в выбранной точке симплекса все веса, входящие в этот набор дуг, приравниваются к 1, а приоритетный вес, соответственно, 5. Таким образом, начальный симплекс для НС (рис. 2) имеет вид:
w1 ^2 w3 ^5 ^6 ^7 ^8
100 0 1 0 1 0 1 0
0 100 0 1 0 1 0 1
1 0 100 0 1 0 1 0
0 1 0 100 0 1 0 1
1 0 1 0 100 0 1 0
0 1 0 1 0 100 0 1
1 0 1 0 1 0 100 0
0 1 0 1 0 1 0 100
0 0 0 0 0 0 0 0
Также для метода Нелдера - Мида приняты следующие значения коэффициентов [4]: коэффициент отражения а, = 1; коэффициент растяжения у = 2; коэффициент сжатия р = 0,5 ; е = 0,001.
Кратко опишем этапы итерации алгоритма, сформированного на основе метода Нелдера -Мида, для определения значения весовых коэффициентов на достижения минимума интегрального квадратичного критерия при функции активации нейронов - гиперболическом тангенсе.
Этап 1. Подготовка. В табл. 1 показан начальный симплекс метода Нелдера - Мида с рассчитанными значениями интегрального квадратичного критерия в этих точках.
Этап 2. Сортировка. Из начального симплекса выбираются 3 точки: хн - с максимальным значением /и, Xg - со следующим значением / и хг -с наименьшим значением функционала. хй = [1;0;1;0;1;0;100;0],
^ = [0;1;0;1;0;1;0;100], Х = [0;0;0;0;0;0;0;0]
Л = / ( ха ) = 2063782768;
е
Т а б л и ц а 1
Начальный симплекс метода Нелдера-Мида
Юг Ю2 Юз
и а 100 0 1 0 1 0 1 0 11983563,08
<и ч 0 100 0 1 0 1 0 1 11983563,08
с % 1 0 100 0 1 0 1 0 11275702,99
я и 0 1 0 100 0 1 0 1 11275702,99
« 1 0 1 0 100 0 1 0 11243657,36
I л 0 1 0 1 0 100 0 1 11243657,36
ч « 1 0 1 0 1 0 100 0 20637827,68
т « 0 1 0 1 0 1 0 100 20637827,68
I 0 0 0 0 0 0 0 0 63,27
Информатика, вычислительная техника и управление
Л = f () = 20637827,68;
/1 = f (XI) = 63,27.
Этап 3. Нахождение центра тяжести по фор-
X..
2 • 0,375 -100;2 • 12,875- 0]; = [24,5; 25,75;...; - 99,25; 25,75],
муле
= [
х = 1 ^ х ,
с 1
100 + 0 +1 + 0 +1 + 0 + 0 + 0
8
0 +100 + 0 +1 + 0 +1 +1 + 0 0 +1 + 0 +1 + 0 +1 +100 + 0
];
^ = Ахг) = 446,22.
Этап 5. Так как ^ > Д то операция растяжения не проводится.
Этап 6. Так как^ < fg, то операция сжатия не проводится и добавляется точка Хг вместо точки хн.
Таким образом, начальный симплекс примет следующий вид (табл. 2).
Аналогичным образом рассчитывается минимальное значение интегрального квадратичного критерия для оставшихся активационных функций и определяется минимальное значение интегрального модульного критерия для всех активацион-ных функций.
3. Результат работы алгоритма Для гиперболического тангенса, минимальным значением интегрального квадратичного критерия является /кв = 0,033299 и требуется 148
Т а б л и ц а 2
Промежуточный симплекс метода Нелдера-Мида, полученный на 1 итерации
8 ' ' 8 102 103 103 Хс =[ 8 ; 8 ; . ; 8 ] = = [12,75;12,875;...; 0,375;12,875]; Л = f (Хс) = 264334,15.
Этап 4. Отражение - проектирование хн через центр тяжести в соответствии с соотношением:
Хг = (1+ а)хс - ахи:
Хг = [2 • 12,75-1;2-12,875-0;...;
Юг Ю2 Юз Юб f(wl,...,w4 )
и 100 0 1 0 1 0 1 0 11983563,08
1 и я 0 100 0 1 0 1 0 1 11983563,08
и а р 1 0 100 0 1 0 1 0 11275702,99
« е т 0 1 0 100 0 1 0 1 11275702,99
Л I Л ч и 2 1 0 1 0 100 0 1 0 11243657,36
а н 0 1 0 1 0 100 0 1 11243657,36
т « с ы 24,5 25,75 24,5 25,75 24,5 25,75 -99,25 25,75 446,22
Я е л 0 1 0 1 0 1 0 100 20637827,68
с 0 0 0 0 0 0 0 0 63,27
Как видно из табл. 2, условие сходимости (1) не выполняется, следовательно, необходимо приступить к следующей итерации.
Аналогичным образом продолжим итеративный процесс, до тех пор, пока не выполнится условие сходимости. В результате получим следующий симплекс (табл. № 3).
Т а б л и ц а 3
Конечный симплекс, полученный в ходе работы алгоритма, построенного
Ю2 Ю4 Ю5 Ю6 Ю7 Ю8
Конечный симплекс -7,62 -0,75 13,59 -29,29 20,67 -9 -0,70 10,68 0,033416
-7,76 -0,74 13,06 -28,54 19,85 -8,71 -0,67 10,36 0,033585
-7,87 -0,77 12,36 -27,74 19,22 -8,38 -0,64 10,01 0,033299
-7,65 -0,73 13,81 -29,19 20,52 -9 -0,7 10,64 0,034014
-7,77 -0,73 13,32 -28,90 20,41 -8,86 -0,68 10,48 0,033533
-7,83 -0,82 14,122 -28,82 19,45 -8,75 -0,68 10,51 0,033557
-7,93 -0,83 12,49 -27,53 18,86 -8,36 -0,64 9,9 0,034353
-8,03 -0,73 13,07 -28,36 19,73 -8,54 -0,66 10,32 0,033569
-7,69 -0,81 12,08 -27,85 19,65 -8,58 -0,65 10,03 0,033965
итераций алгоритма. Минимальным значением интегрального модульного критерия является /мод = 3,067 и требуется 110 итераций алгоритма.
Для сигмоидальной (рациональной) минимальным значением интегрального квадратичного
критерия является /кв = 0,0689 и требуется 125 итераций алгоритма. Минимальным значением интегрального модульного критерия является /мод = 3,47 c переходным процессом и требуется 98 итераций алгоритма.
Для линейной функции активации минимальным значением интегрального квадратичного критерия является /кв = 0,076299 и требуется 275 итераций алгоритма. Минимальным значением интегрального модульного критерия является /МОд = 2,75 с переходным процессом и требуется 193 итераций алгоритма.
На рис. 3 изображены три переходных процесса, каждый из которых соответствуем минимальному значению квадратичного критерия для различных функций активации. График с индексом ГТ соответствует переходному процессу при функции активации нейронов - гиперболическом
тангенсе. График с индексом С соответствует переходному процессу при сигмоидальной (рациональной) функции. График с индексом Л соответствует переходному процессу при линейной функции. Из графиков следует, что наилучший переходный процесс с точки зрения минимума интегрального квадратичного критерия обеспечивает гиперболический тангенс.
На рис. 4 изображены три переходных процесса, каждый из которых соответствуем минимальному значению модульного критерия для различных функций активации. Индексы графиков соответствуют тем же индексам активационных функций, используемым на рис. 3. Из графиков рис. 4 следует, что наилучший переходный процесс с точки зрения минимума интегрального модульного критерия обеспечивает линейная функция (с коэффициентом к = 1).
Заключение
Таким образом, минимальное значение интегрального квадратичного критерия обеспечивает функция гиперболический тангенс, а минимальное значение интегрального модульного критерия -линейная функция активация нейронов.
Информатика, вычислительная техника и управление
Для проверки правильности найденных экстремумов использованы другие начальные симплексы, также полученные способом максимально возможного влияния отдельного параметра, которые привели к схожим результатам.
Из всего вышесказанного следует, что методика решения задачи определения параметров нейронной сети с применением метода Нелдера -Мида может успешно применяться при настройке нейронных сетей, реализующих ПИД-закон регулирования.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Сабанин В.Р., Смирнов Н.И., Репин А.И. Автоматический системы регулирования на основе
нейросетевых технологий // Сборник трудов конференции Control 2003. М. : Изд-во МЭИ, 2003.С. 10-18.
2. Терехов В.А., Ефимов Д.В., Тюкин И.Ю. Нейросетевые системы управления. М. : ИПРЖР, 2002. 480 с.
3. Математический синтез оптических наноструктур / К.П. Ловецкий, Л.А. Севастьянов, О.Н. Бикеев, М.В. Паушто. М. : Изд-во РУДН, 2008. 143 с.
4. Химмелъблау Д. Прикладное нелинейное программирование. М. : МИР, 1975. 536 с.
5. Бураков М. В., Кирпичиков А. П. Синтез дискретного нейро-Пид регулятора // Вестник казан. технол. ун-та. 2014. № 1(17). С. 286-288.
УДК 614.841.3 Носков Сергей Иванович,
д. т. н., профессор, профессор кафедры «Информационные системы и защита информации», Иркутский государственный университет путей сообщения,
e-mail: noskov_s@irgups.ru Врублевский Иван Петрович, аспирант, Иркутский государственный университет путей сообщения,
e-mail: VrublevskiyIP@mail.ru
ФОРМИРОВАНИЕ ОБЛАСТИ ОПРЕДЕЛЕНИЯ ЛИНЕЙНОЙ РЕГРЕССИОННОЙ ЗАВИСИМОСТИ
S. I. Noskov, I. P. Vrublevskiy
FORMING DEFINITION INTERVAL A LINEAR REGRESSION
Аннотация. Рассматривается метод построения области определения регрессионной модели, позволяющий корректно применять ее при прогнозировании за счет оценки степени допустимости будущих значений независимых переменных. Метод основан на построении для каждой объясняющей переменной своей линейной регрессионной зависимости, в которой эта переменная выступает в качестве зависимой. Ошибки аппроксимации этой зависимости трактуются как характеристики ширины области допустимых значений для соответствующей переменной. Декартово произведение этих характеристик и предлагается трактовать как область определения исходной модели. Далее в статье рассматриваются так называемые «мягкая» и «жесткая» интерпретации области определения регрессионной модели.
Ключевые слова: регрессионная модель, прогнозирование, область определения.
Abstract. A method for constructing the field of determination of the regression model, which allows to apply it correctly in the prediction due to the assessment of the permissibility of future values of independent variables is considered. The method is based on constructing, for each explanatory variable, a linear regression in which this variable acts as a dependent. The error of approximation of this dependence is interpreted as the characteristic width of the region ofpermissible values for the corresponding variable. The Cartesian product of these characteristics is proposed to interpret the scope of the original model. Further, the article examines the so-called "soft" and "hard" interpretation of the scope of the regression model.
Keywords: regression model, forecasting, scope.
Рассмотрим линейную регрессионную зависимость (регрессию) вида
т
У к =Е агХШ +£ к , к = м , (1)
1=1
где п - число наблюдений (длина выработки); ук и Хй , к = 1, п , 1 = 1, т - значения зависимой и независимых переменных соответственно; а , 1 = 1, т - подлежащие оцениванию параметры;
ек , к = 1, п - ошибки аппроксимации. Присутствие в уравнениях вида (1) этих составляющих означает, что данная связь описывает процесс не точно, а с некоторой погрешностью. Это может быть вызвано:
■ неточностями в регистрации значений зависимой и независимых переменных;
■ влиянием помех;
■ неучетом ряда значимых факторов;