Идентификация в условиях внешнего возмущения с использованием нейронных сетей
Ведякова А.О.
Аннотация—В статье решается задача нахождения коэффициентов линейной математической модели судна с использованием нейросетевого подхода, при котором статическая нейронная сеть аппроксимирует правую часть уравнений динамики, основываясь на информации о векторе состояния нелинейной модели и его производной. Определение коэффициентов линейной модели судна производится путем линеаризации сформированной нейронной сети.
Ключевые слова—Внешние возмущения, идентификация математической модели, надводное судно, статическая нейронная сеть.
I. Введение
В настоящее время вопросы, связанные с моделированием окружающих нас объектов и явлений, формирует одно из основных направлений в науке и технике. Результатом моделирования выступает математическая модель, применяющаяся как для анализа свойств рассматриваемых объектов или явлений, так и для синтеза систем управления ими.
При описании математической модели любого достаточно сложного динамического объекта, например, морского судна, как правило, точно не известны значения ряда его параметров, которые заменяются приближенными оценками. Они могут быть весьма далекими от истинных величин, что позволяет трактовать соответствующие математические модели как грубое приближение, требующее дальнейшего уточнения.
Подобное уточнение можно выполнить экспериментальным путем, используя результаты динамических экспериментов. Такой подход реализуется путем постановки и решения соответствующей задачи параметрической
идентификации [1-2].
Условия внешней среды, при которых приходится решать задачи судовождения, разнообразны. Пренебрежение возмущением в системе зачастую приводит к неустойчивости и неадекватности поведения модели по отношению к динамике реального объекта.
В данной статье рассматривается нейросетевой подход к идентификации математической модели,
Статья получена
Ведякова Анастасия Олеговна - аспирант факультета ПМ-ПУ СПбГУ (e-mail: [email protected]).
описывающем динамику судка в условиях внешнего возмущения. Нейронные сети (НС) представляют собой мощный математический инструмент, показавший свою состоятельность при решении широкого класса задач, таких как распознавание образов, аппроксимация, классификация, прогнозирование и пр. Наиболее важными преимуществами НС перед традиционными математическими методами являются, во-первых, способность к обучению, позволяющая находить неизвестные взаимосвязи между входными и выходными сигналами, во-вторых, устойчивость к шумам во входных сигналах, и, в-третьих, при практической реализации нейронная сеть может быть представлена в виде параллельно выполняемых операций [3-5].
Согласно [6] в виду наличия достаточного объема обучающих данных, полученных в результате динамического эксперимента над судном, применение нейросетевого подхода для решения задачи параметрической идентификации является
оправданным.
II. Математическая модель
А. Модель судна Рассмотрим задачу идентификации линейной модели бокового движения на примере судна водоизмещением 4500 м3, основные физические характеристики и нелинейные уравнения которого приведены в работе [7].
Линейная математическая модель бокового движения представляется системой дифференциальных уравнений:
Уу = ацУу + а^ю + Ь^б,
Ю = а21Уу + а22Ю + Ь26, (1)
ф = Ю,
6 = и,
где Уу - боковая составляющая линейной скорости; юх
- угловая скорость вращения по курсу; 6 - угол перекладки вертикальных рулей; ф - угол курса; и -
управляющий сигнал; ац, а^, ®2\, а22, Ь, ^ -неизвестные коэффициенты линейной модели.
Целью работы является восстановление шести коэффициентов линейной модели (1) в результате решения задачи идентификации. В качестве входного воздействия на объект используются вертикальные рули.
Будем считать, что величины Уу (), ) и 6(/)
измеряются, а производные У у и со () либо
измеряются, либо восстанавливаются в процессе движения реального объекта.
В. Модель внешних возмущений В данной работе в качестве внешних возмущений учитывается морское волнение, влияющее на динамику судна.
Для формирования возмущающего сигнала ограниченной спектральной плотности [7] использовался подход, заключающийся в пропускании единичного белого шума через фильтр с передаточной функцией:
2Л аВгз
Н ^ = 2 Л[Г2 в2), (2)
5 + 2 а 5 + (а + р )
где Вг - дисперсия волновой ординаты, 5 - оператор Лапласа, аЕ(0;1) - коэффициент затухания, р -угловая частота.
Амплитуда возмущающего воздействия была взята равной 10% от максимального значения полезного сигнала.
III. Нейросетевой подход к идентификации
Рассматриваемый в работе подход к идентификации предполагает формирование статической нейронной сети, которая аппроксимирует векторную функцию
векторного аргумента / О/ /2 (•))", стоящую в правой части системы дифференциальных уравнений, описывающих динамику судна: к
'#(0 = /2 [Уу, ш б)
Каждую компоненту функции правых частей /(•) из (3) предлагается аппроксимировать своей НС, входными сигналами которых будут являться элементы вектора состояния Уу, ш, 6, а выходным - значение производной
соответствующей компоненты вектора состояния: Уу
для /1 и со для /2. Обозначим нейронную сеть, аппроксимирующую/1 как ЫвТ\, а/2 - Nв^2.
В качестве архитектуры для ЫвЦ и Nв^2 примем двухслойную статическую нейронную сеть прямого распространения с сигмоидальным скрытым слоем нейронов и линейным выходным слоем. Архитектура описанного типа для НС ЫвТ\ представлена на рис. 1, где
w1, - весовые коэффициенты скрытого и
(3)
Vі
р1 .
pl
скрытый слои выходной слои
Рис. 1. Архитектура статической НС МеТ\.
Нейронная сеть Ne^2 имеет ту же структуру что и Иеіі, изображенную на рис. 1, за исключением того, что в качестве выхода НС Ne^2 выступает ш.
Сеть представленной на рис. 1 архитектуры обладает хорошими аппроксимационными свойствами, что определяется утверждением [4], приведенным ниже. Утверждение. Пусть ф(*) - непрерывная
непостоянная функция скалярного аргумента, и пусть С множество непрерывных функций, заданных на
3 2
Я 3 В ^ Я . Тогда для любой функции / Є С и любого вещественного числа е > 0 существует такое целое число N и такой набор вещественных
1 2 1 2
коэффициентов , Pj , рк, где /=1..3, j=1..N, что
векторная функция
N
3
WIJX1 + p)
+p2, k = 1,2 (4)
функции fk (•),
выходного слоев соответственно,
коэффициенты смещений при /=1..3, j=1..N; параметр к равен 1 для НС Net1 и 2 для Net2; N - количество
нейронов скрытого слоя; ф(г ) = (1 + exp(-r))-1, w(r )= r
- функции активации скрытого и выходного слоев соответственно.
рк (хь х2, Х3 )= ^ ЛУ]к ф|
] =1 %
является аппроксимацией удовлетворяющей условию
\Рк(хЬх2, х3 )-/к(хЬx2,х31 к = 1,2 (5)
для всех х = (х}, Х2, Х3 )е В, где х - вектор входных сигналов НС, а под обозначениями компонент х±,х2,Х3 понимаются соответственно Уу, ш, 6.
Приведенное утверждение гарантирует успешную аппроксимацию, но, к сожалению, не дает инструкций по количеству функций Ы, необходимых для решения рассматриваемой задачи.
IV. Моделирование обучающих данных
На практике предполагается, что нелинейная математическая модель, описывающая динамику объекта, неизвестна, доступны лишь результаты динамических экспериментов, по которым необходимо определить параметры линейной модели. В данной работе вместо результатов динамического эксперимента предлагается использовать сигналы, полученные путем моделирования нелинейной модели с известными параметрами, приведенной в работе [7]. В таком случае компоненты матриц линейной модели, полученной в результате ее линеаризации можно рассматривать в качестве эталонных для проверки результатов идентификации.
для получения обучающих данных была построена нелинейная модель морского судна в среде МАТЬАБ БтиНпк. Управляющий сигнал задавался в виде
обратной связи и = + К2 (ф-ф ), обеспечивающей
отработку заданной курсовой командной поправки ф ,
где К = -500/V, К = -5с"1 - коэффициенты
стационарной обратной связи.
Для генерации входного сигнала к построенной БтиПпк-модели использовался подход, заключающийся в пропускании единичного белого шума через фильтр нижних частот. На рис. 2 представлен один из
возможных вариантов изменения желаемой курсовой
*
поправки ф .
Рис. 2. Желаемое значение по курсу ф рад.
Иной подход к формированию входного сигнала для
*
БтиПпк-модели при ступенчатом входном сигнале ф
со случайной длинной ступеньки и случайной высотой рассмотрен в работе [8].
V. Обучение нейронной сети
При обучении статической нейронной сети необходимо уточнить алгоритм обучения и метод оценки качества функционирования сети.
А. Обучающий алгоритм
В качестве обучающего алгоритма сетей Ыв^ и Ывг2 рассматривался метод градиентного спуска
Ам() = -г\~— + аАм( -1),
дм
(7)
где ) - коррекция весов на /-ом шаге обучения, Е(у>) - функция ошибки, п - длина шага, а -коэффициент инерции.
B. Оценка невязки
Для оценки невязки целевых выходов и выходов нейронных сетей Ыв/1 и Ыв/2 за основу бралось среднеквадратическое отклонение (СКО)
е<- -11 ^ - ‘-2• (8)
д-0
где у^ - реакция НС Ыв/к к=1,2 на входное
воздействие х.
C. Обучающая выборка
В качестве обучающих данных НС использовались результаты моделирования БтиПпк-модели в течение Т = 20000с с шагом дискретизации А/ = 0,1с . Обучение нейронных сетей Ыв/1 и Ыв/2 производилось на соответствующих наборах обучающих пар {ху|?)
для Ыв/1 и {ху2р)} для Ывг2 при q = 0, п, где п = 1 + Т / Д/ - общее количество обучающих пар, а
У1?) = У [ф!) = V ) у^ = у 2 ) = ю ) -
целевые выходы, соответствующие входному сигналу х('д') = ) = (уу (qЛt), ю(дЛ/), 6(qЛt )).
Б. Алгоритм обучения НС
Процесс обучения нейронной сети происходит итеративно, и его шаги принято называть эпохами. На каждом шаге обучения на вход сети последовательно
подаются все наборы обучающих пар {х(?), у^)} при
д = 0, п, выходы сети сравниваются с целевыми значениями, и вычисляется функция ошибки. Значения функции ошибки, а также ее градиента используются для корректировки весов и смещений, после чего все действия повторяются. Начальные значения весов и смещений сети выбираются случайным образом. Процесс обучения прекращается либо когда реализовано определенное количество эпох, либо когда ошибка достигнет некоторого малого значения или перестанет уменьшаться.
Нейронные сети Ыв/1 и Ыв/2 с 7 нейронами на скрытых слоях обучались в течении 1000 эпох за 5мин .
Е. Проверка результатов обучения Проверка качества обучения нейронной сети производится по тестовой выборке, не участвующей в процессе обучения.
Среднее квадратическое отклонение невязки целевого
сигнала и выхода НС Ыв/1 и Ыв/2 е£, к = 1,2 из (8) не
1 Л-5 2/4 1Л-7 \2 / 4
превышает 10 м / с и 10 рао / с соответственно
для сетей Ыв/1 и Ывг2 на тестирующем наборе (разность в порядке величин возникает из-за разного порядка компонент вектора состояния).
На графиках, изображенных на рис 3, представлены результаты обучения нейронных сетей Ыв/1 и Ыв/2. Красным цветом изображены целевые выходы тестовых выборок, синим - выходы нейронных сетей, соответствующие входным сигналам тестового набора.
хЮ0
Рис. 3. Результаты обучения.
VI. РЕЗУЛЬТАТЫ идентификации
Обученные нейронные сети Ыв/1 и Ыв/2, представляющие собой скалярные функции от трех переменных (3), были линеаризованы относительно нулевого положения равновесия компонент вектора состояния Уу, ю, 6.
При линеаризации нейронных сетей параметры получившихся моделей соответствуют компонентам матриц А и Б системы линейный дифференциальных уравнений (1). Относительная погрешность коэффициентов полученной линейной модели и компонент эталонных матриц линейной модели (1) представлены в таблице 1.
Таблица I. Оценки параметров линейной модели.
Относительная погрешность компонент матриц (%)
А в
&3,7620 8,9021 # еггА = 1 1 А %8,3947 5,0733" & 2,6198 # ЄГГБ = $ 6,0024 "
[1 ] Семенов А. Д. Идентификация объектов управления: Учебн. пособие // А. Д. Семенов [и др.]. - Пенза: Изд-во Пенз. гос. ун-та, 2003. - 211 с.
[2] Сотникова М. В. Особенности идентификации параметров линейной модели бокового движения судна методом наименьших квадратов. - Гироскопия и навигация, 2011. - № 4. -с. 84-91.
[3] Осовский С. Нейронные сети для обработки информации. - М.: Финансы и статистика, 2002. - 344 с.
[4] Хайкин С. Нейронные сети. - М.: «Вильямс», 2006. - 1104 с.
[5] Козлов Д.В. Построение модели объекта с помощью радиальнобазисных нейронных сетеи // Д.В. Козлов [и др.]. - Известия Тульского государственного университета. Технические науки, 2010. - № 1. - с. 165-170.
[6] Степанов О. А. Нейросетевые алгоритмы в задаче нелинейного оценивания. Взаимосвязь с байесовским подходом. Материалы XI конференции молодых ученых Санкт-Петербург, ГНЦ РФ ЦНИИ «Электроприбор», 2009, с. 39-65.
[7] Веремей Е.И. Компьютерное моделирование систем управления движением морских подвижных объектов // Е.И. Веремей [и др.]. - СПб: НИИ Химии СПбГУ, 2002. - 370 с.
[8] Ведякова А.О. Идентификация математической модели судна с использованием нейронной сети при учете внешних возмущений. Современные информационные технологии и ИТ-образование / Сборник избранных трудов VIII Международной научнопрактической конференции. Под ред. проф. В.А. Сухомлина. -М., ИНТУИТ.РУ, 2013. - с. 698-705.
Из таблицы 1 можно заметить, что параметры линейной модели (1), полученные предложенным в данной работе методом в условиях внешнего возмущения, составляют относительную погрешность, не превосходящую 9%, от их эталонных значений.
VII. Заключение
В работе подтверждена применимость и эффективность привлечения нейросетевого подхода для решения задач идентификации моделей морских подвижных объектов в условиях постоянного воздействия внешних возмущений. Разработан новый подход к идентификации нелинейной модели судна на базе статической нейронной сети с последующей линеаризацией для получения параметров линейной модели.
NEURAL NETWORK APPROACH FOR IDENTIFICATION UNDER EXTERNAL DISTURBANCE
Vediakova A.O.
Abstract—In marine systems the changing environmental conditions and the complexity of the infrastructure needed to carry out experimental tests call for mathematical models for accurate simulations. There exist a wide number of techniques to define mathematical models from experimental data.
In this paper neural network approach for parametric identification linear mathematical model of a surface vessel under external disturbance is proposed. Training data is based on information about the state vector and its derivative. The static neural network is training for approximation the right side function of the differential system describing vessel dynamic. Estimates for model parameters are obtained by linearization neural network.
Keywords—External disturbances, identification of the mathematical model, static neural network, surface vessel.