ISSN 0868-5886
НАУЧНОЕ ПРИБОРОСТРОЕНИЕ, 2007, том 17, № 2, c. 72-80
= ИНФОРМАЦИОННО-ИЗМЕРИТЕЛЬНЫЕ СИСТЕМЫ
УДК 681.51; 621.391
© А. В. Меркушева, Г. Ф. Малыхина
ОПРЕДЕЛЕНИЕ ДИНАМИКИ СИСТЕМЫ С УПРАВЛЕНИЕМ И ИЗМЕРИТЕЛЬНЫМ КОНТРОЛЕМ НА ОСНОВЕ СЕТИ С СИММЕТРИЧНОЙ АКТИВАЦИОННОЙ ФУНКЦИЕЙ НЕЙРОНОВ
Рассмотрены элементы метода определения динамики нелинейного многопараметрического объекта (системы) на основе моделирования с использованием сети с симметричной функцией преобразования нейронов. Обученная сеть способна аппроксимировать динамику объекта и подсистемы его контроля в пространстве параметров состояния.
ВВЕДЕНИЕ
Информационные системы находят применение в составе технических комплексов, выполняющих функцию управления или стабилизацию параметров состояния исследуемого объекта. При этом важной задачей является контроль текущих параметров состояния объекта, реализуемый измерительной системой. Наиболее сложен анализ при нелинейности многопараметрического объекта и системы его контроля с присущими элементами стохастического характера динамики их изменения. Как правило, отсутствуют как полная модель объекта, так и системы косвенного измерения его текущих параметров. В этом случае задача идентификации функциональной структуры многомерного объекта и связанной с ним измерительной системы становится особенно трудной.
Одним из подходов к получению достаточно точного приближения к модели динамики исследуемого объекта состоит в применении параметрических или непараметрических методов идентификации. В параметрических методах используются некоторые нелинейные функции, по каким-то признакам соответствующие модели динамики, и параметры этих функций определяются на основе данных вход—выход исследуемой системы (объекта).1"1 Существует также непараметрический метод, основанный на так называемом ядре, который не предполагает знания структуры системы [3]. Несмотря на то что эти методы ориентированы на установление модели, которая лучшим образом описывает соотношение вход—выход у системы, они оказываются малоподходящими для
Такие модели называют также моделями с предсказанием ошибки, и для оценки параметров в них применяется метод наименьших квадратов или метод максимального правдоподобия [1], [2].
динамического управляемого (или стабилизируемого) объекта, связанного с информационной системой контроля (ИСК), где каждый из них (объект и ИСК) описывается собственной моделью поведения. Таким образом, для многих комплексов технических средств в области научных исследований и имитационного моделирования2) требуется отдельное оценивание характеристик самого объекта и ИСК, включающей совокупность датчиков, реакция которых определяется текущими значениями параметров состояния изучаемого объекта.
Следует отметить, что задача оценки параметров состояния динамической системы (ДС) с элементами стохастики, определяемыми наличием шумов (искажений сигналов) в самой управляемой системе и в каналах ИСК включая датчики, имеет точное решение, только когда уравнения модели ДС и ИСК линейные. В этом случае апостериорная плотность распределения вероятностей шума будет гауссовой, а условное среднее и ковариации достаточно хорошо описываются уравнениями фильтра Калмана. Для задач оценки параметров нелинейных ДС требуется использование локальной или общей линеаризации, которая позволяет применять схемы расширенного метода Калмана [2], [4]. Однако линеаризация уравнений ДС и ИСК вдоль их траектории в пространстве состояний может быть основана только на достаточно адекватных моделях этих уравнений.
Для решения анализируемой задачи (которая особенно сложна при высокой степени нелинейности характеристик анализируемых подсистем) оказывается возможным использование метода нейронных сетей (НС), в частности сетей с симметричной функцией преобразования нейронов
2) Сюда относятся системы стендового и полунатурного моделирования перспективных образцов техники и их подсистем.
(СФПН) [5]. Основу разработки подхода к анализу систем с использованием НС положили работы Погио и Гироси (Poggio, 0^08^, Партасарси и Нарендры (РайЬа8аг1:Ьу, КагеМга) [6], [7], в которых универсальное свойство НС получения аппроксимации для функций применено для идентификации модели динамической системы и показана возможность применения метода НС для динамического и статического объектов.
Непосредственное применение метода НС в отдельных случаях не приводит к хорошему результату, особенно при недостаточной точности представления нелинейности модели объекта. Поэтому была использована модификация метода НС с оценкой верхней границы ковариационной матрицы шума, которая позволяет получать оценку параметров состояния с минимальной дисперсией. Процедура вычисления верхней границы использует ошибки аппроксимации, связанные с заменой реальной анализируемой системы на сеть с СФПН. Затем получается субоптимальный фильтр, который применяется для оценки переменных состояния исследуемой ДС.
МОДЕЛЬ ОБЪЕКТА КАК НЕЛИНЕЙНОЙ
ДИНАМИЧЕСКОЙ СИСТЕМЫ И ИСК
Модель нелинейной ДС с дискретным временем3"1 и безынерционная ИСК могут быть представлены в форме соотношений
хк+1 = /(хк,ик) + ™к, к = 0,1,2,...; (1)
пх1 пх1
у к = к (х к) + Ук, к = 0,1,2,..., (2)
тх1 тх1 тх1
где п-вектор параметров состояния хк =
= (х1к, х2 к, хзкхпк); т-вектор выхода ИСК у к =
= (У1к, У2к,Узк--Утк); ик — °дномерн°е управление.
Шум ДС и ИСК представлен п-вектором wk =
= Кк, ^2к , ^3к™пк ) и т-вектором Ук = ,У2к , у3к,...,Утк). Оба вектора (как обычно) полагаются независимыми и соответствующими гауссовым процессам белого шума, у которого отсутствие коррелированности отсчетов выражается соотношениями Е^кwТ ] = Ж -8. и Е[укуТ ] = V -8..
3) Переменные состояния и-мерной ДС, задаваемые и-век-тором хк, относятся к моментам времени 4= кТ, где Т — интервал дискретизации шкалы времени (хк= х(4)). Точно такие обозначения использованы для скалярного управления ик , да-вектора ук значений на выходе ИСК, и-вектора wk шума ДС и т-вектора Ук шума в ИСК.
Дополнительно, первый и второй начальные моменты определены выражениями: Е[х0] = ц0;
Е[(х0 - ц0)(х0 - ц0)т = р0 -1, где Е — символ математического ожидания; I — единичная матрица,
( I )к = ¿к .
Цель для анализируемой задачи состоит в получении приближенной модели для динамики параметров состояния объекта в соответствии с (1) и статической модели для ИСК — в соответствии с уравнением (2). При использовании сети с СФПН это соответствует стадии обучения НС. После завершения обучения модель-сеть с СФПН может служить для оценки состояний первоначально неизвестной ДС. Для процедуры обучения модели-сети с СФПН требуется выполнение нескольких достаточно естественных условий, которые легко выполнимы и лишь незначительно ограничивают число параметров ДС и ИСК, подлежащих моделированию.
— Параметры состояния ДС и управление должны быть ограниченными в некоторой открытой области Б; Б е Я"+1; (хк, ик )е Б, Ук.
— /(-,-) и к (-) — неизвестные вектор-функции, которые удовлетворяют (общему для всей области Б) условию непрерывности:
{/ : |/ (х + 8 х,-) - / (х,-)||< К,||8 х ||};
{/: |/(-, и + ¿и) - /(-, и)||< КиЦдиЦ}; (з)
{ к: ||к(х + 8) -к(х)||< КкЦ8 ||},
где х, х + 8х, и, и + Зи е Б, т. е. принадлежат области определения функций.
— Предполагается, что во время обучения сети с СФНП все переменные состояния ДС измеряются вместе с аддитивным шумом. Это соответствует тому, что стадия эксперимента с обучением сети проводится либо на самой ДС, либо в условиях имитации, сохраняющих присутствие шума, эквивалентного реальному.
— Предполагаются известными ковариационные матрицы шума ДС и ИСК.
— Входное управляющее воздействие на ДС является хорошо измеримым в течение всего времени анализа ДС и ИСК.
МЕТОД НЕПАРАМЕТРИЧЕСКОЙ АППРОКСИМАЦИИ МОДЕЛИ ДС НА ОСНОВЕ СЕТИ С СФПН
В анализируемой задаче целью является получение общей непараметрической аппроксимации
(в области Б) уравнений (1), (2) модели ДС—ИСК. При этом, как отмечено выше, явное выражение функций, определяющих изменение со временем переменных ДС и га-вектора наблюдений (контроля), нам недоступны. Поэтому они представлены аппроксимирующими функциями самой общей формы. Конструктивный метод реализации цели основан на использовании сети с СФПН и на многократных экспериментах.
Рассмотрение метода удобно производить поэтапно, начав его с "упрощенной" задачи получения заданной желаемой траектории переменных пространства состояний ДС (ППС_ДС) посредством подходящего выбора управлений {ик}к = 1)2,..., „. В этой ограниченной форме, когда задано только (1), прямое решение задачи встречает значительные трудности. Поэтому на этом сокращенном варианте анализируемой общей задачи (ДС—ИСК) будет показан метод применения сети с СФПН.
Метод строится на ряде понятий и обозначений. Для аппроксимаций используются вектор-
функции /(•,•), Ь(ш) и вектор ППС_ДС, объединенный с управлением и'к в единый («+1)-вектор Хк = [хк, и1к ]. При N последовательных наблюдениях ППС_ДС {гк, г к,..., г ^ } г1к = хк + дк в каждом из М различных экспериментов {Е, : 7 = 1,2, ..., М} с сопутствующим этим наблюдениям шумом {дк }к=1 ¡^ 7=1 М можно получить аппроксимированную модель по критерию минимизации функционала 3, отражающего величину усредненной (по числу временных отсчетов за каждый из М экспериментов) ошибки аппроксимации за счет компоненты шума. Таким образом, аппроксимирующая модель получается из минимизации соотношения (4), в котором функция /"(•,•) должна аппроксимировать набор переменных состояния ДС на всей области Б.
М N
■ = ЕЕ [гк - ./(хк -1, ик-1)]Т[г к - /( хк -1, ик-1)]. (4)
7=1 к=2 „х1 „х1
При этом аддитивный шум д в наблюдаемых значениях ППС интерпретируется как ошибка аппроксимации / (•,•).
Структура сетей с СФПН, появившаяся позже обычных НС прямого распространения, благодаря свойству более экономного и линейного (по параметрам сети) представления находит все более широкое применение в многомерных задачах интерполирования, аппроксимации, распознавания образов и при создании контроллеров [5, 6, 8, 9].
Типовым применением сети с СФПН можно считать аппроксимацию функции /(х) по
статистически
{х,,/(х, )}. ,
рассеянным парам отсчетов . Применительно к нашему слу-
чаю непрерывная функция / (Я" + ^ Я" )4) может быть достаточно точно аппроксимирована некоторой /р вида
г \
/ (х) = Е л
р 4 / -1 1 , 1 =1
"Х1 ^ "X р
Ф (1|Х - Xе.
• X (5)
( "+1)Х1
так, что при возрастании р || /р (X) - / (X) 0
в некоторой области Б е Я" (при условии, что Б содержит достаточное количество точек { х] };=1^р,
являющихся центрами элементов сети с СФПН).5)
Существенно то, что при заданных центрах (х]) и при любом выборе вида СФПН аппроксимирующая модель имеет линейную форму относительно параметров Л.. В этом случае сеть с
СФПН имеет один скрытый слой из р нелинейных нейронов с активационными функциями ф и одного линейного нейрона (рисунок). Причем параметры Л. определяются единственным образом при
условии, что матрицы Аф, [Аф ], =ф (|| X - X ||),
6)
не являются сингулярными.
ОБЩАЯ СХЕМА, ИСПОЛЬЗУЕМАЯ ДЛЯ МОДЕЛИРОВАНИЯ ДИНАМИЧЕСКОЙ СИСТЕМЫ
На стадии обучения сети с СФПН динамическая часть (1) общей нелинейной модели пространства состояний (ДС—ИСК (1), (2)) может быть представлена в виде соотношений (6), в которых, кроме шума ДС, введен "шум" , отражающий ошибку аппроксимации нейросетевой
моделью переменных пространства состояний
.7).
Xk+1 = [ Л л о]-
*р "X("+1)
к+1 ( "+1)Х1
Ф( Xk)
Xk
( "+1)Х1
гw' ^
0
V У
( "+1)Х1
(6)
гк = хк + дк.
4) Я" — обозначение области "-мерного эвклидова пространства с положительными компонентами каждой его точки.
5) Основными видами зависимости ф(г), используемой для СФПН ф(|| х - хс] ||) являются гауссиан и так называемый мультиквадрикс Харди ф(г) = (] + г2)12 [5].
6) У несингулярной матрицы определитель не равен нулю и поэтому она имеет обратную А-1.
7) В расширенном понимании понятие шум используется для любых плохо измеримых и трудно управляемых искажений информативных сигналов.
"
Х1 Х2
Хп
Входной слой
/(х)
Скрытый слой сети с СФПН
Выходной
слой
Структура сети с СФПН. Скрытый слой содержит р нейронов с пространственно-симметричной функцией преобразования. Вариант сети с двумерным выходом: /(х) = [/1(х), /2(х)]
В (6) i — индекс эксперимента ( =1...М); начальные значения ППС Х0 принадлежат области Б; Хк содержит ППС хк и входное управляющее воздействие (ВУВ) ик; р-вектор Ф( Хк) = = [ф1 (Хк),..., (рр (Хк )]т содержит СФПН, соответствующие р центрам их расположения в области ППС—ВУВ Б. Каждая строка матриц Л и Л0
соответствует элементам вектор-функции / 8).
Ряд преобразований позволяет получить соотношения (6) в более формализованном виде, с помощью которого удобнее построить целевую функцию (критерий) обучения сети с СФПН для аппроксимации модели анализируемой ДС.
Для обозначения элементов .-й строки мат-
рицы [Л Л ] используется вектор 0 . Одно-
(п+ р+1)х1
0
х( п+р+1)
Хк+1 =
тт
0
0 тТ
0
0 0
0 тТк.
(wi ^
(7)
где П = [х1к,х2кх;к,х
м 1 1к'-"' А1к ' 2к'
временно применяется сокращение путем объединения (в форме так называемой конкатенации) двух векторов в матрице правой части (6): Тк =[ФТ(Х'к) Хкт]. Это позволяет представить основное уравнение динамики из (8) в виде
Дальнейшее упрощение получается с помощью обозначения 0 = [в1в2...вп]т и объединения всех М экспериментов в систему с числом Мп переменных состояния и пр параметрами. При этом описание модели ДС на основе сети с СФПН получается в виде пк+1 =£к (Пк, ик )0 + wк с измере-
ниями у к = Пк + ? к> ^ -и-ь ...,хмЛ ]. Матрица £к(пк,ик) имеет размерность Мп х пр и определяется соотношением (8):
( тт ^ 1к
£к (Пк,ик) =
тт
, мк
V
0 ...
( тт ^ 1к
0 ... 0
(8)
1 Вектор, элементами которого являются функции.
тМ
Отметим, что в дальнейшем знание статистических свойств не предполагается, т. к. это "шум", связанный с неточностью аппроксимации ДС нейросетевой моделью, и он не входит непосредственным образом в целевую функцию — критерий обучения сети с СФПН.
ОБУЧЕНИЕ СЕТИ С СФПН ПРИ МОДЕЛИРОВАНИИ ДС
После замены уравнений, описывающих ДС-ИСК, эквивалентной сетью с СФПН остается применить алгоритм обучения сети. (Правильнее сказать, не уравнений, а структурных функций, описывающих ДС. В этих "уравнениях" обозначена только структура функций, определяющих динамику системы (объекта), а вид самих функций не-
известен, тогда как (в обычном понимании) в уравнениях бывает задано выражение этих функций). Этот алгоритм приводит к аппроксимирующей модели ДС и к идентификации ее параметров.
Форма полученной выше аппроксимирующей модели:
%+i = % к (%, uk)® + w k, Y k = % + ? k,
(9)
xlk,x2k,...,xM ], встречается в
где % = [х1к , х1к^-' А1к> а2 к ' теории управления. Однако в нашем случае она получена для реализации модели ДС—ТСК средствами сети с СФПН и объединяет М экспериментов.
Целевая функция, лежащая в основе алгоритма обучения сети, согласно (4), выражается соотношением
N
J = E{[Y k - % k-i(%-i, U-i)©]1
X
k=1
(10)
X[ Yk -%k-i(4kUk-i)©]}.
Использование градиента целевой функции (критерия) относительно 0 дает правило оценки по методу наименьших квадратов для параметров аппроксимирующей сети:
© д
Е %
1 %
k k-i
Е %:
1
k-iY k
(ii)
в виде (i2):
0,
Е %1 - 2% k-i
Е % 1-2 Y k
(i2)
Для вычислений более удобна рекурсивная форма алгоритма (12), которая представлена в виде соотношения
00 N+i = 00 N
+R N %N -i 1 + % N R N %N-i
где
Y N+i % N 00 N
R N+i R N R N %N-i 1 + % NR N %N-i
(i3)
(i4)
Следует отметить, что оценка (11) построена с учетом возможного искажения (аддитивного шума) как в оценке ППС, так и в оценке выхода ИСК. В связи с этим высокая точность идентификации параметров модели не всегда может быть гарантирована. Повышение точности идентификации параметров нейросетевой модели ДС основано на некотором усовершенствовании рассмотренной схемы оценки. Изменение схемы оценки 0 связано с двумя моментами.
1) Матрица Ек-1(%-1, ик-1) заменяется на
Ек-1( %-1, ик-1), поскольку % не является точно измеримой величиной.
2) Точность оценки параметра 0 может повыситься при замене в первых множителях произведения (11) временного индекса переменной на
предшествующее значение (Е к -1 ^ Е к-2).9)
Это приводит к новой оценке параметра 0
Более быстрая сходимость алгоритма обучения получается при выборе Я0 = а1 с не слишком малым значением а. Аппроксимация статического уравнения, описывающего выход ИСК, выполняется аналогичным образом.
ОЦЕНКА ОШИБКИ ПРИБЛИЖЕНИЯ
ПРИ МОДЕЛИРОВАНИИ ДС НА ОСНОВЕ СЕТИ С СФПН
При использовании метода сетей с СФПН для определения переменных пространства состояний ДС желательно располагать значением максимальной ошибки приближения функции /(.,.), которая отражает динамику ППС в (1). Максимальная ошибка е/ может быть представлена в виде
е{ =|| /(X) - /^Щ , Xе Б .10) Если шум процесса (модели ДС) и измерения ППС в моделируемой системе небольшой, оценка е/ (с учетом М экспериментов) может быть получена в форме соотношения (15):
ег = тах11 у к-iк-1(Yк-1, ик-1)<Э||, к = 1,2,... (15)
Подобным образом определяется величина максимальной ошибки еь для приближения статического уравнения ИСК:
е = max|| Ук-4-1 (Гк-1,uк-1)||, к = 1,2,...
Первое из уравнений (6) можно представить в форме (16), близкой к первоначально заданному описанию ДС (1):
xk+i = f'(xk, uk) + Fxk + К + w k,
(i6)
9) Эмпирический способ повышения устойчивости схемы вычисления параметров с использованием МНК, основанный на "двухмоментном" представлении произведений временных компонент алгоритма, применялся Кнаппом и Палом (Knapp, Pal) [i0].
10) Для векторной величины ||...Щ имеет смысл мак-
симума из модулей компонент этого вектора; например, ||(е„...,еп)Т|| = гутаах{|ех е„ |} .
где матрица Е и вектор Ь получаются из матрицы Лс.
Аналогичным образом представляется уравнение, функционально отражающее структуру ИСК:
Ук = к '(х, ) + Их, + Ук. (17)
С учетом свойства ограниченности и непрерывности всех функций в модели ДС и ИСК для приращений /' и к' можно использовать оценки с помощью так называемых констант Липшица11'1 а и А:
||/'(х,, ик) - / '(х, + 8к, ик )|и< а||8к|и, ||к '(х,) - / '(х, + 8, )И< ? || 8, .
Константы а и А оцениваются также с помощью набора обучающих данных, как это было показано для величины ошибок е/ и ек.
Таким образом, алгоритм обучения модели ДС— ИСК на сети с СФПН включает следующие этапы.
■ Случайным порядком выбираются р векторов из М обучающих экспериментов. Для динамической части векторы размерности п+1 выбираются (случайным образом) к раз.
■ С помощью (13) и (14) на основе М обучающих экспериментов определяются значения параметров пространства состояний для уравнения динамики и "статического" уравнения, связанного с измерениями ППС.
■ Из обучающих данных оцениваются ошибки аппроксимации, как показано соотношением (15). С использованием (18) оцениваются значения постоянных Липшица а и А.
ОПРЕДЕЛЕНИЕ ППС НА ОСНОВЕ СЕТИ С СФПН
Чтобы определить параметры состояния системы, представленной сетью с СФПН, необходимо произвести преобразования, которые в анализе такого рода систем эквивалентны нелинейному фильтру. Выполнение системы фильтрации зависит от степени адекватности и точности используемой модели. Если неточность модели (шумы в разных ветвях преобразования ППС) не включена и не отражена в расчетах ковариационной матрицы, то последняя становится неоправданно малой. При этом полученным оценкам ППС может быть приписан необоснованно высокий уровень досто-
11) Простая форма условия Липшица оценивает границу изменения функции при конечном приращении ее аргумента: |§(х+5) - g(x)| < е\3\, где с называется константой Липшица и она зависит от общей области задания функции g. Более сложная форма используется для случая вектор-функции и векторного ее аргумента. Тогда символ модуля заменяется на символ нормы.
верности.12) Чтобы этого не происходило, необходимо принимать во внимание все ошибки моделирования, в частности учитывать максимальные ошибки аппроксимации при использовании сети с СФПН в расчетах ковариационной матрицы. (При этом верхняя граница ковариационной матрицы получается такой, что минимизация оцененной дисперсии в результате приводит к минимизации фактической дисперсии).
Для анализа удобно снова обратиться к соотношениям (16), (17), которые являются модифицированной формой структурного описания модели ДС—ИСК, и представить фильтр для оценки ППС на основе сети с СФПН в виде следующего соотношения:
x к+1 = f'( x k, uk) + Fx k + К +
+ Kk [yk - h'(îk ) - Hik ], (19)
где Kk — коэффициент усиления ошибки.
Если использовать для ошибки оценки ППС
обозначение xk = xk — xk , учесть, что ошибки f
в аппроксимировании динамического и h в аппроксимации статического (связанного с ИСК) уравнений выражаются соотношениями
f = f(xk, uk) — f'(xk, uk) — Fxk — К, (20)
h = h(x k ) — h' (x k ) — Hx k,
использовать обозначение pk = E[xk xдля ковариационной матрицы системы, то, как показано в [12], верхней границей ( р) ковариационной матрицы может служить оценка на основе рекурсивного соотношения13):
р k+1 =
= ^(F — K k H)p k (F — K k H)T + /21 +13 Tr(Pk )I + + /4 K k K k T + /5 Tr(p k )K k K k T + W + K k VK k T, (21)
где в качестве начального значения процедуры рекурсии используется р0 = р0 ( р0 — известная начальная величина ковариационной матрицы); постоянные /1 — /5 определяются соотношениями:
/1 = 1 + a + d + 2ef + eh ;
/2 = n • ef • (2 + a + d + ef + eh ) ;
/3 = a(a + d + ef + eh) ;
12) Это первоначально было отмечено Фитцжеральдом (Fitzgerald) в работе по аналитическим методам решения задачи оценки ППС для более простого случая — анализа линейной динамической системы [11].
13) Соотношение получено Чином и Эланейером (Shin,
Elanayer) [12].
14 = т • еь (1 + а + ё + е} + еь) ; /5 = [а + ё (1 + а + ё + е, + еь)].
Для того чтобы получить матрицу усиления с минимальной дисперсией (Кк), достаточно приравнять нулю первую вариацию рк+1
по K,.14)
Это дает выражение -/^ - КкН)ркН 8Кк + +Кк [141 + /5Тг(|эк )1 + У]8КкТ = 0, в котором должен быть равен нулю множитель при 8Кк (из-за произвольности величины вариации 8Кк). Полученное так уравнение справедливо для матрицы усиления с минимальной дисперсией. После небольших матричных преобразований его решение, определяющее К к , получается в виде (22):
k;=Fp k Ht
+ /5Tr(p k) + V )• I + Hp k HT
. (22)
Для анализируемых условий (аппроксимация структуры ДС—ИСК в форме (16), (17), непрерывность по Липшицу в форме (18) и ошибка аппроксимации в виде (15)) свойства основных характеристик моделирования ДС—ИСК могут быть выражены двумя соотношениями:
■ рк > рк — т. е. рк является верхней границей (или огибающей в дискретных точках 4 = кТ) ковариационных матриц ошибок моделирования ДС сетью с СФПН;
я рк+1(Кк) ^ рк+1(Кк) ^рк+1 — т. е. верхняя граница ковариационной матрицы меньше, если она соответствует минимальному коэффициенту
усиления (Кк).
Описанный выше метод определения ППС путем моделирования ДС—ИСК посредством сети с СФПН применим к нелинейным динамическим системам (объектам) общего типа с регистрацией параметров в ИСК, реализующей их нелинейное преобразование.
Однако в практических приложениях нередки случаи, когда преобразование в ИСК является линейным. Проанализированный выше метод адаптируется к этому случаю следующим образом.
— Структура ИСК с линейным и известным преобразованием ППС (оно легко идентифицируется) представляется соотношением
Уk = H • xk + vk •
(23)
— Верхняя граница ковариационной матрицы вектора ошибок моделирования ППС (р) определяется выражением
р к+1 = (2 + е, - К к Н)р к (F - К к Н )Т + + а(1 + а + е/) • Тг( р к) I + + " • е1 (1 + е1 + а) • I + W + КкУКкт. (24)
— Получение матрицы усиления с минимальной дисперсией (Кк) производится по общему методу: определяется и приравнивается нулю первая вариация ррк+1 по Кк, после чего множитель при 8Кк дает матричное соотношение, преобразование которого приводит к выражению для Кк :
Кк = (2 + е,) • FркНТ • [(2 + е,) • НркНТ + У ]-1 (25)
ПРИМЕНЕНИЕ МЕТОДА ОПРЕДЕЛЕНИЯ ППС ДИНАМИЧЕСКОЙ СИСТЕМЫ (ОБЪЕКТА) НА ОСНОВЕ СЕТИ С СФПН
Схема вычислений анализируемого метода определения параметров состояния ДС может быть показана на примере снижающегося в гравитационном поле объекта, для которого в качестве ИСК служит радиолокационный измеритель.15) Измеритель, регистрирующий высоту и скорость объекта, подвержен шуму (искажениям) за счет меняющейся неоднородности среды распространения сигнала и за счет электронного канала его регистрации, причем, как обычно, многофакторный шум плохо определенной природы и локализации предполагается аддитивным гауссовым белым шумом. Нелинейная модель ДС и ИСК могут быть представлены уравнениями (26):
X1, k+1
X2,k +1
X1, k T • X2k r2k - 3T • x22k exp(-0.05 Хц
(26)
yk =
^1000
+ x1k + vk
14) Для матричного соотношения (21) это операция эквивалентна известной процедуре определения точки максимума (или минимума) некоторой скалярной функции приравниванием нулю ее первой производной. Напомним, что Tr (A) означает след (trace) матрицы А — сумму ее диагональных элементов.
где х1 и х2 — высота и скорость объекта; Т — интервал отсчетов ИСК; V — шум измерителя; использована структура ДС без управляющего входа, и в ней отсутствует шум.
При обучении сети с СФПН, аппроксимирующей описанную систему, использовалось шесть обучающих выборок построенных по данным экспериментов с имитационным моделированием поведения во времени ДС—ИСК. Удовлетворитель-
15) Предполагается неизвестной баллистика, зависимость сопротивления среды от текущей скорости движения объекта.
ные результаты были получены при использовании сети с 20-30 узлами скрытого слоя с обычной формой гауссианы в качестве СФПН.
ЗАКЛЮЧЕНИЕ
Проанализированы элементы методологии приближенного представления нелинейной динамической системы (объекта) и связанной с ней измерительной системы контроля (ИСК). Динамической системе (ДС) и ИСК присущи элементы стохастики, связанные с наличием шума в структуре модели динамики объекта и независимого аддитивного шума в статической ("безынерционной") модели измерительного контроля параметров состояния объекта. Подход к идентификации параметров состояния ДС основан на использовании сети с симметричной функцией преобразования нейронов (СФПН). После обучения нейронной сети на наборе экспериментов, связанных с получением траекторий ДС в пространстве параметров состояния (ПС), сеть может быть использована для предсказания ПС при других управляющих воздействиях и начальных состояниях ДС.
Для получения функции, определяющей динамику объекта, использована векторная форма критерия наименьших квадратов, в которой шум ИСК интерпретируется как ошибка аппроксимации этой функции.
При построении метода идентификации ПС объекта на основе применения сети с многомерной СФПН предполагается выполнение достаточно нежестких условий: ограниченность управления и области изменения параметров состояния ДС, непрерывность функций в структурной модели уравнений динамики объекта и ИСК, измеримость (в пределах компоненты аддитивного шума) параметров ДС—ИСК на стадии получения обучающих данных для сети.
СПИСОК ЛИТЕРАТУРЫ
1. Льюнг Л. Идентификация систем. Теория для пользователя. (Пер. с англ.) / Под ред. Я.З. Цыпкина. М.: Наука, 1991. 432 с.
2. Фомин В.Н. Рекуррентное оценивание и адаптивная фильтрация. М.: Наука, 1984. 284 с.
3. Georgiev A.A. Nonparametric system identification by kernel methods // IEEE Transactions on Automated Control. 1984. V. 29. P. 356-358.
4. Меркушева А. В. Метод Калмана для алгоритмов обучения в реальном времени нейронных сетей с обратными связями (рекуррентных сетей) // Информационные технологии. 2004. № 12. С. 9-15.
5. Меркушева А.В., Малыхина Г.Ф. Методология сетей с симметричной функцией преобразования нейронов // Научное приборостроение. 2006. Т. 16, № 2. С. 34-45.
6. Poggio T., Girosi F. Networks for approximation and learning // Proceedings of IEEE. 1990. V. 78. P.1481-1497.
7. Parthasarthy K., Narendra K. Identification of dynamical systems using neural networks // IEEE Transactions on Neural Networks. 1990. V. 1. P. 4-17.
8. Kwok T.K., Young D.-Y. Objective functions for training new hidden units in constructive neural networks // IEEE Transactions on Neural Networks. 1997. V. 8, N 8. P. 1131-1148.
9. Chen S., Chang E.S. Regularized orthogonal least square algorithm for constructing RBF neural networks // International Journal of Control. 1996. V. 64, N 5. P.829-837.
10. Knapp C.H., Pal P.K. Parameter identification in a class of nonlinear systems // IEEE Transactions on Automatic Control. 1983. V. 28. P. 497-503.
11. Fitzgerald R.J. Divergence of the Kalman filter // IEEE Transactions on Automatic Control. 1971. V. 16. P.736-747.
12. Shin Y.C., Elanayar S.V.T. RBF neural network for approximation of dynamic systems // IEEE Transactions on Neural Networks. 1994. V. 5, N 4. P. 594-598.
Санкт-Петербург
Материал поступил в редакцию 28.02.2007.
DYNAMIC ANALYSIS OF A CONTROL AND METERING SYSTEM BASED ON THE NETWORK WITH A SYMMETRIC ACTIVATION
FUNCTION OF NEURONS
A. V. Merkusheva, G. F. Malykhina
Saint-Petersburg
The paper considers some elements of a simulation method designed for analyzing the dynamics of a nonlinear multiparameter object (system) based on a network with a symmetric neuron-transformation function. The taught network can approximate the dynamics of the object and its control subsystem in the space of status variables.