УДК 62-50
ИДЕНТИФИКАЦИЯ ПАРАМЕТРОВ ДИНАМИЧЕСКИХ СИСТЕМ НА ОСНОВЕ ОБЪЕДИНЕННОГО ПРИНЦИПА МАКСИМУМА
© 2004 г. А.А. Костоглотов, В.В. Дерюшев, А.И. Костоглотов
Is developed a new method of identification of parameters of the dynamic systems, based on application to invariant tags of the real movement of dynamic systems of a needle variation of L. S. Pontrj agin.
Введение
Представлен новый метод идентификации параметров динамических систем, основанный на применении к инвариантным признакам действительного движения динамических систем игольчатой вариации J1.C. Понтрягина [1]. В рассматриваемом случае применение ее параметров к интегралу действия Гамильтона - Остроградского [2] позволяет получить необходимые условия минимума целевого функционала в виде уравнений, записанных в форме принципа максимума для специально сконструированной функции с исключением из рассмотрения вектора сопряженных переменных. В результате сокращаются вычислительные затраты, упрощается задача идентификации и оптимизации, улучшается сходимость и точность алгоритмов.
Структурно работа содержит формулировку объединенного принципа максимума, приложение принципа максимума к задаче идентификации, описание алгоритма идентификации, пример и выводы.
1. Объединенный принцип максимума
Рассматривается движение голономной динамической системы из начального состояния
t = 0, q(0) = [qlo,...,qngf, q(0) = [ql0,...,q„gf (1)
В конечное, определяемое временем t\
t = tb q(tl) = [qn,...,q„if, q(tx) = [qlh...,qni f (2)
под действием управления и = [щ, ..., ит]Т. Для задачи оптимального управления выполняется принцип Гамильтона - Остроградского относительно интеграла действия
h
8R= \(5Г+ 5'A)dt = 0,
о ^ ’
¿*7(0) = Sq(tj) = 0,
из которого вытекают уравнения Лагранжа второго рода
d_
dt
■-¿- = Qs, s = \n. (4)
dqs
Требуется определить вектор-функции управления u(f) и обобщенных координат q(i), обеспечивающие минимум целевого функционала
h
J\ = \ F(q, q) dt —> min (5)
0
при условиях (1) - (4) и ограничении
и 6 Gu. (6)
В (3) - (6) F(q,q)~ скалярная, непрерывная вместе с частными производными, знакопостоянная функция; Gu- замкнутое множество допустимых управлений; q— вектор обобщенных координат; Т кинетическая энергия систем; А - работа внешних сил; Q(q,q,u,t) - вектор обобщенных сил, явно зависящий от управления.
В данном подходе вместо целевого функционала (5) рассматривается расширенный функционал
t\
J = j {F(q, q)+l(T+ A)}dt, (7)
О
где /. - множитель Лагранжа [1].
Чтобы управление м доставляло минимум функционалу (7), необходимо, чтобы его вариация была неотрицательной
¿1
SJ = \\ö'F(ß,c])+2\5T{q,q) + ö'A{q,q,u)^dt>0 (8)
О
для любой допустимой игольчатой вариации [1] du = u(f) -v, t е |r. г+ А/], где v- произвольная точка множества Gu; т- момент непрерывности управления; Дt= А- интервал времени :;\ < ;,. <<;« 1.
Произведем в вариации функционала (8) интегрирование по частям
слагаемых, содержащих производную Sq. Полагая Л = 0, учитывая условия на концах траектории (3), справедливость уравнений Лагранжа (4), получим необходимое условие оптимальности управления.
— г
Введем в рассмотрение функцию ф{ц. ц. и) = X [¿(Л + * v \ls ■ где
s=l
SF dF dF
Vs =-----=-----vy-------обобщенная реакция связи, соответствующая
8qs dqs dqs
бесконечно малому изменению целевого функционала; у - размерный коэффициент.
Теорема 1. Если управление ü(t) и соответствующая ему траектория q(t) доставляют минимум целевому функционалу (5) при условиях (1) -(3), (6), то существует такой постоянный множитель Лагранжа X, что при любом t е [О, I] | функция Ф переменных и, q достигает в точке ii(t) максимальное значение по совокупности переменных
ф(и) = такф(и,д,д,Х).
ueGu
Доказательство получено в [3, 4] и основано на применении игольчатой вариации управления [1].
2. Задача идентификации
Применим объединенный принцип максимума к задаче идентификации. Пусть для простоты форма уравнений движения приведена к виду х = f(x,x,z), х(0) = х0, х(0) = х0.
Динамику идентифицируемых параметров z опишем уравнениями z = 77, z(0) = zq , где 77 =Rm - вектор неизвестных неслучайных возмущений (управления).
Уравнения наблюдения имеют вид у = 11(х. I) + п(1). где у е Rk - вектор наблюдения; H(x,t) - непрерываемая вместе с частными производными вектор-функция; n(t) - вектор белого гауссовского шума, для которого
M[n(t)\ = 0, M\n{t)nT (г)] = H2NS(t-T).
Оценку z вектора z определяем из условия минимума функционала невязки
J\ = ly - H(xW)f N~l [у - H (x(z)),t)\ dt.
2 о
Для получения нетривиального решения вектора возмущений 77 подчи-
1 h Т
ним его условию в виде интегрального ограничения —a\rj (t)rj(t)dt —>■
2 о
—> min.
Сконструируем сглаживающий функционал
J2 =J\+^-a\iiT (t)ri(t)dt, (9)
2 о
где а - параметр регуляризации.
Воспользуемся подходом объединенного принципа максимума и вместо функционала (9) рассмотрим расширенный функционал
?1
J= J2+ЛR + \Juт(z-rl)dt, (10)
о
где X - постоянный множитель Лагранжа, определяемый из теоремы об объединенном принципе максимума; цей”- вектор сопряженных функций для уравнений динамики идентифицируемых параметров.
Применяя к расширенному функционалу (10) игольчатую вариацию управления Л. С. Понтрягина, докажем теорему объединенного принципа максимума для задачи идентификации параметров.
Теорема 2. Необходимые условия минимума расширенного функционала определения оценки 2 вектора параметров г сводятся к двухточечной краевой задаче (ДТКЗ)
2 = а~^/л, г(0) = г0,
/и = Ст—-Ы-\у-Н{х{2),0), М) = 0,
ОХ
+ + в(0) = (5(0) = 0,
дх дх дг
днТ
х = /(х,х,г)-Я-1----Ы~1(у-Н(х,1)), х(0) = х0, х(0) = х0,
дх
где О - матрица чувствительности уравнений движения по вектору параметров г.
Теорема 3. Рекуррентные уравнения последовательной идентификации вектора параметров г имеют вид
л Т днт 1 л
2=РОТ^—Ы-\у-Н(х(2),1)), г(0) = г0, дх
Р =а~1 -1-РОт А|^^-10,_я(^),0)|оЛ Р(0) = Р0,
о = ^-д+^-о+^-, 0(0) = 6(0) = о,
дх дх дг
Л Л Л Л ЯГ7Т л л л л
х = /(х,х,г) — ¡Г ----Ы~ (у - Н(х(г),1)), х(0) = х0, х(0) = х0,
дх
где Р - некоторая симметричная матрица - аналог ковариационной матрицы ошибок оценивания фильтра Калмана.
Доказательство теоремы 3 представлено в [5].
В качестве примера рассмотрена задача идентификации параметра к =
0,1 в уравнении второго порядка
х = -2х-2е kt х3 -3x + 5sin/, х(0) = 2, х(0) = О
по результатам наблюдения y(t) = x(i).
Алгоритм идентификации определялся системой уравнений
Л Л Л
к = PG(y-x(k)), р = а~1 -P2G\
к( 0) = 0; Р( 0) = ОД, а = 0,1,
Л л2 л л3
G =-3G-(2 + 6e~kt х )G + 2te~ktx , G(0) = G(0) = 0,
Л Л
х = -2х-2е kt х -3&+5siní-/l l(y-x(k)),
Л Л
х(0) = х(0) = 0, 2 = 0,3.
Результаты численного моделирования процесса оценки неизвестного параметра к представлены на рисунке.
К моделированию процесса оценки параметра к
Проделанный подсчет вычислительных затрат (количества уравнений первого порядка, требующихся для осуществления алгоритма последовательного оценивания) показывает, что предлагаемый метод обладает высокой вычислительной эффективностью. Так, в рассмотренном примере новый метод требует решения 6 дифференциальных уравнений 1-го порядка, а расширенный фильтр Калмана - 9. С увеличением числа компонент вектора состояния п и вектора параметров т выигрыш в использовании предлагаемого подхода оказывается достаточно внушительным, что поясняется расчетами, результаты которых приведены в таблице (в числителе - количество уравнений, используемых при идентификации на основе предлагаемого метода; в знаменателе - фильтр Калмана).
Таблица результатов расчета количества уравнений фильтра
1 2 3 4 5
1 6/9 11/14 17/20 24/27 32/35
2 10/20 17/27 25/35 34/44 44/54
3 14/35 23/44 33/54 44/65 56/77
4 18/54 29/65 41/77 54/90 68/104
5 22/77 35/90 49/104 64/119 80/135
Выводы
Метод объединенного принципа максимума не требует решения краевой задачи для сопряженных функций, присутствующих в принципе максимума J1.C. Понтрягина, что существенно упрощает задачу оптимизации, алгоритм идентификации, полученный на основе объединенного принципа максимума, обладает более высокой точностью и скоростью сходимости оценки к истинному значению в сравнении с алгоритмом Калмана, новый подход снижает количество вычислительных затрат в сравнении с фильтром Калмана.
Работа выполнена при финансовой поддержке гранта Министерства образования РФ, проект № Т02-13.0-3376.
Литература
1. Понтрягин Л.С. Математическая теория оптимальных процессов. М., 1976.
2. Лурье А.И. Аналитическая механика. М., 1961.
3. Костоглотов A.A. II Автоматика и вычислительная техника, 2001. №4. С. 53-61.
4. Костоглотов A.A. II Автоматика и вычислительная техника, 2002. № 5. С. 26-34.
5. Костоглотов A.A. II Изв. РАН. Теория и системы управления. 2003. № 2. С. 86-92.
Южно-Российский государственный университет
экономики и сервиса 10 ноября 2003 г.