Научная статья на тему 'Идентификация параметров динамических систем на основе объединенного принципа максимума'

Идентификация параметров динамических систем на основе объединенного принципа максимума Текст научной статьи по специальности «Математика»

CC BY
64
19
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Костоглотов А. А., Дерюшев В. В., Костоглотов А. И.

Is developed a new method of identification of parameters of the dynamic systems, based on application to invariant tags of the real movement of dynamic systems of a needle variation of L.S.Pontrjagin.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Костоглотов А. А., Дерюшев В. В., Костоглотов А. И.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Идентификация параметров динамических систем на основе объединенного принципа максимума»

УДК 62-50

ИДЕНТИФИКАЦИЯ ПАРАМЕТРОВ ДИНАМИЧЕСКИХ СИСТЕМ НА ОСНОВЕ ОБЪЕДИНЕННОГО ПРИНЦИПА МАКСИМУМА

© 2004 г. А.А. Костоглотов, В.В. Дерюшев, А.И. Костоглотов

Is developed a new method of identification of parameters of the dynamic systems, based on application to invariant tags of the real movement of dynamic systems of a needle variation of L. S. Pontrj agin.

Введение

Представлен новый метод идентификации параметров динамических систем, основанный на применении к инвариантным признакам действительного движения динамических систем игольчатой вариации J1.C. Понтрягина [1]. В рассматриваемом случае применение ее параметров к интегралу действия Гамильтона - Остроградского [2] позволяет получить необходимые условия минимума целевого функционала в виде уравнений, записанных в форме принципа максимума для специально сконструированной функции с исключением из рассмотрения вектора сопряженных переменных. В результате сокращаются вычислительные затраты, упрощается задача идентификации и оптимизации, улучшается сходимость и точность алгоритмов.

Структурно работа содержит формулировку объединенного принципа максимума, приложение принципа максимума к задаче идентификации, описание алгоритма идентификации, пример и выводы.

1. Объединенный принцип максимума

Рассматривается движение голономной динамической системы из начального состояния

t = 0, q(0) = [qlo,...,qngf, q(0) = [ql0,...,q„gf (1)

В конечное, определяемое временем t\

t = tb q(tl) = [qn,...,q„if, q(tx) = [qlh...,qni f (2)

под действием управления и = [щ, ..., ит]Т. Для задачи оптимального управления выполняется принцип Гамильтона - Остроградского относительно интеграла действия

h

8R= \(5Г+ 5'A)dt = 0,

о ^ ’

¿*7(0) = Sq(tj) = 0,

из которого вытекают уравнения Лагранжа второго рода

d_

dt

■-¿- = Qs, s = \n. (4)

dqs

Требуется определить вектор-функции управления u(f) и обобщенных координат q(i), обеспечивающие минимум целевого функционала

h

J\ = \ F(q, q) dt —> min (5)

0

при условиях (1) - (4) и ограничении

и 6 Gu. (6)

В (3) - (6) F(q,q)~ скалярная, непрерывная вместе с частными производными, знакопостоянная функция; Gu- замкнутое множество допустимых управлений; q— вектор обобщенных координат; Т кинетическая энергия систем; А - работа внешних сил; Q(q,q,u,t) - вектор обобщенных сил, явно зависящий от управления.

В данном подходе вместо целевого функционала (5) рассматривается расширенный функционал

t\

J = j {F(q, q)+l(T+ A)}dt, (7)

О

где /. - множитель Лагранжа [1].

Чтобы управление м доставляло минимум функционалу (7), необходимо, чтобы его вариация была неотрицательной

¿1

SJ = \\ö'F(ß,c])+2\5T{q,q) + ö'A{q,q,u)^dt>0 (8)

О

для любой допустимой игольчатой вариации [1] du = u(f) -v, t е |r. г+ А/], где v- произвольная точка множества Gu; т- момент непрерывности управления; Дt= А- интервал времени :;\ < ;,. <<;« 1.

Произведем в вариации функционала (8) интегрирование по частям

слагаемых, содержащих производную Sq. Полагая Л = 0, учитывая условия на концах траектории (3), справедливость уравнений Лагранжа (4), получим необходимое условие оптимальности управления.

— г

Введем в рассмотрение функцию ф{ц. ц. и) = X [¿(Л + * v \ls ■ где

s=l

SF dF dF

Vs =-----=-----vy-------обобщенная реакция связи, соответствующая

8qs dqs dqs

бесконечно малому изменению целевого функционала; у - размерный коэффициент.

Теорема 1. Если управление ü(t) и соответствующая ему траектория q(t) доставляют минимум целевому функционалу (5) при условиях (1) -(3), (6), то существует такой постоянный множитель Лагранжа X, что при любом t е [О, I] | функция Ф переменных и, q достигает в точке ii(t) максимальное значение по совокупности переменных

ф(и) = такф(и,д,д,Х).

ueGu

Доказательство получено в [3, 4] и основано на применении игольчатой вариации управления [1].

2. Задача идентификации

Применим объединенный принцип максимума к задаче идентификации. Пусть для простоты форма уравнений движения приведена к виду х = f(x,x,z), х(0) = х0, х(0) = х0.

Динамику идентифицируемых параметров z опишем уравнениями z = 77, z(0) = zq , где 77 =Rm - вектор неизвестных неслучайных возмущений (управления).

Уравнения наблюдения имеют вид у = 11(х. I) + п(1). где у е Rk - вектор наблюдения; H(x,t) - непрерываемая вместе с частными производными вектор-функция; n(t) - вектор белого гауссовского шума, для которого

M[n(t)\ = 0, M\n{t)nT (г)] = H2NS(t-T).

Оценку z вектора z определяем из условия минимума функционала невязки

J\ = ly - H(xW)f N~l [у - H (x(z)),t)\ dt.

2 о

Для получения нетривиального решения вектора возмущений 77 подчи-

1 h Т

ним его условию в виде интегрального ограничения —a\rj (t)rj(t)dt —>■

2 о

—> min.

Сконструируем сглаживающий функционал

J2 =J\+^-a\iiT (t)ri(t)dt, (9)

2 о

где а - параметр регуляризации.

Воспользуемся подходом объединенного принципа максимума и вместо функционала (9) рассмотрим расширенный функционал

?1

J= J2+ЛR + \Juт(z-rl)dt, (10)

о

где X - постоянный множитель Лагранжа, определяемый из теоремы об объединенном принципе максимума; цей”- вектор сопряженных функций для уравнений динамики идентифицируемых параметров.

Применяя к расширенному функционалу (10) игольчатую вариацию управления Л. С. Понтрягина, докажем теорему объединенного принципа максимума для задачи идентификации параметров.

Теорема 2. Необходимые условия минимума расширенного функционала определения оценки 2 вектора параметров г сводятся к двухточечной краевой задаче (ДТКЗ)

2 = а~^/л, г(0) = г0,

/и = Ст—-Ы-\у-Н{х{2),0), М) = 0,

ОХ

+ + в(0) = (5(0) = 0,

дх дх дг

днТ

х = /(х,х,г)-Я-1----Ы~1(у-Н(х,1)), х(0) = х0, х(0) = х0,

дх

где О - матрица чувствительности уравнений движения по вектору параметров г.

Теорема 3. Рекуррентные уравнения последовательной идентификации вектора параметров г имеют вид

л Т днт 1 л

2=РОТ^—Ы-\у-Н(х(2),1)), г(0) = г0, дх

Р =а~1 -1-РОт А|^^-10,_я(^),0)|оЛ Р(0) = Р0,

о = ^-д+^-о+^-, 0(0) = 6(0) = о,

дх дх дг

Л Л Л Л ЯГ7Т л л л л

х = /(х,х,г) — ¡Г ----Ы~ (у - Н(х(г),1)), х(0) = х0, х(0) = х0,

дх

где Р - некоторая симметричная матрица - аналог ковариационной матрицы ошибок оценивания фильтра Калмана.

Доказательство теоремы 3 представлено в [5].

В качестве примера рассмотрена задача идентификации параметра к =

0,1 в уравнении второго порядка

х = -2х-2е kt х3 -3x + 5sin/, х(0) = 2, х(0) = О

по результатам наблюдения y(t) = x(i).

Алгоритм идентификации определялся системой уравнений

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Л Л Л

к = PG(y-x(k)), р = а~1 -P2G\

к( 0) = 0; Р( 0) = ОД, а = 0,1,

Л л2 л л3

G =-3G-(2 + 6e~kt х )G + 2te~ktx , G(0) = G(0) = 0,

Л Л

х = -2х-2е kt х -3&+5siní-/l l(y-x(k)),

Л Л

х(0) = х(0) = 0, 2 = 0,3.

Результаты численного моделирования процесса оценки неизвестного параметра к представлены на рисунке.

К моделированию процесса оценки параметра к

Проделанный подсчет вычислительных затрат (количества уравнений первого порядка, требующихся для осуществления алгоритма последовательного оценивания) показывает, что предлагаемый метод обладает высокой вычислительной эффективностью. Так, в рассмотренном примере новый метод требует решения 6 дифференциальных уравнений 1-го порядка, а расширенный фильтр Калмана - 9. С увеличением числа компонент вектора состояния п и вектора параметров т выигрыш в использовании предлагаемого подхода оказывается достаточно внушительным, что поясняется расчетами, результаты которых приведены в таблице (в числителе - количество уравнений, используемых при идентификации на основе предлагаемого метода; в знаменателе - фильтр Калмана).

Таблица результатов расчета количества уравнений фильтра

1 2 3 4 5

1 6/9 11/14 17/20 24/27 32/35

2 10/20 17/27 25/35 34/44 44/54

3 14/35 23/44 33/54 44/65 56/77

4 18/54 29/65 41/77 54/90 68/104

5 22/77 35/90 49/104 64/119 80/135

Выводы

Метод объединенного принципа максимума не требует решения краевой задачи для сопряженных функций, присутствующих в принципе максимума J1.C. Понтрягина, что существенно упрощает задачу оптимизации, алгоритм идентификации, полученный на основе объединенного принципа максимума, обладает более высокой точностью и скоростью сходимости оценки к истинному значению в сравнении с алгоритмом Калмана, новый подход снижает количество вычислительных затрат в сравнении с фильтром Калмана.

Работа выполнена при финансовой поддержке гранта Министерства образования РФ, проект № Т02-13.0-3376.

Литература

1. Понтрягин Л.С. Математическая теория оптимальных процессов. М., 1976.

2. Лурье А.И. Аналитическая механика. М., 1961.

3. Костоглотов A.A. II Автоматика и вычислительная техника, 2001. №4. С. 53-61.

4. Костоглотов A.A. II Автоматика и вычислительная техника, 2002. № 5. С. 26-34.

5. Костоглотов A.A. II Изв. РАН. Теория и системы управления. 2003. № 2. С. 86-92.

Южно-Российский государственный университет

экономики и сервиса 10 ноября 2003 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.