Об одном подходе к синтезу оптимального управления для нелинейных аффинно-управляемых систем

Горелов Юрий Николаевич

УДК 62-50:629.7.052

ОБ ОДНОМ ПОДХОДЕ К СИНТЕЗУ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ДЛЯ НЕЛИНЕЙНЫХ АФФИННО-УПРАВЛЯЕМЫХ СИСТЕМ

Самарский государственный аэрокосмический университет имени академика С.П. Королева (национальный исследовательский университет)

Статья поступила в редакцию 16.10.2015

Рассматривается численный метод синтеза оптимального управления для нелинейных аффин-но-управляемых систем с функционалами типа нормы в Ьр (р = 1, 2, ж ), который является модификацией метода последовательных приближений Пикара. Установлены условия сходимости предложенного метода.

Ключевые слова: оптимальное управление, функционал типа нормы, последовательные приближения, условия сходимости.

Исследование проведено при поддержке РФФИ, проекты № 13-08-97019 р поволжье а, № 13-08-97002 р поволжье а.

ВВЕДЕНИЕ

В [1] изложен общий подход к вычислительной процедуре синтеза оптимального управления применительно к решению некоторых задач управления переориентацией космического аппарата, который был основан на схеме последовательных приближений с использованием определенного вида «линеаризации» для существенно нелинейных уравнений движения космического аппарата [2] с целью последующего применения принципа максимума Н.Н. Красовского (метода моментов) [3, 4] для решения ряда вспомогательных задач оптимального управления с функционалами типа нормы в L р (p = 1, 2, да ). Впервые этот подход был предложен в [5] и затем последовательно развивался в [6 - 8], а в [1], наконец, была отмечена его тесная связь с соответствующей модификацией метода Пикара [9] применительно к управляемым системам достаточно общего вида. При этом в [1] рассматривались квазилинейные управляемые системы в предположении, что они порождаются нелинейными уравнениями углового движения твердого тела и нелинейностью действующих на космический аппарат возмущающих моментов (градиентно-гравитационного, гироскопического и т.п. [2]). В отличие от [1], здесь рассматриваются нелинейные аффинно-управляемые системы следующего вида:

dx = f (t, x) + Bu , (1)

at

где x e Rn - вектор переменных состояния

Горелов Юрий Николаевич, доктор технических наук, профессор, директор института проблем моделирования и управления механико-математического факультета СГАУ. E-mail: yungor07@mail.ru.

системы, и е Кт - вектор управляющих параметров, на которые ограничения не накла-

ппхт

е К - постоянная матрица, а / (/, х) - некоторая вектор-функция, такая, что / : К1 х Кп ^ Кп. Правая часть уравнения (1) для любой непрерывной или кусочно-непрерывной (с разрывами первого рода) программы управления и (/) удовлетворяет условиям теоремы Пикара [9].

Для системы (1) рассматривается двухточечная граничная задача управления [3] с фиксированными начальным и конечным состоянием:

X(/с) = х0 ; х(/у ) = ху, (2)

где х с их у - заданные векторы, а моменты времени /с и /у также фиксированы. Требуется найти оптимальное управление, доставляющее минимум функционалу J (и) типа нормы в Ьр (р = 1,2, ж) для программы управления и [/ с, /у ] (и векторной нормы гельдеровского типа для

и е Кт с показателями V = 1, 2, ж [10, 11]):

J(и) ^ шт. (3)

Цель настоящей статьи - изложение вычислительных процедур метода синтеза оптимального управления в задачах (1) - (3) и условий его сходимости, следуя [1].

1. ПОСТАНОВКА ЗАДАЧИ

В [1] показано, что в общем случае уравнения углового движения космического аппарата можно привести к уравнениям состояния управляемой системы следующего вида:

(х

— = Ах + Ви + F (/, х), (4)

Ж

где х, и и В - векторы и матрица такие же как

/1\ л — опхп и в (1), а Л е К - некоторая постоянная матрица, а ¥ (Г, х) - заданная вектор-функция. Из сравнения (1) и (4) получим

/ (Г, х) = Ах + ¥ (Г, х), (5)

то есть для заданной в (1) вектор-функции / (Г, х) и каким-либо образом назначенной матрицы А в (5) всегда можно определить вектор-функцию ¥ (Г, х). С учетом (5) уравнение (1) приводится к уравнению вида (4) и, соответственно, для численного решения задачи оптимального управления (1) - (3) тогда можно применить метод последовательных приближений, рассмотренный в [1]. В связи с этим вначале отметим, что для его реализации следует: во-первых, задать матрицу А в (5); во-вторых, построить подходящее начальное приближение для задачи (1) - (3). Вообще говоря, решение этих задач допускает вполне определенный произвол и в достаточной степени взаимосвязано. С учетом процедуры построения последовательных приближений, изложенной в [1], одно из предъявляемых к матрице А в (5) требований состой т в ,том, чтобы она вместе с матрицей В из (4) образовывала вполне управляемую пару [3]. Соответственно, построение начального приближения для задачи (1) - (3) или, что то же самое, для задачи (2) - (4) также будет непосредственно связано с введением какой-либо аппроксимации для вектор-функции

¥ (Г, х), например, в виде ¥ (Г, х (Г)) = ¥ (Г), где х(Г), У Г е [Го, Г у-], - некоторый допустимый процесс в пространстве состояний рассматриваемой системы. В частности, наиболее простой аппроксимацией является следующая: ¥ (Г) = 0. Тогда начальное приближение - в виде пары: х (0)(Г),

и(0) (Г), У Г е [Го, Г^ ], - можно получить с учетом ¥ (Г, х) = 0, например, из решения линейной

граничной задачи управления (2), (4):

&(0)

dt

ДО)

= Ax(0) + Bu(0);

x(0)(to) = xo, x(0)(tf) = xf ,

Итак, предполагая, что матрица A в (5) задана и начальное приближение для задачи (2) - (4) тем или иным способом получено в виде пары:

x(0)(t), u(0)(t), Vt е [to, tf ], далее изложим процедуру построения последовательных (пошаговых) приближений к решению задачи оптимального управления (1) - (3), а затем установим условия их сходимости.

2. ОСНОВНЫЕ СООТНОШЕНИЯ И ВСПОМОГАТЕЛЬНЫЕ ЗАДАЧИ МЕТОДА ПРИ ПОСТРОЕНИИ ПРИБЛИЖЕНИЯ НА k -м ШАГЕ

Пусть, исходя из какого-либо начального приближения для задачи (2) - (4), на (k -1) -м шаге получена пара u(k-1)(t), x(k-1)(t), Vt e[to,tf ], для

которой x(k-1)(t0) = x0, x(k-1)(tf ) = xf. Предваряя изложение вычислительных процедур для k -го шага метода и следуя методу последовательных приближений Пикара, вначале отметим, что

для полученных u(k-1)(t) и x(k-1)(t) = x(0k-1)(t) можно было бы последовательно решить начальные задачи:

^^ = A x— (t) + Bu(k-1) (t) + F(t, (t)); dt

x ? -1)(to) = xo (i = 1,2,3,...). (7)

В силу теоремы Пикара: lim x(k ^(t) = xk ^(t), (k-1)

где x k '(t) - решение задачи Коши:

^ k -1) = Ax kk-1) + Bu( k-1)(t) + F (t, xkk),

dt

ck 1)(t0) = x0 .

(8)

(6)

где и(0)(Г) - управление, например, доставляющее минимум функционалу (3). В силу полной управляемости пары матриц (А, В) гарантируется существование решения этой задачи. Отметим, что сведение задачи построения начального приближения к задаче (3), (6) в основном было обусловлено последующим применением метода моментов в виде принципа максимума Н.Н. Красовского [1, 3, 4, 6 - 8]. В зависимости от свойств вектор-функции ¥ (Г, х) в качестве начального приближения метода можно выбирать любое допустимое решение двухточечной граничной задачи (2), (4).

Поэтому необходимость в решении задач (7) оказывается избыточной, то есть для заданного (к _1) -го приближения достаточно решить только задачу (8). Очевидно, что в общем случае для

задачи (8) будет получено х( 1) (Гу ) Ф ху. Иначе, при выполнении с требуемой точностью условия

х(к-1)(Гу ) = х/, пара и(к-1)(Г), х(-1)(Г) - возможное искомое решение задачи оптимального управления для (1) - (3). Далее этот случай будет рассмотрен отдельно.

Если же получено х(к 1)(Гу) Ф ху, то построение к -го приближения необходимо завершить соответствующей коррекцией программы

управления и(к 1)(Г) с целью обеспечения выполнения конечного условия (2). При этом нелинейность в (4) можно заменить вектор-функцией

Рк_1 (Г) = ¥ (Г, х(к 1) (Г)) . Коррекция программы

управления и( к 1)(Г) связана с решением вспо-

могательной задачи оптимального управления для системы (4) с тем же функционалом J(и), что и в (3), а именно:

йх) = Лх(к) + Би(к) + Ёк _1(г);

dt x (k)

(to) = Xo , x(k)(tf ) = xf ,

(9)

где и(к\г) - скорректированное оптимальное управление, которое отыскивается также как

и управление и(к ). Полученное решение

задачи (9) в виде пары и(к\г) , х(к\г) будет являться искомым к -м приближением для задачи оптимального управления системой (1) - (3). Задачи управления типа (9) с какими-либо аппроксимациями для нелинейности в (4) в виде вектор-функций времени были введены в [11] как опорные задачи управления для рассматриваемого здесь метода.

Вычитая уравнение (8) из уравнения (9), получим

й 5х(к)

dt

= ЛЪх(k) + B5u(k )(t), (10)

8и(к)(г) в общем случае допускает существование тождественно ненулевых решений - нуль-финитных управлений [12] Ъу(г) , которые с учетом (11), (12) здесь удовлятворяют следующим условиям:

г/

\ф(г, т) БЪу (к) (т)й т = 0. (13)

Решение уравнения (13) на к -м шаге, то есть

управления Ъу (к), сводится к решению изопери-метрической задачи, в которой для заданного

и(к-1) (I) требуется минимизировать функционал J(u(k-1) + Ъу (к)) по Ъу (к) . Если при этом будет получено Ъу (к \г) * 0 и J(u(k-1)+ Ъу(к)) < J(u(k-1)), то к -й шаг тем самым завершается и, очевидно, что тогда будет получена искомая программа управления и^^) = и(1-1)(€) + Ъу (к) , для которой

х(к \г) - решение начальной задачи:

^ = Лх(к) + Би(к) (г) + F (г, х(к)), х(к) (г0) = х0. йг

Если же 8v(k )(t) = 0 , то искомым приближенным оптимальным управлением для задачи

(1) - (3) будет программа управления u( k 1)(t).

Итак, в общем случае, когда решение уравнения (13) не требуется и k , то имеет место:

х(-1)(t) ^ х(юю)(t) ; u(k)(t) = lim u(k)(t), где

k

x((o)(t) - решение задачи:

dx (k)

Ax(() + Bu(()

= Ax( + Bu^ > (t) + F (t, x(()), x(() (to) = xo,

для которого выполняется условие x^ ' (tf) = xf, а

u '(t) - искомое оптимальное управление для рассматриваемой задачи (1) - (3) и

J(u(k)) = lim J(u(k)) - её :

dt

где

Ъи(к)(г) = и(к)(г)-и(к-1)(г), Ъх(к\и = х(к\1)-х(х-1\и -соответствующие отклонения. Решение уравнения

(10) с учетом Ъх(к) (^0 ) = 0 имеет вид

г

Ъх(к \г) = \ф(г, т) БЪи(к) (т)йт, (11)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

г0

где Ф(г, т) - переходная матрица для системы (9) [1, 3]. При г = г/ из (11) получим

Ъх(к)(г/) = х/ - х¡^ 1)(гу ) или в силу построения оптимального управления и(к)(г) при решении задачи (9):

Ъх(к)(гг) = | Ф(г/,т)БЪи(к)(т)йт = х/ -х((0к-1)(г/) .(12)

г0

Поскольку выше предполагалось, что

х(ок-1)(г/) * х/, то с решением задачи (12), з. ОБ УСЛОВИЯХ СХОДИМОСТИ МЕТОДА а фактически - с решением задачи (9), к-й

шаг завешается и полученная при этом пара

и(к)(г) , х(к)(г) - к -е приближение к решению задачи оптимального управления (1) - (3). Если же при решении задачи (8) было получено

х(к 1)(г/ ) = х/ (с наперед заданной и достаточно высокой точностью), то в этом случае решение задачи (12) не требуется, исключая случай повышения требуемой точности решения на этом шаге. Тем не менее, следует отметить, что если

условие хО 1)(г/) = х/ все-таки оказывается выполненным, то уравнение (12) относительно

значение.

k

Условия сходимости рассматриваемой модификации метода последовательных приближений Пикара для управляемых систем вида (1) непосредственно связаны с условиями сходимости последовательностей Ъх(к )(г/) ^ 0 и Ах ООк)(//) ^ 0, где Ах О )(г) = х О )(г) - х О -1)(г) . Пусть хОк)(г) - решение задачи (8) на (к +1 )-м шаге, то есть

йх ок)

^ = Лх Ок) + Би(к )(г) + F (г, хОк)), йг

t

0

x k )(to) = x0 .

(14)

5u(k )(t) = Mk (t)5x^ >(tf), (18)

где M^ (t) - матрица соответствующих размеров. Подставив (18) в (17), получим

5x(k+1)(tf) = -Kk 5x(k )(tf),

(k)(

Вычитая уравнение (8) из (14), с точностью до малых первого порядка получим

d Ax(lc)

k = A k (t)Ax k) + B5u(k )(t),

dt

Axkk)(to) - 0 .

x

5 x(k+l\tf)

Рис. 1.

Кроме того, учитывая предполагаемую зависимость вариации 5и(к )(Г) от конечного условия

5х(к) (Гу ), представим 5и(к )(Г) в виде поточечной аппроксимации на [Г0, Г у ]:

j

(15) где Vk = jАФк (tf, т) BMk (x)d т. Очевидно, что

А А (дР Л

где Ак(Г) = А + 1 - I , а вариация

V дх ) х=х(к-1)(Г)

5и(к )(Г) - корректирующее управление в (10).

Переходную матрицу для (15) можно представить в виде Ф к (Г, т) = Ф(Г, т) + А Фк (Г, т). Решая далее начальную задачу (15), получим

V

Ах (( )(Гу) = \Фк (Гу, т)В5и(к)(т)Л. (16)

Отметим, что по условиям отыскания корректирующего управления из решения задачи (12)

имеетместо: 5х(к+1} (Iу ) = 5х(к ] (у ) _ Ах () (см. также рис. 1). Поэтому, вычитая (16) из (12), с точностью до малых первого порядка тогда получим:

5х(к+1)(Гу) = _| АФк(Гу, т)В5и(к)(T)dт. (17)

t0

отсюда следует

(k+1)

||5x^(tf)|| <P(Vk)||5x(k)(tf)||, (19)

где p (•) - максимальное сингулярное число матрицы (или её спектральная норма). Стало быть,

для сходимости последовательности 5x(k)(tf ),

то есть lim 5x(k)(tf ) ^ 0 , достаточно, чтобы

k ^k

выполнялось следующее условие:

p (Vk ) < 1 Vk > k0, 1 < k0 < k . Поскольку из (16) с учётом (18), (19) следует Ax kk )(tf ) = (Vk + Qk )5x(k )(tf ) , где

tf

Qk = j* Фk(tf, т)BMk(T)dт , постольку если

lim 5x(k\tf ) ^ 0, то и lim Ax^;(tf ) ^ 0,

кроме того, также имеет место:

lim || 5u(k)(t)|| = 0 (Vt е [t0,tf ]).

k ^k J

Полученные достаточные условия сходимости для рассматривавшегося метода последовательных приближений синтеза оптимального управления для нелинейных аффинно-управляемых систем вида (1) тесно связаны со свойствами

матриц Mk (t), Vk и Qk .

ЗАКЛЮЧЕНИЕ

Рассмотрен численный метод синтеза оптимального управления для нелинейных аффинно-управляемых систем вида (1), в основе которого лежит соответствующая модификация метода последовательных приближений Пикара, отличающаяся тем, что на каждом шаге дополнительно вводится процедура коррекции программы управления с целью выполнения граничных условий в решаемой задаче оптимального управления (1) - (3). Кратко обсуждаются варианты задания начального приближения для метода и приведены основные соотношения метода при построении приближений для решения задачи оптимального управления с функционалами типа нормы в Lp (p = 1, 2, k ). Отмечен также случай, когда корректирующее управление явля-

Д k)/

t

0

t

0

ется нуль-финитным управлением. Указаны достаточные условия сходимости вычислительной процедур метода.

Статья подготовлена по материалам доклада «Метод синтеза оптимального управления для квазилинейных систем при моделировании перенацеливания аппаратуры зондирования космического аппарата», представленного на XVII Всероссийском научно-техническом семинаре по управлению движением и навигации летательных аппаратов (Самара, 18 - 20 июня 2014 г.) [1].

СПИСОК ЛИТЕРАТУРЫ

1. Горелов Ю.Н., Морозова М.В., Пыринов Н.И., Юрин В.Е. Метод синтеза оптимального управления для квазилинейных систем при моделировании перенацеливания аппаратуры зондирования космического аппарата // Управление движением и навигация летательных аппаратов: Сб. тр. XVII Всеросс. научно-техн. семинара по управлению движением и навигации ЛА: ЧЛ. Самара: Изд-во СамНЦ РАН, 2014. С. 54-61.

2. Маркеев А.П. Теоретическая механика. - Москва-Ижевск: НИЦ «Регулярная и стохастическая динамика», 2007. - 592 с.

3. Мороз А.И. Курс теории систем. М.: Высшая школа, 1987. 304 с.

4. Красовский Н.Н. Теория управления движением: линейные системы. М.: Наука, 1965. 476 с.

5. Горелов Ю.Н., Данилов С.Б., Тропкина Е.А. Об одном подходе к приближенному решению задачи оптимального управления переориентацией

космического аппарата // Обозрение прикладной и промышленной математики. 2011, т.18, в.3. С.429-431.

6. Горелов Ю.Н., Данилов С.Б., Юрин В.Е. Синтез оптимального управления переориентацией космического аппарата одним методом последовательных приближений // Управление движением и навигация летательных аппаратов: Сб. тр. XVI Всеросс. научно-техн. семинара по управлению движением и навигации ЛА: Ч.Ш. Самара: Изд-во СНЦ РАН, 2013. С.34-40.

7. Горелов Ю.Н., Курганская Л.В., Мантуров А.И., Соллогуб А.В., Юрин В.Е. К задаче оптимизации программ управления угловым движением космического аппарата дистанционного зондирования Земли // Гироскопия и навигация. 2014, №1 (84). С.81-97.

8. Горелов Ю.Н. К решению задачи синтеза оптимального управления переориентацией космического аппарата при перенацеливании аппаратуры зондирования одним методом последовательных приближений // Известия СамНЦ РАН, 2014, т.16, № 4. С.127-131.

9. МатвеевН.М. Методы интегрирования обыкновенных дифференциальных уравнений. М.: Высшая школа, 1967. 564 с.

10. Воеводин В.В., Кузнецов Ю.А. Матрицы и вычисления. М.: Наука, 1984. 320 с.

11. Горелов Ю.Н. Об одном подходе к моделированию оптимального управления многомерными линейными системами // Вестник Самарского госуд. ун-та. 2013, № 9/2 (110). С.184-190.

12. Синяков А.Н. Системы управления упругими подвижными объектами. Л.: Изд-во ЛГУ, 1981. 200 с.

ABOUT ONE APPROACH TO THE SYNTHESIS OF OPTIMAL CONTROL FOR AFFINE-CONTROLLABLE NONLINEAR SYSTEMS

Samara State Aerospace University named after academician S.P. Korolev (National Research University)

A numerical method of the optimal control synthesis for nonlinear affine-controlled systems with the norm type functionals in Lq ( q = 1, 2, œ ), which is a modification of the Picard's successive approximations method, is presented. The convergence conditions for the proposed method are determined. Keywords: optimal control, functional of norm type, successive approximations, convergence conditions.

Yury Gorelov, Doctor of Technics, Director of Institute for Modeling and Control Sciences. E-mail: yungor07@mail.ru

Об одном подходе к синтезу оптимального управления для нелинейных аффинно-управляемых систем Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Горелов Юрий Николаевич

Похожие темы научных работ по математике , автор научной работы — Горелов Юрий Николаевич

ABOUT ONE APPROACH TO THE SYNTHESIS OF OPTIMAL CONTROL FOR AFFINE-CONTROLLABLE NONLINEAR SYSTEMS

Текст научной работы на тему «Об одном подходе к синтезу оптимального управления для нелинейных аффинно-управляемых систем»