Научная статья на тему 'Позиционные необходимые условия оптимальности и метод решения задач оптимального управления в дискретной системе, линейной по фазовой переменной'

Позиционные необходимые условия оптимальности и метод решения задач оптимального управления в дискретной системе, линейной по фазовой переменной Текст научной статьи по специальности «Математика»

CC BY
141
32
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / ДИСКРЕТНЫЕ ЛИНЕЙНЫЕ СИСТЕМЫ С УПРАВЛЯЕМЫМИ КОЭФФИЦИЕНТАМИ / НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ / ПОЗИЦИОННЫЕ УПРАВЛЕНИЯ / ЧИСЛЕННЫЙ МЕТОД / OPTIMAL CONTROL / DISCRETE LINEAR SYSTEMS WITH CONTROLLED COEFFICIENTS / NECESSARY OPTIMALITY CONDITIONS / FEEDBACK CONTROLS / NUMERICAL METHOD

Аннотация научной статьи по математике, автор научной работы — Сорокин Степан Павлович

Предложен нелокальный метод решения задачи оптимизации линейного целевого функционала в дискретной динамической системе, линейной по фазовой переменной с управляемыми коэффициентами. Метод основан на паре позиционных необходимых условий оптимальности, использующих управления с обратной связью, экстремальные к функции Понтрягина. Результаты апробированы на примерах с билинейными динамическими системами.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

POSITIONAL NECESSARY OPTIMALITY CONDITIONS AND NUMERICAL METHOD FOR DISCRETE OPTIMAL CONTROL PROBLEMS IN LINEAR SYSTEM

The paper is devoted to new numerical method for discrete optimal control problems in system which is linear wrt the state variable. The method is based on the positional necessary optimality conditions in Pontryagin form. The designed method proved itself quite effective in numerical analysis of optimal control problems with bilinear dynamical systems.

Текст научной работы на тему «Позиционные необходимые условия оптимальности и метод решения задач оптимального управления в дискретной системе, линейной по фазовой переменной»

УДК 517.977.5

ПОЗИЦИОННЫЕ НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ И МЕТОД РЕШЕНИЯ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ В ДИСКРЕТНОЙ СИСТЕМЕ, ЛИНЕЙНОЙ ПО ФАЗОВОЙ ПЕРЕМЕННОЙ

© С.П. Сорокин

Ключевые слова: оптимальное управление; дискретные линейные системы с управляемыми коэффициентами; необходимые условия оптимальности; позиционные управления; численный метод.

Предложен нелокальный метод решения задачи оптимизации линейного целевого функционала в дискретной динамической системе, линейной по фазовой переменной с управляемыми коэффициентами. Метод основан на паре позиционных необходимых условий оптимальности, использующих управления с обратной связью, экстремальные к функции Понтрягина. Результаты апробирован на примерах с билинейными динамическими системами.

Данная работа посвящена разработке численной процедуры улучшения управления в задаче оптимального управления динамической системой с управляемыми коэффициентами. В основе данной процедуры лежит позиционное необходимое условие минимума [Дых-та], оперирующее управлениями с обратной связью. Такие управления строятся как экстремальные по отношению к вспомогательным слабо монотонным функциям — решениям соответствующего неравенства Гамильтона-Якоби. В данной работе используется частный вариант позиционного условия минимума с линейными слабо монотонными функциями, примененный к исходной задаче и двойственной к ней.

Рассматривается следующая задача дискретного оптимального управления (Р):

Хи+1 = Ли (пи )хк + Ъи (пи), Хо = X0, (1)

пи € и, к = 0, N — 1,

3[п] = 1 хм ^ шш,

где п = {пи}к=-о — управление, х = {хи}м=0 — траектория, матричные функции Л, Ъ непрерывны, множество и С Ят компактно.

Наряду с задачей (Р) рассмотрим задачу сравнения (Р*) (двойственную к исходной):

ри = Лк (пи )ри+1, Рм = I, (2)

пи € и, к = N — 1, 0,

N -1

К[п] = р0хо + ^ Ри+1Ъи(пи) ^ шт, и=о

с траекториями р = {ри}м=0 — решениями системы (2), сопряженной к (1).

Утверждение. Для любого допустимого управления п имеет место равенство 3[п] = К[п], в частности, шт(Р) = шт(Р*).

Введем функцию Понтрягина Ни (хи ,Ри+1,пи)= Ри+1 Ли (пи)хи + Ъи (пи)) и рассмотрим экстремальное многозначное отображение

ии (хи ,Ри+1) = Лщшт Ни (хи ,Ри+1,пи).

ик&и

2685

Обозначим через и, x и P некоторое допустимое управление с соответствующими траекториями систем (1) и (2).

Имеет место пара прямого и двойственного позиционных необходимых условий оптимальности управления и в понтрягинской форме [1, 2]:

Условие N : J[u] ^ J[v] У v — {vk(xk)}N— : Vk(xk) € Uk(xk ,Pk+i)-

Условие N*: K[u] ^ K[w] У w — {Wk(Pk+i)}N=-01 : Wk(Pk+i) € Uk(xk,Pk+i)-

Укажем некоторые свойства данных условий оптимальности.

1. Выполнение любого из условий N или N * влечет выполнение принципа максимума Понтрягина [3] для управления и в любой из задач (P), (P*), однако обратное не верно.

2. Условия N и N * не эквивалентны, и выполнение одного из них, вообще говоря, не гарантирует выполнения другого.

3. Данные условия носят конструктивный характер: при нарушении любого из них строится новое управление, заведомо лучшее по функционалу, чем исходное.

Указанные свойства позиционных условий оптимальности обосновывают целесообразность следующей принципиальной схемы итерационного метода улучшения управления.

Шаг 0. Задается начальное управление и, вычисляются траектории x, p и задается

Jrec :— J [u] — l xN ■

Шаг 1. Выбирается произвольный селектор w : Wk(Pk+i) € Uk(xk,Pk+i)-

Шаг 2. Находится p — {pjk} как решение сопряженной системы (2), замкнутой управлением Wk(Pk+i)■

Шаг 3. Вычисляется критерий качества

N -1

K[w] — p0x° +Y^ Pk+ibk{wk(Pk+i)) ■ k=0

Если K [w] <Jrec, то Pk :— Pk, Uk :— wk (Pk+i) и Jrec :— K [w].

Шаг 4. Выбирается произвольный селектор v : vk(xk) € U(xk,Pk+1).

Шаг 5. Находится x — {xk} как решение системы (1), замкнутой управлением v■

Шаг 6. Вычисляется критерий качества J[v] — I'xn■ Если J[v] <Jrec, то xk :—xk, Uk :—

— wk (xk ) и Jrec :— J [v].

Далее шаги 1-6 могут повторяться до тех пор, пока не прекратится уменьшение рекордного значения Jrec■

Приведенная схема численно реализована и апробирована на примерах с билинейными системами. Проведенные расчеты показали эффективность данного метода, его нелокальный характер и возможность улучшения неоптимальных экстремалей Понтрягина, в т. ч. особых.

ЛИТЕРАТУРА

1. Дыхта В.А. Слабо монотонные решения неравенства Гамильтона-Якоби и условия оптимальности с позиционными управлениями // Автоматика и телемеханика. 2013 (в печати).

2. Сорокин С.П. Бипозиционные решения неравенств Гамильтона-Якоби в задачах дискретного оптимального управления // Аналитическая механика, устойчивость и управление: Труды 10 Международной Четаевской конференции. Т. 3. Секция 3. Управление. Ч. II. Казань, 12-16 июня 2012 г. Казань: Изд-во Казан. гос. тех. ун-та. 2012. С. 408-420.

3. Mordukhovich B.S. Variational Analysis and Generalized Differentiation I & II. Fundamental Principles of Mathematical Sciences. Berlin: Springer, 2006. V. 330-331.

БЛАГОДАРНОСТИ: Работа выполнена при финансовой поддержке РФФИ (гранты № 11-01-00672-а, № 12-01-31252-мол-а, № 12-01-31391-мол-а) и ФЦП «Научные и научнопедагогические кадры инновационной России» (соглашение № 8211 от 06.08.2012).

2686

Sorokin S.P. POSITIONAL NECESSARY OPTIMALITY CONDITIONS AND NUMERICAL METHOD FOR DISCRETE OPTIMAL CONTROL PROBLEMS IN LINEAR SYSTEM

The paper is devoted to new numerical method for discrete optimal control problems in system which is linear wrt the state variable. The method is based on the positional necessary optimality conditions in Pontryagin form. The designed method proved itself quite effective in numerical analysis of optimal control problems with bilinear dynamical systems.

Key words: optimal control; discrete linear systems with controlled coefficients; necessary optimality conditions; feedback controls; numerical method.

УДК 517.929.2

О РЕШЕНИИ ЛИНЕЙНЫХ т -РАЗНОСТНЫХ УРАВНЕНИЙ ПОРЯДКОВ,

МЕНЬШИХ т

© Д.Н. Спичкин

Ключевые слова: т -разностные уравнения; функции Виленкина - Крестенсона.

Получена структура решения линейных т -разностных уравнений с постоянными коэффициентами порядка д<т при комплексных решениях характеристического уравнения.

Обозначим через [а, Ь] = {а, а + 1,... ,Ь} упорядоченное множество неотрицательных целых чисел. Пусть х = (х1... хп)т, р = (р1... Рп)т — п -разрядные т -ичные представления этих чисел.

Определение! Операцией т -сдвига двух чисел х, р € [а, Ь], обозначаемой х 0 р,

т

назовем их поразрядную разность по модулю т.

О п р е д е л е н и е 2. Линейное разностное уравнение, где в качестве сдвига аргумента берется т -сдвиг, назовем разностным уравнением с модулярной арифметикой или линейным т -разностным уравнением.

Линейное т -разностное уравнение порядка д с постоянными коэффициентами имеет вид

у(х 0 д) + к\у(х 0 (д — 1)) + ... + кд-1у(х 0 1) + кду(х) = 0, (1)

т т т

где к- € С, ] = 1, д.

Решениями уравнений (1) являются функции Виленкина - Крестенсона (ВКФ) [1], записываемые в форме Пэли

п

У. Рп+1-^ х^

Ра1 (р, х) = Wj=1 , (2)

- 2П

где W = вгт, г — мнимая единица, х — аргумент, р — параметр, причем х,р € [0, тп — 1].

Известно [1], что при решении линейных т -разностных уравнений часть разрядов пара-

метра р фиксируется, а часть остается произвольной.

Пусть, далее, порядок д уравнения (1) удовлетворяет неравенствам 1 ^ д<т. Тогда число д в т -ичной п -разрядной форме представления запишется как д = (0 0 ... д)т.

Подставим выражение (2) в уравнение (1) и проведем ряд упрощений. Так как выражения (хп — д)т и (хп — (д — Ь))т в модулярной арифметике, соответственно, равняются выражениям хп + т(5о Хп + $1 Хп + ... + $(д-1) Хп ) — д и хп + т(§0 Хп + $1 Хп + ... + 5(д-г-1) хп ) —

2687

i Надоели баннеры? Вы всегда можете отключить рекламу.