Научная статья на тему 'Необходимые условия оптимальности для дискретных задач оптимального управления'

Необходимые условия оптимальности для дискретных задач оптимального управления Текст научной статьи по специальности «Математика»

CC BY
136
28
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Арутюнов А. В., Маринкович Б.

В теории оптимизации большое значение имеет исследование дискретных динамических систем (см. [1-4] и т.д.). Дискретные системы интересны как сами по себе, вследствие их многочисленных приложений, так и с чисто теоретической точки зрения, так как они широко используются для аппроксимации при численном решении задач оптимального управления (см. [5]).

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Необходимые условия оптимальности для дискретных задач оптимального управления»

6. Флеминг У., Ришел Р. Оптимальное управление детерминированными и стохастическими системами. М.: Мир, 1978.

7. Zeidan V. Sufficient conditions for the generalized problem of Bolza // Trans. Amer. Math. Soc. 1983. 275. P. 561-586.

8. Васильев Ф.П. Методы оптимизации. M.: Факториал, 2002.

9. Матвеев A.C., Якубович В.А. Оптимальные системы управления: обыкновенные дифференциальные уравнения. Специальные задачи. С.-Пб.: Изд-во С.-Петербург, ун-та, 2003.

10. Асеев С.М., Кряжимский A.B., Тарасьев A.M. Принцип максимума Понтрягина и условия трансверсальности для одной задачи оптимального управления на бесконечном интервале // Труды Матем. ин-та им. В. А. Стеклова. 2001. 233. С. 71-88.

11. Киселев Ю.Н. Достаточные условия оптимальности в терминах конструкций принципа максимума Понтрягина // Материалы научного семинара "Математические модели в экономике и биологии". М.: МАКС Пресс, 2003. С. 57-67.

12. Кларк Ф. Оптимизация и негладкий анализ. М.: Наука, 1988.

13. Благодатских В. И. Введение в оптимальное управление. М.: Высшая школа, 2001.

14. Рокафеллар Р. Выпуклый анализ. М.: Мир, 1973.

15. Пшеничный Б.Н. Необходимые условия экстремума. М.: Наука, 1982.

Поступила в редакцию 13.04.04

УДК 517.977

А. В. Арутюнов, Б. Маринкович

НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ

ДЛЯ ДИСКРЕТНЫХ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ1

(кафедра системного анализа факультета ВМиК)

В теории оптимизации большое значение имеет исследование дискретных динамических систем (см. [1-4] и т.д.). Дискретные системы интересны как сами по себе, вследствие их многочисленных приложений, так и с чисто теоретической точки зрения, так как они широко используются для аппроксимации при численном решении задач оптимального управления (см. [5]).

1. Постановка задачи. Рассмотрим следующую дискретную задачу оптимального управления с концевыми ограничениями:

ЛГ-1

^-Ы, (1)

¿ = 0

£¿ + 1 = (рг(Хг, Щ), ¿ = 0,^-1, (2)

К1(х0,хм) ^ 0, К2(Х0,Хдг) = 0. (3)

Здесь XI 6 Д™ — точки фазового пространства, и; £ — управляющие параметры, N — заданное число шагов. Вектор £ = (жо, жъ • • • > жл0 определяет траекторию, т = (щ, щ,..., идг_1) — управление, хо — начальная точка траектории а ждг — ее концевая точка; К\(хо,х^) : Д™ X Д™ —> Д^1 и К2(жо,ждг) : Д" X Д" -т- Д^2 — заданные вектор-функции, описывающие концевые ограничения (3). Все заданные отображения и функции /¿, К1, предполагаются дважды непрерывно дифференцируемыми по совокупности переменных.

1 Работа выполнена при поддержке гранта РФФИ (проект № 05-01-00193), программы "Университеты России" и

программы Президента РФ поддержки ведущих научных школ НШ. 1889. 2003. 1.

Возьмем произвольное начальное условие жо и управление т. Из уравнений (2) они определяют соответствующую им траекторию £ = (жо, жъ • • • > жлг)- Если для £ выполнены условия (3), то пара (хо,т) называется допустимой.

Задача оптимального управления заключается в минимизации функционала

ЛГ-1

= ^ /¿(ЖЬ щ)

¿=о

на множестве допустимых пар.

Цель этой заметки — получение необходимых условий первого и второго порядка в рассматриваемой задаче (1)-(3).

2. Необходимые условия оптимальности. Рассмотрим допустимую пару (хо,т) и соответствующую им траекторию Будем предполагать, что пара (хо,т) доставляет локальный минимум в задаче (1)-(3).

При этом для удобства формулировок, исключая неактивные индексы I : /^¿(¿о, ждг) < 0, будем, не теряя общности, считать, что /1'1(жо,ждг) = 0.

Для формулировки теоремы введем необходимые обозначения. Определим функции

ЯДж, и,р, А0) = (р, <Рг(х, и)) - Ао/Дж, и), г = О, N - 1, 1(х0, ждг, Аь А2) = (Аь К1(х0, ждг)) + (Х2,К2{хо, хм)).

Здесь, А0 6 Я, Хг 6 Д^1, А2 6 Д^2 и р е Д".

Итак, пусть (¿о, ги) — точка локального минимума в задаче (1)-(3). Для нее необходимые условия оптимальности первого порядка заключаются в следующем (см. [7]): существуют такие множители Лагранжа А = (А0, Аь Х2,р), А0 6 Д, Аг 6 11к1, А2 6 11к2, р 6 Д"^1', что А ф О, А0 ^ 0, Аг ^ 0 и выполняются условия: 1)

Ро = я—(жо, Ждг, Аь А2), Рм = ---(ж0, Ждг, Аь А2); (4)

ох0 аждг

2)

дН

Р1 = йг,Рг+1, А0), i = 0,N-l; (5)

3) при всех г = О, АГ — 1 выполнено условие стационарности

дН,

ди

(Хъ,Щ,Ръ + 1,Ао) = 0. (6)

Множество множителей Лагранжа, отвечающих паре (¿о, ги), обозначим через А. Необходимые условия первого порядка означают, что А ф 0.

Обозначим через /С множество, состоящее из тех векторов к = (/го, Ъ>\,..., /гдт) 6 Д"^-1-1',

V = (ио, VI,..., идг-1) £ ДгЛГ, для которых выполняются следующие условия:

¿=0 \ ' ¿=0 * ' ^ = ^¿»ж"1 (^-ь + ^ ¿(и"1 0^-ь (8)

д(х0, Ждг) дК2

д(х0, Ждг)

(ж0, Ждт)(/г0,/гдг) ^ О, (9)

(ж0, ждт)(/г0, /гдг)Т = 0. (10)

Система уравнений (8) называется системой уравнений в вариациях, соответствующей (¿о, ги) Соотношения (9), (10) определяют граничные условия для этой системы уравнений в вариациях.

Положим

-^(Хк,йк) = С'к, -^-{хк,йк) = Бк. Обозначим через В блочную матрицу

В = [Д) В1 ... Баг],

где

дК дК , л „ , ^ ^

Во = я—(жо, Хм) + --(ж0, Ждг) С8,

Ох0 ОХ дг

¿ж _

Я» = а-(жо, • • -См-1-0,-1, г = 1, N - 1,

ОХ дг

о К

В дг = --(¿0, Жлг)0)лг_1.

ОХ дг

Здесь и ниже К = (А'1, А'г)-

Обозначим через М подпространство, которое состоит из всех (/г, и) 6 Д"(ЛГ+1' х ДгЛГ, удовлетворяющих уравнениям (8) и

дК дК ,

--(ж0, Ждг)Яо + я-(ж0, Ждг)/гдг = 0. (11)

Ох о СЖдг

Отметим, что по построению М — это максимальное линейное подпространство, лежащее в выпуклом конусе /С.

Для А 6 А определим на /С квадратичную форму по формуле

12 А , , .2 , дЧ ,А & , , .2 . дЧ

=(ж0, Ждг, Аь А2)[/г0] + Ждг, Аь А2)[/гдг] + 2 (ж0, ¿дг, Аь А2)/г0Ллгу-

ДГ_1 з2яг ДГ_1 з2яг ДГ_1 / <92Яг \

- ^ -^(¿0,Йг,№ + 1,А0)[/гг]2 - ~0^-{£г,иг,Рг + 1, >^о)[щ]2 ~ 2 ^ ( ^^ (¿Ь ¿г, Рг + Ъ > / • 1=0 1=0 1=0 \ '

Здесь и ниже для линейного оператора А запись А[ж]2 = (Ах,х) обозначает значение квадратичной формы (Аж, ж).

Через Ла обозначим множество, состоящее из тех множителей Лагранжа А 6 А, для которых

тс1м ^ к\ + — п — гп + сЦт(кег.В).

Здесь тс1м — ЭТО индекс сужения квадратичной формы на подпространство М. По определению он равен максимальной из размерностей линейных подпространств, лежащих в М, на которых форма отрицательно определена.

Теорема. Пусть (хо,й) — точка локального минимума в задаче (1)-(3). Тогда Аа ф {0} и для любого (]г, и) Е К, имеет место

тах Пх[(к,у)]2 ^ 0. (12)

лела,|л|=1

3. Доказательство теоремы. Для доказательства теоремы переформулируем задачу (1)-(3) как задачу математического программирования, после чего применим к ней необходимые условия оптимальности первого и второго порядка из [6].

Определим функции /(£, ги) : Д"^1) х ДгЛГ Д, ^(^то) : Д"^1) х ДгЛГ Д", г = Т^Ы, и ги) : Д"^1) х ДгЛГ ДпЛГ следующим образом:

ЛГ-1 ¿ = 0

■^+1 , = »¿+1 - (р^ (ж^, -«¿), г = О, Аг — 1,

Рассмотрим задачу математического програмирования:

(13)

= 0, (14)

К 1(х0,хм) ^ 0, К2(х0,хдг) = 0. (15)

Точка (£, т) доставляет в ней локальный минимум. Чтобы применить результаты из [6], введем необходимые понятия.

Определим функцию Лагранжа

Щ, IV, А) : Д"(лг+1) X ЯгМ X Д X Як1 X Кк2 X ЯпМ Я

следующим образом:

ш, А) = Л0/(£, т) + {р, ю)) + (Х1,К1(х0,хм)) + (А2, К2(х0, хм)),

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где А = (Ло, А1, Л2, р), Ао £ Д, А1 6 Як1, Х2 £ Як2, р £ ДпЛГ. Для задачи (13)—(15) правило множителей Лагранжа состоит в том, что ЗА ф 0, Ао ^ О, А1 ^ О,

яг

—|—-се,^, а) = о.

Обозначим через А множество всех множителей Лагранжа задачи (13)—(15), отвечающих точке (£, т). Введем в рассмотрение отображение

ги) : Д"(дг+1) х ЯгМ ЯпМ X Як1 X Д*2,

Положим А = то).

Обозначим через Аа множество тех множителей А 6 А, для которых

д2Ь

1x1(1 ^ —-— то, А) ^ сосИт(1т А), Z = kevA.

д(£, то)2

В [6, теорема 4.1, глава 1] доказано, что если (£, то) — локальный минимум в задаче (13)—(15), то А аф{Щ, шах -^-(|>,А)[(/г,г;)]2^0 (16)

Здесь /С — конус критических направлений в точке (£, то) для задачи (13)—(15). Он состоит из тех векторов (/г, и), для которых выполняются следующие условия:

д/

^ {¡1, <: о, (17)

(i,w)(h,v )Т = = о, (18)

(ж0, Ждг)(/г0 ) ^п, )т ^ о, (19)

(ж0, ждг)(/г0 ) ^п, )т = о. (20)

д(£, то дР

дК1

д(х0, Ждг)

дК2 д(х0, Ждг)

Расшифруем условия (16). Из того, что ЛГ-1 ЛГ-1

ТО, А) = Ао ^ /г{хг,щ) + ^ {Рг + 1, «¿ + 1 ~ Щ)) + (^1, К1(х0, Ждг)) + {Х2,К2(х0, Ждг)) ,

¿=0 ¿=0

имеем

дЬ £ ~ д/0 д(р0 щ дКг дК2

А) = ~0х~ ' Щ> ~ 'дяr^Xo, Р1 (жо, хм) А2 = 0, (21)

= \0^(xi,Ui) +Pi - ^^{xi,Ui)Tpi+i = 0, г = 1, iV" — 1, (22)

9L дКг дК2 , п

= Pn + t.-{x0,xN) Ai + --(ж0,ждт) А2 = 0, (23)

Положим

Зждт Зждг Зждг

Tj^- = A0^-(ii, й) - Ui)Tpi+1 = 0, ¿ = 0,iV-l, (24)

Po = ^^-{x0,u0,pi,\0). (25)

Из (21) и (25) получаем Аналогично из (22): Из (23) имеем

РО = -!г-(хо, Ждг, Аь А2). о ж0

ОН,

Pi = -g^-(Xi,Ui,pi + 1,А0), ¿=l,iV-l.

PN = (¿0, XN, АЬ А2).

О Ждг

Положим р = (ро,р), А = (Ао, Ах, Х2,р). В силу доказанного для рассматриваемого А имеет место (4) и (5).

Из (24) получаем (6).

Вычислим число сосЦт(1т А). Для этого найдем размерность ядра кег А. Это ядро состоит из тех (/г, и), которые удовлетворяют системе уравнений в вариациях

hk ~ Ck-ihk-i - Dk_ivk_i = 0, & = l,iV, (26)

и граничным условиям (11). Решая уравнения (26), получаем

к-1 к-2

hk = П Csh0 + J] J} CsDjVj + Dk-iVk-i, k = lj4.

s=0 j = 0

Отсюда имеем

JV-l N—2

hN = П Csh0 +Y, П C'Divi + DN-tVN-i. (27)

s=0 j=0 j<s^.N-1

Из (11) и (27) получаем, что размерность ядра оператора А совпадает с размерностью ядра блочной матрицы В. Положим mi = n(N1) + riV, т2 = nN + к\ + к2. Как известно, dim(im А) = codim(ker А). Поэтому

codim (im А) = то2 — codim (ker A) = m2 — mi + dim (ker В) = ki + k2 — n — rN + dim (ker £?). Упростим выражения для квадратичной формы (¿;, ц), А). Используя очевидные тождества

я2 г Я2г Я2г

(¿,i) / (0,iV); ^- = 0, - = 0 Уг ф j,

л л --т V ' о ) ' / «/5 V ' / / V ' / ' л л - ? Л л

ОХ{ОХ^ OXiOUj 0П10и3

получаем, что

<92£

то)2

Поэтому А = (Ао, Ах, А2,р) £ А„ А = (Ао, Ах, Х2,р) Е Аа (напомним, что р = (ро,р))- Кроме того, из (17)—(20) непосредственно имеем /С = /С.

Таким образом, в силу вышесказанного из (16) вытекает (12). Теорема доказана.

4. Обсуждение результатов. Допустимую пару (хо,т) назовем экстремалью задачи (1)-(3), если она удовлетворяет необходимым условиям первого порядка (4)-(6). Необходимые условия первого порядка для дискретных задач оптимального управления давно известны [1-4].

Назовем экстремаль (¿о,гЬ) локально управляемой, если для нее имеет место

6? к\ + /г2 — п — гАГ + сЦт(кег В) = 0.

Это естественное применение соответствующей терминологии для задачи с непрерывным временем (см. [7]).

Если ограничения типа неравенств К 1(жо,ждг) ^ 0 отсутствуют, то локальная управляемость экстремали означает ее нормальность (см. [6]). В частности, пусть в задаче (1), (2) левый конец жо фиксирован, а правый конец ждг свободен. Последнее означает, что концевые ограничения (3) имеют вид жо = а, где а — заданный вектор из Я". Тогда в такой задаче любая экстремаль является нормальной.

Вывод необходимых условий первого и второго порядка для задачи (1)-(3) без ограничений типа неравенств К 1(^0, ждг) ^ 0 для нормальных экстремалей не вызывает серьезных затруднений. Для нормальных экстремалей необходимые условия второго порядка получены, например, в [8].

Главной отличительной чертой теоремы является то, что она доказана без каких-либо априорных предположений нормальности (регулярности) и является содержательной и для анормальных экстремалей.

Приведем пример использования теоремы.

Рассмотрим задачу с фиксированным левым и свободным правым концом:

К0(хм (28)

Хг + 1 = (Рг(хг,щ), i = 0,N-l, ж0 = а. (29)

Пусть т является в этой задаче локальным минимумом. Тогда, как известно [1-3], если

дК0

дх

N

-(ждг) = О,

то необходимые условия первого порядка (4)-(6) выполняются автоматически при Ао = 1, р = 0. Поэтому все управления ги, для которых = 0 (здесь ждг — последная координата соответствующей фазовой траектории £), автоматически удовлетворяют условиям первого порядка и являются "подозрительными" на минимум. Применим к ней необходимые условия второго порядка из теоремы. Для задачи (28), (29) все экстремали локально управляемы, множества А и Аа совпадают и содержат единственный элемент А : |А| = 1, причем для него Ао > 0 и

^а[(М)]2 ^ о У(М)е/с.

СПИСОК ЛИТЕРАТУРЫ

1. Болтянский В. Г. Оптимальное управление дискретными системами. М., 1973.

2. Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. М., 1974.

3. Пропой А. И. Элементы теории оптимальных дискретных процессов. М., 1973.

4. Васильев Ф.П. Численные методы решения экстремальных задач. М., 1988.

5. Васильев Ф.П. Методы оптимизации. М., 2002.

6. Арутюнов A.B. Условия экстремума. Анормальные и вырожденные задачи. М., 1997.

7. Арутюнов A.B. Необходимые условия второго порядка в задачах оптимального управления // Докл. РАН. 2000. 371. № 1. С. 10-13.

8. Hilscher R., Zeidan V. Discrete optimal control: second order optimality conditions //J. Differ. Equations Appl. 2002. 8. N 10. P. 875-896.

Поступила в редакцию 02.06.04

i Надоели баннеры? Вы всегда можете отключить рекламу.