Научная статья на тему 'Анормальность в теории необходимых условий оптимальности'

Анормальность в теории необходимых условий оптимальности Текст научной статьи по специальности «Математика»

CC BY
196
32
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
OPTIMALITY CONDITIONS / ABNORMALITY / EXTENSION PRINCIPLE / METHOD OF LAGRANGE / MAXIMUM PRINCIPLE / PENALTY FUNCTIONS

Аннотация научной статьи по математике, автор научной работы — Гурман Владимир Иосифович, Хрусталев Михаил Михайлович

Известные в теории экстремальных задач проблемы существования, не единственности и анормальности решений, возникающие при применении необходимых условий оптимальности, обсуждаются с позиций принципа расширения и общих достаточных условий оптимальности с использованием простых примеров. Показывается, что эти проблемы зачастую порождаются не существом задачи, а применяемым методом решения и могут исчезать при использовании другого метода.В основе исследования лежит предложенный В. Ф. Кротовым принцип расширения в абстрактной задаче на экстремум, получивший дальнейшее развитие в работах В. И. Гурмана, М. М. Хрусталева и А. И. Москаленко. Особое внимание обращено на явление анормальности, возникающее при применении классической схемы формирования функции Лагранжа как в конечномерных экстремальных задачах, так и в задачах оптимального управления.В классическом методе Лагранжа для конечномерных задач множители Лагранжа постоянные числа. В этом случае метод полностью сводит задачу на условный экстремум к задаче на безусловный экстремум лишь в частном случае оговоренном в теореме Куна Таккера. Что касается задач оптимального управления, то в вариационном исчислении и в принципе максимума Понтрягина используется функциональный аналог классических постоянных множителей Лагранжа. В принципе максимума Понтрягина это вектор сопряженных переменных. Проблема анормальности здесь присутствует в полном объеме. Приводится пример класса задач оптимального управления, где любой допустимый процесс является анормальной экстремалью Понтрягина. Принцип расширения позволяет использовать множители Лагранжа, представляющие собой функции, зависящие от оптимизируемого вектора в конечномерном случае и от состояния системы в задаче оптимального управления. Используя этот принцип, можно получать условия оптимальности, в которых проблема анормальности не возникает.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Гурман Владимир Иосифович, Хрусталев Михаил Михайлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Abnormality in the Theory of Necessary Optimality Conditions

The problems of existence, non-uniqueness, abnormality of solutions arising from the using of necessary optimality conditions are discussed in terms of the extension principle and sufficient optimality conditions. Simple examples are used.It is shown that these problems are often generated not by the sense of problem, but by the method of solving and these problems can disappear by using another method.The study is based on the extension principle in the abstract extremum problem proposed by V.F. Krotov. This method was further developed in the works of V.I. Gurman, M.M. Khrustalev and A.I. Moskalenko.Particular attention is paid to the phenomenon of abnormality that occurs in the using of the classical scheme of the formation of the Lagrange function in the finite-dimensional extremal problems and in optimal control problems.Lagrange multipliers are constants in the classical Lagrange method for the finite-dimensional problems. In this case, the problem of conditional extremum is completely reduced to the problem of unconditional extremum only in special cases described in the Kuhn-Tucker theorem.With regard to the optimal control problems, functional analog of classical constant Lagrange multipliers is used in the calculus of variations and in the Pontryagin maximum principle. In the Pontryagin maximum principle it is a vector of conjugate variables. The problem of abnormality is presented here in full. An example of a class of optimal control problems, where any permissible process is an abnormal Pontryagin extremal, is considered.The extension principle allows you to use the Lagrange multipliers, which are the functions depended on the optimized vector in the finite-dimensional case, and depended on the system state in the optimal control problem. Using this principle, you can get the optimal conditions where problem of abnormality doesn’t occur.

Текст научной работы на тему «Анормальность в теории необходимых условий оптимальности»

Онлайн-доступ к журналу: http://isu.ru/izvest.ia.

Серия «Математика»

2017. Т. 19. С. 44-61

УДК 517.977.5 MSG 34Н05

DOI https://doi.org/10.26516/1997-7670.2017.19.44 Анормальность в теории необходимых условий оптимальности*

В. И. Гурман

Институт программных систем им. А. К. Айламазяна РАН М. М. Хрустал ев

Институт проблем управления им. В. А. Трапезникова РАН

Аннотация. Известные в теории экстремальных задач проблемы существования, не единственности и анормальности решений, возникающие при применении необходимых условий оптимальности, обсуждаются с позиций принципа, расширения и общих достаточных условий оптимальности с использованием простых примеров. Показывается, что эти проблемы зачастую порождаются не существом задачи, а. применяемым методом решения и могут исчезать при использовании другого метода..

В основе исследования лежит предложенный В. Ф. Кротовым принцип расширения в абстрактной задаче на. экстремум, получивший дальнейшее развитие в работах В. И. Гурмана., М. М. Хрусталева. и А. И. Москаленко. Особое внимание обращено на. явление анормальности, возникающее при применении классической схемы формирования функции Ла.гра.нжа. как в конечномерных экстремальных задачах, так и в задачах оптимального управления.

В классическом методе Ла.гра.нжа. для конечномерных задач множители Ла.гра.нжа. — постоянные числа.. В этом случае метод полностью сводит задачу на. условный экстремум к задаче на. безусловный экстремум лишь в частном случае оговоренном в теореме Куна. - Таккера..

Что касается задач оптимального управления, то в вариационном исчислении и в принципе максимума. Понтрягина. используется функциональный аналог классических постоянных множителей Ла.гра.нжа.. В принципе максимума. Понтрягина. это вектор сопряженных переменных. Проблема, анормальности здесь присутствует в полном объеме. Приводится пример класса, задач оптимального управления, где любой допустимый процесс является анормальной экстремалью Понтрягина..

Принцип расширения позволяет использовать множители Ла.гра.нжа., представляющие собой функции, зависящие от оптимизируемого вектора, в конечномерном

* Работа, выполнена, при финансовой поддержке Российского фонда, фундаментальных исследований (проекты №15-01-01915 А, 15-07-09091 А).

случае и от состояния системы в задаче оптимального управления. Используя этот принцип, можно получать условия оптимальности, в которых проблема анормальности не возникает.

Ключевые слова: условия оптимальности, анормальность, принцип расширения, метод Лагранжа, принцип максимума, штрафные функции.

1. Введение

Несмотря на то что известные классические методы математической теории оптимального управления учитывают особенности современных прикладных задач, их прямое использование, в том числе практическое, сопряжено с рядом проблем принципиального характера. Одна из них — проблема так называемых анормальных экстремальных задач, широко обсуждаемая во множестве публикаций [1; 2; 3; 4; 5; 6; 7; 8; 11; 12; 13; 15], хотя выражаются и сомнения в необходимости построения единой теории таких задач как неестественных и не возникающих на практике. Это обстоятельство послужило мотивом для авторов рассмотреть эти вопросы с позиций теории принципа расширения и общих достаточных условий оптимальности [4; 5; 7; 11; 12; 13], развиваемой научной школой, работы и результаты которой ориентированы на практические приложения.

2. Принцип расширения

Принцип расширения относительно абстрактной задачи на условный экстремум заключается в следующем. Пусть заданы множества М,Д С М и функционал I : М —>■ К (К — множество вещественных чисел).

Ставится задача (О, I) о минимуме функционала 1{т) на множестве И С М. В общем случае нужно найти минимизирующую последовательность {т3} С -О или оптимальный элемент т € -О.

Эта задача заменяется другой задачей (Е, Ь) о минимуме функционала Ь : Е —>■ К, ЙСЁСМ на множестве Е, включающем в себя множество И (расширение), и формулируются правила, позволяющие по решению задачи (Е, Ь) найти решение исходной задачи (И, I) в надежде, что задача (Е,Ь) решается проще задачи (£>,/).

Лемма 1. (В. Ф. Кротов, М. М. Хрусталев) Пусть имеются функционал I : М —>■ К, множество И С М, последовательность {ш3} С -О, функционал Ь : М —>■ К, множество Е С М и число I такие, что:

1) БС Е;

2) Ь(т) < 1{т) (в частности Ь(т) = 1{т)), т € Б;

Рис. 1. Демонстрация свойств объектов леммы 1

3) I < L(m), т Е Е (см. рис. 1). Тогда:

а) справедливо неравенство

I < inf L < mil,

Е D

б) для любого элемента т Е D справедлива оценка

1{т) - inf I < Д (m, I) = 1{т) - I

Если дополнительно к 1)-3) выполнено условие:

4) последовательность {ms} С D такова, что

lim I(rns) = L

s^oo

то справедливо утверждение

в)

I = inf L = inf

Е D

последовательность {ms} — минимизирующая и для любой минимизирующей последовательности {ш*} С D справедливо равенство

lim L(ms) = 1.

s^oo

Демонстрация утверждений леммы 1 представлена на рис. 2.

Следствие 1. Если выполнены условия 1)-3) леммы и найдется элемент т Е Dj такой что 1{т) = I, то т минимизирует I на D и справедливо равенство

I(ffi) = inf I = inf L — I.

D E

Рис. 2. Демонстрация утверждений леммы 1

Позже в работах А. И. Москаленко [10] было дано обобщение принципа расширения, заключающееся в том, что исходной экстремальной задаче ставится в соответствие другая экстремальная задача — задача сравнения, и формулируются условия, позволяющие по решению задачи сравнения найти решение исходной задачи. Корни такого обобщения принципа расширения лежат в работах В. М. Матросова по теории устойчивости [9].

Принцип расширения состоит в замене исходной задачи (/}, /) другой аналогичной задачей (Е, Ь), в каком-то смысле более простой, которая и дает решение исходной задачи. Задачу (Е, V) при условиях 1)-3) леммы 1 будем называть расширением исходной задачи (/}, /) и разрешающим расширением, если выполняются условия 1)-4) этой же леммы.

Утверждение в) леммы означает, что если разрешающее расширение построено для одного решения исходной задачи, то оно является разрешающим и для любых других решений, т. е. позволяет найти все решения исходной задачи.

Конкретизируем задачу (/},/), явно включив в описание множества И операторные равенства, т. е. приведем ее к форме, характерной для многих экстремальных задач и задач оптимального управления.

Пусть задано множество О, С М, оператор д : М С, где С — линейное топологическое пространство. Положим

Б = {т Е М :т е £1,д(т) = 0}, Ь(т) = /(га) + Е(д(т)),

где 5 : С Л, 5(0) =0. Наиболее простая реализация задачи — хорошо известный лагранжиан

Ь(т) = /(га) + \д(т), где А Е С* — элемент сопряженного к С пространства.

Другая реализация задачи, аналог (2) — обобщенный лагранжиан

Ь(т) = 1{т) + Х(т)д(т), (2.1)

где Л : М —> С*. К этому типу относится расширение В. Ф. Кротова применительно к задаче оптимального управления [7] и необходимые и одновременно достаточные условия М. М. Хрусталева [11; 12; 13], обобщающие условия В. Ф. Кротова, о которых пойдет речь в п. 6.

3. Конечномерные задачи и связь с методом множителей

Лагранжа

Под этим названием подразумевается известная задача нелинейного программирования, где

/ : Кп -»• Д,

Б = {х : дг(х) = 0, г = 1,2,... ,р < п,дг(х) < 0, г = р + 1,..., д}.

Применение принципа расширения с обобщенным лагранжианом позволяет получить для нее новые нетрадиционные условия оптимальности [4; 13].

Положим, аналогично (2.1),

Ь = 1{х) + \Т(х)д(х) = 1{х) + А^(ж)#1(ж) + \%{х)д2{х). (3.1)

Здесь

д = {91,92?, А = (А1,А2)Т, д1,\1£Кр, й.^ей", А2 > О

(векторные неравенства понимается как покомпонентные). При этом из принципа расширения непосредственно получается следующее утверждение.

Теорема 1. Пусть имеется последовательность С -О, множество Е С Ка, -О С Е, а также функции А^ж) и Аг(ж) > 0 при х € И, такие что

1{х3) —> Ь* = ш! Ь.

Е

Тогда последовательность — минимизирующая I на И, и

Ь(х3)

на любой (-С,/) — минимизирующей последовательности

Замечание 1. В теореме 1 не накладывается никаких условий на функции А1(ж), Аг(ж) кроме того, что они определены на Е и Аг(ж) > на И. Может случиться (см. примеры 2, 3), что какая-либо компонента

Аг(ж) функции А(ж) не определена в точках ж, в которых дг(х) = 0. Ситуацию можно исправить, доопределив в таких точках произведение \г(х)дг(х) равенством \г(х)дг(х) = 0. В результате лагранжиан (3.1) будет определен во всех точках множества М.

Если принять Е = Кп, то теорема 1 сводит исходную условную конечномерную задачу (£>,/) к безусловной (Е,Ь).

Исходя из других соображений, частный случай лагранжиана вида (3.1) использовался М. Р. Хестенсом [14] в методе, представляющем собой комбинацию классического метода множителей Лагранжа и метода штрафных функций.

Пример 1. Исследуем на минимум функцию I = (ж1)3 + (ж2)2 при условии —(ж1 + 1) < 0. Положим

Ь = (ж1)3 + (ж2)2 - А (ж) (ж1 + 1), А = (ж1)2 - ^ж1 + | > 0.

Тогда Ь(ж) имеет минимум в точке ж* = (—1, 0), которая удовлетворяет условию (ж1 + 1) =0. Поэтому в данной точке Ь(ж*) = /(ж*), т. е. согласно теореме 1 — это абсолютный минимум I при условии ж1 + 1 > 0, что проверяется и непосредственно.

Пусть выполнены условия теоремы 1 и существует точка минимума ж* функции /(ж) на И, так что

/(ж*) = Ь(х*) = Ь*. (3.2)

Будем предполагать, что все функции участвующие в теореме 1 непрерывны и дифференцируемы в точке ж* и множество Е С Кп открыто. Рассмотрим необходимые условия первого порядка минимума Ь на Е: Ьх( ж*) = 0. Имеем

Ьх = 1Х + Хх

9 + А дх.

Покажем, что при ж = ж*

А] '/ £ К<Г • Е К9г = 0. (3.3)

г=1 г=р+1

В самом деле, первая группа слагаемых в левой части (3.3) исчезает, поскольку <?1 (ж*) = 0. Для любого слагаемого второй группы (г > р + 1) имеются две возможности: либо дг(ж*) = 0, тогда соответствующее слагаемое равно нулю, либо дг < 0. В этом случае Аг(ж*) = 0, иначе Ь{ж*) < /(ж*), что противоречит (3.2). Так как \г > 0, а Аг(ж*) = 0, то ж* — точка минимума Аг(ж). Поэтому А^.(ж*) = 0, и соответствующее слагаемое обращается в нуль в этом случае.

Таким образом, рассматриваемое условие первого порядка сводится к условию существования векторных констант = А^ж*), ¡л,2 = Аг(ж*), таких что в точке ж*

Эти условия первого порядка (3.4), (3.5) совпадают в регулярном случае с хорошо известными условиями метода множителей Лагранжа. Напомним основное утверждение этого метода (правило множителей Лагранжа) для рассматриваемой здесь задачи в предположении, что функции /(ж), д(х) — непрерывные и гладкие.

Пусть ж* — точка локального минимума в рассматриваемой задаче. Тогда найдутся вектор /л = (/^1, ¡Л2, • • •, > № > 0, г = р + 1,..., д и число /ХО) не равные одновременно нулю и такие, что в этой точке

В регулярном случае Цо ф 0 и можно положить цо = 1, что дает условие (3.4). Условие (3.5) здесь также выполняется. Нерегулярный случай цо = 0 соответствует в определенном смысле некорректно поставленной задаче, хотя он и охватывается правилом множителей Лагранжа как необходимым условием минимума.

С точки зрения принципа расширения обычный функционал Лагранжа представляет класс расширений, зависящий от постоянных параметров — неопределенных множителей Лагранжа, в то время как в нашем случае рассматривается более богатый класс, зависящий от функциональных параметров Аг(ж).

В линейных и выпуклых задачах, при выполнении некоторых условий регулярности ограничений, условия первого порядка являются достаточными, поскольку здесь можно ограничиться расширением с обычной функцией Лагранжа, которая оказывается выпуклой и заведомо достигает минимума в точке стационарности, определенной условиями (3.4), (3.5), вытекающими из теоремы 1. О достаточности говорит и известная теорема Куна - Таккера для такого класса задач. В общем случае эта теорема не верна, и это также говорит о том, что правило множителей не является в общем случае достаточным условием минимума.

Мы упомянули о нерегулярных случаях. В этих случаях правило множителей Лагранжа (в котором фигурирует дополнительный неопределенный множитель цо перед минимизируемой функцией в выражении лагранжиана L = + /лтд) выполняется некоторым тривиальным образом при /хо = 0 и не несет на самом деле необходимой информации о решении задачи, а рассматриваемые достаточные условия не выполняются. Для преодоления этой трудности можно пытаться искать набор множителей А(ж) в более широком классе, чем константы.

ix + i~iTgx = ix + t-ijgix + /Дд2х = о $92 = 0.

(3.4)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(3.5)

ц-oix + i~iTgx = о.

Пример 2. Рассмотрим ту же задачу что и в примере 1, но с другим описанием того же самого множества И:

1 = (ж1)3 + (ж2)2, О = {ж : -(ж1 + I)3 < 0}.

Очевидно, данное неравенство выполняется и не выполняется вместе с неравенством —(ж1 + 1) <0. Обычная функция Лагранжа и правило множителей выглядят следующим образом:

Ь = ¡10 ((ж1)3 + (ж2)2) - ж1 + I)3, 1ю,11 > 0,

Ьх 1 = /хоЗ(ж1)2 — 3/х(ж1 + I)2 = 0, Ьх 2 = Цо2х2 = 0.

В точке минимума (-1, 0) эти равенства выполняются только при /хо = 0; при этом они выполняются на всей прямой ж1 = —1. Таким образом, необходимое условие вместе с единственной искомой точкой выделяет целый континуум подозрительных. Условия теоремы 1 не выполняются, так как цо = 0.

Рассмотрим обобщенный лагранжиан (3.1) и положим

А(ж) = (ж1 + 1)~2 ((ж1)2 " + £) > 0.

В итоге получим функцию Ь из примера 2, и задача, таким образом, разрешается.

Строго говоря, функция А (ж) не определена при ж1 = —1, однако, учитывая замечание 1 к лемме 1, произведение

А(жЖж) = (ж1 + I)"2 ((ж1)2 - ^ + ^ (ж1 + I)3

можно доопределить при ж1 = — 1 равенством

А(жЖж) = ((ж1)2 - ¡х1 + £) (^ + 1).

В результате лагранжиан (3.1) определен при всех ж.

После такого сопоставления уместно привести высказывание Лагранжа, относящееся к 1797 г.: «Можно высказать следующий общий принцип. Если ищется максимум или минимум некоторой функции многих переменных при условии, что между этими переменными имеется связь, задаваемая одним или несколькими уравнениями, нужно прибавить к минимизируемой функции задающие уравнения связи умноженные на неопределенные множители и искать затем максимум или минимум построенной суммы, как если бы переменные были независимы. Полученные уравнения, присоединенные к уравнениям связи, послужат для определения всех неизвестных».

Как видим, несмотря на то что метод множителей Лагранжа сыграл и продолжает играть исключительно важную роль в классических и современных теориях экстремума, он не вполне реализует замысел создателя, выраженный словами «искать минимум построенной суммы», поскольку этого минимума может вообще не быть или он будет достигаться не там, где искомый. Однако если в слова «неопределенные множители» вложить новый смысл, а именно считать эти множители не константами, а неопределенными функциями, т. е. рассматривать конструкцию (3.1), то тогда мы окажемся, по-видимому, гораздо ближе к намеченной цели — полной замены условной задачи некоторой безусловной, как показывают примеры и выведенные выше условия, которые вовлекают в исследование гораздо больше вспомогательных переменных, чем классический метод Лагранжа.

4. Использование последовательности расширений в абстрактной задаче

Строится не одно расширение исходной задачи, а последовательность расширений.

Пусть задан некоторый класс Ве расширений (Е,Ь), включающий расширение (М,Ь). Строится последовательность расширений

{(Ек, Ьк)}

(в частности {(Е, Ьк)}), каждому из которых соответствует последовательность оценок А(т, 1к) = 1{т) — 1к.

Последовательность расширений {(Ек,Ьк)} и последовательность {тк} С D строятся так, что

lim Afc = 0.

к—>оо

Здесь Afc = 1{тк) - 1к.

Тогда очевидно, что последовательность {тк} будет минимизирующей.

5. Использование метода штрафных функций в конечномерной задаче на экстремум

Еще один простой метод уйти от проблемы анормальности в задачах на условный экстремум — это применение хорошо известного метода штрафных функций. Этот метод также можно трактовать с точки зрения принципа расширения, используя последовательность расширений (■E,Lk).

В задаче на условный экстремум, поставленной в разд. 3, функционал Ьк, используя стандартную процедуру метода штрафных функций, выбирается в виде

Lk = 1(х) + 7к где & > 0, & = 1, Ъ > О,

Е шю)2+ Е шш

г=1 i=p+1

(5.1)

пЧгА - S9i^ У 0 9 ^ ' \ 0 дг{х) < О,

а Е = Кп. Последовательность {7^} С R выбирается так, что

lim 7к = +оо

к—>оо

и строится последовательность решений {хк} С Е задач (E,Lk) или их достаточно точных аппроксимаций.

При некоторых предположениях последовательность {хк} сходится к решению х € D задачи (D, /), т. е.

lim Хк = х. (5.2)

к—>оо

Полагается lk = L(xk), А к = 1{х) — 1к и тогда

lim А к = О,

к—>оо

1{х) = inf I = lim lk-

D fc—)• 00

Упомянутые выше предположения, например, следующие: функции 1{х), дг(х), i = l,q, непрерывно дифференцируемы на Rn и множество D — компакт.

В этом методе проблема анормальности не возникает.

Пример 3. Исследуем на минимум функцию

1{х\х2) =х1 + ^(х2)2

при условии д(х1,х2) = (ж1 — ж2)2 = 0. 1) Обычный лагранжиан.

Обычный лагранжиан имеет вид

L = (V + ^^+A1 (ж1-ж2)2.

Условия экстремума Ь задаются равенствами

^-=Х° + 2\1(Х1-Х2) = 0, ох1

= Х°Х2-2Х1(Х1-Х2) = 0.

дхг

Так как должно выполняться условие д(х1,х2) = 0, то х1 = х2 и тогда из (3) следует, что А0 = 0, а А1 любое число не равное нулю. В результате необходимым условиям удовлетворяет любая точка (ж1, ж2), такая, что ж1 = ж2, т. е. любая точка, удовлетворяющая ограничению ¿»(ж1, ж2) = 0.

2) Обобщенный лагранжиан.

Положим А0 = 1 и образуем обобщенный лагранжиан Ь = ж1 + ^(ж2)2 + А(ж1, ж2)(ж: - ж2)2. Учитывая, как и в примере 2, замечание 1 к лемме 1, положим

А(ж:, ж2) = —

Тогда

г£> 1 _ 0С^'

Ь = ж1 + ^(ж2)2 - ж1 + ж2 = ^(ж2)2 + ж2.

Минимум лагранжиана Ь достигается в точке ж2 = —1. Из ограничения ¿»(ж1, ж2) = 0 находим ж1 = —1. В результате получаем

/(-1, -1) = Ц-1, -1) =Ы1 = ЫЬ = --.

3) Метод штрафных функций.

Функция (5.1) будет иметь вид

Ьк{ж1, ж2) = ж1 + ^(ж2)2 + -^{х1 - ж2)4, цк > 0.

Необходимые условия экстремума функции Ь{ж1, ж2) на Е = В2 задаются равенствами

Ц = 1 + ^Кж1 - ж2)3 = 0,

д!^ 2 3/ 1 2\3 г\

_ — ОС ОС ) — .

о хг

В результате получаем оптимальную точку хк = (х\,х\) в задаче (К2,Ьк) ^

ОС ^ — 1 , ^/с — *

При ¡лк —> +оо в соответствии с (5.2) получаем допустимую оптимальную точку ж = (—1, —1) € -О в исходной задаче. Здесь

1 ./-л 13 1 . 3 1

2 2 4 Цк 4 Цк

Очевидно, что А к —> 0 при Цк —> +оо.

Нетрудно видеть, что в методах 2), 3) в отличие от 1) проблема анормальности не возникает. Это еще раз подтверждает мысль, что анормальность это не «дефект» задачи, а «дефект» метода.

6. Задача оптимального управления

Рассмотрим следующую задачу оптимального управления. Задача 1.

— = /(£,ж,и), ¿€[¿0,^1],

йх

ж = (жь ..., хп) € Ка, и = («1,..., ит) € Кп

ж(£0)=ж0, ж(^)=ж1, (6.2)

и(г) едсЛт,д- компакт, (6.3)

I = ! (6.4)

¿0

¿0,^1,Ж0,Ж1,(5,/,/о - заданы, (6.5)

д/ д/° _

/> /о, т—, тт—, г = 1 ,п- непрерывны на [¿0,¿1] х Д™ х <3. (6.6)

ОХг ОХг

Управление измеримая, ограниченная на [¿0,^1] функция, ж(£) — абсолютно непрерывная функция. Дифференциальное уравнение (6.1) выполняется почти всюду.

Теорема 2. (принцип максимума Л. С. Понтрягина) Для того чтобы допустимый процесс (х( ),и( )) задачи 1 был оптимален, необходимо существование абсолютно непрерывной вектор-функции

г -»• = ■ ■ ■ х

и числа фо, таких что:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Фо < О,

2. ф(Ь) и фо не обращаются в ноль одновременно,

3.

йФ-Ш д _

= ЛШМЪМ*)), г = 1,п,

4-

H(ipo,t,ip(t),x(t),u(t)) = m&nH(ipo,t,ip(t),x(t),u).

u£Q

Здесь

п

H(ipo,t,ip(t),x,u) = 5>/»(t,®,u) +ipof°(t,x,u).

г=1

Задача 2. Отличается от задачи 1 наличием ограничения

g(t,x(t))< 0, íg[í0,íi]. (6.7)

Функция (t,x) —)• g(t,x) : [íojíi] х —> ií1 и ее производные -£^g(t,x), г = 1,... ,п, непрерывны на [¿о,¿i] х Rn-

Задача 2 — это задача с ограничением на состояние, необходимые условия для такой задачи — это условия Дубовицкого-Милютина [8]. Хорошо известно, что это очень сложные условия, содержащие меру Стильтьеса. Заметим, что эти условия — это гениальный результат в теории оптимального управления. В связи со сложностью условий Дубовицкого-Милютина возникает идея их обойти как-то преобразовав задачу. Оказывается, что можно избавиться от ограничения (6.7) и сформулировать задачу 3, эквивалентную задаче 2, но имеющую вид задачи 1.

Задача 3. Все условия (6.1)—(6.6) задачи 1 имеют место быть, но добавляется еще одно дифференциальное уравнение

^ = h(t,x), yeR1 (6.8)

с граничными условиями

y(to) = о, y(t i) = 0, (6.9)

где

h( . _ jg2(t,x) g(t,x) > О n[t,x) ~ \ 0 g(t,x)<0.

Функция h(t, х) непрерывна и непрерывно дифференцируема по х на [ío, íi] х Rn и поэтому к задаче 3, которая имеет вид задачи 1, применим принцип максимума Понтрягина (теорема 2).

Нетрудно видеть, что задача 3 эквивалентна задаче 2, т. е. каждому допустимому процессу (ж(-),и(-)) задачи 2 и значению критерия на нем 1(х( ),и( )) соответствует один и только один процесс (х( ),у( ),и( )) в задаче 3 и значение критерия (6.4) в задаче 3 совпадает с его значением в задаче 2. При этом y(t) = 0, t € [ío, íi] •

Применим к задаче 3 принцип максимума Понтрягина — теорему 2.

В связи с появлением дополнительного уравнения (6.2) для сопряженной переменной будем использовать обозначение

от), w)) = е Rn+1-

Теорема 3. (М. М. Хрусталев) Любой допустимый процесс (х(•), У(-),и(-)) задачи 3 является анормальной экстремалью Понтрягина (удовлетворяет теореме 2). При этом

ipx(t) = 0, ipy(t) = 7, ^о = О,

где 7 = const ф 0.

Лемма 2. Для любого допустимого процесса (х(),у(),и()) задачи 3 при всех t € [iojii] справедливы равенства

y(t) = о,

д _

——h(t,x(t)) = 0, i = l,п.

dXi

Доказательство. (доказательство леммы 2) Очевидно, что h(t, x(t)) > 0,t£[to,h].

Если хотя бы в одной точке, t* € (to,t\) имеет место неравенство h(t*,x(t*)) > 0, то в силу непрерывности функций h(t,x) и x(t) это неравенство сохранится на некотором интервале (а, (3) С [to,ii] и тогда в силу уравнения (6.8) при выполнении условия у (to) = 0 будет y(t\) > 0, т. е. не выполняется условие y(t\) = 0. Поэтому

h(t,x(t))= 0, t£[t0,ti}. (6.10)

Из этого, в частности, вытекает выполнение ограничения (6.7) для любого допустимого процесса задачи 3 и, как следствие, эквивалентность задач 2 и 3.

А тогда, из (6.8), (6.9), (6.10) следует, что

y(t) = 0, ie[i0,ii].

Так как

^h(tx) = 9(t,x)>0

\ о g(t,x)< o,

и, как установлено выше, выполнено ограничение (6.7), то -^h(t,x(t))= 0, t € [i0,ii]-

Доказательство, (доказательство теоремы 3) Пусть (х(),у(),и()) — допустимый процесс задачи 3. Запишем функцию Н для задачи 3:

п 3=п

Положим фо = 0 (анормальное решение) и запишем сопряженную систему

di

dm)

у miKh {L-miun{hX{4), (6.П)

at ^ J oxi oxi

]=n

it a (6Л2)

Так как в силу леммы справедливо равенство (2), то решением уравнений (6.11), (6.12) при всех t € [iojii] являются функции

ipf(t)= 0, г = Т~п,

ipx(t) =7 = const ф 0.

Условие максимума функции Н (условие 4 теоремы 2) также выполняется, так как

H(ip0,t,r(t),r(t),x(t),y(t),u) = o при всех и € Q. □

Если вместо перехода от задачи 2 к задаче 3 применить метод штрафных функций, заменив функционал (6.4) функционалом

ч

h = J [f°(t, х, и) + fxkh(t, х)] dt,

to

¡ik = const > 0, содержащим штраф за невыполнение ограничения (6.7) и увеличивать /х^, как в разд. 5, то проблема анормальности пропадает.

Другой способ избавиться от проблемы анормальности — использовать необходимые и одновременно достаточные условия глобальной оптимальности М. М. Хрусталева [11; 12], обобщающие условия В. Ф. Кротова, основанные на принципе расширения. В этих условиях проблема анормальности также не возникает и полностью реализуется идея Лагранжа.

Именно в работе [11; 12] впервые и была кратко рассмотрена задача 3 и показано, что к ней применимы предлагаемые в [11; 12] условия глобальной оптимальности.

7. Заключение

Анормальность — свойство не задачи, а метода, в частности конкретной конструкции лагранжиана, как в необходимых условиях оптимальности типа Лагранжа-Понтрягпна. Обобщенный Лагранжиан, априори недоопределенный, дает возможность регуляризовать ситуацию путем его доопределения. Примеры 2, 3 указывают на такую возможность. Если учесть, что серьезные прикладные задачи решаются не с помощью условий оптимальности, а приближенными методами, например, методом штрафных функций, то проблем анормальности здесь также не возникает.

Список литературы

1. Алексеев В. М. Оптимальное управление / В. М. Алексеев, В. М. Тихомиров, С. В. Фомин. - М. : Наука, 1979.

2. Арутюнов А. В. Условия экстремума. Анормальные и вырожденные задачи /

A. В. Арутюно. - М. : Факториал, 1997.

3. Блисс Г. А. Лекция по вариационному исчислению / Г. А. Блисс. - М. : ИЛ, 1950.

4. Гурман В. И. Принцип расширения в задачах управления / В. И. Гурман. -М. : Физматлит, 1985, 1997.

5. Гурман В. И. Вырожденные задачи оптимального управления. I / В. И. Гурман, Ни Минь Кань // Автоматика и телемеханика. - 2011. - № 3. -С. 36-50.

6. Иоффе А. Д. Теория экстремальных задач / А. Д. Иоффе, В. М. Тихомиров. -М. : Наука, 1974.

7. Кротов В. Ф. Методы и задачи оптимального управления / В. Ф. Кротов,

B. И. Гурман. - М. : Наука, 1973.

8. Левитин Е. С. Условия высших порядков локального минимума в задачах с ограничениями / Е. С. Левитин, А. А. Милютин, Н. П. Осмоловский // УМН. -1978. - Т. 33, вып. 6. - С. 85-148.

9. Матросов В. М. Метод сравнения в математической теории систем / В. М. Матросов, Л. Ю. Анапольский, С. Н. Васильев. - Новосибирск : Наука, 1980.

10. Москаленко А. И. Методы нелинейных отображений в оптимальном управлении / А. И. Москаленко. - Новосибирск : Наука, 1983.

11. Хрусталев М. М. Точное описание множеств достижимости и условия глобальной оптимальности динамических систем. Ч. 1. Оценки и точное описание множеств достижимости и управляемости / М. М. Хрусталев // Автоматика и телемеханика. - 1988. - № 5. - С. 62-70.

12. Хрусталев М. М. Точное описание множеств достижимости и условия глобальной оптимальности динамических систем. Ч. 2. Условия глобальной оптимальности / М. М. Хрусталев // Автоматика и телемеханика. - 1988. -№ 7. - С. 70-80.

13. Хрусталев М. М. О достаточных условиях оптимальности в задачах с ограничениями на фазовые координаты / М. М. Хрусталев // Автоматика и телемеханика. - 1967. - № 4. - С. 18-29.

14. Hestenes M.R. Conjugate Direction Methods in Optimization / M. R. Hestenes. -N. Y. : Springer-Verlag, 1980.

15. Montgomery R. Abnormal Minimizers / R. Montgomery // SIAM J. Control and Optimiz. - 1994. - Vol. 32, N 6. - P. 1605-1620.

Гурман Владимир Иосифович, доктор технических наук, профессор, Институт программных систем им. А. К. Айламазяна РАН, 152021, г. Переславль-Залесский, ул. Петра Первого, д. 4а, (e-mail: [email protected])

Хрусталев Михаил Михайлович, доктор физико-математических наук, профессор, Институт проблем управления им. В. А. Трапезникова РАН, 117997, г. Москва, ул. Профсоюзная, д. 65, (e-mail: [email protected])

V. I. Gurman, M. M. Khrustalev

Abnormality in the Theory of Necessary Optimality Conditions

Abstract. The problems of existence, non-uniqueness, abnormality of solutions arising from the using of necessary optimality conditions are discussed in terms of the extension principle and sufficient optimality conditions. Simple examples are used.

It is shown that these problems are often generated not by the sense of problem, but by the method of solving and these problems can disappear by using another method.

The study is based on the extension principle in the abstract extremum problem proposed by V.F. Krotov. This method was further developed in the works of V.I. Gurman, M.M. Khrustalev and A.I. Moskalenko.

Particular attention is paid to the phenomenon of abnormality that occurs in the using of the classical scheme of the formation of the Lagrange function in the finite-dimensional extremal problems and in optimal control problems.

Lagrange multipliers are constants in the classical Lagrange method for the finite-dimensional problems. In this case, the problem of conditional extremum is completely reduced to the problem of unconditional extremum only in special cases described in the Kuhn-Tucker theorem.

With regard to the optimal control problems, functional analog of classical constant Lagrange multipliers is used in the calculus of variations and in the Pontryagin maximum principle. In the Pontryagin maximum principle it is a vector of conjugate variables. The problem of abnormality is presented here in full. An example of a class of optimal control problems, where any permissible process is an abnormal Pontryagin extremal, is considered.

The extension principle allows you to use the Lagrange multipliers, which are the functions depended on the optimized vector in the finite-dimensional case, and depended on the system state in the optimal control problem. Using this principle, you can get the optimal conditions where problem of abnormality doesn't occur.

Keywords: optimality conditions, abnormality, extension principle, method of Lagrange, maximum principle, penalty functions.

References

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Alekseev V.M., Tikhomirov V.M., Fomin S.V. Optimal'noe upravlenie [Optimal Control], Moscow, Nauka, 1979.

2. Arutyunov A.V. Uslovija jekstremuma. Anormal'nye i vyrozhdennye zadachi [Extremum Conditions. Anormal and Degenerate Problems]. Moscow, Faktorial, 1997.

3. Bliss G.A. Lekcija po variacionnomu ischisleniju [Lecture on Variational Calculus]. Moscow, IL, 1950.

4. Gurman V.l. Princip rasshirenija v zadachah upravlenija [The Extension Principle in Control Problems]. Moscow, Fizmatlit, 1985, 1997.

5. Gurman V.l., Kang N.M. Degenerate Problems of Optimal Control. I. Automation and Remote Control, 2011, vol. 72, no 3, pp. 497-511. https://doi.org/10.1134/S0005117911030039

6. Ioffe A.D., Tikhomirov V.M. Teorija jekstremal'nyh zadach [The Extremal Problems Theory]. Moscow, Nauka, 1974.

7. Krotov V.F., Gurman V.l. Metody i zadachi optimal'nogo upravleniya [Methods and Problems of Optimal Control]. Moscow, Nauka, 1973.

8. Levitin E.S., Milyutin A.A., Osmolovskii N.P. High Order Conditions for Local Minimum in Problems with Constraints (in Russian). UMN, 1978, vol. 33, no 6, pp. 85-148. https://doi.org/10.1070/RM1978v033n06ABEH003885

9. Matrosov V.M., Anapol'skii L. Yu., Vasil'ev S.N. Metod sravnenija v matematicheskoj teorii sistem [Comparison Method in Mathematical Theory of Systems]. Novosibirsk, Nauka, 1980.

10. Moskalenko A.I. Metody nelinejnyh otobrazhenij v optimal'nom upravlenii [Nonlinear Mappings Methods in Optimal Control]. Novosibirsk, Nauka, 1983.

11. Khrustalev M.M. Exact Description of Reachability Sets and Global Optimality Conditions for Dynamic Systems. P. 1. Estimates and Exact Description of Reachability and Controllability Sets Optimality Conditions. Avtomatika i Telemekhanika, 1988, no 5, pp. 62-70.(in Russian)

12. Khrustalev M.M. Exact Description of Reachability Sets and Global Optimality Conditions for Dynamic Systems. P. 2. Global Optimality Conditions. Avtomatika i Telemekhanika, 1988, no. 7, pp. 70-80. (in Russian)

13. Khrustalev M.M. On Sufficient Optimality Conditions for Problems with State Constraints. Avtomatika i Telemekhanika, 1967, no 4, pp. 18-29. (in Russian).

14. Hestenes M.R. Conjugate Direction Methods in Optimization. New York, SpringerVerlag, 1980. https://doi.org/10.1007/978-l-4612-6048-6

15. Montgomery R. Abnormal Minimizers. SI AM J. Control and Optimiz., 1994, vol. 32, no 6, pp. 1605-1620. https://doi.org/10.1137/S0363012993244945

Gurman Vladimir Iosifovich, Doctor of Sciences (Technical Sciences), Professor, Ailamazyan Program Systems Institute RAS, 4a, Peter I st., Pereslavl-Zalessky, 152021, (e-mail: [email protected])

Khrustalev Mikhail Mikhailovich, Doctor of Sciences (Physics and Mathematics), Professor, Trapeznikov Institute of Control Sciences RAS, 65, Profsoyuznaya st., Moscow, 117997, (e-mail: [email protected])

i Надоели баннеры? Вы всегда можете отключить рекламу.