Научная статья на тему 'Монотонные функции типа Ляпунова и условия глобальной оптимальности для задач управления дискретными системами'

Монотонные функции типа Ляпунова и условия глобальной оптимальности для задач управления дискретными системами Текст научной статьи по специальности «Математика»

CC BY
119
25
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИСКРЕТНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ / МОНОТОННЫЕ ФУНКЦИИ ТИПА ЛЯПУНОВА / ВНЕШНИЕ ОЦЕНКИ МНОЖЕСТВ ДОСТИЖИМОСТИ / ДОСТАТОЧНЫЕ И НЕОБХОДИМЫЕ УСЛОВИЯ ГЛОБАЛЬНОЙ ОПТИМАЛЬНОСТИ / ДИСКРЕТНЫЙ ПРИНЦИП МАКСИМУМА / DISCRETE DYNAMICAL SYSTEMS / MONOTONE LYAPUNOV TYPE FUNCTIONS / INNER ESTIMATES TO REACHABLE SETS / SUFFICIENT AND NECESSARY GLOBAL OPTIMALITY CONDITIONS / DISCRETE MAXIMUM PRINCIPLE

Аннотация научной статьи по математике, автор научной работы — Сорокин Степан Павлович

Для задач дискретного оптимального управления получены достаточные и необходимые условия глобальной оптимальности, основанные на применении сильно и слабо монотонных функций типа Ляпунова, не убывающих вдоль всех или вдоль некоторых траекторий дискретной динамической системы соответственно. Установлено, что предлагаемые достаточные условия являются более тонкими, нежели известные условия Кротова. С применением линейных верифицирующих функций получено обращение дискретного принципа максимума в достаточное условие глобальной оптимальности.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Monotone Lyapunov type functions and global optimality conditions for discrete control problems

Sufficient and necessary global optimality conditions for discrete optimal control problems are proposed. These conditions are based on applying of strongly and weakly monotone Lyapunov type functions that do not decrease along any or some trajectories of discrete dynamical systems under consideration. Proposed sufficient conditions are more general than well-known Krotov conditions. There are obtained conditions that converse the discrete maximum principle into sufficient optimality condition.

Текст научной работы на тему «Монотонные функции типа Ляпунова и условия глобальной оптимальности для задач управления дискретными системами»

Серия «Математика»

2011. Т. 4, № 3. С. 132-145

Онлайн-доступ к журналу: http://isu.ru/izvestia

УДК 517.977.5

Монотонные функции типа Ляпунова и условия глобальной оптимальности для задач управления дискретными системами *

С. П. Сорокин

Учреждение Российской академии наук

Институт динамики систем и теории управления Сибирского отделения РАН

Аннотация. Для задач дискретного оптимального управления получены достаточные и необходимые условия глобальной оптимальности, основанные на применении сильно и слабо монотонных функций типа Ляпунова, не убывающих вдоль всех или вдоль некоторых траекторий дискретной динамической системы соответственно. Установлено, что предлагаемые достаточные условия являются более тонкими, нежели известные условия Кротова. С применением линейных верифицирующих функций получено обращение дискретного принципа максимума в достаточное условие глобальной оптимальности.

Ключевые слова: дискретные динамические системы; монотонные функции типа Ляпунова; внешние оценки множеств достижимости; достаточные и необходимые условия глобальной оптимальности; дискретный принцип максимума.

В теории управления непрерывными динамическими системами широкое применение находят вспомогательные функции типа Ляпунова, монотонные вдоль траекторий исследуемой системы и удовлетворяющие соответствующим неравенствам Гамильтона-Якоби [19]. Выделяют два класса таких функций (кратко называемых ¿-функциями): сильно и слабо монотонные. Первые монотонны вдоль всех траекторий системы (как функции Кротова и Беллмана [12, 17, 6, 19, 13, 18, 5]), а вторые — вдоль некоторых. В [8, 9, 16, 10, 11] получены и исследованы так называемые канонические условия глобальной оптимальности (как достаточные, так и необходимые), оперирующие множествами решений

1. Введение

* Работа выполнена при финансовой поддержке СО РАН (интеграционный проект СО РАН-УрО РАН № 85) и РФФИ (грант № 11-01-00672-а).

неравенств Гамильтона-Якоби для сильно монотонных L-функций. В [8, 1] этот подход использован для обращения принципа максимума Понтрягина в достаточное условие оптимальности. Слабо монотонные функции в большей степени приспособлены для получения необходимых условий оптимальности, построения приближенного оптимального синтеза [15] и процедур улучшения управления [9].

В данной статье канонические условия оптимальности распространяются на задачи управления дискретными системами [14, 3, 7, 4, 2, 17, 6, 13, 18, 5]. Введены соответствующие классы сильно и слабо монотонных функций, установлены необходимые и достаточные критерии сильной и слабой монотонности. С помощью семейств сильно монотонных L-функций получены достаточные условия глобальной оптимальности, более гибкие, нежели идейно родственные условия оптимальности В. Ф. Кротова [12, 17]. С применением сильно монотонных функций, линейных по фазовым переменным и построенных с помощью решений сопряженной системы, получено обращение дискретного принципа максимума [14, 3, 7, 18] в достаточное условие глобальной оптимальности, не требующее условия выпуклости вектограммы управляемой системы. В завершении статьи приводятся необходимые условия глобальной оптимальности, основанные на применении семейств слабо монотонных функций. На базе этих условий могут быть получены схемы улучшения управления, аналогичные непрерывным задачам динамической оптимизации [9].

2. Сильно и слабо монотонные L-функции

Рассматривается дискретная управляемая динамическая система (S):

x(k + 1) = f (k,x(k),u(k)), u(k) G Uk, k = 0,N — 1, (2.1)

где N — заданное натуральное число, функция f конечна на {0,...,N — 1}х Rn х Rm, множества Uk С Rm непусты, dim x(k) = n, dim u(k) = m.

Обозначим через к = {x(k)}N=0 и v = {u^)}^-)1 траекторию и соответствующее управление системы (S), т. е. конечные последовательности, удовлетворяющие системе (2.1) и интерпретируемые как составные векторы. Пару таких последовательностей а = (к, v) назовем процессом системы (S).

Через к|м, v|M-1 и = (к|м,v|M-1) (0 < s < M < N) обозначим подпоследовательности к, v и а, называемые отрезками траектории, управления и процесса системы (S). Введем множество TsM (£), состоящее из всех отрезков траекторий к|м системы (S), удовлетворяющих начальному условию x(s) = {.

Определение 1. Функцию ip(k, x) : {0,...,N} х Rn ^ R назовем

a) сильно возрастающей относительно системы (S), если

(v (s, £) G {0, ...,N — 1} х R”) (V к^ G TSN(£)) p(k + 1, x(k + 1)) > p(k, x(k)), k = s, N — 1;

b) слабо убывающей относительно системы (S), если

(V (s, О G {0, ...,N — 1} х R”) (3 к|^ G TSN(£)) : p(k + 1, x(k + 1)) < p(k, x(k)), k = s, N — 1.

Множества всех функций p, удовлетворяющих условиям a) и b), обозначим через Ф+ и Ф_ соответственно.

Дадим критерии проверки сильной и слабой монотонности функций

p.

Лемма 1. p G Ф+ тогда и только тогда, когда выполнено неравенство inf p(k + 1,f(k,x,u)) — p(k,x) > 0 Vx G R”, k = 0,N — 1. (2.2)

uEUk

Доказательство. Достаточность очевидна, необходимость докажем от противного. Пусть для некоторых (s,£) G {0,...,N — 1} х R”

inf p(s + 1, f (s £ u)) — p(s £) < °.

ueUs

Тогда существует u* G Us: p(s + 1,f(s,£,u*)) — p(s,£) < 0 и из точки £ можно выпустить отрезок траектории к|^ G TN(£) такой, что x(s + 1) = f(s,£,u*), существование которого противоречит включению p G Ф+. □

Лемма 2. Для включения p G Ф_ необходимо выполнения неравенства

inf p(k + 1,f(k,x,u)) — p(k,x) < 0 Vx G R”, k = 0,N — 1. (2.3)

uEUk

Если суперпозиция p(k + 1, f (k, x, u)) непрерывна по u G Uk при всех x G R”, k = 0,N — 1, и все множества Uk компактны, то неравенство (2.3) также достаточно для включения p G Ф_.

Доказательство. Необходимость очевидно вытекает из определения 1, докажем достаточность. Выберем произвольные (s, £) G {0, ...,N — 1} х R”. Из сделанных предположений следует, что при каждом k G {s,...,N — 1} и x G R” инфимум в (2.3) достигается на некотором u = u*(k,x) G Uk. Выпустим из (s,£) отрезок траектории к|^ с управлением v|N-1, в котором каждый вектор u(k) = u*(k,x(k)). Тогда, очевидно, что функция p не возрастает вдоль к|^ ив силу произвольности выбора (s, £) является слабо убывающей, т. е. выполняется включение p G Ф_. □

Неравенства (2.2) и (2.3) — это дискретные аналоги неравенств Гамильтона-Якоби для непрерывных управляемых динамических систем [19, 9, 16], решения которых обладают аналогичными свойствами сильной и слабой монотонности. Решения уравнения Гамильтона-Якоби, соответствующего равенству в (2.2), сильно возрастают и слабо убывают одновременно и в определенном смысле являются «идеальными», однако их нахождение сложнее поиска решений неравенств.

Для некоторых задач управления выполнение свойств сильной и слабой монотонности достаточно требовать лишь вдоль некоторых траекторий, проходящих по заданному множеству X = Хо хХ1 х- ■ ■ хХ^ (в предположении, что допустимые по X траектории существуют). Такие ¿-функции назовем монотонными (сильно или слабо) на множестве X; для них выполнение неравенств (2.2) и (2.3) требуется лишь при х € Хк, к = 0, N — 1. Сильно и слабо монотонные ¿-функции на множестве X обозначим через Ф+^) и Ф-^) соответственно.

3. Сильно монотонные ¿-функции: внешние оценки множества соединимых точек и достаточные условия

оптимальности

Рассмотрим следующую задачу дискретного оптимального управления (Р) с общим концевым ограничением на траекторию и целевой функцией, зависящей от концов траектории:

x(k + 1) = f (k,x(k),u(k)), u(k) є Uk, k = 0,N — 1,

q :=(x(0),x(N)) є Q, (3.1)

J(a) = l(q) ^ min.

Сохраним предположения предыдущего пункта на входные данные задачи, и кроме того множество Q С R2n будем считать замкнутым, а функцию l : R2n ^ R — непрерывной.

Процесс а = aN назовем допустимым в задаче (P), если для него выполняется включение (3.1). Для простоты задачу (P) будем рассматривать на минимум (а не на инфимум) и через а обозначать исследуемый на глобальную оптимальность допустимый процесс с концевым вектором q = (x(0),X(N)).

Введем множество

R = {({о,6) Є R2n | 3к є TN(£о) : x(N) = 6},

которое назовем множеством соединимых точек системы (S). Очевидно, что теоретически задача (P) эквивалентна задаче

1({о ,{1) ^ min; ({о,{1) Є^П Q; (3.2)

они имеют совпадающие значения и минимизирующие концы траекторий. Но множество R определяется сложным, неявным образом; поэтому далее используются его оценки.

Для p G Ф+ и множества Ф С Ф+ определим следующие множества:

E(p) = {(£0,6) | p(N,£1) — p(0,£0) > 0}, E(Ф)= П E(p). Лемма 3. Пусть Ф С Ф+. Тогда R С E(Ф).

Доказательство. Возьмем произвольную траекторию к G T0N(£0), £0 G R”. В силу возрастания каждой p G Ф вдоль всех траекторий выполняется неравенство p(N, x(N)) — p(0,x(0)) > 0 и, следовательно, (x(0),x(N)) G E(p) Vp G Ф. Отсюда получаем утверждение леммы. □

Для формулировки достаточных условий оптимальности можно ограничиться оценкой множества R П Q. Пусть на каждом шаге известна априорная внешняя оценка Xk множества достижимости системы (S) с частичным учетом множества Q, т. е. внешняя оценка множества

Rk[Q] = {x G R” | 3 4 G T0k(£) : £ G Q0, x(k) = x},

где Q0 = prx0 Q. В этом случае множество X = X0 х X1 х ■ ■ ■ х Xn сильно инвариантно относительно управляемой системы (S) с ограничением q G Q.

Лемма 4. Пусть Ф С Ф+(Х). Тогда (Rn Q) С E(Ф).

Из лемм 3, 4 и взаимосвязи задач (P) и (3.2) очевидным образом следуют канонические достаточные условия глобальной оптимальности в задаче (P) с множеством сильно монотонных L-функций. Для их формулировки введем следующую концевую задачу (EP(Ф)):

l(£0,£1) ^ inf; (£0,£1) G E(Ф) П Q.

Теорема 1. Пусть для допустимого процесса а найдется такое множество Ф С Ф+(X), что J(<г) = min(EP(Ф)), т. е. q — точка глобального минимума в задаче (EP(Ф)). Тогда а глобально оптимален в задаче (P).

Множество Ф, удовлетворяющее вместе с а теореме 1, назовем разрешающим для задачи (P) (и любого оптимального процесса или минимизирующей последовательности этой задачи).

ФУНКЦИИ ТИПА ЛЯПУНОВА В ЗАДАЧАХ ДИСКРЕТНОГО УПРАВЛЕНИЯ 137

4. Замечания и анализ достаточных условий оптимальности

Разрешающие множества L-функций в задачах оптимизации дискретных систем обладают большинством свойств аналогичных множеств в классических непрерывных задачах оптимального управления [10, 11]. Укажем некоторые из них.

1. Как и в первых работах по каноническим условиям оптимальности в непрерывных системах [8], естественно считать, что искомое разрешающее множество L-функций образует семейство Ф = {ра(k, x) | a G A}, зависящее от некоторого параметра, возможно, бесконечномерного. В частности, для рассматриваемой задачи (P) с не аддитивной зависимостью концевого ограничения и целевого функционала от x(0), x(N) полезны так называемые позиционные L-функции, в которых роль a играют xo = x(0) или xN = x(N) [11].

2. Легко убедиться, что нижняя огибающая любого множества функций из Ф+ также сильно возрастает. Однако использование этого свойства для замены в теореме 1 множества Ф на единственную функцию

р* (k, x) = inf p(k, x) может приводить к потере качества аппроксима-Ф

ции множества R и, как следствие, свойства разрешаемости (помимо ухудшения свойств гладкости).

Пример 1. Рассмотрим элементарную систему x(1) = x(0) + u(0), u(0) G [—1,1]. Очевидно, что R = |(£0,£i) | |£i — £0| < 1}, и его точное описание дается двумя сильно возрастающими L-функциями р1,2 = k ± x, k = 0,1. Однако внешняя оценка множества R, определяемая функцией р* = min{p1,p2} = k — |x|, оказывается существенно грубее.

3. Задачу (P) назовем локально вырожденной в точке а, если вектор q является локальным решением следующей задачи: l(q) ^ min; q G Q (без всякого учета динамики).

В наиболее важном случае, когда задача (P) локально не вырождена в точке а, а разрешающему множеству Ф соответствует множество функций {p(N, £1) — р(0,£0) | p G Ф}, равномерно полунепрерывное снизу в точке q, для любого £ > 0 множество

Ф£(а) := {p G Ф | p(N, x(N)) — р(0, x(0)) < £} = 0.

Иначе говоря, множество £-активных ограничений типа неравенства с функциями p G Ф в концевой задаче (EP(Ф)) не пусто. В частности, в типичной для приложений ситуации множество Фо(<^) = 0, т. е. р = const вдоль К при p G Ф0(а).

4. В предположениях из 3 для любой p G Фе(<7) процесс а £-опти-мален в задаче минимизации критерия

w(p; а) := p(N, x(N)) — р(0, x(0))

в дискретной системе (S) (без каких-либо ограничений на траекторию).

Свойства 3, 4 содержат важную информацию о возможных кандидатах в элементы разрешающего множества L-функций. В частности, она тесно связана с понятием биэкстремали системы (S) (см. ниже раздел

5).

5. Установим любопытную связь достаточных условий оптимальности теоремы 1 с условиями В.Ф. Кротова [12, 17].

Для этого предположим для простоты, что X = RnN и искомое разрешающее множество конечно: Ф = {p1,...,pV}. Тогда неполный нормальный лагранжиан задачи (EP(Ф)), включающий лишь ограничения, связанные с p G Ф, имеет вид

V

¿Ф(£, А) = 1(£) - £ А*(p*(N,£i) - рг(0,£о)), i=1

где £ = (£о, £i), А = (Ai,..., AV). Определим следующее условие

БС(Ф). Найдется такой множитель A G R+, что лагранжиан £Ф(£,А) достигает глобального минимума при ограничении £ G Q в точке £ = q причем

min £ф(£, А) = 1(g).

ÍEQ

Ясно, что £С(Ф) — это простейшее достаточное условие оптимальности точки £ = q в задаче (EP(Ф)), гарантирующее выполнение условий теоремы 1 с множеством Ф.

Теорема 2. а) Если выполнено условие £С(Ф), то

V

p(k,x) = А*рг(й,ж)

i=1

является функцией Кротова задачи (P).

b) Если р G Ф+ — функция Кротова задачи (P),то выполнено условие SC({p}) со скалярным множителем А = А = 1.

Доказательство. а) Очевидно, что p G Ф+ и условие £С(Ф) преобразуется в условие SC({p}) с одноэлементным множеством Ф = {р} и числовым множителем А = А = 1. Преобразованное условие гарантирует оптимальность вектора £ = q в соответствующей задаче (EP(Ф)) и является переформулировкой достаточных условий Кротова с использованием приема нормировки [17, 5]. Это пояснение доказывает и утверждение b). □

Из теоремы 2 следует, что достаточные условия Кротова представляют собой метод решения концевой задачи (EP(Ф)) из условий оптимальности теоремы 1 с помощью принципа Лагранжа снятия части

ограничений. Выполнение условий Кротова влечет существование разрешающей функции, совпадающей с кротовской, однако, обратное не верно: нетрудно привести примеры, в которых функций Кротова не существуют, но выполнены канонические условия оптимальности. Поэтому теорема 1 существенно обобщает теорему Кротова. Аналогично обстоит дело, если использовать модифицированную версию условий Кротова с множеством сильно монотонных L-функций [16, 10].

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Пример 2. J = x(0)x(1) ^ min; x(1) = x(0) + 0 ■ u(0), |u(0)| < 1. Легко проверить, что в этом примере оптимальны все процессы а с x(0) = x(1) = 0, однако, условия Кротова не могут быть выполнены ни с одной, по крайней мере, дважды дифференцируемой функцией. В то же время, канонические условия оптимальности выполняются с парой линейных L-функций р1,2 = ±x или с одной из двух позиционных — р3 = — |x — x0| или р4 = —(x — x0)2.

6. Важным является обращение достаточных условий оптимальности теоремы 1 в необходимые. В случае аддитивной целевой функции вида I(а) =Y^ f0(k, x(k),u(k)) и раздельных фазовых ограничений обращение теоремы 1 вытекает из необходимости существования функции Кротова в дискретных задачах оптимального управления (фактически через метод динамического программирования [17, 2]).

7. Для нахождения L-функций могут применяться все известные методы построения функций Кротова и Беллмана [17, 6, 13], в частности, поиск в классе линейно-квадратичных по x функций.

Пример 3. В [18, Т.2,с.249] рассмотрена следующая линейно-квадратичная задача, в которой дискретный принцип максимума не справедлив:

x(k + 1) = g(k,u(k)), x(0) = 0, a 2

y(k + 1) = ax2(k) + by(k) — b(g(k,u(k)) , y(0) = 0, u(k) G U, k = 0,1, 2, J (а) = y(3) ^ min .

Здесь g(k, ■ ) — непрерывная при всех k функция, множество U компактно, скалярные параметры a, b строго положительны.

a 2

Поскольку J(а) = — b(g(2,u(2))) , то оптимальными являются все

2

процессы а с u(2) G Argmax (g(2,u)) .

uGU

Будем искать разрешающую L-функцию в виде p = S(k)x2 + p(k)y. Неравенство (2.2) принимает вид

miii |S(k + 1)(g(k + 1, u))2 + p(k + 1) ^ax2 + by — ^(g(k + 1,u))2j

—S(k)x2 — p(k)y) > 0.

Требуя выполнения этого условия в форме равенства, положим 5(к + а

1) = ^^(к + 1), 5(к) = ар(к + 1), р(к) = 5р(к + 1), откуда получим

следующие цепочки 5(к) = 55(к + 1), р(к) = 5р(к + 1) и условие 5(к) = а

ЬР(к). Кроме того, выберем р(3) = 5 и 5(3) = а. Получим функцию р(к, х, у) = а53-к х2 + 54-к у,

\ а 2

которая сильно возрастает и дает следующую оценку: уз > — 5X3, откуда с учетом априорной оценки хз € д(2, и) устанавливается оптимальность процессов а.

Отметим, что при 5 > 1 функция р не удовлетворяет условиям Кротова даже с явным учетом свойства монотонности (Ар > 0) и указанной априорной оценки.

Выбор ¿-функций в классе линейных по х приводит к достаточным условиям оптимальности в форме дискретного принципа максимума, к формулировке которых мы и переходим.

5. Линейные сильно монотонные L-функции и достаточные условия оптимальности в форме принципа максимума

Рассмотрим задачу (P), дополнительно предполагая, что функция f непрерывно дифференцируема по ж.

Введем функцию Понтрягина H(k, ж, p, u) = p ■ f (k, ж, u).

Пусть a = (к, V) — некоторый процесс. Определим для него следующие условия, которые назовем условиями экстремальности: существует последовательность ф = {p(k)}N=0, p(k) £ Rn такая, что при всех k = 0,N - 1

p(k) = Hx(k, x(k),p(k + 1), u(k)), (5.1)

H (k,x(k),p(k + 1),u(k)) = max H (k,x(k),p(k + 1),u). (5.2)

ueUk

Процесс a, удовлетворяющий этим условиям, назовем экстремалью системы (S), любую тройку y = (к, V ,ф), удовлетворяющую соотношениям (5.1), (5.2), — биэкстремалью системы (S), а соответствующую последовательность ф — коэкстремалью. Множество всех коэкстремалей для a обозначим через Ф(ст).

Легко видеть, что условия экстремальности процесса a совпадают с частью условий дискретного принципа максимума, который, как известно [14, 3, 7, 4, 2, 13, 18], справедлив лишь в предположении локальной выпуклости вектограммы f (k, ж, Uk) вдоль траектории к. Ясно, что

если a удовлетворяет дискретному принципу максимума с котраекто-рией ф , то ф £ Ф(а).

Обозначим через Ф+(<г) множество всех коэкстремалей для а, удовлетворяющих следующему расширенному условию максимума:

H(k,x(k),p(k + 1), u(k)) — p(k) ■ x(k) =

= max {H(k,x,p(k + 1),u) — p(k) -ж}, k = 0,N — 1.

U G k G

Пусть Ф+(<г) = 0. С помощью любой коэкстремали ф £ Ф+(а) построим функцию (k,ж) = p(k) ■ (ж(k) — ж). Нетрудно проверить, что она сильно возрастает, т. е. р^ £ Ф+.

Возьмем произвольное множество коэкстремалей Ф С Ф+(а ) и рассмотрим задачу (EP(Ф)):

1(Co,£i) ^ inf; ({о,{0 £ Q

p(N) ■ (ж(Ж) — {i) — p(0) ■ (ж(0) — {о) > 0 Vф £ Ф.

Теорема 3. Пусть для допустимого процесса а найдется такое множество коэкстремалей Ф С Ф+(<т), что J(а) = min(EP(Ф)). Тогда а — глобально оптимальный процесс в задаче (P).

Приведенное достаточное условие оптимальности в форме дискретного принципа максимума не требует априорного предположения нормальности экстремали a и использует информацию о всем множестве соответствующих наборов Лагранжа. Его выполнение типично для задач оптимального управления в экономических моделях.

Заметим, что в задачах управления дискретными системами естественно рассматривать и слабые экстремали, определяемые через локальный принцип максимума (т. е. через универсальное необходимое условие оптимальности, нежели глобальный принцип максимума). Для них по аналогичной, но локализованной схеме можно получить достаточные условия локальной оптимальности в форме локального принципа максимума.

6. Слабо монотонные L-функции и необходимые условия

оптимальности

Рассмотрим задачу (Po) с подвижным левым и свободным правым концами траекторий и терминальной целевой функцией:

ж^ + 1) = f(k,ж(^,и(^), u(k) £ Uk, k = 0,N — 1,

ж(0) £ X0,

J (a) = 1(ж(Ж)) ^ inf .

Пусть a = aN — некоторый допустимый в задаче (Po) процесс. С помощью слабо монотонных функций получим необходимые условия глобальной оптимальности процесса a.

Через Rn = Rn(Xo) обозначим множество достижимости к моменту времени N из множества Xo, т. е.

Rn(Хо) = {ж £ Rn | 3 kN £ ToN({) : { £ Хо, ж(N) = ж}.

Среди всех слабо убывающих L-функций Ф_ выделим те, которые удовлетворяют граничному условию в форме неравенства p(N, ж) > 1(ж) на множестве Rn . Множество всех таких функций обозначим через Ф>.

Лемма 5. Пусть Ф С Ф>. Тогда inf(Po) < inf inf р(0,ж).

_ <^€Ф ж€Хо

Доказательство. Предположим противное: пусть выполнено неравенство inf(Po) > inf inf р(0,ж). Тогда существуют р* £ Ф и {* £ Xo,

^еФ жеХо

такие что inf(Po) > Р*(0,{*). В силу слабого убывания функции р* найдется траектория к* £ T)N({*), вдоль которой р не возрастает, и, следовательно,

inf(Po) > р*(0,{*) > р(N, ж*(N)) > J(a*),

где a* — процесс с рассматриваемой траекторией. Ясно, что a* допустим и из предыдущего неравенства получаем противоречие. □

Из леммы 5 очевидным образом вытекает следующее необходимое условие глобальной оптимальности в задаче (Po).

Теорема 4. Пусть Ф С Ф>. Тогда для глобальной оптимальности допустимого в задаче (Po) процесса a необходимо выполнение неравенства J(<г) < inf inf р(0,{).

^еФ £€Хо

Очевидно, что теорема 4 в контрпозитивной форме принимает вид достаточного условия неоптимальности процесса a, но оставляет открытой проблему построения процесса, улучшающего значение функционала задачи (Po) относительно исходного. Для конструктивного уточнения верхней оценки в правой части неравенства из формулировки теоремы 4 целесообразно определить модифицированный лагранжиан вида

N _1

К(р,ст) = р(0,ж(0))+У^ ^(k + 1,ж(k + 1))— inf р^ + 1,f(k,ж(k),u))

- \ uGUk

k=o

Легко проверить, что для любой р G Ф> он мажорирует целевой функционал задачи J(<г); кроме того, имеется оценка

inf К(р,ст) > inf inf р(0,{) V Ф С Ф>, aeD ^еФ îeXü _

теоретически уступающая фигурирующей в теореме 4 (здесь D — множество процессов, допустимых в задаче (Po)). Однако левая часть последнего неравенства определяет вполне реализуемую экстремальную задачу, если фиксировать структуру функций из Ф> (или детализировать класс задач типа (Po))• Из вида K вытекает, что при фиксированной р выбор минимизирующего процесса аналогичен методу динамического программирования [13, 17, 3].

7. Заключение

В статье получены аналоги достаточных условий оптимальности канонической теории Гамильтона-Якоби с применением семейств сильно монотонных функций типа Ляпунова для дискретных задач оптимального управления, а также достаточные условия оптимальности в форме дискретного принципа максимума, оперирующие линейными L-функциями. Кроме того, приведено одно из возможных приложений слабо монотонных L-функций — необходимые условия глобальной оптимальности, допускающие построение процедур улучшения неоптимальных дискретных процессов.

Интересным представляется дальнейшее распространение полученных условий на задачи управления дискретными системами с нефиксированными моментами квантования времени и на задачи управления дискретно-непрерывными и импульсными системами, включающими в свое описание рекуррентные связи. Важным также является обращение принципа квазимаксимума [14, 4] и аппроксимативного принципа максимума [18] в достаточное условие субоптимальности. Область применения указанных критериев оптимальности не ограничена дискретными системами с локально выпуклой вектограммой.

Список литературы

1. Антипина Н. В. Линейные функции Ляпунова-Кротова и достаточные условия оптимальности в форме принципа максимума / Н. В. Антипина, В. А. Дыхта // Изв. вузов. Математика. - 2002. - № 12. - С. 11-21.

2. Ащепков Л. Т. Оптимальное управление разрывными системами / Л. Т. Ащепков. - Новосибирск : Наука, 1987. - 226 с.

3. Болтянский В. Г. Оптимальное управление дискретными системами / В. Г. Болтянский. - М. : Наука, 1973. - 448 с.

4. Габасов Р. Качественная теория оптимальных процессов / Р. Габасов, Ф. М. Кириллова. - М. : Наука, 1971. - 508 с.

5. Гирсанов И. В. Некоторые связи между функциями Беллмана и Кротова для задачи динамического программирования / И. В. Гирсанов // Вестн. Моск. ун-та. - 1968. - № 2. - С. 56-59.

6. Гурман В. И. Принцип расширения в задачах управления / В. И. Гурман. -2-е изд., перераб. и доп. - М. : Наука, Физматлит, 1997. — 288 с.

7. Дубовицкий А. Я. Дискретный принцип максимума / А. Я. Дубовицкий // Автоматика и телемеханика. - 1978. - № 10. - С. 55-71.

8. Дыхта В. А. Неравенство Ляпунова-Кротова и достаточные условия в оптимальном управлении / В. А. Дыхта // Итоги науки и техники. Совр. математика и ее приложения. - 2006. - Т. 110. - С. 76-108.

9. Дыхта В. А. Некоторые приложения неравенств Гамильтона-Якоби в оптимальном управлении / В. А. Дыхта // Изв. Иркут. гос. ун-та. Сер. Математика. - 2009. - Т. 2. - С. 15-28.

10. Дыхта В. А. Анализ достаточных условий оптимальности с множеством функций типа Ляпунова / В. А. Дыхта // Тр. Ин-та математики и механики УрО РАН. - 2010. - Т. 16, № 5. - С. 66-75.

11. Дыхта В. А. Позиционные решения неравенств Гамильтона-Якоби в задачах управления дискретно-непрерывными системами / В. А. Дыхта, С. П. Сорокин // Автоматика и телемеханика. - 2011. - № 6. - С. 48-63.

12. Кротов В. Ф. Методы и задачи оптимального управления / В. Ф. Кротов, В. И. Гурман. - М. : Наука, 1973. - 448 с.

13. Иоффе А. Д. Теория экстремальных задач / А. Д. Иоффе, В. М. Тихомиров. -М. : Наука, 1974. - 480 с.

14. Пропой А. И. Элементы теории оптимальных дискретных процессов / А. И. Пропой. - М. : Наука, 1973. - 256 с.

15. Субботин А. И. Обобщенные решения уравнений в частных производных первого порядка. Перспективы динамической оптимизации / А. И. Субботин. -М. ; Ижевск : Ин-т компьютер. исследований, 2003. - 336 с.

16. Dykhta V. Some applications of Hamilton-Jacobi inequalities for classical and impulsive optimal control problems / V. Dykhta, O. Samsonyuk // European Journal of Control. - 2011. - Vol. 17, N 1. - P. 55-69.

17. Krotov V. F. Global Methods in Optimal Control Theory / V. F. Krotov. - N. Y. : Marcel Dekker, 1996. - 384 p.

18. Mordukhovich B. S. Variational Analysis and Generalized Differentiation I & II. Fundamental Principles of Mathematical Sciences / B. S. Mordukhovich. - Berlin : Springer, 2006. - Vol. 330 & 331. — I. — 611 p.; II. — 580 p.

19. Nonsmooth Analysis and Control Theory / F. H. Clarke, Yu. S. Ledyaev, R. J. Stern, P. R. Wolenski. - N. Y. : Springer-Verlag, Grad. Texts in Math, 1998. - Vol. 178. - 276 p.

S. P. Sorokin

Monotone Lyapunov type functions and global optimality conditions for discrete control problems

Abstract. Sufficient and necessary global optimality conditions for discrete optimal control problems are proposed. These conditions are based on applying of strongly and

weakly monotone Lyapunov type functions that do not decrease along any or some trajectories of discrete dynamical systems under consideration. Proposed sufficient conditions are more general than well-known Krotov conditions. There are obtained conditions that converse the discrete maximum principle into sufficient optimality condition.

Keywords: discrete dynamical systems, monotone Lyapunov type functions, inner estimates to reachable sets, sufficient and necessary global optimality conditions, discrete maximum principle

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Сорокин Степан Павлович, м.н.с., Учреждение Российской академии наук Институт динамики систем и теории управления Сибирского отделения РАН, 664033, Иркутск, ул. Лермонтова, 134, тел.: (950) 1111985 ([email protected])

Sorokin Stepan, Institute for System Dynamics and Control Theory SB RAS, 134, Lermontova Str., Irkutsk, 664033, junior researcher, Phone: (950) 1111985 ([email protected])

i Надоели баннеры? Вы всегда можете отключить рекламу.