Достаточные условия оптимального управления экономическими системами

Орёл Е.Н.; Орёл О.Е.

ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ЭКОНОМИЧЕСКИМИ СИСТЕМАМИ

Орёл Е.Н.,

Орёл О.Е., Федеральное государственное образовательное Бюджетное учреждение Высшего профессионального образования «Финансовый университет при Правительстве Российской Федерации»

Получены достаточные условия глобального экстремума для центральных полей траекторий в автономных задачах оптимального управления экономическими системами. Показано, что в регулярном случае гладкого поля экстремалей Понтрягина эти условия выполнены автоматически.

Ключевые слова: экономическая система, оптимальное управление, поле экстремалей, достаточное условие, принцип максимума Понтрягина, условие Вейерштрасса.

SUFFICIENT CONDITIONS OF OPTIMAL ECONOMIC SYSTEM CONTROL

Oryol E.,

Oryol O., Federal State Budget institution of higher education, “Finance Academy under the Government of the Russian Federation ”

Sufficient conditions of the global extremum for central fields in autonomous problems of optimal economic system control are received. It showed that this conditions are fulfilled automatically for the regular case of the smooth field of Pontryagin extremals.

Keywords: economic system, optimal control, field of extremals, sufficient condition, Pontryagin maximum principle, Weierstrass condition.

Введение

Модели и методы оптимального управления широко используются в различных областях экономики, таких, как макроэкономическая динамика, логистика и управление запасами, календарное планирование, распределение инвестиций, маркетинг и финансовый анализ [15].

Как известно [1-11], в задачах оптимального управления принцип максимума Понтрягина является необходимым условием локального экстремума. После выхода в свет монографии [6] появилось большое количество публикаций, уточняющих необходимые условия для разных классов задач.

Между тем специфика задач оптимального управления в экономике такова, что в конечном счете требуется построить именно оптимальное управление, т.е. управление, обеспечивающее не локальный, а абсолютный (глобальный) экстремум. Например, если ищется максимум прибыли, то фирму не может удовлетворить решение, дающее большую прибыль по сравнению лишь с достаточно близкими решениями. Принятое решение должно обеспечивать прибыль, максимальную по всем возможным решениям. Поэтому исследование на необходимость - только начало решения задачи оптимального управления.

Принцип максимума является не только необходимым, но и достаточным условием в линейных задачах оптимального быстродействия, когда целевым состоянием является положение равновесия [7, с. 96]. Для более общих случаев вопросы достаточности абсолютного экстремума мало изучены.

В задачах вариационного исчисления, составляющих классическую базу задач оптимального управления, изучение этих вопросов невозможно без исследования полей траекторий. Поэтому в настоящей статье будем предполагать, что центральное поле траекторий в задаче оптимального управления каким-то образом построено. При этом предположении будет выведены необходимые и достаточные условия абсолютного экстремума.

1. Центральное поле в задаче оптимального управления

Неизбежность исследования полей в задачах оптимального управления была осознана уже давно в связи с задачей синтеза. Так, в классической монографии [6] представлены рисунки центральных полей экстремалей Понтрягина для самых разнообразных конкретных задач (например, см. Рис. 1). В [6] центром поля является терминальная точка. Во многом это связано с тем, что часто требуется попасть в

положение равновесия (на Рис. 1 - точка (0,0) ). В настоящей работе в качестве центра поля берется стартовая точка, как в задачах вариационного исчисления. Принципиальной разницы здесь нет.

Рис. 1. Понтрягинский синтез

Будем предполагать, что центральное поле траекторий уже каким-то образом построено. Требуется определить, является ли оно оптимальным. Будет выведено необходимое и достаточное условие абсолютного экстремума для, вообще говоря, негладкого центрального поля траекторий. Будет также показано, что в случае гладкого поля экстремалей Понтрягина проверку этого условия проводить не нужно, т.к. оно выполнено автоматически.

Ограничимся задачами оптимального управления в автономной форме. Задачи с закреплённым временем рассматривались в [12].

1.1. Постановка задачи

Следуя [6], рассмотрим задачу оптимального управления в автономной форме в j n для двухточечной краевой задачи с нефиксированным временем T ^ 0

x(0) = s, x(T) = t, s,11 D,

T

O L(x(t), u(t))dt ® min,

0

ddtt)=f (x (t), u(t)),

x(t) = (x(1)(t),K , X(n)(t)) I DI j n,

u(t) = (u(1)(t),K , u{m)(t)) I UI j m.

Как обычно, отображения L: Д' U ® j и f : D,' U ® j ' n , где D, - открытое множество, содержащее D,

будем считать дифференцируемыми, а управление u(.) - кусочно непрерывным.

Вместе время движения T , управление u(.) и траектория x(.) образуют управляемый процесс g = (T, x(.), u(.)). Начальное и конечное состояния произвольного процесса g будем обозначать соответственно a (g) и b (g) . Таким образом, a(g) = x(0), b(g) = x(T) . Положим T

J (g) = O L (x(t), u(t ))dt.

0

Через M обозначим множество управляемых процессов, а через M s - множество процессов g, стартующих из s , т.е.

a (g) = s для g I Ms.

1.2. Свойства траекторий

Если даны две траектории, g1 (T1, xi(.), U1(.)) и g2 (T2, x 2 (.),U 2 (.)) ’ причем a (g2) b(g1) ’

то их можно естественным образом скрепить (склеить). Единую траекторию g = (Ti + T2, x(.), u(.)) будем называть произведением траекторий g1 и g2 и обозначать g = glg2.

Определение. Семейство траекторий Ns I M s будем называть центральным полем (пучком), если через каждую точку УI D проходит ровно одна траектория семейства.

Центральное поле Ns будем называть оптимальным, если каждая траектория поля является оптимальной при соответствующих

граничных условиях, т.е. если для любого t I D траектория g I Ns , для которой b (g) = 1 , обеспечивает оптимальное управление.

В работе предполагается, что дано центральное поле траекторий Ns . Требуется определить условия, при которых это поле является

оптимальным.

2. Неравенство треугольника и его следствия

2.1. Криволинейный треугольник

Определим действие по Гамильтону S(x):D ® j как сложную функцию центрального поля траекторий. А именно, пусть g - траектория поля Ns , оканчивающаяся в точке x . Тогда S (x) = J (g).

Пусть дана произвольная траектория d= (T,y(.),w(.)) I M . Рассмотрим криволинейный треугольник, вершинами ко-

торого являются состояния § , а (С , Ь (С) , а сторонами - сама траектория С и траектории поля ^2 I , первая пусть

оканчивается в точке а (С , а вторая - в Ь (С . Рассмотрим выражение

] (с|= 5(а(с|)+ /(с|- 5(Ь(с|).

Условие

] (С3 0

будем называть неравенством треугольника для траектории С.

Теорема 1. Для оптимальности поля N. необходимо и достаточно, чтобы для любой траектории С М выполнялось неравенство треугольника .

Необходимость доказывается методом от противного, а достаточность - с помощью неравенства треугольника для траектории, начинающейся в § .

2.2. Функции вдоль пробной траектории

Зафиксируем произвольную траекторию С= (Т,у(.),*(.)) I М , которую будем называть пробной. Для г I [0,Т] обозначим

J(t) = J Цу(т), w(T))dt, S(t) = S (у(т))..

О

Рассмотрим функцию времени £(*)= s(o)+ J(t)~ s(t)при 11 [0,t].

Лемма 1. Если 0 £ a < Ь £ T , то

ф(Ь)~ ф(а)= g(4) ,

где d2 - участок траектории d, такой, что d= , а время движения вдоль траекторий d1 , d2 и C| равно соответствен-

но а, Ь - а и T - Ь.

Лемма доказывается путём преобразования алгебраических выражений.

Теорема 2. Поле Ns оптимально тогда и только тогда, когда для любой пробной траектории dI M функция не убы-

вает.

Теорема является простым следствием теоремы 1 и леммы 1.

2.3. Предельный переход

Для произвольной функции одной переменной f (t) , заданной на отрезке [а, Ь] , обозначим через f (t) и f' (t) соответственно верхнюю и нижнюю производные.

Теорема 3. Для того чтобы центральное поле траекторий Ns было оптимальным, необходимо и достаточно, чтобы для любой пробной траектории d= (T,y(.), w(.)) I M при всех 11 [0,t] имело место неравенство

m*0 ’

где

^(o=z(y(o,w(o)-4'(^ .

Доказательство теоремы вытекает из леммы 2, приводимой ниже.

Лемма 2. Для того, чтобы функция f (t) , заданная на отрезке [а, Ь] , не убывала, необходимо и достаточно, чтобы ее нижняя

производная f \ (t) была неотрицательна всюду на этом отрезке.

Необходимость доказывается предельным переходом в неравенстве, а достаточность - двоичным делением отрезка [а, Ь].

3. Регулярный случай

Рассмотрим регулярный случай, когда в окрестности исследуемой точки центральное поле является гладким и состоит из экстремалей Понтрягина.

3.1. Функция Гамильтона и экстремали Понтрягина Определим функцию Гамильтона

H(x,p, u) = (p,f(x,u)} - L(x,u),

где через ^, ^ обозначено скалярное произведение векторов.

Траекторию (, x (.) , u (.)) будем называть экстремалью Понтрягина, если существует такая непрерывная вектор-функция времени p = (p(1)(t ),K, p(n)(t)) , что на отрезке 11 [0,тj выполнены соотношение Гамильтона-Понтрягина

■dpr) = - NxH(x(t),p(t),u(t)), dt

закон сохранения энергии

H (x(t), p(t), u(t)) = О

и неравенство Понтрягина-Вейерштрасса

H(x(t),p(t), w) £ О

для всех w I U . Здесь, как обычно, N x есть оператор градиента по x.

Из определения гамильтониана вытекает справедливость двойственного к соотношение

dx(t)

dt

= N p H (x(t), p(t), u(t)).

Экстремали Понтрягина будем обозначать наборами

g = (T, x (.), u (.), p (.)).

Условия , , в совокупности составляют принцип максимума Понтрягина [б].

3.2. Достаточность в регулярном случае

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Пусть дана пробная траектория d= (T, y (.) , w (.)) I M . Для 11 [О,тj обозначим через g(t) траекторию центрального поля, оканчивающуюся в y(t).

Будем считать, что для всех t из некоторого интервала (a, Ь) I [ О, Tj траектории g(t) являются экстремалями Понт-

рягина. Введем для них обозначение: g(t) = (R(t X x(t,.), u (t,.), p (t,.)) . Здесь t является параметром, который определяет “номер” экстремали; текущее время вдоль экстремали будем обозначать буквой t (11 [О, R(t)j ). Заметим, что =f (x (t, t), u (^t))

(для экстремали),

= f (y (t) , w (t)) 5

(для пробной траектории),

x(t, R (t)) = y (t)

(конец экстремали лежит на пробной траектории).

Теорема 4. В условиях гладкого центрального поля экстремалей для любой пробной траектории справедлива формула

ф\0= - tf(y(>),pM(0),w(0>

< Так как в гладком случае верхняя производная становится производной в обычном смысле, то превращается в

ф\ї)= Z(y(0,w(0)- JL(x(t,r),u(t,r))dr.

at 0

Прежде всего, заметим, что для О < t < T справедлива формула

iL <x(t,f >,u(t,f}) = x/ p(t, t), ix (t, t )\ it i^ it /

76 TRANSPORT BUSINESS IN RUSSIA

Далее следует дважды воспользоваться формулой для производной скалярного произведения вектор-функций. При вычислении производной функции Гамильтона следует воспользоваться равенством H <0) = О , где

H (1 )= H(x(t, t), p(t, t),u(t + І , t)).

После этого надо преобразовать производную в выражении : dR

— О L(x, u)dt =

dt О

= L(x(t,R),u(t,R))R'+ /p(t,R),ix(t,R^ - /p(t,0),^(t,0)Y

Поэтому ф\І) = - i/(y,p,W(^))+ Я(Х,р,и)іг'.

Так как H(x,p,u) = 0, то ф\t)= - Н{у P,W,). >

Ввиду неравенства , из теоремы вытекает, что в случае гладкого поля функция $(t) не убывает на любой пробной траектории.

Тем самым доказано следующее утверждение: всякое гладкое центральное поле экстремалей Понтрягина оптимально.

4. Задача об управляемой остановке

Обратимся к первому примеру задачи синтеза из монографии [б]. Запишем систему уравнений

dx 0 dx& . ,

— = x& — = u, I u I£ 1. dt dt

Требуется попасть из одной точки фазового пространства в другую за минимальное время. В данном примере n = 2 , m = 1 ,

x(t) = (x(t),x&)), U = [-1,1], D = і 2, L° 1, f = (x&u).

В [б] при анализе задачи фиксировалась терминальная точка - положение равновесия (0,0). В настоящей статье фиксируется стартовая точка S = (S, S&, а терминальное состояние может быть произвольным. Для определенности будем считать, что начальная скорость

положительна, т.е. S& 0.

Центральное поле экстремалей Понтрягина, состоящее из парабол

x&

x m—= c,

2

изображено на Рис.2. Как видно из рисунка, имеются две параболы переключения, выходящие из (S, S&. Первая (она идет вправо-вверх) проходит через точку Z1 = ( Z1, Z^ и соответствует управлению u = 1, а вторая проходит через точку Z2 (Z2,Z&)

и соответствует управлению u = - 1 . Справа от этой единой линии управление для всех траекторий поля равно _1, а слева + 1.

Пробная траектория ( у (.) , У&.)) обозначена пунктиром. На ней выбраны две точки, y i = ( Уі, У&) , i = 1,2, по разные

стороны от единой линии переключения. Видно, что траектория поля, проходящая через у. , представляет собой ломаную SZiy^,

которая состоит из двух парабол с точкой переключения Z i .

Обозначим через u0 управление на первом участке “ломаной” SZ^у. . Если двигаться из S в точку У1 , то начальное ускорение

u01 будет положительно ( u01 = + 1), а если в точку у 2 - то отрицательно ( u02 = - 1).

Для каждой точки y пробной траектории имеем

S(y,У&= u0(2^&- SSe У&.

Теперь выразим промежуточную точку Z через S и y :

z = s / 2 + y / 2 - u0S& /4 + u0 y2 / 4,

Рис. 2. Поле экстремалей в задаче об управляемой остановке

& = и0у - и0s + &/2 + &/2.

В уравнении перейдем к производной по { . Заметим, что зависит от у сложным образом. Имеем

ф'= (1+ u0w)

(f- у)

Первый сомножитель в равенстве неотрицателен из-за ограничений на управление, а второй - из-за того, что числитель и знаменатель

одновременно положительны (при и0 = 1) или отрицательны (при и0 = - 1). Поэтому всегда (р ^ 0. Итак, поле экстре-

малей Понтрягина обеспечивает выполнение условия и, следовательно, является оптимальным при заданной начальной точке и переменной конечной точке.

Заключение

Таким образом, получено общее необходимое и достаточное условие абсолютного экстремума для центрального поля экстремалей. В регулярном случае, когда поле является гладким и состоит только из экстремалей Понтрягина, данное условие выполнено автоматически. В этом смысле принцип максимума Понтрягина является как необходимым, так и достаточным условием абсолютного экстремума.

Литература:

1. Optimal Control and Dynamic Games: Applications in Finance, Management Science and Economics. Edited by R.F. Hart and H. Deissenberg.

- N.-Y., Springer, 2005. - 342 p.

2. Лагоша Б.А., Апалькова Т.Г. Оптимальное управление в экономике: теория и приложения. - М.: Финансы и статистика, 2008. - 220 с.

3. Просветов Г.И. Математические методы в логистике: задачи и решения. - М.: Альфа-пресс, 2008. - 304 с.

4. Caputo M. R. Foundation of Dynamic Economic Analysis: Optimal Control Theory and Applications. - Cambridge, University press, 2005.

- 580 p.

5. Kamien M.I., Nancy L.S. Dynamic optimization: The Calculus of Variations and Optimal Control in Economics and Management. - N.-Y., Elsevier, 1995. 377 p.

6. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. - М.: Наука, 1969. - 391 с.

7. Болтянский В.Г. Математические методы оптимального управления. - М.: Наука, 1969. - 408 с.

8. Черноусько Ф.Л., Баничук Н.В. Вариационные задачи механики и управления. - М.: Наука, 1973. - 238 с.

9. Янг Л. Лекции по вариационному исчислению и теории оптимального управления. - М.: Мир, 1974. - 488 с.

10. Флеминг У., Ришел Р. Оптимальное управление детерминированными и стохастическими системами. - М.: Мир, 1978. - 316 с.

11. Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. - М.: Наука, 1979. - 430 с.

12. Орёл Е.Н., Орёл О.Е. Геометрия необходимых и достаточных условий в задачах оптимального управления / Сб. научн. тр. Искусственный интеллект в технических системах. Вып. 22. - М.: ГосИФТП, 2001. С. 30-55.

Достаточные условия оптимального управления экономическими системами Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Орёл Е. Н., Орёл О. Е.

Похожие темы научных работ по математике , автор научной работы — Орёл Е. Н., Орёл О. Е.

SUFFICIENT CONDITIONS OF OPTIMAL ECONOMIC SYSTEM CONTROL

Текст научной работы на тему «Достаточные условия оптимального управления экономическими системами»