УДК 517.977.5
М.В. Орлов, А.И. Пучкова2
ИССЛЕДОВАНИЕ СПЕЦИАЛЬНОЙ МОДЕЛИ РАСПРЕДЕЛЕНИЯ РЕСУРСОВ НА БЕСКОНЕЧНОМ ПРОМЕЖУТКЕ ВРЕМЕНИ
В статье изучается специальная модель распределения ресурсов на бесконечном промежутке времени. С помощью принципа максимума Понтрягина строится экстремальное решение, оптимальность которого доказывается с помощью теоремы о достаточных условиях в форме конструкций принципа максимума Понтрягина. Рассмотрен конкретный пример, в котором классический принцип максимума неприменим.
Ключевые слова: оптимальное управление, принцип максимума Понтрягина, достаточные условия оптимальности, бесконечный горизонт планирования.
1 Факультет ВМК МГУ, доц., к.ф.-м.н., e-mail: orlovQcs.msu.su
2 Факультет ВМК МГУ, асп., e-mail: apuchkovaQgmail.com
1. Постановка задачи. Рассмотрим следующую задачу оптимального управления на бесконечном горизонте времени:
'x(t) = —x(t) + u(t), 0 ^ t < +оо, ж(0) = Xq,
~гоо
J= e~ptF(x(t))dt min,
J и(')
(1)
О < u(t) < и+.
Здесь х и и — одномерные фазовая переменная и управление соответственно, р > 0, жо > 0, и+ > 0 — заданные константы. Класс допустимых управлений состоит из всех кусочно-непрерывных на [0, +оо) функций и(-), имеющих конечное число точек разрыва первого рода на любом конечном интервале, со значениями из отрезка [0,
Известная модель потребления и накопления Рамсея [1]
' X = uf(x) — /¿Ж, 0 ^ t < +00, ж(0) = Xq,
+ ОС
/ e~ut(l — u)f(x) dt max,
J «(•)
(2)
,0 ^ и ^ 1,
сводится к рассматриваемой задаче (1) в случае /(ж) = Аха, А > 0 и а € (0,1). Функция /(ж) удовлетворяет неоклассическим условиям [1].
В целях простоты изложения рассмотрим /(ж) = Ау[х. Заменой переменных у = у/х дифференциальное уравнение задачи (2) приводится к уравнению
А р
У 211 2^'
А,
которое, в свою очередь, переходом к новому времени s = —t преобразуется в
у = +
А А
где v = —и, 0 ^ v ^ — = и+. Начальное условие у(0) = уа = л/xq. Перейдем к функционалу. Выразив р р
Ж + ¡XX
управление в виде и = —-—■=-, имеем
луж
о о
Отбросив константу жо, которая не является существенной при максимизации, после замены переменных t и ж на s и у соответственно получаем следующую задачу минимизации:
+ ОС
e~psW(y(s)) ds min,
и(-) 0
где W(y) = — [(// + ь>)у2 — Ау] и р = —. Таким образом, задача (2) полностью сводится к задаче (1). р р
Преобразование остается верным для любого а € (0,1) при замене у = х1~а. Модель односекторной экономики [2-4]
'ж = ueptf(ж) — рх, 0 ^ t < +оо, ж(0) = жо,
-(-OG
[ e~vt{l ^u)eptf(x)dt max,
J и(')
,0 ^ и ^ 1,
где /(ж) = ж", а € (0,1), которая является обобщением модели Рамсея, а также модель двухсекторной экономики [4-6] в модифицированном виде могут быть преобразованы к задаче (1) при определенном соотношении параметров.
Предполагается, что функция Р(х) является дважды непрерывно дифференцируемой в Д. При этом существует точка а > 0, такая, что -Р'(ж) < 0 при ж < а, -Р'(а) = 0, -Р'(ж) > 0 при х > а. Также предполагается, что Р"(х) >0 Ух € Я.
2. Предварительные результаты. Нетрудно доказать следующее свойство для допустимых траекторий задачи (1).
Лемма 1. Для любой допустимой пары (и(1),х(1)) задачи (1) при всех1 ^ 0 выполнено неравенство
О < х~{Ь) ^ х{Ь) ^ ж+(£) ^ тах{и+,жо}, (4)
где х~(1) = ж0е~* — траектория, отвечающая управлению и = 0, а х+(1) = (хо — и+)е~г + и+ — траектория, отвечающая управлению и = и+.
Замечание 1. В силу непрерывности функций Р(-) и -Р'(-), а также равномерной ограниченности допустимых траекторий ж(-) при заданном ж о существуют положительные константы С\ = С\(хо) и С2 = С2(хо), такие, что для произвольных допустимых пар (и(1), х(1)), £ ^ О, выполнено |^(ж(г))| ^ С\ и |^'(ж(г))| ^ Сг- Таким образом, при произвольном кусочно-непрерывном управлении
+ ОС +ОС
со значениями из отрезка [0, интегралы / е~р*.Р(ж(£)) (Й и / е~р*.Р'(ж(£)) (Й сходятся.
Решение задачи (1) зависит от того, может ли управляемая система поддерживать режим (и = а, ж = а). Сначала рассмотрим случай 0 < а ^ и+. В этом случае возможен особый режим (и(1) = а,х(1) = а). Значение управления на особом участке принадлежит области управления [0,
Теорема 1. Пусть а, € (0,и+]. Тогда оптимальное решение («*(£), ж* (¿)) задачи (1) имеет вид:
1) если 0 < жо < а < и+, то
<К*<т, г(,)_[х+(1), СК*<Т, т^г<+ос, т ^ £ < +оо,
где т = 1п ( -Ц-—— ] > 0 определяется из условия ж+(т) = а; \ и+ — а )
2) если 0 < жо < а = и+, то «*(£) = и+, ж*(£) = х+(1) Ш ^ 0;
3) если жо = а, то «*(£) = а, ж*(£) = а Ш ^ 0;
4) если жо > а, то
Го, 0<|<г <К.<г
а, т ^ £ < +оо, а, г ^ Ь < +оо,
где т = 1п > 0 определяется из условия ж (г) = а.
Доказательство. Покажем, что пара («*(£),ж*(£)) является оптимальной, непосредственно оценив приращение функционала. Рассмотрим любой допустимый процесс задачи (1)
й(г),ж(г), о 5$ г < +оо.
Покажем, что приращение функционала
= ./[„] - ./[„,]
неотрицательно, что гарантирует оптимальность управления «*(•). Доказательство проведем для случая 1. Случаи 2-4 рассматриваются аналогично.
Пусть 0 < хо < а < и+. Тогда
+ ОС +ОС
о о
т +ос
=/«-" тт-чх+т^/'-'мт-ча))«.
О т
Так как х(Ь) ^ ж+(£) ^ а на отрезке [0, г] и функция .Р(ж) убывает при х < а, то .Р(ж(£)) ^ -Р(ж+(£)) на отрезке [0, г]; .Р(ж(£)) ^ -Р^а), так как а — точка минимума функции .Р(ж). Получаем, что ^ 0. Теорема 1 доказана.
Модель (2) исследована в книге [1], при этом а € (0,«+]. Модель (1) допускает случай а > и+, который оказался интересным с математической и методической точки зрения. В этом случае особого режима нет.
3. Исследование задачи (1) при а > и+ и ж0 < а.
Теорема 2. Пусть а > и+ и жо € (0, а]. Тогда оптимальное решение задачи (1) имеет вид «„(*) = «+, ж*(г) = ж+(г) ш^о.
Теорема 2 доказывается аналогично теореме 1.
Замечание 2. Теоремы 1 и 2 верны и при более слабых предположениях на функцию -Р(ж), а именно достаточно ограниченности функции в Д, а также существования точки а > 0, такой, что функция .Р(ж) убывает при ж € (—оо, а] и возрастает при ж € [а, +оо).
Случай жо > а представляет особый интерес. В этом случае оптимальное решение не удается найти аналогичными рассуждениями, поэтому для исследования задачи (1) привлекаются принцип максимума Понтрягина и теория оптимального управления [7].
4. Исследование задачи (1) в случае жо > а > и+. Введем в рассмотрение функцию
X
0(х) = I Е'(у)(у-и+Уйу.
и+
Лемма 2. Функция С(х) обладает следуют,ими свойствами:
0(и+) = 0; С(х) < 0, ж е(«+,а]; С(+оо) =+оо; £?'(ж) <0, же (и+,а); О'(ж) >0, же (а, + оо); £?"(ж) >0, же (а, + оо). Рассмотрим уравнение
0( ж) = 0 (5)
при ж € (и+, +оо). Из леммы 2 следует, что существует единственный корень ж* уравнения (5), причем ж* > а > и+, С(х) < 0 при ж € (и+,х*) и С(х) > 0 при ж € (ж*, +оо).
Замечание 3. При отсутствии предположения о том, что Р"(ж) >0 Ух € Я, возможен также случай, когда С(ж) < 0 при ж € (и+, +оо), в этом случае уравнение (5) не имеет решений. Сформулируем теорему, которая является основным результатом данной статьи. Теорема 3. Оптимальное решение задачи (1) имеет следующий вид:
1) если жо € (а, ж*], то «*(£) = и+, ж*(£) = х+(1) Ш ^ 0;
2) если жо > ж*, то
и*{г)~\и+, т* 5$г < +ос, х*{г)~\х(1), т*^г<+ос,
где х(€) = (жо — и+еТ*)е~г + и+, т* = 1п ( — ) > 0, при этом ж (т*) = ж~(т*) = ж*.
\х* /
При доказательстве теоремы 3 применяется теорема о достаточных условиях оптимальности в форме конструкций принципа максимума Понтрягина [8]. Для того, чтобы воспользоваться теоремой, необходимо найти решение краевой задачи принципа максимума специального вида. Ниже проводятся исследования, описывающие соответствующую краевую задачу и ее решение.
5. Принцип максимума Понтрягина. Составим функцию Гамильтона Понтрягина для задачи (1)
ж, ф, и) = -е~ргР(х) + ф(-х + и).
Известно [7], что если (и(-),х(-)) — оптимальная пара, то существует функция ф{Ь), такая, что ф = - А'и
ж(£), ф{Ь), и{Ь)) = тах К(Ь,х{1),ф{1),у).
г)£[0,и+]
Найдем максимизатор функции Гамильтона-Понтрягина й*(ф) = arg тах К(1, х, ф, и). Функция К
ке[о,к+]
линейна по и, поэтому
Го, Ф < о,
и*(ф) = < и+, ф > О, [[О,«+], ^ = 0.
Легко показать, что ф(1) ф 0 ни на каком отрезке [а, /3], а < /3, так как х(1) ф а, I € [«,/?], поэтому максимизатор может быть записан в виде й*(ф) = и+к(ф), где Ь(-) — функция Хевисайда
W \1, 5 > 0.
Рассмотрим краевую задачу следующего вида:
' х = К'ф\и=йЛф) = -х + и+Ъ.(ф), ж(0) = ж0,
Ф = —К'х\и=йт(1р) = Ф + е~ргР'(х), ф(+оо) = 0, (6)
ки*(ф) = и+Цф).
Условие трансверсальности ф(+оо) = 0 является предметом дискуссий. В различных статьях также используются другие условия трансверсальности (см., например, [9] и [10]). Однако в нашем случае применение именно этого вида условия трансверсальности помогает решить вопрос оптимальности.
Исследование сопряженной переменной ф = ф(1) позволяет установить две важные характеристики оптимального управления: оптимальным управлением задачи (1) является кусочно-постоянная функция, которая не может иметь более одной точки переключения, и существование момента времени в, такого, что оптимальное управление «*(£) = и+ при £ € [0, +оо). Таким образом, если оптимальное управление и* (¿) существует, то либо и* (¿) = и+ Ш ^ 0, либо
и и\ = /°> т»,
п ^ t < +оо,
где т* < в — точка переключения. Обоснование этого результата не приводится, так как в статье представлено прямое доказательство оптимальности решения задачи (1).
6. Решение краевой задачи в случае ха > х*. Рассмотрим функции
т*
г
где т* = 1п (— ). Прямое их дифференцирование и сформулированная ниже лемма доказывают, что \х* /
эта пара функций образует решение краевой задачи (6).
Лемма 3. Функция ip(t) обладает следующими свойствами:
ф(г)<0, (Ki<r*, ф(п) = О, ip(t) >0, п <t < +оо, lim ip(t) = 0.
t—»- + OC
Доказательство. Прежде всего докажем следующую формулу:
+ ОС
(7)
Т*
После замены переменной у = и+ + (жо — и+еТ*)е~г имеем
+оо U+
I e-^F'ixit)) dt = - _ JeT,)p+1 I F'{y){y^u+Ydy = 0.
T* X*
Равенство нулю последнего интеграла верно в силу того, что G(x*) = 0.
Рассмотрим ip(t) при t G [0,г*). Функция x(s) = xqc~s является убывающей. Учитывая, что ж(т*) = х* > а, получаем x(s) > а при s G [t, г*], а значит, и F'(x(s)) > 0 при s G [t, г*]. Поэтому ip(t) < 0 при t G [0,г*). Свойство ф(т*) = 0 очевидно, x(s) = и+ + (xq — u+eT*)e~s при s ^ т*. Существует единственная точка в, такая, что х(в) = а. Функция F'(x(s)) > 0 при s G [т*,0), так как ж(з) > а при s G [т*,0), откуда i/>(i) > 0 при t G (т*,0). Функция F'(x(s)) < 0 при s G (0,+оо). Если t € [0, +оо), то
.....-
Т* Т* 0
в Н-оо Н-оо
т» в т»
Следовательно, i/>(i) > 0. Остается доказать, что lim ^(i) = 0. Применяя правило Лопиталя и учи-
t—>-+ос
тывая (7), имеем
t
lim Hm e* f F'(x(s)) ds = lim e {p+1)tF'(x(t)) = ^ F'(a:(*)) = ^
t-f+oo t-f+oo J t^+oо t-f+oo
T*
Последнее равенство верно, так как функция F'(-) ограничена. Лемма доказана. Из леммы 3 следует, что
u(t) = ü*(m) = \\
т* < t < +оо.
7. Решение краевой задачи в случае .г(, е (а, ж*]. Пара функций
+оо t
образует решение краевой задачи (6).
Лемма 4. Функция ip(t) обладает следуют,ими свойствами:
lim = о, > о vt > о.
t—>+oо
Лемма 4 доказывается аналогично лемме 3. Из леммы получаем
«(г) = и*{'ф{г)) = и+ ш^о.
Нетрудно заметить, что полученная пара («(¿),ж(£)) совпадает с парой (и*(£), ж*(£)), описанной в теореме 3.
Замечание 4. Теорема 3 верна и при более общих предположениях, когда класс допустимых управлений состоит из всех измеримых (по Лебегу) на [0, +оо) функций со значениями из отрезка [О, при этом предположение о выпуклости функции Р(х) оказывается излишним. Для доказательства теоремы в этом случае используется принцип максимума Понтрягина в классическом виде (без требования ф(+оо) = 0) и теорема существования оптимального управления [9]. Однако в данной работе применяется другой способ доказательства в силу его простоты и эффективности, оптимальность решения задачи (1) устанавливается прямой оценкой приращения функционала на основании методики, применяемой при доказательстве теоремы о достаточных условиях оптимальности [8]. Эта техника применима и в более сложных случаях, когда теорема существования неприменима. В п. 9 рассматривается пример, в котором функция Р(х) не является всюду дифференцируемой, несмотря на это, удается получить решение и доказать его оптимальность.
8. Доказательство теоремы 3. Рассмотрим произвольный допустимый процесс задачи (1)
й(г), ж(г), о < г < +оо.
Обозначим Ах(1) = х(1) — ж*(£). Докажем, что для приращения функционала А,1 имеет место неравенство
Д3 = ,Щ - ^ 0.
В силу произвольности пары (й(-),ж(-)) отсюда вытекает оптимальность пары («*(•),ж*(-)). Лемма 5. Для приралцения функционала верна следующая формула:
+ ОС
! [к(г,ж(г),^(г),й(г)) - м(г,ж*(г),?Яг)) - (м;(г,ж*(г),^(г)), Дж(г))] <й, (8)
о
где
М(г,х,ф)= шах К(г, х, = -е~р*Р{х) + ф(-х + и+Цф)),
г)£[0,и+]
Доказательство. Так как ж(0) = ж*(0) = хо, то Дж(0) = 0. В силу соотношения
= -е~р*Р'{х) - ф = ж, ф)
сопряженное уравнение допускает запись в форме ф = — ж,ф). Имеют место следующие равенства:
(#),Д ж(г)) = Д®(*)),
- ¿*(г)) = + «(*)) - + «*(*)) =
= к(г,х(г),ф(г),й(г)) + е~ргР(ж(г)) - к(г,х*(г),ф(г),и*(г)) - е~ргР(ж*(г)), используя которые находим
Ьоо +ос
0= (^(г),Дж(г))|^°°= I Д®(*))<й = I [(#), Дж(г)) + Дж(г))1 м =
о о
Ноо
- М(£, х*(1),ф(1)) - (М^Дж*^),^)), Дж(г))] <]Л + ,Щ - «/[и* откуда получаем формулу (8). Лемма 5 доказана.
Очевидно, что
K(t,x,ip(t),u) 5$ M(t,x,ip(t)) Ух G R, SG [0,«+],
поэтому
+оо
^AJ ^ j [M{t,x{t),${t)) -M(t,x,(t),i/>(t)) - (M'x(t,x,(t),i/>(t)),Ax(t))] dt. (9)
0
Функция
m(t, x) = M(t, x, ip(t)) = ^e~ptF(x) + 4/>(t)(-x + u+h(ip(t)))
является вогнутой функцией аргумента х в силу выпуклости функции F(x). Вогнутость функции означает выполнение неравенства
m(t, ж) — m(t, ж) — (m'x(t, ж), ж — х) ^ О Уж, ж G Д.
При ж = ж(t), x = x*(i) из последнего неравенства следует, что выражение в квадратных скобках в формуле (9) не превосходит нуля, поэтому A J ^ 0. Теорема 3 доказана.
9. Пример. Рассмотрим .Р(ж) = |ж — а|, в этом случае задача (1) может быть записана в виде
'ж = —ж + и, 0 ^ £ < +оо, ж(0) = жо,
+ ОС
<J= e-pt\x^a\dt -яшп, (Ю)
] «(•) о
10 < «(¿) < «+.
Эта задача является примером задачи (1), когда функция ж) не является всюду дифференцируемой, т.е. прямое применение принципа максимума в классическом виде невозможно. Заметим, что для задачи (10) теоремы 1 и 2 остаются верны, поэтому рассматривается только случай жо > а > и+. Введем обозначение
ж* = (а ^ и+) + и+ > а. Теорема 4. Оптимальное решение задачи (10) имеет вид:
1) если и+ < а < ха ^ ж*, то «*(£) = и+, ж*(£) = х+(1) Ш ^ 0;
2) если ж0 > ж*, а > и+, то
(+\ _ т*, , . _ Гж0е"*, 0 < £ < т*,
г... < / < Х*{1) ~ \«+ + (ж0 -и+еТ*)е~\ + ос,
гс>е г* = 1п ( — ) > 0. \х* /
Теорема 4 доказывается с помощью аналогичной техники, которая применялась для доказательства теоремы 3.
В заключение авторы выражают признательность профессору А. В. Дмитруку за постановку задачи (1) и за ряд полезных советов, а также доценту Ю. Н. Киселёву за ценные замечания, сделанные в ходе работы над статьей.
СПИСОК ЛИТЕРАТУРЫ
1. Ашманов С. А. Математические модели и методы в экономике. М.: Изд-во МГУ, 1980.
2. Киселёв Ю. Н., О р л о в М. В. Исследование одномерных оптимизационных моделей в случае бесконечного горизонта // Дифференц. уравн. 2004. 40. № 12. С. 1615-1628.
3. Solow R. М. Growth Theory: An Exposition. N. Y.: Oxford Univ. Press, 1970.
4. Essays on the Theory of Optimal Economic Growth / Ed. by K. Shell. Cambridge, Massachusetts: MIT Press, 1967.
5. Киселёв Ю.Н., Аввакумов C.H., Орлов M. В. Задача распределения ресурсов в двухсекторной экономической модели специального вида // Дифференц. уравн. 2009. 45. № 12. С. 1756-1774.
6. Shell К. Applications of Pontryagin's maximum principle to economics // Mathematical Systems Theory and Economics 1. Lecture Notes Oper. Res. and Math. Econ. V. 11. Berlin: Springer, 1969. P. 241-292.
7. Понтрягин JI. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. М.: Наука, 1961.
8. Киселёв Ю.Н. Достаточные условия оптимальности в терминах конструкций принципа максимума Понтрягина // Материалы научного семинара "Математические модели в экономике и биологии". М.: МАКС Пресс, 2003. С. 57-67.
Э.Асеев С. М., Кряжимский A.B. Принцип максимума Понтрягина и задачи оптимального экономического роста // Тр. Матем. ин-та РАН. 2007. 257. С. 3-271.
10. Асеев С.М., Кряжимский A.B., Тарасьев A.M. Принцип максимума Понтрягина и условия трансверсальности для одной задачи оптимального управления на бесконечном интервале // Тр. Матем. ин-та РАН. 2001. 233. С. 71-88.
Поступила в редакцию 21.06.11
INVESTIGATION OF SPECIAL RESOURCES ALLOCATION MODEL WITH INFINITE TIME HORIZON
Orlov M. V., Puchkova A. I.
In this paper the resources allocation model with infinite time horizon is considered. Applying Pontryagin's maximum principle the extremal solution is found and the optimality is proved using the sufficient optimality conditions theorem in the form of Pontryagin's maximum principle. Also the particular case of the model is studied, for this case the direct application of the classical maximum principle is impossible.
Keywords: optimal control, Pontryagin's maximum principle, sufficient optimality conditions, infinite time horizon.