УДК 517.977.5
Ю. Н. Киселев, М. В. Орлов
ИССЛЕДОВАНИЕ ОДНОМЕРНЫХ ЗАДАЧ РАСПРЕДЕЛЕНИЯ РЕСУРСОВ НА БЕСКОНЕЧНОМ ПРОМЕЖУТКЕ ВРЕМЕНИ1
(кафедра оптимального управления факультета ВМиК, e-mail: kiselev@cs.msu.su; orlov@cs.msu.su)
1. Введение. Рассмотрим задачу оптимального управления
' х = /о (ж) + fi(x)u, 0 ^ t < +оо, ж(0) = ж0 > О,
7 _ (1)
.J= е vt [ho (ж) + hi (ж) и] dt —> min .
J "(•)
о
Здесь ж и и — одномерные фазовая переменная и управление соответственно. Измеримая функция н(-), удовлетворяющая ограничению u(t) £ [0,1] для почти всех t ^ О, называется допустимым управлением, если соответствующий интеграл J задачи (1) сходится. Положительные параметры жо, v считаются заданными. Для задачи (1) справедлива следующая теорема. Теорема 1. Пусть в задаче (1) выполнены следующие условия:
1) функции /¿(ж), hi(ж), г = 0,1, определены на [0, +оо) и являются гладкими на (0,+оо), кроме того, \fi(x) \ > 0 \/ж > 0 (то. е. fi(x) сохраняет знак при ж > 0);
2) при всех t ^ 0 определены функции ж_(i) и ж + (t), где ж_(-) — траектория, отвечающая управлению и = 0, ж_|_(-) — траектория, отвечающая управлению и = 1, если /i(-) > 0, или ж_(-) — траектория, отвечающая управлению и = 1, ж+(-) — траектория, отвечающая управлению и = 0, если /i(-) < 0;
3) функция
W(x ) = /
МО
Л (О
о
определена при всех ж > 0;
4) d/гя любой допустимой траектории ж(-) выполняется предельное соотношение
lim = 0:
i-s> + oo 1
5) функция
ж) = ho (ж) — Н?'(ж)/о(ж) + vw(x)
имеет глобальный минимум на полупрямой (0, +оо), который достигается в единственной точке х £ (0,+оо). Кроме того, д'(ж) < 0 при ж £ (0, ж) и д'(х) > 0 при ж £ (ж,+оо);
6) выполняется двойное неравенство
/о (ж)
0 < --
^ 1.
х=х
fi(x)
Тогда оптимальная траектория xopt(-) в задаче (1) определяется равенством х0pt(t) = arg min g(ж), -^(i) = [ж_ (i), ж+(£)], 0 ^ t < +oo.
Оптимальное управление uopt(-) в задаче (1) имеет вид
_ xopt(t) - fo(xopt(t))
Uopt[)~ h{xoPm
в точках дифференцируемости траектории xopt(-).
1 Работа выполнена при поддержке грантов РНП 2.1.1.1714, НШ-7581.2006.1, РФФИ 05-01-00193.
Замечание 1. Теорема 1 является полным аналогом соответствующей теоремы для задачи на максимум, доказанной в статье [1].
Задачи вида (1) встречаются при исследовании экономических и биологических процессов [1-4]. В данной статье изучаются два примера: в первом выполнены все условия теоремы 1, а во втором не выполнено только условие 6. Первая задача является частным случаем одномерной оптимизационной модели Рамсея и допускает полное исследование с помощью теоремы 1.
2. Одномерная модель Рамсея на бесконечном горизонте. Оптимальные пропорции производства и потребления.
2.1. Постановка задачи. Рассматривается одномерная задача оптимального управления на бесконечном промежутке времени
Здесь ж и и — одномерные фазовая переменная и управление соответственно; измеримая функция и(-), удовлетворяющая ограничению 6 [0,1] для почти всех £ ^ О, называется допустимым управлением, если соответствующий интеграл .1 задачи (2) сходится; ¡1, V — заданные положительные константы. Дифференциальное уравнение в (2) описывает управляемую динамику основных фондов, управление и характеризует долю продукта, направляемую на производство, тогда как (1 — и) есть доля продукта, направляемая на потребление. Функционал ,1[и] характеризует дисконтированную стоимость продукта, направляемую на потребление.
Задача (2) является частным случаем задачи оптимального управления
которая называется упрощенной одномерной моделью Рамсея [5] об оптимальных пропорциях производства и потребления при /(ж) = у/х. В модели Рамсея требуется, чтобы функция /(ж) удовлетворяла неоклассическим условиям [5]. Легко проверить, что функция у[х удовлетворяет неоклассическим условиям.
2.2. Применение теоремы 1 к исследованию задачи (2). Перепишем задачу (2) в следующем эквивалентном виде, удобном для использования теоремы 1:
(3)
В данном случае
/0 (ж) = — ¡1 ж, /1(х) = л/х, /го (ж) = —л/х, к\(х) = у/х, ги( ж) = ж, д(х) = —у/х + (д + и)х = \/х( — 1 + (д + и)л/х),
—
1
Прямая проверка показывает, что все условия теоремы 1 выполнены. Применение указанной теоремы к задаче (2) позволяет найти оптимальное решение. Сформулируем окончательный результат.
Теорема 2 (вид оптимального решения в задаче (2)). Справедливы следующие утверждения.
1. При жо = х оптимальное управление иор£ и оптимальная траектория жор£ имеют вид
иорг(г) = и, 0 ^ Ь < +ос, хорЬ(Ь) = ж, 0 ^ Ь < +оо.
2. При жо > х оптимальное управление иор£ и оптимальная траектория жор£ имеют вид
р к' т < г < +ос, р к' \ ж, т < г < +ос,
где точка переключения
г=М-)>0
¡1 V ж /
определяется как корень уравнения ж_(г) = ж.
3. При 0 < жо < ж оптимальное управление иор4 и оптимальная траектория жор4 имеют вид
иоРл*) = \1> !? ХорЛ*) = \х+{^
р к' 1 и, т < г < +ос, р у 7 1 ж, г < г < +ос,
г<?е точка переключения определяется как корень уравнения ж +(т) = ж.
2 , /1 - Дд/ж^Х
г = - In -> 0
Д V 1 - ¿/Vi /
3. Исследование модельного примера на основе принципа максимума Понтрягина [6]. Построение сопряженной переменной; обоснование оптимальности решения. Единственность решения краевой задачи принципа максимума. В данном разделе изучается конкретная задача оптимального управления, к которой теорема 1 неприменима, так как не выполнено условие 6. Тем не менее задача допускает полное исследование.
3.1. Постановка задачи. Рассмотрим одномерную задачу оптимального управления на бесконечном горизонте:
ж = —ж + и, 0 ^ t < +оо, ж(0) = ж0 > О,
7 (х - 2)2 (4)
J = / е 1 --— dt min .
J 2 u(.)
о
Здесь ж и и — одномерные фазовая переменная и управление соответственно. Измеримая функция и(-), удовлетворяющая ограничению u(t) G [0,1] для почти всех t ^ 0, называется допустимым управлением, если соответствующий интеграл J задачи (4) сходится. Любая допустимая траектория x(t) удовлетворяет условию
x(t)£X(t), t ^ 0, (5)
где X(t) = [x_(t),x+(t)] — множество достижимости в момент времени t для данной управляемой системы, функции ж_(i), x+(t) являются траекториями динамической системы, отвечающими постоянным управлениям u(t) = 0 и u(t) = 1 соответственно:
ж_(í)=жoe"í, x+(t) = (ж0 - l)e_i + 1, t ^ 0. (6)
Введем (по образцу раздела 1 с очевидными изменениями) функцию
i(i) = arg^imn 0 ^ t < +оо, (7)
где ТУ(ж) = (ж — 2)2/2. В некоторых случаях функция (7) определяет оптимальную траекторию задачи (4); например, при жо ^ 2 имеем
+ оо +оо
x(t)=x+(t), u(t) = 1, J[û]= J e^Wix+it)) dt ^ J e^Wixit^dt
о 0
для любой допустимой траектории x(t), так как в рассматриваемом случае x(t) ^ x+(t) ^ 2 и W(x+(t)) ^ W{x{t)) для всех t ^ 0.
В случае же жо > 2 функция x(t), определяемая формулой (7), имеет вид
' (i),
x{t) = 2, n <t<T2, (8)
^X+(t), T2 ^t < +OC,
где точки ri = 1п(жо/2) и = 1п(жо — 1) определяются из условий: x_(ti) = 2, х+(т2) = 2, причем О < т\ < Г2 при жо > 2. Функцию (8) нельзя рассматривать как допустимую траекторию задачи (4): участок ж(t) = 2, т\ < t < т2, может быть реализован лишь при управлении н(£) = 2 ^ [0,1], нарушающем геометрическое ограничение на управление в исходной задаче. Таким образом, формальное применение формулы (7) не приводит к построению оптимального решения. При жо > 2 нарушено условие 6 теоремы 1.
3.2. Применение принципа максимума Понтрягина. Краевая задача принципа максимума. Записываем функцию Гамильтона-Понтрягина для задачи (4)
К(t, ж, ф, и) = - 2)2 + ф(-х + и). (9)
Находим максимизатор
и*(ф) = argmax К^,х,ф,и) (10)
«£[0,1]
функции К] получаем
m /О, Ф< О,
M*w = |l, ф > О,
т.е. максимизатор и*(ф) = 1г(ф), где h(-) — функция Хевисайда. Находим функцию Гамильтона (функцию максимума)
M(t, ж, ф) = К\u=ut {ф) = -\e~\x - 2)2 - фх + ф1г(ф). (11)
Отметим, что функция (11) вогнута по аргументу ж при любых t и ф. Краевая задача принципа максимума для задачи (4) имеет вид
ж = —ж + 1г(ф), ж(0) = жо,
ф = ф + е~\х - 2), ф(+оо)=0
-и, ^ (12)
Построение оптимального решения задачи (4) связано с нахождением решения краевой задачи (12). Ниже предъявляется решение
ж (г), 0^t<+oo, (13)
задачи (12) и отдельными рассуждениями производится обоснование оптимальности порождаемого им процесса
х(г), и(г) = Цф^)), о ^ ^ <+оо. (14)
Отдельно рассматриваются случаи жо ^ 5/2 и жо > 5/2.
3.3. Случай жо ^ 5/2. Построение решения (13) краевой задачи (12). Обоснование оптимальности процесса (14). Решение краевой задачи (12) в рассматриваемом случае жо ^ 5/2 имеет вид
ж= (ж0 - 1)е~г + 1 = ж_|_,
= + (15)
г е [о, +оо)
ж(0) = жо, ^¡x(t) = -x(t)+ü(t), ü(t) G [0,1],
(18)
со свойствами
>(0) = + ± ^ О,
Ф(ь) > о Vi > о, (16)
lim ib(t) = 0. _ i-s> + oo
Решение (15) порождает экстремальный процесс
x(t)=x+(t), u(t) = h(ip(t)) = 1, 0 ^ t < +оо. (17)
Докажем оптимальность процесса (17). Рассмотрим произвольный допустимый процесс
:(t), ü(t), 0 ^ t < +оо,
>> dt'' и введем приращения
Ax(t) = x(t) - x(t), Аu(t) = ü(t) - u(t), AJ = J[ü]-J[u]
для траектории, управления и функционала соответственно. Покажем, что имеет место неравенство
AJ ^ 0 (19)
при любом допустимом процессе (18); неравенство (19) означает оптимальность процесса (17).
Привлекая методику статьи [7], представим приращение функционала, взятое со знаком минус, в форме
+ оо
-AJ = j ^K(t,x(t), Ij)(t),ü(t)) - M(t,x(t), ф{Ь)) - M'x(t,x(t), ij(t))Ax(t)}dt. (20)
о
Используя формулу (9) для К, формулу (11) для М и формулу для частной производной
М'х(г,х,ф) = -е-*(х- 2)-ф, преобразуем интегрант в правой части формулы (20). Находим, что он равен выражению
1
— — е ь(х — 2)2 — фх + фи —
— — е (ж - 2у -фх + ф1ъ{ф)
- [—е (ж - 2) - ф] Ах =
= —[(ж - 2)2 - (ж - 2)2 - (ж - 2) Аж] - ф(х - х) + фАх + ф(й - 1г(ф)) = (Аж)2 - ф{Цф) - и).
Отсюда следует, что
+ оо +оо
е~\Ах(t))2dt+ j ф{Ь){к{ф{Ь)) - ü(t))dt. (21)
о о
Интегрант второго интеграла неотрицателен в силу условия максимума. Тот же вывод следует из того, что
ф{1){1г{ф{1)) - Щ) = ф{1){ 1 - Щ) > 0, (22)
так как в силу (16) и (18) имеем ф{Ь) > 0, 1 — и(£) ^ 0 при £ > 0. Из (21), (22) вытекает требуемое неравенство (19) для приращения функционала. Таким образом, показано, что процесс (17), построенный на основе принципа максимума, является оптимальным в случае жо ^ 5/2. Случай жо ^ 2 был рассмотрен выше на основе формулы (7). Случай 2<жо^5/2с помощью формулы (7) исследован быть не может.
3.4. Случай жо > 5/2. Построение решения краевой задачи (12). Обоснование оптимальности процесса (14). В случае жо > 5/2 пара функций
( ] _ ¡х0е~*, 0 ^ г,
1 ; ~ I (х0 ~ ет)е~* + 1, т <Ь < +ос,
Ш _ { '^ " е"2Т] е* - ^е"2' + в"*, 0 ^ г,
с параметром
г = 1п(2ж0/5) > 0 (25)
образует решение краевой задачи (12). Функция (24) обладает свойствами
фЦ) <0, 0 iC t < т, ф(т) = 0, Зф(т + 0) = ф(т - 0) > О,
Ф(г) >о, Г < t < +оо, Угь>
lim ф(г) = 0.
s t—> + оо
Решению (23), (24), (25) отвечает экстремальный процесс
*(*), u(t) = НФ(г)) = [I (27)
Для приращения АJ функционала получаем, так же как в предыдущем подразделе, выражение
+ оо +оо
e_i(Ax(t))2dt + J ij)(t)(h(il)(t))-ü(t))dt, (28)
о о
причем второй интегрант неотрицателен:
фШкШЬ)) - u(t)) = max ф(г)и - фШй(г) ^ 0. (29)
«£[0,1]
Из (28) и (29) следует неравенство
A J ^ 0,
которое доказывает оптимальность процесса (27). Случай жо > 5/2 рассмотрен полностью.
3.5. Единственность решения краевой задачи (12). Предположим, что наряду с построенным решением
x(t), ф(г), 0 ^ t < +ос, (30)
краевой задачи (12) имеется другое ее решение
x(t), фН), 0 ^ t < +оо. (31)
Решениям (30), (31) отвечают экстремальные управления
иЦ) = к{фЦ)), (32)
u{t) = h{i){t)). (33)
Запишем аналог формулы (28) для приращения функционала
+ оо +оо
J[u]-J[u] = ^j e-\S:(t) - x(t))2 dt + J ф(Ь) (Цф(t)) - u(t)) dt = о 0
+ oo +00
= ^ J e"'(Ai(i))2 dt+ J ф(£)(и(£) - u(t)) dt,
и аналогично, меняя ролями и ж и, получаем
+ оо +оо
J[u]-J[ü] = ^ I е~г (Ax(t))2 dt + I фН)(ЦфН)) - u(t))dt.
о о
Почленное сложение последних двух равенств дает
+ оо +оо +оо
о=у е~г(Ах(г))2 <и+ у ф(г)(и(г)-й(г))<и+ у ФЦ){Щ - и(ь)) м. (34)
0 0 о
В силу неотрицательности трех интегралов в (34) получаем, что каждый из них равен нулю. В частности,
+ оо
J (Ax(t))2 dt = О,
откуда следует, что
Ax(t) ее 0. (35)
Приращение Аф{£) = ф{£) — ф{Ь) удовлетворяет условиям
iA^(i) = A^(i) + e-iAa;(i), , ,
\Д^(+оо) = 0. [6Ь)
Из (36), (35) получаем
ее 0. (37)
Полученные соотношения (35), (37) доказывают единственность решения краевой задачи (12): x(t) =
= x(t), ф(Ь) = ф{£). Это позволяет сделать вывод о единственности оптимального решения.
В заключение авторы выражают признательность профессору A.B. Дмитруку, обратившему их
внимание на задачи типа (4).
СПИСОК ЛИТЕРАТУРЫ
1. Киселев Ю.Н., Орлов М.В. Исследование одномерных оптимизационных моделей в случае бесконечного горизонта // Диф. ур-ния. 2004. 40. № 12. С. 1615-1628.
2. Киселев Ю.Н., Орлов М.В. Задачи оптимального управления с особыми режимами для одной модели из микробиологии // Вестн. Моск. ун-та. Сер. 15. Вычисл. матем. и киберн. 1998. № 3. С. 23-26.
3. Berg Н. van den, Kiselev Yu.N., Kooijman S.A.L.M., Orlov M.V. Optimal allocation between nutrient uptake and growth in a microbial trichome //J. Math. Biol. 1998. 37. P. 28-48.
4. Киселев Ю.Н., Орлов М.В. Анализ математических моделей в случае бесконечного горизонта// Материалы научного семинара "Математические модели в экономике и биологии". М.: МАКС Пресс, 2003. С. 72-74.
5. Ашманов С. А. Математические модели и методы в экономике. М.: Изд-во МГУ, 1980.
6. Понтрягин Л. С., Б о л т я н с к и й В. Г., Г а м к р е л и д з е Р.В., Мищенко Е. Ф. Математическая теория оптимальных процессов. М., 1961.
7. Киселев Ю.Н. Достаточные условия оптимальности в терминах конструкций принципа максимума Понтрягина // Материалы научного семинара "Математические модели в экономике и биологии". М.: МАКС Пресс, 2003. С. 57-67.
Поступила в редакцию 13.09.06