Научная статья на тему 'Исследование одномерных задач распределения ресурсов на бесконечном промежутке времени'

Исследование одномерных задач распределения ресурсов на бесконечном промежутке времени Текст научной статьи по специальности «Математика»

CC BY
65
8
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Киселев Ю. Н., Орлов М. В.

В статье рассматриваются две управляемые нелинейные динамические модели распределения ресурсов в случае бесконечного горизонта. Для исследования обеих моделей применяется известный теоретический результат, который применим без всяких ограничений только к первой задаче. В каждой из моделей найдено оптимальное решение и обоснована их оптимальность.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Исследование одномерных задач распределения ресурсов на бесконечном промежутке времени»

УДК 517.977.5

Ю. Н. Киселев, М. В. Орлов

ИССЛЕДОВАНИЕ ОДНОМЕРНЫХ ЗАДАЧ РАСПРЕДЕЛЕНИЯ РЕСУРСОВ НА БЕСКОНЕЧНОМ ПРОМЕЖУТКЕ ВРЕМЕНИ1

(кафедра оптимального управления факультета ВМиК, e-mail: kiselev@cs.msu.su; orlov@cs.msu.su)

1. Введение. Рассмотрим задачу оптимального управления

' х = /о (ж) + fi(x)u, 0 ^ t < +оо, ж(0) = ж0 > О,

7 _ (1)

.J= е vt [ho (ж) + hi (ж) и] dt —> min .

J "(•)

о

Здесь ж и и — одномерные фазовая переменная и управление соответственно. Измеримая функция н(-), удовлетворяющая ограничению u(t) £ [0,1] для почти всех t ^ О, называется допустимым управлением, если соответствующий интеграл J задачи (1) сходится. Положительные параметры жо, v считаются заданными. Для задачи (1) справедлива следующая теорема. Теорема 1. Пусть в задаче (1) выполнены следующие условия:

1) функции /¿(ж), hi(ж), г = 0,1, определены на [0, +оо) и являются гладкими на (0,+оо), кроме того, \fi(x) \ > 0 \/ж > 0 (то. е. fi(x) сохраняет знак при ж > 0);

2) при всех t ^ 0 определены функции ж_(i) и ж + (t), где ж_(-) — траектория, отвечающая управлению и = 0, ж_|_(-) — траектория, отвечающая управлению и = 1, если /i(-) > 0, или ж_(-) — траектория, отвечающая управлению и = 1, ж+(-) — траектория, отвечающая управлению и = 0, если /i(-) < 0;

3) функция

W(x ) = /

МО

Л (О

о

определена при всех ж > 0;

4) d/гя любой допустимой траектории ж(-) выполняется предельное соотношение

lim = 0:

i-s> + oo 1

5) функция

ж) = ho (ж) — Н?'(ж)/о(ж) + vw(x)

имеет глобальный минимум на полупрямой (0, +оо), который достигается в единственной точке х £ (0,+оо). Кроме того, д'(ж) < 0 при ж £ (0, ж) и д'(х) > 0 при ж £ (ж,+оо);

6) выполняется двойное неравенство

/о (ж)

0 < --

^ 1.

х=х

fi(x)

Тогда оптимальная траектория xopt(-) в задаче (1) определяется равенством х0pt(t) = arg min g(ж), -^(i) = [ж_ (i), ж+(£)], 0 ^ t < +oo.

Оптимальное управление uopt(-) в задаче (1) имеет вид

_ xopt(t) - fo(xopt(t))

Uopt[)~ h{xoPm

в точках дифференцируемости траектории xopt(-).

1 Работа выполнена при поддержке грантов РНП 2.1.1.1714, НШ-7581.2006.1, РФФИ 05-01-00193.

Замечание 1. Теорема 1 является полным аналогом соответствующей теоремы для задачи на максимум, доказанной в статье [1].

Задачи вида (1) встречаются при исследовании экономических и биологических процессов [1-4]. В данной статье изучаются два примера: в первом выполнены все условия теоремы 1, а во втором не выполнено только условие 6. Первая задача является частным случаем одномерной оптимизационной модели Рамсея и допускает полное исследование с помощью теоремы 1.

2. Одномерная модель Рамсея на бесконечном горизонте. Оптимальные пропорции производства и потребления.

2.1. Постановка задачи. Рассматривается одномерная задача оптимального управления на бесконечном промежутке времени

Здесь ж и и — одномерные фазовая переменная и управление соответственно; измеримая функция и(-), удовлетворяющая ограничению 6 [0,1] для почти всех £ ^ О, называется допустимым управлением, если соответствующий интеграл .1 задачи (2) сходится; ¡1, V — заданные положительные константы. Дифференциальное уравнение в (2) описывает управляемую динамику основных фондов, управление и характеризует долю продукта, направляемую на производство, тогда как (1 — и) есть доля продукта, направляемая на потребление. Функционал ,1[и] характеризует дисконтированную стоимость продукта, направляемую на потребление.

Задача (2) является частным случаем задачи оптимального управления

которая называется упрощенной одномерной моделью Рамсея [5] об оптимальных пропорциях производства и потребления при /(ж) = у/х. В модели Рамсея требуется, чтобы функция /(ж) удовлетворяла неоклассическим условиям [5]. Легко проверить, что функция у[х удовлетворяет неоклассическим условиям.

2.2. Применение теоремы 1 к исследованию задачи (2). Перепишем задачу (2) в следующем эквивалентном виде, удобном для использования теоремы 1:

(3)

В данном случае

/0 (ж) = — ¡1 ж, /1(х) = л/х, /го (ж) = —л/х, к\(х) = у/х, ги( ж) = ж, д(х) = —у/х + (д + и)х = \/х( — 1 + (д + и)л/х),

1

Прямая проверка показывает, что все условия теоремы 1 выполнены. Применение указанной теоремы к задаче (2) позволяет найти оптимальное решение. Сформулируем окончательный результат.

Теорема 2 (вид оптимального решения в задаче (2)). Справедливы следующие утверждения.

1. При жо = х оптимальное управление иор£ и оптимальная траектория жор£ имеют вид

иорг(г) = и, 0 ^ Ь < +ос, хорЬ(Ь) = ж, 0 ^ Ь < +оо.

2. При жо > х оптимальное управление иор£ и оптимальная траектория жор£ имеют вид

р к' т < г < +ос, р к' \ ж, т < г < +ос,

где точка переключения

г=М-)>0

¡1 V ж /

определяется как корень уравнения ж_(г) = ж.

3. При 0 < жо < ж оптимальное управление иор4 и оптимальная траектория жор4 имеют вид

иоРл*) = \1> !? ХорЛ*) = \х+{^

р к' 1 и, т < г < +ос, р у 7 1 ж, г < г < +ос,

г<?е точка переключения определяется как корень уравнения ж +(т) = ж.

2 , /1 - Дд/ж^Х

г = - In -> 0

Д V 1 - ¿/Vi /

3. Исследование модельного примера на основе принципа максимума Понтрягина [6]. Построение сопряженной переменной; обоснование оптимальности решения. Единственность решения краевой задачи принципа максимума. В данном разделе изучается конкретная задача оптимального управления, к которой теорема 1 неприменима, так как не выполнено условие 6. Тем не менее задача допускает полное исследование.

3.1. Постановка задачи. Рассмотрим одномерную задачу оптимального управления на бесконечном горизонте:

ж = —ж + и, 0 ^ t < +оо, ж(0) = ж0 > О,

7 (х - 2)2 (4)

J = / е 1 --— dt min .

J 2 u(.)

о

Здесь ж и и — одномерные фазовая переменная и управление соответственно. Измеримая функция и(-), удовлетворяющая ограничению u(t) G [0,1] для почти всех t ^ 0, называется допустимым управлением, если соответствующий интеграл J задачи (4) сходится. Любая допустимая траектория x(t) удовлетворяет условию

x(t)£X(t), t ^ 0, (5)

где X(t) = [x_(t),x+(t)] — множество достижимости в момент времени t для данной управляемой системы, функции ж_(i), x+(t) являются траекториями динамической системы, отвечающими постоянным управлениям u(t) = 0 и u(t) = 1 соответственно:

ж_(í)=жoe"í, x+(t) = (ж0 - l)e_i + 1, t ^ 0. (6)

Введем (по образцу раздела 1 с очевидными изменениями) функцию

i(i) = arg^imn 0 ^ t < +оо, (7)

где ТУ(ж) = (ж — 2)2/2. В некоторых случаях функция (7) определяет оптимальную траекторию задачи (4); например, при жо ^ 2 имеем

+ оо +оо

x(t)=x+(t), u(t) = 1, J[û]= J e^Wix+it)) dt ^ J e^Wixit^dt

о 0

для любой допустимой траектории x(t), так как в рассматриваемом случае x(t) ^ x+(t) ^ 2 и W(x+(t)) ^ W{x{t)) для всех t ^ 0.

В случае же жо > 2 функция x(t), определяемая формулой (7), имеет вид

' (i),

x{t) = 2, n <t<T2, (8)

^X+(t), T2 ^t < +OC,

где точки ri = 1п(жо/2) и = 1п(жо — 1) определяются из условий: x_(ti) = 2, х+(т2) = 2, причем О < т\ < Г2 при жо > 2. Функцию (8) нельзя рассматривать как допустимую траекторию задачи (4): участок ж(t) = 2, т\ < t < т2, может быть реализован лишь при управлении н(£) = 2 ^ [0,1], нарушающем геометрическое ограничение на управление в исходной задаче. Таким образом, формальное применение формулы (7) не приводит к построению оптимального решения. При жо > 2 нарушено условие 6 теоремы 1.

3.2. Применение принципа максимума Понтрягина. Краевая задача принципа максимума. Записываем функцию Гамильтона-Понтрягина для задачи (4)

К(t, ж, ф, и) = - 2)2 + ф(-х + и). (9)

Находим максимизатор

и*(ф) = argmax К^,х,ф,и) (10)

«£[0,1]

функции К] получаем

m /О, Ф< О,

M*w = |l, ф > О,

т.е. максимизатор и*(ф) = 1г(ф), где h(-) — функция Хевисайда. Находим функцию Гамильтона (функцию максимума)

M(t, ж, ф) = К\u=ut {ф) = -\e~\x - 2)2 - фх + ф1г(ф). (11)

Отметим, что функция (11) вогнута по аргументу ж при любых t и ф. Краевая задача принципа максимума для задачи (4) имеет вид

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ж = —ж + 1г(ф), ж(0) = жо,

ф = ф + е~\х - 2), ф(+оо)=0

-и, ^ (12)

Построение оптимального решения задачи (4) связано с нахождением решения краевой задачи (12). Ниже предъявляется решение

ж (г), 0^t<+oo, (13)

задачи (12) и отдельными рассуждениями производится обоснование оптимальности порождаемого им процесса

х(г), и(г) = Цф^)), о ^ ^ <+оо. (14)

Отдельно рассматриваются случаи жо ^ 5/2 и жо > 5/2.

3.3. Случай жо ^ 5/2. Построение решения (13) краевой задачи (12). Обоснование оптимальности процесса (14). Решение краевой задачи (12) в рассматриваемом случае жо ^ 5/2 имеет вид

ж= (ж0 - 1)е~г + 1 = ж_|_,

= + (15)

г е [о, +оо)

ж(0) = жо, ^¡x(t) = -x(t)+ü(t), ü(t) G [0,1],

(18)

со свойствами

>(0) = + ± ^ О,

Ф(ь) > о Vi > о, (16)

lim ib(t) = 0. _ i-s> + oo

Решение (15) порождает экстремальный процесс

x(t)=x+(t), u(t) = h(ip(t)) = 1, 0 ^ t < +оо. (17)

Докажем оптимальность процесса (17). Рассмотрим произвольный допустимый процесс

:(t), ü(t), 0 ^ t < +оо,

>> dt'' и введем приращения

Ax(t) = x(t) - x(t), Аu(t) = ü(t) - u(t), AJ = J[ü]-J[u]

для траектории, управления и функционала соответственно. Покажем, что имеет место неравенство

AJ ^ 0 (19)

при любом допустимом процессе (18); неравенство (19) означает оптимальность процесса (17).

Привлекая методику статьи [7], представим приращение функционала, взятое со знаком минус, в форме

+ оо

-AJ = j ^K(t,x(t), Ij)(t),ü(t)) - M(t,x(t), ф{Ь)) - M'x(t,x(t), ij(t))Ax(t)}dt. (20)

о

Используя формулу (9) для К, формулу (11) для М и формулу для частной производной

М'х(г,х,ф) = -е-*(х- 2)-ф, преобразуем интегрант в правой части формулы (20). Находим, что он равен выражению

1

— — е ь(х — 2)2 — фх + фи —

— — е (ж - 2у -фх + ф1ъ{ф)

- [—е (ж - 2) - ф] Ах =

= —[(ж - 2)2 - (ж - 2)2 - (ж - 2) Аж] - ф(х - х) + фАх + ф(й - 1г(ф)) = (Аж)2 - ф{Цф) - и).

Отсюда следует, что

+ оо +оо

е~\Ах(t))2dt+ j ф{Ь){к{ф{Ь)) - ü(t))dt. (21)

о о

Интегрант второго интеграла неотрицателен в силу условия максимума. Тот же вывод следует из того, что

ф{1){1г{ф{1)) - Щ) = ф{1){ 1 - Щ) > 0, (22)

так как в силу (16) и (18) имеем ф{Ь) > 0, 1 — и(£) ^ 0 при £ > 0. Из (21), (22) вытекает требуемое неравенство (19) для приращения функционала. Таким образом, показано, что процесс (17), построенный на основе принципа максимума, является оптимальным в случае жо ^ 5/2. Случай жо ^ 2 был рассмотрен выше на основе формулы (7). Случай 2<жо^5/2с помощью формулы (7) исследован быть не может.

3.4. Случай жо > 5/2. Построение решения краевой задачи (12). Обоснование оптимальности процесса (14). В случае жо > 5/2 пара функций

( ] _ ¡х0е~*, 0 ^ г,

1 ; ~ I (х0 ~ ет)е~* + 1, т <Ь < +ос,

Ш _ { '^ " е"2Т] е* - ^е"2' + в"*, 0 ^ г,

с параметром

г = 1п(2ж0/5) > 0 (25)

образует решение краевой задачи (12). Функция (24) обладает свойствами

фЦ) <0, 0 iC t < т, ф(т) = 0, Зф(т + 0) = ф(т - 0) > О,

Ф(г) >о, Г < t < +оо, Угь>

lim ф(г) = 0.

s t—> + оо

Решению (23), (24), (25) отвечает экстремальный процесс

*(*), u(t) = НФ(г)) = [I (27)

Для приращения АJ функционала получаем, так же как в предыдущем подразделе, выражение

+ оо +оо

e_i(Ax(t))2dt + J ij)(t)(h(il)(t))-ü(t))dt, (28)

о о

причем второй интегрант неотрицателен:

фШкШЬ)) - u(t)) = max ф(г)и - фШй(г) ^ 0. (29)

«£[0,1]

Из (28) и (29) следует неравенство

A J ^ 0,

которое доказывает оптимальность процесса (27). Случай жо > 5/2 рассмотрен полностью.

3.5. Единственность решения краевой задачи (12). Предположим, что наряду с построенным решением

x(t), ф(г), 0 ^ t < +ос, (30)

краевой задачи (12) имеется другое ее решение

x(t), фН), 0 ^ t < +оо. (31)

Решениям (30), (31) отвечают экстремальные управления

иЦ) = к{фЦ)), (32)

u{t) = h{i){t)). (33)

Запишем аналог формулы (28) для приращения функционала

+ оо +оо

J[u]-J[u] = ^j e-\S:(t) - x(t))2 dt + J ф(Ь) (Цф(t)) - u(t)) dt = о 0

+ oo +00

= ^ J e"'(Ai(i))2 dt+ J ф(£)(и(£) - u(t)) dt,

и аналогично, меняя ролями и ж и, получаем

+ оо +оо

J[u]-J[ü] = ^ I е~г (Ax(t))2 dt + I фН)(ЦфН)) - u(t))dt.

о о

Почленное сложение последних двух равенств дает

+ оо +оо +оо

о=у е~г(Ах(г))2 <и+ у ф(г)(и(г)-й(г))<и+ у ФЦ){Щ - и(ь)) м. (34)

0 0 о

В силу неотрицательности трех интегралов в (34) получаем, что каждый из них равен нулю. В частности,

+ оо

J (Ax(t))2 dt = О,

откуда следует, что

Ax(t) ее 0. (35)

Приращение Аф{£) = ф{£) — ф{Ь) удовлетворяет условиям

iA^(i) = A^(i) + e-iAa;(i), , ,

\Д^(+оо) = 0. [6Ь)

Из (36), (35) получаем

ее 0. (37)

Полученные соотношения (35), (37) доказывают единственность решения краевой задачи (12): x(t) =

= x(t), ф(Ь) = ф{£). Это позволяет сделать вывод о единственности оптимального решения.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В заключение авторы выражают признательность профессору A.B. Дмитруку, обратившему их

внимание на задачи типа (4).

СПИСОК ЛИТЕРАТУРЫ

1. Киселев Ю.Н., Орлов М.В. Исследование одномерных оптимизационных моделей в случае бесконечного горизонта // Диф. ур-ния. 2004. 40. № 12. С. 1615-1628.

2. Киселев Ю.Н., Орлов М.В. Задачи оптимального управления с особыми режимами для одной модели из микробиологии // Вестн. Моск. ун-та. Сер. 15. Вычисл. матем. и киберн. 1998. № 3. С. 23-26.

3. Berg Н. van den, Kiselev Yu.N., Kooijman S.A.L.M., Orlov M.V. Optimal allocation between nutrient uptake and growth in a microbial trichome //J. Math. Biol. 1998. 37. P. 28-48.

4. Киселев Ю.Н., Орлов М.В. Анализ математических моделей в случае бесконечного горизонта// Материалы научного семинара "Математические модели в экономике и биологии". М.: МАКС Пресс, 2003. С. 72-74.

5. Ашманов С. А. Математические модели и методы в экономике. М.: Изд-во МГУ, 1980.

6. Понтрягин Л. С., Б о л т я н с к и й В. Г., Г а м к р е л и д з е Р.В., Мищенко Е. Ф. Математическая теория оптимальных процессов. М., 1961.

7. Киселев Ю.Н. Достаточные условия оптимальности в терминах конструкций принципа максимума Понтрягина // Материалы научного семинара "Математические модели в экономике и биологии". М.: МАКС Пресс, 2003. С. 57-67.

Поступила в редакцию 13.09.06

i Надоели баннеры? Вы всегда можете отключить рекламу.