УПРАВЛЯЕМЫЕ СИСТЕМЫ И МЕТОДЫ ОПТИМИЗАЦИИ
УДК 517.977
DOI: 10.18101/2304-5728-2019-1-3-12
РЕШЕНИЕ ОДНОЙ ЗАДАЧИ ОПТИМАЛЬНОГО РАСПРЕДЕЛЕНИЯ РЕСУРСОВ
© Аксенюшкина Елена Владимировна
кандидат физико-математических наук, доцент, Байкальский государственный университет Россия, 664003, г. Иркутск, ул. Ленина, 11 E-mail: [email protected]
Рассматривается обобщенный вариант билинейной задачи оптимального пла -нирования инвестиций. Экономическая интерпретация этой постановки представляет собой упрощенный вариант общей задачи распределения ресурсов в двухсекторной экономической модели специального вида. На основе классического принципа максимума получены условия на параметры задачи, сохраняющие простейшую структуру экстремального управления, в которой отсутствуют особые участки магистрального типа. Фактически эти условия обеспечивают «корректность» единственной точки переключения экстремального управления. В данном случае эта точка является единственным корнем нелинейного уравнения с экспонентой, которое имеет удобную структуру для итерационного поиска решения. Получены условия на конечное время, которые характеризуют стратегии долгосрочного и краткосрочного планирования. Поскольку рассмотренная задача является невыпуклой, то проведен дополнительный анализ на предмет оптимальности экстремальных управлений. Свойство оптимальности построенных управлений проверяется с помощью достаточных условий, которые получены на основе точных формул приращения функционала, использующих фазовую вогнутость функции Понтрягина и сильную экстремальность управления.
Ключевые слова: невыпуклая задача оптимального управления; принцип максимума; точка переключения; достаточные условия оптимальности.
Для цитирования:
Аксенюшкина Е. В. Решение одной задачи оптимального распределения ресурсов // Вестник Бурятского государственного университета. Математика, информатика. 2019. № 1. С. 3-12.
Введение
Рассмотрим следующую задачу оптимального управления:
т
F(u) = J e gt (1 - u(t)) xe(t )dt ® max, u eV, (1)
0
x = auxe , x(0) = x0, V = (u(-) e C([0; T]), u(t) e [0;1], t e [0; T]}.
Здесь X е [0, Т] — время, и (X) — управление, х(Х) — фазовая траектория, С([0, Т]) — пространство кусочно-непрерывных функций на [0, Т], V — множество допустимых управлений. Выделим параметры задачи (1): у ; а > 0; ее (0,1); х0 > 0; Т > 0 .
В содержательной интерпретации данная постановка представляет собой упрощенный вариант общей задачи распределения ресурсов в двух-секторной экономической модели специального вида [1; 2]. В свою очередь, частный случай задачи (1) при у = 0, е = 1 (билинейная задача оптимального планирования инвестиций) хорошо изучен в литературе и часто представляется в качестве методического примера использования принципа максимума.
В этом случае оптимальное управление имеет вид
(х) Г1, X е[0,т),
и* (X) = <
[0, X е (г, Т],
- т 1
с точкой переключения г = Т--.
а
В данной статье для рассмотренной нелинейной задачи (1) найдены условия на параметры, при которых оптимальное управление сохраняет указанную структуру без появления особых участков магистрального ти -па. При этом точка переключения г является единственным корнем нелинейного уравнения, которое представляется в виде, удобном для итераций. Сохраняются привычные условия на конечный момент Т : долгосрочное планирование (г е (0, Т)) и «малые» Т (г = 0).
Результаты аналогичного характера представлены в [3-7].
1 Необходимые соотношения
Приведем для задачи (1) основные соотношения, связанные с принципом максимума [8; 9].
Функция Понтрягина представляется формулой
Н (у, х, и, X) = уаихе + еу (1 - и) хе = хе (у а и + еух (1 - и)).
Отсюда получаем
Ни (у, х, X) = хе(ау-еу).
Сопряженное уравнение имеет вид
ут =--ее-— (а у и + еу (1 - и)), у(Т) = 0.
х
Обозначим g(ц, X) = ау-еу и перепишем сопряженное уравнение
У = —^7(еуХ + ug(у, X)), у(Т) = 0. (2)
х1 е
Н -максимизирующее управление, имеет вид
и* (у, X, X) =
(3)
0, g(у, X) хЕ < 0, [1, g(у, X) х£ > 0.
Если g(у, X) хе = 0 , то и* (у, х, X) е [0; 1].
Проведем упрощение этой формулы с учетом характера фазовых тра -екторий. Пусть и(-) е V — произвольное допустимое управление. Соответствующее фазовое уравнение имеет вид
X (X) = аи (X) Xе (X), х (0) = х 0. Его решение представляется формулой
х($) =
-1-е
+ (1 - е)а | и (т)ёт
1
1-е
X е [0; Т] (4)
Действительно, проведем проверку:
х(0) = х0,
х^) =
1
1 -е
1-е
I
+ (1 - е)а | и (т)ёт
1-е
■ (1 -е)аи^) = аи^)хе (X).
и* (у, X) = -
Таким образом, формула (4) для х^) справедлива. Из нее, в частности, следует, что х^,и) > 0, X е [0; Т] для любого управления и() е V .
Рассмотрим формулу (3) в области х > 0 . Поскольку хе > 0, то максимизирующее управление не зависит от фазовой переменной, т. е. имеет место представление
[0, g(y, X) < 0, [1, g(у, X) > 0. Если g(у, X) = 0 , то и* (у, X) е [0; 1]. Отметим, что
[ 0, g (у, X) < 0, и (у, X), g (у, X) > 0,
т. е. и* (у, X)g(у, X) = тах{0, g(у, X)} = g + (у, X).
Сопряженное уравнение (2) при и = и* (у, X) принимает вид
е
и*(у, X^(у, X) = -
у =
-1-е
(в^ + g+ (у, X)), у(Т) = 0.
(5)
Пусть x(X), X е [0; Т] — произвольная фазовая траектория, у^) — решение сопряженного уравнения (5) при х = х(^). Тогда имеет место свойство монотонного убывания
е
у/ (X) =--— (еух + g + (у (X), X)) < 0, х е [0; Т).
х(х )1-е
Поскольку у (Т) = 0, то у (X) > 0, X е [0; Т).
Таким образом, для любой фазовой траектории х(х) и Н - максимизирующего управления и* (у, X) — соответствующее решение сопряженного уравнения монотонно убывает на [0, Т) и положительно: у/(X) < 0, у(х) > 0, X е [0, Т) . В частности, это свойство справедливо для любого экстремального управления и(X) задачи (1), поскольку и(X) = и* (у(х, и), X), X е [0, Т], причем
у(X, и) =--— (е ^ + g + (у(X, и), X)), у(Т, и) = 0. (6)
х(х, и)1
Кроме того, отметим, что функция переключения экстремального управления
g(y(X, и), X) = а у(х, и) - еух, X е [0, Т]
в конечный момент времени X = Т отрицательна: g(y(T, и), Т) = — еуТ < 0. С учетом ее непрерывности по X заключаем: найдется такое 5 > 0, что g(w(X, и), X) < 0, X е (Т — 5, Т]. Это значит, что на «финишном» промежутке по времени любое экстремальное управление равно нулю.
2 Построение экстремального управления
Для некоторого экстремального управления и (X) рассмотрим функцию переключения g(у(х, и), X), X е [0, Т], где у(х, и) — решение уравнения (6) с фазовой траекторией х(х, и), которая выражается по формуле (4). Найдем производную
dg(у(х, и), X) = а у/(X, и) — уеух, X е [0, Т] dх
и рассмотрим первый случай, когда параметр у положителен: у > 0 . Тогда производная меньше нуля, т. е. функция переключения монотонно убывает на отрезке [0, Т] с отрицательным значением в конечный момент Т . Выделим точку т < Т , в которой
g(у(т, и), т) = 0 ^ у(т, и) = — еут .
а
Предположим, что т > 0 , т. е.
g(у(х, и), X) > 0, X е[0,т), g(у(х, и), X) < 0, X е (т, Т]. В соответствии с этим соотношением введем управление
(Л Г1, X е[0,г),
пи) = [
[0, X е (г, Т].
На основании формулы (4) для фазовой траектории получаем х(Х, п)1-е = х0-е + а(1 -е)г, X е [г, Т] . Сопряженное уравнение для X е[г, Т] принимает вид
У (X) = - 1-е -- ^, у(Т) = 0.
+ а(1 -е)г
После интегрирования по X е [г, Т] получаем
е(еуТ -)
у(г)=--е-.
Х + а(1 -е)г) у
Точка переключения г характеризуется условием у(г) = — еуг , кото-
а
рое приводит к следующему уравнению относительно г
ае + у х0~е + ау(1 -е)г=аееу(Т-г). (7)
Представим его с помощью двух функций (левая и правая части равенства)
Р(г) = Ф2(г). (8)
Функция (р1 (г) [р (г)] монотонно возрастает [убывает] на [0, Т], причем р1 (Т) > р2 (Т). Предположим, что р1 (0) < р2 (0). Тогда уравнение (8) имеет единственный корень г* на интервале (0, Т). При этом управление
) Г1, X е [0, г*), пМ) = [
[0, X е (г., Т]
является экстремальным, поскольку
gУ, п.), X) > 0, X е [0, г.), g (у^, п.), X) < 0, X е (г., Т ]. Обсудим предположение р (0) < <р2 (0). Фактически это условие на параметры задачи
1-е уТ
ае + у Х0 <аее' ,
которое обеспечивает «корректность» точки переключения
г. [г. е (0, Т)].
Представим это неравенство в виде
еУт > 1+ У х. ае
Отсюда получаем условие на конечное время
Т Дь (1 + ах0-£ |, (9)
у \ ае 0
которое обычно трактуется как случай долгосрочного планирования.
Таким образом, при условии (9) управление и* (X) является экстремальным в задаче (1). При этом точка переключения т* есть единственный на (0, Т) корень уравнения (7).
Если условие (9) не выполнено (случай краткосрочного планирования), т. е. (Р1 (0) > ср2 (0), то уравнение (7) не имеет решений на (0, Т). Это значит, что функция переключения g(у(Х, 0), X) отрицательна на (0, Т) и экстремальное управление является нулевым: и*(Х) = 0, X е [0, Т].
Остается заметить, что численное решение уравнения (7) при условии (9) можно проводить, например, с помощью метода простой итерации. При этом достаточное условие сходимости метода (| р2 (т)| < 1, те (0, Т)) нетрудно представить в явном виде через параметры задачи.
Рассмотрим, далее, второй случай, когда параметр у отрицателен: у < 0 . Будем рассуждать в рамках той же схемы относительно функции переключения g(у(Х, и), X) с экстремальным управлением и(X). В данном случае с учетом сопряженного уравнения
dg(УС,и),X) = ау(X,и)+1 у |еу = ш
( \ ае
1 У 1 -
х(г, и)1 е
еУ--^г— g + У, и), X).
х(Г, и)1
Отметим, что
х(Х, и) > 0, g + (у(X, и), X) > 0, X е [0, Т].
^ Ш ^
Поэтому отрицательность производной — обеспечивается условием
Ш
а е
I У I <-¡—, X е [0, Т].
х^, и )1
На основании формулы (4) имеет место оценка сверху
х(Х, и)1-е < х¿-е + а(1 -е)1 < х0"е + а(1 - е)Т . В результате получаем итоговое условие на параметр у
а е
у < 0, |у|<—-, (10)
х0-е + а(1 -е) Т
которое гарантирует монотонное убывание функции переключения g(у(X, и), X) на [0, Т].
Далее действуем по аналогии с предыдущим случаем (у > 0) вплоть до уравнения (7) в интерпретации (8).
В рассматриваемом случае (у < 0) функция ср^ (г) р2 (г)] монотонно убывает [возрастает] на [0, Т], причем р1 (Т) < р2 (Т). Проверим, что при условии (10) на у
р1(0) = ае + у х0 е > 0 .
Действительно,
р1(0) = ае-1 у |х0 е >ае
„1-е
1 -
1-е
+ а(1 -е) Т
> 0.
Далее внесем предположение р1 (0) > р2 (0), которое гарантирует существование и единственность корня г* уравнения (7) на (0, Т), что определяет экстремальное управление и * (X).
Это предположение приводит к неравенству на параметры
1У1Х 1-е
ае
Отсюда получаем условие на конечное время (долгосрочное планирование)
у <1 1 х1-е
Т >
| у
I у I х1-е х0 ае
1п I 1 х1-е
Итоговые утверждения по поводу экстремального управления и* (X) сохраняются.
В заключение прокомментируем особый случай у = 0, когда экспонента уходит из рассмотрения. При этом свойство монотонности функции переключения очевидно выполняется. Точка переключения г определяется условием у (г) = —, причем
а
у(г) = —
е(Т-г)
+ а(1 - е)г
Отсюда получаем явное выражение для экстремальной точки
г* = — (а е Т - х0-е). а
Требование г* > 0 приводит к условию долгосрочного планирования
Т > — х¿-е .
ае
3 Свойство оптимальности
Рассматриваемая задача (1) является невыпуклой, поэтому построенные ранее экстремальные управления нуждаются в дополнительном анализе на предмет оптимальности. С этой целью используем достаточные
е
условия оптимальности типа принципа максимума, полученные в [10; 11] на основе точных формул приращения функционала.
В задаче (1) экстремальное управление определяется условием
11, g(y(t, u*), t) x(t, u*)e > 0, u* (t) = i
[0, g(y(t, u*), t) x(t, u*)e < 0.
Поскольку x(t, u) > 0, t e [0, T] для любого управления u e V , то в предыдущей формуле можно заменить траекторию x(t, u*) на любое решение x(t, u) фазового уравнения. Это значит, что управление u* (t) является сильно экстремальным в задаче (1) [10].
Рассмотрим далее функцию Понтрягина H(y, x, u, t) для y = y(t, u*), u = u* (t)
H(y(t, u*), x, u* (t), t) = xe [ay(t, u*)u* (t) + eg (1 - u* (t))].
Поскольку y(t, u*) > 0, u* (t) e [0,1], то коэффициент при xe положителен "t e [0, T].
Это значит, что функция H(y(t, u*), x, u* (t), t), "t e [0, T] вогнута по x в области R+ = {x > 0}, содержащей все фазовые траектории.
В совокупности заключаем, что первое достаточное условие из [10] выполнено, т. е. построенные экстремальные управления являются оптимальными в задаче (1).
Заключение
На основе принципа максимума проведено исследование обобщенной задачи оптимального планирования инвестиций. Получены условия на параметры, при выполнении которых экстремальное управление не содержит особых участков и сохраняет релейную структуру с одной точкой переключения. Обосновано свойство оптимальности полученных управлений.
Литература
1. Киселев Ю. Н., Аввакумов С. Н., Орлов М. В. Задача распределения ресурсов в двухсекторной экономической модели специального вида // Дифференциальные уравнения, 2009. Т. 45, № 12. С. 1756-1774.
2. Никольский М. С. Упрощенная игровая модель взаимодействия двух государств // Вестн. Моск. ун-та. Сер. 15. Вычислит. математика и кибернетика. 2009. № 2. С. 14-20.
3. Антипина Н. В. Влияние инвестиционной составляющей на экономические показатели малых и средних фирм // Baikal Research Journal. 2017. Т. 8, № 2. С. 26. DOI: 10.17150/2411-6262.2017.8(2).26.
4. Антипина Н. В. Условия оптимальности импульсных процессов в приложении к задачам экономической динамики // Вестник Бурятского государственного университета. Математика, информатика. 2018. № 2. С. 13-26.
5. Баенхаева А. В., Тимофеев С. В. Эволюционный подход к развитию средств массовой информации: построение математической модели // Известия Байкальского государственного университета. 2016. Т. 5. С. 825-833.
6. Баенхаева А. В. Исследование оптимального импульсного управления в моделях рекламных расходов // Вестник Бурятского государственного университета. Математика, информатика. 2009. Вып. 9. С. 18-21.
7. Суходолов А. П., Кузнецова И. А., Тимофеев С. В. Анализ подходов в моделировании средств массовой информации // Вопросы теории и практики журналистики. 2017. Т. 6, № 3. С. 287-305. DOI: 10.17150/2308-6203.2017.6(3).287-305.
8. Математическая теория оптимальных процессов / Л. С. Понтрягин [и др.]. М.: Наука, 1969. 384 с.
9. Габасов Р., Кирилова Ф. М. Принцип максимума в теории оптимального управления. М.: Либроком, 2011. 272 с.
10. Срочко В. А., Антоник В. Г. Достаточные условия оптимальности экстремальных управлений на основе формул приращения функционала // Известия вузов. Математика. 2014. № 8. С. 96-102.
11. Srochko V., Antonik V., Aksenyushkina E. Sufficient Optimality Conditions for Extremal Controls Based on Functional Increment Formulas // Numerical Algebra, Control and Optimization, 2017. Vol. 7, № 2. P. 191-199.
SOLUTION FOR A PROBLEM OF OPTIMAL ALLOCATION OF RESOURCES
Elena V. Aksenyushkina
Cand. Sci. (Phys. and Math.), A/Prof.,
Department of Mathematics and Statistics
Baikal State University
11 Lenina St., Irkutsk 664003, Russia
E-mail: [email protected]
The article considers a generalized version of the bilinear problem of optimal investment planning. The economic interpretation of this statement is a simplified version of the general problem of allocation of resources in a two-sector economic model of a special form. Based on the classical principle of maximum, we have obtained conditions on the task options, which preserve the simplest structure of extremal control without special turnpike-type segments. In fact, these conditions provide "correctness" of the only switching point of extremal control. Here, this point is the only root of the nonlinear exponential equation, which has a convenient structure for iterative solution search. Final time conditions that characterize long-term and short-term planning strategies are obtained. Since the considered problem is nonconvex, we have carried out an additional analysis to determine the optimality of extremal controls. An optimality property of the constructed controls is verified by means of sufficient conditions, which are derived from shrewd formulas for the increment of a functional based on phase concavity of Pontryagin's function and strong extremity of control. Keywords: nonconvex optimal control problem; principle of maximum; switching point; sufficient optimality conditions.
References
1. Kiselev Yu. N., Avvakumov S. N., Orlov M. V. Zadacha raspredeleniya re-sursov v dvukhsektornoi ekonomicheskoi modeli spetsialnogo vida [Problem of Resource Allocation in a Two-Sector Economic Model of a Special Form]. Differential Equations. 2009. V. 45. No. 12. Pp. 1756-1774.
2. Nikolskii M. S. Uproshchennaya igrovaya model vzaimodeistviya dvukh go-sudarstv [Simplified Game Model of Interaction between Two States]. Moscow University Computational Mathematics and Cybernetics. 2009. No. 2. Pp. 14-20.
3. Antipina N. V. Vliyanie investitsionnoi sostavlyayushchei na ekonomicheskie pokazateli malykh i srednikh firm [Influence of the Investment Component on Economic Performances of Small and Moderate-Sized Firms]. Baikal Research Journal. 2017. V. 8. No. 2. P. 26. DOI: 10.17150/2411-6262.2017.8(2).26.
4. Antipina N. V. Usloviya optimalnosti impulsnykh protsessov v prilozhenii k zadacham ekonomicheskoi dinamiki [Optimality Conditions for Impulse Processes in Application to the Problems of Economic Dynamics]. Vestnik Buryatskogo gosu-darstvennogo universiteta. Matematika, informatika. 2018. No. 2. Pp. 13-26.
5. Baenkhaeva A. V., Timofeev S. V. Evolyutsionnyi podkhod k razvitiyu sredstv massovoi informatsii: postroenie matematicheskoi modeli [Evolutionary Approach to Mass Media Development: Building a Mathematical Model]. Izvestiya Bai-kalskogo gosudarstvennogo universiteta. 2016. V. 5. Pp. 825-833.
6. Baenkhaeva A. V. Issledovanie optimal'nogo impulsnogo upravleniya v modelyakh reklamnykh raskhodov [Investigation of Optimal Impulse Control in Advertising Expenditure Models]. Vestnik Buryatskogo gosudarstvennogo universiteta. Matematika, informatika. 2009. V. 9. Pp. 18-21.
7. Sukhodolov A. P., Kuznetsova I. A., Timofeev S. V. Analiz podkhodov v modelirovanii sredstv massovoi informatsii [Analysis of Approaches in Media Modeling]. Voprosy teorii i praktiki zhurnalistiki. 2017. V. 6. No. 3. Pp. 287-305. DOI: 10.17150/2308-6203.2017.6(3).287-305.
8. Pontryagin L. S., Boltyanskii V. G., Gamkrelidze R. V., Mishchenko E. F. Matematicheskaya teoriya optimalnykh protsessov [Mathematical Theory of Optimal Processes]. Moscow: Nauka Publ., 1969. 384 p.
9. Gabasov R., Kirilova F. M. Printsip maksimuma v teorii optimalnogo upravleniya [Principle of Maximum in Optimal Control Theory]. Moscow: Librokom Publ., 2011. 272 p.
10. Srochko V. A., Antonik V. G. Dostatochnye usloviya optimalnosti eks-tremalnykh upravlenii na osnove formul prirashcheniya funktsionala [Sufficient Opti-mality Conditions for Extremal Controls Based on Functional Increment Formulas]. Russian Mathematics. 2014. No. 8. Pp. 96-102.
11. Srochko V., Antonik V., Aksenyushkina E. Sufficient Optimality Conditions for Extremal Controls Based on Functional Increment Formulas. Numerical Algebra, Control and Optimization. 2017. V. 7. No. 2. Pp. 191-199.