Н.С. Демин, Е.В. Кулешова
УПРАВЛЕНИЕ ОДНОСЕКТОРНОЙ ЭКОНОМИКОЙ НА КОНЕЧНОМ ИНТЕРВАЛЕ ВРЕМЕНИ В МОДЕЛИ СОЛОУ
Приводится полное решение задачи оптимального управления односекторной экономикой на конечном интервале времени в модели Солоу в случае экспоненциального изменения трудовых ресурсов. Результаты конкретизуются для случая производственной функции Кобба-Дугласа.
1. ПОСТАНОВКА ЗАДАЧИ
Рассматривая модель односекторной экономики, придерживаемся следующих обозначений [1-3]: Y - валовой национальный продукт; K - основные фонды; L(t) = = L0eXt - трудовые ресурсы, L0 > 0, X > 0; y = Y/L -удельный валовой продукт; к = K/L - фондовооруженность; F(K, L) - линейно-однородная производственная функция, удовлетворяющая неоклассическим условиям [1, 2]; I - накопление; C - потребление; ц > 0 - коэффициент амортизации основных фондов; 5 > 0 - коэффициент дисконтирования; f (к) = F(k, 1). Предполагается, что c = C/L - удельное потребление на одного рабочего. Тогда задача максимизации потребления на конечном интервале времени является задачей оптимального управления следующего вида: найти управление c(t), удовлетворяющее ограничениям
0 < c (к ), (1.1)
при которых на траекториях дифференциального уравнения
k(t ) = f (к (t ) - (ц + Х)к (t ) - c(t ), t е [0, T ]
с граничными условиями
k(0) = ko, k(T) = kT > 0
функционал
J = J c(t)e
-(5-X)t
dt
(1.2)
(1.3)
(1.4)
достигает максимального значения, где 5 > X.
2. ОБЩЕЕ РЕШЕНИЕ
Для решения поставленной задачи воспользуемся принципом максимума Понтрягина [4]. Согласно (1.2), (1.4) функция Гамильтона имеет вид
Н(у, к, с) = у[f (к) - (ц + Х)к - c] + y0ce-5 - X)t, (2.1) где у0 = {0; 1}, а y(t) - сопряженная переменная.
Обозначив q(t) = y(t)e(5~X)t, получим из (2.1) согласно [4], что
c(t) = arg max {(q(t), к(t), с},
0 < с < f(k)y (2.2)
q(t) = -dH (q, к, с) / дк.
Проводя вычисления, получаем с учётом того, что Уо = 1 [4]:
f (к(t), q(t) < 1, c(t) = < 0, q(t) > 1,
0 < c(t) < f (к(t)), q(t) = 1;
q(t) = (5 + ц) • q - qf '(к);
q(T) > 0, q(T)[к(T) - кт ] = 0.
Граничные условия следуют из общих условий трансверсальности для сопряженной переменной [4]. Таким образом, из принципа максимума Понтрягина следует для рассматриваемой задачи, что если c(t) -оптимальное управление, то оно удовлетворяет (2.3), а q(t) и к(0 для te[0, T] соответственно подчиняются
(2.3)
(2.4)
(2.5)
дифференциальным уравнениям (2.4) и (1.2) с граничными условиями (2.5) и (1.3). Дальнейшее решение задачи связано с анализом свойств траекторий ¿(/) и к(0 автономной системы уравнений (1.2), (2.4). Из (2.3) следует, что возможны три ситуации: с(/) = 0, с(/) = / (к?)), 0 < с(0 < / (к(0). Проведем анализ этих ситуаций.
Если с(0 = 0, то весь доход уходит на накопление. В этом случае ¿(0 > 1, а уравнение (1.2) имеет вид
£(/) = / (к) - (ц + Х)к. (2.6)
Выделим на оси ке [0, да) области знакопостоянства ¿(/).
а) q(/) = 0. Тогда уравнение (2.4) имеет единственный корень к , такой, что
I '(к *) = 5 + ц. (2.7)
б) ¿() < 0. В этом случае из (2.4), (2.7) следует, что I'(к) > > (5 + ц) при к > к .
в) ¿У) > 0. В этом случае из (2.4), (2.7) следует, что I'(к) < (5 + ц) при к < к*.
Выделим на оси ке [0, да) области знакопостоянства к(г).
1) к({) =0. В этом случае из (2.6) следует, что
I (к) = (ц + Х)к. (2.8)
Так как согласно неоклассическим условиям КО является монотонно возрастающей функцией и при этом 1(0) = 0,1(да) = да, то уравнение (2.8) имеет единственный корень к, такой, что
I (к) = (ц + Х)~. (2.9)
2) &(/)>0. В этом случае из (2.6), (2.9) следует, что 1(к) > (ц + Х)к при к < к.
3) к^) < 0. В этом случае из (2.6), (2.9) следует, что
1(к) < (ц + Х)к при к < к.
II. Если с(0 = I (к(?)), то весь доход идет на потребление. В этом случае ¿(0 < 1, а уравнения (2.4) и (1.2) имеют вид
¿¡(Г) = (5 + ц^ -1 ’ (к (2.10)
Щ) = - (ц + Х)к. (2.11)
Из (2.11) следует, что
Щ) = - (ц + Х)к < 0 , к > 0 . (2.12)
Выделим на оси ке [0, да) области знакопостоянства ¿У).
а) q(/) =0. В этом случае уравнение (2.4) имеет единственный корень к*, такой, что
I' (к *) = 5 + ц . (2.13)
б) ¿(0 < 0. В этом случае из (2.4) следует, что _Дк) > >(ц + Х)к при к > к*.
в) ¿(?)>0. В этом случае из (2.4) следует, что Цк) <
<(ц + Х)к при к < к*.
III. Если 0 < с(?) < _Дк(0, то доход делится на накопление Кк(?) - с(?) и на потребление с(?).
Теперь мы можем выделить области знакопостоян-
ства q(t) и k(t) на плоскости (k, q). Точка x* = (1; k )
является особой, так как она является стационарным решением для системы
q(t) =0, l¡(t) =0. (2.14)
Пусть k = k , q = q , тогда система (2.14) с учетом (2.4), (1.2) принимает вид
f (k*) - (ц + À)k* - c*, f ' (k*) = S + ц . (2.15)
Таким образом, из (2.15) следует
c* = f (k) - (ц + À)k*, 0 < c* < f (k*) . (2.16)
Если фазовая траектория {k(t0; q(t)} попадает в особую точку и при этом используются управления (2.16), то данная траектория не выходит из x .
3. АЛГОРИТМ УПРАВЛЕНИЯ
На рис. 1 в соответствии с проведенным исследованием изображены типовые фазовые траектории {i(t0; q(t)} с номерами 1-б. Обозначим: Г0 - фазовые траектории, входящие в x = (1; k); ГТ - фазовые траектории, исходящие из x = (1; k ). Поскольку условие {q(t) < 0; k(t) < 0} означает убывание
{l(t); q(t)} с ростом t, а условие {¡(t) > 0; k(t) > 0} - их воз-1 *
растание, то согласно рис. 1 попасть в x мы можем только из областей I и III соответственно с управлениями c(t) = О, c(t) = =f (l(t)) по траекториям Г и ГО, а выйти из x мы можем только в области II и IV соответственно с управлениями c(t) = 0, c(t) = f (i(t)) по траекториям Ггт и Г^ . По тем же правилам строятся типовые фазовые траектории, которые не
*
проходят через точку x .
k * k k Рис. 1
Теперь среди всего множества траекторий нужно выбрать оптимальные, т.е. те, которые, выходя из произвольной точки к(0) = ко > 0, за фиксированное время Т приходят в точку к(Т) = кТ > 0. При этом, согласно (2.5)Ю должно выполняться условие ¿(Т)>0, если к(Т)=кТ и ¿(Т)=0, если к(Т)>кТ. Из рис. 1 следует, что если к0 < к, а кТ > к, то вообще не существует траекторий, для которых к(Т) = кТ (кривые 1-5), так как все они не могут перейти правее прямой к = к . Поиск оптимальных управлений будем осуществлять при условии к0 < к, кТ < к. Алгоритм управления в предположении достаточно большого времени управления Т заключается в следующем. Если к0 < к, то подбирается такое значение ¿0, чтобы (к0; ¿0) е Г.. Тогда с управлением с(0 = 0 точка {£(0; ¿(?)} переводится по траектории Г в точку х = (1; к), и в момент Т* попадания {к?); ¿(0} в точку х полагается с(Т) = с (см. (2.16)). Если к> к, то подбирается такое значение ¿0, чтобы (£о; ¿0)е Г„. Тогда с управлением с(()=/' (£?)) точка {к(р); ¿(?)} переводится по траектории
Г03 в точку х = (1; к), и в момент Т попадания х = (1; к) в точку х полагается с(Т) = с . В момент Т полагается с(Т*) = 0, если кТ > к* и с(Т**) = I (£Т**)), если кТ < к*, и соответственно с управлениями с(?) = 0 либо с(/) = I (к?)) точка {к?); ¿(/)} переводится по траекториям ГТ либо ГТ в точку х(Т) = {к(Т);q(Т)} такую, что к(Т) = кТ.
4. МАГИСТРАЛЬНАЯ ТЕОРЕМА
Сформулируем полученный результат в форме магистральной теоремы [2,3]. Введем для к. < к2, Х1 < т2 обозначения
т.м. >=?/ №) -Щ,к - <«>
Т.(.,к.)=ц+Х^=ц+1>"-кт. <42)
30 (т., т2 > = | с(/> Ч5-Х)'Л; (4.3)
т1
*
3 * (т., т2 > = -(5-Х)т1 - е-(5-Х)т2 ]. (4.4)
5 - Х
Теорема 1. При достаточно большом времени
управления Т решение задачи имеет следующий вид:
1) Интервал [0, Т] разбивается на три интервала, т.е. [0, Т] = [0, Т*) и [Т*, Т**] и (Т**, Т].
2) Оптимальное управление с(?) имеет структуру с(?) = {I (£(?)); 0; с }, т.е. управление с(?) является кусочно-непрерывным, где
с* = I (к*) - (ц + Х)к*, (4.5)
а к - единственный корень уравнения
I '(к) = 5 + ц . (4.6)
3) На интервале ?е [Т*,Т**] всегда с(?) = с*, и фондовооруженность £?) сохраняет постоянное значение к .
4) На начальном интервале времени ?е [0, Т) с(?) = 0, если к0 < к , и с(?) = I (к(0), если к0 > к , и происходит соответственно возрастание либо убывание к(?) от к0 до к .
5) На конечном интервале времени ?е(Т , Т] с(?) = 0 если кТ < к , и с(?) = I(к(0), если кТ < к , и происходит соответственно возрастание либо убывание £(?) от к до кТ.
6) значения Т, Т и функционала 3 определяются следующими формулами:
- если к0 < к , кТ < к (магистраль I), то
Т* = Т.(ко, к*), Т** = Т - Т2(£т, к*), (4.7)
3 = /(Т*, Т**) + /(Т**, Т); (4.8)
- если к0 < к , кТ > к , (магистраль II), то
Т* = Т. (к0, к*> Т** = Т - Т. (*Дт >, (4.9)
3 = 3 * (т *,Т ** > ; (4.10)
- если к0 > £, кТ < £ (магистраль III), то
Т* = Т2 (к*, к0> Т** = Т - Т2 (Т (*>, (4.11)
3 = 30 (0, Т * >+ 3 * (Т *, Т ** >+ 30 (т **, Т >; (4.12)
- если к0 > к, кТ > к (магистраль IV), то
Т * = Т2 (к *, к0 >, Т ** = Т (*,£ >, (4.13)
3 = 30 (0, Т * >+ 3 * (т *, Т ** >. (4.14)
Исследуем поведение с(?) = I (£(?)), когда £(?) определяется уравнением (2.12). Тогда
с(?) = I '(£) ¿(?) = - (ц + Х)!(4.15)
Так как по неоклассическим условиям I ' (к) > 0, то из (4.15) следует, что с(г) < 0 , т.е. с(?) - монотонно убывающая функция времени. Чтобы установить тип кривизны с(г), определим знак с(?). Из (2.12),(4.15) следует
с(/) = (ц + Х)2 к [ (к) +1 " (к)]. (4.16)
Из (4.16) следует, что знак с(г) зависит от знака функции ф (к)^"' (к) + I "(к). Например, если I (к) - функция Кобба-Дугласа, т.е.I(к)=А£а, А > 0, 0 < а < 1, то ф (к) =Аа£(а-1)> 0, и таким образом с(Г) > 0, т.е. функция с(?) есть монотонно убывающая выпуклая вниз функция. Для общего класса неоклассических производственных функций знак ф (к), а значит, и знак с (г) может быть любым и соответственно кривизна убывающей функции с(г) может быть любой.
На рис. 2, 4, 6, 8 представлены реализации управления с(г) на всём интервале времени управления ?е [0, Т], построенные в соответствие с проведенным исследованием. Для случаев магистралей Ш и IV, когда £0 > £, следует, согласно (4.5), что с(Т) = I (к) > с и при этом Д с** = с(Т) - с = (ц + Х)£ (рис. 6, 8). Для случаев магистралей I и III, когда кТ < £*, следует, согласно (4.5), что Д сТ = с(Т -1(кТ) -1(£*) + (ц + Х)£*. При этом
- Д сТ >0, т.е. с(Т > с*, если [I(£*) -1(£Т)] < (ц + Х) £*;
- Д сТ > 0, т.е. с(Т > с*, если [I(£*) -1(£Т)] < (ц + Х) £*;
- Д сТ = 0, т.е. с(Т =с*, если [I (£*) -1 (£Т)] = (ц + Х) к*. Данные ситуации отражены на рис. 2, 6.
/ f (к*) ^ с )
f (кг)
с *
f (кТХ
Т * Т * * т *> 1
Рис. 2
Исследуем поведение фондовооруженности £(?). Рассмотрим сначала интервал времени ?е [0, Т).
Пусть к0 < к (магистрали I и II). В этом случае управление с(г) = 0 и, согласно, (2.6) к (?) > 0 , т.е. £(/) монотонно возрастающая функция. Тогда
к(?) = к(/)[(£(?)) - (ц + Х)]. (4.17)
Так как 5 > Х, то из (2.7) следует, что I' (£(/)) - (ц + Х) >
>0 для к < к*. Тогда, согласно (4.17), к (г) > 0 , т.е. при
к0 < к на интервале ?е [0, Т) к(г) является монотонно возрастающей выпуклой вниз функцией (рис. 3, 5).
Пусть к0 > к (магистрали III и IV). В этом случае управление с(г) = I (£(/)) и, согласно (2.12), к (г) < 0, т.е. к(?) монотонно убывающая функция. Тогда
£ (г) = - (ц + Х)£ (г), (4.18)
и, следовательно, к (г) > 0 . Таким образом, при £, > к
на интервале ге[0, Т) к(г) является монотонно убывающей выпуклой вниз функцией, что отражено на рис.7, 9.
к (О * к
к Г
к 0 _ к
к т V
0 Т * Т „** Т
Рис. 3
Рис. 4
Рассмотрим интервал времени /є (Т , 7]. Пусть кТ < к (магистрали I и III). В этом случае управление с(/) = =Дк(/)) и, согласно (2.12), (4.17), к(/) < 0, к (/) > 0 .
Таким образом, при кТ < к* на интервале /є(Т**, Т] к(/) является монотонно убывающей выпуклой вниз функцией, что отражено на рис.3, 7. Пусть кТ > к (магистрали II и IV). В этом случае управление с(/) = 0 и, согласно (2.6), к(/) > 0 , т.е. к(/) монотонно возрастающая функция, а к(/) определяется формулой (4.17). Пусть к является корнем уравнения
/ ’ (к) = Ц + X . (4.19)
Так как 5 > X, то из (2.7) и (4.19) следует, что к * < к. Тогда, согласно (4.17), /'(к) - (ц + Х) = 0, если к = к ;f(к)-
- (ц + Х) > 0, если к < к; f'(к) - (ц + Х) < 0, если к > к. Таким образом, из (4.17) следует, что к(/) > 0, если к*< < к(/) < к, и к (/) < 0 , если к < к(/) < кТ. Проведенное исследование приводит к следующему результату: на интервале /є(Т , Т] к(/) является монотонно возрастающей выпуклой вниз функцией д ля к * < к (/) < к и монотонно возрастающей выпуклой вверх функцией для к < к (/) < кТ с точкой перегиба к (/) = к. Подобное поведение к(/) отражено на рис. 5, 9. Если к * < кТ < к , то, очевидно, что
монотонное возрастание к(/) на интервале /є (Т , Т] происходит без точки перегиба выпуклым вниз образом.
Рис. 5
вд к 0
0 *
Т
0 1 Н * * Н * н
Рис.7
5. СЛУЧАИ ПРОИЗВОДСТВЕННОЙ ФУНКЦИИ КОББА-ДУГЛАСА
Теорема 2. Пусть[1-3]
/ (к) = А • ка, а > 0 , 0 <а< 1 .
Тогда
1) для к *, к, с* имеют место формулы
Г=|^Г,г 4 А
5 + ц I I ц + X
с* = [а - (ц + Х)(к*)1-а](к* );
2) для Т, Т и J имеют место формулы (4.14), где
Т1 ( к2) = J0 (о, Т *)
1
- 1п
А - (ц-Х)к;-а
,1-а
(ц + Х)(1-а) А - (ц + Х)к,
А(к*1
(8 - X) + а(ц + X)
еа(ц+Х)Т - е-(5-Х)Т
(8 - X) + а(ц + X)
J 0(Т , Т) =
1 - е
-[(5-Х)+а(ц+Х)]Т*
А
(5-Х) + а(ц + Х)
^ ^ ^^^^^ц+Х)Т+а(ц+Х)Т** ]- е~(5-Х)Т**
Ака
(5 - X) + а(ц + X)
X е^Т - е~ [(5-X)+а(Ц+X)T +а(^Т
с(Г) = Ак^“1^' = А (к *)а е“0^ -г) (5.9)
если к0 > к *, и
(5.1)
(5.2)
(5.3) (4.7) -
(5.4)
к (г) =
А а]
-(н^Х^а)/
н+X
1
1-а
А - А - (н^^к* )-а е^КТ*-/)
н +
1
1-а
если к0 < к * ;
4) на интервале ге(Т**, Т]
к (г) = к ) = Де0^-г),
с(г) = А (к * )а е^^^ *) = А(кТ )
\а «(^ХТ-г)
(5.10)
(5.11)
(5.12)
если к < к *, и
"А -[а - (н + X)kT^a]e(н+X)(1-а)(Т-г0"
к(г) = = к (г) 1 н + |
, (5.5) = А - А - (н^^:* ^(^ )(1-а)(/-Т **0
н +
1
1-а
1
1-а
J (Т , т ) = -
5^
3) на интервале ге [0, Т*)
к (г) = к0е^^н+х)г = к *e(н+X)(T -г),
(5.6)
(5.7)
(5.8)
(5.13)
если кТ > к .
Данный результат получается при использовании (5.1) в теореме 1.
ЗАКЛЮЧЕНИЕ
Теоремы 1, 2 справедливы при условии Т**- Т* > 0. Так как Т * = Т - Т, где Т - время достижения траекторией к(г) значения кТ на интервале ге [Т , Т], то данное условие принимает вид Т > Т + Т *, где кТ < к и Т = Т2(к*, кТ) если к > к. Интервал ге[0, Т] является интервалом выхода траектории к(г) на магистраль для
к
к
Ака
0
ж
с
обеспечения стационарного состояния экономики. Интервал te [T , T] является интервалом схода траектории k(t) с магистрали для обеспечение терминального условия в конечный момент времени T (условие экономического горизонта). Таким образом, чем меньше T и T при заданном T, тем больше интервал стационарного состояния экономики AT = T - T (интервал пребывания экономики на магистрали) приближается ко всему интервалу T. На магистрали, когда te [T* T**], k(t) = k*= const, y(t)= y= f (k*) =
= const. При этом K (t) = k L0e = K0e . Тогда Y (t) = = F(K0*eXt, L0eXt) и dY*(t)/dt > 0. Таким образом, на магистрали обеспечивается сбалансированный рост экономики. Если k0 < k , kT > k , то на интервалах te [0, T) и te(T* T], K(t) = L0ektk(t), где k(t) > 0 , и тогда dY(t)/dt = =dF(L0extk(t), L0ext/dt > 0. Таким образом, при k0 < k*, kT>
> k обеспечивается устойчивый рост экономики на всем интервале времени te [0, T].
ЛИТЕРАТУРА
1. Эрроу К. Применение теории управления к экономическому росту // Математическая экономика. М.: Мир, 1974. С.7-45.
2. Ашманов С.А. Введение в математическую экономику. М.: Наука, 1984.
3. ИнтрилигаторМ. Математические методы оптимизации и экономическая теория. М.: Прогресс, 1975.
4. Понтрягин Л.С. и др. Математическая теория оптимальных процессов. М.: Наука, 1978.
Статья представлена кафедрой прикладной математики факультета прикладной математики и кибернетики Томского государственного университета, поступила в научную редакцию «Кибернетика» 25 мая 2004 г.