Н.С. Демин, Е.В. Кулешова
УПРАВЛЕНИЕ ОДНОСЕКТОРНОИ ЭКОНОМИКОЙ НА КОНЕЧНОМ ИНТЕРВАЛЕ ВРЕМЕНИ С УЧЕТОМ ЭКОЛОГИЧЕСКИХ ЗАТРАТ
Рассматривается задача оптимального управления односекторной экономикой на конечном интервале времени с учетом затрат на борьбу с загрязнением. На основании необходимых и достаточных условий оптимальности было выделено четыре ситуации: «Золотой век»; «Темный век»; расходы производятся только на экологию; расходы производятся только на накопление. Доказано, что могут реализоваться только первые две ситуации, для которых проведено детальные исследования в стационарном случае.
1. ПОСТАНОВКА ЗАДАЧИ
Рассмотрим модель взаимодействия потребления и производства в односекторной экономике, в которой кроме полезных продуктов вырабатываются и побочные, вызывающие загрязнение окружающей среды. Далее P(t) обозначает уровень загрязнение. В рамках выбранной модели предполагается, что в каждый момент времени t произведенный экономикой продукт
Y(t) делится на потребление C(t), инвестиции (накопление) I(t) и борьбу с загрязнением V(t), т.е.
Y(t) = C(t) + I(t) + V(t). (1)
Производственная функция F(K(t),L) является линейно-однородной [1], где L = const - объем трудовых ресурсов, K(t) - объем основных фондов. Предполагается, что F удовлетворяет неоклассическим условиям [1]:
1) F(K,L) > 0, K > 0, L>0;
1) 3F/3K > 0 , 3F/3L > 0 ;
2) 52f/dK 2 < 0, 52 F/dL2 > 0 ;
3) lim dF/dK = ro , lim dF/dL = ro ;
L^0
4) lim dF/dK = 0, lim dF/dL = 0 .
K L^ro
Распределение Y(t) осуществляется следующим образом: a(t)-a часть (0 < a(t) < 1) производственного продукта, т.е. a(t)F, идет на потребление; P(t)-a часть (0 < P(t) < 1), т.е. P(t)F, идет на экологию; (1 - a(t) -- Р(0)-я часть, т.е. (1 - a(t) - P(t)) F, идет на накопление. Тогда, согласно (1),
Y (t) = F (K (t), L) = a(t) F (•) + P(t) F (•) +
+(1 - a(t) - P(t)) F (.) = C (t) + V (t) +1 (t). (2)
На величины a(t) и P(t) наложены дополнительные ограничения:
0 < a(t) + P(t) <1. (3)
Производственные фонды амортизируют с коэффициентом д (0 < д < 1). Тогда уравнение, описывающее динамику изменения основных фондов, имеет вид
K(t) = (1 - a(t) - P(t))F(K(t), L) - ^(t). (4)
Объем загрязнения прямо пропорционален произведенному продукту с коэффициентом £ (0 < £ < 1), т.е. определяет ту часть произведенного продукта, которая является загрязнением. Уровень загрязнения P(t) может уменьшаться за счет V(t) с коэффициентом П (п > 1) и за счет естественной убыли загрязнения с коэффициентом у (у > 0). Тогда уравнение, описывающее динамику изменения загрязнения, имеет вид
P(t) = (6 - nP(t))F(K(t), L) - yP(t). (5)
В начальный момент времени уровень основных фондов задан, т.е. К(0) = К0, Р(0) = Р0.
В качестве критерия, подлежащего максимизации в плановом периоде / е [0, Т ], возьмем интегральную
полезность с дисконтированием
J[K(t);P(t)] = J U(C, P)e~stdt.
(6)
где 5 > 0 - коэффициент дисконтирования, а и(С,Р) -функция полезности, удовлетворяющая условиям [1 - 3]
1) ЗП/дС > 0 ;
2) Иш дП/ дС = го;
3) дU/дС2 < 0;
4) dU/dP < 0 ;
5) д2 U/дР2 < 0.
Задача. Найти функции a(t) и P(t), максимизирующие функционал (6) при условиях (2) - (5). Таким образом, поиск оптимальной стратегии управления сводится к решению следующей задачи оптимального управления [4]:
J [K (t); P(t)] = J U (С, P )e~5t.
dt-
->max,
(7)
K (t) = (1 - a(t) - P(t)) F (K (t), L)-|jK (t),
' p(t) = (6-nP(t))F(K(t),L) -Yp(t),
P(0) = P0,K(0) = K0, t e [0,Г],
0 < a(t) <1,0 <P(t) <1, a(t) + P(t) < 1.
Решение задачи. Построим сначала оптимальные траектории Ka (t) и Pa (t) для вспомогательной задачи оптимального управления, которая получается из задачи (7) после удаления ограничений 0 < a +Р < 1, a(t) < 1, P(t )< 1. Воспользуемся необходимым условием оптимальности [4]. Введем функцию Гамильтона -Понтрягина:
H (Р, K, yj, у 2, a, р, t) = U (С, P)e~5t +
+у [(1 - a - Р)F(K, L) - ц!] +
+y 2 [(б - nP) F (K, L) -уР].
Составим сопряженную систему:
(8)
дF дU -5t n3F 1
= a——e +V1[(1 -a-e)—-Ц] + дK дС дK
дF
+ ^2(6-ne)—,
дK
дU -5t
K 2 =-^pe +У 2 Y.
(9)
Запишем условие принципа максимума:
H ( P (Г ), K (Г ), У! (Г), у 2 «), а(Г), Р(/), Г) =
= шахH(P,K,у1,у2,а,р,/). (10)
Вместо сопряженных переменных у1(/), у 2^) введем новые сопряженные переменные q1 = у1е5г, q2 = у2еа и модифицированную функцию Гамильтона - Понтрягина:
H (с, q2, K, P, а, р, /) = е^ {П ^ (K, I), P) +
+^[(1 -а-в)F(К,I)] + С2[(в-лР)F(К,I)-yP] . (11)
В новых переменных соотношения (9) и (11) примут вид
дF дП д^ . Р дF
с =-а——+С1[8+ц-(1-а-р)—]+С2(пр-е;>—, дК дС дК дК
дU
<?2 = ~ + ?2(5 + У); дР
(12)
H (P(t), K (t), q (t), q2 (t), a(t), P(t), t) =
= maxH(P,K,q1,q2,a,p,t). (13)
Запишем достаточные условия оптимальности вспомогательной задачи согласно [5, 6].
Сопряженная система:
дF дU r5 e dF t _ dF
q =-a^^+q1[5+^-(1-a-e)^]+q2(nP-6)—,
dK дС dK dK
bu
q2 = ^7T + q2(5 + Y).
dP
(14)
(15)
Условия трансверсальности:
Й(Т + 0) = 0, с[2 (Т + 0) = 0.
Условия скачка отсутствуют.
Условия неотрицительности:
МО > 0, у2(0 > 0, / е Т . (16)
Условия дополняющей нежесткости:
М^а(0 = 0, у2Р(/) = 0,/ е Т . (17)
Условия стационарности:
ди
дС
F - q(t) F + ^(t) = 0,
Рассмотрим каждый из них в отдельности.
I. Vi(t) = 0, V2(t) = 0.
Тогда, согласно (17), a(t) > 0, P(t) > 0, t e T1. Следовательно, условия (18) примут вид
^F - q(t) F = 0,
дС
-q(t) F - q2(t)nF = 0. (20)
Из (20) следует q1(t) = dU/дС. Так как F > 0,
dU/дС > 0 , то,
q1(t) > 0, t e 71, (21)
q2 (t) = - * (t)/n = -[Vn] ou/дС.
Так как п > 0, то -[^n] dU/дС > 0 . Тогда q2 (t) < 0, t e 71. Рассмотрим q^t) = d2U/дС2. Так как д2и/дС2 < 0, то <71(t) < 0,t e T1, q2(t) =-[VnM^t) = = -[1/n] d2U/дС2 > 0 , то есть q2(t) > 0, t e 71.
С учетом того, что q1(t) = dU/ дС = const, получаем ft(t) = 0, <2-2 (t) = 0. (22) Тогда, согласно (22), из (14) следует dF d U dF dF
-a——+^[5+ц-(1 -a-P) —]+q2(nP-6) — = ^
dK дС dK dK
dU
dP
+ q2(5 + y) = 0 .
Отсюда, учитывая, что q1(t) = dU/ дС, получим
q1
dF 6 dF
(5 + ц)--------------------------I-= 0,
dK ndK _
dU dU 1 _ 4
— =--------------(5 + y).
dP дС n2
dF 6 dF
(5 + ц)----------+-------
dK ndK J
Так как q1 ^ 0 , то
oF = (5 + ц) dK 1 -б/n"
= 0. Тогда
t e 71.
'dU IdU
"dP/ ОС
.(5 + y) n
t
: T .
-С^)F -с2^)^ + у2(/) = 0,( е Т . (18)
Оптимальная траектория ^а(/);Ка(/)}, tеT вспомогательной задачи определяется двумя параметрами МО и МО, t е Т, которые, согласно (16), либо принимают положительные значения, либо равны нулю.
Определение 1. Часть траектории Pa ^), Ка (0,
t е Т, на которой ни один из параметров у^) и МО не
меняет значение с положительного на нулевое или,
наоборот, с нулевого на положительное, будем называть дугой.
Определение 2. Промежуток времени, когда движение происходит по у-й дуге, обозначим Ту.
Таким образом, возможны четыре варианта:
I. v1(t) = 0, МО = 0;
II. МО = 0, МО > 0; (19)
III. МО > 0, МО = 0;
IV. МО > 0, МО > 0.
Более детальный анализ оптимального решения на конечном интервале времени довольно сложен, но на бесконечном интервале времени, то есть на стационарных траекториях, он может быть проведен достаточно полно.
Рассмотрим стационарный случай. Из (20) следует
F
oU
ОС
- ^(t)
= 0 . Так как F > 0, то
'dU
5С “ qi<t)
= 0.
Из второго уравнения (14) имеем
1 dU
q2 =;
(23)
(24)
5 + y dP
Поскольку q1 = const и q2 = const , постольку q1 = 0, q2 = 0 , и из первого уравнения (14) с учетом того, что q1 (t) = dU/ дС, получаем
(5 + ц)-(1 -Р)
dK
= <2(пР-6)
oF
dK
(25)
Подстановка (23) в (25) с учетом (21) дает, что oF = (5 + ц) dK 1 - (б/n)
Подставляя (24) в (25), получаем
(26)
'ди
зРУ
>cU
ОС
. (5 + y) n
(27)
Условия реализации стационарного случая следуют из (7):
{(1 -а-Р) F = цК,
\(е-пР^ = yP.
Решив уравнение (26), найдем К* - оптимальный объем основных фондов. Таким образом, при К=К* последние соотношения принимают вид
foK* = F(K*, L) - aF(K*, L) - pF(K*, L), \yP = 6F (K *, L) - n PF (K *, L).
Из второго соотношения (28) следует, что
(28)
p=I| 6-y--------P---
n v F (K *, L)
По постановке задачи С = aF(K, L)
тельно, с учетом (29)
цK* = F(K*, L) - С - F- + y P .
n n
(29)
Следова-
Тогда
-=nС+n
(30)
(31)
U- (С, P) Пс (С, P)
.(5 + y) n
P = nС + n yK*-|1 --IF(K*,L)
y y L v ny j
где UP (С, P) и ПС (С, P) - частные производные U(С, Р) соответственно по Р и С.
II. Vi(t) = 0, V2(t) > 0.
Тогда, согласно (17), a(t) > 0, P(t) = 0, t e T2, то есть отчисления на экологию отсутствуют. Таким образом, имеем ситуацию «Темного века» [1,3]. В этом случае условия (18) примут вид
dd-F - qx(t) F = 0,
дС
-q(t) F - q2 (t )nF + V2(t) = 0. (32)
Из (32) следует q1(t) = dU/ ОС. По условию dU/ОС > 0 , следовательно,
q1(t) > 0, t e T2,
)=- rn+V2-o >
(33)
n nF
С учетом того, что q1 (t) = dU/ОС = const, получаем <71 (t) = 0, q2(t) = 0. Тогда из (14) с учетом (33) следует
_ oF"
)~dK j
1 dU"
dF dU -a------------- + q1
dK ОС
dU /й 4 +(S+T)
(5 + ц) -(1 -a)-v2(t)
dF 0 _6q2 — = 0'
dK
= 0.
nF n дСj Учитывая, что q1(t) = dU/ дС, получим
цК *-I 1 — IF (К *, I)
У У1_ I ПУ _
Из первого соотношения (28) следует, что а* = 1 - Р * - цК */F(К*, I).
Итак, в ситуации у^) = 0, у2(() = 0 получаем, что в стационарном случае присутствуют отчисления на потребление, накопление и борьбу с загрязнением. Данная ситуация получила название «Золотого века» [1, 3]. Сведем полученный результат в следующую теорему.
Теорема 1. В случае равновесия «Золотого века» оптимальные значения а* и в* норм отчислений соответственно на потребление, борьбу с загрязнением и нормы накопления 5* = 1 - а* - в* определяются формулами
а* = 1 - Р * - цК */F(К*, I),
Р* =1 Ге-у----—
^ (К *, I)
5* = цК */ F (К *, I), где оптимальное значение К* уровня основных фондов является единственным решением уравнения с^ = (5 + ц) дК 1 -е/п ,
а оптимальные значения С* и соответствующее значение уровня загрязнения P* являются единственными решениями системы уравнений
_ou
~дР
« ч dF'
(5+ц)-ok
dF 0 -6q2 CK = 0;
+ (5 + y)
v2(t) -1 oU
nF n дС
= 0.
Из первого соотношения (34) следует dF (5 + ц)
(34)
(35)
дК 1 + е[с^ с2]
Как и в предыдущей ситуации, анализ оптимального решения в общем случае затруднен. Рассмотрим стационарный случай. Условия реализации стационарного следуют из (7):
(36)
f(1 -a) F = ц^,
(6F = yP.
Так как q2(t) = 0 , то из второго соотношения (14) имеем
1 dU
q2 =-
5 + y dP
Так как q1 (t) = dU/ дС, то из (37) следует
1
5 + y
oU /cU дР дС
Использование (38) в (37) дает, что
dF
— = (5 + ц)
dK
1 + -
U-
(5 + y) Пс
Из (37) следует:
Р =- F(K, L);
y
a = 1 -
F '
(37)
(38)
(39)
(40)
(41)
Таким образом, учитывая, что
С = aF (K, L),
(42)
пришли к следующему результату.
Теорема 2. В случае равновесия «Темного века» оптимальные значения а* и 5* = 1 - а* соответственно норм потребления и накопления определяются формулами
а* = 1 -цК */ F (К *, I),
5* = цК */ F (К *, I),
а оптимальные значения уровня основных фондов К*, потребления С* и соответствующий им уровень загрязнения P* являются единственными решениями системы уравнений
dF (K, L)
дК
= (5 + ц)
1 + ■
6 UP (С, Р)
5 + y иС (С, Р)
то
1 - (б/n)
>0.
Тогда неоклассические условия на для F(K,I) обеспечивают существование единственного решения К* уравнения (26) (рис. 1).
Так как К* определено и единственно, то уравнения (30) и (27) определяют в плоскости (C,P) прямую п
вида P = — С + а с коэффициентом наклона п/у > 0 и
У
кривую P = у(С) (рис. 2).
Р = - F (K, L), y
С = [1 - цК/F(K, L))]F(K, L).
Замечание. Доказательство существования единственного решения уравнений, упомянутых в теоремах 1 и 2, вынесены в Приложение.
В вариантах III и IV при a(t) = 0 имеем вырожденный случай. Поскольку C(t) = 0 при a(t) = 0, а dU/ дС = го при С = 0, то дуги Т3 и Т4, соответствующие этим ситуациям, не реализуются.
Приложение
1. Докажем единственность решения K*, С*, Р* системы уравнений (26), (27) и (30).
Рассмотрим уравнение (26). Так как
5 > 0, д > 0, 0 < £ <1 < п,
(5 + ц)
Кривая P = у(С) изображена с учетом условий, которым удовлетворяет функция полезности U(C,P), а прямая P = (п/у)С + а для а > 0. Если а < 0, то изменение рисунка очевидно, а свойство единственности решения остается.
Тогда система уравнений (30), (27) имеет единственное решение (C*,P*).
2. Докажем единственность решения К*, С*, P* системы уравнений (39), (40), (42).
Рассмотрим уравнение (39). Данное соотношение имеет вид у(К, P(К)) = 0 неявной функции P от К. Тогда
dP = у К (К, P( К))
dK у Р (K, Р( K))
Найдем у К (K, Р( K)):
ук (K, Р(K)) = FkK +5±2ц-д[.]=
(43)
= F! + 6 5+‘5ц (5 + y)
н2
= FK + 6(5 + ц)
[.]2 дК‘
upk U- TJ Пс ~Ur 2 С
С
ПСПРК - ПРПС1
(5 + y)[.]2 Пс 2
(44)
где [.]=
1+-
6 ( dU (aF (К, L), Р)/ дР
5 + y VdU (aF (К, L), Р) / дЖ
Так как
п = д2U(aF(К,L),Р) aF, п
U pk --------------— aF л U —с ,
РК дРдК К РС
п = д2U(aF(К,L), Р) F, п
Uck------------------= aFK исс ,
дСдК
то из (44) следует
у л (К, Р( К)) = (5 + ц)и2С2[^К + Пс [*]2(5 + y) + 6(5 + ^aFK (ПсП-с - U-Псс)
Пс 2[*]2(5 + y) .
Аналогично получаем
_(5 + ц)6(ПсПрр-U-Пср)
у - (К, Р( К)) =-
Пс 2[*]2(5 + y)
(45)
(46)
Тогда, согласно (43), (45), (46),
dP (5 + у)Пс 2[.]2 FK
dK (5 + ц)6(ПС UPP - UP ПСР)
+ 6(5 + y)aFK (ПсП-с - U-Псс) (5 + ц)6(Псирр -ПРПСР) .
(47)
Поскольку (5+у) > 0, [*]2 > 0, ЕК < 0, (5 + ц) > 0,
а > 0, ЕК > 0, е> 0, то (5 + |а)Пс 2[«]2 ЕК < 0, а е(5 + ц)аЕК > 0 . Распишем (47) в виде
р (д + у)ис 2[.]2 ЕК 1 _
dK (5 + ц)е (исирр _ириср)
_(5 + у)аЕкК(ПсПрс _ПрПсс)
(5 + ц)(исирр _ирПср) .
По условиям, накладываемым на П(с,р),
ирисс исирс Пр иср _ ис Прр dР
>0,
исПрр <0,
ирПср > 0.
дК
> 0, е > 0, у > 0 ,
др( К)
то -------> 0 и уравнение (40) определяет р как мо-
дК
нотонно возрастающую функцию К .
Следовательно, существует единственное решение (К*,р*) системы уравнений (39), (40) (рис. 3). Подстановка найденного значения К = К* в (42) определяет
с*.
то —< 0 , то есть уравнение (39) определяет р как
dK
монотонно убывающую функцию К .
Рассмотрим уравнение (40). Поскольку
дЕ (К, I)
ЛИТЕРАТУРА
1. Ашманов СА. Введение в математическую экономику. М.: Наука, 1984.
2. ИнтрилигаторМ. Математические методы оптимизации и экономическая теория. М.: Прогресс, 1975.
3. Математическая экономика / Ред. Б.С. Митягина. М.: Мир, 1974.
4. Понтрягин Л.С. и др. Математическая теория оптимальных процессов. М.: Наука, 1978.
5. Габасов Р., Габасова О.Р., Дмитрук НМ. Синтез оптимальной политики для производственно-финансовой модели фирмы I // Автоматика и телемеханика. 1998. № 9. С. 100 - 117.
6. Габасов Р., Габасова О.Р., Дмитрук Н.М. Синтез оптимальной политики для производственно-финансовой модели фирмы II // Автоматика и телемеханика. 1998. № 10. С. 95 - 113.
Статья представлена кафедрой прикладной математики факультета прикладной математики и кибернетики Томского государственного университета, поступила в научную редакцию «Кибернетика» 12 мая 2005 г.