УДК 519.83
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ЭКОНОМИКО-ЭКОЛОГИЧЕСКОЙ СИСТЕМЫ РЕГИОНА С ПРИМЕНЕНИЕМ ТЕОРИИ ДИНАМИЧЕСКИХ ИГР С ПРИРОДОЙ
Н. С. Самойленко, В. В. Мешечкин
MATHEMATICAL MODELING OF THE REGIONAL ECONOMIC-ECOLOGICAL SYSTEM USING THE THEORY OF DYNAMICAL GAMES WITH NATURE
N. S. Samoylenko, V. V. Meshechkin
Статья посвящена исследованию приложений динамических игр с природой как нового класса игровых моделей, предложенного в работах профессора Кемеровского государственного университета Н. Н. Данилова. В виде динамической игры с природой построена математическая модель экономико-экологической системы региона, проведен ее анализ и выполнены расчеты оптимальных (в смысле критериев Вальда, Гурвица, Сэвиджа) стратегий.
The article is devoted to researching applications for dynamical games with nature as a new class of game models proposed in the works of professor N. N. Danilov, Kemerovo State University. Mathematical model of a regional economic-ecological system as a dynamical game with nature is built, its analysis is carried out and calculations of optimal (in terms of Wald, Hurwicz, Savage criteria) strategies are made.
Ключевые слова: математическое моделирование, теория игр, экономико-экологические системы.
Keywords: mathematical modeling, game theory, economic-ecological systems.
Введение
Теория игр - совокупность математических методов анализа и оценки конфликтных ситуаций - имеет широкое применение в вопросах бизнеса в условиях конкуренции, в планировании военных операций и управлении военной техникой, в самых разнообразных задачах организации народного хозяйства и управления производством. Теория игр помогает выбрать лучшие стратегии с учетом представлений о других участниках, их ресурсах и их возможных поступках [1].
В последнее время наблюдается стремительное повышение интереса к теории игр и значительное возрастание ее роли. Одним из бурно развивающихся разделов теории игр являются динамические игры, с помощью которых удается создавать адекватные модели для исследования практических задач из области экологии, экономики, менеджмента, международных отношений, охраны окружающей среды и др. Это обусловливается необходимостью учитывать временной аспект в многочисленных взаимодействиях между субъектами: фирмы, работающие на одном и том же рынке, знают, что они встретятся снова в последующих периодах, из аналогичного предположения исходит правительство, определяя свою внешнеторговую политику. Кроме того, многие экономические параметры, такие как инвестиции в производственные мощности, расходы на рекламу и пр., оказывают свое влияние на предложение и спрос лишь в будущем. Поэтому методы теории динамических игр все чаще применяются при анализе вопросов стратегического поведения в сложных социально-экономических и экологических системах, развивающихся во времени (см., напр., [2]). Сама теория динамических игр тоже не стоит на месте, в ней появляются новые разделы, позволяющие описывать различные варианты динамического взаимодействия игроков, и новые методы для их анализа. К таким новым разделам можно отнести динамические матричные игры, динамические игры с природой и динамические биматричные игры,
предложенные профессором математического факультета Кемеровского государственного университета Н. Н. Даниловым [3; 4].
Данная работа посвящена применению теории динамических игр с природой для моделирования деятельности производственного сектора региона как экономико-экологической системы, в которой учитывается как экономическая выгода от производственной деятельности, так и ущерб от загрязнения окружающей среды. В основу положена методология статьи [4], где автор предложил понятие динамических игр с природой, введя в модель игры с природой фактор времени, определил классы допустимых стратегий и проанализировал динамические аналоги принципов оптимальности Вальда, Гурвица, Сэвиджа.
Построение математической модели эконо-миико-экологической системы региона в виде динамической игры с природой
Рассматривается производственный сектор региона, выпускающий некоторую продукцию. При этом в процессе производства образуются вредные вещества, которые выбрасываются в окружающую среду и в возмещение ущерба от которых производители вынуждены уплачивать штрафы. Тогда целью производственного сектора будет максимизация экономической прибыли с учетом выплат за загрязнение природной среды.
Для получения математической модели производственного сектора построим динамическую модель игры с природой, применив терминологию и аппарат работы [4].
Исследуемая система сознательно будет рассматриваться в упрощенной форме, с одной стороны, удобной для представления в матричном виде и для интерпретации, а с другой, - в достаточной мере отражающей специфику изучаемого объекта.
Введем обозначения для построения модели.
t - параметр времени, соответствующий году и принимающий дискретные значения (t = 0,1,..., Т).
К^) - величина основных фондов производственного сектора в момент времени t.
I (^ - инвестиции (валовые капитальные вложения) в момент t. Их величина для производственного сектора в каждый момент ограничена сверху максимальным значением ).
Валовые капитальные вложения идут на приращение основных фондов К(Г) (чистые капитальные вложения) и на замещение изношенного капитала, то есть на восстановление изношенной части основных производственных фондов (амортизационные отчисления).
Тогда, зная размер инвестиций, можно построить уравнение динамики основных фондов:
К^ +1) = I(^ + К(0 ~/и(0 • К(0, (1)
где /и(11) - темп изнашивания основных фондов (за год t из строя выходит /и^) • К(t) единиц основных фондов) [5].
В начальный момент ? = 0 заданы основные фонды производственного сектора:
К(0) = К0. (2)
Условия (1), (2) определяют динамику основных фондов на отрезке [0, Т].
Через F : Я1 ^ Я1 обозначим функцию, описывающую производственные возможности региона в зависимости от размера основных фондов. Величина F(К^)) представляет собой объем выпуска производственного сектора, если основные фонды равны
к (0.
Для определенности будем считать, что объем производства в каждый момент t прямо пропорционален основным фондам, то есть функция F имеет следующий вид:
F(К^)) = у«) • КЦ). (3)
Обозначим через р цену выпускаемого продукта, тогда доход производственного сектора в момент t будет равен р • F(К ^)).
При этом производственный сектор будет нести производственные издержки С (К ^)), величина которых определяется формулой:
С(К (0) = &•№ • F (К (t)), (4)
где ю - цена затрат, а ^(t) - величина затрат на единицу выпуска в момент времени t.
Обозначим 0(К ^)) сумму штрафов, назначаемых
за выбросы загрязняющих веществ в окружающую среду. Будем предполагать, что они пропорциональны объему производства:
О (К ^)) = 5 •а^) • F (К ^)), (5)
где а(^ - величина загрязнения на единицу выпуска,
5 - цена за выброс одной единицы загрязнителя.
Итоговой характеристикой для производственного сектора, оценивающей эффективность его работы, будет суммарная прибыль за весь период [0, Т].
Прибыль производственного сектора в каждый момент t определяется не только доходом от реализации продукции, но и производственными издержками, а также издержками, вызванными загрязнением окру-
жающей среды:
П(K (t)) = p • F(K(t)) - С(K (t)) - G(K(t)) . (6)
Подставляя (4) и (5) в (6), получаем:
П(K (t)) = p • F(K(t)) --a • P{t) • F(K(t)) - S • a(t) • F(K(t)) =
= (p -a • P(t) -S • a(t)) • (F(K(t))), t = 1,...,T.
Тогда суммарная прибыль за весь период времени, которую и будет максимизировать производственный сектор, равна
X (p -a •Pit) - S • a(t)) • (F (K (t))).
t=1
На размер прибыли производственного сектора будет влиять его стратегия при выборе объема выпускаемой продукции, а также природоохранное законодательство, политика администрации региона и территориальных органов Министерства природных ресурсов и экологии Российской Федерации в области экологического регулирования.
В настоящее время величина и порядок выплаты штрафов за возмещение ущерба от негативного воздействия на природу в России определяются Законом «Об охране окружающей природной среды» [6]. В данной статье примем в качестве допущения, что величина штрафа за единицу выброса заранее производственному сектору не известна и может принимать значения в некотором диапазоне [0, Smax], где Smax -максимально допустимая величина штрафа за единицу выбросов. Такое предположение приводит к возникновению ситуации неопределенности и позволяет построить модель в виде игры с природой, где 1-м игроком является производственный сектор, который распоряжается инвестициями I(t), а 2-м игроком будет выступать «природа» как состояние природоохранного законодательства, в условиях которого функционирует производственный сектор, со стратегиями, соответствующими устанавливаемым значениям штрафа на единицу загрязнения окружающей среды. При этом считается, что 2-й игрок пассивный и характеризуется тем или иным состоянием [7].
Интервал возможных значений штрафов [0, Smax] разобьем дискретными точками S1 (t) = 0 , S2 (t), S3 (t)
, ..., Sn (t) = Smax, которые и будут стратегиями «природы» в каждый момент t.
Аналогично, учитывая максимальный размер инвестиций Imax(t) для каждого момента времени t, произведем дискретизацию диапазона [0,Imax(t)]: I1(t) = 0,
I2(t ), I3(t), ..., Im(t) = Imax(t). Э™ величины будут
стратегиями 1-го игрока - производственного сектора.
При выборе производственным сектором стратегии I (t) на следующем шаге он перейдет в состояние K(t +1) = I,, (t) + (1 - ^(t)) • K(t). Если при этом «природа» окажется в состоянии Sj (t), то прибыль производственного сектора будет равна:
Пу (K (t)) = П j (K (t), S. (t), L (t)) = = p • F (K (t)) - a • P(t) • F (K(t)) -
- S. (t) a(t )• F (K (t)).
Перебирая все возможные значения ,, ., получаем матрицу значений П. (К (Г)), которая является матрицей выигрыша игрока 1 для данного момента времени Г:
СПИ(К(0) П12(К(Г)) ... П,(К(Г))^
ПК)) па(К(г)) ... п,(К(Г))
А(К(Г)) =
.(7)
ЧПЛ1(К(Г)) ПШ2(К(Г)) ... п,(к(г))]
Изменяя Г от 1 до Т, получаем последовательность игровых матриц, в которых стратегии «природы» не известны. Для каждого Г эти матрицы определяют игру с природой, в которой производственный сектор вынужден выбирать свою стратегию выпуска продукции с учетом состояний «природы».
Записанные соотношения формируют модель производственного сектора на отрезке [0, Т], в которой основные фонды играют роль фазовых переменных, характеризующих состояние производственного сектора в каждый момент времени, инвестиции являются управляющими переменными, а суммарная прибыль - критерием качества. Однако при этом принятие решения производственным сектором происходит в условиях неопределенности, так как величины штрафов в конкретные моменты ему не известны.
Поэтому построенную модель будем рассматривать как динамическую игру с природой и для ее решения используем соответствующие игровые принципы оптимальности (Вальда, Гурвица, Сэвиджа), распространив их на динамику.
Формализация игровых принципов оптимальности для динамической игры с природой
С помощью системы (1) - (2) функционирование производственного сектора можно представить следующим образом: в состоянии К 0 под действием выбранных в момент Г = 0 управлений 11 (0) производственный сектор переходит в новое состояние К(1) = I,.(0) + (1 — и(0)) •К(0). Если при этом величина штрафов (стратегия «природы») окажется равной
5. (0), то прибыль производственного сектора будет равна
П (К(1)) = (р —ю 3(1) — SJ (0) • а(1)) • ^(К(1))).
Под влиянием выбранных в состоянии К(1) управлений производственный сектор переходит в новое состояние К(2) = I,. (1) + (1 — и(1)) • К(1), получая при этом прибыль
П I (К (2)) = (р — /3(2) — Sj (1) • а(2)) • ^ (К (2)))
и так далее. На последнем шаге (Г = Т — 1), находясь в состоянии К(Т — 1), под действием выбранных управлений производственный сектор переходит в состояние К (Т) = I, (Т — 1) + (1 — и(Т — 1)) • К (Т — 1) с прибылью:
П I (К(Т)) = (р — ю • 3(Т) — 5. (Т — 1) • а(Т)) • ^(К(Т))).
В результате получается хронологически упорядоченная последовательность значений основных фондов производственного сектора
К (•) = {К0, К (1),..., К (Т)}, которую будем называть траекторией системы (1) -
(2), соответствующей последовательности управлений
I (•) = {I ,(0), I .(1),..., I. — (Т — 1)}.
Стратегии «природы» 5. (Г) также можно объединить в последовательность, получив траекторию
5 (•) = {^(0)5. (1),...,5.—1(Т — 1)}.
Построенные последовательности стратегий будут являться допустимыми управлениями 1-го и 2-го игроков соответственно.
Цель игрока 1 представим как максимизацию значения следующего функционала:
F (К )(•), 1(-), 8(-)) = £ П1[_1 и( К (Г) =
1=1
= § (р — ю • 3(Г) — Б. (Г) • а (Г)) • ^ (К (Г))),
г=0
где I(•) и 5(•) - последовательности стратегий игроков, выбираемых ими в играх с природой с матрицами А(К (Г)), Г = 1,..., Т .
Используя формализацию работы [4], определим классы допустимых стратегий игроков в рассматриваемой модели.
Множество всех стратегий игроков 1 и 2 обозначим символами Ф: и Ф5 соответственно.
Совокупность
Г (К0, Т) = (£ (К0, Т); ФI, Ф 5; ^ , (8)
где £ (К0, Т) - символическое обозначение системы
(1) - (2), назовем динамической игрой с природой.
Процесс управления производственным сектором с помощью модели (8) можно представить следующим образом. В начальном состоянии К 0 игроки выбирают некоторые стратегии
ф,(•) = {I,(0),I.(1),...,— (Т — 1)} е ФI,
фЕ(•) = {5. (0)5 (1),..,5/т—1 (Т — 1)} е ФЕ , которые порождают траекторию
К (•) = К (., К0, ф, (•), ф3 (•)) = {К0, К (),..., К (Т)}.
Во всех точках траектории К(•) (кроме К0) заданы игры с природой с матрицами вида (7) для Г = 1,..., Т . Пары стратегий (1.0 (0), 5.0 (0)), ...,
(^ (Т —1), 1 (Т -1)) определяют выигрыши
П,0,л(К (1)^ ..., П.Т—1 * м(К (Т ))
первого игрока. Следовательно, при выборе управлений (ф7 ( •), ф5 ( •)) = (I ( •), 5 ( •)) выигрыш первого игрока равен величине
F(К0фОф (•)) = F(К(•),I(•),5(•)) = £ П.. (К(Г)).
Г=1
Для построения принципов оптимального выбора стратегий игроком 1 в динамической игре (8) используем приведенные в [4] определения.
1. Каждой траектории К (•) поставим в соответст-
Т
вие число ¥в (К ( • )) = £ тах шт П Г (К (Г)),
Г= и =1,..,т],^ =1,...,п
которое будет называться ценой Вальда для траектории К (•).
Определение 1. Стратегия ф^Ое ФI называется
оптимальной по Вальду стратегией 1-го игрока в игре которое назовем ценой Гурвица для траектории К(•). (8), если
min VB(K(•,K0,I*(•),S(•))) =
S ОєФ
max min VB (K(•, K0, I(•), S(•))),
I (Оє^ S(ОєФ
Определение 2. Стратегия ф1 (•) е Ф1 называется оптимальной по Гурвицу стратегией 1-го игрока в игре (8), если
шт Уг (К(•, К0, I*(•), 5(•))) =
5 (-)еФ2
где I (•) - управление, входящее в состав стратегии
&*(•) •
_* . .
Критерием Вальда, как правило, руководствуется где I (•) - управление, входящее в состав стратегии
= Vr (K(•, K^I(•), S(•))),
I (ОєФ! S(•)єФ2
при выборе рисковых решений в условиях неопределенности субъект, не склонный к риску или рассматривающий возможные ситуации как пессимист.
2. Каждой траектории К (•) поставим в соответствие число
(K(л» = | max
t=lи
Я min Пі (K(t)) +
jt - =1,...,n И’Л-1
+(1- Я) miix П. l(K(t))
jt-l =1.....n t -1 t-1
О <Я< 1,
f maxП ll(K(t))- Піі(K(t))
4-1 1
miax П^Д K (t))- П2і( K (t))
ф(о.
Критерий Гурвица позволяет руководствоваться при выборе рискового решения в условиях неопределенности некоторым средним результатом эффективности, находящимся между оптимистическим и пессимистическим значениями.
3. Наряду с матрицей (7) в состоянии К (Г) введем в рассмотрение матрицу риска:
R(K (t)) =| |rt-1 jt-l(K (t ))||:
miaxП ll(K(t))- Пml (K(t))
V .t-l
max П ^ (K (t))- Піи(K (t))
miax Пип (K (t))- П2и( K (t))
max ПП. ln (K (t))- Пт (K (t))
(9)
Каждой траектории K (•) поставим в соответствие
T
число Vc (K (•)) = y min max rt (K (t)), которое
" it-, =l,...,m jt-, =1,...,n t-1 ■jt-1
назовем оценкой риска по Сэвиджу для траектории K (•).
Определение 3. Стратегия (^(а Ф1 называется оптимальной по Сэвиджу стратегией 1-го игрока в игре (8), если
max V(K(-,K,I*(•),S(•))) =
S(Oe0S
= nninniax VC (K(s K0, I (•), SQ)),
I (-)аф S(•)a<pS
где I (•) - управление, входящее в состав стратегии .
Критерий Сэвиджа используется при выборе рисковых решений в условиях неопределенности, как правило, субъектами, не склонными к риску.
Нахождение оптимальных траекторий в построенной динамической игре с природой
Рассмотрим последовательно функционирование производственного сектора в исследуемой модели.
В состоянии K0 под действием выбранного в момент t = 0 управления I (0) производственный сектор переходит в новое состояние:
K(1) = I(0) + (1- М(0)) • K(0).
Под влиянием выбранных в состоянии K(1) управлений производственный сектор переходит в состояние
К (2) = I (1) + (1 — и(1)) • К (1) = I (1) + (1 — и(1)) • I (0) +
+(1 — и(1)) • (1 — и(0)) • К (0).
Аналогично, на следующем шаге осуществляется переход в состояние
К (3) = I (2) + (1 — и(2)) • К (2) =
= I (2) + (1 — и(2)) • I (1) +
+(1 — и(2)) • (1 — и(1)) • I (0) +
+(1 — и(2)) • (1 — и(1)) • (1 — и(0)) • К (0), и так далее.
Из (3) - (5) следует, что производственные издержки С (К (Г)) должны вычисляться по формуле:
С (К (Г )) =ю3(Г) •у (Г) • К (Г),
а сумма штрафов О (К (Г)), назначаемых за выбросы
загрязняющих веществ в окружающую среду, - по формуле:
О (К (Г )) = 5 (Г) а(Г) у (Г) • К (Г).
Если в момент времени Г = 0 величина штрафов (стратегия «природы») окажется равной 5(0), то прибыль производственного сектора для Г = 1 будет равна: П (К (1)) = (I (0) + (1 — и(0)) • К (0)) •
•у(0) • (р — ю-3(1) — 5 (0) • а(1)).
Аналогично, в состоянии К(2) игрок 1 получает прибыль:
П (К (2)) = (I (1) + (1 — и(1)) • I, (0) +
+(1 — и(1)) • (1 — и(0)) • К(0)) •уЦ) •
•( р — ю-3(2) — 5 (1) а(2)).
В состоянии К (3) игрок 1 получает прибыль:
П (К (3)) = (I (2) + (1 — и(2))-1 (1) +
+(1 — и(2)Н1 — и(1)> I (0) +
+(1 — и(2)) • (1 — и(1)) • (1 — и(0)) • К (0)) • у (2) •
• (р — ю3(3) — 5 (2) • а(3)).
Остановимся пока на этом состоянии и зафиксируем индексами .Г , .Г номера выбиравшихся на отрезке времени [0, 3] стратегий. Тогда суммарная прибыль игрока 1 на этом промежутке вычисляется по следующей формуле:
£ П—,,(К(Г)) = 10 (0) • (Г(0> (р—ю 3(1)—50 (0) • а(1))) +
Г=1
+ ((1 — и(1)) • у(1) • (р — Ю 3(2) — ^ (1) • а(2))) + +((1 — и(2)) • (1 — ()) • У(2) • (р—ю 3(3) — ^ (2) • а(3) + +
+14(1)‘
7(1)- (р -0-3(2) - Б,^1) -«(2)) + ^ (1 -^(2))-(1 -^(1)) -Г(2). Л
-(р -а 3(3) -Б,2(2) .«(3))
+
V V
/ у
+1,2 (2) ■ р2) • (р - а 3(3) - ^.2 (2) - «(3))) +
+К(0) ■ ((1 - М0)) ■ р - а 3(1) - (0) ■ «(1)+ К0) +
+(1 - ^(1)) ■ (1 - М0)) ■ 7(1) ■ р - а 3(2) - Б. (1) ■ «(2)) +
+(1 -М2))-(1 -^(1))-(1 -^(0))- '
■ 7(2)- (р -а 3(3) -Б.2(2) -«(3)),
где у(ґ) - коэффициент пропорциональности между основными фондами и объемом выпуска в (3).
Разобьем полученную формулу на части, выделив в ней стратегии природы Б, (ґ) и производственного
сектора I (ґ) на каждый момент ґ. При этом получим следующие выражения для отдельных компонент:
Н , (К (1)) = I (0) ■ (7(0) ■ (р -о 3(1) - Б. (0) ■ «(1))) +
+К(0) ■ (1 - М0)) • р -0-3(1) - Б. (0) ■ «(1)) 7(0),
(10)
Н , (К (2)) = 1.(0)
(1-^(1)}-
7(1) -р -ю-3(2) - Б. (1) -«(2)) +1 (1) - р) • (Р - а 3(2) - Б, (1) - «(2))) ^(1-^(1))(1 -М0))-
-(р-о-3(2) - Б, (1)-«(2))-7(1)
+К(0) ■
)+
Л
(11)
Н , (К(3)) = I: (0) -
(1 -М2))-(1 -^(1))-
(12)
•7(2) • (р — ю(3) — 5. (2) а(3)+
+!** (1) • (7(2) • ( — ю 3(3)—5. (2) • а(3) + (1 — и(2))) -
I , (2) • (у(2) • (р — ю 3(3) — 5. (2) • а(3))) +
С(1 — и(2))-(1 — ^(1))(^—^(0)) ^
+К (0) • , , ,
V •( — ю3(3) — 5. (2) а(3)) • 7(2))
где I* (Г) - оптимальная стратегия, выбранная игроком 1 в момент времени Г.
Преобразуем (10) - (12), переписав эти выражения следующим образом:
Н . (К (1)) = 7(0) • (I, (0)+К (0) • (1 — и0))) •
•(р — 0-3(1) — 5. (0) • а(1)),
Н . (К (2)) = 7(1) • (I* (0) • (1 — К)) +1, (1) +
+К (0) • (1 — и(1)) • (1 — и(0))) • (р — ю 3(2) — ^ (1) • а (2)),
СI ,*(0)41 — и(2))(1 — и(1)) +
Н . (К (3)) = 7(2) • 0*
. 1ч+/,1 (1)(1 — и(2)) +1, (2) +
+К (0) • (1 — и(2)) • (1 — и(1)) • (1 — и(0))) •
•( — ю-3(3) — 5 (2) -а(3)).
Полученные соотношения позволяют проследить закономерность изменения величины Н во времени и записать общий вид выражения для произвольно-
го ґ:
Н, (К(ґ)) = 7(ґ -1)--(р-о3(ґ) - Б, (ґ -1)-«(ґ))•
(13)
I , (ґ -1) +Х11 (?)-
ґ = 2,3,4,
П (1 — и(в))+К(0)• П(1 — К*))
V 0=г+1 *=0 у
Из величин (13) при разных значениях , = 1,...,т и . = 1,..., п составляем вспомогательные матрицы выигрышей Н (К (Г)) для каждого момента Г.
Как видно из формулы (13), элементы вспомогательной матрицы Н (К (Г)) на каждом шаге зависят от оптимальных стратегий, выбранных игроком 1 на предыдущих шагах. Таким образом, взяв в качестве оптимальной одну из своих т стратегий при Г = 1 , игрок 1 может получить в момент Г = 2 одну из т возможных вспомогательных матриц Н(К(2)). Оптимальная стратегия на втором шаге для каждой такой матрицы, в свою очередь, также определяет т воз-
ч_* 2
можных продолжений, то есть всего получается т вспомогательных матриц Н(К(3)), зависящих от выбора оптимальных стратегий I (0) и I (1) и так далее.
Последовательно увеличивая Г и применяя к вспомогательным матрицам (13) критерии Вальда, Гурвица, Сэвиджа, можно определить оптимальные стратегии в соответствующие моменты времени и по-
Л
строить оптимальную траекторию для игрока 1 (производственного сектора).
Пример
Для иллюстрации описанного выше теоретического материала приведем расчеты модельного примера, позволяющие определить оптимальные стратегии производственного сектора в условиях неопределенности, вызванной неизвестными значениями штрафов за выбросы вредных веществ в окружающую среду.
Пусть в модели производственного сектора Т = 3, начальное значение основных фондов К(0) = 300, цена товара р = 12 , цена затрат ю = 15 .
Величина затрат на единицу выпуска а(Г) = 0,45, Г = 0,1,2,3.
Коэффициент пропорциональности между основными фондами и загрязнением 3(Г) = 0,6 , Г = 0,1,2,3.
Темп изнашивания основных фондов и (Г) = 0,45, Г = 0,1,2,3.
Коэффициент пропорциональности между основными фондами и объемом выпуска 7(Г) = 0,5, Г = 0,1,2,3.
Будем предполагать, что возможные величины штрафов в каждый момент Г реализуются из множества 5(Г) = {^(Г), 52(Г), 53(Г), 54(Г)} = {2,5,8,11}, а возможные размеры инвестиций выбираются из множества I (Г) = {!,(Г), 12 (Г), Ш, 14 (Г) } = {0,9,18,23}.
При Г = 1 по формуле (10) строим вспомогательную матрицу:
с 346,5 123,75 —99 —321,75'
355,95 127,12 —101,7 —330,52
365,4 130,5 —104,4 —339,3
,370,65 132,37 —105,9 —344,17 у
Для критерия Вальда в каждой строке этой матрицы находим минимальное значение, а из полученных чисел выбираем максимальное: -321,75.
Это число соответствует стратегии ^, которая будет являться оптимальной для Г = 1 . С использованием этой стратегии и формул (10) рассчитывается следующая вспомогательная матрица для Г = 2 :
с 95,28 18, 71 —8,23 —14,72'
104,73 23,11 —12,20 —28,41
114,18 27,5 —16,16 —42,10
,119,43 29,95 —18,37 —49,71 у
В каждой строке полученной матрицы находим минимальное значение и из них выбираем максимальное: -14,72.
Это число соответствует стратегии Д, которая снова (как и для Г = 1 ) будет оптимальной. По данной стратегии рассчитывается следующая вспомогательная матрица для Г = 3 :
с 18,71 —8,23 —14,72 12,45'
22,09 — 11,38 —25,79 30,11
25,46 —14,53 —36,79 47,77
ч 27,34 —16,28 —42,92 57,58у
В каждой строке матрицы определяем минимальное значение, из них выбираем максимальное (-14,72) и для последнего шага снова в качестве оптимальной получаем стратегию ^.
В результате находим оптимальную траекторию для игрока 1 по критерию Вальда:
IВо = {IВ(0), IВ(1), IВ (2)}={1,1,1}.
Далее применим критерий Гурвица. Пусть Л = 0,5, то есть позиция игрока 1 - средняя между крайним оптимизмом и крайним пессимизмом.
Возьмем начальную матрицу (14) и в каждой ее строке найдем минимальное и максимальное значения.
По правилу выбора оптимальной стратегии в критерии Гурвица вычисляем линейную комбинацию для первой строки:
—321,75 • 0,5 + (1 — 0,5) • 123,75 = 12,375.
Аналогичные расчеты проводим для остальных строк. В результате получаем следующий набор чисел:
12,375; 12,71; 13,05; 13,23.
Из этих значений выбираем наибольшее (13,23), соответствующее стратегии 14, которая будет оптимальной при Г = 1 .
По стратегии !4 рассчитываем следующую вспомогательную матрицу для Г = 2 :
с 108,57 23, 46 —12,03 —27,05'
118,02 27,85 —15,99 —40,74
127,47 32,25 —19,96 —54,43
ч 132,72 34,69 —22,16 —62,04у
Заметим, что в силу выбора при Г = 1 другой стратегии (14 в отличие от ^) эта матрица не совпадает со вспомогательной матрицей, использовавшейся на соответствующем шаге при вычислении критерия Вальда.
В каждой строке полученной матрицы находим минимальное и максимальное значения и применяем методику нахождения оптимальной стратегии по Гур-вицу, что дает нам набор чисел:
40,75; 38,68; 36,51; 35,33.
Из этих величин выбираем наибольшую (40,75), соответствующую стратегии ^, которая будет оптимальной для Г = 2 .
Используя эту стратегию, рассчитываем вспомогательную матрицу для Г = 3 :
с 18,71 —8,23 —14,72 12,45'
22,09 — 11,38 —25,79 30,11
25,46 —14,53 —36,79 47,77
ч 27,34 —16,28 —42,92 57,58у
В каждой строке матрицы находим минимальное и максимальное значения, применяем формулу критерия Гурвица и из чисел -10,33; -10,15; -6,84; -5,003
выбираем наибольшее, соответствующее стратегии 14, которая будет оптимальной для Г = 3 .
В итоге получаем оптимальную траекторию производственного сектора по критерию Гурвица:
I *(•) = {I *(0), IГ (1), I Г* (2)} = {4,1,4}.
И, наконец, рассмотрим критерий Сэвиджа.
В каждом столбце начальной вспомогательной матрицы (14) находим максимальное значение:
370,65; 132,37; -99; -321,75.
Далее строим матрицу риска по формуле (9): с24,15 8,625 0 0 ^
Я( К (1)) =
14,7
5,25
0
5,25
1,87
0
2,7
5,4
6,9
8,77 17,55 22, 42
Н (К (2)) =
109,93
119,38
124,63
24,96 -13,68 29,36 -17,65 31,8 -19,85
-19,54 Л -33,23 -46,9 -54,53
В каждом столбце матрицы Н (К (2)) находим
максимальное значение:
124,63; 31,8; -9,72; -19,54.
По полученным данным рассчитываем матрицу риска:
с 24,15 11,23
Я(К (2)) =
14,7
5,25
0
6,83 2, 44 0
0
3,96
7,93
10,1
0 Л 13,69 27,38 34,99
Н (К (3)) =
24,96 —13,68 —35,41 28,34 —16,83 —46,44 30,21 —18,58 —52,58
Ч 7 7 7 ■ /
В каждом столбце данной матрицы определяем максимальное значение:
30,21; -10,21; -24,37; 72,43,
27,30Л 44,96 62,62 72, 43
после чего вычисляем матрицу риска:
(8,625 0 0
Я(К (3)) =
5,25
1,87
0
3,14
6,29
8,04
11,03
22,07
28,208
45,13 Л 27,47 9,81 0
В каждой строке этой матрицы находим максимальное значение и выбираем из них минимальное (14,7), соответствующее стратегии !2, которая будет оптимальной при Г = 1 .
По стратегии /2 рассчитывается следующая вспомогательная матрица для Г = 2:
с100,48 20,57 —9,72
В каждой строке матрицы Я(К(3)) находим максимальное значение, из них выбираем минимальное (22,07) и видим, что при Г = 3 оптимальной будет стратегия /3.
В результате получаем оптимальную траекторию производственного сектора по критерию Сэвиджа: !*(•) = {!*(0), I*®, I* (2)} = {2,2,3}.
Номера оптимальных стратегий 1-го игрока в динамической игровой модели производственного сектора, найденные на основе различных критериев, можно свести в обобщающую таблицу.
Критерий Номер оптимальной стратегии игрока 1 для момента времени t
X = 1 ґ = 2 ґ = 3
Вальда 1 1 1
Гурвица 4 1 4
Сэвиджа 2 2 3
В каждой строке этой матрицы находим максимальное значение и из них выбираем минимальное (14,7), соответствующее стратегии !2, которая снова оказалась оптимальной.
По стратегии !2 рассчитывается следующая вспомогательная матрица для Г = 3 :
с 21,59 —10,53 —24,37
Окончательно оптимальная траектория производственного сектора выбирается из предложенных в зависимости от предпочтений производителей и их склонности к риску.
Заключение
Проведенные исследования продемонстрировали возможность прикладного использования новой теории динамических игр с природой для моделирования взаимодействий в различных сложных системах в условиях неопределенности на примере экономикоэкологической системы региона. Применение теоретико-игрового аппарата позволяет произвести стратегический анализ, определить наиболее важные и требующие учета факторы при принятии решений, что, в конечном счете, повышает эффективность функционирования системы.
Рассмотренный в статье подход позволяет с новой точки зрения исследовать задачи со стратегически обусловленными действиями и изучать поведение человека в различных ситуациях в рамках экономической науки, политологии, социологии, психологии и пр., учитывая при этом изменение во времени условий или факторов, могущих повлиять на ситуацию.
Литература
1. Мазалов, В. В. Математическая теория игр и приложения: учеб. пособие / В. В. Мазалов. - СПб.: Лань, 2010. - 446 с.
2. Зенкевич, Н. А. Динамические игры и их приложения в менеджменте: учеб. пособие / Н. А. Зенкевич, Л. А. Петросян, Д. В. К. Янг. - СПб.: Высшая школа менеджмента, 2009. - 416 с.
3. Данилов, Н. Н. Динамические матричные игры. Обоснование применения принципа минимакса в классе чистых комбинированных стратегий / Н. Н. Данилов // Вестник КемГУ - 2012. - Вып. 2(50). - С. 42 - 48.
4. Данилов, Н. Н. Математическая модель менеджмента в условиях неопределенности в форме динамической игры с природой I Н. Н. Данилов II Вестник КемГУ. - 2012. - Вып. 3(51). - С. 110 - 114.
5. Данилов, Н. Н. Курс математической экономики: учеб. пособие I Н. Н. Данилов. - М.: Высшая школа, 200б. - 407 с.
6. Федеральный закон Российской Федерации от 10.01.2002 № 7-ФЗ «Об охране окружающей среды» (ред. от 02.07.2013). - Режим доступа: http:IIwww.consultant.ruIpopularIokrsredI
7. Дубров, А. М. Моделирование рисковых ситуации в экономике и бизнесе: учеб. пособие I А. М. Дубров, Б. А. Лагоша, Е. Ю. Хрусталев; под ред. Б. А. Лагоши. - М.: Финансы и статистика, 2000. - 17б с.
Информация об авторах:
СамойленкоНаталья Сергеевна - студентка математического факультета КемГУ, 8 (3842) 54-25-09, nostienataly@mail.ru.
Natalia S. Samoylenko - student at the Mathematical Faculty, Kemerovo State University.
Мешечкин Владимир Викторович - научный руководитель, кандидат физико-математических наук, доцент кафедры математической кибернетики КемГУ, 8 (3842) 54-25-09, vvm@kemsu.ru.
Vladimir V. Meshechkin - research advisor, Candidate of Physics and Mathematics, Assistant Professor at the Department of Mathematical Cybernetics, Kemerovo State University.