Научная статья на тему 'Математическое моделирование экономико-экологической системы региона с применением теории динамических игр с природой'

Математическое моделирование экономико-экологической системы региона с применением теории динамических игр с природой Текст научной статьи по специальности «Экономика и бизнес»

CC BY
713
112
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
СибСкрипт
ВАК
Область наук
Ключевые слова
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ / ТЕОРИЯ ИГР / ЭКОНОМИКО-ЭКОЛОГИЧЕСКИЕ СИСТЕМЫ / MATHEMATICAL MODELING / GAME THEORY / ECONOMIC-ECOLOGICAL SYSTEMS

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Самойленко Наталья Сергеевна, Мешечкин Владимир Викторович

Статья посвящена исследованию приложений динамических игр с природой как нового класса игровых моделей, предложенного в работах профессора Кемеровского государственного университета Н. Н. Данилова. В виде динамической игры с природой построена математическая модель экономико-экологической системы региона, проведен ее анализ и выполнены расчеты оптимальных (в смысле критериев Вальда, Гурвица, Сэвиджа) стратегий.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Самойленко Наталья Сергеевна, Мешечкин Владимир Викторович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MATHEMATICAL MODELING OF THE REGIONAL ECONOMIC-ECOLOGICAL SYSTEM USING THE THEORY OF DYNAMICAL GAMES WITH NATURE

The article is devoted to researching applications for dynamical games with nature as a new class of game models proposed in the works of professor N. N. Danilov, Kemerovo State University. Mathematical model of a regional economic-ecological system as a dynamical game with nature is built, its analysis is carried out and calculations of optimal (in terms of Wald, Hurwicz, Savage criteria) strategies are made.

Текст научной работы на тему «Математическое моделирование экономико-экологической системы региона с применением теории динамических игр с природой»

УДК 519.83

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ЭКОНОМИКО-ЭКОЛОГИЧЕСКОЙ СИСТЕМЫ РЕГИОНА С ПРИМЕНЕНИЕМ ТЕОРИИ ДИНАМИЧЕСКИХ ИГР С ПРИРОДОЙ

Н. С. Самойленко, В. В. Мешечкин

MATHEMATICAL MODELING OF THE REGIONAL ECONOMIC-ECOLOGICAL SYSTEM USING THE THEORY OF DYNAMICAL GAMES WITH NATURE

N. S. Samoylenko, V. V. Meshechkin

Статья посвящена исследованию приложений динамических игр с природой как нового класса игровых моделей, предложенного в работах профессора Кемеровского государственного университета Н. Н. Данилова. В виде динамической игры с природой построена математическая модель экономико-экологической системы региона, проведен ее анализ и выполнены расчеты оптимальных (в смысле критериев Вальда, Гурвица, Сэвиджа) стратегий.

The article is devoted to researching applications for dynamical games with nature as a new class of game models proposed in the works of professor N. N. Danilov, Kemerovo State University. Mathematical model of a regional economic-ecological system as a dynamical game with nature is built, its analysis is carried out and calculations of optimal (in terms of Wald, Hurwicz, Savage criteria) strategies are made.

Ключевые слова: математическое моделирование, теория игр, экономико-экологические системы.

Keywords: mathematical modeling, game theory, economic-ecological systems.

Введение

Теория игр - совокупность математических методов анализа и оценки конфликтных ситуаций - имеет широкое применение в вопросах бизнеса в условиях конкуренции, в планировании военных операций и управлении военной техникой, в самых разнообразных задачах организации народного хозяйства и управления производством. Теория игр помогает выбрать лучшие стратегии с учетом представлений о других участниках, их ресурсах и их возможных поступках [1].

В последнее время наблюдается стремительное повышение интереса к теории игр и значительное возрастание ее роли. Одним из бурно развивающихся разделов теории игр являются динамические игры, с помощью которых удается создавать адекватные модели для исследования практических задач из области экологии, экономики, менеджмента, международных отношений, охраны окружающей среды и др. Это обусловливается необходимостью учитывать временной аспект в многочисленных взаимодействиях между субъектами: фирмы, работающие на одном и том же рынке, знают, что они встретятся снова в последующих периодах, из аналогичного предположения исходит правительство, определяя свою внешнеторговую политику. Кроме того, многие экономические параметры, такие как инвестиции в производственные мощности, расходы на рекламу и пр., оказывают свое влияние на предложение и спрос лишь в будущем. Поэтому методы теории динамических игр все чаще применяются при анализе вопросов стратегического поведения в сложных социально-экономических и экологических системах, развивающихся во времени (см., напр., [2]). Сама теория динамических игр тоже не стоит на месте, в ней появляются новые разделы, позволяющие описывать различные варианты динамического взаимодействия игроков, и новые методы для их анализа. К таким новым разделам можно отнести динамические матричные игры, динамические игры с природой и динамические биматричные игры,

предложенные профессором математического факультета Кемеровского государственного университета Н. Н. Даниловым [3; 4].

Данная работа посвящена применению теории динамических игр с природой для моделирования деятельности производственного сектора региона как экономико-экологической системы, в которой учитывается как экономическая выгода от производственной деятельности, так и ущерб от загрязнения окружающей среды. В основу положена методология статьи [4], где автор предложил понятие динамических игр с природой, введя в модель игры с природой фактор времени, определил классы допустимых стратегий и проанализировал динамические аналоги принципов оптимальности Вальда, Гурвица, Сэвиджа.

Построение математической модели эконо-миико-экологической системы региона в виде динамической игры с природой

Рассматривается производственный сектор региона, выпускающий некоторую продукцию. При этом в процессе производства образуются вредные вещества, которые выбрасываются в окружающую среду и в возмещение ущерба от которых производители вынуждены уплачивать штрафы. Тогда целью производственного сектора будет максимизация экономической прибыли с учетом выплат за загрязнение природной среды.

Для получения математической модели производственного сектора построим динамическую модель игры с природой, применив терминологию и аппарат работы [4].

Исследуемая система сознательно будет рассматриваться в упрощенной форме, с одной стороны, удобной для представления в матричном виде и для интерпретации, а с другой, - в достаточной мере отражающей специфику изучаемого объекта.

Введем обозначения для построения модели.

t - параметр времени, соответствующий году и принимающий дискретные значения (t = 0,1,..., Т).

К^) - величина основных фондов производственного сектора в момент времени t.

I (^ - инвестиции (валовые капитальные вложения) в момент t. Их величина для производственного сектора в каждый момент ограничена сверху максимальным значением ).

Валовые капитальные вложения идут на приращение основных фондов К(Г) (чистые капитальные вложения) и на замещение изношенного капитала, то есть на восстановление изношенной части основных производственных фондов (амортизационные отчисления).

Тогда, зная размер инвестиций, можно построить уравнение динамики основных фондов:

К^ +1) = I(^ + К(0 ~/и(0 • К(0, (1)

где /и(11) - темп изнашивания основных фондов (за год t из строя выходит /и^) • К(t) единиц основных фондов) [5].

В начальный момент ? = 0 заданы основные фонды производственного сектора:

К(0) = К0. (2)

Условия (1), (2) определяют динамику основных фондов на отрезке [0, Т].

Через F : Я1 ^ Я1 обозначим функцию, описывающую производственные возможности региона в зависимости от размера основных фондов. Величина F(К^)) представляет собой объем выпуска производственного сектора, если основные фонды равны

к (0.

Для определенности будем считать, что объем производства в каждый момент t прямо пропорционален основным фондам, то есть функция F имеет следующий вид:

F(К^)) = у«) • КЦ). (3)

Обозначим через р цену выпускаемого продукта, тогда доход производственного сектора в момент t будет равен р • F(К ^)).

При этом производственный сектор будет нести производственные издержки С (К ^)), величина которых определяется формулой:

С(К (0) = &•№ • F (К (t)), (4)

где ю - цена затрат, а ^(t) - величина затрат на единицу выпуска в момент времени t.

Обозначим 0(К ^)) сумму штрафов, назначаемых

за выбросы загрязняющих веществ в окружающую среду. Будем предполагать, что они пропорциональны объему производства:

О (К ^)) = 5 •а^) • F (К ^)), (5)

где а(^ - величина загрязнения на единицу выпуска,

5 - цена за выброс одной единицы загрязнителя.

Итоговой характеристикой для производственного сектора, оценивающей эффективность его работы, будет суммарная прибыль за весь период [0, Т].

Прибыль производственного сектора в каждый момент t определяется не только доходом от реализации продукции, но и производственными издержками, а также издержками, вызванными загрязнением окру-

жающей среды:

П(K (t)) = p • F(K(t)) - С(K (t)) - G(K(t)) . (6)

Подставляя (4) и (5) в (6), получаем:

П(K (t)) = p • F(K(t)) --a • P{t) • F(K(t)) - S • a(t) • F(K(t)) =

= (p -a • P(t) -S • a(t)) • (F(K(t))), t = 1,...,T.

Тогда суммарная прибыль за весь период времени, которую и будет максимизировать производственный сектор, равна

X (p -a •Pit) - S • a(t)) • (F (K (t))).

t=1

На размер прибыли производственного сектора будет влиять его стратегия при выборе объема выпускаемой продукции, а также природоохранное законодательство, политика администрации региона и территориальных органов Министерства природных ресурсов и экологии Российской Федерации в области экологического регулирования.

В настоящее время величина и порядок выплаты штрафов за возмещение ущерба от негативного воздействия на природу в России определяются Законом «Об охране окружающей природной среды» [6]. В данной статье примем в качестве допущения, что величина штрафа за единицу выброса заранее производственному сектору не известна и может принимать значения в некотором диапазоне [0, Smax], где Smax -максимально допустимая величина штрафа за единицу выбросов. Такое предположение приводит к возникновению ситуации неопределенности и позволяет построить модель в виде игры с природой, где 1-м игроком является производственный сектор, который распоряжается инвестициями I(t), а 2-м игроком будет выступать «природа» как состояние природоохранного законодательства, в условиях которого функционирует производственный сектор, со стратегиями, соответствующими устанавливаемым значениям штрафа на единицу загрязнения окружающей среды. При этом считается, что 2-й игрок пассивный и характеризуется тем или иным состоянием [7].

Интервал возможных значений штрафов [0, Smax] разобьем дискретными точками S1 (t) = 0 , S2 (t), S3 (t)

, ..., Sn (t) = Smax, которые и будут стратегиями «природы» в каждый момент t.

Аналогично, учитывая максимальный размер инвестиций Imax(t) для каждого момента времени t, произведем дискретизацию диапазона [0,Imax(t)]: I1(t) = 0,

I2(t ), I3(t), ..., Im(t) = Imax(t). Э™ величины будут

стратегиями 1-го игрока - производственного сектора.

При выборе производственным сектором стратегии I (t) на следующем шаге он перейдет в состояние K(t +1) = I,, (t) + (1 - ^(t)) • K(t). Если при этом «природа» окажется в состоянии Sj (t), то прибыль производственного сектора будет равна:

Пу (K (t)) = П j (K (t), S. (t), L (t)) = = p • F (K (t)) - a • P(t) • F (K(t)) -

- S. (t) a(t )• F (K (t)).

Перебирая все возможные значения ,, ., получаем матрицу значений П. (К (Г)), которая является матрицей выигрыша игрока 1 для данного момента времени Г:

СПИ(К(0) П12(К(Г)) ... П,(К(Г))^

ПК)) па(К(г)) ... п,(К(Г))

А(К(Г)) =

.(7)

ЧПЛ1(К(Г)) ПШ2(К(Г)) ... п,(к(г))]

Изменяя Г от 1 до Т, получаем последовательность игровых матриц, в которых стратегии «природы» не известны. Для каждого Г эти матрицы определяют игру с природой, в которой производственный сектор вынужден выбирать свою стратегию выпуска продукции с учетом состояний «природы».

Записанные соотношения формируют модель производственного сектора на отрезке [0, Т], в которой основные фонды играют роль фазовых переменных, характеризующих состояние производственного сектора в каждый момент времени, инвестиции являются управляющими переменными, а суммарная прибыль - критерием качества. Однако при этом принятие решения производственным сектором происходит в условиях неопределенности, так как величины штрафов в конкретные моменты ему не известны.

Поэтому построенную модель будем рассматривать как динамическую игру с природой и для ее решения используем соответствующие игровые принципы оптимальности (Вальда, Гурвица, Сэвиджа), распространив их на динамику.

Формализация игровых принципов оптимальности для динамической игры с природой

С помощью системы (1) - (2) функционирование производственного сектора можно представить следующим образом: в состоянии К 0 под действием выбранных в момент Г = 0 управлений 11 (0) производственный сектор переходит в новое состояние К(1) = I,.(0) + (1 — и(0)) •К(0). Если при этом величина штрафов (стратегия «природы») окажется равной

5. (0), то прибыль производственного сектора будет равна

П (К(1)) = (р —ю 3(1) — SJ (0) • а(1)) • ^(К(1))).

Под влиянием выбранных в состоянии К(1) управлений производственный сектор переходит в новое состояние К(2) = I,. (1) + (1 — и(1)) • К(1), получая при этом прибыль

П I (К (2)) = (р — /3(2) — Sj (1) • а(2)) • ^ (К (2)))

и так далее. На последнем шаге (Г = Т — 1), находясь в состоянии К(Т — 1), под действием выбранных управлений производственный сектор переходит в состояние К (Т) = I, (Т — 1) + (1 — и(Т — 1)) • К (Т — 1) с прибылью:

П I (К(Т)) = (р — ю • 3(Т) — 5. (Т — 1) • а(Т)) • ^(К(Т))).

В результате получается хронологически упорядоченная последовательность значений основных фондов производственного сектора

К (•) = {К0, К (1),..., К (Т)}, которую будем называть траекторией системы (1) -

(2), соответствующей последовательности управлений

I (•) = {I ,(0), I .(1),..., I. — (Т — 1)}.

Стратегии «природы» 5. (Г) также можно объединить в последовательность, получив траекторию

5 (•) = {^(0)5. (1),...,5.—1(Т — 1)}.

Построенные последовательности стратегий будут являться допустимыми управлениями 1-го и 2-го игроков соответственно.

Цель игрока 1 представим как максимизацию значения следующего функционала:

F (К )(•), 1(-), 8(-)) = £ П1[_1 и( К (Г) =

1=1

= § (р — ю • 3(Г) — Б. (Г) • а (Г)) • ^ (К (Г))),

г=0

где I(•) и 5(•) - последовательности стратегий игроков, выбираемых ими в играх с природой с матрицами А(К (Г)), Г = 1,..., Т .

Используя формализацию работы [4], определим классы допустимых стратегий игроков в рассматриваемой модели.

Множество всех стратегий игроков 1 и 2 обозначим символами Ф: и Ф5 соответственно.

Совокупность

Г (К0, Т) = (£ (К0, Т); ФI, Ф 5; ^ , (8)

где £ (К0, Т) - символическое обозначение системы

(1) - (2), назовем динамической игрой с природой.

Процесс управления производственным сектором с помощью модели (8) можно представить следующим образом. В начальном состоянии К 0 игроки выбирают некоторые стратегии

ф,(•) = {I,(0),I.(1),...,— (Т — 1)} е ФI,

фЕ(•) = {5. (0)5 (1),..,5/т—1 (Т — 1)} е ФЕ , которые порождают траекторию

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

К (•) = К (., К0, ф, (•), ф3 (•)) = {К0, К (),..., К (Т)}.

Во всех точках траектории К(•) (кроме К0) заданы игры с природой с матрицами вида (7) для Г = 1,..., Т . Пары стратегий (1.0 (0), 5.0 (0)), ...,

(^ (Т —1), 1 (Т -1)) определяют выигрыши

П,0,л(К (1)^ ..., П.Т—1 * м(К (Т ))

первого игрока. Следовательно, при выборе управлений (ф7 ( •), ф5 ( •)) = (I ( •), 5 ( •)) выигрыш первого игрока равен величине

F(К0фОф (•)) = F(К(•),I(•),5(•)) = £ П.. (К(Г)).

Г=1

Для построения принципов оптимального выбора стратегий игроком 1 в динамической игре (8) используем приведенные в [4] определения.

1. Каждой траектории К (•) поставим в соответст-

Т

вие число ¥в (К ( • )) = £ тах шт П Г (К (Г)),

Г= и =1,..,т],^ =1,...,п

которое будет называться ценой Вальда для траектории К (•).

Определение 1. Стратегия ф^Ое ФI называется

оптимальной по Вальду стратегией 1-го игрока в игре которое назовем ценой Гурвица для траектории К(•). (8), если

min VB(K(•,K0,I*(•),S(•))) =

S ОєФ

max min VB (K(•, K0, I(•), S(•))),

I (Оє^ S(ОєФ

Определение 2. Стратегия ф1 (•) е Ф1 называется оптимальной по Гурвицу стратегией 1-го игрока в игре (8), если

шт Уг (К(•, К0, I*(•), 5(•))) =

5 (-)еФ2

где I (•) - управление, входящее в состав стратегии

&*(•) •

_* . .

Критерием Вальда, как правило, руководствуется где I (•) - управление, входящее в состав стратегии

= Vr (K(•, K^I(•), S(•))),

I (ОєФ! S(•)єФ2

при выборе рисковых решений в условиях неопределенности субъект, не склонный к риску или рассматривающий возможные ситуации как пессимист.

2. Каждой траектории К (•) поставим в соответствие число

(K(л» = | max

t=lи

Я min Пі (K(t)) +

jt - =1,...,n И’Л-1

+(1- Я) miix П. l(K(t))

jt-l =1.....n t -1 t-1

О <Я< 1,

f maxП ll(K(t))- Піі(K(t))

4-1 1

miax П^Д K (t))- П2і( K (t))

ф(о.

Критерий Гурвица позволяет руководствоваться при выборе рискового решения в условиях неопределенности некоторым средним результатом эффективности, находящимся между оптимистическим и пессимистическим значениями.

3. Наряду с матрицей (7) в состоянии К (Г) введем в рассмотрение матрицу риска:

R(K (t)) =| |rt-1 jt-l(K (t ))||:

miaxП ll(K(t))- Пml (K(t))

V .t-l

max П ^ (K (t))- Піи(K (t))

miax Пип (K (t))- П2и( K (t))

max ПП. ln (K (t))- Пт (K (t))

(9)

Каждой траектории K (•) поставим в соответствие

T

число Vc (K (•)) = y min max rt (K (t)), которое

" it-, =l,...,m jt-, =1,...,n t-1 ■jt-1

назовем оценкой риска по Сэвиджу для траектории K (•).

Определение 3. Стратегия (^(а Ф1 называется оптимальной по Сэвиджу стратегией 1-го игрока в игре (8), если

max V(K(-,K,I*(•),S(•))) =

S(Oe0S

= nninniax VC (K(s K0, I (•), SQ)),

I (-)аф S(•)a<pS

где I (•) - управление, входящее в состав стратегии .

Критерий Сэвиджа используется при выборе рисковых решений в условиях неопределенности, как правило, субъектами, не склонными к риску.

Нахождение оптимальных траекторий в построенной динамической игре с природой

Рассмотрим последовательно функционирование производственного сектора в исследуемой модели.

В состоянии K0 под действием выбранного в момент t = 0 управления I (0) производственный сектор переходит в новое состояние:

K(1) = I(0) + (1- М(0)) • K(0).

Под влиянием выбранных в состоянии K(1) управлений производственный сектор переходит в состояние

К (2) = I (1) + (1 — и(1)) • К (1) = I (1) + (1 — и(1)) • I (0) +

+(1 — и(1)) • (1 — и(0)) • К (0).

Аналогично, на следующем шаге осуществляется переход в состояние

К (3) = I (2) + (1 — и(2)) • К (2) =

= I (2) + (1 — и(2)) • I (1) +

+(1 — и(2)) • (1 — и(1)) • I (0) +

+(1 — и(2)) • (1 — и(1)) • (1 — и(0)) • К (0), и так далее.

Из (3) - (5) следует, что производственные издержки С (К (Г)) должны вычисляться по формуле:

С (К (Г )) =ю3(Г) •у (Г) • К (Г),

а сумма штрафов О (К (Г)), назначаемых за выбросы

загрязняющих веществ в окружающую среду, - по формуле:

О (К (Г )) = 5 (Г) а(Г) у (Г) • К (Г).

Если в момент времени Г = 0 величина штрафов (стратегия «природы») окажется равной 5(0), то прибыль производственного сектора для Г = 1 будет равна: П (К (1)) = (I (0) + (1 — и(0)) • К (0)) •

•у(0) • (р — ю-3(1) — 5 (0) • а(1)).

Аналогично, в состоянии К(2) игрок 1 получает прибыль:

П (К (2)) = (I (1) + (1 — и(1)) • I, (0) +

+(1 — и(1)) • (1 — и(0)) • К(0)) •уЦ) •

•( р — ю-3(2) — 5 (1) а(2)).

В состоянии К (3) игрок 1 получает прибыль:

П (К (3)) = (I (2) + (1 — и(2))-1 (1) +

+(1 — и(2)Н1 — и(1)> I (0) +

+(1 — и(2)) • (1 — и(1)) • (1 — и(0)) • К (0)) • у (2) •

• (р — ю3(3) — 5 (2) • а(3)).

Остановимся пока на этом состоянии и зафиксируем индексами .Г , .Г номера выбиравшихся на отрезке времени [0, 3] стратегий. Тогда суммарная прибыль игрока 1 на этом промежутке вычисляется по следующей формуле:

£ П—,,(К(Г)) = 10 (0) • (Г(0> (р—ю 3(1)—50 (0) • а(1))) +

Г=1

+ ((1 — и(1)) • у(1) • (р — Ю 3(2) — ^ (1) • а(2))) + +((1 — и(2)) • (1 — ()) • У(2) • (р—ю 3(3) — ^ (2) • а(3) + +

+14(1)‘

7(1)- (р -0-3(2) - Б,^1) -«(2)) + ^ (1 -^(2))-(1 -^(1)) -Г(2). Л

-(р -а 3(3) -Б,2(2) .«(3))

+

V V

/ у

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+1,2 (2) ■ р2) • (р - а 3(3) - ^.2 (2) - «(3))) +

+К(0) ■ ((1 - М0)) ■ р - а 3(1) - (0) ■ «(1)+ К0) +

+(1 - ^(1)) ■ (1 - М0)) ■ 7(1) ■ р - а 3(2) - Б. (1) ■ «(2)) +

+(1 -М2))-(1 -^(1))-(1 -^(0))- '

■ 7(2)- (р -а 3(3) -Б.2(2) -«(3)),

где у(ґ) - коэффициент пропорциональности между основными фондами и объемом выпуска в (3).

Разобьем полученную формулу на части, выделив в ней стратегии природы Б, (ґ) и производственного

сектора I (ґ) на каждый момент ґ. При этом получим следующие выражения для отдельных компонент:

Н , (К (1)) = I (0) ■ (7(0) ■ (р -о 3(1) - Б. (0) ■ «(1))) +

+К(0) ■ (1 - М0)) • р -0-3(1) - Б. (0) ■ «(1)) 7(0),

(10)

Н , (К (2)) = 1.(0)

(1-^(1)}-

7(1) -р -ю-3(2) - Б. (1) -«(2)) +1 (1) - р) • (Р - а 3(2) - Б, (1) - «(2))) ^(1-^(1))(1 -М0))-

-(р-о-3(2) - Б, (1)-«(2))-7(1)

+К(0) ■

)+

Л

(11)

Н , (К(3)) = I: (0) -

(1 -М2))-(1 -^(1))-

(12)

•7(2) • (р — ю(3) — 5. (2) а(3)+

+!** (1) • (7(2) • ( — ю 3(3)—5. (2) • а(3) + (1 — и(2))) -

I , (2) • (у(2) • (р — ю 3(3) — 5. (2) • а(3))) +

С(1 — и(2))-(1 — ^(1))(^—^(0)) ^

+К (0) • , , ,

V •( — ю3(3) — 5. (2) а(3)) • 7(2))

где I* (Г) - оптимальная стратегия, выбранная игроком 1 в момент времени Г.

Преобразуем (10) - (12), переписав эти выражения следующим образом:

Н . (К (1)) = 7(0) • (I, (0)+К (0) • (1 — и0))) •

•(р — 0-3(1) — 5. (0) • а(1)),

Н . (К (2)) = 7(1) • (I* (0) • (1 — К)) +1, (1) +

+К (0) • (1 — и(1)) • (1 — и(0))) • (р — ю 3(2) — ^ (1) • а (2)),

СI ,*(0)41 — и(2))(1 — и(1)) +

Н . (К (3)) = 7(2) • 0*

. 1ч+/,1 (1)(1 — и(2)) +1, (2) +

+К (0) • (1 — и(2)) • (1 — и(1)) • (1 — и(0))) •

•( — ю-3(3) — 5 (2) -а(3)).

Полученные соотношения позволяют проследить закономерность изменения величины Н во времени и записать общий вид выражения для произвольно-

го ґ:

Н, (К(ґ)) = 7(ґ -1)--(р-о3(ґ) - Б, (ґ -1)-«(ґ))•

(13)

I , (ґ -1) +Х11 (?)-

ґ = 2,3,4,

П (1 — и(в))+К(0)• П(1 — К*))

V 0=г+1 *=0 у

Из величин (13) при разных значениях , = 1,...,т и . = 1,..., п составляем вспомогательные матрицы выигрышей Н (К (Г)) для каждого момента Г.

Как видно из формулы (13), элементы вспомогательной матрицы Н (К (Г)) на каждом шаге зависят от оптимальных стратегий, выбранных игроком 1 на предыдущих шагах. Таким образом, взяв в качестве оптимальной одну из своих т стратегий при Г = 1 , игрок 1 может получить в момент Г = 2 одну из т возможных вспомогательных матриц Н(К(2)). Оптимальная стратегия на втором шаге для каждой такой матрицы, в свою очередь, также определяет т воз-

ч_* 2

можных продолжений, то есть всего получается т вспомогательных матриц Н(К(3)), зависящих от выбора оптимальных стратегий I (0) и I (1) и так далее.

Последовательно увеличивая Г и применяя к вспомогательным матрицам (13) критерии Вальда, Гурвица, Сэвиджа, можно определить оптимальные стратегии в соответствующие моменты времени и по-

Л

строить оптимальную траекторию для игрока 1 (производственного сектора).

Пример

Для иллюстрации описанного выше теоретического материала приведем расчеты модельного примера, позволяющие определить оптимальные стратегии производственного сектора в условиях неопределенности, вызванной неизвестными значениями штрафов за выбросы вредных веществ в окружающую среду.

Пусть в модели производственного сектора Т = 3, начальное значение основных фондов К(0) = 300, цена товара р = 12 , цена затрат ю = 15 .

Величина затрат на единицу выпуска а(Г) = 0,45, Г = 0,1,2,3.

Коэффициент пропорциональности между основными фондами и загрязнением 3(Г) = 0,6 , Г = 0,1,2,3.

Темп изнашивания основных фондов и (Г) = 0,45, Г = 0,1,2,3.

Коэффициент пропорциональности между основными фондами и объемом выпуска 7(Г) = 0,5, Г = 0,1,2,3.

Будем предполагать, что возможные величины штрафов в каждый момент Г реализуются из множества 5(Г) = {^(Г), 52(Г), 53(Г), 54(Г)} = {2,5,8,11}, а возможные размеры инвестиций выбираются из множества I (Г) = {!,(Г), 12 (Г), Ш, 14 (Г) } = {0,9,18,23}.

При Г = 1 по формуле (10) строим вспомогательную матрицу:

с 346,5 123,75 —99 —321,75'

355,95 127,12 —101,7 —330,52

365,4 130,5 —104,4 —339,3

,370,65 132,37 —105,9 —344,17 у

Для критерия Вальда в каждой строке этой матрицы находим минимальное значение, а из полученных чисел выбираем максимальное: -321,75.

Это число соответствует стратегии ^, которая будет являться оптимальной для Г = 1 . С использованием этой стратегии и формул (10) рассчитывается следующая вспомогательная матрица для Г = 2 :

с 95,28 18, 71 —8,23 —14,72'

104,73 23,11 —12,20 —28,41

114,18 27,5 —16,16 —42,10

,119,43 29,95 —18,37 —49,71 у

В каждой строке полученной матрицы находим минимальное значение и из них выбираем максимальное: -14,72.

Это число соответствует стратегии Д, которая снова (как и для Г = 1 ) будет оптимальной. По данной стратегии рассчитывается следующая вспомогательная матрица для Г = 3 :

с 18,71 —8,23 —14,72 12,45'

22,09 — 11,38 —25,79 30,11

25,46 —14,53 —36,79 47,77

ч 27,34 —16,28 —42,92 57,58у

В каждой строке матрицы определяем минимальное значение, из них выбираем максимальное (-14,72) и для последнего шага снова в качестве оптимальной получаем стратегию ^.

В результате находим оптимальную траекторию для игрока 1 по критерию Вальда:

IВо = {IВ(0), IВ(1), IВ (2)}={1,1,1}.

Далее применим критерий Гурвица. Пусть Л = 0,5, то есть позиция игрока 1 - средняя между крайним оптимизмом и крайним пессимизмом.

Возьмем начальную матрицу (14) и в каждой ее строке найдем минимальное и максимальное значения.

По правилу выбора оптимальной стратегии в критерии Гурвица вычисляем линейную комбинацию для первой строки:

—321,75 • 0,5 + (1 — 0,5) • 123,75 = 12,375.

Аналогичные расчеты проводим для остальных строк. В результате получаем следующий набор чисел:

12,375; 12,71; 13,05; 13,23.

Из этих значений выбираем наибольшее (13,23), соответствующее стратегии 14, которая будет оптимальной при Г = 1 .

По стратегии !4 рассчитываем следующую вспомогательную матрицу для Г = 2 :

с 108,57 23, 46 —12,03 —27,05'

118,02 27,85 —15,99 —40,74

127,47 32,25 —19,96 —54,43

ч 132,72 34,69 —22,16 —62,04у

Заметим, что в силу выбора при Г = 1 другой стратегии (14 в отличие от ^) эта матрица не совпадает со вспомогательной матрицей, использовавшейся на соответствующем шаге при вычислении критерия Вальда.

В каждой строке полученной матрицы находим минимальное и максимальное значения и применяем методику нахождения оптимальной стратегии по Гур-вицу, что дает нам набор чисел:

40,75; 38,68; 36,51; 35,33.

Из этих величин выбираем наибольшую (40,75), соответствующую стратегии ^, которая будет оптимальной для Г = 2 .

Используя эту стратегию, рассчитываем вспомогательную матрицу для Г = 3 :

с 18,71 —8,23 —14,72 12,45'

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

22,09 — 11,38 —25,79 30,11

25,46 —14,53 —36,79 47,77

ч 27,34 —16,28 —42,92 57,58у

В каждой строке матрицы находим минимальное и максимальное значения, применяем формулу критерия Гурвица и из чисел -10,33; -10,15; -6,84; -5,003

выбираем наибольшее, соответствующее стратегии 14, которая будет оптимальной для Г = 3 .

В итоге получаем оптимальную траекторию производственного сектора по критерию Гурвица:

I *(•) = {I *(0), IГ (1), I Г* (2)} = {4,1,4}.

И, наконец, рассмотрим критерий Сэвиджа.

В каждом столбце начальной вспомогательной матрицы (14) находим максимальное значение:

370,65; 132,37; -99; -321,75.

Далее строим матрицу риска по формуле (9): с24,15 8,625 0 0 ^

Я( К (1)) =

14,7

5,25

0

5,25

1,87

0

2,7

5,4

6,9

8,77 17,55 22, 42

Н (К (2)) =

109,93

119,38

124,63

24,96 -13,68 29,36 -17,65 31,8 -19,85

-19,54 Л -33,23 -46,9 -54,53

В каждом столбце матрицы Н (К (2)) находим

максимальное значение:

124,63; 31,8; -9,72; -19,54.

По полученным данным рассчитываем матрицу риска:

с 24,15 11,23

Я(К (2)) =

14,7

5,25

0

6,83 2, 44 0

0

3,96

7,93

10,1

0 Л 13,69 27,38 34,99

Н (К (3)) =

24,96 —13,68 —35,41 28,34 —16,83 —46,44 30,21 —18,58 —52,58

Ч 7 7 7 ■ /

В каждом столбце данной матрицы определяем максимальное значение:

30,21; -10,21; -24,37; 72,43,

27,30Л 44,96 62,62 72, 43

после чего вычисляем матрицу риска:

(8,625 0 0

Я(К (3)) =

5,25

1,87

0

3,14

6,29

8,04

11,03

22,07

28,208

45,13 Л 27,47 9,81 0

В каждой строке этой матрицы находим максимальное значение и выбираем из них минимальное (14,7), соответствующее стратегии !2, которая будет оптимальной при Г = 1 .

По стратегии /2 рассчитывается следующая вспомогательная матрица для Г = 2:

с100,48 20,57 —9,72

В каждой строке матрицы Я(К(3)) находим максимальное значение, из них выбираем минимальное (22,07) и видим, что при Г = 3 оптимальной будет стратегия /3.

В результате получаем оптимальную траекторию производственного сектора по критерию Сэвиджа: !*(•) = {!*(0), I*®, I* (2)} = {2,2,3}.

Номера оптимальных стратегий 1-го игрока в динамической игровой модели производственного сектора, найденные на основе различных критериев, можно свести в обобщающую таблицу.

Критерий Номер оптимальной стратегии игрока 1 для момента времени t

X = 1 ґ = 2 ґ = 3

Вальда 1 1 1

Гурвица 4 1 4

Сэвиджа 2 2 3

В каждой строке этой матрицы находим максимальное значение и из них выбираем минимальное (14,7), соответствующее стратегии !2, которая снова оказалась оптимальной.

По стратегии !2 рассчитывается следующая вспомогательная матрица для Г = 3 :

с 21,59 —10,53 —24,37

Окончательно оптимальная траектория производственного сектора выбирается из предложенных в зависимости от предпочтений производителей и их склонности к риску.

Заключение

Проведенные исследования продемонстрировали возможность прикладного использования новой теории динамических игр с природой для моделирования взаимодействий в различных сложных системах в условиях неопределенности на примере экономикоэкологической системы региона. Применение теоретико-игрового аппарата позволяет произвести стратегический анализ, определить наиболее важные и требующие учета факторы при принятии решений, что, в конечном счете, повышает эффективность функционирования системы.

Рассмотренный в статье подход позволяет с новой точки зрения исследовать задачи со стратегически обусловленными действиями и изучать поведение человека в различных ситуациях в рамках экономической науки, политологии, социологии, психологии и пр., учитывая при этом изменение во времени условий или факторов, могущих повлиять на ситуацию.

Литература

1. Мазалов, В. В. Математическая теория игр и приложения: учеб. пособие / В. В. Мазалов. - СПб.: Лань, 2010. - 446 с.

2. Зенкевич, Н. А. Динамические игры и их приложения в менеджменте: учеб. пособие / Н. А. Зенкевич, Л. А. Петросян, Д. В. К. Янг. - СПб.: Высшая школа менеджмента, 2009. - 416 с.

3. Данилов, Н. Н. Динамические матричные игры. Обоснование применения принципа минимакса в классе чистых комбинированных стратегий / Н. Н. Данилов // Вестник КемГУ - 2012. - Вып. 2(50). - С. 42 - 48.

4. Данилов, Н. Н. Математическая модель менеджмента в условиях неопределенности в форме динамической игры с природой I Н. Н. Данилов II Вестник КемГУ. - 2012. - Вып. 3(51). - С. 110 - 114.

5. Данилов, Н. Н. Курс математической экономики: учеб. пособие I Н. Н. Данилов. - М.: Высшая школа, 200б. - 407 с.

6. Федеральный закон Российской Федерации от 10.01.2002 № 7-ФЗ «Об охране окружающей среды» (ред. от 02.07.2013). - Режим доступа: http:IIwww.consultant.ruIpopularIokrsredI

7. Дубров, А. М. Моделирование рисковых ситуации в экономике и бизнесе: учеб. пособие I А. М. Дубров, Б. А. Лагоша, Е. Ю. Хрусталев; под ред. Б. А. Лагоши. - М.: Финансы и статистика, 2000. - 17б с.

Информация об авторах:

СамойленкоНаталья Сергеевна - студентка математического факультета КемГУ, 8 (3842) 54-25-09, [email protected].

Natalia S. Samoylenko - student at the Mathematical Faculty, Kemerovo State University.

Мешечкин Владимир Викторович - научный руководитель, кандидат физико-математических наук, доцент кафедры математической кибернетики КемГУ, 8 (3842) 54-25-09, [email protected].

Vladimir V. Meshechkin - research advisor, Candidate of Physics and Mathematics, Assistant Professor at the Department of Mathematical Cybernetics, Kemerovo State University.

i Надоели баннеры? Вы всегда можете отключить рекламу.