Научная статья на тему 'Коалиционное решение в задаче сокращения вредных выбросов'

Коалиционное решение в задаче сокращения вредных выбросов Текст научной статьи по специальности «Математика»

CC BY
434
48
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ / КООПЕРАТИВНЫЕ ИГРЫ / ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ / УРАВНЕНИЕ ГАМИЛЬТОНА-ЯКОБИ-БЕЛЛМАНА / КОАЛИЦИОННОЕ РЕШЕНИЕ / ВЕКТОР ШЕПЛИ / РАВНОВЕСИЕ ПО НЭШУ / PMS-ВЕКТОР / DIFFERENTIAL GAMES / COOPERATIVE GAMES / DYNAMIC PROGRAMMING / HAMILTON-JACOBI-BELLMAN EQUATION / COALITIONAL SOLUTION / SHAPLEY VALUE / NASH EQUILIBRIUM / PMS-VECTOR

Аннотация научной статьи по математике, автор научной работы — Козловская Надежда Владимировна, Петросян Леон Аганесович, Ильина Анна Владимировна

В статье рассматривается теоретико-игровая модель экологического регулирования. Предложен механизм перераспределения затрат в случае частичной кооперации предприятий, участников игры. Процесс управления выбросами моделируется при помощи дифференциальной игры с коалиционной структурой. Предполагается, что на первой стадии коалиции не кооперируют, а действуют в собственных интересах, как в равновесии по Нэшу. На втором шаге выигрышк аждой коалиции делится между игроками по вектору Шепли, вычисленному для кооперативной игры внутри каждой коалиции. Вектора Шепли образуют PMS-вектор. Найдено коалиционное решение дифференциальной игры, результат работы вычисление PMS-вектора. Приведено доказательство динамической устойчивости PMS-вектора. Рассматривается вопрос об устойчивости полученного решения против иррационального поведения игроков. Для задачи сокращения вредных выбросов доказано выполнение условия Д. В. К. Янга. Библиогр. 14 назв.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Coalitional solution in emission reduction model

Coalitional solution of the differential game is considered. The coalitional partition of the set of players is formed. Any player acts in the interests of coalition to which he belongs. The total cost of each coalition is divided among players according to Shapley value. Time-consistency is proved. The D. W. K. Yeungs condition is verified.

Текст научной работы на тему «Коалиционное решение в задаче сокращения вредных выбросов»

ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА

Сер. 10. 2010. Вып. 2

УДК 517.977.8+519.834

Н. В. Козловская, Л. А. Петросян, А. В. Ильина КОАЛИЦИОННОЕ РЕШЕНИЕ

В ЗАДАЧЕ СОКРАЩЕНИЯ ВРЕДНЫХ ВЫБРОСОВ

1. Введение. В статье рассматривается теоретико-игровая модель экологического регулирования. Ранее модели экологического регулирования исследовались в работах [1, 2]. В данной статье анализируется ситуация, когда предприятия-загрязнители сами принимают активное участие в регулировании, в результате чего они существенно снижают объемы выбросов по сравнению с уровнем, установленным законодательством. Добровольный подход к экологическому регулированию успешно применяется в ряде развитых стран [3].

Добровольное регулирование, как правило, приводит как к кооперации участников соглашения между собой, так и к сотрудничеству с государством. В этой статье предложен механизм перераспределения затрат в случае частичной кооперации. Процесс управления выбросами моделируется при помощи дифференциальной игры с коалиционной структурой. Найдено коалиционное решение дифференциальной игры.

Коалиционные решения для статических игр были изучены в ряде работ Блоха

[4], Оуэна [5]. В своих исследованиях Албизур и Зарзуэло [6] предложили новое понимание вектора Оуэна для статических игр с трансферабельными выигрышами. Оуэн

[5] определяет коалиционный вектор для статических одношаговых игр с трансфера-бельными выигрышами: сначала вектор Шепли вычисляется для игры, разыгрываемой коалициями, а потом выигрыш каждой коалиции перераспределяется между игроками согласно вектору Шепли [7]. Этот подход предполагает, что на первой стадии игроки кооперируются и создают гранд-коалицию. Игры, разыгрываемые внутри коалиций коалиционного разбиения, являются кооперативными со специфическим образом определенной характеристической функцией: вектора Шепли, вычисленные для игр, разыгрываемых внутри коалиций, образуют вектор Шепли-Оуэна.

В данной статье применяется иной подход. Предполагается, что на первой стадии коалиции не кооперируют, а действуют в собственных интересах, как в равновесии

Козловская Надежда Владимировна — аспирант кафедры операционного менеджмента высшей школы менеджмента Санкт-Петербургского государственного университета. Научный руководитель: кандидат физико-математических наук, доц. Н. А. Зенкевич. Количество опубликованных работ: 15. Научное направление: дифференциальные игры. E-mail: kknn@yandex.ru.

Петросян Леон Аганесович — доктор физико-математических наук, профессор, декан факультета прикладной математики-процессов управления Санкт-Петербургского государственного университета. Количество опубликованных работ: 238. Научные направления: теория дифференциальных и динамических игр, теория управления. E-mail: spbuoasis7@peterlink.ru.

Ильина Анна Владимировна — аспирант кафедры математической теории игр и статистических решений факультета прикладной математики-процессов управления Санкт-Петербургского государственного университета. Научный руководитель: доктор физико-математических наук,

проф. Л. А. Петросян. Количество опубликованных работ: 1. Научное направление: дифференциальные игры. E-mail: aanytka@yandex.ru.

© Н. В. Козловская, Л. А. Петросян, А. В. Ильина, 2010

по Нэшу [8]. На втором шаге выигрыш каждой коалиции делится между игроками по вектору Шепли, рассчитанному для кооперативной игры внутри каждой коалиции. Вектора Шепли образуют PMS-вектор, который был введен в [9]. Таким образом находится коалиционное решение дифференциальной игры, результат работы - вычисление PMS-вектора.

Также приведено доказательство динамической устойчивости PMS-вектора. Понятие динамической устойчивости было введено в статье [10]. Кроме того, в п. 9 статьи рассматривается вопрос об устойчивости полученного решения против иррационального поведения игроков. Для задачи сокращения вредных выбросов в п. 10 доказано выполнение условия Д. В. К. Янга [11].

2. Постановка задачи. Данная модель была впервые предложена Л. А. Петросяном и Г. Заккуром [12]. Пусть I - это множество игроков (предприятий), участвующих в игре сокращения вредных выбросов:

1 = {1,

Выбросы игрока г, г = 1, 2,...,п, в момент времени £, Ь € [Ьо, те), обозначим как щ(Ь). Пусть х(Ь) - это динамика накопления загрязнения за время Ь. Накопление загрязнения определяется дифференциальным уравнением

Х(Ь) = 5^ щ(Ь) — 5х(Ь),

х(Ьо) = хо, (1)

где 5 - коэффициент, характеризующий долю поглощенного загрязнения. Введем следующие обозначения: С\(щ) - это издержки на природоохранные мероприятия, которые несет игрок г, если он снижает выбросы до некоторого допустимого уровня щ:

Сг{щ{г)) = - щ)2, о < щ(г) 7 > о.

Под параметром щ понимается норматив допустимого воздействия на окружающую среду, а именно показатель предельно допустимого выброса (ПДВ), определяющий максимально разрешенный уровень выбросов. В соответствии с российским природоохранным законодательством, ПДВ разрабатываются самостоятельно каждым предприятием, а потом утверждаются региональным экологическим комитетом, поэтому их значения различны.

Пусть Вг(х) - это издержки возмещения ущерба от загрязнения:

А(х) = Щх(г), Щ > 0.

Под ущербом от загрязнения понимается экономический ущерб, т. е. совокупность материального ущерба, ущерба здоровью граждан и ущерба, нанесенного окружающей среде, в денежном выражении. Процесс, в результате которого издержки внешнего эффекта переносятся на его виновника, называется интернализацией.

Обе функции - непрерывно дифференцируемые и выпуклые: С[(иг) < 0 и (х) > 0. Каждый игрок стремится минимизировать суммарные издержки уменьшения выбросов и возмещения убытков. Таким образом, выигрыши игроков имеют следующий вид:

СЮ

К(хо,1о,п) = I е-р(г-г°\С(щ (Ь)) + Вг(х(1)))3,1, где и = (п\,... ,ип) является ситуацией в игре, а 5 - ставка дисконтирования.

т

Пусть ($1, ^2,..., Бт) - это разбиение множества I, такое, что П = §, У Бг =

1=1

т

I, | = щ, ^2 п = п.

г=1

Будем полагать, что каждый игрок г из I играет в интересах коалиции , которой он принадлежит, пытаясь минимизировать сумму выигрышей ее членов, а именно

СЮ

шт ^ Кг(и,хо,Ьо)= шт / е-р(—о) ^ {Сг(щ(г)) + Бг(х(г))}&,

и^ЕЗк и.,гЕЗк,/

где динамика определяется уравнением (1).

3. Решение задачи. В соответствии с предположением, каждый игрок г, г € Бк, действует в интересах коалиции Б к, которой он принадлежит. Не умаляя общности, можно считать, что коалиции Бк действуют как отдельные игроки. Тогда на первом шаге будем вычислять равновесие по Нэшу в игре коалиций, используя уравнение Гамильтона-Якоби-Беллмана [13]. Суммарные издержки коалиции Бк распределены между игроками в соответствии с вектором Шепли подыгры Г(Б^). Игра Г(Б^) определяется следующим образом: пусть Б к - множество игроков в игре Г(Б^), а Г(Б^) -кооперативная игра. Таким образом, на втором шаге вычисляются характеристическая функция и вектор Шепли для каждой подыгры Г(Б^).

Вычисление характеристической функции V(К, х, Ь) этой игры не стандартно. Когда характеристическая функция рассчитывается для коалиции К € Бк, игроки, не входящие в эту коалицию, действуют согласно стратегиям, полученным в равновесии по Нэшу. Данный подход к определению характеристической функции имеет свои недостатки и достоинства. Достоинство заключается в том, что метод позволяет существенно сократить число вычислительных операций по сравнению со стандартным подходом, когда V(К, х, Ь) представляет собой максимальный гарантированный выигрыш коалиции К, если даже остальные игроки объединяются в антикоалицию Б\К. Недостатком является тот факт, что характеристическая функция, вычисленная таким образом, в общем случае не является супераддитивной.

Выигрыши всех игроков г € I образуют PMS-вектор [9]. PMS-вектор определяется следующим образом:

Определение 1. Вектор

РМ8(х,г) = [РМ81(х,г), РМ82(х,г),...,РМ8п(х,г)]

- это PMS-вектор, если РМ8г(х,Ь) = БНг(Би,х,Ь) при г € Бк, где

*,)- £ (ч-тЖт-Ц! [у(м_ ^ _ ,/(ДА ^

■ * Пь, '

М Эг,М СБк

(Б1, Б2,..., Бт) - это коалиционное разбиение множества I.

Предполагается, что на первой стадии коалиции разыгрывают равновесие по Нэшу, действуя как отдельные игроки, после чего для каждой кооперативной игры Г(Б^) рассчитываются значения БНг(Бк,х,Ь).

В п. 4 вычисляется равновесие по Нэшу в предположении, что коалиции Б1,Б2,..., Бт ведут себя как отдельные игроки. Далее в п. 5 приводится определение характеристической функции и в п. 6 - доказательство ее супераддитивности. После чего в п. 7 найден вектор Шепли, и в п. 8 построен PMS-вектор, который является решением данной игры. В п. 9 доказана динамическая устойчивость, в п. 10 проверено выполнение условия Янга.

4. Вычисление равновесия по Нэшу. На первом шаге вычисляем равновесие по Нэшу. Таким образом, игроки, входящие в Б к, стремятся минимизировать

Ж(Бк,хо,Ьо) = шт ^ Кг(и,хо,Ьо) = шт [ ер(£-£о) ^ (С\(щ) + Б^х))А,

игЛЕБк игЛЕБк /

’ iesk ’ £0

где динамика загрязнения задается формулой (1). Для того чтобы найти равновесие по Нэшу, необходимо решить систему уравнений Гамильтона-Якоби-Беллмана. Обозначим функцию Беллмана для этой задачи Wsk = Ж (Б к ,х,Ь). Вышеупомянутая система уравнений может быть записана следующим образом:

р^к = шт

Ui,гESk

Е (Сг(щ) + А(х)) + ^ ($>(*) - бх(г))

‘i^Sk 3^1

к = 1,...,т. (2)

Дифференцируя правую часть формулы (2) по щ и приравнивая нулю, получаем

N _ - 1 дWsk ,

Щ — Щ-----------, * € Як- (3)

7 ох

Подставляя ^ в формулу (2), находим

ш Пк (^Зк\2 , V'1, I - 1 V'1, дWsj \ . ,

^ = ¥,(—) + ^ '»■+ — (£“• - -&) (“)

' jeSk ге1 ' 3 = 1

Можно легко проверить, что функция

Ж,эк = А,эк х + Б,зк, к = 1, 2,...,т, (5)

удовлетворяет уравнению Беллмана (2) [13]. Заметим, что

*£=*>■ <6>

Подставляя формулы (5) и (6) в формулу (4), определяем коэффициенты ASk и БSk:

Е

, jEsk

Авк = ——г> р + О

л п т

= Е ^ + ^0- <7>

' i=1 1=1,г=к ' '

Таким образом, подставляя (7) в (3), находим управления в равновесии по Нэшу

для г € I, при г € Бк. Издержки коалиции Бк, к = 1,...,т, получаем в следующем виде:

Подставляя равновесные по Нэшу стратегии (8) в уравнение динамики (1) и решая его, получаем коалиционную траекторию

5. Вычисление характеристической функции в игре Г(Б\). Вспомним, что издержки коалиции Бк распределяются между игроками по вектору Шепли. Таким образом, необходимо найти характеристическую функцию для игры Г(Бк) и вектор Шепли.

5.1. Вычисление равновесия по Нэшу в игре Г(Бк). Известно, что каждый игрок минимизирует сумму издержек снижения загрязнения и возмещения ущерба. Для того чтобы найти равновесие по Нэшу, необходимо решить систему задач оптимизации

где уравнение динамики задается формулой (1). Функции = Ш({г},х,^ системы (11) должны удовлетворять системе уравнений Гамильтона-Якоби-Беллмана

Дифференцируя правую часть формулы (12) по щ и приравнивая нулю, получаем управления в равновесии по Нэшу

(9)

Подставив значения (7) в формулу (9), имеем

ОО

Ш({г}, хо, 1о) = шт К^(п,хо,1о) = шт / е р(С Со){С^щ) + Бъ(х)}(й,

иг П4 .

г г СО

г € Бк,

(11)

зет

Вспомним, что ЩП = и", г € Б3, г / Бк , где и" задается формулой (8). Подставив (13) и (8) в (12), имеем

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 (дШ,\2 т п3 л 1 ^ дШ3

27 \ дх~) +ЩХ+^{Ьи<- Ь --2^-^Г

ге1 3 = 1,3 = к зеБк

г Бк .

Учитывая формулу (5), находим

рАгХ + рВг = —А2 + тт^х + А^ (У щ - У -----Авк ~ дх^, г е Бк.

1 г=1 3 = 1,3 = к 7 7

Коэффициенты Аг и ВI имеют вид

А. ?Г'

р + 3’

. п л т

В, = ^-(ущ-1у —АБ- + —аЛ .

7Й 7 27 ;

Согласно предположению,

Ш = А^х + Вг, г € Бк.

Издержки г-го игрока в равновесии по Нэшу равны

/ п т Е п Е П1 \

Wi = ^—-px + Уui--У^l-^^ + -l-^- V (14)

р(р + 6)\ 1 1 Р +5 27 р + 6 )

5.2. Вычисление значений характеристической функции для произвольной коалиции в игре Г(Бк). Характеристическая функция для произвольной коалиции Ь € Бк рассчитывается посредством решения следующей задачи максимизации:

СО

Ш (Ь,хо,Ьо) = шт Кг(и,хо ^о) = [ е-р(г-1о') У(С(щ) + Вг(х))3х, (15)

игЛ^Ь /

г А,- Г

Со

%еь

где динамика задается формулой (1). Обозначим через ШЬ = Ш(Ь,х,1) функцию Беллмана задачи (15). Решение задачи (15) эквивалентно решению системы уравнений Гамильтона-Якоби-Беллмана

рШь = шт

иг ,геь

У(Сз(щ) + В^х)) + _ 6х)

(16)

Предположим, что игроки из I\Бк придерживаются управлений (8), а игроки из Бк\Ь -управлений (13). Дифференцируя правую часть выражения (16) по щ, г € Ь, находим управления иЬ, г € Ь:

Подставляя иЬ, и", ЩП в формулу (16), получаем уравнение I ( дШь \ 2 V-

= 27 (~£ьГ) + 1>1 +

; зеь

дШь (^^ _ I дШь пз 1

+ ^(Ем*--^- Е ~Аъ-- Е

*е/ 3 = 1,3 = к гевк\Ь

где I = \Ь\. Подставляя в него формулы (5) и (6), находим

рАьх + рВь = + Е71"^ +

7 зеь

т 1 7

+(е«* - Е - ~ Е ^ - ~Ль -5х(*)) •

ге/ з=1,з=к геяк\ь

Отсюда имеем

Шь = Аьх + Вь, Ь с Бк,

здесь

Аь =

Е п

зеь р + 6 ’

г‘=т(&- £ £ .4,-1.4

3=1,3 = к

гЕБк\Ь

Итак, издержки коалиции Ь имеют вид

Шь =

Е п

зеь

р{р + 5)

рх

7 .

1еБк\Ь

, Е П

* геь р + 3 7 р + 3

(18)

5.3. Характеристическая функция. Таким образом, построена характеристическая функция для игры Г(Бк), которая определяется формулой

V (К,х,г) =

'0, К = %,

Ш^(х,1), К = {г},

Шзк (х,г), К = Бк,

КШь(х,г), к = ь,

где Шг(х,г), ШЬ(х,г), Шзк (х,г) задаются формулами (14), (18), (9).

6. Супераддитивность характеристической функции. Для доказательства супераддитивности необходимо доказать следующее неравенство:

ь

Обозначим, для ясности:

Е пг

Л к

р + 3

Как было ранее показано, V(К, х, г) равна (0, К = %:

V (К, х,г) = <

А п 1 т

— (рх + ^Гщ--^2 —Абэ + ^~аЛ, К=Щ]

р\ ^ 7 ^ 7 ^ )

, пт

^(7» + 1>- £ ^ + А' = 5к;

Н г =1 з=1,з = к ! !

А п т 1 I

-^(Рх + ^Щ- ]Г ~М:--А3к\ь--Аь), К = Ь.

^ 4 з=хз=к7 7 7

Очевидным является следующее равенство:

Ак + Аь = Ак иь. (20)

Рассмотрим теперь левую часть формулы (19). Используя (20), получаем

V(К и ь, х, г) - V(К, х, г) - V(Ь, х, г) =

Н---(АкА3к\к + АьА3к\ь + кА2К + 1А2Ь —

АкиьХкиЬ - Акхк - АьхЬ+

1

- АкиьАвк\(киь) - (к + 1)А2киь) . (21)

Для краткости обозначим

Д = АкАБк\к + АЬАБк\Ь + кАк + 1АЬ - АкиЬАБк\(киь) - (к + 1)Акиь.

Легко доказать при помощи (20), что

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Д = -1А2к - кА\ + 2АкАЬ(1 - I - к).

Из того, что р, 3, щ, г € I, неотрицательны, очевидно, следует, что Д ^ 0 при любом к,1 > 1.

Предполагается, что коалиции разыгрывают равновесие по Нэшу, а внутри коалиций игроки кооперируют, таким образом, траектория накопления загрязнения задается формулой (10). В том случае, если в какой-то момент времени т возникнет некоторая коалиция К Бк , траекторию накопления загрязнения можно вычислить подстанов-

кой и", г € Бк (3), игп, г € Бк\К (13) и ик, г € К (17) в уравнение динамики (1) с начальными условиями х(т) = х"(т). Остается проверить, что

хк(г) = у (1 - е-&(-г-т)) + хк(т)е

где х" (г) - коалиционная траектория, заданная формулой (10), коэффициент ак равен

Е_ ^пз к 1

Щ- 2^ —Лб1 - ~Ак - ~АЗЛК-

г=1 3=1,3 = к ' ' '

Продолжим упрощение выражения (21). Применяя (20), находим

АкиьХКиь - АкхК - Аьхь = 1

^(і-е ^ (акиьАкиь - &кАк - &ьАь)

= Ал _е-^-т)

7О \

Это означает, что

У{К и Ь, х, і) — У{К, х, і) — У(Ь, х, і) = —-(і—є ТЛ Н-.

уд \ / ур

Поскольку у, Р,0 ^ 0 и Д ^ 0, неравенство (19) доказано.

7. Вектор Шепли. Вектор Шепли в игре, разыгрываемой внутри коалиции Бк, вычисляется по известной формуле

БЬі(Бк,х 0, *о) = У2 ——к-Щ—1—\У{К,х0,г0)-У{К\Щ,х0,г0)

КэТКсЗк Пк! У

Рассмотрим разность

V(К, х,Ь) — V(К\{*}, х) = (АК — АК\{г})х + {ВК — ВК\{г})•

По формуле (20) получаем

. . Пг

Ак-Ак\{1} = —§.

После простейших преобразований находим

+ 2^((-к~ “ кА2к) + ~р

ур\ Ки * 1 Р + О К р + оу

т л ( Е П3

—^(Уй у 1Иа3.)+ — 1(2-2 к)^-^-----------------------------

РІР+5)^! зІіфк1 27 Л Р + 6 Р + 6

Е П3 ч 2 Е П3■

^ 7Г» \2 {К\{і} \ _2_7Г* $к\К

р + О \ р + О ) р + О р + О I Переходя от суммирования по подмножествам к суммированию по мощностям, имеем 54

П

3

Е

К Эг

(пк - к)!(к - 1)!

Ак — А

Е

к=1

К\{г} І Х

(пк - к)!(к - 1)! (пк - 1)! Пг

Пк! (к - 1)!(пк - к)! р + О

пк

= Е

к=1

1

Пк р + О р + О

Аналогично получаем

Е

К Эг

(п - к)\(к - 1)!

{ВК - ВК\{г})

р(р + О)

гет

+

Е ^

2ур \^3 У р + 6

П3

2п пг зеБк

32

+

пП21 П ( 7Гі V 1 ЗЄвк

3 р + О р + О 6 \р + О/ 6 (р + О)2 I

Таким образом, компоненты вектора Шепли имеют вид

Б^(Бк,х,г) = АіХ +- у —Ав^ +

геї 3=1,з=к

+ ----(-А2 + —АіА3к - —А} + - V А2). (22)

2ур V 3 ^ 3 к 6 * 6 ^ Ч ’

11 3ЄБк

8. Построение РЫ8-вектора. Мы нашли вектор Шепли (22) для игры Г(Бк), где (Б1, Б2,..., Бт) - это коалиционное разбиение множества игроков I. Принимая во внимание определение 1, получим PMS-вектор

РМ8(хо, і0) = (РМ81(хо, і0), РМ82(хо, і0), •••, РМ8„(хо, і0)),

(23)

где РМ8г(х0,г0) = БНг(Бк,х0,г0) при г € Бк, а БНг(Бк,х0,г0), г € I, определяются формулой (22). Коалиционная траектория х"(г) задается формулой (10).

9. Динамическая устойчивость. Под динамически устойчивым решением понимается такое решение, которое остается оптимальным в любой подыгре вдоль коалиционной траектории, таким образом, игрокам невыгодно отклоняться от первоначально выбранного дележа, и они до конца игры будут придерживаться выбранных стратегий.

Понятие динамической устойчивости было введено Л. А. Петросяном [10] и применялось в задачах охраны окружающей среды [12, 14].

Начнем с определений, которые были приведены в статье [12]. Рассмотрим подыг-ры рассматриваемой нами игры с начальными условиями (х"(г),г) на коалиционной траектории и обозначим через РМ8(х"(г),г) соответствующий PMS-вектор, который определяется формулой (23).

П

П

п!

П

2

3

Определение 2. Вектор в(Ь) = (вг(Ь),в2(Ь), ■ ■ ■ ,вп(Ь)) называется процедурой распределения дележа в соответствии с PMS-вектором (будем обозначать PMS-ПРД), если

СЮ

РМБДхо ,Ь0) = I в-^-0^^)^, г

£ I■

Определение 3. Вектор в(Ь) = (в\(Ь),в2(Ь), ■ ■ ■ ,вп(Ь)) - динамически устойчивая ГЫБ-ПРД, если при любых начальных (хк(Ь),Ь), при любом Ь € [Ьо, те) выполняется следующее условие:

Рма'(хо'Ьо> = !в-Л'-">*(Т>*Т + в-Р"-ц>РМ*х(Ь)Ь г € 1 (24)

*0

Если это условие верно для любых Ь € [Ьо, те), то начальное соглашение неизменно в течение игры.

Утверждение. Вектор в(Ь) = (р\(Ь), в2(Ь), ■■■, /Зп(Ь)), где в(Ь) задается формулой А(*) = рРМ^х*(*),*) - (*),*),

есть динамически устойчивая PMS-ПРД.

Утверждение доказано в [12]. Рассмотрим PMS-вектор (23), который был вычислен в п. 8. Дифференцируя формулу (23), находим PMS-ПРД

/3;(» = щхк(г) + — (^А2зк + -^ААзк - уА2 + - У А])’ (25)

1 зеБк

где г € Бк и хк(Ь) задается формулой (10). по утверждению, вектор (25) удовлетворяет определению 2. Таким образом, формула (25) определяет динамически устойчивую PMS-ПРД.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10. Условие Янга. Очевидно, что компоненты найденного коалиционного решения в каждой подыгре Г(Бк) удовлетворяют условиям индивидуальной и коллективной рациональности, потому что вектор Шепли является дележом. Кроме того, как было установлено в п. 9, коалиционное решение является динамически устойчивым, а это означает, что на всем протяжении игры игрокам не выгодно отклоняться от изначально выбранного решения. Но тем не менее это не гарантирует того, что отдельные игроки не будут предпринимать иррациональных действий, следствием которых будет отказ остальных игроков от кооперативного соглашения.

Общий вид условия устойчивости против иррационального поведения [11]

I

Уг(хо,Ьо) < V(хм(Ь),Ь) + ! в^т)ё,г,

*0

где Уг(х, Ь) - выигрыш г-го игрока, когда он действует в своих интересах; в'1(Ь) - процедура распределения. Смысл условия Янга заключается в том, что даже если кооперация продлится с момента времени Ь0 до момента Ь, г-й игрок все равно получит больше, чем если бы кооперации не было вообще.

В силу того, что в задаче сокращения выбросов игроки стремятся минимизировать затраты, знак неравенства иной, кроме того, вследствие бесконечности временного промежутка возникает дисконт-фактор, а значит, условие Янга примет вид

г

У,(хо,Ьо) > в-р(г-го)У^хк(Ь),Ь)+ У в-р(т-го)в^т)йт^ (26)

го

Покажем теперь, что условие Янга (26) выполнено для коалиционного решения в задаче сокращения вредных выбросов.

Затраты г-го игрока, когда он действует в своих интересах, имеют вид

Щхм(г),г) = ^ (рхм(ь) + Щйз + ~ (27)

Формула (27) может быть найдена как решение системы уравнений Гамильтона-Якоби-Беллмана аналогично вычислениям, приведенным в п. 5.

Для удобства изложения введем следующие обозначения:

' зевк

т

зе1 i=l '

Вз = --АТ.

7

Тогда процедура распределения дележа в^Ь), заданная формулой (25), может быть переписана следующим образом:

вт = ПiXN (Ь) + Б\,

а коалиционная траектория (10) так:

xN(Ь) = (хо - Б2)в-й(г-го'> + Б2■

Вычислим сначала интеграл в правой части неравенства (26):

г г

У в-р(т-го>в^т = I в-р(т-го>(щ((хо - Б2)в-3(т-го> + Б2) + Б\)в.т = го *о

-р(т-1 о) ( ^г(х0 — В2) _й(т_40) _ щВ2 _ Вх

' V р+6 р р

= е-рЦ-1о) ( Мхо - В2) с-в(1-1о) _ ^в2 _ + Мх0 -В2) + щВ2 + В]_

\ р + 6 р р) р+6 р р

Таким образом, с учетом (27), левая часть формулы (26) имеет вид

I е-р(т-го)рг(г )ат + в-р(г-го)у^ (хм (г))

= е—р(^ — ^°')

7Гг Щ л Е>1 ТГг^З \

~Кр + ЩЬ~ 3*~Т + Жр + 6))

ТТ^Хр _ щВ2 7цВ2 -01

р + 5 р + 5 р р '

Правая часть формулы (26) равна

Ц,(хо, £0) = ^ (рхо + + Вз)-

Рассмотрим теперь разность левой и правой частей. Для доказательства неравенства (26) необходимо, чтобы

+ <28>

Очевидно, что е-р(г-*о) — 1 < 0 при любом г > го, а е-р(Ь-*о) — 1 = 0 при г = го. Таким образом, условие Янга выполнено в начальный момент времени го. Обозначим

п _ 7Г* пг , ^1

~Яр+*)Ь~ р(р+*)'

Ясно, что, если константа в ^ 0, условие (28) выполнено при любом г, если же в < 0, - то только в начальный момент времени. Покажем, что существует момент времени Т > го, при котором условие Янга выполнено. Это будет означать, что в ^ 0.

Поскольку в (г) - динамически устойчивая ПРД, условие (26) можно переписать, используя формулу (24):

РМ8*(хо,го) — у(хоМ + е-^^у (Xм(г),г) — РМ^(хм(г),г)) < 0. (29)

Переходя к пределу при г в неравенстве (29), получаем, что

Иш е-р(г-го)у (хм(г),г) — рмб^(г),г)) = 0,

а значит,

РМБ*(хо,го) < у(хо,го).

Это верное равенство, вследствие индивидуальной рациональности. Обозначим е = У,(хо, го) — Р1М8Дхо, го). По определению предела, существует Т > 0 такое, что при любом г > Т \е-р(г-г°')(Уг(хм(г),г) — РМ8Дхм(г),г))| < е. Тем самым мы установили,

что в ^ 0, и неравенство (28) верно при любом г, что и требовалось доказать.

11. Заключение. В статье предложен механизм перераспределения затрат в случае частичной кооперации предприятий. Процесс управления выбросами моделируется при помощи дифференциальной игры с коалиционной структурой. Решение игры найдено в явном виде. Полученное решение является динамически устойчивым. Доказано выполнение условия Д. В. К. Янга.

1. Stimming M. Capital accumulation subject to pollution control: Open-Loop versus feedback investment strategies // Annals of Operations Research. 1999. Vol. 88. P. 309—336.

2. Katsoulacos Y., Xepapadeas A. Environmental policy under oligopoly with endogenous market

structure // Scand. J. of Economics. 1995. Vol. 97, N 3. P. 411-420.

3. Borkey P., Leveque F. Voluntary approaches for environmental protection in the European Union —

a survey // European Environment. 2000. Vol. 10. P. 35-54.

4. Bloch F. Sequantal formation of coalitions with fixed payoff division // Games and Economic Behaviour. 1966. Vol. 14. P. 90—123.

5. Owen G. Values of games with a priory unions // Mathematical Economy and Game Theory / eds.: R. Henn and O. Moeschlin. Berlin, 1997. P. 78—88.

6. Albizur M., Zarzuelo J. On coalitional semivalues // Games and Economic Behaviour. 2004. Vol. 2. P. 221—243.

7. Shapley L. S. A value for n-person games // Contributions to the Theory of Games II. Princeton: Princeton University Press, 1953. P. 57—69.

8. Nash J. F. Equilibrium points in n-person games // Proc. Nat. Acad. Sci. USA. 1950. Vol. 36. P. 48—49.

9. Petrosyan L., Mamkina S. Dynamic games with coalitional structures // Intern. Game Theory Review. 2006. Vol. 8, N 2. P. 295—307.

10. Петросян Л. А. Устойчивость решений в дифференциальных играх со многими участниками // Вестн. Ленингр. ун-та. Сер. 1: Математика, механика, астрономия. 1977. № 19. С. 46—52.

11. Yeung D. W. K. An irrational — behavior — proofness condition in cooperative differential games // Intern. Game Theory Review. 2006. Vol. 8. P. 739—744.

12. Petrosyan L., Zaccour G. Time-consistent Shapley value allocation of pollution cost reduction // J. of Economic Dynamics and Control. 2003. Vol. 27. P. 381—398.

13. Dockner E. J., Jorgensen S., van Long N., Sorger G. Differential Games in Economics and Management Science. Cambridge: Cambridge University Press, 2000. 485 p.

14. Petrosyan L. A., Kozlovskaya N. V. Time-consistent Allocation in Coalitional Game of pollution cost reduction // Computational Economics and Financial and Industrial Systems. 2007. A Preprints Volume of the 11th ifac symposium, IFAC publications Internet Homepage. URL: http://www.elsevier.com/locate/ifac. P. 156—160.

Статья принята к печати 24 декабря 2009 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.