УДК 519.837 + 517.977 ББК 22.18
КООПЕРАТИВНОЕ РЕГУЛИРУЮЩЕЕ УСЛОВИЕ В ЗАДАЧЕ РАЗДЕЛЕНИЯ БИОРЕСУРСОВ 1 2
Реттиева А. Н. 3
(Учреждение Российской академии наук Институт прикладных математических исследований Карельского научного центра РАН, Петрозаводск)
Проведено исследование динамической игры управления биоресурсами в дискретном времени. В игре участвует центр, который разделяет водоем между участниками, и игроки, производящие вылов биоресурсов. Предполагается, что между частями водоема существует миграционный обмен. В работе получены равновесие по Нэшу и кооперативное равновесие для бесконечного периода планирования. Для поддержания кооперативного соглашения строится динамически устойчивая процедура распределения дележа. Предлагается новое условие, которое побуждает игрока соблюдать кооперативное соглашение, называемое кооперативным регулирующим условием.
Ключевые слова: динамические игры, задача управления биоресурсами, кооперативное равновесие, динамическая устойчивость, процедура распределения дележа.
1 Работа выполнена при поддержке гранта РФФИ №08-01-98801-р-север-а и гранта ОМН РАН (программа «Математические и алгоритмические проблемы информационных систем нового поколения»).
2 Текст приводится в соответствии с изданием «Математическая теория игр и ее приложения. - 2009. - Т. 1. №3».
3 Анна Николаевна Реттиева, кандидат физико-математических наук ([email protected]).
Введение
В работе проведено исследование динамической игры управления биоресурсами (выловом рыбы) в дискретном времени. В данной модели водоем разделен на две части, в каждой из которых вылов ведет игрок. В игре участвует центр (арбитр), который разделяет водоем между участниками, и игроки (страны), производящие вылов биоресурсов.
Предполагается, что между частями водоема существует миграционный обмен. Таким образом, размер популяции в одном районе (где вылов ведет первый игрок) зависит не только от размера популяции и вылова в предыдущий момент, но и от размера популяции и вылова в другом районе (где популяцию эксплуатирует второй игрок).
Существует альтернативная интерпретация данной модели. Можно рассмотреть два вида рыбы, каждый из которых эксплуатируется игроком [6]. В этом случае миграции соответствует процесс межвидового взаимодействия.
В традиционной постановке задачей центра является регулирование вылова путем введения квот на вылов рыбы. В серии работ [1, 8] был разработан новый подход, где задачей центра является определение оптимальной доли территории, где будет запрещен вылов.
Основной задачей предложенной работы является применение разработанного подхода к задаче разделения биоресурсов. В статье получены равновесие по Нэшу и кооперативное равновесие для бесконечного периода планирования.
Существует несколько методологических схем для поддержания кооперативного соглашения, достигнутого в начале периода планирования: кооперативное регулируемое равновесие и динамически устойчивая процедура распределения дележа. Схема построения кооперативного регулируемого равновесия для задач управления биоресурсами описана авторами в работах [2, 9].
В данной статье исследуется схема построения динамически устойчивой процедуры распределения дележа, предложенная
367
и развитая в работах Петросяна Л.А. [3, 4, 10]. Рассматривается случай, когда центр является игроком и может формировать коалиции с участниками (странами). Получен в аналитическом виде вектор Шепли и динамически устойчивая процедура распределения дележа. Предлагается новое условие, которое побуждает игрока соблюдать кооперативное соглашение, называемое кооперативным регулирующим условием.
Приведены результаты моделирования.
1. Модель разделения биоресурсов
Разделим акваторию водоема на две части: в и 1 — в, где вылов ведут два игрока. Центр (арбитр) разделяет водоем между участниками. Игроки (страны), производящие вылов биоресурсов на бесконечном промежутке времени, являются участниками игры.
Модель может иметь другую интерпретацию: в водоеме имеются два вида рыбы и игрок может ловить только один из них.
Предполагаем, что популяция развивается в соответствии с биологическим законом:
где хг ^ 0 - размер популяции в первом районе в момент времени t, Уг ^ 0 - размер популяции во втором районе в момент времени £, 0 < а < 1 - коэффициент внутреннего роста, 0 < в < 1 -коэффициент миграции.
Здесь а представляет эффект прямого влияния размера популяции на размер в следующий период времени на этой территории. в представляет миграционный эффект между двумя частями водоема.
Игрок 1 эксплуатирует хг и игрок 2 ведет вылов популяции
(1)
Х0 = X ,
Уо = У ,
Уь.
368
Можно заметить, что в нашей модели интенсивность миграции зависит также и от доли территории. Это предположение естественно, поскольку размер среды обитания уменьшается, когда в уменьшается, и рыба должна мигрировать в другой район.
Предполагается логарифмический вид функций выигрыша. Рассматриваются задачи максимизации бесконечных сумм дисконтированных выигрышей двух игроков:
ГО ОО
(2) 1 = ^ 5* 1п(пИ) , 1 = ^ 5* 1п(п2г) ,
1=0 1=0
где 0 ^ пи, Щг ^ 1 - выловы игроков в момент времени Ь,
0 < 5 < 1 - коэффициент дисконтирования.
И динамика принимает вид:
(3) Г Хг+1 = (хг - Пц)а-вз(уг - п^)13* ,
I Уг+1 = (Уг - П2г)а-в{1-з)(хг - П1*)в(1-8) .
В данной модели в отличие от [2] центр также является игроком и его выигрыш на бесконечном промежутке времени имеет вид:
ГО
(4) I = ^ 5г 1п(х*уг).
г=0
Таким образом, центр хочет максимизировать общий размер популяции в водоеме.
2. Вектор Шепли и динамическая устойчивость
Динамическая устойчивость принципов оптимальности в дифференциальных играх подробно исследовалась в работах специалистов по теории игр. Л.А. Петросян [3] математически формализовал понятие динамической устойчивости. Л.А.Петросян и
Н.Н.Данилов [4] ввели понятие процедуры распределения дележа для кооперативных решений.
Для данной модели определяется вектор Шепли и динамически устойчивая процедура распределения дележа [10].
Теорема 1. При х0 = у0 вектор Шепли в задаче (2)-(4) име-
ет вид
где
(6 ,
= 2&1" х+
+ 6(1---6)(2С1 + 2С1,2,8 — 2С2,8 + С1,2 + С1,8 — С2 — С\в) ,
і _ 1 + ^1 1 |
^2 = 2(1 — аб) ПХ+
+ 6(1---б) (—С1 + 2С1,2,8 + С2,8 + С1,2 — 2С1,8 + 2С2 — С8)
3
6 = 2(1—06)1п х+
+ 6(1-б) (—С1 + 2С1,2,8 + С2,8 — 2С1,2 + С1,8 — С2 + 2С8)
С1 = С2 = 1п(------------- ------) + 1п(1---------- -------) ,
1 2 4 — а + 0.56 1 — а к 1 — а + 0.5Ь; ’
2а Л а
с8 = (1-) 1п(1 — 1-------+ 0 5,), С1,2 = 1п(1 — а) +1-------1п(а),
(1 — а) 1 — а + 0.56 1 — а
1 - а 3а 1 - а
С128 = 1п(------------------------------------------) +-1п(1-),
1,2,8 1 + 2а 1 — а 1 1 + 2а
2См ^11п(2 — ^1а(1 — а + Ь) — (а — Ь)(а + 1))+
+ (2 — ^1)а 1п(1_____________________________________2Л__________)
1 — а 2 — ^а(1 — а + Ь) — (а — Ь)(а + 1)
и
2Д
(1 - №) 1п(2 + №а(1 - а + Ь) - 2а + Ь) +
(1 + ^)а 1п(1----------------------2^—----),
1 — а 2 + ^а(1 — а + Ь) — 2а + Ь
где а = Ь = ДО, Д = (1 — а)(1 — а + Ь).
Доказательство. Последующее доказательство верно и для случая ж0 = уо, но получаемые коэффициенты и управление центра имеют значительно более сложный вид. Поэтому ограничимся здесь только простым случаем.
Рассмотрим случай некооперативного поведения игроков, т. е. ситуацию равновесия по Нэшу.
Пусть VI (ж, у) функция выигрыша игрока 1, ^(ж, у) - игрока
2, а ^(ж, у) - выигрыш центра.
Следуя принципу Беллмана эти функции должны удовлетворять уравнениям:
С2,8 =
+
^(х,у) = тах {1п и1 +
0<их
(5)
+бМх — „,)« ( * П (у — «,).(£—Ї1 Г-8’)}
\у — и2 /
^2(х,у) = тах {1пи2+
0^П2
(6)
+б^2((х — »,)“ (^(у — ,,,.2Г (х—*)в(1-’)}
\у — и2 /
V8(x,y) = тах {1п(ху)+ 0<8<1
№((х — «1)»(^—* Г, (у — »,)“ (х—и)в(1-8’)}.
\х — щ/ \у — и2/
Будем искать функцию выигрыша в следующем виде:
Жж,у)= Лг 1п Ж + Вг 1п у + Сг , % = 1, 2,8,
где Лг, Вг и Сг константы, зависящие от параметров модели. Тогда для игрока 1 из (5) получим
Л11п ж + В11п у + С1 =
(8) = 1п и1 + 5Л1[(а — ДО) 1п(ж — и1) + ДО 1п(у — и2)] +
+5В1[(а — в(1 — «)) 1п(у — и2) + в (1 — 8) 1п(ж — и1)] + 5С1.
Предположим, что и1 = 71ж и и2 = 72у. Тогда составим систему для определения констант:
А1 = 1 + 5А1 (а — ДО) + £В1(в(1 — 8) В1 = ^А^ДО + 5Б1(а — в(1 — «)),
решая которую получим
1 — 5(а — в(1 — в)) £ДО
Л1 =------------д-----------■ В1 = -д-
где
Д = (1 — £а)(1 — £а + ^в). Аналогично для игрока 2 из (6) получим
1 — £(а — ДО) ^в(1 — 5)
В = ------д----- • А = ----д----
Для определения оптимальных выловов максимизируем правую часть (8)
1 5А1(—а + ДО) — £В1(в (1 — 8)
и1 х — и1
откуда получим
хд
«1 =
1 — 5а + 5в(1 — 8)
Аналогично для игрока 2:
«2
уД
1 — 5а + 5вв
Для центра из (7) получим уравнение
А. 81п х + В 81п у + С 8 =
(9) = 1п х + 1п у + 5А8[(а — вв) 1п(х — и1) + вв 1п(у — «2)] + +5В8[(а — в(1 — в)) 1п(у — «2) + в(1 — в) 1п(х — «1)] + 5С8,
максимизируя правую часть которого получим
(5Л8 + 5В8)в(1п(ж — «1) — 1п(у — «2)) = 2^^ 1п ж—— = 0.
1 — у — «2
Следовательно, оптимальное управление центра определяется из условия
ж(1 — 71) = 1 (1 — 72)у .
Для рассматриваемого некооперативного случая при условии жо = уо получим, что центр должен разделять водоем поровну
1
в =2
Для всех возможных коалиций, действуя аналогично, найдем оптимальные стратегии игроков и центра.
При этом, стратегии игроков ищутся в виде:
ии = 71 ж*, «2* = 72у*.
Было получено, что для всех возможных коалиций оптимальное управление центра определяется в виде:
„ , хг(1 — 71) =
' (1 — 72)у* ,
и ниже будут приведены выражения для 8 только для случая жо =
уо.
А именно, были получены следующие оптимальные управления:
1) Коалиции {1}, {2}, {в}.
в 2,
д
71 = 72
1 — а5 + 0.5в5
где
Д = (1 — а5)(1 — + 5в)
2) Гранд коалиция {1, 2,8}.
а(1 — а5 + 5в)(1 — 2^1) + в (2 — ^1)
3в
1 — а5
71 =72 = ша5
1
3) Коалиции {1, 2}, {8}.
8 = 1 — ^1 71 = 72 = 1 — .
4) Коалиции {1,8}, {2}.
—а^(1 — а5 + 5в) + в(1 + а5) + а(1 — а5)
2в
2д
71 = 72
2 — ^15а(1 — а5 + 5в) — 5(а — в )(а5 + 1)
5) Коалиции {2, в}, {1}.
—а^(1 — а5 + 5в) + в
в
71 = 72 =
2в
2д
2 + ^15а(1 — а5 + 5в) — 5(2а — в) "
Заметим, что в рассматриваемом случае ж* = у* для всех возможных коалиций, поскольку )а-в и жо = уо.
Поэтому, если в общем случае выигрыш имеет вид:
У{К} = Лк 1п ж + В к 1п у + С к
для всех коалиций К, то при нашем предположении (жо = уо) выигрыш имеет вид:
У{к} = (Лк + В к) 1п ж + С к .
Приведем функции выигрыша для всех коалиций
(10)
1 1 2 1
^} = ^ =1—^ 1п ж + Т—5 СьУ{*} = 1—^5 1п ж + Т—5 С:
3 1 11
^•2-» = ^г1пж + С1А<’ ^-2> = ^51пж + П7С1-2
2 — Д1, 1 ^ 1 + Д1, 1
1—іг1п х+тС1 1п х+Г^'
где коэффициенты Сг, Сг ^, Сг, j, 8 приведены в формулировке теоремы (г, ] = 1,2,8).
Теперь мы можем найти вектор Шепли, используя формулу:
6 = £ (3 - |К|)6(|К 1 - 1)! |К,к, — У^], і є N = {1,2, в}
кем
общий вид которого приведен в формулировке теоремы.
Динамика развития популяции (ж* = у*) при кооперативном поведении всех участников имеет вид:
х1+1 = х?(1 — т)“ = х?(Г+|_)»
а?
£ 3 Л
откуда получим ж* = жа (1+заал)?= .
Определение 1. Вектор в(£) = (ДО (£), в2 (£),/$«(£)) называется процедурой распределения дележа (ПРД) [4, 10], если
ГО
&(0) = ^ 5*вг(і), і = 1,2, в . *=0
Основная идея этой схемы заключается в распределении кооперативного выигрыша по всему периоду продолжения игры.
Определение 2. Вектор в(£) = №(£), в2(£), АД£)) называется динамически устойчивой ПРД [3, 4, 10], если
*-1
6(°) = Е 5Твг(т) + 5*^г(^), г = 1, 2,8.
т=о
Здесь игроки, следуя кооперативной траектории, придерживаются одного и того же принципа оптимальности в каждый текущий момент времени и поэтому не имеют объективных мотивов отклоняться от ранее выбранного решения о кооперации.
Для нашей модели получим
вг(£) = Сг(^) — 5{г(^ +1) , г = 1, 2,8.
Определение 3. Дележ (£ъ£2,£з) удовлетворяет условию Янга [11], если
*-1
Е 5Твг(т) + 5%}(£) ^ У{г}(°)
т=о
для всех £ ^ 1, где в(£) = (в^), в2(£), в«(£)) _ динамически устойчивая ПРД.
Это условие гарантирует участникам кооперации, что даже в случае расторжения кооперативного соглашения их выигрыш будет не меньше, чем при изначальном некооперативном поведении.
Это условие в нашей модели принимает вид:
Определение 4. Дележ (£ь£2 , £8) удовлетворяет кооперативному регулирующему условию, если
Ж£) + 5У{г}(£ + 1) ^ ^{г}(£)
для всех £ ^ 1, где в(£) = (в1 (£), в2 (£), (£)) - динамически
устойчивая ПРД.
Это условие в нашей модели принимает вид:
£г(£) — 5{г(£ + 1) ^ ^{г}(£) — <^{г}(£ + 1) .
Предложенное условие дает стимул игроку поддерживать кооперацию, поскольку на каждом шаге он получает больше выгоды от кооперации, чем от некооперативного поведения.
В нашей модели кооперативное регулирующее условие имеет
вид:
£г(£) — 56(£ + 1) ^ ^{г}(£) — <^{г}(£ + 1) .
Заметим, что кооперативное регулирующее условие влечет условие Янга, поэтому докажем наше модифицированное условие.
Теорема 2. Кооперативное регулирующее условие выполнено для всех игроков.
Доказательство. Для случая ж* = у регулирующее условие
принимает вид:
Для первого игрока
3^-а5 3а5
—1п(жі) + - - — 1пГ ) — 5С- +
1 — а 5 1 + 2а 5'
+2С1 , 2, 8 — 2С2 ,8 + С1 , 2 + С1 ,8 — ^ °.
Для второго игрока
3(1 — ^-)а5 3а5
26
+2С1,2,« + С2,« + Сі,2 — 2С1,« — С;
1 — а 5 1„+ 2а 5'
> 0.
Для центра
11
26
3а 3а
— о 1п(х*) + її і-------И 1п(т , — 2С- +
1 — а5 1 + 2а5
+2С1,2,« + С2,8 — 2С1,2 + С1,8 — 4С8 ^ °.
Рассмотрим первое условие и покажем, что выражение в квадратных скобках неотрицательно.
^ 3ша5 , , 3а5 . _
В — г—а 1п(г^ >— 5С- + 2С-,2,*—
— 2С2,« + Сі,2 + С1,« — С« —
= 1п^-^а57) — 5С- + 3С-,2,в + (См — 2С2,8) — С8—
1 — а5 1 + 2а 5
3а5 , . г. 1 + 2а5, „ г. а5 , , г.
1п(3а 5) + ----- 1п(1 + 2а5) + ----- 1п(а5).
1 — а 5 1 — а 5 1 — а5
Заметим, что это убывающая по ^1 функция, поэтому достаточно проверить, что В ^ 0 при ^1 = 1. Несложно заметить также, что С18 — 2С28 > 0. Тогда
В > 3С- 2 в — 5С- — С + 1п(1 + 2а5) + 1п(а5) —
1 — а 5
— (зС- ,2,а — 5С- — 2(13—5а5) >п(1 — 1 — а5 + (,35)/2 *) +
Г
+ Ап(1 + 2а5) + а—- 1п(а5 ) —
V 1 — ао
— 2(1 — а5) 1п(1 — 1 — а5 + (£5)/2^ ’
где А = (1 — а5)(1 — а5 + в5).
Легко видеть, что выражения в скобках неотрицательны. Для завершения доказательства вспомним, что
1п(ж4) < 0.
Условия для второго игрока и центра проверяются аналогично.
3. Результаты численного моделирования
Моделирование было проведено для следующих параметров:
а = 0,4, 5 = 0,1, 8й = 0,5
в = 0,3 , ^1 = 0,55 , ^2 = 0,45 .
Начальный размер популяции ж = у = 0.5. Число шагов 10. На рис. 1-3 показана динамически устойчивая процедура распределения дележа (вг (£)) для игрока г (темная линия), выигрыш игрока г в равновесии по Нэшу - Р{г} (светлая линия) и его компонента дележа - £г(0) (пунктир).
распределения дележа распределения дележа
для игрока 1 для игрока 2
На рис. 4-6 представлено выполнение кооперативного регулирующего условия для всех игроков. На рисунках можно видеть £г(£) — 5{г(і + 1) (темная линия) и ^}(£) — 5У{^}(£ + 1) (светлая линия).
Рис. 3. Процедура распределения дележа для центра
регулирующее условие регулирующее условие
для игрока 1 для игрока 2
Рис. 6. Кооперативное регулирующее условие для центра
4. Заключение
В работе исследована теоретико-игровая модель эксплуатации ресурсов в дискретном времени. Для степенной функции развития популяции и логарифмических выигрышей игроков найдены равновесие по Нэшу и кооперативное равновесие. Получены в аналитическом виде вектор Шепли и динамически устойчивая процедура распределения дележа.
В данной работе особое внимание уделяется условиям, гарантирующим соблюдение кооперативного договора, достигнутого в начале периода планирования. Предлагается новое условие, которое побуждает игрока соблюдать кооперативное соглашение, называемое кооперативным регулирующим условием. Оказывается, что новое условие является сильнее и легче проверяемым, чем известное ранее условие Янга.
Литература
1. МАЗАЛОВ В.В., РЕТТИЕВА А.Н. Равновесие по Нэшу в задачах охраны окружающей среды// Мат. моделирование. -2006.-Т. 18.-№.5.-С. 73-90.
2. МАЗАЛОВ В.В., РЕТТИЕВА А.Н. Регулируемое равновесие в дискретной задаче разделения биоресурсов// Доклады Академии Наук. - 2008. - Т. 423. - №3. - С. 320-322.
3. ПЕТРОСЯН Л.А. Устойчивые решения дифференциальных игр со многими участниками// Вестник Ленинградского Университета. - 1977. - №19. - С. 46-52.
4. ПЕТРОСЯН Л.А., ДАНИЛОВ Н.Н. Кооперативные дифференциальные игры и их приложения. - Изд-во Томского Университета, Томск, 1982.
5. BASAR T., OLSDER G.J. Dynamic noncooperative game theory. - NY: Academic Press, 1982.
6. FISHER R.D., MIRMAN L.J. The complete fish wars: biological and dynamic interactions // J. of Environmental Economics and Management. - 1996. - V. 30. - P. 34-42.
7. LEVHARI D., MIRMAN L.J. The great fish war: an example using a dynamic Cournot-Nash solution// The Bell J. of Econom. - 1980. - V. 11. - №1. - P. 322-334.
8. MAZALOV V.V., RETTIEVA A.N. Bioresource management problem with changing area for fishery // Game Theory and Applications. - 2008. - V. 13. - P. 101-110.
9. MAZALOV V.V., RETTIEVA A.N. Incentive equilibrium in bioresource management problem// Evolutionary methods for design, optimization and control, CIMNE, Barcelona, Spain, 2008. - P. 301-312.
10. PETROSJAN L., ZACCOUR G. Time-consistent Shapley value allocation of pollution cost reduction// J. of Economic Dynamic and Control. - 2003. - V. 7. - P. 381-398.
11. YEUNG D.W.K. An irrational-behavior-proof condition in cooperative differential games//Game Theory Review. - 2006.
- V. 8. - №4. - P. 739-744.
COOPERATIVE INCENTIVE CONDITION IN BIORESOURCE SHARING PROBLEM
Anna Rettieva, Institute of Applied Mathematical Research Karelian Research Center of RAS, Petrozavodsk, Cand.Sc. ([email protected]).
Abstract: The discrete-time game model for bio-resource management problem (fish catching) is considered. The center (referee) shares a reservoir between the competitors, and the players (countries) capture the fish. We assume that there is a migratory exchange between the regions of the reservoir. The Nash and cooperative equilibria are obtained for infinite planning horizon. Time-consistent imputation distribution procedure is considered as a method for cooperation maintenance. The new condition which offers an incentive to players to keep cooperation is introduced and called "incentive cooperative condition".
Keywords: dynamic games, bio-resource management problem, cooperative equilibrium, time-consistency, imputation distribution procedure.