Научная статья на тему 'Двухуровневая кооперация в дифференциальной игре технологического альянса'

Двухуровневая кооперация в дифференциальной игре технологического альянса Текст научной статьи по специальности «Математика»

CC BY
319
44
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИФФЕРЕНЦИАЛЬНАЯ ИГРА / DIFFERENTIAL GAME / КООПЕРАЦИЯ / COOPERATION / ПРОЦЕДУРА РАСПРЕДЕЛЕНИЯ ПРИБЫЛИ / IMPUTATION DISTRIBUTION PROCEDURE

Аннотация научной статьи по математике, автор научной работы — Колабутин Николай Валерьевич

Статья посвящена двухуровневой кооперации в дифференциальных играх. Кооперативные дифференциальные игры один из наиболее актуальных разделов теории игр. С их помощью возможно математически описать конфликтно-управляемые процессы в менеджменте и экономике. Решением кооперативной дифференциальной игры являются некоторое кооперативное соглашение и выбранный принцип оптимальности, согласно которому распределяется полученный выигрыш. Исследования показали, что изначально выбранное кооперативное решение часто теряет свою оптимальность с течением времени. Поэтому встал вопрос об устойчивости кооперативного решения, в первую очередь о динамической устойчивости или о временной состоятельности. Данное понятие было формализовано Л. А. Петросяном. Кооперативное решение считается динамически устойчивым, если принцип оптимальности, выбранный в начале игры, сохраняет свою состоятельность на протяжении всего игрового процесса. Для динамической устойчивости необходимо в каждый момент времени проводить регуляризацию выбранного принципа оптимальности. Для этой регуляризации Л. А. Петросян предложил использовать перераспределение полученного выигрыша согласно процедуре распределения дележа. Все чаще в дифференциальных играх изучаются коалиционные решения, в которых коалиции выступают как отдельные игроки. Коалиции играют друг с другом в бескоалиционную игру, а выигрыш каждой коалиции распределяется между ее участниками в соответствии с некоторым принципом оптимальности. В данной статье исследуется модель, в которой участники объединяются в коалиции, выступающие как отдельные игроки, но при этом коалиции также могут кооперироваться для увеличения совместного выигрыша. В этом случае коалиции играют в свою кооперативную игру, максимизируя общий выигрыш и распределяя его между собой согласно с некоторым принципом оптимальности. Затем выигрыш каждой коалиции распределяется между ее участниками также в соответствии с некоторым принципом оптимальности. Такая кооперация называется двухуровневой. Принципы распределения выигрыша между коалициями и внутри коалиции могут отличаться. Для решения таких моделей требуется на каждом уровне кооперации построить характеристическую функцию и процедуру распределения дележа. Рассмотрена модель двухуровневой кооперации на примере дифференциальной игры технологического альянса. Участниками игры являются фирмы, имеющие технологию, приносящую прибыль. На первом (нижнем) уровне фирмы образуют коалиции, чтобы совместная прибыль была больше. На втором (верхнем) уровне коалиции выступают как отдельные игроки и также объединяются в одну общую коалицию с целью увеличения совместного выигрыша. Полученный на верхнем уровне выигрыш распределяется между коалициями-участниками. Таким образом, каждая коалицияучастник может иметь больше, чем если бы она играла самостоятельно. Затем каждая коалиция распределяет свою долю выигрыша между входящими в нее фирмами. Представлено устойчивое кооперативное решение для этой модели. Для его реализации на каждом уровне кооперации построена характеристическая функция и доказана ее супераддитивность. В качестве дележа выбран динамический вектор Шепли. Результаты подтверждены численным примером.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

TWO-LEVEL COOPERATION IN TECHNOLOGICAL ALLIANCE DIFFERENTIAL GAMES

The paper is devoted to two-level cooperation in differential games. Cooperative differential games are currently one of most important parts of game theory. They mathematically describe the conflict-controlled processes in management and economics. The solution of a differential game is a cooperative agreement, and the selected principle of optimality, according to which the received payoff is distributed. Studies showed that initially selected cooperative solution often loses its optimality over time. Therefore, the question arose about the stability of the co-operative solutions. The issue of dynamic stability or time consistency is considered. This concept was formalized by L. A. Petrosyan. Cooperative solution is dynamically stable if the principle of optimality selected early in the game stays consistent throughout the gameplay. For dynamic stability it is necessary at each moment of time to carry out the regularization of the chosen principle of optimality. For this regularization L. A. Petrosyan proposed to use the redistribution of received payoff in accordance with the “imputation distribution procedure”. In some cases coalitional solutions in differential games are studied, where the coalitions act as individual players. Coalitions play with each other in a noncooperative game, and payoff of each coalition is distributed among its members in accordance with some principle of optimality. In this paper we began to investigate the model in which participants form coalitions, acting as individual players, but the coalitions may also cooperate to increase joint payoff. In this case, the coalition play their cooperative game, maximizing overall benefits and distributing them among themselves according to some principle of optimality. Then, payoff of each coalition is distributed among its members as well according to maybe a different principle of optimality. Such cooperation is called two-level cooperation. Principles of profit distribution between coalitions and within coalition may be different. To solve such models which is required at both levels of the cooperation it is necessary to build the characteristic function and imputation distribution procedure. This paper describes a model of a two-level cooperation on the example of a technological alliance differential game. Participants in the game are the firms with the technology that brings profit. On the first (lower) level firms form coalitions to increase joint profit. On the second (upper) level coalitions act as individual players and also form the one grand coalition to increase the joint profit. The resulting top-level payoff is distributed between coalitions-participants. Thus, each coalition party may get more than it would receive by playing individually. Then each coalition distributes the resulting share of payoff among its member firms. This article also presented a stable cooperative solution in this model. For its implementation at every level of cooperation we build the characteristic function and prove its superadditivity. As a sharing the dynamic Shapley value is selected. The results are illustrated by a quantitative example.

Текст научной работы на тему «Двухуровневая кооперация в дифференциальной игре технологического альянса»

УДК 517.977.8

Вестник СПбГУ. Сер. 10. 2015. Вып. 1

Н. В. Колабутин

ДВУХУРОВНЕВАЯ КООПЕРАЦИЯ В ДИФФЕРЕНЦИАЛЬНОЙ ИГРЕ ТЕХНОЛОГИЧЕСКОГО АЛЬЯНСА

Санкт-Петербургский государственный университет, Российская Федерация, 199034, Санкт-Петербург, Университетская наб., 7/9

Статья посвящена двухуровневой кооперации в дифференциальных играх. Кооперативные дифференциальные игры — один из наиболее актуальных разделов теории игр. С их помощью возможно математически описать конфликтно-управляемые процессы в менеджменте и экономике. Решением кооперативной дифференциальной игры являются некоторое кооперативное соглашение и выбранный принцип оптимальности, согласно которому распределяется полученный выигрыш. Исследования показали, что изначально выбранное кооперативное решение часто теряет свою оптимальность с течением времени. Поэтому встал вопрос об устойчивости кооперативного решения, в первую очередь о динамической устойчивости или о временной состоятельности. Данное понятие было формализовано Л. А. Петросяном. Кооперативное решение считается динамически устойчивым, если принцип оптимальности, выбранный в начале игры, сохраняет свою состоятельность на протяжении всего игрового процесса. Для динамической устойчивости необходимо в каждый момент времени проводить регуляризацию выбранного принципа оптимальности. Для этой регуляризации Л. А. Петросян предложил использовать перераспределение полученного выигрыша согласно процедуре распределения дележа. Все чаще в дифференциальных играх изучаются коалиционные решения, в которых коалиции выступают как отдельные игроки. Коалиции играют друг с другом в бескоалиционную игру, а выигрыш каждой коалиции распределяется между ее участниками в соответствии с некоторым принципом оптимальности.

В данной статье исследуется модель, в которой участники объединяются в коалиции, выступающие как отдельные игроки, но при этом коалиции также могут кооперироваться для увеличения совместного выигрыша. В этом случае коалиции играют в свою кооперативную игру, максимизируя общий выигрыш и распределяя его между собой согласно с некоторым принципом оптимальности. Затем выигрыш каждой коалиции распределяется между ее участниками также в соответствии с некоторым принципом оптимальности. Такая кооперация называется двухуровневой. Принципы распределения выигрыша между коалициями и внутри коалиции могут отличаться. Для решения таких моделей требуется на каждом уровне кооперации построить характеристическую функцию и процедуру распределения дележа. Рассмотрена модель двухуровневой кооперации на примере дифференциальной игры технологического альянса. Участниками игры являются фирмы, имеющие технологию, приносящую прибыль. На первом (нижнем) уровне фирмы образуют коалиции, чтобы совместная прибыль была больше. На втором (верхнем) уровне коалиции выступают как отдельные игроки и также объединяются в одну общую коалицию с целью увеличения совместного выигрыша. Полученный на верхнем уровне выигрыш распределяется между коалициями-участниками. Таким образом, каждая коалиция-участник может иметь больше, чем если бы она играла самостоятельно. Затем каждая коалиция распределяет свою долю выигрыша между входящими в нее фирмами. Представлено устойчивое кооперативное решение для этой модели. Для его реализации на каждом уровне кооперации построена характеристическая функция и доказана ее супераддитивность. В качестве дележа выбран динамический вектор Шепли. Результаты подтверждены численным примером. Библиогр. 8 назв. Табл. 2.

Ключевые слова: дифференциальная игра, кооперация, процедура распределения прибыли.

Колабутин Николай Валерьевич — старший преподаватель; e-mail: n.kolabutin@spbu.ru Kolabutin Nikolay Valerievich — senior teacher; е-mail: n.kolabutin@spbu.ru

N. V. Kolabutin

TWO-LEVEL COOPERATION IN TECHNOLOGICAL ALLIANCE DIFFERENTIAL GAMES

St. Petersburg State University, 7/9, Universitetskaya embankment, St. Petersburg, 199034, Russian Federation

The paper is devoted to two-level cooperation in differential games. Cooperative differential games are currently one of most important parts of game theory. They mathematically describe the conflict-controlled processes in management and economics. The solution of a differential game is a cooperative agreement, and the selected principle of optimality, according to which the received payoff is distributed. Studies showed that initially selected cooperative solution often loses its optimality over time. Therefore, the question arose about the stability of the co-operative solutions. The issue of dynamic stability or time consistency is considered. This concept was formalized by L. A. Petrosyan. Cooperative solution is dynamically stable if the principle of optimality selected early in the game stays consistent throughout the gameplay. For dynamic stability it is necessary at each moment of time to carry out the regularization of the chosen principle of optimality. For this regularization L. A. Petrosyan proposed to use the redistribution of received payoff in accordance with the "imputation distribution procedure". In some cases coalitional solutions in differential games are studied, where the coalitions act as individual players. Coalitions play with each other in a noncooperative game, and payoff of each coalition is distributed among its members in accordance with some principle of optimality. In this paper we began to investigate the model in which participants form coalitions, acting as individual players, but the coalitions may also cooperate to increase joint payoff. In this case, the coalition play their cooperative game, maximizing overall benefits and distributing them among themselves according to some principle of optimality. Then, payoff of each coalition is distributed among its members as well according to maybe a different principle of optimality. Such cooperation is called two-level cooperation. Principles of profit distribution between coalitions and within coalition may be different. To solve such models which is required at both levels of the cooperation it is necessary to build the characteristic function and imputation distribution procedure. This paper describes a model of a two-level cooperation on the example of a technological alliance differential game. Participants in the game are the firms with the technology that brings profit. On the first (lower) level firms form coalitions to increase joint profit. On the second (upper) level coalitions act as individual players and also form the one grand coalition to increase the joint profit. The resulting top-level payoff is distributed between coalitions-participants. Thus, each coalition party may get more than it would receive by playing individually. Then each coalition distributes the resulting share of payoff among its member firms. This article also presented a stable cooperative solution in this model. For its implementation at every level of cooperation we build the characteristic function and prove its superadditivity. As a sharing the dynamic Shapley value is selected. The results are illustrated by a quantitative example. Bibliogr. 8. Tables 2.

Keywords: differential game, cooperation, imputation distribution procedure.

Введение. Рассматривается кооперативная дифференциальная игра, в которой участвуют фирмы, разрабатывающие некоторую технологию. Множество фирм обозначим N = {1,...,n}. Параметром каждой фирмы i G N является уровень ее технологии, которое обозначим xi G R+. Уровень технологии будем также называть состоянием фирмы. Игра начинается из состояния x0 = {x0,...,xЩ в момент to и продолжается период T-to, в течение которого фирмы получают определенную прибыль от применяемой технологии. В момент окончания игры T фирмы ликвидируют свои технологии, вследствие чего получают дополнительную прибыль [1].

Прибыль фирмы зависит от уровня ее технологии, поэтому она стремится его повысить, для чего фирма инвестирует в развитие технологии. Уровень инвестиций фирмы i в свое технологическое развитие, являющийся ее стратегией в игре, обозначим ui G R+. Этот параметр будем также называть управлением фирмы.

Динамика развития фирмы протекает согласно дифференциальному уравнению

1 /9

Хг(в) = аг [иг(в)хг (в)] / — бхг(в), (1)

Хг(г0) = Х0, г € М,

в котором аг и б — положительные константы. На правые части уравнения наложены условия, гарантирующие существование, единственность и продолжимость решений для любых кусочно-непрерывных управлений иг(в) € Н+, в € [¿о, Т]. Также на систему наложено дополнительное ограничение хг(в) > 0, в € [¿о,Т]. Прибыль фирмы г € N имеет вид

т

Нг (х0, Т — Ьо,щ) =1 Нг (в, Хг(в),щ(в)) ехр [—г(в — ¿о)] dв + 4о

+ ехр[—г(Т — ¿о)] Яг [Хг(Т)]1'2 , (2)

где Нг (в, хг(в),иг(в)) = Рг [Хг(в)]1'9 — сгиг(в) — мгновенная прибыль фирмы г в момент в, в состоянии хг(в) и управлении иг(в); Рг,сг — положительные константы; ехр [—г(Ь — ¿о)] — функция, определяющая величину дисконта; г — процентная ставка; Яг [хг(Т )]1/'9 — терминальный выигрыш фирмы г в момент окончания игры Т ив состоянии хг(Т); яг — положительная постоянная.

Для большей прибыли фирмы могут объединяться в коалиции. За счет своих партнеров фирма-участник может получить дополнительные возможности в развитии, которые она не могла бы иметь, если бы действовала самостоятельно. Поэтому динамика развития фирм в коалиции изменяется. Рассмотрим коалицию К, образованную некоторым подмножеством игроков К С N. Динамика развития коалиции принимает вид

Хг(в)= аг [иг(в)Хг (в)]1/9 + ]Т Ь^^Х (в)хг(в)]1/9 — бхг(в), (3)

фА г Ьз

зек, з=г

Хг (¿о) = хо , г € К,

здесь Ь-З^ ^ 0 — положительная константа, которая представляет эффект передачи технологии для фирмы г, осуществляемый фирмой Уровень технологии каждой фирмы в коалиции К оказывает положительный эффект на скорость технологического развития, т. е. выполняются условия дfк [хк(в),иг(в)] /дхз ^ 0, ] € К, где /к [хк(в),иг(в)] — правая часть уравнения динамики (3) (заметим, что динамика развития не зависит явно от времени в). Синергетический эффект технологического развития фирмы г возникает за счет передачи технологий от других фирм в коалиции К.

Прибыль коалиции К С N равна суммарному выигрышу всех ее участников:

У^ Нг (х°, Т — ¿о, щ) =

гек

Н (в, хг(в), иг (в)) ехр [—г (в — ¿о)] + ^ ехр [—г(Т — ¿о)] Яг [хг(Т )]1'2 . (4)

А г- Т^ " А г-

гек: гек

Для максимизации прибыли коалиции К требуется рассмотреть задачу оптимального управления, которая состоит в максимизации (4) при граничных условиях (3). Эту задачу максимизации обозначим через ш [К; г0; ^к] •

Подробное решение данной задачи описано Л. А. Петросяном и Д. Янгом [2]. Ими была введена непрерывно-дифференцируемая функция Ж)к (г,хк(г)) : [г0,Т] х П^ек—► Д, определяющая максимальный выигрыш коалиции К С N на промежутке [г,Т], где г € [г0,Т]. Эта функция удовлетворяет уравнению Беллмана

-Ж(о)К (г, хк(г)) = тах I V Ы (г, х(), щ(г))ехр [-г(г - ¿о)] +

ик ^^

иек

+ £ (г, хк (г)) ¡к [хк (г), ик (г)] ,

гек )

Ж(*0)к (Т, хк(Т)) = £ ехр [-г(Т - го)] щ [хн(Т)]1'2 ,

гек

/к [хк(г),ик(г)] = {¡к [хк(г),щ(г)}} = {хг}1ек, К с N.

В результате решения задачи ш [К; г0; х0к] получаем функцию Ж(*°)к (г,хк(г))

гек

.0

в виде

\к1+\ и.ЛАМ1/2 , Гк1

Ж(ь°)к (г,хк(г))

£Ак (г) [хг(г)]1/2 + ск (г)

1гек

ехр[-г(г - г0)], (5)

где величины {Ак(г)}гек, Ск(г) являются решением соответствующих дифференциальных уравнений

^ ' зек,з=г

2

гек 1

Ак(Т) = Яг, Ск(Т)=0, г € К.

В [2] была подробно рассмотрена кооперативная игра, в которой фирмы, объединяясь в общую коалицию, максимизируют совместный выигрыш и делят его в соответствии с вектором Шепли. В данной статье представлена расширенная модель, в которой участниками игрового процесса являются не отдельные фирмы {г}ге^, а их коалиции, которые выступают как отдельные игроки [3, 4].

Модель. Будем, как и ранее, считать, что в игре участвуют N игроков-фирм. Параметром состояния фирмы г € N = {1,...,п} является его уровень технологии хг € Д+, а стратегией - инвестиции в технологическое развитие иг € Д+. Выигрыш игрока вычисляется по формуле (2). Пусть Д = {К1К2,..., Кт} - коалиционное

т т

разбиение игры, т. е. К^ р| Кп = 0, 11 = 12, и К1 = N, \К[ \ = щ, ^ щ = п.

г=1 г=1

Множество индексов разбиения обозначим через М = {1,..., т}.

Дифференциальную игру, в которой коалиции выступают как отдельные игроки, будем обозначать через ГЛ (хо,Т — ¿о). При этом коалиции могут кооперироваться между собой, чтобы увеличить совместный выигрыш. Введем обозначения: хк1 (в) = {хг(в)}гек1, I € М — состояние коалиции К1 в момент в € [¿о,Т], определяемое через набор состояний ее участников; хк = {х°}гек1 — начальное состояние коалиции К;; ик1 (в) = {иг(в)}гек1,1 € М, — управление коалиции К1 в момент в, представляющее собой набор управлений ее участников; К С Д — любая коалиция, образованная подмножеством элементов разбиения Д; VА(1о) = VА(1о) ^К,хк(¿), Т — ^ — характеристическая функция игры.

Динамика развития коалиции К1 С Д протекает согласно системе дифференциальных уравнений

Хг(в) = аг [иг(в)хг(в)]1/9 + £ Ь^Х(в)хг(в)]1/9 — бхг(в), (6)

зекг, з=г

хг(¿о) = х°, г € К;.

Правую часть уравнения обозначим через ¡к1 [хк1 (в),ик1 (в)].

Выигрыш коалиции К1 равен сумме выигрышей ее участников:

Нк1 (х°к1 ,Т — ¿о,ик,) = ^ Нг (х°,Т — ¿о, иг) =

гек1

т

^ / Нг (в, хг (в), иг (в))ехр[—г(в — ¿о)] dв +

гек /о

+ £ ехр[—г(Т — ¿о)] Яг [хг(Т )Г . (7)

гек1

В (7) Нг (в, хг(в), иг(в)) = Рг [хг(в)]1'9 — сгиг(в) — мгновенная прибыль фирмы г в момент в € [¿о, Т].

Кооперация коалиций. Если несколько коалиций объединяются между собой в более крупную коалицию, то каждая из коалиций-участников может получить дополнительные бонусы в развитии своей технологии, которые она не могла бы иметь сама. Поэтому уравнение движения коалиций-участников изменяется. Рассмотрим коалицию К = К^У} К;2[] ...\_}К;к, где К;1 ,К12 ,...,К;к С Д. Уравнение движения участников коалиции К1 С К принимает следующий вид:

Хн(в) = аг [иг(в)хн(в)]1/9 + £ Ь^1 Х (в)хн(в)]1/9 + £ Ь^Хз (в)хг(в)]1/9 + ... +

зекн зек12

+ £ ЬЗг[Хз (в)Хг (в)]1/9 + ... + £ Ь^Х (в)Хг(в)]1/9 — бХг (в), (8)

зекг, з=г эещк

хг (¿о ) = х°, г € К;.

Суммы ^ Ь\?,г [хз (в)хг(в)]1/9 представляют собой суммарный эффект передачи тех-зекк з _

нологии фирме г от соответствующей коалиции. Таким образом, синергетический эффект технологического развития фирмы г получается за счет как участников той

коалиции, которой она изначально принадлежала, так и участников остальных коалиций, входящих в коалицию К. Объединив суммы, можно упростить выражение (8), записав его так:

ХН(8)= О* (8)]1/2 + £ (8)ТН (з)]1/2 - 5хг(з), (9)

зек, з=г

хг(г0)= х0, г е К с д.

Выигрышем коалиции К является ее прибыль, которая, как и раньше, рассчитывается как сумма прибылей ее участников, т. е. коалиций К¡1, К12,..., К1к:

к

' „0

Нк (хк,Т - ¿о,ик) =£Нкч (хкч ,Т - ¿0,ик£) =

«=1

к ( 1

= £ £ Ы (в,хг(з),щ(з))ехр[-г(з - ¿о)] ¿.в +

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1г г0

+ ]Т ехр[—г(Т - ¿о)] Яг [хг (Т )]Ь2

гек1(

Коалицию К = Д, образованную всеми участниками игры ГЛ (х°, Т — ¿о), будем называть технологическим альянсом коалиций.

Для нахождения коалиционного решения в игре ГЛ (х°, Т — ¿о) требуется рассчитать характеристическую функцию VА(1о) = VЛ(М ^К,хк(¿),Т — ^ и определить процедуру распределения совместной прибыли.

Вычисление характеристической функции в игре ГЛ (х°, Т — ¿0). При вычислении характеристической функции важно помнить, что участниками игры являются не отдельные фирмы, а коалиции, поэтому требуется рассматривать не все подмножества множества N, а только подмножества К1 С Д и их объединения.

Характеристическую (функцию будем искать в два этапа: вначале построим равновесие по Нэшу в игре ГЛ (х°, Т — ¿о), затем вычислим значение характеристической функции для произвольной коалиции К С Д, частным случаем которой является технологический альянс коалиций. Считаем, что коалиции из разбиения Д, не входящие в К, получают выигрыш, соответствующий равновесию по Нэшу.

Равновесие по Нэшу в игре коалиций ГА (х°, Т — ¿о). Поскольку в данной модели формирование коалиций ведет только к изменению динамики игры и образованные коалиции никак не взаимодействуют между собой, то любая фирма ], не входящая в коалицию К1, никак не влияет на ее развитие. Поэтому в данном случае поиск равновесия по Нэшу вырождается в максимизацию коалиционного выигрыша каждым игроком-коалицией К1 С Д.

Коалиция К1 стремится максимизировать свой выигрыш. С этой целью рассмотрим соотношение

V(К1 ,хК1 (1),Т — 1) = = Ш ('о)к (I, хк, (г)) = тах (Нк, (хк, (¿),Т — I, и к, Ш =

= т&х(уУу Нг (хг(¿),Т — ¿,щ(¿)) ) =

ик, \ ^-'

, Кгек, /

= шах I У^ / Нг (в,хг(в),иг(в)) ехр [—г(в — ¿о)] dв + ик, \ ^ } \гек, г

+ £ ехр [—г(Т — ¿о)] яг [хг (Т)]1/9 ) , К; С Д,

гек,

где Ш(*о)к' (¿,хк, (¿)) — непрерывно дифференцируемая функция, определяющая максимальный гарантированный выигрыш коалиции К; на временном промежутке [¿,Т], I € [¿о,Т].

Задача максимизации коалиционного выигрыша была описана в [2]. Функция Ш(*о)к' (¿,хк, (¿)) удовлетворяет уравнению Беллмана

(¿,хк, (¿)) =

= шах< У^ Нг (г,Хг(г),иг(¿))ехр[—г(г — ¿о)] +

ик, гек, г г г

+ £ (¿, хк, (¿)) /к [хк, (¿), ик, (¿)] 1 ,

(10)

гек,

19

Ш(го)к (Т, хк, (Т)) = £ ехр [—г(Т — ¿о)] Яг [хг(Т)]!

гек,

/к [хк, (¿),ик, (¿)]= Хк,, К; С Д.

В [2] было показано, как определяется значение характеристической функции для произвольной коалиции. Действуя аналогичным образом, находим

ш(гок (г,хк, (¿)) =

^лк (¿) [Хг(1)]1/9 + Ск (¿)

.гек,

ехр[—г(1 — ¿о)] . (11)

Здесь величины {ЛK, (¿)}гек,, Ск, (¿) являются решением дифференциальных уравнений

^ ' зек, ,з=г

[г,з1 2 з

гек,

лк (Т) = яг, ск (Т) = 0, г € К;. Из формул (11) и (12) получаем уравнения для частных производных

(¿, хк, (¿)) =

£Л к (1)[Хг(1)]1/9 + С ^ (¿) гек,

^Лк (¿) [хг (¿)]1/2 + Ск (I)

гек

ехр[—т(1 — ¿о)], (13)

= = (14)

из уравнений (10) и (13) - формулы для оптимальных управлений участников коалиции К1

2

16(с/)2

Определив оптимальные управления участников коалиции (14) и подставляя их в уравнение развития коалиции К1 (6), выводим уравнение оптимальной коалиционной траектории

2

= М«)]1/2 + £ - 6x^8),

1 зек,, з=г

хг(Ьо) = хо, г е К^в е [¿о,Т].

Вычисление значения характеристической функции для произвольной коалиции К С Д. Пусть К = К^ и К^и ...{^К^ — объединение некоторого подмножества коалиций из разбиения Д. Характеристическая функция VА(го) = VА(г°) ^К,х£(¿),Т — ^ для коалиции К ищется аналогичным образом. Требуется решить следующую задачу максимизации:

VАМ = VА(г°) (К,х Й(¿),Т — = тах (Н Й (хЙ(¿),Т — ¿,иЙ(Ь))) = V / ик

= т*х НкI (хк, (¿),Т — ик1 (¿))

к \ кI с к /

= т*х[У, ! £ Ы (в, хг(5),иг(в)) ехр [—т(в — ¿о)] ds + к \к1 сЙ г гек1

+ £ £ ехр[—т(Т — ¿о)] яг [хг(Т )]1/21 .

к1с Й гек1 )

Динамика развития коалиции К протекает согласно системе (9). Уравнение Белл-мана для функции VА(го) = VА(го) ( К,хк(¿),Т — ¿1 принимает такой вид:

(К,хЙ(¿),Т — ¿) =

= тах < У^ Ыг (¿, хг(¿), иг(¿)) ехр [—т(1 — ¿о)] +

ик к ге Й

+ £ V£¡■t0) (К,хк(¿),Т — ! Й [хк(¿),ик(¿)] |> , (15)

кс к

т

УA(to) (к,xk(Tt) = E exp [-r(T - to)] qi [xi(T)]m .

iek

Здесь

V A(t0)

V K i

K,xк(t),T - t =

= gradVA(t0) (K,xk(t),T -1) = { VxA(t0) (K,xk(t),T - t) ,

fKi [xкк (t),UKi (t)] ={ f? [xк(t),Ui(t)]}^ = {xi(t)heKi, K С К. Выражение v£(to) (к, xk(t),T - tj f щ \xk(t), uk1 (t)] можно переписать как сумму:

VA(to) (к ,xk (t),T - t)fKi [xk (t),UKi (t)] =

] (16)

= VA(to) [K,xk(t),T-t) fK [xk(t),Ui(t)] .

ieKi

Подставив (16) в (15), имеем

-VtA{to) (К ,xk (t),T - t) =

max < E hi (t, xi(t), ui(t)) exp [-r(t - to)] +

лек

+ Y. VA(to) [K ,xk (t), T - t)fK [xk (t), Ui(t)] ieK

VA(to) (Ё ,xk (T ),T = E exp[-r(T - to)] qi [xi(T)]

1/2

ieK

(17)

Беря частные производные по величинам {щ}^к от выражения под знаком max и приравнивая их нулю, выводим формулы для оптимальных управлений

4(ci)2

VA(to) (К,xK(t),T - t) exp[r(t - to)]l xi, i e К.

(18)

Подставляя (18) в (17) и решая полученное уравнение, находим

VA(to) (К,xk(t),T - t) =

ieK

AK (t)[xi(t)]1/2 + CK (t)

exp [-r(t - to)]

Здесь

ieK

и CK (t) являются решением дифференциальных уравнений

<[ij]

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

jeK ,j=i

2

a

Ui =

геЙ г

Л?(Т) = яг, С*(Т)=0, г е К. Таким образом, характеристическая функция VА(го) К, хк(Р),Т — ^ совпадает

с функцией Беллмана Ш(г°)к (ъ,хк(¿)). Запишем оптимальные управления для коалиции К:

= ытгей = • (19)

Динамика развития коалиции принимает вид

2

х*(в) = ^-А?(*)[х*(*)]1/2+ ]Г Ъ^[х*(3)хШ112-5хШ (20)

г зе к ,з=г

х* (¿о)= х°, г е К, в е [¿о,Т].

Супераддитивность характеристической функции VА(го) ^К,хк(р), Т — £

Характеристическая функция VА(го) ^К,хк(¿),Т — ^ определяется следующим образом:

( 0, К = 0,

VА(го) (К, хк(¿),Т — Ш(го)к'(1,хк (I)), К = К1 С Д (21)

[ ш(г°)к (I, хк(¿)), К = К с д.

Следует установить супераддитивность функции VА(го) (К, хкТ — t). Определение. Функция VА(го) (К, хкТ — ¿) является супераддитивной, если для любых коалиций К, Ь С Д, К П Ь = 0 выполняется условие

VА(го) (КиI,хк^I(¿),Т — г) > VА(го) (К,хк(¿),Т — ^ + VА(го) (£,(¿),Т —

Учитывая (21), если функция Ш(го)к (¿,хк^)) супераддитивная, то из нее очевидным образом следует супераддитивность функции VА(го) (К, хкТ — t).

Покажем супераддитивность функции Ш(г°)к (¿, хк $)) для любой коалиции Ь С К. Для начала приведем без доказательства теорему о сравнении решений [5]. Теорема 1. Пусть даны две задачи Коши:

У1(¿)= 11 (^УШ , У1(1о)= У°1,

У2(¿)= 12 (¿,У2(¿)) , У2Ы= У°°.

Для каждой задачи выполняются условия существования и единственности решения и, кроме того, условие /1 (¿, и(¿)) ^ /2 (¿, и(¿)) | V (¿, и(¿)) . Тогда, если Уо ^ У°, то при всех £ ^ t0 выполняется

У1(г,го,У<о) > У2(Ь, Ьо, у2). Теперь можно доказать супераддитивность функции Ш(г°)к (¿,хк(¿0).

Теорема 2. Функция Ш(го)к (¿,хк(¿)), задаваемая формулой (5), является супераддитивной.

Доказательство теоремы 2. Рассмотрим две коалиции 81,89 С N, £1 П 89 = 0 и их объединение 81 и Б9. Функция Ш(го)к (¿,хк(¿)) для каждой из коалиций принимает следующий вид:

Ш(го)31и32 (¿,хз1из2 (¿)) =

= шах £ Р [х^ — сгЩ(в)} ехр[—г(в — ¿о)]Пв +

+ £ ехр[—г(Т — ¿о)] Яг Х(Т , геЯ1и82 /

Ш(¿,х«1 (¿)) = шах [51 ! [Рг [хг(в)]1'9 — сгиг(в)] ехр[—г(в — ¿о)] Пв + 1 \ге«1 г

+ ^ехр [—г(Т — ¿о)] Яг [хг(Т)]1

19

ге«1

1ге«1 '

Ш(го)&'2 (¿,хз2 (¿)) = шах Е / Рг [хг(в)]1'9 — сгиг(в) ехр[—г(в — ¿о)] Пв +

+ £ ехр[—г(Т — ¿о)] Яг [хг(Т )]1/9) .

ге81 )

При этом уравнения движений для каждой из коалиций имеют вид

Х г (в) = /«1иБ2 [в,х51и«2 (в), иг(в) = аг [иг(в)хг (в)]1/2 +

+ £ ЬзА[хз (в)хг(в)]1/9 — ёхг(в), зе81иБ2, з=г

хг(Ьо) = хо, г € Б1 и 89, в € [¿о,Т],

(22)

Хг(в) = /«1 [в, хв1 (в), щ(в)] = аг [иг(в)хн(в)]1/2 +

Ьз,г][хз (

+ Е (в)х г (в)]1/9 — 5хг (в),

(23)

зеБ1, з=г

хг (¿о) = хо, г € 81, в € [¿о,Т],

Хг (в) = /«2 [в,х«2 (в), щ (в)] = аг [щ (в)хг (в)]1/2 +

+ £ Ь^Х (в)х г (в)]1/9 — ёхг (в), зеЯ2, з=г

хг (¿о) = хо, г € 89, в € [¿о,Т].

ге«1и«2

Из условия хг (в) > 0 для У г € N следует, что для любых иг

^Г«^82 [в,х51и«2 (в),иг(в)] > /«1 [в,х?1 (в),иг(в)] , г € 81, /?1и82 [в,Х81и32 (в), Щ (в)] > /?2 [в,х«2 (в),иг (в)], г € 89.

Обозначим решения уравнений (22)-(24) соответственно через |х?1"?2 (в)|

Iх?' <4^ " О?С)}.е«,•

Учитывая теорему 1, получаем, что для любых допустимых и (в) уровень технологии фирмы х?1"?2 (в) ^ х?1 (в), г € 81, и х?1"?2 (в) ^ х?2 (в), г € 89.

Из формулы выигрыша предприятия (2) находим, что для любого допустимого иг(в) выигрыш фирмы Нг (хг(¿),Т — ¿,щ) в коалиции 81 и 89 больше, чем выигрыш той же фирмы в коалиции 81 или 89:

Нг(х?1и?2 (¿),Т — ¿, щ(I)) > Нг^х?1 (¿),Т — ¿,иг(I)) , г € 81,

Нг (х?1"?2 (¿),Т — ¿, щ$)) > Нг (х?2 (¿),Т — ¿,щ(Ь)) , г € 89.

Просуммировав выигрыши фирм по коалициям, имеем

]Г Нг(х?1и?2 (¿),Т — ¿,иг(I)) ^ Нг^х?1 (¿),Т — ¿,щ(¿)) ,

е ?1 е ?1

]Г Нг (х?1"?2 (¿),Т — ¿,иг(I)) Нг (х?2 (¿),Т — ¿,иг(1)^ . (25)

е ?2 е ?2

Обозначим через \ и?1 (в) > и \и?2 (в) > управления, максимизирующие

е ?1 е ?2

суммы выигрышей в коалиции 81 и 89. Подставляя их в (25), получаем £ Нг (х?1"?2 (¿),Т — ¿, и?1 (1)) > £ Нг (х?1 (¿),Т — ¿, и?1 (I)) ,

е ?1 е ?1

£ Нг(х?1и?2 (¿),Т — ¿, и?2 (I)) > £ Нг(х?2 (¿),Т — ¿, и?2 (I)) . (26)

е ?2 е ?2

Сложив неравенства (26), находим

£ Нг (х?1"?2 (¿),Т — ¿,и?1 (I)) + £ Нг (х?1"?2 (¿),Т — ¿,и?2 (¿)) > е ?1 е ?2

> £ Нг (х?1 (¿),Т — ¿, и?1 (I)) + £ Нг (х?2 (¿),Т — ¿, и?2 (I)) .

х

е ?1 е ?2

Обозначив через ^и?1"'52 ? управления, максимизирующие суммы вы-

I г J геSlUS2(s) игрышей в коалиции 81 и 89 , получаем

£ Нг (х?1"?2 (¿),Т — ¿Щ?1"?2 (I)) = шах ( £ Нг (х?1"?2 (¿),Т — ¿,Щ и)} >

геSlUS2 и%,г 1 2 uе3lU32 )

> £ Нг (х?1"?2 (¿),Т — ¿,и?1 (I)) + £ Нг (х?1"?2 (¿),Т — ¿,и?2 (¿)) >

е ?1 е ?2

тах

и^,ге31

Нг (х?1 (*),Т — ¿, и!1 (I)) + £ Нг (х*2 (¿),Т — ¿, и?2 (I)) =

геБ1 геБ2

| £ Нг (х!1 (¿),Т — t,щ(t))\+ тах \ £ Нг (х**2 (¿),Т — 1,иг(1)) (27)

По определению

тах*Л £ н(х3^32®,т—^щш = ш^1^^х*^т..

и±,ге31и32 ,

{ге31и32

тах | £ Нг (хс*1 (¿), Т — ¿, щ(1)) | = Ш(¿, х(¿)), (28)

тх \ £ Нг (х32 (¿), Т — I, иг(1)) | = Ш(го)32 (I, хх*2 (¿)) . Подставив (28) в (27), имеем

Ш(го)31и32 (¿,хз1и32 (¿)) > Ш(го)31 (¿,хз1 (¿)) + Ш(го)32 (¿,хз2 (¿)),

что и требовалось доказать. ■

Супераддитивность функции

VА(го) (К, хк (¿),Т — ¿) очевидным образом вытекает из супераддитивности функции Ш(г°)к (¿,хк$)).

Процедура распределения прибыли в технологическом альянсе коалиций. Будем предполагать, что участники технологического альянса коалиций делят полученный выигрыш в соответствии с динамическим вектором Шепли (см. [6]). Отметим, что рассчитывается не доля каждой отдельной фирмы, а доля каждой коалиции К1 С Д. Формула для компоненты вектора Шепли принимает следующий вид:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

^ (1/) = £ (к-Щгп-ку. г _ ,

т! I

к СА

Здесь К = К^ и К12 и^и^'»: — объединение некоторого подмножества коалиций из разбиения Д, К£ = 1, к — число коалиций-участников игры, входящих в коалицию К.

Чтобы максимизировать доход технологического альянса, игроки на промежутке [¿о, Т] будут применять набор кооперативных управлений в соответствии с формулой (19) и реализовывать соответствующие оптимальные траектории (20) для случая К = Д. Предполагается, что для дележа совместного дохода игроки будут использовать вектор Шепли, компоненты которого вычисляются по формуле (29). В начальный момент времени 1о доля кооперативной прибыли коалиции К1 будет равна

,(г°) (+п хо ) к1 у-о,хи)

(Ъо,

(к - 1 )!(то - к)\

пса

Е ( Т [уА(М 4.г -*о) - (К\ к,,Т-го)

Учитывая, что УА(гс) (к(¿),Т — ^ = Ш(гс)К {¿,хк(¿)), можно переписать (30) в следующем виде:

4:]М) = Е (<0>4) (*0>4\*.)]. (31)

К СА

Вектор Шепли должен поддерживаться в течение всего времени игры. Это означает, что в каждый момент времени £ € [¿о, Т] должно выполняться равенство

К СА

Для реализации динамического вектора Шепли, чтобы компенсировать переходные изменения, необходимо определить процедуру распределения дележа (см. [7]) как функцию В а (¿) = {Вк1 (¿)}Т=1о, такую, что

1

^ (1о,х%) = [ Вщ (в)ехр[—т(8 — ¿о)] ^ + ехр[—т(Т — ¿о)] Е ® XI (Т)]1/2 . (32) /с ^Кг

Функция В к, (¿) представляет собой мгновенный платеж, получаемый участником-коалицией К1 в момент

Чтобы вектор Шепли поддерживался на всем протяжении игры, необходимо, чтобы в каждый момент выполнялось равенство

^ (1,х*м (1))= В ^ (8)еЩ)[—т(8 — ¿о)] 3.8 + ехр-т(Т — ¿о)]^ <Й X Т)]1/2 . г ^К

(33)

Из (32) и (33) получаем, что

г

(¿о, х%) = У Вкг (8) ехр [—т(8 — ¿о)] 38 + ^ (¿, х%(¿)).

Последнее условие означает временную состоятельность или динамическую устойчивость [7, 8] решения относительно коалиций-участников {К;}. Но необходимо также показать динамическую устойчивость решения относительно каждой отдельной фирмы. Это будет сделано ниже.

Отметим, что в каждый момент 8 € [¿о, Т] происходит только перераспределение совместной прибыли, поэтому сумма мгновенных доходов игроков не меняется:

ВКг (8) = Е Е ^ (8,Х*(8),П*(8)) = Е Е Р [Х^2 — СгП* (8)

Е

Кг СА Кг СА гекг Кг С_А геКг

В данном случае функция В кг (8) имеет вид (к — Щт — к)!

т!

КС А

+

зек

- Е №*>К\К' ^,Х*к\к1 (*))] /N [Х*М (*),п%(8)]

не К\Кь

Распределение прибыли внутри коалиции К;. Выигрыш, полученный в игре ГЛ (х°,Т — ¿°), коалиция К1 делит между своими фирмами-участниками. Необходимо вычислить долю каждой фирмы от такого выигрыша. Будем считать, что внутри коалиции К1 фирмы действуют кооперативно. В качестве дележа используется также динамический вектор Шепли. Это означает, что можно определить кооперативную игру Гк1 (х°, Т — ¿о), в которой К1 - множество игроков, а V(Ь, х^(г), Т — г), где Ь С К;, - характеристическая функция, рассчитанная в предположении, что игроки, не входящие в коалицию К1, применяют свои оптимальные коалиционные стратегии, а игроки, не входящие в Ь, - свои равновесные по Нэшу стратегии в игре Гк (х°,Т — ¿°).

Для вычисления доли дохода каждой фирмы г € К1 необходимо найти значение характеристической функции в игре ГК1 (х°, Т — ¿°) и определить процедуру распределения прибыли.

Вычисление значения характеристической функции в игре х°, Т—

¿°). Характеристическую функцию будем искать следующим образом. Вначале вычислим характеристическую функцию для всей коалиции К;, затем для одной фирмы г € К1 и для произвольной коалиции К С К;. При расчете характеристической функции для коалиции К; необходимо учитывать, что она участвует в игре коалиций ГЛ (х°,Т — ¿°) и поэтому получает больше прибыли, чем играя самостоятельно. Поскольку любая подкоалиция К С К; не включена в разбиение Д, то можно считать, что она не имеет тех бонусов, какие доступны для коалиции К;, и для нее характеристическая функция будет строиться без учета игры коалиций.

Вычисление значения характеристической функции для коалиции К;. Значение характеристической функции V = V(К;,хк1 (¿),Т — г) должно равняться максимальному выигрышу, который возможен для коалиции К;. Если бы коалиция играла самостоятельно, ее максимальный выигрыш был бы равен функции Ш{ь,х*к (¿)), определяемой формулой (11). Эта функция определяет максимальный выигрыш коалиции К; при самостоятельном развитии в игре коалиций ГЛ (х°,Т — ¿°). Но поскольку коалиции объединены в технологический альянс, то в результате распределения прибыли на верхнем уровне каждая коалиция К; получает долю дохода, равную компоненте вектора Шепли (¿,х*м(г)), которая вычисляется по формуле (31). В силу индивидуальной рациональности вектора Шепли (¿,х*м(г)) ^ Ш(г°)к' (¿,х*к1 (г)), прибыль коалиции оказывается выше, чем при самостоятельном развитии. Следовательно, характеристическая функция V = Vк1 (К;, х*к (г), Т — г) будет равна выигрышу коалиции К; в игре ГЛ (х°, Т — ¿°), т. е. компоненте вектора Шепли:

Vк^ (К;,хК(г),Т — ¿Г = К (г,х*„(г)).

Вычисление значения характеристической функции для отдельной фирмы г € К;. Для одной фирмы г € К; характеристическая функция будет равна значению выигрыша в равновесии по Нэшу в игре ГК1 (х°,

Т — г°). Отметим, что

поскольку фирмы не влияют на развитие друг друга, не находясь в кооперации, то равновесие по Нэшу в данной игре переходит в задачу максимизации выигрыша каждой фирмы. Для того чтобы определить максимальный выигрыш фирмы, требуется решить систему задач оптимизации

Vк'(го) (г, хг$), Т — 1) = тах (Нг (хг(¿), Т — ¿, щ)) =

и

= тах / Нг (в, хг^),^^)) ехр [—т(в — ¿о)] + + ехр [—т(Т — ¿о)] Яг [хг(Т)]1/2) , г е К,.

При этом уравнение динамики фирмы г задается уравнением (1). Требуется найти функции Vк'(го) (г, хг(1), Т — t), которые удовлетворяют системе уравнений Беллмана:

^^ (г, хг(¿), Т — 1)= тах {Нг (¿, хг(¿), иг(¿)) ехр [—т$ — ¿о)] +

иг

+ (г, х^), Т — ¿) ¡г [хг(1), иг(*)]} ,

Vк1(го) (г, хг(Т), Т) = ехр [—т(Т — Яг [хг(Т)]т ,

Нг (^хг^щ^)) = [Рг[ххг(¿)]1/2 — сгщ(¿)

¡г [хг(¿), щЩ = а [иг(в)хг(в)]1/2 — 5хг(в). Проводя максимизацию по управлению иг, получаем выражение 2 2 4(сг)2 I г 1

Подставив его в (34) и решив новое уравнение в частных производных, имеем

(34)

Vк^(t0) (г,хг(¿), Т — 1)= [л{г}(1) [хг(1)]1/2 + С{г} ф] ехр [—т(1 — ¿о)]. (35)

Величины Л{г} (¿) и с « (^ являются решением дифференциальных уравнений

2

л{г}(Т )= яг, С{г} (Т ) = 0.

Легко убедиться, что выражение (35) совпадает с функцией Ш(г°)г (¿, хг(t)), определяющей максимальный гарантированный выигрыш фирмы в игре Г (хо,Т — ¿о) между фирмами, описанной в [2]. Вычислив формулы частных производных, получаем формулу оптимальной стратегии фирмы г

16(Сг)2

Л{г} (¿)

ге К,.

а2

2

Таким образом, оптимальная стратегия для фирмы % в игре Г А (х°, Т — ¿о) равна ее оптимальной стратегии в игре Г (х°, Т — ¿о).

Вычисление значения характеристической функции для произвольной коалиции Ь С К;. Определим теперь характеристическую функцию для произвольной коалиции Ь С К;. Функция УКг(гс) (Ь, хь^),Т — ¿) находится посредством решения следующей задачи оптимизации:

УКг (г с) (ь,хь(г),Т — г) = = тах(Нь (хь(¿),Т — г,иь(г))) =т&х\У1 Нг (х^),Т — ¿^¿(¿)) | =

иь иь \ *-'

\геь /

= тах I УЗ / к (8,х<(8),и<(8))вхр[—т(8 — ¿о)] + иь \геЬ г

+ Е ехр [—т(Т — ¿о)] Чг [хг (Т )]1/2 ) , Ь С К;.

геЬ )

Функция УКг(гс) (Ь,хь^),Т — ¿) удовлетворяет уравнению Беллмана

—УК(г с) (ь,хь(г),Т — ¿) =

= тах < УЗ Ы (г,хг(г),иг(г))ехр [—т(Ь — ¿о)] +

иь

иеь

+ ЕУХКг(гс) (Ь, хь(г), Т — г) / Ь [хь(г), иф] |, геь )

УКг(гс) (Ь, х%, Т) = ^3 ехр [—т(Т — ¿о)] Чг [хг(Т)]!

11/2

ехр [ ' (Т — ¿о)] Чг [хг (Т )

геь

кг (^хг^щ^)) = ЫхШ^2 — сгиг(¿)

/Ь [хь(1),щ(1)] = аг [иг(8)хг(8)]1/2 + ]Т Ь^^хз(8)хг(8)]1/2 — 6хг(8).

ЗеЬ, 3=г

Используя аналогичную технику, приведенную ранее, получаем

УКг(гс) (Ь,хь(Ь),Т — ¿)

ехр [—т(Ь — ¿о)].

^АЬ(^[хг (¿)]1/2 + Сь (¿)

еь

Величины Аь (¿) и СЬ(Ь) являются решением дифференциальных уравнений

/ л \ Ь-г 3

еь

AL(T) = qi, CL(T) = 0, i e L. Из уравнений выше находим формулы частных производных

VtKl{to) (L,XL(t),T —t) = ^

Y; A L(t)[xi(t)]1/2 + C L(t)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

.i€L

Y,AL(t) [Xi(t)]1/2 + CL(t) .i€L

exp [—r(t — to)],

(L, xL(t), T — t) = -Af(t) Mt)]-1/2 exp [-r{t - t0)].

Как легко убедиться, характеристическая функция VKl(to) (L,xl(P),T — t) совпадает в данном случае с функцией W(to)L (t,XL(t)), определяющей максимальный выигрыш коалиции L в игре фирм [2]. Таким образом, характеристическая функция в игре rKl (x0,T — to) имеет следующий вид:

0,

VKl(t0) (К,хк(t), T — t)

K (t,xN(t))

К =

,xN (t)) , K = Kh

W(t0)i (t,xi(t)), К = {i}eKh W(t0)L (t,xL(t)), К = L с Kl.

(36)

Супераддитивность функции Гк1 (х°,Т — ¿о) очевидным образом вытекает из супераддитивности функции Ш(г°)ь (¿^ъ^)) (теорема 2), а также из условия к (¿,х%(¿)) > Ш(го)к' (¿, х*к, (¿)).

Распределение прибыли в игре Гк1 (х° ,Т — ¿0). Определив характеристическую функцию в игре Гк1 (х°,Т — ¿0), введем процедуру распределения совместной прибыли. В качестве дележа полученной прибыли коалиции К, будем вновь прини-

(to,xK)},

iEKt

мать динамический вектор Шепли (¿о,хок^ =

Поскольку коалиция К, участвует в игре коалиций ГА {х°, Т — ¿о), то ее участники-коалиции будут максимизировать совместный выигрыш Ш(¿о^0^, используя набор оптимальных управлений {u*(t)}гeN, полученных по формуле (19), на промежутке [¿о,Т] и реализовывать соответствующие оптимальные траектории для случая К = Д.

В начальный момент времени ¿о доля кооперативной прибыли фирмы г е К, будет равна

,(t0 )Ki

(to,x°K,) = E

KÇK,

(k - l)\(h - k)\ h\

VKi(t0) (K,xK, T — to) —

— VKl(t0) (k\ i,xK\i,T — to)

Здесь кI = 1К,\ — число участников коалиции К,.

Вектор Шепли должен поддерживаться на протяжении всей игры. В момент времени t е [¿о,Т] в состоянии х*кг (¿) е хN(¿) для фирмы г е К, должен быть обеспечен соответствующий принцип распределения дележа:

v(t0)Kl (t,xK (t))

E

KÇK,

(к — l)!(fc; — k)\ Ы

VKl(to) (K, xK(t),T — t) —

r

— УКг^ (К\ г,х*К\(),Т — г)

Учитывая (36), можно переписать формулу для компонент вектора Шепли в следующем виде:

КСКг

1

(к — 1) ! (к; — к) !

к;

Ш(гс)К (Ь,хК(¿)) —

- (г,х*кхЩ + - [4? (г,х*К1(г)) - (г,х*кл&)

Для реализации динамического вектора Шепли необходимо в каждый момент времени выполнять перераспределение совместной! прибыли. Определим процедуру

распределения дележа [7], как функцию ВКг (¿) = | ВКг (¿) | , такую, что

(г0)Кг (¿о, х°Кг) =1 ВКг (8)ехр[—т(8 — ¿о)] 38 +ехр[—т(Т — ¿о)] Чг [х? (Т)]1/2 . (37)

г

Функция В^ г (8) представляет собой мгновенный платеж, получаемый фирмой % € К; в момент 8 € [¿о,Т]. Для того чтобы вектор Шепли поддерживался внутри коалиции, в каждый момент должно выполняться равенство

1

)Кг (¿,хК (¿)) = I ВКг (8)ехр[—т(8 — ¿о)] 38 + ехр[—т(Т — ¿о)] Чг [х? (Т)]1/2 . (38)

Из (37) и (38) получаем, что

)Кг (¿о, хК г) =/ВКг (8)ехр[—т(8 — ¿о)] 38 + )Кг (¿,х*к, (¿)) .

Формула ВКг (¿) определяется из производной компонента вектора Шепли (¿о,х<К^. Необходимо учитывать, что характеристическая функция УКгЫ (К;( хКг (¿),Т — ¿) равна компоненте вектора Шепли иК0 х*н(¿)) в игре коалиций ГА (хо,Т — ¿о), которая зависит от состояний всех участников разбиения Д. Следовательно, частные производные компонент V(гс)Кг (¿,хК1 (¿)) по состояниям фирм ] € К; будут отличаться от нуля.

В общем случае функция ВК (8) принимает вид

ВКг (8) = — Е

КСК

(к - !)!(&; - к)\ к\

(8,хК (8)) —

— Ш^К\г (^гЫ)] + Е К (8,хК (8))] [х^ (8),и* (8)] —

зек

Е

нек\г

Ш^К (8,хК\г (8^1 [х*К (8),<(8)] I +

V

г

V

(го) к,

jеN

г

,(г о) 'к,

(в,х% (в)) — ^ (в,хк ^г (в)) +

(в,хм(в)) [хм(в),и(в)] —

^ Е Г*^ \ [в,хк1 \г(в))] ¡^ [хк (в),<(в)]\ .

не^г )

Динамическая устойчивость технологического альянса коалиций. Для

доказательства динамической устойчивости построенного коалиционного решения необходимо показать, что в каждый момент происходит только перераспределение прибыли между всеми фирмами г е N, а общая сумма мгновенной прибыли остается неизменной, т. е. требуется доказать равенство

Е Е в? (в) =

к,сА гек,

= Е (в,х (в),и (в)) =Е Е [рг [х (в)]1/2 — сги*(в) . (39)

к,сА ге_к1 к, с А ге_к1

Ранее уже было установлено, что в каждый момент времени происходит перераспределение прибыли между коалициями-участниками игры ГА (х0 ,Т — tо). Следовательно, равенство (39) можно переписать следующим образом:

Е Е в?(в)= Е вк,(в)-

к, с А ге_к1 к, с А

Данное равенство очевидно, если показать, что ^ В?1 (в) = Вк, (в) для любой

гек, г ,

коалиции-участника К, С Д.

Суммируя компоненты Вгк, (в), легко установить, что

Т. в? (в

гек,

у (го)

(в,хк(в)) + Е

(го) к,

(в,х*к (в)) ¡? К (в),и* (в)] .

jеN

Правая часть этого равенства представляет собой полную производную ) (¿, x*N(¿)) по t с обратным знаком, которая по определению равна Вк1 (в). Таким образом, полученное коалиционное решение будет динамически устойчивым.

Численный пример. Приведем численные результаты на примере трех фирм. На множестве фирм N = {1, 2, 3} задано разбиение Д = {{1, 2}, {3}}, состоящее из двух коалиций. Заданы начальные параметры: ¿о =0; Т = 20; т = 0.1; 6 = 0.2; Р1 = 0.6; Р2 = 0.3; Р3 = 0.15; сг = 0.5; аг = 0.3; Ъ[]А = 0.05; яг = 0.1; г,з е N.

В табл. 1 представлены прибыли коалиций и их суммы в произвольно выбранные моменты времени до и после ее перераспределения. Значения прибылей до и после перераспределения различны, но сумма не меняется.

Таблица 1. Прибыли коалиций до и после перераспределения и их суммы

Х-;

1 ^{31 И Щ з>(*)

0 -0.04031 0.02488 -0.01543 -0.07842 0.06299 -0.01543

5 0.85579 0.09914 0.95493 0.81135 0.14358 0.95493

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10 1.51064 0.16949 1.68013 1.46475 0.21538 1.68013

В табл. 2 приведена прибыль фирм 1 и 2 в коалиции {1, 2} в произвольно выбранные моменты времени. В каждый момент сумма прибылей фирм равна прибыли коалиции.

Таблица 2. Прибыли фирм 1 и 2 в коалиции {1,2} и их сумма

t B^Ht) Br4t) + Br4t) £{1.2} W

0 -0.12022 0.04180 -0.07842 -0.07842

5 0.55274 0.25861 0.81135 0.81135

10 1.03134 0.43341 1.46475 1.46475

Заключение. В данной статье представлена модель двухуровневой кооперации в игре технологического альянса. Построено кооперативное решение и доказана его динамическая устойчивость. На каждом уровне кооперации построена своя процедура распределения прибыли. Результаты подтверждены численными примерами. Представленные выводы могут быть применены в экономике и менеджменте.

Литература

1. Костюнин С. Ю., Шевкопляс Е. В. Об упрощении интегрального выигрыша в дифференциальных играх со случайной продолжительностью // Вестн. С.-Петерб. ун-та. Сер. 10: Прикладная математика, информатика, процессы управления. 2011. Вып. 4. С. 47—56.

2. YeungD. W.K., PetrosyanL. A. Cooperative Stochastic Differential Games. New York: Springer, 2006. 253 p.

3. Петросян Л. А., Козловская Н. В., Ильина А. В. Коалиционное решение в задаче сокращения выбросов // Вестн. С.-Петерб. ун-та. Сер. 10: Прикладная математика, информатика, процессы управления. 2010. Вып. 2. С. 46-59.

4. Петросян Л. А., Седаков А. А., СюринА. Н. Многошаговые игры с коалиционной структурой // Вестн. С.-Петерб. ун-та. Сер. 10: Прикладная математика, информатика, процессы управления. 2006. Вып. 4. С. 97-110.

5. Денисов А. М., РазгулинА.В. Обыкновенные дифференциальные уравнения: пособие для студентов 2-го курса. М.: Изд-во Моск. ун-та, 2008. 70 с.

6. Petrosyan L. A., Zaccour G. Time-consistent Shapley value allocation of pollution cost reduction // Journal of economic dynamics and control. 2003. Vol. 27, N 3. P. 381-398.

7. Петросян Л. А. Устойчивость решений в дифференциальных играх со многими участниками // Вестн. Ленингр. ун-та. 1977. № 19. С. 46-52.

8. Зенкевич Н. А., Петросян Л. А. Проблема временной состоятельности кооперативных решений в менеджменте // Вестн. С.-Петерб. ун-та. Сер. 8: Менеджмент. 2007. Вып. 1. С. 7-42.

References

1. Kostyunin S. Y., Shevkoplyas E. V. Ob uproshhenii integral'nogo vyigrysha v differencial'nyh igrah so sluchajnoj prodolzhitel'nost'ju (On the simplification of the integral gain in differential games with random duration). Vestn. of St. Petersburg University. Serie 10: Applied mathematics, computer science, control processes, 2011, issue 4, pp. 47-56.

2. YeungD. W. K., Petrosyan L. A. Cooperative Stochastic Differential Games. New York: Springer, 2006, 253 p.

3. Petrosyan L. A., Kozlovskaya N.V., Ilyina A.V. Koalicionnoe reshenie v zadache sokrashhenija vybrosov (Coalition solution for the problem of reducing emissions). Vestn. of St. Petersburg University. Serie 10: Applied mathematics, computer science, control processes, 2010, issue 2, pp. 46-59.

4. Petrosyan L. A., Sedakov A. A., Syurin A. N. Mnogoshagovye igry s koalicionnoj strukturoj (Multistage games with coalition structure). Vestn. of St. Petersburg University. Serie 10: Applied mathematics, computer science, control processes, 2006, issue 4, pp. 97-110.

5. DenisovA. M., Razgulin A. V. Obyknovennye differencial'nye uravnenija (The ordinary differential equations). Handbook for 2nd year students. Moscow: Publisher Moscow University, 2008, 70 p.

6. Petrosyan L. A., Zaccour G. Time-consistent Shapley value allocation of pollution cost reduction. Journal of economic dynamics and control, 2003, vol. 27, no. 3, pp. 381-398.

7. Petrosyan L. A. Ustojchivost' reshenij v differencial'nyh igrah so mnogimi uchastnikami (Stability of solutions of differential games with many participants). Vestn. of St. Leningrad University, 1977, issue 19, pp. 46—52.

8. Zenkevich N.A, Petrosyan L. A. Problema vremennoj sostojatel'nosti kooperativnyh reshenij v menedzhmente (The problem of time consistency of cooperative solutions in management). Vestn. of St. Petersburg University. Serie 8: Management, 2007, issue 1, pp. 7—42.

Статья поступила в редакцию 1З ноября 2014 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.