Научная статья на тему 'Проблема временной состоятельности кооперативных решений в менеджменте'

Проблема временной состоятельности кооперативных решений в менеджменте Текст научной статьи по специальности «Математика»

CC BY
297
33
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Зенкевич Н. А., Петросян Л. А.

Долгосрочный менеджмент должен включать элементы кооперации или полную кооперацию принимающих управленческие решения субъектов. Наиболее подходящим инструментом для строгого количественного анализа и моделирования кооперации является математическая теория кооперативных динамических и дифференциальных игр. Теоретический анализ показывает, что принципы оптимальности классической кооперативной теории игр не являются динамически устойчивыми (состоятельными во времени), а поэтому неприменимыми при стратегическом управлении. В данной работе мы предлагаем методы построения динамически устойчивых решений в задачах стратегического менеджмента, стараясь сложные математические построения проводить на доступном широкой аудитории уровне.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Проблема временной состоятельности кооперативных решений в менеджменте»

2007 ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА

Сер. 8. Вып. 1

ОБЩИЙ И СТРАТЕГИЧЕСКИЙ МЕНЕДЖМЕНТ

Н. А. Зенкевич, Л. А. Петросян

ПРОБЛЕМА ВРЕМЕННОЙ СОСТОЯТЕЛЬНОСТИ КООПЕРАТИВНЫХ РЕШЕНИЙ В МЕНЕДЖМЕНТЕ

Долгосрочный менеджмент должен включать элементы кооперации или полную кооперацию принимающих управленческие решения субъектов. Наиболее подходящим инструментом для строгого количественного анализа и моделирования кооперации является математическая теория кооперативных динамических и дифференциальных игр. Теоретический анализ показывает, что принципы оптимальности классической кооперативной теории игр не являются динамически устойчивыми (состоятельными во времени), а поэтому неприменимыми при стратегическом управлении. В данной работе мы предлагаем методы построения динамически устойчивых решений в задачах стратегического менеджмента, стараясь сложные математические построения проводить на доступном широкой аудитории уровне.

введение

Для оценки качества менеджмента и выработки методологии его улучшения используются методы математического и компьютерного моделирования.

В том случае, если управленческие решения принимаются одним лицом и их результат не зависит от действий других сторон, в качестве аппарата математического моделирования может быть с успехом использована теория оптимального управления и оптимизации. В то же время в подавляющем большинстве случаев, даже когда можно условно предположить осуществление менеджмента одним лицом, нельзя гарантировать, что его результат не будет зависеть от действий других сторон или лиц, так или иначе заинтересованных в результатах этого менеджмента. Поэтому необходимо учитывать наличие несовпадающих, а в ряде случаев и конфликтующих интересов у сторон, заинтересованных в результатах менеджмента.

© Н. А. Зенкевич, Л. А. Петросян, 2007

Игнорирование этого обстоятельства может привести, и в действительности приводит, к невозможности полной реализации управленческих решений, а следовательно, к недостижению результатов, на которые эти управленческие решения были направлены. Поэтому при попытках моделирования подобных ситуаций пользуются методами и подходами теории игр [Neumann, von Morgenstern, 1944]. Однако подавляющее большинство исследований в области теории игр касается так называемых однократных, или мгновенных, игр, в которых конфликт между сторонами происходит мгновенно и совершенно не учитывается временной фактор. В то же время реальные процессы принятия решений происходят на достаточно большом временном интервале, где приходится в каждый текущий момент времени учитывать результаты предыдущих решений и только на этой основе вырабатывать соответствующее управление. Именно поэтому констатируется, что подходящими математическими моделями подобных процессов могут быть динамические и дифференциальные игры, которые, с одной стороны, учитывают конфликтность процесса принятия решений, а с другой — необходимость его моделирования на достаточно продолжительном временном интервале.

На практике долгосрочные управленческие решения вырабатываются на основе ограничений и предпочтений, выявляемых на всех уровнях системы управления. В результате из большого числа возможных вариантов на базе некоторого трудно формализуемого алгоритма выбирается одно единственное решение, подлежащее дальнейшей реализации. Этот плохо формализуемый и трудно улавливаемый алгоритм выбора по существу является реализацией установившегося в данной системе менеджмента принципа оптимальности, осмысление и научный анализ которого иногда может привести к обескураживающим выводам. Здесь мы сталкиваемся с интересной проблемой — восстановлением принципа оптимальности, лежащего в основе принятия решений по наборам конкретно выработанных решений. Независимо от того, в какой степени мы сумеем продвинуться в реализации этой задачи, сам факт наличия такого принципа оптимальности не вызывает сомнения. В то же время особенности последнего можно наблюдать и без проведения глубокого исследования. Отметим два, на наш взгляд, наиболее важных свойства, оказывающих влияние на принятие долгосрочных решений (долгосрочный менеджмент). Первое — необходимость проверки качества принимаемого решения по нескольким критериям. Второе — неодинаковая оценка качества решения различными сторонами, участвующими в его выработке. Это наводит на мысль о том, что неуловимый принцип оптимальности, лежащий в основе выбора решения, имеет теоретико-игровой, конфликтный характер, поскольку так же, как и в теоретико-игровых моделях, здесь имеется несколько сторон, влияющих

на принятие решения, в соответствии со своими, не обязательно совпадающими интересами.

Процессы принятия и реализации решения различными субъектами в современных условиях оказываются в значительной степени взаимосвязанными, поэтому с точки зрения современного менеджмента исключительно важно осознать и реально использовать данное обстоятельство. Стратегический аспект принятия решений особенно важен в таких областях, как торговые переговоры, иностранные и национальные инвестиции, международный контроль за состоянием окружающей среды, интеграция и развитие рынков, технологические и продуктовые исследования и разработки, маркетинг, региональная кооперация, политика в области обороны и контроль над вооружениями.

Как отмечалось, при моделировании конфликтно-управляемых процессов в социально-экономической сфере и менеджменте наиболее реалистичными являются математические модели, базирующиеся на теории динамических и дифференциальных игр. Теория дифференциальных игр возникла в 1950-е гг. Основополагающей работой в этой области считается монография Р. Айзекса «Дифференциальные игры», вышедшая в свет в 1965 г. [Isaacs, 1965]. Первые отечественные работы появились также в 1965 г. [Красовский, 1966; Петросян, 1965; Понтрягин, 1966]. Однако до середины 1960-х гг. исследовались лишь антагонистические дифференциальные игры, моделирующие конфликт между двумя сторонами, имеющими прямо противоположные интересы. Понятно, что такие игры могли иметь приложения лишь в ограниченном классе задач, возникающих при военном столкновении сторон (перехват летательных аппаратов, обнаружение и уничтожение подводных подвижных объектов, оптимизация распределения ресурсов при локальных военных столкновениях и т. п.).

Для моделирования социально-экономических процессов необходимо было разработать теорию неантагонистических дифференциальных игр. Первые работы в этой области появились в конце 60-х гг. прошлого века [Петросян, Мурзов, 1967; Case, 1967; Starr, Ho, 1969a; 1969b]. В них исследовались неантагонистические некооперативные дифференциальные игры со многими участниками, и поэтому в качестве принципа оптимальности использовалось равновесие по Нэшу. В последующих трудах полученные результаты применялись для анализа различных задач социально-экономического характера (см.: [Haurie, Krawczyk, Roche, 1994; Jorgensen, 1985; Jorgensen, Sorger, 1990; Jorgensen, Zaccour, 2001; 2002; Kaitala, 1993; Sorger, 1989; Yeung, 1992; 1994] и др).

Однако в указанных работах не рассматривалась возможность кооперации участников конфликтно-управляемого процесса с целью достижения более высоких показателей. И хотя статическая (мгновенная) теория таких

игр была хорошо развита, динамическому аспекту кооперативного поведения не было уделено должного внимания. Теория кооперативных игр дает возможность выработки социально-оптимальных коалиционно-эффективных решений в задачах, включающих стратегически обусловленные действия. Формализация условий кооперации и связанного с этим оптимального поведения участников конфликтно-управляемого процесса (игроков) является фундаментальным элементом этой теории. Однако для сохранения кооперации и принятых соглашений требуется выполнение более жесткого условия: в процессе реализации решения принцип оптимальности, на основе которого вырабатывалось первоначальное решение, должен оставаться состоятельным в течение всего игрового процесса (генерировать в определенном смысле адекватные решения в текущих подзадачах), т. е. в каждый момент времени вдоль определенной заранее оптимальной траектории процесса. Это условие носит название «динамической устойчивости» или «состоятельности во времени». Иными словами, свойство динамической устойчивости решения (состоятельности во времени или временной состоятельности) кооперативной динамической игры означает, что, когда игра развивается вдоль кооперативной траектории, игроки следуют одному и тому же принципу оптимальности в каждый момент времени (в каждой подзадаче с начальными условиями на этой оптимальной траектории) и поэтому не имеют побуждения отклониться от первоначально выбранного оптимального решения в течение всей игры.

При исследовании кооперативных дифференциальных игр в конце 1970-х гг. нами было обнаружено и математически строго доказано, что если специальным образом не производить регуляризацию принципа оптимальности, то выбранное в начале процесса «оптимальное решение» в ходе его реализации почти всегда теряет свою «оптимальность» и поэтому не может оставаться основополагающим принципом дальнейшего развития. Данное явление имеет место даже без каких-либо внешних воздействий или изменения интереса участников. Это и есть нарушение динамической устойчивости или временной состоятельности. Несколько позже это обстоятельство было обнаружено при решении одной специальной задачи зарубежными авторами Ф. Кидландом и Е. Прескоттом [КуШап^ РгезсоМ, 1977], получившими Нобелевскую премию в области экономики в 2004 г.

Таким образом, для сохранения оптимальности долгосрочного кооперативного решения в процессе реализации необходимо, чтобы заложенный при его выработке принцип оптимальности обладал свойством динамической устойчивости (временной состоятельности), хотя это может происходить лишь в вырожденных случаях. Нарушение временной состоятельности рано или поздно приводит к ревизии стратегий менеджмента, колоссальным материальным и моральным потерям. И здесь возникает

опасность оказаться в порочном кругу. Для определения того, является выбранный принцип оптимальности состоятельным во времени или нет (если нет, то нами предлагаются методы его регуляризации, приводящие к состоятельному принципу оптимальности), необходимо его точное математическое описание. Однако при существующих схемах принятия решений сделать это практически невозможно.

Динамическая устойчивость (временная состоятельность) принципов оптимальности в дифференциальных играх подробно исследовалась в работах специалистов по теории игр. А. Ори [Haurie, 1976] заметил временную несостоятельность арбитражной схемы Нэша при ее использовании в качестве принципа оптимальности в дифференциальной игре. Л. А. Петросян [Петросян, 1977; 1978] математически формализовал понятие динамической устойчивости, ввел «понятие процедуры распределения дележа» для кооперативных решений [Петросян, Данилов, 1979; 1985]. Впервые в журнальной литературе термин «динамическая устойчивость» появился в работе С. В. Чистякова [Чистяков, 1981]. Этим же автором практически одновременно с Л. А. Петросяном была сформулирована проблема сильной динамической устойчивости [Чистяков, 1992]. В [Tolwinski, Haurie, Leitmann, 1986] исследовано кооперативное равновесие в дифференциальных играх, когда система угроз обеспечивает развитие игры по кооперативному пути. В дальнейшем в работах [Petrosjan, 1993; 2003; Petrosjan, Zenkevich, 1996; Zenkevich, 2001] был проведен подробный анализ динамической устойчивости в кооперативных дифференциальных играх и предложен метод регуляризации для построения динамически устойчивых решений.

определение кооперативного решения

Вполне логично начать изложение содержания работы с определения базовых понятий, в том числе понятия кооперативного решения. Поскольку речь идет о менеджменте, то целесообразно рассмотрение неантагонистических конфликтов, соответствующих им моделей и решений.

В широком смысле под кооперативным решением мы понимаем решение нескольких участников (сторон, лиц, игроков), объединенных необходимостью или желанием принятия решения по актуальной проблеме, требующее согласования их интересов и закрепленное соглашением. Таким образом, в широком смысле речь идет фактически о любом согласованном решении заинтересованных сторон. Заметим, что рассматриваемая проблема временной состоятельности относится к долгосрочному решению именно в таком широком контексте.

Проблемы принятия кооперативных решений возникают в различных областях менеджмента и теории менеджмента. В первую очередь отметим

проблему подписания контракта как результата согласования интересов сторон. В стратегическом менеджменте — это, например, соглашения по слиянию или поглощению, по образованию стратегических альянсов и другие типы соглашений по межфирменной кооперации. На уровне фирмы — долгосрочные соглашения между собственниками и менеджерами о распределении прибыли. В финансовом менеджменте — инвестиционные решения. Можно привести и много других примеров. При этом кооперативные решения могут быть в форме юридического контракта или соглашения, законные и незаконные, с явными или тайными целями. Возможны и более сложные варианты кооперативного соглашения.

При анализе и принятии кооперативного решения обычно рассматривается несколько аспектов. Во-первых, какая имеется у заинтересованных сторон мотивация для принятия согласованного решения? Если таковая существует, то является ли она достаточной? Часто в роли такой мотивации выступают категории выгодности и справедливости согласованного решения. Во-вторых, какое согласованное решение следует выбрать в качестве оптимального (каков будет принцип оптимальности)? Как выбрать оптимальное решение (каков механизм выбора решения)? В-третьих, как реализовать процесс выполнения решения во времени для достижения результатов кооперации? В этой связи вызывает интерес поведение кооперативного решения во времени (в ходе его реализации), поэтому ключевым является последний из рассмотренных аспектов проблемы принятия решений.

Кооперативные решения в широком смысле делятся на статические и динамические. В первом случае решение принимается один раз, мгновенно реализуется, и игроки сразу получают выигрыш от его реализации. Несмотря на кажущуюся простоту данного подхода, классическая теория игр занимается в основном изучением именно таких моделей. Однако менеджмент и теория менеджмента имеют дело с управлением, а значит — с процессами (в нашем случае — с конфликтными процессами). Тем не менее для понимания концепции кооперативного решения мы традиционно начнем рассмотрение со статической модели игры.

Под игрой п лиц в нормальной форме понимается модель Г следующего вида:

где N = {1, ..., п} — множество игроков, V' — множество стратегий, и' е V — стратегия, (и1, ..., ип) — функция выигрыша игрока г е N. Что же подразумевается под решением игры Г? Ответ на поставленный вопрос дают концепции (принципы) оптимальности, сформулированные в определениях. Во всех случаях под решением следует понимать

некоторый набор стратегий (u1, ..., un) всех игроков, удовлетворяющий требуемому свойству оптимальности. Наиболее распространенной концепцией оптимальности игры многих лиц является равновесие по Нэшу.

Определение 1. Набор стратегий (и1, ..., Un) называется равновесием по Нэшу [Nash, 1951], если следующие неравенства выполняются для всех стратегий ui е U и всех игроков i е N:

Kt(й. ..., щ, щ. ui+1. ..., un) > Kt(Mj, ..., щ, ut, Mt+1, ..., un).

Равновесие по Нэшу (NE-решение) является кооперативным решением в широком смысле, поскольку выбор такого решения требует согласованного поведения игроков. Действительно, NE-решение представляет собой набор стратегий, удовлетворяющий указанной системе неравенств. Поэтому игроки, по крайней мере, должны договориться, что они будут придерживаться именно такого способа поведения. Последнее обстоятельство особенно важно, если в игре имеется несколько NE-решений. В этом случае игрокам необходимо оговорить и то, какое равновесие они будут реализо-вывать.

Определение 2. Набор стратегий (й1, ..., un) называется оптимальным по Парето, если не существует другого набора стратегий (u1, ..., un), для которого следующие неравенства выполняются для всех i е N:

Ki (ui, ..., ui, ..., un) > Ki (uui, ..., u , ..., Un)

и хотя бы для одного j е N оно выполняется строго:

Kj (щ, ..., uj, ..., un) > Kj (¿<1,..., u},..., un).

Оптимальное по Парето решение (PO-решение) является кооперативным в широком смысле, поскольку его принятие требует согласованного выбора стратегий всеми игроками и обладает свойством групповой рациональности при стратегическом поведении игроков. Концепция оптимальности по Парето применима для игр как с трансферабельными, так и с нетрансфера-бельными выигрышами (такие выигрыши игроки не могут передавать друг другу).

Характерным представителем оптимального по Парето решения является арбитражное решение Нэша (u[, ..., un) [Nash, 1950]:

max П[[(u. .... un) _ K0] = П[[(ui,..., u'n) _ K0]

"i'...' "" i=1 i=1

при ограничениях:

Ki(u, ..., un) > K0, i е N.

Здесь (м0, ..., м0) — некоторое заданное «эталонное решение», определяющее точку «статус-кво» К0 = (К0, ..., КО, ..., К0), К? = К{(м?, ..., мП), г е N. Арбитражное решение Нэша ^Е-решение) является кооперативным в широком смысле, поскольку представляет собой частный случай оптимального по Парето решения.

При заданной арбитражной схеме в задаче можно реализовать практически любое парето-оптимальное решение за счет выбора точки «статус-кво». Таким образом, арбитражная схема регламентирует лишь механизм (правила), на основе которого предполагается выбрать оптимальное решение.

Все указанные выше принципы оптимальности являются стратегическими в том смысле, что построены на основе согласованного или совместного выбора стратегий игроками.

Рассмотрим теперь понятие кооперативного решения в узком смысле. Такая концепция кооперативного решения предполагает двойную кооперацию: по совместному выбору стратегий и дележу общего выигрыша от кооперации.

Напомним, что под кооперативной игрой в форме характеристической функции понимается модель Гу вида:

Г V = ^, V),

где N = {1, ..., п} — множество игроков, V(5) > 0, 5 с N V(0) = 0 — характеристическая функция, обладающая свойством супераддитивности:

V(5 и Т) > V(5) + V(Т), 5 п Т = 0.

Значение характеристической функции v(S) часто интерпретируется как максимальный гарантированный выигрыш коалиции 5 с N. Из свойства супераддитивности характеристической функции следует, что V(5) > V(5') для Б' с 5 с N. Поэтому игрокам выгодно создавать максимальную коалицию N для получения максимально возможного суммарного выигрыша v(N) в процессе игры.

Пусть Гу — кооперативная игра, построенная на структуре игры Г (с трансферабельными выигрышами), в которой игроки действуют в соответствии с некоторым заранее принятым принципом оптимальности [Пет-росян, Зенкевич, Семина, 1998]. Тогда, как было отмечено ранее, величина v(S) понимается в качестве максимального гарантированного выигрыша коалиции 5, т. е. максимального выигрыша коалиции 5 в случае, когда оставшиеся игроки образуют коалицию N / 5 для игры против этой коалиции 5.

Соглашение о том, как следует осуществлять кооперацию и делить полученный в результате кооперативный выигрыш, и представляет принцип

оптимальности решения кооперативной игры. В частности, решением для кооперативной игры Г является:

♦ соглашение о множестве кооперативных стратегий, направленных на получение максимального выигрыша от кооперации;

♦ механизм распределения общего максимального выигрыша между игроками.

Множество всевозможных распределений максимального суммарного выигрыша называется множеством дележей. Обозначим через выигрыш игрока г е N при кооперации, если общий выигрыш от кооперации равен v(N).

Вектор (распределение суммарного выигрыша) ^ = (^, ^2, ..., ^п) называется дележом в игре Г , если выполняются условия:

(а) ^. > V({}), г е N, *

(б) = V(N).

геЫ

В этом определении условие (а) гарантирует индивидуальную рациональность дележа в том смысле, что каждый игрок получает, по меньшей мере, такой же выигрыш, который он или она получит, играя против всех остальных игроков. Условие (б) гарантирует парето-оптимальность дележа, а поэтому и групповую рациональность.

Обозначим множество дележей в игре Г* через Е. Под кооперативным принципом оптимальности № в игре Г* понимается правило, по которому каждой игре Г* ставится в соответствие некоторое подмножество ^ с Е* из множества дележей, т. е. механизм распределения суммарного выигрыша от кооперации. Если принцип оптимальности ^ выбран, то дележ ^ = (^, ^2, ..., ) е называется оптимальным в соответствии с данным принципом оптимальности № . Это и есть определение кооперативного решения в узком смысле.

Приведем некоторые широко известные определения кооперативных решений.

Определение 3. Будем говорить, что дележ ^ = (^, ^2, ..., ^п) принадлежит ядру игры Г*, если для каждой коалиции 5 с N выполняется следующее условие:

> V(Б).

геБ

Множество всех дележей из ядра обозначается С*. Смысл кооперативного решения из ядра понятен: если выбран в качестве оптимального дележ из ядра, то при таком дележе каждая коалиция получает не меньший выигрыш от кооперации, чем она может получить самостоятельно.

Определение 4. Дележ Ф = (Фх, ..., Фi, ..., Фn) называется вектором Шепли [Shapley, 1953], если он определяется по формуле:

ф?= Z (" _s"(S _1)![v(S)_V(S\i)], i =1, ".

S с N (ieS)

Существуют и другие признанные концепции кооперативных принципов оптимальности, например, решение по Нейману-Моргенштерну, N-ядро. Все нижеперечисленные принципы оптимальности определяют кооперативные решения в узком смысле.

проблема временной состоятельности

В предыдущем разделе мы рассмотрели статические концепции кооперативного решения. Однако менеджмент имеет дело с управлением, а поэтому с процессами (в нашем случае — конфликтными). Управление выбирается в начальный момент и реализуется в течение некоторого временного промежутка. Мы намерены показать, что в динамике кооперативное решение должно обладать обязательным свойством, называемым динамической устойчивостью или временной состоятельностью (time-consistency).

Под свойством динамической устойчивости (временной состоятельности) кооперативного решения будем понимать свойство сохранения оптимальности в каждой подзадаче с начальными условиями на оптимальной траектории, построенной в начальный момент.

Поясним на стилизованных модельных примерах концепцию «динамической устойчивости» (временной состоятельности) принципа оптимальности.

Динамическая устойчивость решения задачи оптимального управления.

Пример 1. Совместное производство автомобильных двигателей [Гар-ретт, Дюссон, 2002, с. 54-56]. В 1971 г. компании Peugeot, Renault и Volvo договорились о создании альянса PRV с целью производства шестицилиндровых двигателей V6. С этой целью было решено создать совместное предприятие, которое являлось бы совместным филиалом каждой из компаний. После образования совместного предприятия и запуска в производство двигателей V6 каждый из партнеров альянса запустил в серийное производство свой автомобиль, который являлся прямым конкурентом автомобилям высокого класса других партеров. Несмотря на это, альянс стал успешным, было создано мощное совместное производство двигателей.

Попробуем прояснить причины успешности альянса. Мы имеем дело с интеграционным альянсом конкурирующих фирм, и поэтому фирмы-партнеры являются фирмами-конкурентами. Однако ни одна из фирм

не располагала достаточно большим рынком сбыта автомобилей высокого класса, укомплектованных такими двигателями. Кроме того, ни одна из них не была в состоянии самостоятельно производить двигатель, а закупать его у сторонней фирмы было невыгодно в связи с высокими с трансакционны-ми затратами и риском попасть в зависимость от поставщика.

Приведенный анализ показывает, что, несмотря на конфликтный характер проблемы, задача создания и функционирования совместного предприятия в данном случае может рассматриваться как задача оптимального управления.

Пусть точка М е Яп определяет некоторое идеальное состояние системы (в нашем примере — состояние совместного предприятия). Рассмотрим классическую задачу теории управления. Пусть задана управляемая система дифференциальных уравнений:

X(г) = /(х(г), и(г)), X е Яп, и е и с Я1,

(1)

хОо) = х0, г е , Т],

где вектор х(г) описывает состояние системы, вектор и(г) — управление, выбираемое в каждый момент времени г.

Процесс происходит на конечном интервале времени [г0, Т]. Целью управления является перевод точки х0 (состояние системы в начальный момент времени г0) в некоторое состояние х(Т) (в момент окончания процесса Т), при котором достигается минимум расстояния р(х(Т), М) до некоторой фиксированной точки М е Я".

Таким образом, математически задачу можно сформулировать так: найти такое управление й(£), £ е [£0, Т], которое переводит точку х0 в точку х (Т) в силу системы (1), наиболее близко расположенную к точке М.

Построим множество С(х0, Т — г0), называемое множеством достижимости системы (1). Это множество тех точек х(Т), в которое может перейти система из х0 в точности в момент времени Т, в соответствии с некоторым выбранным правилом управления м(£), £ е [£0, Т]. Понятно, что при различных правилах управления (управляющих функциях, или «программных стратегиях») и(г) точки х(Т) будут различны.

Обозначим также задачу минимизации расстояния р(х(Т), М) через Г(х0, Т — г0), подчеркивая ее зависимость от начального состояния х0 и времени процесса Т - г0.

Предположим для простоты, что точка М не принадлежит С(х0, Т — г0), т. е. М п С(х0, Т — г0) = 0. Это означает, что достижение точки М за время Т - г0 из состояния х0 невозможно. Принципом оптимальности в данной задаче является минимизация расстояния между точкой х(Т) и точкой М.

Очевидно, что «оптимальное движение» или «оптимальная траектория» должна переводить точку x0 в точку M' (х(t0) = 10, х(T) = M'), наиболее близко расположенную в множестве C(x0, T — 10) от точки M. Обозначим через х (t) траекторию, соединяющую x0 с M', реализованную при каком-то фиксированном (оптимальном) программном управлении U(t):

х = f (x(t), U(t)), x(t0) = x0, x(T) = M'.

Пусть процесс развивается вдоль оптимальной траектории x(t), как это показано на рис. 1. Рассмотрим некоторый промежуточный момент т [t0, T]. Пусть мы пожелали в этот момент проверить: будет ли точка M' оставаться ближайшей к M в подзадаче Г(x(T), T — т) с начальным условием x(т) на оптимальной траектории и продолжительностью T - т? Совершенно очевидно, что ответ — положительный, т. е. можно утверждать, что продолжение движения вдоль х (t) при t > т будет оптимальным движением в подзадаче Г(х(т), T — т) (рис. 1). Это и означает динамическую устойчивость или временную состоятельность оптимальной траектории x(t). Этот принцип был впервые сформулирован Р. Беллманом в 1957 г. [Bellman, 1957] и лег в основу теории динамического программирования. Он практически всегда выполняется в однокритериальных классических задачах оптимального управления.

Заметим, что в рассматриваемом случае имеет место и более сильное условие (кстати, не замеченное Р. Беллманом). В задаче Г(х(т), T — т) могут возникнуть и другое программное управление u(t), t е [т, T), U(t) Ф U(t), и соответствующая траектория x(t), переводящая точку x (т) в M' и, следовательно, также оптимальное в подзадаче Г(^(т), T — т). Интересно заметить, что управление вида

Гм(t), t е [t0, т) и(t) = <

[и(t), t е [т, T]

переводит точку x0 в M' в задаче r(x0, T - t0), т. е. также является оптимальным в задаче r(x0, T - t0).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таким образом, оказывается, что любое оптимальное продолжение в подзадаче Г(х(т), T — т) вместе с начальным оптимальным движением на отрезке [t0, т) в задаче r(x0, T - t0) будет оптимальным в исходной задаче r(x0, T - t0). Это свойство называется сильной динамической устойчивостью управления.

Пример 1. Выводы. Если говорить о совместном производстве автомобилей в примере 1, то мы склонны утверждать, что именно динамическая устойчивость кооперативного решения по образованию альянса (при усло-

вии выполнения других предположений кейса) является ключевой причиной его успешности.

К сожалению, условие сильной динамической устойчивости перестает выполняться при рассмотрении более сложных задач оптимизации. Это имеет место в случае многокритериальной оптимизации.

Временная состоятельность парето-оптнмального решения в задаче многокритериального оптимального управления. Когда мы говорим о проблемах временной состоятельности кооперативного решения между конкурирующими игроками, следует анализировать результаты не только кооперации, но и каждого игрока в отдельности. Заметим, что подобные проблемы учета взаимоотношений между соперничеством и сотрудничеством имеют место и при кооперативных решениях конкурирующих фирм по образованию стратегического альянса, при этом альянс может охватывать как отдельный этап производства, так и целый ряд этапов изготовления продукции на партнерских предприятиях и поставлять на

рынок совместно произведенную продукцию. Понятно, что в ходе реализации кооперативного проекта у партнеров остаются свои личные интересы.

Пример 2. Совместное производство самолетов [Гарретт, Дюссон, 2002, с. 263-274]. Зададимся вопросом, что произошло бы с альянсом PRV, если бы каждый из его участников имел свой взгляд на двигатель V6 и стремился достичь своего результата в ходе процесса кооперации? В этом случае проблема создания совместного предприятия может быть сформулирована как задача многокритериального управления.

Аналогичная ситуация происходит, когда создается совместное предприятие с целью поставки на рынок совместно произведенной продукции. Проиллюстрируем это на примере организации Объединения экономических интересов (ОЭИ) Airbus Industrie, созданного в 1970 г. с целью координации деятельности партнеров в рамках программы сотрудничества по созданию и реализации произведенных самолетов. ОЭИ завершило образование концерна Airbus. В состав концерна Airbus вошли четыре партнера со следующим распределением акционерного капитала: компания Aerospatiale — 37,9%, компания DASA — 37,9, английский концерн British Aerospace — 20, испанская компания CASA — 4,2%. За четверть века своего существования (1969-1994 гг.) компании Airbus удалось продать более 1800 самолетов общей стоимостью 80 млрд долл.

Несомненно, это пример успешной работы по реализации кооперативного решения. Таких результатов удалось достичь за счет разделения ответственности за производство исследовательских и конструкторских работ между участниками проекта (без дублирования), а также четкой их специализации при производстве самолетов. Вместе с тем коммерческие операции концерна по маркетингу, продаже и обслуживанию самолетов были поручены ОЭИ Airbus Industrie, которое является единственным средством связи партнерской команды с рынком. Проблема создания и работы ОЭИ Airbus Industrie может быть исследована в рамках модели многокритериального управления.

Пусть задана управляемая система дифференциальных уравнений (1). Процесс происходит на конечном интервале времени [t0, T]. По сравнению с предыдущим случаем каждый из участников I стремится к тому, чтобы достичь своей целевой точки M. Целью кооперативного управления является перевод точки x0 в некоторое состояние x(T), при котором минимизируется расстояние до точек M1, ..., Mk, т. е. задача заключается в нахождении минимума векторного критерия:

[p(x(T), M,), ..., p(x(T), Mг), ..., p(x(T), Mк)], где M;е Rn, I = 1, 2, ..., k. 20

Математически задачу можно сформулировать так: найти такое управление м(0, которое переводит точку х0 в х(Т) в силу системы (1), наиболее близко расположенную к системе точек М, ..., Мк.

Поскольку данная задача является задачей многокритериального оптимального управления, то в качестве принципа оптимальности естественно рассматривать множество оптимальных по Парето решений.

Пусть, как и раньше, множество С(х0, Т - £0) есть множество достижимости системы (1), и обозначим через Г(х0, Т - £0) нашу задачу многокритериального оптимального управления, подчеркивая в этом обозначении зависимость от начального состояния х0 и времени процесса Т - £0.

Обозначим через М выпуклую оболочку точек М1, ..., Мк. Предположим для простоты, что:

М п С(х0, Т — ) = 0.

При условии выпуклости множества достижимости можно показать, что множество оптимальных по Парето управлений в этой задаче состоит из программных управлений м(£), переводящих точку х0 в некоторую точку М', принадлежащую проекции множества М на множество С(х0, Т - £0) [Петросян, Захаров, 1997].

Обозначим через х(?) траекторию, соединяющую х0 с некоторой точкой М', принадлежащей проекции М на С(х0, Т - £0), и пусть м(?) — соответствующее программное управление.

Траекторию х(£) назовем оптимальной траекторией. Понятно, что данная задача может иметь бесконечное число оптимальных траекторий, поскольку проекция множества М на множество С(х0, Т - £0), в общем случае, представляет собой замкнутое множество, содержащее более одной точки.

Рассмотрим некоторый промежуточный момент времени те [£0, Т]. Пусть мы пожелаем в этот момент проверить: будет ли точка М' концом оптимальной по Парето траектории в подзадаче Г(х(т), Т — т) с начальным условием х(т) на оптимальной траектории и продолжительностью Т - т?

Как и в задаче оптимального управления, ответ положительный, т. е. можно утверждать, что продолжение движения вдоль траектории х(£) при £ > т будет оптимальным движением в подзадаче Г(х(т), Т — т). Это и означает динамическую устойчивость (временную состоятельность) оптимальной по Парето траектории х (£).

В то же время, как видно из рис. 2, само парето-оптимальное множество программных управлений и соответствующие им траектории в подзадаче Г(х(т), Т — т) отличаются от парето-оптимального множества в задаче Г(х0, Т - £0), поскольку множество концов оптимальных по Парето траекто-

рий в задаче Г(х0, Т - г0) совпадает с дугой АВ, а множество концов парето-оптимальных траекторий в задаче Г(х(т), Т — т) — с дугой А'В', которая является проекцией множества ММ на множество С(х (т), Т — т).

Мл

А'

ССх(х), Т-х).

\В'

\М"

*М'

чМ,

В

Рис. 2. Нарушение сильной динамической устойчивости парето-оптимального

решения

В общем случае множества АВ и А'В' имеют одну общую точку М. Поэтому мы видим, что в подзадаче Г(х (т), Т — т) возникают новые оптимальные по Парето траектории, переводящие точку х(т) в силу системы (1) в одну из точек М' дуги А'В', не совпадающей с точкой М'. Рассмотрим следующее программное управление:

и (г) =

и (г), г е [г0, т), и (г), г е [т, т ],

где и (г) — оптимальное по Парето программное управление, переводящее точку х (т) в силу системы (1) в точку М' на отрезке времени [1, Т].

Поскольку точка M' не принадлежит дуге AB, постольку программное управление U(t) не является парето-оптимальным в первоначальной задаче

П*0, Т - t0).

Таким образом, мы приходим к выводу, что в задачах многокритериального управления не всякое оптимальное продолжение движения в подзадачах с начальными условиями на оптимальной траектории первоначально поставленной задачи Г(х0, Т - t0) является парето-оптимальным в этой задаче. Это и означает нарушение сильной динамической устойчивости или сильной состоятельности во времени парето-оптимальных решений в задачах многокритериального управления.

При переходе от однокритериальных задач оптимального управления к многокритериальным мы сталкиваемся с потерей сильной динамической устойчивости принципов оптимальности.

Само по себе это обстоятельство делает весьма проблематичной реализацию на практике принципа оптимальности в подобных задачах, поскольку в промежуточные моменты времени возникает возможность пересмотра первоначально выбранного решения с заменой его на оптимальное в таком же смысле решение, однако общее развитие процесса при этом оказывается неоптимальным в первоначальном смысле. Данное обстоятельство порождает естественную неуверенность у лица, принимающего управленческое решение, в выполнении первоначально задуманных планов и проектов.

Временная несостоятельность кооперативного решения, построенного на механизме выбора конкретного парето-оптимального решения. Теоретико-игровой анализ. Значительно более неприятной оказывается ситуация с выбором конкретного парето-оптимального решения. Большинство принципов оптимальности (пусть даже в неигровых задачах), регламентирующих выбор конкретного парето-оптимального решения из множества всех парето-оптимальных решений, не являются не только сильно динамически устойчивыми (сильно состоятельными во времени), но и просто динамически устойчивыми (состоятельными во времени).

Пример 3. Проект «Сахалин-2». Важной формой международных стратегических альянсов в российском нефтегазовом комплексе (НГК) являются международные консорциумы по разработке и реализации проектов на основании соглашений о разделе продукции (СРП). Так в консорциуме по СРП «Сахалин-2» представлены только три иностранные ТНК, имеющие свои доли в его акционерном капитале: Royal Dutch/Shell — 55%, Mitsui — 25, Mitsubishi — 20%, которые осуществляют финансирование проекта за счет собственных средств [Эксперт, 2003].

Общий доход российской стороны, согласно схеме раздела продукции, складывается из платы за пользования недрами («роялти»), доли государ-

ства от прибыльных углеводородов, налога на прибыль инвестора, бонусов и других платежей.

«Газпром» заинтересован в участии в проекте (монополист вел долгие переговоры с Shell о вхождении в проект в обмен на долю в ЗАО «Заполярье-Неоком», закончившиеся неудачно).

18 сентября 2006 г. Минприроды отменило положительное заключение государственной экологической экспертизы второго этапа проекта «Саха-лин-2». В сентябре 2006 г. компания Sakhalin Energy, оператор проекта «Саха-лин-2», заявила, что затраты, которые может понести проект из-за отмены заключения экологической экспертизы Минприроды, пойдут в категорию возмещаемых. Кроме того, летом 2005 г. компания увеличила размер инвестиций во второй этап проекта с 12 до 20 млрд долл. Эти действия снижают прибыль РФ от проекта «Сахалин-2».

Российское руководство в лице Президента РФ, ответственных работников аппарата Президента неоднократно заявляли, что российская сторона не согласится с увеличением издержек проекта «Сахалин-2», поскольку это сократит прибыли России, предусмотренные соглашением о разделе продукции.

При анализе возникших проблем при реализации проекта «Сахалин-2» важно не то, насколько справедливы претензии российской стороны (это предмет отдельного разговора), а то, насколько кооперативное решение, принятое на основе схемы СРП, состоятельно во времени. Кстати, на основе СРП работают Харьягинский проект, «Сахалин-1», «Сахалин-2» [Business Week, 2006].

Поскольку СРП — арбитражное решение, то можно предположить, что кооперативное решение принято на основе применения одной из арбитражных схем.

Имеется много подходов к выбору конкретного парето-оптимального решения из множества всех существующих. К сожалению, наиболее нетривиальные и обоснованные из них являются динамически неустойчивыми (несостоятельными во времени). Покажем это на примере. Рассмотрим для этого выбор парето-оптимального решения по принципу Калаи-Сморо-динского. Решение, выбранное таким образом, носит название — KS-реше-ние [Kalai, Smorodinskiy, 1975].

В отличие от двух предыдущих случаев мы будем считать, что правая часть системы (1) зависит от нескольких управляющих воздействий, т. е.:

x(t) = f (x(t), щ(t), ..., un(t)), щ е Ut, x(t0) = x0, x е Rm, t е [t0, T]. (2)

При этом каждое из управляющих воздействий u. выбирается различными сторонами, которые мы будем называть игроками.

Для простоты предположим, что каждый из игроков г е N заинтересован в некотором выигрыше, который имеет вид:

т

К (х0, Т — г0; и, ..., ип) = | gi (х(Шг + ^1 (х(Т)), I е N,

Ч

где х(г) — решение системы (2), соответствующее управляющим воздействиям и(-) = (и1 (•), ..., ип(•)), выбираемым игроками как функции текущих состояний и времени (позиционные стратегии), а также начальному условию х(г0) = х0. В результате мы получаем некоторую дифференциальную игру, которую обозначим через Г(х0, Т — г0).

Обозначим также через К(х0, Т — г0) множество всех возможных значений векторов-оценок:

[К (х 0, Т — г0; щ,..., ип),..., К; (х 0, Т — £0 ; , ..., ип ), ..., Кп (Хо , Т — г0; их,..., ип)]

при различных управляющих воздействиях и1, ип(множество возможных оценок проекта).

Пусть К(х0, Т — г0) с К (х0, Т — г0) — парето-оптимальное множество векторов-оценок в К(х0, Т — г0). При определении различных схем выбора конкретного парето-оптимального решения важную роль играет точка «статус-кво». Пусть К0 есть то значение максимального выигрыша, которое игрок I может обеспечить себе в наихудшем случае, если все остальные игроки будут действовать против него (т. е. вместо того, чтобы стремиться максимизировать свой выигрыш, направят все усилия на минимизацию выигрыша игрока г). Обозначим точку «статус-кво» следующим образом:

К0(х0, Т — г0) = [К0(х0, Т — г,),...,К0(х0,Т — г,)] е К(х0,Т — г0).

Конечно, точка «статус-кво» зависит от начального условия х0 и продолжительности игры Т - г0. Обозначим ее так:

К(х0, Т — г0) = тах К; (х0, Т — г0; их, ..., ип).

и1, ..., ип

Точка (вектор-оценок) принимает вид:

К(х0, Т — г0) = (х0, Т — г0), ..., К(х0, Т — г0), ..., К,(х0, Т — г0)],

как и ранее, она называется «идеальной» и имеет смысл максимальных значений выигрыша игроков. Вообще говоря,

¿(х0, Т — г0) г К (х0, Т — г,), так как в противном случае точка К и определяла бы решение задачи.

Осуществим геометрический анализ проблемы временной состоятельности KS-решения. Для нахождения KS-решения проведем отрезок L, соединяющий точки K0 (x0, T - 10) и K(x0, T - t0). Поскольку K0 (x0, T - t0) е К (x0, T - t0), а также K(x0, T - t0) ё К (x0, T - t0), то существует точка M пересечения границы множества К(x0, T - 10) и отрезка L. Если такая точка единственна, то она называется KS-решением. Если точка M не единственна, то в качестве KS-решения можно взять точку пересечения отрезка L с множеством К(x0, T - t0), наиболее удаленную от K0 (x0, T - 10). Если множество К (x0, T - 10) выпукло, то KS-решение всегда принадлежит множеству парето-оптимальных точек. Однако легко видеть, что KS-решение не является динамически устойчивым (состоятельным во времени).

Проиллюстрируем это обстоятельство на числовом примере. Пусть система (2) имеет вид:

z = ul + u2, К| < 1, |u2| < 1, z е R2; ul, u2 е R2,

z0 = (6, 3), t е [0, 2], z = (x, y),

Kj(z0, 2; u1, u2) = -x(2), K2(z0, 2; u1, u2) = -|y(2)|.

Покажем временную несостоятельность решения Калаи-Смородин-ского. Здесь точка «статус-кво» в задаче r(z0, 2) равна K°(z0, 2) = (-6, 3) и соответствует начальному состоянию z0 = (6, 3). Идеальная точка этой задачи равна K(z0, 2) = (-2, 0) и соответствует точке z(z0, 2) = (2, 0), поскольку max K1 = -2, max K2 = 0. Множество достижимости C2(6, 3) есть круг с центром в точке (6, 3) и радиусом 4. Оптимальная траектория соответствует движению по прямой от точки z0 = (6, 3) по направлению к точке z(z0, 2) = (2, 0) до пересечения с большей окружностью C2(6, 3). Точка пересечения и определяет KS-решение в задаче r(z0, 2) (рис. 3).

Мы видим, что при движении вдоль оптимальной траектории z(t), соединяющей точку z0 с KS-решением задачи r(z0, 2), в подзадаче Г(7(1), 1) возникает новое KS-решение, отличное от KS-решения основной задачи, т. е. KS(z0, 2) Ф KS(z(1), 1), что и означает временную несостоятельность (динамическую неустойчивость) KS-решения.

Пример 3. Продолжение. Нарушение временной состоятельности кооперативного решения по схеме СРП и является объективной причиной возникающих проблем в проекте «Сахалин-2». Это обстоятельство приводит к необходимости проведения тяжелых продолжительных переговоров по согласованию интересов сторон в ходе реализации подобных проектов и в конечном счете к недостижению результатов, предполагаемых при открытии проекта.

Рис. 3. Временная несостоятельность КЗ-решения

регуляризация кооперативного принципа оптимальности

Предыдущие рассмотрения показывают, что абсолютное большинство кооперативных решений в широком смысле не является состоятельным во времени, а поэтому их реализация связана с серьезными проблемами и в конечном счете с недостижением результатов кооперации в том смысле, как это предполагалось при принятии кооперативного решения. Динамически устойчивыми выступают лишь решения задачи оптимального управления и равновесие по Нэшу в условиях одинакового дисконта у всех игроков (дисконтирование ведется по одинаковой процентной ставке). Имеется ли выход из создавшегося положения? К счастью, можно дать положительный ответ на поставленный вопрос. Решение проблемы возможно в классе кооперативных решений в узком смысле, т. е. когда задача формализуется как кооперативная игра.

Определение кооперативной дифференциальной игры. Рассмотрим общую дифференциальную игру п лиц с уравнениями движения:

х(л = /а, ха),(г), м2а),..., мп(г)], ха0) = х0. (з)

Игра происходит на промежутке [г0, Т]. Выигрыш игрока I определяется по формуле:

т

|g{[з, х(з), щ(з), м2(5), ..., мп(з)№ + с(х(Т)), g> 0, q' > О, (4)

Ч

где х(г) е X с Кт — позиционная переменная игры, определяющая ее текущее состояние, м{ е V — управляющее воздействие игрока I е N. В рассматриваемом случае будем считать, что выигрыши игроков трансферабельные.

Мы предполагаем, что игроки перед началом игры приняли решение максимизировать суммарный выигрыш. Пусть Г.(х0, Т - г0) — кооперативная игра, построенная на структуре игры Г(х0, Т - г0), в которой игроки действуют в соответствии с некоторым заранее принятым принципом оптимальности. Соглашение о том, как именно осуществлять кооперацию и разделить полученный в результате кооперативный выигрыш, и составляет принцип оптимальности решения кооперативной схемы.

Принцип оптимальности решения должен оставаться действенным на всем периоде кооперации. Кроме того, принцип групповой рациональности требует, чтобы игроки выбирали кооперативные стратегии (управления) из парето-оптимального множества. В дополнение к этому принцип распределения полученного суммарного выигрыша должен быть индивидуально-рациональным в том смысле, что в результате кооперации ни один из игроков не получил бы меньше, чем без кооперации.

Для выполнения условия групповой рациональности в случае транс-ферабельных выигрышей игроки стремятся максимизировать суммарный выигрыш:

X||£1[з, х(з), щ(з), М2(з), ..., мп(зХМз + с 1 (х(Т))| (5)

при ограничении (з).

Для нахождения соответствующих максимизирующих управлений м*($) = [м*(5), м*($), ..., м*($)] можно использовать принцип максимума Пон-трягина или уравнение Беллмана. Подставляя полученные оптимальные управления в (3), получаем оптимальную траекторию {х* }Т=^, которая определяется соотношением:

t

х*(?) = х0 + |/[з, х*(з), м*(з)]^з, г е [?0, Т]. (6)

Для удобства обозначений в дальнейшем изложении мы будем чередовать использование символов х *(£) и х Обозначим выражение

через V(Ы; х0, Т - Х0). Пусть 5 с N и V(Б; х0, Т - Х0) означает выигрыш коалиции Б (значение характеристической функции).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Будем использовать обозначение Гу (х0, Т - ) для определения дифференциальной игры в форме характеристической функции V(Б; х0, Т - £0), 5 с N. Обозначим также через х0, Т - £0) = = (х0, Т - £0), (х0, Т - £0), ..., (х0, Т - £0)] произвольный дележ, Су (х0, Т - £0) — ядро, О у (х0, Т - ¿0) — вектор Шепли в игре

Г V (х0 > Т - Х0 ) .

Динамика дележей в кооперативной игре. В динамических и дифференциальных играх дележи, входящие в решение, естественным образом находятся в поле зрения игроков при их движении вдоль оптимальной траектории {х*}Т= ( . В этом разделе мы обратим основное внимание на динамику распределения дележа, обусловленного выбранным принципом оптимальности.

Итак, пусть в игре Гу (х0, Т - £0) выбран некоторый принцип оптимальности решения ММ(х0, Т - £0). Решение игры строится в начальном состоянии х(Х0) = х0 на основе данного принципа оптимальности и представляет собой некоторое подмножество множества дележей ММ (х0, Т - X0) с Еу (х0, Т - X0), а также условно-оптимальную траекторию {х* }Т= г, максимизирующую суммарный выигрыш:

Определение 5. Любая траектория {х*}Т= ( , являющаяся решением системы (3) и такая, что

называется условно-оптимальной траекторией в игре Гу (х0, Т - X0).

Из определения 5 следует, что вдоль условно-оптимальной траектории игроки получают максимальный суммарный выигрыш. Рассмотрим пове-

дение множества (х0, Т - г0) вдоль условно-оптимальной траектории {х* }Т= to. Для каждого текущего состояния х*(г) = х* определяем текущую подыгру Гу (х*, Т - г) с характеристической функцией у(N; х*, Т - г) и множеством дележей Еу (х*, Т - г).

Рассмотрим семейство текущих игр {Гу (х*, Т - г), г0 < г < Т} и их решения (х*, Т - г) с Еу (х*, Т - г), порожденные тем же принципом оптимальности, что и решения (х0, Т - г0).

Понятно, что множество (х*, 0) есть решение текущей игры Гу (х*, 0) в момент Т и состоит из единственного дележа

С(х*(Т)) = [с1 (х*(Т)), с2(х*(Т)), ..., сп(х*(Т))] = [с1 (х*), с2(х*), ..., сп(х*)].

Динамически устойчивое (состоятельное во времени) кооперативное решение. Определение оптимального поведения игроков является основным вопросом в теории кооперативных игр. Поведение игроков, удовлетворяющее некоторому принципу оптимальности, и составляет решение игры. Для динамических игр требуется выполнение еще одного дополнительного условия (динамической устойчивости или состоятельности во времени): выбранный принцип оптимальности должен оставаться оптимальным в каждой подыгре с начальными условиями на оптимальной траектории, построенной в начальный момент. К сожалению, все основные кооперативные принципы оптимальности в узком смысле являются динамически неустойчивыми (несостоятельными во времени).

Пусть существуют решения (х *, Т - г) ^ 0, г 0 < г < Т вдоль оптимальной траектории {х*}^0. Предположим, что в момент времени г0 в состоянии х0 игроки согласились на дележ:

^(х0 , Т - г0) =

= [^ (х0, Т - г0), ^2(х0, Т - г0), ..., ^п(х0, Т - г0)] е (х0, Т - г0).

Это означает, что они согласились на такой дележ суммарного выигрыша, при котором доля игрока I на отрезке времени [г0, Т] в точности равна ^; (х0, Т - г0). Если, в соответствии с дележом х0, Т - £0), игрок I предполагает получить выигрыш, равный [^(х0, Т - г0); х*(•), г - г0] на временном интервале [г0, г], то на оставшемся интервале [£, Т] его выигрыш должен быть равен:

П,X0, Т - г,); X*(г), Т - г] =

(7)

= ^(X0, Т - г0) -ю,£(X0, Т - г0); X*(•), г - г0].

Для того чтобы первоначальное соглашение о дележе (а именно о дележе х0, Т — 10)) сохранялось в силе в момент t, существенно, чтобы вектор

П&х0, Т — г0); х*(г), Т — г] е (х*, Т — Г), (8)

т.е. 0, Т — t0); х*(?), Т — t]действительно был бы решением текущей игры Гу (х*, Т — 1). Если указанное условие выполняется в каждый момент времени t е [t0, Т] вдоль оптимальной траектории {х* }Т= *о, то дележ х0, Т — 10) динамически устойчив.

Динамическая устойчивость или состоятельность во времени решения ^(х0, Т — 10) гарантирует, что продолжение решения в подыграх, начинающихся на оптимальной траектории, должно оставаться оптимальным. Кроме того, групповая и индивидуальная рациональность должна выполняться на всем временном интервале.

К сожалению, все основные кооперативные принципы оптимальности в узком смысле являются динамически неустойчивыми (несостоятельными во времени). Однако выход из положения есть. Необходимо специальным образом определить механизм выплат, который бы обеспечил устойчивую реализацию таких дележей.

Процедура распределения дележа. Процедура распределения дележа, впервые предложенная в [Петросян, Данилов, 1979], будет построена таким образом, чтобы динамическая устойчивость дележей могла быть реализована для конкретного кооперативного решения. Представим выигрыш игрока г, получаемый им на временном интервале в виде:

t

Ю,£(х0 (•), Т — to); х*(•), t — to ] = | Б, (5)<к, (9)

* 0

где

X Б; (5) = X &; [5, х*(5), и* (5)] ,

при t0 < 5 < t < Т и

пК(х0, Т — 10); х*а), Т — t] + = £,(х, Т — ^). Отсюда получаем:

Б'<() = — ТГ ИЛИ ^Т = В(') • (10)

где пе Wv(х*, Т — t).

Величина Б.(^) может быть проинтерпретирована как мгновенный выигрыш игрока г в момент ^ Очевидно, что вектор Б(/) = [Б:(t), Б2 (t), ..., Бп(t)] предписывает распределение суммарного выигрыша между членами коали-

ции N. Выбирая B(t), t е [t0, T], игроки могут гарантировать желаемый исход, а именно: в каждый момент t е [t0, T] у них не будет оснований против реализации первоначального дележа Ъ,(х0, T - 10), как показано на рис. 4, т. е. дележ Ъ,(х0, T - 10) динамически устойчив.

Кооперативная дифференциальная игра Гv(х0, T - t0) имеет динамически устойчивое решение Wv (х0, T - t0), если все его дележи х0, T - 10) е Wv (х0, T - 10) динамически устойчивые. Нами при достаточно общих предположениях доказано, что процедура выбора B(t), t е [t0, T] (процедура распределения дележа), приводящая к динамически устойчивому кооперативному решению, существует и реализуема [Petrosjan, Zenkevich, 1996].

Пример 3. Проект «Сахалин-2». Выводы. В соответствии с приведенными результатами исследований в случае проектов типа «Сахалин-2» мы предлагаем использовать двухэтапную модель принятия решения. На первом этапе выбирается кооперативный дележ в соответствии с выбранным принципом оптимальности. На втором этапе необходимо регуляризовать

данное решение, используя специальную процедуру распределения дележа. В результате формируется система выплат, которая должна реализовывать-ся в ходе выполнения проекта. Итоговое кооперативное решение будет обладать свойством динамической устойчивости.

динамическая модель совместного предприятия

Рассмотрим совместное предприятие, функционирующее на временном интервале 0, Т], образованное п фирмами. Уравнения движения имеют вид:

X, ($) = /\ [5, X, (5), И, (5)], х, ) = X0, г е N (11)

где х, е X, с Ят• есть переменная состояния фирмы г, и е V — вектор управлений фирмы г. Состояние фирмы г включает ее основной капитал, уровень технологий, дополнительные навыки и производственные ресурсы. Целью фирмы г является максимизация выигрыша:

I яг [5, X, (з), и, (5)] ехр

г (у) Лу

+ ехр

г (у) Лу

Я1 (X, (Т)),

где ехр

|-[ г(у)Лу

[ ^о

есть дисконт, g1 [5, X, (5), И; (5)]

мгновенный доход

и я 1 (X1 (Т)) — терминальный платеж фирмы г е N. Рассмотрим совместное предприятие, состоящее из подмножества предприятий К с N. Подмножество К состоит из к фирм. Участвующая фирма может получить основные навыки и технологии, которые было бы очень сложно получить в одиночку, следовательно, динамика состояний фирмы г в коалиции К имеет вид:

X,(5) = /к [, XK(5), и,(5)], X,(Г0) = X0, г е К,

(12)

где xK(s) есть совокупность векторов я.^) для ] е К. В частности, д/^[5, X,, ик ]/ди;- > 0, для ) Ф г. Таким образом, положительный эффект в фиксированном состоянии фирмы г может быть получен при использованием технологий других фирм, входящих в коалицию.

Выигрыши коалиций. В момент времени доход совместного предприятия К имеет вид:

IX %1 [5, X; (5), и ■ (5)] ехр

г 0 1ек

г (у) Лу

+ X ехр

1еК

Г (у) Лу

Я1 (XI(Т)). (13)

Для того чтобы вычислить выигрыш совместного предприятия К, мы должны рассмотреть задачу оптимального управления максимации (13) при условии (12).

Для удобства обозначений представим (12) в виде:

Xк (5) = /к [, хк (5), ик (5)1 Xк ) = хК, (14)

где ик — совокупность управлений и, ) е К; /к [, хк, ик] — вектор-столбец с компонентами /;к [, хк, ик], ) е К.

Используя методику динамического программирования, решение зада-

(Г )к

чи может быть описано следующим образом. Обозначим через у* (X, хк) оптимальное управление фирмы ] (в смысле максимизации суммарного выигрыша коалиции) в коалиции К. В случае когда все п фирм участвуют в совместном предприятии, т. е. К = Ы, оптимальное управление имеет вид:

у N) (5, хм (5)) =[у(Г0 ж* (5, хм (5)), ) ^ (5, х N (5)), ..., У N°) ^ (5, хм (5))]. Оптимальная траектория удовлетворяет системе уравнений:

х; (5) = Г? [5, хN (5), У 0)М* (5, хN (5))] , х; (Xо ) = х° , ] е К, которая также может быть представлена в виде:

х N (5) = Г N [5, х N (5), У N°) N * (5, х N (5))] , х N «о ) = х 0. (15)

Пусть х\N(X) = [(X), х*(Х), ..., хП(X)] обозначает решение (15). Оптимальная траектория {хN (X)} характеризует состояние фирм-партнеров в период кооперации. Будем использовать хГ* для обозначения состояния х* (£) в момент времени X е [0, Т].

Рассмотрим приведенную выше модель совместного предприятия, включающего п фирм. Предположим, что фирмы-участники максимизируют свой совместный доход и распределяют его в соответствии с вектором Шепли. Проблема дележа полученного дохода возникает практически в каждом совместном предприятии. Вектор Шепли — один из наиболее часто используемых механизмов в статических кооперативных играх с транс-ферабельными доходами. Кроме того, обладая свойствами индивидуальной и групповой рациональности, вектор Шепли всегда единственный. Это делает его более привлекательным кооперативным решением относительно других, например, ядра и НМ-решения. Кроме того, вектор Шепли дает правило распределения для дележа кооперативного дохода среди участников коалиции в виде:

ф, = X (к 1)!(П к)![V(К) - V(К \ г)], г е N (16)

К с N

где К \ г есть дополнительная коалиция г в К, г(К) — доход коалиции К и [V(К) — V(К \ г)] — маргинальный вклад фирмы г в коалицию К. Для того чтобы максимизировать доход совместного производства,

фирмы будут использовать вектор управлений {уN°)Ы (1, хN)} _ на промежутке [?0, Т], получая в результате соответствующие (15) оптимальные траектории {хN (£)} . В момент и состоянии хN фирмы договариваются, что доля дохода фирмы г будет такова:

V(*°)1 а0, х0) _ X (к — 1)!(П — к)![П(*°)К0, хК) — П(*°)К\'V0, XК\,)],(17)

К с N "!

для г е N.

Однако вектор Шепли должен поддерживаться на всем промежутке производства [¿0, Т]. В частности, в момент времени те [0, Т] и состоянии хN должно быть выполнено следующее соотношение:

V(т)'(т, хN) _ X (к — 1)!(" — к)![^^К(т, хК) — П(т)К\'(т, х-,)], (18)

К с N "!

где г е N и те [(0, Т].

Отметим, что V(т)(т, х£) _ [V(т)1(т, х£), V(т)2(т, х£), •••, V(т)"(т, х£)], полученный по формулам (18), удовлетворяет свойствам дележа.

Более того, если условие (18) выполнено, то принцип оптимальности решения — дележ доходов в соответствии с вектором Шепли — сохраняется в любой момент времени на протяжении всей игры вдоль оптимальной траектории, выбранной в начальный момент. Следовательно, временная состоятельность имеет место, и ни одна из фирм не будет отклоняться от первоначально выбранного кооперативного решения. Таким образом, динамический принцип дележа, удовлетворяющий (18), динамически устойчив или состоятелен во времени.

Ключевой момент анализа — формирование механизма распределения дележа, который обеспечивал бы выполнение условия (18).

Компенсация переходных изменений. Здесь будет показан механизм распределения прибыли с целью компенсации переходных изменений так, чтобы значение вектора Шепли поддерживалось на всем промежутке кооперации. Для этого должна быть сформулирована процедура распределения дележа (аналогичная рассмотренной в работах [Ре^озуап, 2ассоиг, 2003; Уеи^, Ре^озуап, 2004]), чтобы схема распределения в условии (18) была ре-

ализуема. Пусть В (Х) есть платеж, получаемый фирмой I е N в момент Xе [Х0, Т], предписываемый функцией у(Г°)г (Х0, х0). В частности,

,(' °)

(Xо, хN) = X (к - ^ - ^)!(Г°)к(Хо, хк) - *(Г°)кХг(Хо, хк)] =

к с N

= | Вг (5)ехр

"I г (у) йу

й5 + q' (х * (Т ))ехр

г (у) йу

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(19)

Следующая формула определяет В.(т) — правило распределения вектора Шепли во времени, обеспечивающее динамическую устойчивость последнего.

В, (Т) =

= - X (к - 1)!ПП - к)!{[*(Т)к(X, хк*) |г=Т] - (Т)к"(X, хк*\,) |г=Т]

+

к с N

+ 1

или

(к (х, х к*) К \(х, х к*,) и])

х/ N [Т, х - у N) N * (Т, х N*)], В,- (Т) =

= - X (к - 1)!ПП - к)!{[*(Т)к(X, хК*) |Г=Т] - (Т)к(X, хК*\,) |Г=Т]

(20)

+

к с N

;еК

к (X, хТ) к=Т

- X И*) кх' (т, хк*\,)

т/-\ -I- к

йек \ г

г? [т, х- у (Т, х-)]

/? [т, хN, у!т)N (Т, хN )]1 =

= - X (к - 1)!ПП - к)!{[*(Т)к(X, хк*) |г=Т ] - (Т)к\'(X, хк*\г) |г=Т ]

+

к с N

+ Н*К (X, X К* Н=Т ] /К [т, X £ , у К) " (Т, X £ )]-

-[*х(Т*)к\' (Т, хк*\г

)1г=Т

/^ г [Т,

хN , у к)N (Т, х

N

)]} ■

где f:N [т, хN, ^К?Ы (т, хN)] есть вектор-столбец с компонентами /:* [т, хN, ¥(т)м (т, )], I е К.

Вектор В(т) служит уравновешивающей компенсацией изменений, которая гарантирует реализуемость дележа согласно вектору Шепли на всем протяжении игры. Отметим, что мгновенный доход В.(т), предлагаемый игроку I в момент т, зависит от текущего состояния хN и текущего момента времени т. Представим В.(т) как функцию двух переменных В; (т, хN). Таким образом, мгновенные выплаты В, (т, х) игроку I е N обеспечивают динамическую устойчивость кооперативного решения в совместном предприятии.

Кооперативная модель совместного предприятия. Рассмотрим частный случай, когда в совместном предприятии участвуют три компании. Пусть плановый период кооперации [?0, Т]. Доход компании I составляет:

г

ДР [х,(5)]12 - с,щ(5)]ехр[-г(5 - г0)] + ехр[-г(Т - г0)] [х,(Т)], (21)

где I О N; Р., с. и д. — положительные константы, г — процентная ставка, х, (?) е Я + — уровень технологий компании I в момент ? и и; (?) е Я + — инвестиции в технологическое развитие. Слагаемое Pi [х, (?есть чистая операционная прибыль компании I при технологическом уровне х.(?), и си1 — затраты на инвестиции, д, [х, (Т)]12 — это ликвидационная стоимость технологий компании I в момент Т.

Технологический уровень компании I эволюционирует в соответствии с динамикой:

х, (5) = [а, [и, (5)х, (5)] - 5х, (5)], х, (?0) = х? е X,, х, (?0) = х0 е X,, (22)

где а, [и, (5)х, (5)]12 — улучшение в технологии, полученное при инвестировании и.(5), 5 — скорость устаревания.

Рассмотрим случай, когда все три фирмы соглашаются образовать совместное предприятие и разделить совместный доход в соответствии с динамическим вектором Шепли. Благодаря обмену знаниями фирмы-участники могут приобрести основные навыки и технологии, которые получить в одиночку они могли бы с трудом. Эволюция технологического уровня компании I в условиях совместного предприятия принимает вид:

х, (5) =

а, [и, (5)х, (5)] + Ь[,,][х; (5)х, (5)]12 + Ъ^[хк (5)х, (5)] - 5х, (5)]

(23)

х, (?0) = х0 е X, для I, ], к е N = {1, 2, 3} и I Ф ] Ф к,

где Ь^, г] и , г] — неотрицательные константы. В частности,

, г][х(5)хг (5)] представляет эффект передачи технологий в условиях совместного предприятия для фирмы г, осуществляемый технологиями фирмы ''.

Прибыль совместного предприятия есть сумма прибылей фирм-партнеров:

Т 3

Мр [х; (5)] г° ]=1[

>2

cjиj (5)

ехр [—г(5 - Xо )]й5 +

+ X ехр [-Г(Т - Xо)] [х; (Т)] ;=1

X

(24)

В совместном предприятии фирмы действуют совместно, чтобы максимизировать (24) при условии (23).

Опуская технические выкладки, получаем, что

/{1,2 3}[т, хТ*, х2*, х3Т*, у(Т){1,2 3}(Т, хТ*, хТ*, х3Т*)] = л/1, 2, 3}(т) (х,Т*)^ + Ь[,,] [хТ*хТ*]^ + ь[,,] [хкТ*х,Т*]! - 5хТ

(25)

для г е {1, 2, 3}.

Обозначив [*, х2*, хТ*] через х{* 2 3}, имеем:

5{1, 2, 3}[Т х Т* у(Т){1, 2, 3}( х Т* ) у(Т){1, 2, 3}( х Т* )]_

/{г,;} [Т, х{1,2,3}, уг х{1,2,3^, ух{1,2,3^]

Г 5 {1, 2, 3}[Т х Т* у(Т){1, 2, 3}( х Т* )]]

/г [Т, х{1,2,3}, уг х{1,2, 3^]

_/;{, , }[Т, х{1** 2,3}, у(){, , }(т, х{1* 2, 3}))

для г, ' е {1, 2, 3} и г Ф /"{12,3}[Т хт* м/т)/1,2,3}( хт* ) у(т){1,2,3}( хт* ) у(т){1,2,3}( хТ* )] =

/{1, 2,3} [Т х{1,2, 3}, у1 х{1, 2,3^, у 2 х{1,2, 3^ , у3 ^ Т, х{1, 2,3}=

/{, , }[т, х{1*, 2, 3}, у(){, , }(т, х{1* 2, 3})]

/2{, , }[Т, х{1*, 2, 3}, у 2){, , }(т, х-Т1>* 2, 3})]

/"{1, 2, 3}[Т хТ* У(Т){1, 2- 3}(Т хТ* )]

/3 [Т х{1, 2, 3}, у3 х{1, 2, 3}/1]]

После аналитических преобразований имеем:

W«*' 2' 3}(, x2, 3})t= =

"aa^1' 2' 3}(т) (xT+ Af2' 3}(т) (x2т+ A3{1'2' 3}(т) (xт+ C{1-2-Э}(т)

-r

а{ 2,3}(т)(хт+ А2,3}(т)(х2т*)12 + А{{1,2,3}(т)(хзт*)12 + С{1,2,3}(т)

^,, хт:Д=т =

А{, ;}(т)(хт:)^ + А{, ;}(т)(хт+ (С{', %)

-г А{, ;}(т)(хт:)^ + А{ ;}(т)(х^+ С{, %) для г, ] е {1, 2, 3} и г Ф ].

Ю(т); (, хт:)=т = [А{}(т)хт: + С{}(т)] - г[А{}(т)хт: + С{}(т)], для г е {1, 2, 3}.

Ю™К (, х::)(=т = 2(т)(х/, (27)

для г е К с {1, 2, 3}.

Заметим, что коэффициенты А., С. получаются из решения линейных систем дифференциальных уравнений. Окончательный вид коэффициентов опустим из-за их громоздкого вида.

Из (25)-(27) и формулы (20) выводим выражение для В.(т). Выплата В.(т), предложенная игроку г е {1, 2, 3} в момент времени ?е [?0, Т], приведет к реализуемости динамического вектора Шепли. Таким образом, в результате получим динамически устойчивое развитие совместного производства.

основные выводы

В работе исследованы долгосрочные кооперативные решения в широком смысле (основанные на согласовании интересов) и узком смысле (требующие стратегической кооперации по максимизации суммарного выигрыша и механизма распределения этого выигрыша).

Опираясь на ранее проведенные исследования, показано, что основные кооперативные принципы оптимальности не обладают свойством динамической устойчивости (временной состоятельности), требующим сохранения свойства оптимальности на промежутке его реализации вдоль оптимальной траектории. Нами предложен метод регуляризации (ПРД), базирующийся на введении нового управления на оптимальной траектории. Результатом применения этого метода в конкретной задаче динамической кооперации является построение управления в виде функции специальных выплат, реализуемого на оптимальной траектории. Таким образом, мы получаем двухэтапную задачу: принятие кооперативного решения в рамках выбранного принципа оптимальности и построение управления для данного кооперативного решения на основе применения ПРД. Кооперативное решение, полученное в результате выполнения этой двухэтапной задачи, будет обладать свойством динамической устойчивости.

В частном случае исследована модель динамической кооперации при создании совместного предприятия. Получено теоретическое решение задачи. В плане ближайшей перспективы предполагается завершить количественное моделирование на основе достигнутых теоретических результатов в кооперативной модели создания совместного предприятия.

ЛИТЕРАТУРА

Гарретт Б., Дюссон П. Стратегические альянсы / Пер. с англ. М.: ИНФРА-М, 2002.

XX (Серия «Менеджмент для лидера»). Красовский Н. Н. К задаче об игровой встрече движений // Докл. АН СССР. 1967.

Т. 173. № 3. С. 535-537. Петросян Л. А. Дифференциальные игры на выживание со многими участниками //

Докл. АН СССР. 1965. Т. 161. № 2. С. 285-287. Петросян Л. А. Устойчивость решений в дифференциальных играх со многими

участниками // Вестн. Ленингр. ун-та. 1977. № 19. С. 46-52. Петросян Л. А. Неантагонистические дифференциальные игры // Вопросы механики процессов управления. Управление динамическими системами. Л.: ЛГУ, 1978. С. 173-181.

Петросян Л. А., Данилов Н. Н. Устойчивость решений в неантагонистических дифференциальных играх с трансферабельными выигрышами // Вестн. Ленингр. ун-та. 1979. № 1. С. 52-59. Петросян Л. А., Данилов Н. Н. Кооперативные дифференциальные игры и их приложения. Томск: Изд-во Томского ун-та, 1985. Петросян Л. А., Мурзов Н. В. Игры на перетягивание со многими участниками //

Вестн. Ленингр. ун-та. 1967. № 13. С. 125-129. Петросян Л. А., Захаров В. В. Математические модели в экологии. СПб.: Изд-во С.-Пе-терб. ун-та, 1997.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Петросян Л. А., Зенкевич Н. А., Семина Е. А. Теория игр. М.: Высш. Школа, Книжный дом «Университет», 1998.

Понтрягин Л. С. К теории дифференциальных игр // УМН. 1966. 21. № 46. С. 219-274.

Чистяков С. В. О бескоалиционных дифференциальных играх // Докл. АН СССР. 1981. Т. 259. № 5. С. 1052-1055.

Чистяков С. В. О построении сильно динамически устойчивых решений кооперативных дифференциальных игр // Вестн. С.-Петерб. ун-та. 1992. Сер. Математика, механика, астрономия. Вып. 1. С. 50-54.

Эксперт. 2003. № 7(361). 24 февраля.

Bellman R. Dynamic Programming. Princeton, NJ: Princeton University Press, 1957. (Рус. пер.: Беллман P. Динамическое программирование. М.: Иностранная литература, 1960.)

BusinessWeek-Россия. 2006. № 37. 9 октября.

Case J. H. Equilibrium Points of n-Person Differential Games // Ph. D. Thesis. Tech. Report N 1967-1. Ann Arbor, MI: University of Michigan, Department of Industrial Engineering, 1967.

Haurie A. A Note on Nonzero-sum Differential Games with Bargaining Solutions // Journal of Optimization Theory and Application. 1976. Vol. 18. N 1. P. 31-39.

Haurie A., Krawczyk J. B., Roche M. Monitoring Cooperative Equilibria in a Stochastic Differential Game // Journal of Optimization Theory and Applications. 1994. Vol. 81. N 1. P. 73-95.

Isaacs R. Differential Games. N. Y.: Wiley, 1965. (Рус. пер.: Айзекс P. Дифференциальные игры. М.: МИР, 1967.)

Jorgensen S. An Exponential Differential Games Which Admits a Simple Nash Solutions // Journal of Optimization Theory and Applications. 1985. N 3. Vol. 45. P. 383-396.

Jorgensen S., Sorger G. Feedback Nash Equilibria in a Problem of Optimal Fishery Management // Journal of Optimization Theory and Applications. 1990. Vol. 64. N 2. P. 293-310.

Jorgensen S., Zaccour G. Time Consistent Side Payment in a Dynamic Game in Downstream Pollution // Journal of Economic Dynamics and Control. 2001. Vol. 25. P. 1973-1987.

Jorgensen S., Zaccour G. Time Consistency in Cooperative Differential Games // Decision and Control in Management Sciences: Essays in Honor of Alan Haurie / Ed. by G. Zaccour. London: Kluwer Science Publisher, 2002. P. 349-366.

Kaitala V. Equilibria in a Stochastic Resource Management Game under Imperfect Information // European Journal of Operational Research. 1993. Vol. 71. N 3. P. 439-453.

Kalai E., Smorodinskiy M. Other Solutions to Nash's Bargaining Problem // Econometrica. 1975. Vol. 43. N 3. P. 513-518.

Kydland F. E., Prescott E. C. Rules Rather than Discretion: The Inconsistency of Optimal Plans // Journal of Political Economy. 1977. Vol. 85. P. 473-490.

Nash J. F. The Bargaining Problem // Econometrica. 1950. Vol. 18. N 2. P. 155-162.

Nash J. F. Non-Cooperative Games // Ann. Math. 1951. Vol. 54. N 2. P. 286-295.

Neumann J., von Morgenstern O. Theory of Games and Economic Behavior. Princeton: Princeton University Press, 1944. (Рус. пер.: Нейман Дж., Моргенштерн О. Теория игр и экономическое поведение. М.: Наука, 1970.)

Petrosjan L. A. Differential Games of Pursuit. Singapore: World Scientific Publishing Co. Pte. Ltd, 1993.

Petrosjan L. A. Bargaining in Dynamic Games // ICM Millennium Lectures on Games /

Eds. L. Petrosjan, L. D. Yeung. Berlin: Springer-Verlag, 2003. P. 139-143. Petrosjan L., Zaccour G. Time-Consistent Shapley Value Allocation of Pollution Cost Reduction // Journal of Economic Dynamics and Control. 2003. Vol. 27. N 3. P. 381398.

Petrosjan L. A., Zenkevich N. A. Game Theory. Singapore: World Scientific Publishing Co. Pte. Ltd, 1996.

Shapley L. S. A Value for n-Person Games // Contributions to the Theory of Games / Eds.

H. W. Kuhn, A. W. Tucker. Princeton: Princeton University Press, 1953. P. 307-317. Sorger G. Competitive Dynamic Advertising: A Modification of the Case Games // Journal

of Economic Dynamics and Control. 1989. Vol. 13. N 1. P. 55-80. Starr A. W., Ho Y. C. Further Properties of Nonzero-Sum Differential Games // Journal of

Optimization Theory and Applications. 1969a. Vol. 3. N 4. P. 207-219. Starr A. W., Ho Y. C. Nonzero-Sum Differential Games // Journal of Optimization Theory

and Applications. 1969b. Vol. 3. N 3. P. 184-206. Tolwinski B., Haurie A., Leitmann G. Cooperative Equilibria in Differential Games // Journal of Mathematical Analysis and Applications. 1986. Vol. 119. P. 182-202. Yeung D.W.K. A Differential Game of Industrial Pollution Management // Annals of Operation Research. 1992. Vol. 37. N 1-4. P. 297-311. Yeung D. W. K. On Differential Games with a Feedback Nash Equilibrium // Journal of

Optimization Theory and Applications. 1994. Vol. 82. N 1. P. 181-188. Yeung D. W. K., Petrosyan L. A. Cooperative Stochastic Differential Games. Springer, 2006. Zenkevich N. A. Auction Games and Integrative Imputations // International Yearbook on Game Theory and Applications. Vol. 6. N. Y.: Nova Science Publ., 2001. P. 192-203. (Рус. пер.: Зенкевич H. А. Интеграционные дележи и решения игр аукционов // Численные и качественные методы прикладной математики / Под ред. С. В. Чистякова. СПб.: Изд-во С.-Петерб. ун-та, 2004. С. 41-54.)

Статья поступила в редакцию 17 ноября 2006 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.