Научная статья на тему 'МЕТОДИКА СРАВНИТЕЛЬНОГО АНАЛИЗА ЭФФЕКТИВНОСТИ СПОСОБОВ ОРГАНИЗАЦИИ АКТИВНЫХ АГЕНТОВ И МЕТОДОВ УПРАВЛЕНИЯ'

МЕТОДИКА СРАВНИТЕЛЬНОГО АНАЛИЗА ЭФФЕКТИВНОСТИ СПОСОБОВ ОРГАНИЗАЦИИ АКТИВНЫХ АГЕНТОВ И МЕТОДОВ УПРАВЛЕНИЯ Текст научной статьи по специальности «Математика»

CC BY
53
9
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Проблемы управления
ВАК
Область наук
Ключевые слова
МЕТОДЫ УПРАВЛЕНИЯ И РАСПРЕДЕЛЕНИЯ ДОХОДА / НЕЭФФЕКТИВНОСТЬ РАВНОВЕСИЙ / СПОСОБЫ ОРГАНИЗАЦИИ АКТИВНЫХ АГЕНТОВ

Аннотация научной статьи по математике, автор научной работы — Угольницкий Г.А.

При взаимодействии активные агенты могут действовать независимо, вступать в кооперацию или быть связанными отношениями иерархии. В свою очередь, иерархическое воздействие может осуществляться с помощью административных или экономических методов с обратной связью или без неё. Приведено систематическое описание этих способов организации и методов управления посредством теоретико-игровых моделей конфликтного управления без учёта неопределённости с разными информационными регламентами. Представляется чрезвычайно важным количественное сравнение выигрышей отдельных агентов и всего их множества (общественного благосостояния) при указанных способах организации и методах управления. Предложена методика построения систем общественных и индивидуальных предпочтений на основе выигрышей агентов в играх в нормальной форме и долей в распределении общего выигрыша в кооперативных играх. Для более детальной количественной оценки разработана система индексов относительной эффективности. Предложенная методика проиллюстрирована на примере моделей олигополии Курно.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

AN APPROACH TO COMPARE ORGANIZATION MODES OF ACTIVE AGENTS AND CONTROL METHODS

When interacting, active agents can behave independently, cooperate, or have hierarchical relations. In turn, a hierarchical impact may be exerted by administrative or economic methods with or without feedback. These organizational modes and control methods are systematically described based on game-theoretic models with different information structures without uncertainty. It seems crucial to compare the payoffs of separate agents quantitatively with social welfare under the organization modes and control methods. A methodology is proposed to build the systems of social and individual preferences in normal form games and determine shares when allocating the cooperative payoff. A system of relative efficiency indices is developed for detailed quantitative assessment. This methodology is illustrated by several Cournot oligopoly models.

Текст научной работы на тему «МЕТОДИКА СРАВНИТЕЛЬНОГО АНАЛИЗА ЭФФЕКТИВНОСТИ СПОСОБОВ ОРГАНИЗАЦИИ АКТИВНЫХ АГЕНТОВ И МЕТОДОВ УПРАВЛЕНИЯ»

УДК 519.83+519.86 DOI: http://doi.org/10.25728/pu.2022.3-3

МЕТОДИКА СРАВНИТЕЛЬНОГО АНАЛИЗА ЭФФЕКТИВНОСТИ СПОСОБОВ ОРГАНИЗАЦИИ АКТИВНЫХ АГЕНТОВ И МЕТОДОВ УПРАВЛЕНИЯ

Г.А. Угольницкий

Аннотация. При взаимодействии активные агенты могут действовать независимо, вступать в кооперацию или быть связанными отношениями иерархии. В свою очередь, иерархическое воздействие может осуществляться с помощью административных или экономических методов с обратной связью или без неё. Приведено систематическое описание этих способов организации и методов управления посредством теоретико-игровых моделей конфликтного управления без учёта неопределённости с разными информационными регламентами. Представляется чрезвычайно важным количественное сравнение выигрышей отдельных агентов и всего их множества (общественного благосостояния) при указанных способах организации и методах управления. Предложена методика построения систем общественных и индивидуальных предпочтений на основе выигрышей агентов в играх в нормальной форме и долей в распределении общего выигрыша в кооперативных играх. Для более детальной количественной оценки разработана система индексов относительной эффективности. Предложенная методика проиллюстрирована на примере моделей олигополии Курно.

Ключевые слова: методы управления и распределения дохода, неэффективность равновесий, способы организации активных агентов.

ВВЕДЕНИЕ

На первый взгляд кажется очевидным, что кооперация лучше конфронтации. Объединение усилий активных агентов позволяет добиться лучших результатов, чем их независимое эгоистичное поведение и тем более вражда, а полученный дополнительный выигрыш коалиции всех агентов можно каким-то образом разделить между всеми ними.

К сожалению, здесь не всё так просто. Для общества в целом действительно выигрыш при кооперации всегда по крайней мере не меньше, чем при независимом поведении составляющих общество активных агентов или при наличии отношений иерархии между ними. Но вот для каждого агента в отдельности это уже совсем не обязательно так. Например, выигрыш агента верхнего уровня иерархии может оказаться больше, чем его доля в равномерном распределении при кооперации даже с учётом дополнительного эффекта. Не так легко и договориться о том, как именно делить прибавку даже при наличии принципиального соглашения о сотрудничестве и как обеспечить устой-

чивость этого соглашения. Возможно, отчасти в силу этих соображений известно множество примеров отказа от кооперации в пользу конфликта и борьбы за лидерство в экономике, общественной жизни, международных отношениях и иных областях.

Поэтому чрезвычайно актуальным представляется математический анализ условий выгодности кооперации и сравнение эффективности различных способов организации активных агентов, методов управления ими и распределения полученного кооперативного дохода. Фундаментальные основы такого анализа предоставляют теории активных систем и управления организационными системами [1, 2], информационная теория иерархических систем [3-7], теория контрактов и дизайн механизмов [8]. Концепция управления устойчивым развитием активных систем на основе учёта и согласования интересов активных агентов предложена в работах [9, 10]. Основным математическим инструментом анализа служит теория игр [11-15]. Для решения сложных динамических задач конфликтного управления целесообразно использовать имитационное моделирование [16].

Детальный анализ так называемой проблемы неэффективности равновесий приведён в работах [17-20]. Исход рационального поведения независимых эгоистичных экономических агентов обычно оказывается для общества хуже исхода, полученного при централизованном управлении или добровольной кооперации. Возникает важный вопрос: насколько именно хуже? Обычно для количественной оценки неэффективности равновесий используется цена анархии, которая определяется как отношение наихудшего из равновесных значений выбранной функции выигрыша общества к её значению на оптимальном исходе [21]. Более широкий набор показателей для динамических игр предложен в работе [22]. Сравнение выигрышей при различных способах организации агентов проводится в очень многих работах по теории игр [2325].

Однако, проблему (не)эффективности равновесий целесообразно формулировать в более общем виде. Прежде всего, сравнению подлежат выигрыши не только при базовых способах организации активных экономических агентов (равноправие, иерархия, кооперация), но и с учётом различных методов управления, определяющих регламент взаимодействия агентов. Кроме того, что ещё более важно, сравнение необходимо проводить с точки зрения не только общественного благосостояния, но и интересов отдельных агентов. Ещё раз подчеркнём, что исход игры, более выгодный для общества в целом при некотором способе организации, не обязательно окажется таким же для каждого из агентов.

Главные способы организации взаимодействия активных агентов - это их равноправие, иерархия и кооперация. При равноправии агенты (игроки) выбирают свои действия одновременно и независимо, а решением возникающей игры в нормальной форме считается равновесие Нэша. При иерархической организации возможны два основных варианта управления. При первом из них ведущий игрок выбирает и сообщает одному или нескольким остальным игрокам своё предполагаемое действие, а они оптимально реагируют на него. Тогда возникает игра Гермейера Г1 (игра Штакельберга в англоязычной литературе), решением которой считается равновесие Штакельберга. Во втором варианте ведущий выбирает и сообщает ведомым свою стратегию как функцию от их ожидаемых действий, а они оптимально реагируют на эту стратегию. Тогда возникает игра Гермейера Г2 (обратная игра Штакельберга в англоязычной литературе), решение которой ищется на основе принципа гарантированного результата Ю.Б. Гермейера [4].

Целесообразно также различать административные (принуждение) и экономические (побуждение) методы управления, которые соответственно заключаются в воздействии на множества допустимых стратегий или функции выигрыша агентов [9, 10]. Другой вариант формализации иерархических отношений - игры в развёрнутой форме, когда игроки делают ходы последовательно. Этот вариант в статье не рассматривается. Наконец, при кооперации все игроки объединяются и совместно максимизируют суммарную функцию выигрыша по всем управляющим переменным. Эта трактовка отвечает утилитаристскому подходу, в отличие от эгалитаристского, когда максимизируется наименьший из выигрышей агентов [26].Тогда исходная игра сводится к задаче оптимизации, кооперативное решение которой оптимально по Парето. Динамические постановки задач конфликтного управления (дифференциальные или разностные игры) в обсуждаемом смысле принципиально не отличаются от статических [11-15].

Кроме функций выигрыша, которые характеризуют эффективность действий активных агентов, теоретико-игровые модели могут содержать дополнительные ограничения, характеризуемые как условия координации [7] или условия устойчивого развития [9, 10]. Эти условия означают, что состояние управляемой динамической системы должно принадлежать определённой области фазового пространства. В статических моделях данные условия формулируются как ограничения на управляющие переменные.

Вклад настоящей статьи состоит в следующем:

• дано систематическое описание способов взаимодействия активных агентов и методов управления ими посредством теоретико-игровых моделей без учёта неопределённости;

• предложена методика сравнительного анализа общественной и индивидуальной эффективности указанных способов и методов на основе выигрышей агентов в играх в нормальной форме и их долей в кооперативном распределении общего выигрыша в играх в форме характеристической функции;

• для более детальной количественной оценки сравнительной эффективности разработана система индексов;

• предложенная методика проиллюстрирована на примере статических и динамических моделей олигополии Курно.

В § 1 описывается теоретико-игровая формализация способов организации взаимодействия активных агентов и методов управления ими. Сравнение выигрышей агентов позволяет построить

30

С0№ТР0Ь ЗОЕМСББ N0. 3 • 2022

системы общественных и индивидуальных предпочтений. При этом для более детальной количественной характеристики можно использовать индексы сравнительной эффективности. В § 2 рассматривается методика сравнительного анализа эффективности, основанная на построении и исследовании теоретико-игровых моделей конфликтного управления. В § 3 предложенная методика иллюстрируется на примере различных моделей олигополии Курно. Результаты настоящей работы и перспективы дальнейших исследований обсуждаются в заключении.

1. СПОСОБЫ ОРГАНИЗАЦИИ, МЕТОДЫ УПРАВЛЕНИЯ И СИСТЕМЫ ПРЕДПОЧТЕНИЙ

1.1. Способы организации и методы управления

Базовые способы организации взаимодействия активных агентов - это их равноправие, иерархия и кооперация. При иерархической организации возможны два основных метода управления: принуждение (административные механизмы) и побуждение (экономические механизмы). Эти механизмы могут быть реализованы с обратной связью по управлению или без неё.

При кооперации возникают два вопроса: как определить выигрыш каждой коалиции (построение характеристической функции) и как распределить общий выигрыш между игроками (выбор принципа оптимальности). Распределение выигрыша также естественно трактовать как задачу управления.

В данном разделе даётся систематическое описание указанных способов взаимодействия и методов управления посредством статических теоретико-игровых моделей.

Взаимодействие равноправных агентов отражает модель игры n лиц в нормальной форме

ui(x,...,xn) ^max, xi e Xi,i e N . (1.1)

Здесь N = {1,..., n} - множество игроков (активных агентов); Xi - множество допустимых действий игрока i; xi - конкретное выбранное действие игрока i; ui : X ^ R - функция выигрыша игрока i. Игроки из множества N одновременно и независимо выбирают свои действия xi , в результате чего возникает исход игры x = (x,...,xn) e X = X1 х...х Xn . Игроки могут иметь различную природу. В экономике это отдельные предприниматели, домохозяйства, фирмы, регионы, страны. В политике - отдельные избиратели, политические партии, движения и объединения,

органы исполнительной и законодательной власти. В организационном управлении - отдельные сотрудники, подразделения и целые организации. Важно, что интересы каждого игрока целиком и полностью описываются стремлением к максимизации выигрыша ui (постулат экономической рациональности).

Решением игры (1.1) считается множество равновесий Нэша

NE = {xne e X : Vi e N

Vxt e Xi Ui(xш) > щ(xi,xne)},

x_i = (( ,...,xi_j ,xi+j ,...,xn ). (1.2)

При кооперации игроки объединяются и вместе максимизируют суммарный выигрыш (утилитаристскую функцию общественного благосостояния) [26]

u(x) = X Ui (x). (1.3)

ieN

Кооперативное решение есть

xC e X :uC = u(xC) = maxu(x). (1.4)

xeX

При иерархическом управлении ко множеству игроков N добавляется выделенный игрок (Центр в теории активных систем), обозначаемый индексом 0. При управлении без обратной связи Центр выбирает и сообщает остальным игрокам своё действие x0 e X0. Зная действие x0, игроки выбирают оптимальные ответы. Предвидя такое поведение, Центр на самом деле выбирает действие x0 e X0 так, чтобы максимизировать свой выигрыш на множестве оптимальных ответов. Здесь различают два случая.

• Если Центр рассчитывает на благожелательность остальных агентов, то его выигрыш определяется значением

u0 = sup sup u0(x0,x), (1.5)

x eXо xeR( xo )

где R(x0) - множество оптимальных ответов агентов на действие Центра x0. Ответ на вопрос о том, как определить это множество при связанных агентах, неочевиден. Обычно считают, что R(x0) = NE(x0), предполагая Vx0 NE(x0) , иначе определение множества R(x0) нужно давать отдельно для конкретной модели. В широко известной монографии [13] даётся следующее определение равновесия Штакельберга для конечных игр трёх лиц, которое легко обобщить для произвольного n > 3 .

Пусть в игре трёх лиц первый игрок ведущий, второй и третий ведомые. Обозначим через xi стратегии игроков, X i - множества их допусти-

мых стратегий, J1(x1, x2, x,) - выигрыши при исходе (x1, x2, x,), i = 1, 2, 3. Тогда x* - иерархическая равновесная стратегия ведущего, если

min ^ J1(x*, x2, x3) =

(x2 x )eR (x*)

= max min J1 (xj, x2, x3),

x1eX1 (x2 ,x3)eR(x1)

где R(xj) - множество оптимальных ответов группы ведомых, которое определяется для каждой стратегии ведущего x1 e X1 условиями

R(xi) = {(У2 - Уз) е X 2 Х X3: J2(xi, У 2, Уз) >

> J2(x1, x2, x3)л J3(x1 - y2, y3) > J3(x1,x2,x3), Vx2 e X 2, x, e X з}.

Любая тройка (x*, x2,x*), (x2, x*) еR(x*), есть равновесие Штакельберга [13, с. 145, 146]. • В противном случае (при сознательной или невольной неблагожелательности агентов) выигрыш Центра определяется значением

С = sup inf u0(x0, x). (1.6)

x0 eX0 xeR(x0)

Обозначим через ST множество равновесий Штакельберга (решений иерархической игры Центра и агентов).

Замечание 1. Часто считается, что равновесие Штакельберга определяется только формулой (1.5), в то время как формула (1.6) относится лишь к принципу гарантированного результата Ю.Б. Гермейера, однако это не так. В широко известной монографии [13] равновесие Штакельберга определяется формулой (1.6).

Замечание 2. Во многих представляющих практический интерес прикладных моделях существует единственный оптимальный ответ агентов (например, единственное равновесие Нэша). Тогда вопрос о благожелательности или неблагожелательности агентов вообще не возникает.

При иерархическом управлении с обратной связью Центр выбирает и сообщает остальным игрокам свою стратегию xn е Xtl = Xtlx , т. е. х: X —> Х0. Далее регламент игры аналогичен предыдущему случаю с естественной модификацией. Зная стратегию х0, игроки выбирают оптимальный ответ. Предвидя такое поведение, Центр на самом деле выбирает стратегию xn е Х() так, чтобы максимизировать свой выигрыш на множестве оптимальных ответов. Если Центр рассчитывает на благожелательность агентов, то его выигрыш определяется значением

Г<!' = sup sup и0 (х0 (х), х). (1.7)

х0 eÄ'o хеШ0 )

В противном случае (при сознательной или невольной неблагожелательности агентов) выигрыш Центра определяется значением

н,,1'' = sup inf и0(х0(х),х). (1.8)

i0el'0 -veÄKo>

Обозначим через IST множество решений иерархической игры Центра и агентов при управлении с обратной связью.

При иерархическом управлении различают административные методы (принуждение) и экономические методы (побуждение) [9, 10]. Проведём формализацию на примере управления без обратной связи при неблагожелательных агентах. Иерархическая игра имеет вид

u0(p, q, x) ^max, p e P, q eQ; (1.9) ui (pi ,x) ^ max, xi e Xi (qi), i e N. (110)

Здесь p = (pj,...,pn) - вектор экономических управлений Центра, с помощью которых он воздействует на функции выигрыша агентов; q = (qj ,...,qn ) - вектор административных управлений Центра, посредством которых он воздействует на множества допустимых действий агентов.

Множество равновесий принуждения в игре (1.9), (110) есть множество исходов

r^rw /ГГ> Г/ COMP COMPv / COMP COMPx _ COMP.

COMP = {(x0 , x ): u0(x0 , x )- u0 }, где

u0COMP = sup inf u0 (q,x), (1.11)

qeQ xeR(q)

при этом значение p считается фиксированным.

Множество равновесий побуждения в игре (1.9), (110) есть множество исходов

IMP = {(«Г, xIMP): uo(xr, xIMP) = u0MP}, где

u0MP = sup inf u0(p,x), (1.12)

peP xeR(p)

при этом значение q считается фиксированным. Случай управления с обратной связью формализуется аналогично.

Замечание 3. Известны и другие информационные регламенты, например, игра Гермейера Г3 [7]. Поэтому предложенная классификация не претендует на исчерпывающую полноту. Однако она охватывает основные способы организации активных агентов.

Для описания распределения кооперативного дохода (1.4) целесообразно использовать теорию игр в форме характеристической функции (кооперативных игр) [11, 12]. Характеристическая функция есть отображение v: 2n ^ R, её значение v(K) характеризует выигрыш коалиции K с N . Наиболее распространена характеристическая функция фон Неймана - Моргенштерна [27]

v™(K) = val(K, N\K) = = sup if Xu.xn)•

(1.13)

Предложены также характеристические функции Петросяна - Заккура [28]

' (k) = sup x ui (xk , xn:k )

(1.14)

и Громовой - Петросяна [29]

yPG(^) = jL (xC , ^ (1.15)

где xK - набор стратегий игроков из коалиции K, xN\K - набор стратегий игроков из анти-коалиции N\K, верхний индекс NE или C обозначает равновесие Нэша или кооперативное решение соответственно. Заметим, что для всех характеристических функций (1.13)—(1.15)

Vnm(N) = vpZ(N) = vPG(N) = sup Xu(x1,..., xn) = uC,

т. е. выигрыш максимальной коалиции всегда совпадает с выигрышем при кооперации (1.4). В качестве решения кооперативной игры удобно взять вектор Шепли, который всегда существует и единствен. Компоненты вектора Шепли вычисляются по формуле [30]

Ф, = Е - (к )№)" v(K\{,})], , е N,

¡еК

^ (п - к)!(к -1)! ,

У„(к) =---, к = К\, п = Щ. (1.16)

В соответствии с формулой (1.16), доля игрока при распределении кооперативного выигрыша согласно вектору Шепли показывает его вклад во все коалиции с его участием с учётом их мощности.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1.2. Системы предпочтений и индексы сравнительной эффективности

Эффективность различных способов организации активных агентов, методов управления и распределения кооперативного выигрыша принципиально необходимо сравнивать с двух разных позиций: общества в целом и отдельных агентов. Показателями для системы общественных предпочтений служат величины суммарного выигрыша (1.3). Для удобства сравнения предположим, что всегда N = {0,1,...,п}, при этом в случаях равноправного и кооперативного поведения игрок с номером 0 ничем не отличается от остальных игроков.

Выигрыш общества при равноправии есть

(1.17)

u = minu(x),

xeNE

при кооперации

при управлении без обратной связи

uST =X u (xST), (1.19)

ieN

при управлении с обратной связью

uIST =X u (xIST) . (1.20)

ieN

Для вычисления общественного выигрыша (1.19) могут использоваться как определение (1.5), так и (1.6), а для вычисления выигрыша (1.20) -как (1.7), так и (1.8) в зависимости от того, какие сделаны предположения о благожелательности/неблагожелательности агентов. Также в качестве решения иерархической игры вместо ST можно брать множество COMP на основе формулы

(1.11) или множество IMP на основе формулы

(1.12) либо их аналоги при управлении с обратной связью на основе формул (1.7), (1.8) вместо IST. Соответственно, получим общественные выигры-

COMP IMP ICOMP IIMP

ши u , u , u , u •

Согласно определению (1.4), выигрыш общества при кооперации всегда не меньше, чем при любом другом способе организации или методе управления. Для оценки потерь (неэффективности равновесий) можно использовать индексы общественной эффективности

K ne = u

ne st ist

t^ST u T^IST u

uC uC uC

K C

K imp = u

.imp

K11

K"

u

(1.21)

Замечание 4. Использование индексов (1.21) предполагает положительность всех выигрышей, и тогда значения всех дробей не превышают единицу. Хотя это предположение считается стандартным в теории (не)эффективности равновесий [17, с. 444], оно ограничивает универсальность подхода. На самом деле, для сравнительного анализа эффективности можно использовать исходные значения выигрышей. Индексы (1.21) дают дополнительную количественную характеристику в тех случаях, когда это удобно.

Показателями для системы индивидуальных предпочтений агентов i е N служат величины:

• при равноправии -

ufE = min ц (x), (1.22)

xeNE

т. е. значение выигрыша игрока в наихудшем из равновесий Нэша (принципа оптимальности для данного способа организации);

• при кооперации -

u = max u(x),

xeX

(1.18)

C u uC =■

\N\

(1.23)

v

u

C

u

C

C

u

u

u

с

u

либо значение вектора Шепли Ф; (v) для одной из характеристических функций (1.13), (1.14) или (1.15);

• при иерархии без обратной связи ufT ;

• при иерархии с обратной связью u-ST .

В качестве множеств ST или IST можно также брать их аналоги при принуждении COMP, ICOMP или при побуждении IMP, IIMP. Для более детальной количественной сравнительной оценки подходят индексы индивидуальной эффективности

K NE _ Ui_

ST IST

¡r ST _ ui jtHST _ ui

Ki _ ~c~ , Ki

u, u

k nm _

ФМ

Kpz _

ФР

PZ

ui

comp

KC

к imp _ u

ui

TMP

ui

iimp

KPG _

K,I

ФР

PG

KI

N.

(1.24)

Показатели общественной и индивидуальной эффективности и соответствующие индексы собраны в табл. 1.

Условия координации (устойчивого развития) имеют вид

и еи*, (1.25)

где и * - некоторое заданное множество. Эти условия могут дополнять любую из рассмотренных моделей.

2. МЕТОДИКА СРАВНИТЕЛЬНОГО АНАЛИЗА ЭФФЕКТИВНОСТИ

Сравнительный анализ эффективности способов организации активных агентов и методов управления и распределения кооперативного выигрыша включает в себя следующие этапы.

1. Ввести множество активных агентов (игроков) N = {0,1,..., и].

2. При равноправии агент с номером 0 не отличается от остальных. Построить игру в нормальной форме (1.1). Найти множество равновесий Нэша (1.2). Вычислить значения показателей (1.17) и (1.22).

3. При кооперации агент с номером 0 также не отличается от остальных. Найти решение задачи оптимизации (1.4). Вычислить значения показателей (1.18) и (1.23).

4. При иерархии агент с номером 0 выполняет роль Центра (на эту роль может претендовать любой из исходно равноправных игроков). Для регламента управления без обратной связи вычислить значения выигрышей (1.5) и (1.6) и найти соответствующие множества ST. Вычислить значения показателя (1.19) и ufT .

5. Для регламента управления с обратной связью вычислить значения (1.7) и (1.8) и найти соответствующие множества IST. Вычислить значения показателей (1.20) и ц13Т .

C

u

C

u

u

с

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

с

u

u

с

u

Таблица 1

Показатели и индексы общественной и индивидуальной эффективности

Равноправие Кооперация Иерархия без Иерархия с обратной

обратной связи связью

Показатели общественной эффективности NE u uC _ v(N) ST COMP IMP u , u , u IST ICOMP IIMP u , u , u

Показатели индивидуальной эффективности, г е N ne ui uC, Ф™, Ф^, Фpg st COMP imp Щ , щ , ui ist icomp IIMP ui , ui , ui

Индексы общественной эффективности ne t^NE u K _ с uC - ST T^ST u K = ~ uC IST J^IST u K = C uC

Индексы индивидуальной эффективности, г е N ^S hall Ф nm jr^nm ^i Ki _ C ' ui ФК ffPZ i Ki _ с , ui Фга Ki _ C u u ST ¡^ST ui Ki =—, u u comp t^comp ui Ki = C , u u IMP JT^IMP ui Ki = C u u IST ¡rHST ui Ki = C , u u ICOMP T^ICOMP ui Ki = C , u ump jt^iimp ui Ki = C u

6. Для регламента принуждения в иерархической игре (1.9), (1.10) найти множество COMP согласно формуле (1.11). Вычислить аналоги показателей (1.19) и ufT.

7. Для регламента побуждения в иерархической игре (1.9), (1.10) найти множество IMP согласно формуле (1.12). Вычислить аналоги показателей (1.20) и ufT .

8. На основе игры в нормальной форме (1.1) построить игру в форме каждой из характеристических функций (1.13)—(1.15). Для этих игр вычислить вектор Шепли (1.16).

9. На основе иерархической игры с управлением при отсутствии или наличии обратной связи построить игру в форме каждой из характеристических функций (1.13)—(1.15). В этом случае возможны три различных типа коалиций: только агенты; только Центр; Центр и хотя бы один агент (включая максимальную коалицию). Для построенных кооперативных игр вычислить вектор Ше-пли (1.16).

10. Учесть дополнительно ограничения вида (1.25).

11. Построить систему общественных предпочтений путём упорядочения показателей (1.17), (1.19), (120), а также величин

COMP IMP ICOMP IIMP тт

u ,u ,u ,u . Дополнительно оценить потери от неэффективности равновесий с помощью индексов (1.21).

12. Построить систему индивидуальных предпочтений путём упорядочения показателей (1.22), (1.23). Для более детальной оценки сравнительной эффективности использовать индексы (1.24).

Замечание 5. Разумеется, что в большинстве случаев решения теоретико-игровых задач конфликтного управления могут быть найдены только численно. Тогда при сравнении используются средние значения всех введённых показателей по множеству вычислительных экспериментов для различных наборов входных данных.

Замечание 6. В зависимости от постановки задачи и возможностей исследования некоторые этапы могут быть опущены.

3. МОДЕЛИ ОЛИГОПОЛИИ КУРНО

В качестве иллюстративного примера проведём сравнительный анализ эффективности нескольких моделей олигополии Курно.

Пример 1. Олигополия Курно с симметричными агентами.

Пусть N = {1,..., п} - множество равноправных симметричных агентов (фирм). Для случая постоянных затрат с учётом налога модель имеет вид

щ (x) = (1 - p)[(D -x)xt - cxi] ^ max, 0 < xi < 1/n, i e N Здесь xi - объём выпуска продукции i-й фирмы; D - объём спроса; c - удельные затраты каждой фирмы; p e [0,1] - фиксированная ставка налога; x = xj +... + xn . Положим для определённости D = 1, c = 1/n (в работе [31] эта параметризация использована для n = 2). Тогда

u; (x) = (1 - p) I П—1 - x I x ^ max,

(3.1)

0 < xt < 1/n, i e N.

Обозначим также u (x) = u1(x) +... + un (x). Имеем

du n -1 „ ^ . ,T —L = 0 =--2x. - > x,, i e N ;

dxi n

, ^ n -1 . лг 2x + > x. =-, i e N .

ь 1 n

Значит, в равновесии Нэша

xne = xne = n - 1 . J ne = n - 1 .

' n(n +1) n +1

ne ne (1 - p)(n -1)2.

ui = u =—2-2—;

i n (n +1)2

—ne = (1 - p)(n -1)2

(3.2)

n(n +1)2

Пусть теперь агенты из множества N вступают в кооперацию. Модель принимает вид

u (x) = (1 - p) | П—1 - x | x ^ max,

I n )

0 < xi < 1/n, i e N. Очевидно, что в этом случае Vi e N xt = x, откуда

u (x) = (1 - p) | n—1 - nx | nx, I n )

и условие максимума имеет вид

— = 0 = n -1 - 2nx,

Sx

откуда получаются решение кооперативной задачи оптимизации и значения выигрышей

xc = xc = n -1; xC = n -1,

i 2n2 2n

uc = uc = (1 - p)(n -1)2 ,

i 4n3 '

_c = (1 - p)(n -1)2

u --n. .

4n2

Далее пусть агент с номером 1 становится Центром, первым выбирает значение x1 и сообщает его остальным агентам. Тогда задача каждого из этих агентов такова:

Щ = (1 - p)

n -1

- x -> xi

1=2

x ^ max,

0 < xi < 1/n, i = 2,..., n.

Условия максимума

dut n -1 ^ . _ -= 0 =--x1 -2xi - ^ xj, i = 2,..., n ,

dxi n j=2,jfi

дают оптимальный ответ каждого агента (индекс BR обозначает best response)

xBR =xBR= n -1 - nx\, i = 2,...,n .

n

Задача Центра принимает вид

U1 (x1) = (1 - p)

n -1 (n - 1)(n -1 - nx1)

1-p

——(n-1 -nx1)x1 ^ max, 0 < x1 < 1/n.

Условия максимума

du1 = 0 = n -1 - 2nx1 dx1

приводят к равновесию Штакельберга

xST = n -1. x„. =

2n

n -1

2n2 '

i = 2,..., n,

_st (n - 1)(2n -1) суммарному выпуску x = ---4,-1 и выигрышам

2n

ust = (1 - p)(n -1)2 .

4n3

st = (1 - p)(n -1)2

u =

4n

= 2,...,n;

_ST = (1 - p)(n -1)(n - n +1)

u — . .

4n

Предположим теперь, что Центр - это дополнительный агент с индексом 0, который сам ничего не производит, но назначает ставку налога p . Тогда его задачу можно записать в виде

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

'n-1

--x xp -ap2 ^ max, 0 < p < 1, (3.3)

n )

где a > 0 - коэффициент затрат на сбор налогов.

Оптимальный ответ агентов есть равновесие Нэша в их игре, которое задаётся формулой (3.2). Задача Центра принимает вид

Ü0 =-

(n -1)2 n(n +1):

ST (n -1) откуда p =

2an(n +1)2 (здесь равновесие побуждения) есть

■p - ap2 ^ max, 0 < p < 1, (3.4)

а равновесие Штакельберга

ST-IMP =

(n -1)2

n-1

n-1

ч 2an(n +1) n(n +1) n(n +1) )

Выигрыши Центра и агентов задаются формулами

imp = (n -1)2[(n -1)2 - an(n +1)2]. U° = 2an2(n +1)2 ;

, imp _ (n - 1)2[2an(n +1)2 - (n -1)2] i = 1

ui = . -> ^ л , i = 1,•

2an (n +1)4

n;

_,мр _ (п - 1)2[2ап(п +1)2 - (п -1)2]

Ы — , .

2ап(п +1)

Рассмотрим теперь экологическое ограничение (условие устойчивого развития)

¿X < (З-5)

за выполнение которого отвечает Центр (т. е. это дополнительное ограничение в его задаче оптимизации (3.4)), где й - коэффициент, характеризующий отношение объёма выбросов загрязняющих веществ к суммарному выпуску продукции; рпах - предельно допустимая величина выбросов. Тогда в равновесии Нэша это условие принимает вид

а при кооперации

n-1 < Pax

n +1 d

n-1 < Pmx

2n d

(3.6)

(3.7)

При выполнении условий (3.6) или (3.7) соответственно равноправное или кооперативное поведение агентов совместимо с условиями устойчивого развития.

В противном случае Центр может использовать механизм побуждения равноправных агентов к устойчивому развитию вида

р(х) = dn

p-, иначе.

Для исследования распределения кооперативного выигрыша построим сначала характеристическую функцию фон Неймана - Моргенштерна (1.13). Очевидно, что для любой коалиции K имеем xi = 1/n, i е N\K. Тогда

vNM (i) = (1 - p)max f— - — - x 1 xi = 0, i е N ;

x ^ n n J

n -1 n - к _

vNM(K) = (1 - p)max

x ,ieK V n

Поскольку, очевидно,

n

-xK xK, к = K| •

Vi e K x = x,

vNM(K) = к(1 - p)max( — -kx \x.

x v n

Условие

* к -1 -* x* =-, x* =

максимума к -1

к -1

- 2kx = 0

то

дает

2 kn

2 n

откуда окончательно

vnm(K )=к (1 - p) f- 1 k-1=(1 -

Соответственно,

vNM(N ) =

2Ы ) 2kn

(1 - p )(n -1)2 4n2

4n

По определению характеристическая функция Пет-росяна - Заккура (1.14) здесь совпадает с функцией фон

n

2

Неймана - Моргенштерна. Построим характеристическую функцию Громовой - Петросяна (1.15):

ОР f n-1 n-1 n-1 ^ n -1

V (i) = (1 -p)\

n n

\ 2

(1 - p)(n -1)2

4n

2n ) 2n

i e N;

vgp(K ) = (1 - p)

n -1 n - к к (n -1) ) к (n -1)

= (1 - P)

п п 2п ) 2п к (п - 1)(кп - 2п + к)

4п '

vGP(N) = (1 - Р)(п2 -1)2 = ис . 4п

В силу симметрии кооперативных игр для всех характеристических функций

(

(1- p)(n -1)2 (1 - p)(n -1)

2 л

фым = фр2=фор =

4и" ' ' 4 п3

Очевидно, что в моделях с симметричными агентами для равноправия и кооперации общественные и индивидуальные предпочтения совпадают, а распределения кооперативного выигрыша согласно вектору Шепли всегда одинаковы для всех характеристических функций.

Заметим, что в рассмотренной модели ис = щ8Т > и?Т, г = 2,..., п. Таким образом, кооперация строго выгоднее иерархии для всех агентов, кроме Центра, которому всё равно. При этом

.с - и - = (1 - р)(п -1) ( п -1 - п2 - п +1

4п2

= (1 - р)(п-1) (п2(п-2) + п-1) > 0,

4п

т. е. для общества в целом кооперация строго выгоднее иерархии. Значения индексов

4п „ п2 - п +1

Kne = -

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(n +1)2

^ 0, KST = -

. ^ 0 nl(n -1)

показывают, что с ростом числа агентов выгодность кооперации по сравнению с равноправием и иерархией увеличивается.

Пример 2. Дуополия Курно с несимметричными агентами.

Модель имеет вид

и{ = (1 - р)(1 - сг - % - х2 )хг ^ тах, 0 < хг < 1/2, г = 1, 2.

Теперь по сравнению с формулой (3.1) с{ е (0,1/2) -затраты г-й фирмы. При равноправном поведении агентов равновесие Нэша находится как решение системы дщ .

— = 0,1 = 1,2, откуда

дх1

х?Е = (1 + с] - 2сг )/3, г, } = 1,2;

= (2-c1 -c2)/3,

(3.8)

а выигрыши равны

ne

и™ = (1 - p)(1 + cj - 2ci У / 9, i = 1,2 ; = (1 - p)(2 - 2c1 - 2c2 + 5c12 + 5c22 - 8c1c2 )/9.

xc =

Кооперация агентов приводит к задаче оптимизации и = (1 - p)[(1 -X)X -c1 x1 - c2x2] ^ max, 0 < x; < 1/2, i = I 2. Система Ж/ск; =0, / = L 2—о, приводится к виду x1 + x2 = (1 - c1)/2, x1 + x2 = (1 - c2)/2, т. е. при сделанном предположении c1 Ф c2 она не имеет решений. Значения суммарной функции выигрыша на границе области допустимых управлений равны и(0, 0) = 0; и(1/2,1/2) = -(1 - p)(c1 + c2) < 0;

и (1/2, 0)=(1 - p)(1/4 - c1/2); и (0, 1/2)=(1 - p)(1/4 - c2/2).

Таким образом, решение кооперативной задачи и соответствующие выигрыши таковы:

'(1/2,0), c < c2 ^ uC = (1 -p)(1 -2c1)/4,

uC = (1 - p)(1 - 2c1)/8, i = 1, 2; (0, 1/2), c > c2 ^ uC = (1 - p)(1 -2c2)/4, uC = (1 - p)(1 - 2c2)/8, i = 1,2.

В обоих случаях суммарный кооперативный выпуск xC = 1/2.

Далее пусть агент с номером 1 становится Центром, первым выбирает значение x1 и сообщает его второму агенту. Аналогично предыдущему разделу получаем равновесие Штакельберга в виде

xfT = (1 - 2c1 + c2 )/2; x2ST = (1 + 2c1 - 3c2)/4.

При этом суммарный выпуск и выигрыши равны X2T = (3 - 2c1 - c2)/4 ; u2T = (1- p)(1- 2c1 + c2)/8; uST = (1- p)(1 + 2c1 - 3c2)/16;

и2T = (1 - p)(3 - 4c1 - 2c2 + 12c? - 20c1c2 +11c22)/16.

Предположим теперь, что Центр - это дополнительный агент с индексом 0, который сам ничего не производит, но назначает ставку налога p . Тогда его задачу по аналогии с формулой (3.3) можно записать в виде и0 = (1 - c1 - c2 - X)Xp - ap2 ^ max, 0 < p < 1.

Оптимальный ответ агентов на стратегию Центра p есть равновесие Нэша в их игре (3.8). Аналогично предыдущему разделу получаем стратегию побуждения

Центра

pimp = (1 - 2c - 2c2)(2 - q - c2)

18a

и равновесие побуждения IMP = (p , x1 , x2 ).

Наконец, рассмотрим экологическое ограничение (условие устойчивого развития) (3.5). Тогда в равновесии Нэша это условие принимает вид

d(2 - q - (2) < 3Pmax,

а при кооперации

d < 2Pmax .

Построение игры в форме характеристической функции при n = 2 нецелесообразно.

и—

ne

и

ЗАКЛЮЧЕНИЕ

Очевидный общий результат заключается в том, что в детерминированных моделях для общества в целом кооперация оказывается не хуже, чем любой другой способ организации взаимодействия активных агентов, поскольку она приводит к неотрицательному кооперативному эффекту. Возникающие при отказе от сотрудничества коллективные потери можно оценить с помощью различных индексов (классическая проблема неэффективности равновесий).

Однако для отдельных агентов вполне может оказаться выгоднее захватить лидерство или просто сохранять независимость. Неочевидны и правила распределения кооперативного выигрыша между агентами. Поэтому наряду с общественными нужно учитывать индивидуальные предпочтения, которые к тому же в общем случае неодинаковы для разных агентов. Здесь также можно использовать индексы сравнительной эффективности.

Даже в достаточно простых моделях вычислить выигрыши отдельных агентов и общества в целом и провести их аналитическое сравнение нелегко. В настоящей работе получены простые иллюстрации предложенной методики сравнительного анализа для случая симметричных агентов. В дальнейшем предполагается выполнить численное исследование сравнительной эффективности способов организации, методов управления и распределения кооперативного выигрыша для ряда статических и динамических моделей олигополии Курно.

ЛИТЕРАТУРА

1. Бурков В.Н., Новиков Д.А. Теория активных систем: состояние и перспективы. - М.: СИНТЕГ, 1999. - 128 с. [Burkov, V.N., Novikov, D.A. Teoriya aktivny hsistem: sos-toyanie i perspektivy. - M.: SINTEG, 1999. - 128 s. (In Russian)]

2. Новиков Д.А. Теория управления организационными системами. - М.: Изд-во физ.-мат. лит., 2007. - 584 с. [Novikov, D.A. Teoriya upravleniya organizacionnymi sistemami. - M.: Izd-vofiz.-mat. lit., 2007. - 584 s. (In Russian)]

3. Гермейер Ю.Б. Введение в теорию исследования операций.

- М.: Наука, 1971. - 384 с. [Germejer, Yu.B. Vvedenie v teor-iyu issledovaniya operacij. - M.: Nauka, 1971. - 384 s. (In Russian)]

4. Гермейер Ю.Б. Игры с непротивоположными интересами.

- М.: Наука, 1976. - 328 с. [Germejer, Yu.B. Igry s neprotivopolozhnymi interesami. - M.: Nauka, 1976. - 328 s. (In Russian)]

5. Моисеев Н.Н. Элементы теории оптимальных систем. - М.: Наука, 1975. - 528 с. [Moiseev, N.N. Elementy teorii opti-mal'nyh sistem. - M.: Nauka, 1975. - 528 s. (In Russian)]

6. Кукушкин Н.С., Морозов В.В. Теория неантагонистических игр. - М.: МГУ, 1984. - 106 с. [Kukushkin, N.S., Morozov, V.V. Teoriya neantagonisticheskih igr. - M.: MGU, 1984. - 106 s. (In Russian)]

7. Горелик В.А., Горелов М.А., Кононенко А.Ф. Анализ конфликтных ситуаций в системах управления. - М.: Радио и связь, 1991. - 288 с. [Gorelik, V.A., Gorelov, M.A., Kononenko, A.F. Analiz konfliktnyh situacij v sistemah upravleniya. - M.: Radio i svyaz', 1991. - 288 s. (InRussian)]

8. Laffont, J.-J., Martimort, D. The Theory of Incentives: The Principal-Agent Model. - Princeton University Press, 2002. -421 р.

9. Угольницкий Г.А. Управление устойчивым развитием активных систем. - Ростов-на-Дону: Изд-во Южного федерального ун-та, 2016. - 940 с. [Ugol'nickij, G.A. Upravlenie ustojchivym razvitiem aktivnyh sistem. - Rostov-na-Donu: Izd-vo Yuzhnogo federal'nogo un-ta, 2016. - 940 s. (In Russian)]

10. Угольницкий Г.А. Методология и прикладные задачи управления устойчивым развитием активных систем // Проблемы управления. - 2019. - № 2. - С. 19-29. [Ougolnit-sky, G.A. Methodology and Applied Problems of the Sustainable Management in Active Systems / Control Sciences. - 2019.

- No. 2. - P. 19-29. (In Rusian)]

11.Мазалов В.В.Математическая теория игр и приложения. -СПб.:Лань, 2010. - 448 с. [Mazalov, V.V. Matematicheskaya teoriya igr i prilozheniya. - SPb.: Lan', 2010. - 448 s. (In Russian)]

12.Петросян Л.А., Зенкевич Н.А., Шевкопляс Е.В. Теория игр.

- СПб.:БХВ-Петербург, 2011. - 432 с. [Petrosyan, L.A., Zenkevich, N.A., Shevkoplyas, E.V. Teoriya igr. - SPb.: BHV-Peterburg, 2011. - 432 s. (In Russian)]

13.Basar, T., Olsder, G.Y. Dynamic Non-Cooperative Game Theory. - SIAM, 1999. - 506 р.

14.Differential Games in Economics and Management Science / Dockner E., Jorgensen S., Long N.V., Sorger G. - Cambridge: Cambridge University Press, 2000. - 382 р.

15. Gorelov, M.A., Kononenko, A.F. Dynamic models of conflicts. III. Hierarchical games // Automation and Remote Control. -2015. - Vol. 76, no. 2. - P. 264-277.

16. Ougolnitsky, G.A., Usov, A.B. Computer Simulations as a Solution Method for Differential Games // Computer Simulations: Advances in Research and Applications. Eds. M.D. Pfeffer and E. Bachmaier. - N.-Y.: Nova Science Publishers, 2018. -P. 63-106.

17. Algorithmic Game Theory. Ed. by N. Nisan, T. Roughgarden, E. Tardos, V. Vazirany. - Cambridge University Press, 2007. -754 р.

18.Dubey, P. Inefficiency of Nash equilibria // Math. Operations Research. - 1986. - No. 11(1). - Р. 1-8.

19.Johari, R., Tsitsiklis, J.N. Efficiency loss in a network resource allocation game // Math. Oper. Res. - 2004. - No. 29(3). - Р. 407-435.

20.Roughgarden, T. Selfish Routing and the Price of Anarchy. -MIT Press, 2005. - 240 p.

21.Papadimitriou, C.H. Algorithms, games, and the Internet // Proc. 33rd Symp. Theory of Computing, 2001. - P. 749-753.

22.Basar, T., Zhu,Q. Prices of Anarchy, Information, and Cooperation in Differential Games // Dynamic Games and Applications.

- 2011. - No. 1(1). - P. 50-73.

23.Dahmouni, I., Vardar, B., Zaccour, G. A fair and time-consistent sharing of the joint exploitation payoff of a fishery // Natural Resource Modeling. - 2019. - 32(2). -e12216.

24.Zhang, W., Zhao, S., Wan, X. Industrial digital transformation strategies based on differential games // Applied Mathematical Modeling. - 2021. - Vol.98. - P.90-108.

25.Sharma, A., Jain, D. Game-Theoretic Analysis of Green Supply Chain Under Cost-Sharing Contract with Fairness Concerns // International Game Theory Review. - 2021. - Vol. 23. - No.2. -2050017. (32 p.)

26Мулен Э. Кооперативное принятие решений: Аксиомы и модели. - М.: Мир, 1991. - 464 с. [Mulen, E. Kooperativnoe prinyatie reshenij: Aksiomy i modeli. - M.: Mir, 1991. - 464 s. (In Russian)]

27.von Neumann, J., Morgenstern, O. Theory of Games and Economic Behavior. - Princeton University Press, 1953. - 625 p.

28.Petrosjan, L., Zaccour, G. Time-consistent Shapley value allocation of pollution cost reduction // J. of Economic Dynamics and Control. - 2003. - Vol. 27, no. 3. - P. 381-398.

29. Gromova, E.V., Petrosyan L.A. On an approach to constructing a characteristic function in cooperative differential games // Automation and Remote Control. - 2017. - Vol. 78. - P. 16801692.

30.Shapley, L. A Value for n-person Games. Santa Monica, CA:

The RAND Corporation, 1952. 31.Мулен Э. Теория игр с примерами из математической экономики. - М.:Мир, 1985. - 200 с. [Mulen, E. Teoriya igr s primerami iz matematicheskoj ekonomiki. - M.: Mir, 1985. -200 s. (In Russian)]

Статья представлена к публикации членом редколлегии академиком РАНД.А. Новиковым.

Поступила в редакцию 31.03.2022, после доработки 29.06.2022. Принята к публикации 1.07.2022.

Угольницкий Геннадий Анатольевич - д-р физ.-мат. наук, Южный федеральный университет, г. Ростов-на-Дону, Н gaugolnickiy@sfedu.ru.

Keywords: inefficient equilibria, control and resource allocation methods, organization modes for active agents.

AN APPROACH TO COMPARE ORGANIZATION MODES OF ACTIVE AGENTS

AND CONTROL METHODS

G.A. Ougolnitsky

Southern Federal University, Rostov-on-Don, Russia H gaugolnickiy@sfedu.ru

Abstract. When interacting, active agents can behave independently, cooperate, or have hierarchical relations. In turn, a hierarchical impact may be exerted by administrative or economic methods with or without feedback. These organizational modes and control methods are systematically described based on game-theoretic models with different information structures without uncertainty. It seems crucial to compare the payoffs of separate agents quantitatively with social welfare under the organization modes and control methods. A methodology is proposed to build the systems of social and individual preferences in normal form games and determine shares when allocating the cooperative payoff. A system of relative efficiency indices is developed for detailed quantitative assessment. This methodology is illustrated by several Cournot oligopoly models.

i Надоели баннеры? Вы всегда можете отключить рекламу.