МАТЕМАТИКА И МЕХАНИКА
УДК 519.8
К решению игры олигополии Курно при неполной информации с возможностью кооперативного взаимодействия
Ю.Г. Алгазина1, Д.Г. Алгазина2
'Алтайский государственный технический университет им. И.И. Ползунова (Барнаул, Россия)
2Алтайский государственный университет (Барнаул, Россия)
Solving the Cournot Oligopoly Game under Incomplete Information with the Possibility of Cooperative Interaction
Yu.G. Algazina1, D.G. Algazina2
'Polzunov Altai State Technical University (Barnaul, Russia) 2Altai State University (Barnaul, Russia)
Сбалансированность товарных рынков является крайне важной и актуальной задачей. Наблюдается активное развитие исследований, направленных на решение этой задачи. Однако известные теоретические модели не всегда адекватно отражают стремление агентов к принятию таких индивидуальных решений и поиску таких компромиссов, чтобы обеспечить наибольшую прибыль и привести рынок к равновесию.
В статье рассматривается решение игры олигополии Курно при неполной информации для случая линейного спроса и линейных издержек. В основу построения процесса принятия агентами решений положены подходы теории рефлексивных игр и теории коллективного поведения. При традиционных предположениях о независимости агентов политика оптимальных ответов агентов на ожидаемые объемы выпуска окружения может не приводить к равновесию, поэтому нами рассмотрены и предложены нетрадиционные решения, допускающие возможность кооперации агентов. Показано, что достаточно совместно отрегулировать процесс только на начальной стадии, чтобы он приходил к равновесию, если в дальнейшем агенты будут самостоятельно корректировать собственный выпуск, рассчитывая на максимальную ожидаемую прибыль. Приведены необходимые утверждения и их математические доказательства. Ключевые слова: олигополия Курно, неполная информированность, рефлексивное коллективное поведение, независимость агентов, кооперативные решения, равновесие по Нэшу.
DOI: 10.14258/izvasu(2022)4-12
The balance of commodity markets is an extremely important and pressing challenge. There is an active development of research aimed at solving such problem. However, well-known theoretical models do not always adequately reflect the desire of agents to make such individual decisions and search for such compromises to ensure the greatest profit and bring the market to equilibrium.
The article considers the solution of the Cournot oligopoly game under incomplete information for the case of linear demand and linear costs. The approaches of the reflexive games theory and collective behavior theory are the basis for the construction of the decision-making process by agents. The policy of optimal responses of agents to the expected output volumes of the environment under traditional assumptions about the independence of agents may not lead to equilibrium. Therefore, the article considers and proposes non-traditional solutions that allow agents to cooperate. It is shown that it is enough to jointly regulate the process only at initial stage. After that, it should come to equilibrium if, in the future, agents independently adjust their own output, counting on the maximum expected profit. The necessary assertions and their mathematical proofs are given.
Key words: Cournot oligopoly, incomplete awareness, reflexive collective behavior, agent independence, cooperative solutions, Nash equilibrium.
Введение
В игре олигополии выбор действия каждого агента (фирмы) зависит от того, какие действия выберут другие агенты, относительно которых трудно однозначно сказать априори. Что вынуждает агентов рефлексировать, т.е. предсказывать поведение окружения и выбирать свои действия уже с учетом этого прогноза [1]. Определяющим эффектом рефлексии является достижение равновесия (решения игры), определяемого как устойчивый по Нэшу [2] исход взаимодействия агентов. Поэтому математические исследования, направленные на повышение адекватности таких прогнозов, являются актуальными для современных рынков.
В конкурентной среде агенты часто не заинтересованы раскрывать другим агентам свою информацию, являющуюся существенной для адекватного прогноза. В этих условиях растет понимание того, что равновесие достигается не в результате однократного выбора рациональными агентами своих действий, а как исход итерационного процесса рефлексивного принятия ими решений (см., например, [1, 3-7]). Рациональность поведения агента заключается в желании максимизировать собственный выигрыш.
Наиболее распространенной для исследования динамики принятия агентами рациональных решений является теория коллективного (группового) поведения (см., например, [8]). Подходы теории игр и теории коллективного поведения согласованы в том смысле, что статичное по Нэшу равновесие игры в нормальной форме, как правило, является равновесием динамики коллективного поведения [1].
Однако при классических предположениях в моделях коллективного поведения конкурентного рынка о независимости и взаимной информированности агентов динамика может не приводить к равновесию,
Здесь ^+1 € [0; 1] — параметры, выбираемые агентами.
Модель (1) является наиболее распространенной моделью динамики коллективного поведения, суть ее состоит в следующем. В каждый текущий ^ + 1)-й момент времени каждый из агентов наблюдает действия ^ всех агентов, которые они выбрали в предыдущий момент времени % и выбором величины шага ^+1 изменяет свое состояние в момент времени t в направлении текущего положения цели, следуя итерационной процедуре (1).
линейными функциями затрат р. (^) = сд{ + й и линейной обратной функции спроса вида р(0) = а — bQ.
Здесь qi — выпуск (действие) 1-го агента, Q = ^ q. — суммарный объем выпуска, с,, й. —
особенно в тех случаях, когда рациональные агенты выбирают оптимальные или близкие к ним ответы на действия конкурентов. Поэтому есть основания для рассмотрения моделей коллективного поведения с возможностью кооперации агентов.
Основной целью настоящей статьи является решение игры олигополии Курно [9] при неполной информации с использованием модели рефлексивного коллективного поведения для случая линейного спроса и линейных издержек, поиск возможностей кооперации, обеспечивающей адекватность процесса рефлексии. В данном контексте под адекватностью понимается стремление агентов только так регулировать собственное действие, чтобы обеспечить наибольшую прибыль.
Постановка задачи исследования
Рассматривается конкурентный рынок, состоящий из п взаимосвязанных целенаправленных агентов (фирм), функционирующий в дискретном времени. Состояние рынка в момент времени t дается п-мерным вектором qt = ,..., qti,..., qtn), t = 0, 1, 2, ... и текущее положение цели г-го агента х1 (^)( i € N = {1,..., п}) зависит от состояний (действий) остальных агентов, где q-i = ^,..., qti_l, qit+1, qtn). Текущее положение цели агента — такое его действие, которое максимизировало бы его целевую функцию при условии, что в текущий момент времени остальные агенты выбрали бы те же действия, что и в предыдущий (см., например, [1, 10]).
Будем предполагать, что при переходе от предыдущего момента времени t к последующему ^ + 1) смена состояния рынка представляется в виде преобразования
(1)
На сегодняшний день имеется немало прикладных моделей, иллюстрирующих эффекты коллективного поведения по (1) (см, например, [1, 6, 8, 10, 11]).
В качестве прикладной модели рефлексивного коллективного поведения рассмотрим классическую модель олигополии, состоящую из п агентов, конкурирующих объемами выпуска однородной продукции, с целевыми функциями
(2)
предельные и постоянные издержки агентов, р^) — единая рыночная цена, а, Ь — параметры спроса. Полагается, что весь выпуск реализуется, ограничения мощности отсутствуют.
^+1 = ^ + 7;+1(хг (^)- ^), г € N, t = 0, 1, 2, ....
П(р(О),qi) = р(О)^ - ^ (^) ^ тах, г € N ,
qi
Определим для данной прикладной модели расчетные формулы для положения цели 1-го агента в текущий ^ + 1)-й момент времени — х{ ((- )(£ = 0, 1, 2, ...). Введем следующие обозначения:
к =
а - с.
(3)
(4)
В условиях конкуренции каждому агенту при определении своей рыночной стратегии необходимо принимать в расчет поведение конкурентов. В нашем случае каждый агент реагирует на действия конкурентов по Курно [9], т.е. устанавливает объем выпуска, полагая, что другие агенты оставят свои объемы выпуска неизменными. Тогда текущее положение цели агента или его оптимальный ответ на действия окружения задается выражением (см., например, [4, 5])
чаях, когда агенты выбирают оптимальные или близкие к оптимальным ответы на действия конкурентов. В частности (см, например, [4, 5]), при +1 = 1 V/ е N(£ = 0, 1, 2, ...) (т.е. когда агенты всегда выбирают свой наилучший отклик на предполагаемые текущие действия конкурентов) процесс (1) для п > 2 расходится.
Основной задачей настоящей статьи является формирование на основе модели (1) процесса рефлексивного поведения, сходящегося к равновесию Нэша в игре олигополии (2) в условиях неполной асимметричной информированности агентов и неточности предсказаний ими действий конкурентов. Особенностью подхода к ее решению является то, что динамический процесс принятия решений осуществляется путем оптимальных ответов агентов на ожидаемые объемы выпуска окружения. Поскольку при традиционных предположениях о независимости агентов такая политика зачастую не позволяет получить сходящиеся процессы, в статье рассмотрены и предложены нетрадиционные решения, допускающие возможность кооперации агентов.
X ((-/) =
К - Qt-i
(/ е N; I = 0, 1, 2, ...). (5)
Напомним также, что в данной рефлексивной модели олигополии выбор действий всеми агентами осуществляется синхронно (одновременно). Агенты не знают, что другие агенты действуют так же. Все агенты точно знают собственные затраты и целевую функцию, собственную функцию реакции, включающую параметры спроса а и Ь, ранее произведенный выпуск другими агентами, но не располагают достоверной априорной информацией относительно ожидаемых объемов их выпуска, множеств допустимых действий, функций затрат и целевых функций конкурентов.
Традиционно в рефлексивных моделях коллективного поведения используются предположения о независимости и взаимной информированности агентов:
— агенты в каждый момент времени принимают решения одновременно и независимо, т.е. при отсутствии (явных) соглашений об объемах выпуска (коалиций);
— каждый агент в каждый момент времени (£ + 1) знает действия всех агентов, выбранные ими в предыдущий момент времени £
— каждый рефлексирующий по Курно агент не знает действий других агентов, синхронных своему действию, но может пытаться предсказывать, считая, что они будут такими же, что и в предыдущий момент времени.
В рамках этих предположений динамика (1) может не приводить к равновесию, особенно в тех слу-
Основные результаты исследования
Предположим, что равновесие ((с) = (((с), ..., ((с),..., (П)) на рынке олигополии существует, единственно и ((с) = 0, V/ е N. В дальнейшем речь идет о сходимости к этой точке.
Условия сходимости процессов коллективного поведения (1) к положению равновесия относятся к начальным приближениям (0 = ..., (П) параметрам +1 и общему числу агентов на рынке. Полагаем, что (0 > 0.
Под сходимостью к равновесию понимаем сходимость по евклидовой норме. Под равновесием понимается равновесие Нэша.
Введем функции-индикаторы [10] аI = х ((-)-(, характеризующие отклонения текущих выпусков от текущих оптимумов агентов. Известно (см., например, [4, 5]), что к = Q(c) + (с),/е N (здесь Q(с) ((с)). Эту формулу можно также получить
из предельных выражений при t ^ ж для (5).
Тогда имеем
а' =-($с) + ((с)- Qt - (), /е N. (6)
Функции-индикаторы а? можно рассматривать в качестве оценки «удаленности» агентов от положения равновесия [4, 5].
С учетом введенных обозначений (3)-(6) перепишем (1) в виде
(+1=( + 7;, / е N, 7;+1 е (0; 1]. (7)
Ь
Справедливо равенство
а.
—Е
1 + п^
ам = а'
j€N 1 *
—Е а1 - а', г € N. 1 + п^1€М 1 2 г
(8)
Приведем вывод (8). Из (6) суммированием аI по индексу г € N и получаем
Е
! 1 + п
а. =-
jeN 1 2
(^(с)- Qt
(9)
Тогда а' = — Е а +1 (qfc) - а
м и а'+1-
1 + п
Е
а + -qí+1 = а'
1€Ы 1 2 г
С учетом (7) получаем (8).
В последующем потребуется лемма.
Е аt +14..
1 + п^1€М 1 2*
Лемма
Пусть последовательность {7!} не стремится к нулю при t ^ то. Тогда процесс (7) сходится к равновесию
только в том случае, если сходится последовательность {Е а
Доказ ательств о
Пусть {Е .ема1} сходится при t ^ то. Тогда по (8)
7;+1
имеем
а
1-
—Е
1 + п^
.а.
1еМ 1
а
Правая часть этого равенства стремится к нулю, поэтому а\ ^ 0. На основании (7) последовательность {qit} сходится, а из определения (6) для величин а\ следует, что qti ^ qi(c). Пусть теперь процесс сходится к равновесию. Тогда а\ ^ 0 Уг € N и {Егаti } ^ 0 Лемма доказана.
Следствие
Из доказательства леммы также следует,
Е ,
может сходиться только к нулю.
аналогия с доказанной леммой может быть неуместной. Покажем это. Пусть в некоторый момент времени t оказалось, что Е-аа^ = 0. По (9) следует, что
Qt = Q(c), но не следует, что а\ = 0, т.е qti ^ qi(c)Уг € N. Другими словами, не следует, что сами агенты находятся в положении равновесия.
В следующем утверждении устанавливается факт сходимости динамики (1) в том случае, когда, начиная со второй итерации, агенты делают «полные» шаги, т.е. делают свой оптимальный выбор. На первой итерации величина шага 7! каждого агента подлежит согласованию между агентами.
Утверждение
На рынке Курно с произвольным числом агентов
процесс (1) придет в равновесие Нэша 2
при 71 =-(Уг € N) и у!+1 = 1 (Уг € N, t = 1,2, ...)
г 1 + п
для любых начальных условий г € N}.
Примечание
Справедливость леммы показана для предельного перехода. Однако для конечного момента времени I
Доказательство
Из выражения (8) получаем:
а!+1 -
—Е
1 + п^
t+1 0 а. = а. ■
1ем 1 г
1 + п
Е
а
1ем 1
t т+1 т . 7 а. 2^ т=0 ' г
0 1
(10)
После суммирования по индексу г из последнего выражения получаем:
-±- Е а'.+ = Е
1 + 1
1 0 1
-а,
1 + п 1
0 t
т + 1
7 ат
г
(11)
Если на первой итерации все агенты выберут шаги, 2
равные 71 = --, то по (11) имеем, что Е .а* = 0 .
Если далее на второй итерации агенты выберут полные шаги 72 = 1 (Уг € ^ , то из (8) имеем
а,2-
1
1 + п
Е
а2 =
1€Ы 1
1-*
а1 = 1 а1. Из суммирова-
ния последних равенств по индексу i следует,
что ^ ,а;2 = 0 поэтому а2 == 1 а*.
Аналогично показывается, что на третьей итера-
3 1 2
ции а^ ==— са и т.д. На 1-й итерации имеем
а' =-1-а1. Следовательно, а' ^ 0 и а' ^ а(с) ' 2 ' ' ' '
при ' ^ ж.
Утверждение доказано.
Следствия
1. Если для начальных условий {а°. / е N} имеет место О0 = О(с), то при 7'+ = 1 (V/ е N, ' = 0,1,2, ...) процесс (1) придет в равновесие. 2. Если для началь-
ных условий {а°. / е N} имеет место О0 = О(с) и агенты знают, что начальный суммарный выпуск является равновесным, а также знают формулу с^) = к - ), то агенты могут определить свои равновесные выпуски, обходясь без итераций. 3. Если агенты знают формулу (9) и формулу ) = к - О(с), то уже после первой итерации процесса агенты могут определить свои равновесные выпуски. Последующих итераций не потребуется.
Пример. Пусть на рынке п = 4 и к = (128, 126, 102, 114), а0 = (12, 20, 36, 28). На первой итерации по договоренности между агентами устанавливаются пара-
2 2
метры 7! =-= — . По (6) имеем а0 = (10, 5, -15, -5)
' 1 + п 5
и по (7) а1 = (16, 22, 30, 26).
Используя (6) для а'+1 и а', а также (7), имеем:
at+1 =
7Г
a,■
л та, =
ieN 1
Л
2^ 1€N\l1 i1
(12)
По (12) следует, что а1 = (9, 5, -11, -3).
При Y2 = 1 (Vi е N) по (7) имеем q2 = (25, 27, 19, 23),
а по (12) а2 =
21,5) и а3 =
9 5 11 31 „2, 2, 2 , 2) При 73 = 1 (V/ е N) имеем а3 = (29,5; 29,5; 13,5; 9 5 11 3 22, 22, 22, 22 При 74 = 1 (V/ е N) имеем а4 = (31,75; 30,75; 10,75; 9 5 11 3 23, 23, 23, 23 Процесс сходится к равновесию а(с) = (34, 32, 8, 20).
20,75) и а4 =
Заключение
В последнее время все больше внимания исследователей привлекают проблемы поиска наилучших решений в условиях конкуренции и неполного знания. Общепринятым математическим аппаратом иссле-
дования таких проблем является теория игр. Вместе с тем нередко теоретические модели рефлексивного поведения агентов не всегда адекватно отражают стремление агентов только так индивидуально регулировать собственное действие и поиск возможностей компромиссов, чтобы обеспечить наибольшую прибыль.
В статье предпринята попытка ввести элементы кооперации в процесс коллективного поведения для модели олигополии Курно для случая линейных издержек агентов и линейного спроса. Показано, что достаточно совместно отрегулировать процесс только на начальной стадии, чтобы он приходил к равновесию, если в дальнейшем агенты будут самостоятельно корректировать собственный выпуск, рассчитывая на максимальную ожидаемую прибыль.
Полученные результаты могут иметь практическое значение для понимания и регулирования группового поведения на современных конкурентных рынках.
Библиографический список
1. Novikov D.A., Chkhartishvili A.G. Reflexion and Control: Mathematical Models. Leiden, 2014.
2. Nash J. Non-Cooperative Games // Annals of Mathematics. 1951. № 54.
3. Askar S.S., Elettrebybc M.F.The Impact of Cost
Uncertainty on Cournot Oligopoly Games // Applied Mathematics and Computation. 2017. Vol. 312.
4. Algazin G.I., AlgazinaYu.G. Reflexive Dynamics in the Cournot Oligopoly under Uncertainty // Automation and Remote Control. 2020. Vol. 81. № 2.
5. Алгазин Г.И., Алгазина Д.Г. Моделирование динамики коллективного поведения в рефлексивной игре с произвольным числом лидеров // Информатика и автоматизация. 2022. № 21 (2). DOI: 10.15622/ia.21.2.5.
6. Гераськин М.И. Рефлексивный анализ равновесий в игре триполии при линейных функциях издержек агентов // Автоматика и телемеханика. 2022. № 3. DOI: 10.31857/ S0005231022030084.
7. Ueda M. Effect of Information Asymmetry in Cournot Duopoly Game with Bounded Rationality // Applied Mathematics and Computation. 2019. Vol. 362. DOI: 10.1016/j. amc.2019.06.049.124535.
8. Опойцев В.И. Равновесие и устойчивость в моделях коллективного поведения. М., 1977.
9. Cournot A. Researches into the Mathematical Principles of the Theory of Wealth // London, 1960. (Original 1838).
10. Малишевский А.В. Качественные модели в теории сложных систем. М., 1998.
11. Fedyanin D.N. Monotonicity of Equilibriums in Cournot Competition with Mixed Interactions of Agents and Epistemic Models of Uncertain Market // Procedia Computer Science. 2021. Vol. 186 (3).