УДК 519.86
Динамика рефлексивного коллективного поведения в модели олигополии с лидерами
Г.И. Алгазин, Д.Г. Алгазина
Алтайский государственный университет (Барнаул, Россия)
Dynamics of Reflexive Collective Behavior in the Oligopoly Model with Leaders
G.I. Algazin, D.G. Algazina
Altai State University (Barnaul, Russia)
Рассматривается проблема достижения равновесия Нэша на рынке олигополии фирмами-олигопо-листами, действующими по Штакельбергу, с применением рефлексивных повторяющихся игр и моделей динамики коллективного поведения. Олигополисты, основываясь на наблюдении за текущей ценой товара и собственных размышлениях о наилучшем собственном действии с учетом наилучших откликов остальных фирм, при повторении игры уточняют по модели коллективного поведения свои объемы выпуска, делая шаги в направлении текущего оптимального выпуска. Развитие динамики может направляться правилами игры на величины шагов. В нашем случае рефлексивной игры длины шагов могут меняться во времени, но фирмы в каждый момент времени должны следовать политике единой длины шага. В классе линейных функций спроса и издержек олигополистов получены необходимые и достаточные условия сходимости динамик в дискретном времени к равновесию Нэша. Динамики сходятся при любых первоначальных значениях выпуска и цены. Перспективными представляются исследования сходимости динамик, в которых каждая фирма может придерживаться своей собственной политики выбора величины шага, отличной от политики других фирм.
Ключевые слова: олигополия, поведение по Штакельбергу, равновесие по Нэшу, рефлексивные игры, коллективное поведение, текущие цены, уточнение выпусков, сходимость динамики.
The problem of achieving Nash equilibrium in the oligopoly market with oligopolistic firms that acted on Stackelberg using reflexive repetitive games and models of collective behavior dynamics is considered. Oligopolists observe the product current price and use their own reflections on what actions should produce the best response from remaining firms. They repeat the game and clarify output using collective behavior models, making steps towards the current optimal release. The development of the dynamics can be directed by rules of the game with the step size. In case of reflexive games, step sizes can change over time, but firms at each time point must follow a unified policy of the same step size. The necessary and sufficient conditions for the convergence of dynamics in discrete time to the Nash equilibrium are obtained in the class of linear demand and cost functions of oligopolists. Dynamics converge for any initial output and price. Studies of the convergence dynamics when each firm may follow its own independent policy of step size choice are seemed to be prospective.
Key words: oligopoly, Stackelberg behavior, Nash equilibrium, reflexive games, collective behavior, current prices, clarifying output, dynamic convergence.
DOI 10.14258/izvasu(2018)1-11
На конкурентном олигопольном рынке каждая из рациональных фирм, желая увеличить собственную прибыль, стремится стать лидером. Лидерские амбиции обязывают их правильно прогнозировать поведение и выбор конкурентов. Однако, наблюдая текущее состояние рынка, одна, несколько или все фирмы могут убедиться в том, что из-за неправильно-
го прогноза их текущие объемы выпуска продукции не являются оптимальными. Естественно, что у них возникает желание уточнить свои будущие объемы выпуска так, чтобы они были оптимальным ответом на действия конкурентов. Если это удастся сделать всем фирмам, то олигополия придет в так называемое состояние неравновесия по Штакельбергу, соот-
Динамика рефлексивного коллективного поведения...
ветствующее истинным (оптимальным относительно выбора конкурентов) выпускам фирм. Это состояние будет также равновесием по Нэшу, т.е. фирмы не будут заинтересованы, чтобы в одиночку изменить его, хотя существует доминирующее над ним состояние равновесия по Курно, в котором фирмы получают больше прибыли (см., например, [1-4]).
Работа посвящена построению и исследованию в рамках классической модели олигополии траекторий уточнения фирмами своих выпусков, которые бы гарантированно приводили к неравновесию по Штакельбергу. Теоретической основой для этого являются теория рефлексивных игр (см., например, [3, 4]) и теория коллективного поведения (см., например, [5-7]). Теоретико-игровой подход и теория коллективного поведения дополняют друг друга тем, что в условиях неполной информированности агентов и неадекватности предсказаний действий конкурентов рефлексивные игры позволяют использовать процессы коллективного поведения и результаты размышлений игроков, приводящие к равновесию Нэша. Основным результатом работы являются необходимые и достаточные условия сходимости траекторий, основанных на процессах коллективного поведения.
Чтобы успешно конкурировать с другими участниками олигополии, фирмы-агенты должны уметь прогнозировать действия своих конкурентов (осуществлять рефлексию). Поэтому математические исследования, направленные на повышение адекватности таких прогнозов, являются актуальными для современных рынков.
В отличие от классического поведения по Штакельбергу, когда лидер делает ход первым, здесь выбор реальных действий всеми фирмами осуществляется синхронно (одновременно). Однако предварительно каждая фирма играет с фантомными агентами на основе эмпатии, т.е. следуя логике рефлексивного реагирования по Штакельбергу, размышляет о наилучшем собственном действии с учетом наилучших откликов остальных фирм на рынке. Подобный прием обоснован и использован, например, в [4, 7-9]. В [4] достижение неравновесия по Штакельбергу изучается в условиях неправильного (итеративно уточняемого) представления фирм о предельных издержках других олигополистов. В [9] получены условия равновесия по Нэшу при асимметричной информированности агентов с нелинейными функциями издержек для случая нескольких лидеров. В [10] на модели олигополии показано, что метод рефлексивного разбиения множества агентов в моделях коллективного поведения при определенном диапазоне начальных действий агентов позволяет реализовать равновесные по Нэшу уровни выпуска путем введения агентов различных рангов рефлексии. Возможности изменения правил поведения, или ранга рефлексии агентов, приводящих к равновесию с использованием динамических имитационных моделей в непрерывном
времени, обсуждается в [11]. В [12] с применением метода численного моделирования обсуждаются условия сходимости процессов рефлексии с различным порядком ходов. В целом в аналитической форме условия сходимости динамик коллективного рефлексивного поведения преимущественно изучены для случая дуополии.
Цель работы — показать, что на олигопольном рынке, состоящем только из ведущих агентов, последние, основываясь на наблюдении за текущей ценой товара и оставаясь неизменными в своих неверных исходных предположениях о поведении конкурентов, могут в динамике уточнять собственный выпуск так, чтобы привести рынок в неравновесие по Штакельбергу.
Базовая модель олигополии
На рынке присутствует п фирм-агентов, конкурирующих объемами выпуска однородной продукции. Каждый агент продает произведенный им выпуск q. по единой рыночной цене р(0), которая
определяется общим объемом выпуска Q = ^ "= qi.
Фирмы рациональны, и их действия направлены на максимизацию собственной прибыли [4, 7, 8, 12]:
П. Ш), qi) = рШ, - ф ^) ^ тах, . = 1, ...,п (1)
qi
Цена р(О) и полные издержки фирм ф ^) заданы линейными функциями:
р(О) = а — bQ, ф(^) = сд{ + . = 1,...,п,
(2)
где а,Ь — параметры спроса; с, — предельные и постоянные издержки фирм.
Кооперация фирм друг с другом и ограничения мощности отсутствуют. Полагается, что весь выпуск будет реализован. Оптимальный объем выпуска на-
ходится из условия а — с.
дП.
дqi
= 0, что с учетом (2) дает
q^ =-
ь
— О—
2 +
до^
дqi
-, где обозначено qj.
Адаптивная динамика и условия ее сходимости в модели олигополии, в которой все агенты — ведущие
Полагаем, что все фирмы действуют по Штакельбергу, т. е. каждая фирма считает, что остальные действуют по Курно. Тогда для всех агентов будут выполнены условия [4, 7, 8, 12]
дqi
п — 1
-, . = 1,..., п.
(3)
В теории рефлексивных игр вектор (ql,q2,...,qn), компоненты которого соответствуют правильным представлениям каждого агента, понимается как истинное информационное неравновесие (или просто неравновесие) по Штакельбергу (см., например, [3, 4]). Ниже обозначим верхним индексом "(S)" показатели рынка для неравновесия по Штакельбергу.
В состоянии истинного информационного неравновесия для каждого агента справедливы соотношения
с + bqf} In = p(Q(S)).
(4)
Справедливо также и обратное: если для вектора действий (q1,q2, ■■■,qn) агентов выполняется система равенств (4), то он является неравновесным по Штакельбергу. Этот факт следует из того, что дифференцирование (4) по q. приводит к равенству (3).
Таким образом, по системе равенств (4) можно судить, является ли вектор действий (q1,q2, ■■■q^) неравновесным по Штакельбергу.
Итеративный процесс для нахождения неравновесия состоит из следующих этапов.
1. Агенты, наблюдая в текущем периоде t цену товара pt—\ которая сложилась в предыдущем (t — 1)-м периоде, и полагая, что и в текущем периоде все агенты выберут те же действия, как и в предыдущем периоде, рассчитывают с учетом выполнения условия (4) свой текущий оптимальный выпуск xt—1
bxt— —1 (1 +1/ n) = pt—1 + bq.t—1 — с..
(5)
2. Агенты изменяют свой выпуск за предыдущий (' — 1)-й период, делая от него шаг по направлению к текущему оптимальному выпуску х'—1 по формуле
^ = ^—1 + 7 '(х'—1 — £—1), I = 1,..., п, (6)
где 7' е [0; 1] — параметры, определяющие величины шагов.
3. Аукционер по текущему выпуску агентов формирует рыночную цену товара р' = а — .
Затем процесс повторяется с п. 1. Перейдем к выводу условий сходимости этого процесса.
Из формул (2), (5) и (6) имеем
t t—1 , Y 'n
q.= qi +—г
n + 1
a ci r*t—1 1 t—1
—--Q — qi
(7)
После суммирования (7) по индексу i для t-го и (t — 1)-го периодов получаем
q' = Qt—1 +
Ytn
n +1
Qt—1 = Qt—2 + ^JL n + 1
t — ci — n2 +1 Q—1
t! b n Q
'fa—±. — n2 +1 Qt—2
(8)
Умножим левую и правую часть первого выражения на 71, а второго — на 7', исключив случай равенства параметров нулю. Затем вычитаем одно полученное выражение из другого и преобразуем их разность к виду
Q' — Qt—1 =
Q Q Yt—1 Или
q' — Qt—1 = T- (Q1 — Q° )П
1 — Y'
,—1 n2 +1
n+1
Qt—1 — Q
(9)
1 — Y'
tn2 +1
n+1
(10)
Здесь Q0 — первоначальный общий объем выпуска. Сходимость Q' — Q'—1 ^ 0 будет иметь место, если 7' ^ 0 либо начиная с некоторого ' будет вы-
полняться неравенство
1 — Y'
tn2 +1
n+1
< 1, т.е.
Y' е
0, min U,
2(n + 1) 1
n2 +1I
(n > 1).
(11)
Теперь покажем, что для каждого агента временная последовательность {qj} сходится и ее предел
является ситуацией неравновесия по Штакельбергу. По (8) и (10) имеем
n +1
tta — с- — n2 +1 Qt—1
:1т (Q1 — Q° )ft
Y t=1
1 — Y'
tn2 +1
n + 1
Поэтому при условии (11) имеем ¿4a — с. n +1 t—1
t-.---Q ^ 0 и, следовательно,
i=1 b n Q) = lim q' =
(n2 + 1)b 7=1 b
a — c.
, где выражение
справа определяет неравновесный по Штакельбергу общий выпуск агентов Q(S ).
Далее с учетом (7) для t-го и (t — 1) -го периодов получаем
t t—1 Y
q.— q' = y—1
1-
n + 1
t—1 t—2 q' — qi
Y 'n n +1
Q'—1 — Q'—2
(12)
Динамика рефлексивного коллективного поведения.
Поэтому при выполнении условия (11) из последнего выражения имеем:
11т( q' — q'—1 )= Нт^—
1
7
" + 1
— 2 ) — (О—1 —О'—2 ) =
зп + 1
= Нт
7
'^^ ^ Из формул (7) и (12)
1
п + 1
1
'—1
7
1
7
п +1
п +1
= Нт ^ ^ — qi0 )П
7 V
о'—1—о'—2 )=
1-
п + 1
= 0.
п + 1
а с. г*'—1 1 я
—--О — qi
Откуда следует, что 11т
а с. ,-у—1 1 1
—--О — qi
: ^ — ) — 11т1 qií—1 = 0, q<S) = 11т q;—1 = п
а — с.
А—О
(5)
Здесь q<iS) — неравновесный по Штакельбергу выпуск г-го агента.
или 7' =-. Для этой политики выполнено усло-
' + 1
Допустим, условие (11) не выполняется. Тогда вие доказанного утверждения и 7 ^ 0. Поэтому процесс Брауна сходится к равновесию.
3. В (10) может для некоторого С иметь место
по (10) последовательность {о ' — О ' 1} расходящаяся, а из (8) следует, что расходится и последовательность {О '—1}.
Итак, доказано следующее утверждение.
Утверждение
Вмодели олигополии слинейными функциями спроса и издержек агентов, в которой все агенты ведущие, для того чтобы итеративный процесс (5)-(6) сходился к неравновесию по Штакельбергу, необходимо и достаточно, начиная с некоторого ( выполнение условия:
7' е (0,1] при п = 1,2 и 7'
0,
2(п +1)
п2 +1
при
2.
Обсуждение и выводы
1. Может иметь место альтернативный вариант итеративного процесса, когда агенты наблюдают не цену, а текущий суммарный выпуск всех агентов. Тогда п. 3 процесса может отсутствовать, а каждый агент рассчитывает в п. 1 цену самостоятельно, полагая, что формулу и параметры цены а, Ь он знает точно.
2. Для итеративных игровых процессов Брауном предложена политика выбора шага 7', исходящая из принципа равного вклада в формируемую стратегию qt¡ оптимальных ответов х( и опыта, накоплен-
ного в ' сыгранных партиях. Тогда
1 — 7'
7
п + 1
п +1
—1 = о <5) =
. Тогда при ' > '* будет О' = О' 1 и по (8)
^-Ч и в (6) в качестве теку-
п2 +1
Ь
щего положения цели х' 1 в процессе будет всегда вы-
ступать его истинное значение q(S). Поскольку
— q(S) = (1 — 7')(1 — q(S)) = (q0, — q(S ))П(1 — 7'),
то процесс сходится ( qi0 — первоначальный объем выпуска /-го агента).
4. В условиях доказанного утверждения процесс (5)-(6) сходится при любых первоначальных значениях выпуска и цены.
5. Представляются перспективными исследования таких процессов, в которых каждый игрок может придерживаться своей собственной политики выбора величины шага , отличной от политики других агентов. Для таких процессов вряд ли возможны общие аналитические выводы даже для олигополии с линейными функциями затрат и спроса, хотя вполне продуктивным может являться метод численного или имитационного моделирования. Представляет также интерес получение аналитических выражений условий сходимости для некоторых частных случаев процессов, учитывающих определенный содержательный смысл в том, почему в конкретном периоде тот или иной агент выбирает именно такой, а не другой шаг.
=1
е
1
Библиографический список
1. Myerson R. Game Theory: Anaysis of Conflict. — London, 1991.
2. Sakovics J. Games of incomplete information without common knowledge priors // Theory and decision. — 2001. — № 50.
3. Novikov D., Chkhartishvili A. Reflexion and Control: Mathematical Models. — London, 2014.
4. Алгазин Г.И., Алгазина Д.Г., Пятковский О.И. Неравновесие по Штакельбергу и динамика коллективного поведения // Изв. Алт. гос. ун-та. — 2017. — № 1 (93). DOI: 10.14258/isvasu(2017)1-11.
5. Опойцев В.И. Равновесие и устойчивость в моделях коллективного поведения. — М., 1977.
6. Васин А.А., Васина П.А., Рулева П.Ю. Об организации рынков однородных товаров // Известия РАН. Теория и системы управления. — 2007. — № 1.
7. Algazin G.I., Algazina D.G. Collective Behavior in the Stackelberg Model under Incomplete Information // Automation and Remote Control. — 2017. — Vol. 78, № 9. DOI: 10.1134/S0005117917090077
8. Алгазин Г.И., Алгазина Д.Г. Информационное равновесие в модели динамики коллективного поведения на конкурентном рынке // Управление большими системами. — 2016. — № 64.
9. Geras'kin M.I., Chkhartishvili A.G. Game-theoretic models of an oligopoly market with nonlinear agent cost functions // Automation and Remote Control. — 2017. — Vol. 78, № 9. DOI: 10.1134/S0005117917090089.
10. Корепанов В.О., Новиков Д.А. Метод рефлексивных разбиений в моделях группового поведения и управления // Проблемы управления. — 2011. — № 1.
11. Айзенберг Н.И., Зоркальцев В.И., Мокрый И.В. Исследование нестационарных олигопольных рынков // Сибирский журнал индустриальной математики. — 2017. — Т. 20, № 1. DOI: 10.17377/SIBJIM.2017.20.102.
12. Дюсуше О.М. Статическое равновесие Курно — Нэша и рефлексивные игры олигополии: случай линейных функций спроса и издержек // Экономический журнал ВШЭ. — 2006. — № 1.