10
Вестник СибГУТИ. 2019. № 4
УДК 519.8
Динамика и равновесие в модели Курно при неполной информации
Д. Г. Алгазина, Ю. Г. Алгазина
Игровое моделирование рационального поведения агентов на рынке олигополии при неполной их информированности предполагает многократное повторение игры и построение траектории принятых решений. Важной является задача построения такой траектории, которая гарантированно приводит к равновесию и эффективна с точки зрения предположений относительно текущей информированности агентов в условиях ограниченности их когнитивных возможностей, возможностей агентов в определении величины шагов, скорости сходимости. Представлена модель динамического поведения на рынке Курно в классе линейных функций спроса и издержек агентов. Используя минимальную информацию о рынке и наблюдая только сложившуюся на рынке цену, агенты в динамике на основе модели коллективного поведения уточняют свои объемы выпуска. Получены достаточные условия сходимости динамики к равновесию Курно-Нэша с меняющимися от игры к игре, но равными в каждой отдельной игре шагами агентов. Обсуждаются особенности и возможные решения по улучшению динамики. Проведен также сравнительный анализ условий на величины шагов для сходимости ряда траекторий.
Ключевые слова: модель Курно, неполная информированность, повторяющиеся игры, уточнение выпусков, равновесие.
1. Введение
Теоретико-игровое моделирование рационального некооперативного поведения агентов при неполной их информированности предполагает осуществление рефлексии (предсказывания ходов оппонентов), чтобы находить лучшие ответы на ходы оппонентов (см., например, [1-4]). Теория коллективного поведения дополняет теорию игр тем, что дает такие механизмы, которые без предсказания выбора оппонентов и при достаточно слабых предположениях об информированности игроков позволяют прийти к равновесию игры, т.е. когда ходы всех игроков являются наилучшими ответами на ходы оппонентов (см., например, [5, 6)]).
В представленной работе подходы теории коллективного поведения к решению рефлексивных некооперативных игр рассмотрены на классической игровой модели олигополии Курно [7-10 и др.]. Содержательное описание изучаемой проблемной ситуации заключается в следующем. Наблюдая текущее состояние рынка, агент может убедиться в том, что его объемы выпуска продукции не являются оптимальными. К такому выводу могут прийти не один, а несколько или сразу все конкурирующие друг с другом объемами выпуска агенты. Естественно, что у каждого из них возникает желание уточнить свой выпуск так, чтобы он был оптимальным ответом на выбор конкурентов. Если это удастся сделать всем агентам, то выбранные объемы выпуска будут равновесными, так как агенты не будут заинтересованы, чтобы при отсутствии кооперации в одиночку изменить их. Решение игры требует ее многократного повторения. Поэтому важным для рынка является изучение такой траектории уточнения от игры к игре выпусков каждым агентом, которая бы гарантированно приводила к равновесию.
Суть рассмотренной в статье траектории заключается в следующем. Каждый агент в каждой текущей игре, наблюдая цену товара, сложившуюся в предыдущей игре, и выбирая в качестве текущей цели соответствующий ей оптимальный объем своего выпуска, корректирует свой объем выпуска в предыдущей игре, делая от него «шаг» в направлении текущей цели. Траектория основана на модели коллективного поведения, агенты используют минимальную информацию о рынке. Такой информацией выступает цена товара.
В качестве альтернативной рассматривается траектория, в которой агенты в качестве текущей цели используют свои текущие представления о предельных издержках конкурентов и корректируют свои представления в предыдущей игре, делая от них «шаг» в направлении текущей цели [10]. Полагается, что исходные представления агентов недостоверны. Представлен сравнительный анализ траекторий.
Основной результат работы: сформулированы и математически доказаны достаточные условия на величины шагов для сходимости динамик к равновесию Курно-Нэша. Этот результат обобщает известные аналитические решения рефлексивной игры одновременного порядка для классической модели олигополии Курно с произвольным числом агентов.
2. Модель рынка олигополии и адаптивная динамика поведения агентов
На рынке n фирм-агентов конкурируют объемами выпуска однородной продукции. Каждый агент продает произведенный им выпуск q, по единой рыночной цене p(Q), которая определяется общим объемом выпуска Q = £ n=1 q,. Фирмы рациональны, их действия направлены на максимизацию прибыли:
П (p(Q),qt) = p(Q)qt - ф (q) ^ max. (1)
q >0
Цена p(Q) и полные издержки фирм ф (q,) заданы линейными функциями:
p(Q) = a-bQ, ф^,) = erf, + d,, i = 1, ...,n, (2)
где a,b - параметры спроса; e,, d, - предельные и постоянные издержки фирм. Считается, что
если Q > yb, т.е. p(Q) < 0, то фирмы несут потери в объеме полных издержек. Кооперация
фирм друг с другом, барьеры на вход и ограничения мощности отсутствуют. Весь выпуск будет реализован.
Согласно предположению Курно относительно объемов выпуска каждая фирма действует так, что не ожидает от своих конкурентов изменения объемов выпуска, даже если сама сделает это. Формально это предположение можно записать в виде условий (см., например, [9, 10]):
^ = 1, , = 1, ...,n. (3)
dq,
Состояние, в которое приходит рынок, если каждый агент действует подобным образом, называется равновесием Курно, которое для классической модели олигополии является равновесием Нэша. Обозначим верхним индексом С показатели для равновесия Курно-Нэша. Будем считать, что #(С) >0 ({ — 1,...,и), т.е. в равновесии нет неконкурентоспособных по выпуску агентов. Имеют место равенства [9, 10]
С + Ь4С) — р(б(С)), I — 1,..., и. (4)
Справедливо и обратное: если для вектора положительных действий ...,ди) агентов
выполняется система равенств (4), то он является равновесным. Этот факт следует из того, что дифференцирование (4) по приводит к равенствам (3). Таким образом, по системе равенств
(4) можно определить, является ли вектор положительных действий • ••,Цп) равновес-
ным или не является.
Рассмотрим следующий динамический процесс.
1. Каждый из агентов независимо от других, используя наблюдаемую цену р1 -1 и полагая, что в текущем г -м периоде все остальные агенты выберут те же действия, как и в предыдущем (г -1) -м периоде, на основе (1) рассчитывает согласно своей функции реакции текущий оптимальный выпуск х*-1 по формуле
хг-1 = 4 (р'-1 + Ь4>-1 - С ) г'= 1,-, п- (5)
2Ь
2. Каждый агент изменяет свой выпуск за предыдущий (г -1) -й период, делая от него шаг по направлению к текущему оптимальному выпуску х\-1 по формуле
г г-1 , г, г-1 г-и • л /¿л
41 = 41 +П(х1 - ), I = 1, •••, п, (6)
где у/ е [0; 1] - параметры, определяющие величины шагов.
3. По текущему выпуску агентов аукционером формируется рыночная цена товара рг = а - Ь).
Затем процесс повторяется с п. 1.
Утверждение. В модели олигополии Курно с линейными функциями спроса и издержек агентов для того, чтобы итеративный процесс (5)-(6) сходился к равновесию Курно-Нэша
при = у', достаточно, начиная с некоторого г, выполнение условий
У е (0,1] при п = 1, 2; уг е | о —) при п > 2.
I п +1)
(7)
п+1
Доказательство. Пусть (7) выполняется. Из формул (2), (5) и (6) имеем
4> = 41-1 +4 ( а~1Г - -1 - 4-1). (8)
Учитывая, что )) = Еп=14/, имеем
ог = ог-1 +у
С п а - г, Л
Е - (п+1))-1
V/=1 Ь )
(9)
Из (9) для г -го и (г -1) -го периодов получаем рекуррентную формулу
ог - ог-1 = у
г
уг-1
^ -У-1(п +1) ))г-1 - )г - 2 ) Или
2
) - )-1 = У ()1 _ о0 ^ _ у ^
У г=1^ 2
(10)
а - с,
Из (9) и (10) имеем £
¿=1 Ь
- (п+1)ег-1 = 2 (е1 - е0
г
Й1
г=11 2
уг (п +1)
2
< 1. Поэтому £
а с - (п+1-ег-1 ^ о и е(С) = бш ег =
. Из (7) следует, что 1
1=1 Ь
г ^да
(п + 1)Ь
' п Л па - £ с г =1 ;
равновесный по Курно-Нэшу суммарный выпуск агентов. По (8) для г-го и (г -1) -го периодов получаем
г-1
г
У
Тогда Иш (дгг - 1 )= Нш
/-1 .г (
Л-1 ^
1 -
У
У
г ^да
г ^да
,г-1
2
.г-1 >
9-1 - д?- 2 )-У (ег-1 - ег - 2)
1 -
у
\
2
У
г-1 „г - 2
-)- Иш у(ег-1 -е
г - 2
г ^да
= Иш
г ^да
Г
.г-1
1 --
.г-1
2
У-1 - д? - 2 )=Ит4 - д0 Ш ^
г^да У г =11 2
= 0.
Из (8) и (11) получаем сходимость процесса к равновесным выпускам агентов:
1
г-1
1 -
У
-1 >
..г-1
I-1 г - 2^ Ил г-1 пг - 2^ а - сг пг-1 г-1
9 -}-^е -е р ——е -91 ,
есть
(11)
Ч ^ - ег-1 - 91-1
г ^да^ Ь
а - С - е(с) - Ш дг-1 = 0 и д(С) = Вш 91-1 = ^ - е(С).
Ь
г^да
г^да
Ь
При выводе соотношений (11) мы полагали, что уг ф о. Если, начиная с некоторого г, уг = 0,
то по (8) дг = -1, т.е. процесс остановится и не придет в равновесие, если не находился в нем в начальном состоянии. Утверждение доказано.
3. Обсуждение и выводы
1. Рекуррентные соотношения рефлексивной игры одновременного порядка [9, с. 23],
можно получить из соотношений (6) при уг = 1, т.е. агенты в каждом периоде выбирают свой наилучший ответ. Из доказанного утверждения следует, что такой процесс сходится только для случая монополии или дуополии, иначе расходится, что согласуется с выводами в [9].
2. Для итеративных игровых процессов Брауном предложена политика выбора шага уг, исходящая из принципа равного вклада в формируемую стратегию оптимальных ответов
Хг и опыта, накопленного в г сыгранных партиях [5]. Тогда
У
1 -У
1 г
= - или уг
1
г +1
. Для этой
политики выполнено условие (7) и yt ^ 0. Поэтому процесс сходится к равновесию.
3. Рядом авторов отмечается, что для рынка с рефлексирующими агентами возникает потребность в регулировании ([6, 11] и др.), в том числе в форме «навязывания» участникам представлений о процессе через модель рефлексивного коллективного поведения (см., например, [6, с. 149]). Здесь это нашло отражение следующим образом. Всем агентам для уточнения собственных выпусков предложено использовать единую модель, в которой значение параметра «величина шага» движения к цели определяет, будет ли динамика сходящейся к равновесию или нет. С содержательной точки зрения рациональные агенты, следуя только концепции индивидуального выбора, предпочтут наилучший ответ на действия конкурентов, что
2
соответствует у/ = 1. Но этот выбор не дает (при п > 2) сходящуюся динамику, поэтому ее развитие может направляться выделением множества траекторий условиями на величины шагов. В нашем случае рефлексивной игры длины шагов могут меняться во времени.
4. В (10) для некоторого t* может иметь место уг - 2 . Тогда условие (7) выполняется
n +1
1 na c
и при t > t* будет Ql - Ql-1, по (9) - Qt-1 - Q(C) --E-i- и в (6) в качестве текущего
п + 1i-1 b
положения цели x\-1 будет всегда выступать его равновесное значение qiCПроцесс сходится, так как qj -q(C) - (1 -/ )(qj-1 -q(C)).
5. Представляет интерес сравнение условий сходимости траектории по уточнению объемов выпуска агентов (динамика 1), которая представлена в этой статье, и траектории (динамика 2), в которой агенты, не зная достоверно предельные издержки конкурентов и наблюдая текущую цену товара, выбирают в качестве текущей цели соответствующие этой цене свои представления об их предельных издержках. Затем корректируют эти представления, делая от них «шаг» в направлении текущей цели [10, 12].
Доказано [10], что для сходимости такого итеративного процесса при у\ =у
( 2 ^
(i -1,..., п; t -1,2,...,) должно выполняться условие у е 0, — (п > 1). Из (1) и (4) следует, что
V п)
при п - 2 нет различий между диапазонами значений параметров для обоих сходящихся про-
П 1 4 2 цессов. При п > 1 имеем, что-> —.
п +1 п
Анализ указанных динамик показывает:
а) сходящаяся динамика 1 дает больше возможностей по выбору значений параметров. Если динамика 2 сходится, то динамика 1 сходится для тех же значений параметров. Обратное неверно;
б) вычисление динамики 1 проще и менее трудоемко;
в) сходимость динамики 1 доказана для единой длины шага у агентов в каждый момент времени, а динамики 2 - при более жестких условиях, предполагающих единую длину шага для всех агентов и всех моментов.
6. В условиях доказанного утверждения процесс (5)-(6) сходится к равновесию Курно-Нэша при любых первоначальных значениях выпуска и цены.
7. Представляет интерес исследование процессов, в которых каждый игрок может придерживаться своей собственной политики выбора величины шага у\, отличной от политики других агентов. Для таких процессов пока не существует универсального аппарата поиска аналитических решений, но представляется перспективным получение аналитических выражений условий сходимости для некоторых частных случаев процессов, учитывающих определенный содержательный смысл в том, почему в конкретном периоде тот или иной агент выбирает именно такой, а не другой шаг. В качестве альтернативного метода исследования сходимости таких процессов используется также метод численного или имитационного моделирования, составляющий базис результатов расчетов, иллюстрирующих, что в некоторых случаях разно-информированные агенты могут в динамике (при повторении игры) прийти к истинному информационному равновесию, как например в [8, 9].
Литература
1. Шуетъоп R. Game Theory: Analysis of Conflict. Harvard University Press, 1997. 600 p.
2. Novikov D., ChkhaTtishvili A. Reflexion and Control: Mathematical Models. Leiden: CRC Press, 2014. 298 p.
*
3. Kukushkin N. Best Response Dynamics in Finite Games with Additive Aggregation // Games and Economic Behavior. 2004. № 48. P. 94-110.
4. Sakovics J. Games of Incomplete Information without Common Knowledge Priors // Theory and Decision. 2001. № 50. P. 347-366.
5. Беленький В. З., Волконский В. А., Иванков С. А. и др. Итеративные методы в теории игр и программировании. М.: Наука, 1974. 320 с.
6. Васин А. А. Модели динамики коллективного поведения. М.: МГУ, 1989. 156 с.
7. Kamalinejad H., Majda V., Kebriaei H., Kian Л. Cournot Games with Linear Regression Expectations in Oligopolistic Markets // Mathematics and Computers in Simulation. 2010. V. 80, № 9. P.1874-1885.
8. Yang H., Zhang Y. Complex Dynamics Analysis for Cournot Game with Bounded Rationality in Power Market // Journal Electromagnetic Analysis and Applications. 2009. № 1. P. 48-60.
9. Дюсуше О. М. Статическое равновесие Курно-Нэша и рефлексивные игры олигополии: случай линейных функций спроса и издержек // Экономический журнал ВШЭ. 2006. № 1. С. 3-32.
10. Алгазин Г. И., Алгазина Д. Г. Информационное равновесие в модели динамики коллективного поведения на конкурентном рынке // Управление большими системами. 2016. № 64. С. 112-136.
11. Понькина Е. В., Маничева А. С., Комаров П. В. Модель рассредоточенного рынка с барьерами на вход // Изв. Алт. гос. ун-та. 2012. № 1-2 (73). С. 104-109.
12. Algazin G., Algazina D. Collective Behavior in the Stackelberg Model under Incomplete Information // Automation and Remote Control. 2017. V. 78, № 9. P.1619-1630.
Статья поступила в редакцию 08.05.2019.
Алгазина Дарья Геннадьевна
к.т.н., доцент кафедры прикладной информатики в экономике, государственном и муниципальном управлении АлтГУ, e-mail: [email protected].
Алгазина Юлия Геннадьевна
к.э.н., доцент кафедры информационных систем в экономике АлтГТУ, e-mail: [email protected].
Dynamics and equilibrium in the Cournot model with incomplete information D. Algazina, J. Algazina
Game simulation of agents' rational behavior in the market of oligopoly with their incomplete awareness involves multiple repetition of the game and the construction of decisions made trajectory. The problem of constructing the trajectory that guarantees the equilibrium and efficiency from the point of view of assumptions concerning the current awareness of agents in conditions of their limited cognitive capabilities, the capabilities of the agents in determining the value of steps, the rate of convergence is important. A model of dynamic behavior in the Cournot market in the class of linear demand functions and costs of agents is presented. Using minimal information about the market and observing only the current market price, agents in the dynamics d based on the model of collective behavior clarify their output volumes. Sufficient conditions for convergence of dynamics to the Cournot-Nash equilibrium with the steps of agents varying from game to game, but equal in each individual game are obtained. Features and possible solutions for improving the dynamics are discussed. A comparative analysis of the conditions on steps value for a number of trajectories convergence is also carried out.
Keywords: Cournot model, incomplete information, repeated games, clarifying output, equilibrium.