удк: 519.833.2 msc2010: 91a10
ЗОЛОТОЕ ПРАВИЛО В МОДЕЛИ ДУОПОЛИИ КУРНО
© М. И. Высокос
Московский государственный областной гуманитарный институт Физико-математический факультет кафедра математики и физики ул. Зеленая, 22, Орехово-Зуево, 142611, Российская Федерация e-mail: [email protected]
© В. И. Жуковский
Московский государственный университет имени М.В. Ломоносова Факультет вычислительной математики и кибернетики кафедра оптимального управления Ленинские горы, МГУ, ВМК, ГСП-1, Москва, 119991, Российская Федерация
e-mail: [email protected]
The Golden Rule in the Model of Cournot Duopoly.
Vysokos M. I, Zhukovskiy V. I.
Abstract.
Source of the Golden Rule: «Do with respect to someone in such way as you would like him to do with respect to you» one can find in New Testament.
Such approach in economics results to altruistic rules of behavior «help others, forgetting about yourself». The concept of Berge equilibrium strictly formalized in Russia in 1994 in thesis and first articles of Vaisman K.S. fully meets such approach. Then this method of conflict balancing began to be used in works of western colleagues.
However the matter of its practical application to problems of mathematical economics was left open.The offered article maybe is one of the first concerning this application. It is constructed the explicit form of Berge equilibrium solution in dynamic one-step variant of controllable Cournot duopoly - the mathematical model of interaction of two sellers on the market.
Nash equilibrium is a common optimality concept for non-cooperative games. The key difference is that in case of Nash equilibrium an individual player's deviation from the equilibrium cannot increase the player's own payoff, therefore it has «egoistic character». On the contrary Berge equilibrium is characterized by «altruistic character» dictated by the Golden rule.
The monograph written by French economist, philosopher and mathematician Antoine Augustin Cournot (1801-1877) is one of the first scientific studies of the use of game theory in economics. It was published in 1838. Cournot considers a duopoly model on the market in this book.
Key words: Cournot duopoly, Berge equilibrium, Nash equilibrium, one-step positional noncooperative linear-quadratic game, dynamic programming.
Введение
Одним из первых научных исследований, посвященных применению теории игр в экономике, принято считать монографию французского экономиста, философа и математика Антуанна Огюстена Курно (1801-1877) «Исследование математических принципов теории богатств» [1], опубликованную им в 1838 г. В разделе 7 этой книги «о конкуренции производителей» Курно рассматривает частный случай дуополии и использует концепцию решения соответствующей игры, представляющей собой частный случай общеизвестного понятия равновесия (по Нэшу).
В настоящей статье рассмотрены статический и динамический варианты модели Курно. Наиболее распространенной концепцией равновесности является равновесие по Нэшу. Однако, используемый в данной статье подход отличается от упомянутой концепции равновесности. Здесь за основу поведения взято Золотое правило: «Поступай по отношению к другому так, как ты хотел бы, чтобы он поступил по отношению к тебе». Полностью отвечает этому подходу концепция равновесности по Бержу, которая впервые была строго формализована в диссертации и статьях К.С. Вайсмана [2, 3, 4]. Этот способ уравновешивания конфликтов уже получил достаточно широкое распространение в работах отечественных и западных ученых [5].
В данной статье впервые рассматривается вопрос о практическом применении равновесия по Бержу: использование такого способа уравновешивания конфликтов в модели дуополии Курно.
1. «СТАТИЧЕСКИЙ» ВАРИАНТ МОДЕЛИ
Сформулируем экономическую модель рыночной конкуренции, известную под названием модель дуополии Курно.
Две фирмы выпускают однородную продукцию за некоторый (заданный априори) промежуток времени. Пусть qi - количество продукции, выпущенное i-ой фирмой (i = 1, 2). Издержки производства предполагаются линейно зависимыми от количества выпущенной продукции qi и поэтому будут cqi + d, здесь c и d соответственно средние переменные и постоянные издержки (к переменным издержкам относятся, например, затраты на зарплату рабочих, на закупку сырья, на амортизацию оборудования, к постоянным - аренда помещений, земли, станков, лицензий и т.п.). На рынке в зависимости от спроса устанавливается цена продукции, которую также считаем линейно зависящей от количества q = qi + q2 поступившего на продажу товара.
Цену товара представляем в виде р(д) = а — bg , где а = const > 0 - цена (на рынке) при отсутствии товара, а коэффициент b показывает, на сколько «падает» цена при поступлении в продажу единицы продукции. Тогда выручка первой фирмы будет
Р(<?)<?1 = (а — bg)qi = [а — b(qi + q2)]qi,
а ее прибыль (выручка минус издержки)
^i(9i, 92) = [а — b(qi + 92)]<?i — (cqi + d) = aqi — bqi — bqiQ2 — cqi — d,
одновременно прибыль второго
^(qi, 92) = [а — b(qi + q2)]q2 — (c<?2 + d) = а^2 — bq2 — bqiQ2 — cq2 — d.
Вследствии строгой вогнутости ^i(qi,92) по qi (i = 1,2) (т.к. = —2b < 0) достаточные условия существования q*, максимизирующей ^i(q,i,Q2) по Qi (i = 1, 2), сводятся к построению решения системы из двух линейных уравнений
^f21 к = а — 2bq* — bQ2 — c = 0, ^gf211?2; = а — bqi — 2bq* — c = 0.
Отсюда
* _ а — c — bq2 * _ а — c — bqi
Ql = 2b , Ql = 2b . Итак, в «статическом» варианте математической модели функциональная зависимость между «наилучшими ответами» двух фирм (при конкурентном взаимодействии) связаны соотношениями
а — c — bq2 а — c — bqi
Qi = 2b , Q2 = 2b . Этот факт будет учтен при построении динамического варианта модели.
2. ДИНАМИЧЕСКИЙ ВАРИАНТ МОДЕЛИ
Здесь будем предполагать,
во-первых, время продолжительности выпуска продукции состоит из одного периода между моментами времени, т.е. к = 0,1;
во-вторых, существует временной лаг (здесь берем его равным одному периоду) и поэтому функции наилучшего ответа каждой из фирм на действия конкурента приобретают вид
а — с — Ьо2(к) . а — с — Ьо^к) 91(к + 1) =-^т^, ®(к + 1) =-—^ (к = 0);
в-третьих, фиксированы начальное количество продукта (то есть в момент к = 0) на складах ¿-ой фирмы 5г(0) = 5г0 (г = 1, 2).
Наконец, в-четвертых, руководство каждой фирмы (в дальнейшем называемое игроком) формирует и организует интенсивность (на каждый период) выпуска продукции (за счет, например, части инвестиций в свое производство (вгиг) а оставшаяся (1 — вг)мг (г,.? = 1, 2; 3 = ¿) передается второму игроку, точно так же обстоят дела с внедрением новых технологий; данную интенсивность для ¿-ой фирмы в момент £ = к обозначим через иг[к] (г = 1, 2; к = 0,1), при этом постоянные вг е [0,1]; отметим также, что управляющие воздействия иг игрока г в момент времени к зависит от количества продуктов, выпущенных обеими фирмами в момент к. Таким образом иг(к) - стратегию (правило поведения - способ руководства своей фирмой) ¿-го игрока (г =1, 2) в момент £ = к (к = 0,1) будем отождествлять со скалярной функцией иг(к,5^52) (этот факт обозначается иг — иг(к,5), здесь и далее двухкомпонентный вектор 5 = (51,52)). Тогда сама математическая модель управляемой динамической системы Е, описывающей процесс выпуска продукции в дискретные моменты времени 0 и 1 представится следующим образом
51 (к + 1) = — Щр + в1и1 + (1 — в2)и2, 51(0) = 510, ^ ,
2Ь 2
52 (к + 1) = — ^ + (1 — в1)и1 + в2и2 , 52(0) = 520 (к = 0).
Отметим, что (1) есть система из двух разностных (одношаговых) линейных уравнений, множество стратегий иг(к) на к-ом шаге далее обозначаем символом иг(к) (г = 1, 2; к = 0). Тогда ситуацию и(0) образует упорядоченная пара
и(0) = (и1(0) - и1(0, 5), и2(0) - и2(0, 5)),
где иг(к) е иг(к) (к = 0) и 5(0) = (510,520).
Итак, пара стратегий (и1,и2) образует ситуацию и.
С возрастанием времени к от 0 до 1 «развертывание игры во времени» происходит следующим образом. Пусть игроки, не объединяясь в коалицию, каждый ¿~ ый сам выбирает свою стратегию иг(0) е Ц;(0), иг(0) — иг(0,5) (г = 1, 2); то есть формируются две скалярные функции иг(0,51,52) (г = 1, 2). Сам выбор стратегии иг(0) е иг(0), иг(0) — иг(0,51,52) игрок г осуществляет, руководствуясь концепцией равновесности по Бержу («помогай всем, забывая о своих интересах») и применяя ее к функциям выигрыша игроков (явный вид которых будет приведен ниже). Для построения таких функций применим (1) и начальные значения фазового вектора 5(0) = 50 = (51(0), 52(0)) = (510,520).
Строим
(3)
образующие траекторию системы (1) при использовании игроками упомянутых (и выбранных) конкретных стратегиях иг(0) е Ц;(0), иг(0) — иг(0,5) (г = 1, 2); во-вторых, две реализации
С помощью (3) и (4) построим критерий (функцию выигрыша) игрока г, значение которого (выигрыш) как раз и оценивает качество функционирования этого игрока. При этом будем учитывать следующие два обстоятельства.
Во-первых, каждая г-ая фирма (г = 1, 2) стремится выпустить на рынок возможно большее количество продукции, что, в конечном счете, можно свести к максимизации ¿-ым игроком (за счет подходящего выбора иг е %) следующей суммы
Во-вторых, затратить при таком выпуске возможно меньше своих ресурсов и ресурсов партнера. Это требование можно «обеспечить» стремлением к возможно увеличить
образует одношаговую бескоалиционную позиционную линейно-квадратичную игру двух лиц. В ней Е — (1) означает, что управляемая система Е описывается системой разностных уравнений (1), а /г(и, 50) — (5) - функция выигрыша ¿-го игрока имеет вид (5).
{«#] = ui(0,q(0))} (i = 1, 2).
(4)
(1) + q2(0) (i = 1,2).
-u? [0] - u2[0].
(5)
Ситуация UB = (Uf, Uf) G U является равновесной по Бержу в игре Г, если
max Ji(Uf ,U2,qo) = J-(UB,qo),
U2GU2 1 (6)
max J2(Ui,U2b,qo) = ^2(UB,qo).
UiGUi
Тройка (UB, JB = Ji(UB, qo), Jf = J2(UB, qo)) называется равновесным по Бержу решением игры Г.
Согласно определению равновесной по Нэшу ситуации Ue = (Uf, U|) в игре Г:
max Ji(Ui,Uf,qo) = Ji(Ue,qo),
UieUi
max J2(Uf, U2, qo) = J2(Ue,qo),
U2EU2
и приведенному понятию равновесности по Бержу, для игры двух лиц ситуация равновесия по Нэшу становится ситуацией равновесия по Бержу, если только в игре Г игроки обменялись своими функциями выигрыша. Поэтому (снова только в игре двух лиц!) для построения ситуации равновесия по Бержу можно в игре Г применять метод динамического программирования, «приспособленный» для построения равновесия по Нэшу в модели дуополии Курно в книге [6, с. 184-242]. Перейдем к изложению этого способа.
Замечание 1. При построении равновесного по Бержу решения воспользуемся схемой, «диктуемой» теоремой 2.4.1 из [6] и измененной в соответствии с определением (6). Для игры Г ее можно свести к выполнению двух этапов.
Этап 1. При k =1 строятся две функции
Vi(1)(q) = q2 (i = 1, 2).
Этап 2. При к = 0 находим четыре скалярные функции иг(0, д) и (г = 1, 2),
исходя из условий
V(o) (q) = max{q2 - [uf (0, q)]2 - «2 + [ar - If + 0i«B(0, q) + (1 - ^b]2}
U2
= /&т{и2 ^ ив(0, д)},
У2(0) (д) = тах{д2 - и? - [ив(0, д)]2 + [^ - 2 + (1 - вН + (0, д)]2} = ( }
«1
= /&т{и1 ^ (0,д)},
здесь /&т{иг ^ ив (0, д)} означает выражение в фигурных скобках, где иг заменено на иВ(0, д) (г = 1, 2).
Тогда, во-первых, ситуация равновесия по Бержу в игре Г ив = (и?в, и В), ив = ив (0) и ив (0) - иВ (0,51,52) (г = 1, 2), во-вторых, равновесные выигрыши игроков (их выигрыши в ситуации равновесия
по Бержу) будут ^¿(иБ,50) = (510, 520) (г = 1, 2); равновесное по Бержу решение игры Г при этом образует тройка (иВ, У1(0)(50), ^>(0)(50)).
3. Построение равновесного по Бержу решения Утверждение 1. Равновесное по Бержу решение игры Г имеет вид (иВ = (иВ,и2Б),ЛБ = Л(иБ,50), = ^(иБ,50)),
где
ив — иВ(0, 5) = 2А(з-|1-д) [-^(3 - 2в2) + 51(2 - ^2) + 52(1 - в2)], иВ — иВ(0, 5) = 2в2(з-в2-в2) [-2-£(3 - 2в1) + 51(1 - в1) + 52(2 - &)], Л(ив, 50) = 520 - [иВ(0, 50)]2 - [иВ(0, 50)]2 + [а- - + в1иВ(0, 50) + (1 - в2)иВ(0, ®,)]2 /2(иВ, 50) = 520 - [иВ(0, 50)]2 - [иВ(0, 50)]2 + [а- - 220 + (1 - в1)иВ(0,50) + в2иВ(0,50)]2
Доказательство. Следуем схеме, представленной в приведенном выше замечании 1. Этап 1. (к = 1). Строим две скалярные функции
^(1)(5) = 52 (г = 1, 2).
Этап 2. (к = 0). Первое равенство из (7) реализуется при иВ(0,5), если
тах^1(и2) = "01 (иВ(0, 5)) Vq е И2, (8)
«2
где 01(и2) = -и2 + [а— - + в^(0,5) + (1 - в2)и2]2. В свою очередь, (8) имеет место, если только
^(0,2) = -2иВ(0, 5) + 2[^ - + в1и0(0, 5) + (1 - в2)иВ(0, 5)](1 - ^2) = 0,
АМ«1 = -2 + 2(1 - в2)2 = 2[в2 - 2]в < 0
(второе условие имеет место, ибо постоянная в е [0,1]). Из первого равенства и аналогично ему вторых равенств для (6)-(7):
-2иВ(0, 5) + 2[^ - | + (1 - в1)иВ(0, 5) + в2иВ(0, 5)](1 - вх) = 0
получаем построение иВ(0,5) (г = 1, 2) сводится к решению двух линейных неоднородных алгебраических уравнений (относительно иВ(0,5) и иВ(0,5))
в1(1 - в2)иВ(0,5) + в2(в2 - 2)иВ(0,5) = (-а- + )(1 - в2), в1(в1 - 2)иВ (0,5) + в2(1 - в1)иВ (0,5) = (-а- + 22 )(1 - в1).
Определитель системы (9)
(9)
А
в1(1 - в?) в?(в? - 2) вхСвх - 2) в?(1 - в1)
= в1в?(-3 + в1 + в?) = 0,
ибо 0 < в < 1 (i = 1, 2). Для построения решения uf(0,q) (i = 1, 2) из системы (9) найдем
Ai
Д2
(-ат + 12)(1 - в2) в2(в2 - 2) (-isT + il)(1 - в1) в2(1 - в)
(1 - в1)в2
(-af +12)(1 - в2) (в2 - 2)
(-a-bC +11 ) 1
Mi-M[-а-.(3 - 2в2) + qi(2 - £2) + q2(1 - в2>] > 0
в1(1 - в2) (-а-2 + 12)(1 - в2) в1(в1 - 2) (-a-c + 11 )(1 - в1)
в1(1 - в2)
1 (_ а~с I 12 )
1 ( 2b + 2 )
в1 - 2 (-а-2 + 11 )(1 - в1)
МЬМ [-а-(з - 2в1 ) + Q1(1 - в1) + 52(2 - £1)].
Отсюда
uf (0, q) = f
Bin — A2
2 вх(
-УА 2) [-9-Г(3 - 2в2) + 51(2 - в2) + 52(1 - в2)],
uf (0, q) = f = 2в2(-1з+в21 2) [-a-C(3 - 2в1) + 51(1 - в1) + 52(2 - £1)]
10)
и UB = (Uf, Uf ) ^ (uf (0,5),uf (0,5)).
'1 > w2 ) • V"1 Наконец, согласно (7)
7 в
J1
J1(UB, 50) = V^fo) = 52o - [uf (0, 5o)]2 - [uf (0,5o)]2+
+ [a-. - 120 + ftuf (0,go) + (1 - £2)uf (0,go)]
-(0)/^__2 r„.f/
= /2(ив, 50) = (50) = 520 - К(0,5с)]2 - К(0,5с)]2+ + [а-2 - 22а + (1 - вх)«В(0, 5о) + 02«В(0,5о)]2,
причем ив(0,50) заданы в (10), где 50 = (5°,5°)-Таким образом, утверждение 1 доказано.
Заключение
□
В работе получены следующие результаты:
во-первых, рассмотрен динамический одношаговой вариант управляемой дуополии Курно, формализовано для нее понятие равновесной по Бержу ситуации и равновесного по Бержу решения для такой одношаговой бескоалиционной позиционной игры двух лиц;
во-вторых, построен явный вид равновесного по Бержу решения. Исследования выполнены при финансовой поддержке РФФИ в рамках научного проекта №14-00-90408 Укр_а и НАН Украины проект №03-01-14.
Описок литературы
1. COURNOT, A.A. (1838) Recherches sur les Principes Mathématiques de la Theorie des Rechesses.Paris: L.Hachette.
2
2. Вайсман, К.С. Равновесие по Бержу: автореферат дисс. ... канд. физ.-мат. наук. — СПбГУ, 1994. — 13 с.
Vaisman, K.S.(1995) The Berge equilibrium: abstract of diss. ... cand. of phys. math. sciences. SPbSU.
3. ZHUKOVSKIY, V.I., SALUKVADZE, M.E. and VAISMAN, K.S. (1999)The Berge equilibrium. Preprint. — Tbilisi: Institute of Control Systems.
4. Вайсман, К.С. Равновесие по Бержу // Линейно-квадратичные дифференциальные игры / Жуковский, В.И., Чикрий, А.А. — Киев: Наукова Думка, 1994. — С. 119-142.
VAISMAN, K. (1994) The Berge equilibrium. In the book Zhukovskiy, V.I. and Chikrii, A.A. Linear-quadratic differential games. Kiev: Naukova Dumka.
5. COLMAN, A., KORNER, T., MUSY, O. and TAZDAIT, T. (2011) Mutual support in games: some properties of Berge equilibria. Journal of Mathematical Psychology, Article in Press. p. 1-10.
6. Жуковский, В.И., Кудрявцев, К.Н. Уравновешивание конфликтов и приложения. — M.:URSS, 2012. — 304 с.
Zhukovskiy, V.I., Kudryavtsev, K.N. (2012) Equilibrium in conflicts and applications. Moscow: URSS.
Статья поступила в редакцию 26.05.2015