Научная статья на тему 'Правило большинства в задаче наилучшего выбора для трёх лиц'

Правило большинства в задаче наилучшего выбора для трёх лиц Текст научной статьи по специальности «Математика»

CC BY
187
42
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЗАДАЧА НАИЛУЧШЕГО ВЫБОРА / ПОСЛЕДОВАТЕЛЬНЫЕ ПЕРЕГОВОРЫ / ПРАВИЛО БОЛЬШИНСТВА / ДИСКОНТИРОВАНИЕ / СОГЛАШЕНИЕ / BEST-CHOICE PROBLEM / SEQUENTIAL NEGOTIATIONS / MAJORITY RULE / DISCOUNTING / AGREEMENT

Аннотация научной статьи по математике, автор научной работы — Носальская Татьяна Эдуардовна

В статье рассмотрена последовательная игра, связанная с задачей наилучшего выбора. Трое игроков ведут переговоры, состоящие из K этапов. На некотором шаге каждый из них получает предложение, которое он должен принять или отвергнуть. После того, как игроки приняли решение, вступает в силу правило большинства: если, по крайней мере, двое из них приняли предложение, то осуществляется соответствующее решение, иначе происходит дисконтирование, и переговоры переходят на следующий шаг. Процесс продолжается до тех пор, пока игроки не придут к согласию, либо пока переговоры не достигнут последнего этапа. Для описанной игры найдено равновесие в классе пороговых стратегий.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Majority Rule in the Problem of the Best Choice for Three Persons

The article discusses the sequential game related to the best-choice problem. Three players participate in the negotiations, which consist of K stages. At some step each of them receives an offer that he should accept or reject. After the players have made a decision, the majority rule comes into force: if at least two of them have accepted the offer, the corresponding solution is carried out, otherwise there is discounting and the negotiations move to the next step. The process continues until the players reach an agreement, or until the negotiations reach the final stage. The equilibrium in the class of threshold strategies is found for the described game.

Текст научной работы на тему «Правило большинства в задаче наилучшего выбора для трёх лиц»

ББК В 11 УДК 519.833.2

Татьяна Эдуардовна Носалъская,

аспирант,

Забайкальский институт железнодорожного транспорта (Чита, Россия), e-mail:tenosalskaya@gmail.com

Правило большинства в задаче наилучшего выбора для трёх лиц1

В статье рассмотрена последовательная игра, связанная с задачей наилучшего выбо-ра. Трое игроков ведут переговоры, состоящие из К этапов. На некотором шаге каждый из них получает предложение, которое он должен принять или отвергнуть. После того, как игроки приняли решение, вступает в силу правило большинства: если, по крайней мере, двое из них приняли предложение, то осуществляется соответствующее решение, иначе - происходит дисконтирование, и переговоры переходят на следующий шаг. Про-цесс продолжается до тех пор, пока игроки не придут к согласию, либо пока переговоры не достигнут последнего этапа. Для описанной игры найдено равновесие в классе поро-говых стратегий.

Ключевые слова: задача наилучшего выбора, последовательные переговоры, правило большинства, дисконтирование, соглашение.

Tatiana Eduardovna Nosalskaya,

graduate student Zabaikalsky Institute of Railway Transport (Chita, Russia), e-mail: tenosalskaya@gmail.com

Majority Rule in the Problem of the Best Choice for Three Persons

The article discusses the sequential game related to the best-choice problem. Three players participate in the negotiations, which consist of К stages. At some step each of them receives an offer that he should accept or reject. After the players have made a decision, the majority rule comes into force: if at least two of them have accepted the offer, the corresponding solution is carried out, otherwise there is discounting and the negotiations move to the next step. The process continues until the players reach an agreement, or until the negotiations reach the final stage. The equilibrium in the class of threshold strategies is found for the described game.

Keywords: best-choice problem, sequential negotiations, majority rule, discounting, agreement.

Представленная работа продолжает серию известных моделей переговоров, таких как переговоры работника и работодателя [6], [7], игра обмена [2], многоэтапный покер [10], [11], раздел пирога и другие. Большинство исследований [4], [5] анализируют модель, где игроки представляют свои предложения, а третий независимый участник - арбитражный комитет - выбирает одно из них. Сакагучи [11] рассматривает модель переговоров работника и работодателя с арбитражным комитетом, состоящим из двух арбитров, и каждый арбитр предлагает размер заработной платы в каждый период переговоров. В работах [12], [13], [14], [5], [9] эта модель арбитража была расширена для двустороннего случая, где арбитр представляет некоторые предложения для игроков и, если их решения отличаются, приоритет решения определяется лотереей. Статья [8] описывает арбитражную задачу для трёх игроков и её обобщение для п игроков, где приоритет решения определяется голосованием. Дальнейшее развитие эта модель получает в работе [11, с. 42-45] на примере раздела пирога между тремя лицами по правилу большинства, основываясь на совместном распре-делении Дирихле вида k\ = к2 = к% = 1. Здесь мы исследуем подобную схему с параметрами к2 = к2 = к3 = 2.

1 Работа выполнена в рамках rpaHTf РФФИ ]Ч«12-01-90702-моб_ст и государственного задания вузу Минобрнауки РФ, №8.3641.2011.

© Т. Э. Носалъская, 2012

93

Пусть для переговоров отведено К шагов, а до конца осталось к. На этом этапе игроки получают предложения хк, ук, zk. Предположим, что на каждом шаге это случайные величины, распределённые по закону Дирихле, т.е. совместная плотность имеет вид

f(r V - r(fci +к2+ кз) fel_l fe2_l fe3_l

J\x,y,z) — r(fcx) .rfe)-Г(^з) V

причём x + у + z = 1.

Затем каждый из них решает, принять или отклонить предложение в ожидании более удач-ного предложения в будущем. После чего, согласно правилу большинства, если хотя бы двое из них приняли положительное решение, осуществляется делёж пирога (x,y,z), в противном случае переговоры переходят на следующий этап к — 1. При этом происходит дисконтирование, и пирог становится уже размера 6 < 1. Процесс продолжается до тех пор, пока игроки не придут к согласию,

либо пока не наступит этап к = 0, на котором все игроки получат куски малого размера Ъ «

О

Обозначим Hk значение игры на этапе к. Предположим, что каждый игрок информируется только о значении его предложения. Пусть х, у, z - предложения игрокам I, II, III, соответственно. Поскольку х + у + z = 1, можно ограничить рассмотрение переменными х и у.

Исследуем симметричный случай с распределением Дирихле для параметров к\ = к2 = кз = 2. Тогда функция совместной плотности распределения имеет вид

Т (

f(x, у) = Г(2) . г(2) ■ Г(2) ' Ху^ ~Х~У) = 12®ХУ(1 -х-у),

где х,у > 0,х + у = 1.

Заметим, что

1 1 — X

120 J xdx J у( 1 — х — y)dy = 1.

Пусть Д].(х), ¡12 (у), Цз(%) - вероятность того, что игрок 1,11 или III примет текущее предложение

х, у или х, соответственно. Обозначим ДДх) = 1 — Ц{(х), г = 1,2,3.

Теорема. Оптимальные стратегии игроков на к-м шаге имеют вид

1{х>ЗНк-1} 5 ^ 1>^,3,

где 1а ~ индикатор А.

Значение игры удовлетворяет рекуррентным соотношениям

нк = \- т4н^1 - здяь_1)(з - №_1), Но = ъ.

Доказательство. Уравнение оптимальности для выигрыша на к-м шаге имеет вид

1 1 — X

Нк = 120 J xdx J у( 1 — х — y)dy {д1/Х2Мзз: + Дц^гА4

о о

+М1Д2М3Я: + /л М2 Дзж + Д1 Дг Дз<5^а,—1 + Д1Д2Дз<5-Щ,-1 +

+Д1М2Дз<ЗДг-1 + Д1Д2МЗ<ЗДк;-1} ,________к = 1,2,...,____________________(1)

причём Нр = Ь, ¡11=/л1(х), М2=М2(у), Дз = дз(1 - Ж - 2/)-

Преобразуя выражение (1), получаем

1 1 — X

Нк = 120 J X • Их{x)dx J {(ж - 5Нк-1) (дг + Мз - 2д2Дз)}у(1 - х - у^у+

Для максимизации своего выигрыша игрок I может влиять только на значение первого интеграла в формуле (2). Введём обозначение

1-Х

Ск{х) = X I {(ж - 5Нк-1) (¿¿2 + М3 - 2/х2дз)} у(1 — х — у)йу. о

Оптимальная стратегия игрока I имеет вид

. | 1, если Ск(х) > О

/Л (*) = < п

I I), иначе.

Из симметрии задачи следует, что оптимальное поведение игроков II и III должно быть одинаковым, т.е. ц2{у) = Мз(1 -X - у).

Выражение Ск{х) будет положительно, если

1 — Х

х(х-6Нк-г) ! (¡12 + Дз - 2д2Мз)у(1 - X - у)¿у > 0; о

\х(х - 5Нк-г) ■ (1 - х)3 > 0; о

х — 6Нк-1 > 0.

Таким образом, при х > 5Нк-\ получаем Ск(х) > 0, в противном случае Ск(х) < 0. Зафиксируем такое а, что Ск(о) = 0.

Находим равновесие рассматриваемой игры в классе пороговых стратегий. Пусть = 1{у>о} ■, дз = 1{г>а}. Рассмотрим три случая:

1) При 0 < х < 1 — 2а получаем

1 — X

J (М2 + Мз - 2/х2дз) у(1 - X - у)<1у = о

___а___________________1 — х_______________________________

= I у(1-х-у)йу+ ! у{\ - ж - у)йу = ^а2 (3 - Зх - 2а).

О 1—х—а

2) При 1 — 2а<ж<1 — а значение указанного интеграла будет описываться формулой

1—х—а 1—х

J y(l-x-y)dy+ J y(l-x-y)dy =

= ^(1 — х + 2а) (1 — х — а)2.

О__________________________________

3) При 1 — а < х < 1 рассматриваемый интеграл равен нулю.

Найдём соответствующее выражение для второго интеграла формулы (2)

1 — х____________________1 — а—х_______________

j Д2Мз • У(1 - х - y)dy = j у( 1-х- y)dy =

0__________________________а

= -(1 — х — 2а)(1 + 2а — 2а2 — 2х — 2ах + х2).

6

С учётом полученных выражений, можно записать

Gk{x) = х(х — 8Нк_i) f-а2 (3 — Зх — 2а) • 1{х < 1 — 2а}+

+ -(1 — х + 2а)(1 — х — а)2 • /{1 — 2а < a: < 1 — а}+

О

+0 • /{1 — а < ж < 1}

Т.к. Gfc(a) = 0, то а = 8Нк-\. Тогда

Gfc(aQ = а;(а; - 8Нк-1) (3 — За: — 2^_х) ■ 1{х < 1 - 2^_х}+

+ ^(1 - х + 2<5tffc_i)(l - а: - <5tffc_i)2 • /{1 - 8Нк.г <х<1- 8Нк- J+

О___________________________________________.______________________________________________

+0 • /{1 — 8Нк- 1 < х < 1

Таким образом, если игроки II и III используют пороговые стратегии ¡12 = 1{у>йнк_1], Мз = т0 наилучший ответ игрока I также должен быть /хх = 1{х>ёнк_ 1>-

1

Нк = 120 J ц\{х) ■ Gk{x)dxJr

Q

1 1 — х

+ 120 J xdx j {{х-5Hk-i) №№ +5Нк-1_}у(1 - х - y)dy =

-2ёНк-!

/ х (х — 8Нк-\) (3 — За: — 25Нк-\) dx+ Нк-!

+40 ~J х (х — 8Нк_i) (1 — х + 28Нк-\){1 — х — 6Hk_i)2dx+

о о

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1-2 SHk_!

= 4062н1_г

SHk. 1

1 — -Hfc-1

+20 J x(x - SHk-i)(l ~ x ~ 2SHk-i)-о

:2 tt2 nxzj. . ™ I J2\

•(1 + 2SHk-i — 28 Н£_1 — 2x — 25Hk-ix + x )dx + 8Hk-\.

Получаем рекуррентную формулу

tffc = 8Hk-1 + ^ (1 - 38Нк-г) (1 - 90<54tf4-i + 1206s Н^).

_______________¿i___________________________________________

Следствие. Если <5 = 1, то lim Нк = \.

___________________________к—»ОС_______Q_

Иными словами, при отсутствии дисконтирования и бесконечном горизонте переговоров арбитр может на некотором этапе предложить игрокам делёж единичного пирога поровну.

Список литературы

1. Мазалов В. В., Менчер А. Э., Токарева Ю. С. Переговоры. Математическая тео-рия. СПб: Лань, 2012. 304 с.

2. Brams J. S., Kilgour D. М., Davis M. D. Unravelling in games Qf sharing and

exchange // Frontiers in Game Theory, MIT Press, Cambridge, 1993. P. 194-212.

3. Chatterjee K. Models with complete and incomplete information // IEEE Trans, SMC-11, 1981. P. 101-109.

4. Crawford V. P. On Complusory arbitration schemes // Journal of Political Economy

11. 1973. P. 131-159.

5. Garnaev A. Y. Value of information in optimal stopping games // Game Theory and Applications 5, 2000. P. 55-64.

6. Gibbons R. A Primer in Game Theory. Prentice Hall, 1992. 278 p.

7. Leitman G. Collective bargaining a differential game // Journal of Optimization Theory and Applications 11, 1973. P. 405-412.

8. Mazalov V. V., Banin M.V. N-person best-choice game with voting // Game Theory and Applications 9, 2003. P. 45-53.

9. Mazalov V. V., Sakaguchi М., Zabelin A.A. Multistage arbitration game with random offers // Game Theory and Applications 8, 2002. P. 95-106.

10. Sakaguchi M. A simplified two-person multistage poker with optional stopping // Mathematica Japonica 28, 1983. P. 287-303.

11. Sakaguchi M. A time-sequential game related to an arbitration procedure // Mathematica Japonica 29, 1984. P. 491-502.

12. Sakaguchi M. Optimal stopping games for bivariate uniform distribution // Mathematica Japonica 41, 1995. P. 677-687.

13. Sakaguchi M. Optimal stopping games where players have weighted priviledge // Game Theory and Applications 6, 2000. P. 116-131.

14. Sakaguchi M. Best-choice game where arbitration comes in // Game Theory and Applications 9, 2003. P. 141-149.

Статья поступила в редакцию 25.02.2012 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.