УДК 519.832.2
А. И. Пьяных1
МНОГОШАГОВАЯ МОДЕЛЬ БИРЖЕВЫХ ТОРГОВ С АСИММЕТРИЧНОЙ ИНФОРМАЦИЕЙ И ЭЛЕМЕНТАМИ ПЕРЕГОВОРОВ
Рассматривается модификация дискретной многошаговой модели биржевых торгов с рисковыми ценными бумагами. На каждом шаге торгов игроки делают целочисленные ставки, причем один из игроков знает настоящую цену, а второй — только ее вероятностное распределение. Цена сделки определяется как выпуклая комбинация предложенных ставок с некоторым заданным коэффициентом. Получено решение игры бесконечной продолжительности.
Ключевые слова: многошаговые игры, асимметричная информация, повторяющиеся игры с неполной информацией.
1. Введение. В работе [1] была рассмотрена многошаговая модель биржевых торгов однотипными акциями, в которой торги между собой ведут два игрока. Перед началом торгов случайный ход определяет цену акции на весь период торгов. В состояниях рынка L и Н цена акции равна О и т € N соответственно. Выбранная цена сообщается первому игроку и не сообщается второму, при этом второй знает, что первый игрок — инсайдер. Оба игрока знают вероятность р высокой цены акции. На каждом шаге торгов оба игрока одновременно и независимо назначают некоторую
1 Факультет ВМК МГУ, асп., e-mail: artem.pyanykhQgmail.com
цену за акцию. Игроки могут делать произвольные вещественные ставки, причем игрок, предложивший большую цену, покупает у другого акцию по названной цене. Игроки помнят предложенные цены на всех предыдущих этапах торгов. Задачей игрока является максимизация стоимости портфеля, состоящего из некоторого числа акций и суммы денег. Модель сводится к повторяющейся игре с неполной информацией, как описано в [2], для которой Де Мейером и Салей [1] были найдены оптимальные стратегии игроков и значение игры.
Позднее В. Доманским [3] была рассмотрена модификация модели, в которой ставки игроков могли принимать только целые значения. В данной постановке им было получено решение для игры неограниченной продолжительности. Отметим работу В. Крепе [4] с явным решением для п-шаговых игр при т ^ 3, а также работу М. Сандомирской и В. Доманского [5] с решением одношаговой игры при произвольном т е N.
Рассмотрим следующий механизм формирования цены акции, предложенный в [6]. Игроки одновременно предлагают цены гш При г > з акция продается по цене /Зг + (1 — /3)з, где ¡3 € [0,1] — заданный коэффициент, характеризующий переговорную силу продавца. В работе [3] фактически /3 = 1. Решение задачи при значении /3 = 1/2 получено в [7]. В данной работе решение бесконечной игры найдено при произвольном /3 € [0,1].
2. Модель игры. Пусть множество состояний рынка Б = {Н,Ь}. На первом шаге случай выбирает « € в с вероятностями р(Н) = р и р(Ь) = 1 — р. После этого на протяжении п ^ оо шагов игроки играют в игру с матрицей А8,13, где при а = 1 — ¡3
(аъ + ^з, г < 3-, (аъ + Рз — т, г < 3,
О, г=з, Ан^{г,з)=Ь, 1 = ^
-/Зг - аз, г > </, [т - /Зг - аз, г > </.
На 1-м шаге первый игрок выбирает ставку ц € I = {0,1,...,т}, а второй — ставку
п
31 € J = {0,1,... ,т}. Выигрыш первого игрока в повторяющейся игре равен ^ а®'^ . Второму
г=1
игроку этот выигрыш становится известным только после окончания игры. На промежуточных шагах он не имеет точной информации о величинах а*^.
Таким образом, стратегией первого игрока является последовательность ходов а = {о\, 02, ■ ■ ■, ■ • •); гДе : 3 х а А(I) — множество вероятностных распределений на I.
Как ив [3], мы ограничимся рассмотрением только тех стратегий а, которые гарантируют первому игроку на каждом шаге игры неотрицательный выигрыш. Множество таких стратегий первого игрока обозначим через Е. Аналогично стратегией второго игрока назовем последовательность ходов г = (т1, т2,..., т-1,...), где : Р~1 —> А(</). Множество стратегий второго игрока обозначим через Т.
При применении первым игроком смешанной стратегии а = (сг1? сг2,... ,ап), где = (а^, сг^), о'1 = (с|0,... ,о'1т) е а вторым игроком смешанной стратегии г = (тх, т2,..., тп), где
Ч = • • • -,тг,т) € А(«/), ожидаемый выигрыш первого игрока равен
п
1<;Г ' (р,а,т) = ^ {рАн>Р{а*,п) + (1 -р)А™{а$,п)) , (1)
ге1 зе.1
Полученную игру обозначим через О™''3 (р), а ее значение через У™^ (р).
Заметим, что Аь,&(1,з) = Ан,а(т — — ,?'), Ан^]) = Аь,а{т — 1,т — з). Определим симметричные по отношению к с и г стратегии игроков а% = (а^,аь), где = (с®то,... ,с|0) € А(/),
и 1% = (г4)ТО,..., т^о) € А(«/). Также введем обозначение О™''3 (р) = {1 —р). Легко видеть,
что выигрыши игроков в играх О™''^ (р) и О™''3 (р) при использовании симметричных стратегий совпадают.
3. Оценка сверху выигрыша первого игрока. Следуя [3], рассмотрим чистую стратегию второго игрока rfc, к € J:
{jt-i ~ 1, Ч-i < jt-ъ jt-u it-i=jt-u jt-i + l, it-l>jt-l-
По сути эта стратегия представляет собой стратегию подражания инсайдеру. Доказательство следующего утверждения проводится по индукции.
Утверждение 1. При применении стратегии тк в игре G™' @ (р) второй игрок гарантирует себе проигрыш не более
п — 1 п — 1
hLn{rk) £(*•-/- hn О"*) = $>»-*-*- ß)+i
t=о t=о
в состояниях L и Н соответственно, где х+ = тах(ж; 0) для х € Ж.
Очевидно, что h^(rk) и h^ (тк) монотонны и ограничены сверху по п. Введем следующую функцию:
Я™"3 (р) = min lim {ph*(rj) + (1 - рК(тГ)) = jej n-i-oo
= min [p(m - j)(m - j + а - ß) + (1 - p)j(j + ß - a)] /2.
При p € ((к — a)/m, (к + ß)/m)] минимум по j 6 J достигается при j = к. Таким образом, Я™'*3 (р) является кусочно-линейной функцией, состоящей изта + 1 линейных сегментов, и полностью определяется своими значениями в точках
Я™"3 ((к + ß)/m) = ((m — (к + ß))(k + ß) + aß) /2, к = 0,m-l, Я™"3 (0) = Я™'*3 (1) = 0.
Пусть второй игрок при р € ((к — а)/тп, (к + ß)/m)} применяет тк, к = 0, т. Обозначим эту стратегию через т*. Тогда справедлива следующая
Лемма 1. При использовании вторым игроком стратегии т* в игре G™'*3 (р), выигрыш первого игрока ограничен сверху функцией Я™'*3 (р), т. е.
таxK£ß(p,<j,T*)^H£ß(p).
4. Оценка снизу выигрыша первого игрока. Перейдем к описанию стратегии первого игрока, гарантирующей ему выигрыш не менее Я™'*3 (р) в игре О™'*3 (р). Пусть на первом шаге
игрок применяет о\ = где of = а\ = {а1к^(Т1к+1) и а\,г — вероят-
ность сделать ставку г в состоянии я € {Я, Ь}. Применяя ак, инсайдер делает ставки к и к + 1 с некоторыми заданными вероятностями.
Определим следующие параметры: полные вероятности действий к и к + 1, равные и дк+1 соответственно, а также апостериорные вероятности состояния я при условии, что на пре-
дыдущем шаге первый игрок сделал ставку г. Тогда вероятности а( 1 можно найти по формуле Байеса о\ ^ = р{я\г)цг/р{з),1 г = к, к + 1.
Утверждение 2. При использовании ак первый игрок гарантирует себе на первом шаге выигрыш
' тр - @к - щ - @дк+1, ] < к,
(тр(Н\к + 1) - к - /3) Як+1, 3 = к, (к + Р-тр(Н\к))дк, 3 = к + 1,
KT'ß (p,atj) = {
ак + ßj — тр + aqk+i, j > к + 1.
Доказательство следует из (1) и определения ак.
Построим оптимальную стратегию инсайдера. Рассмотрим на [0,1] множество Р точек вида р® = '1,/т, г = О, т, р^ = (г + /3)/т, г = 0, т — 1. Для р = рк определим как действие о\ с параметрами
р(Н\к)=рРк_1, р(Н\к + 1)=рРк, Цк = Р, Чк+1 = а.
Дополнительно определим как действие, состоящее в применении ставки 0 с вероятностью 1,
а ф®п — как действие, состоящее в применении ставки т с вероятностью 1. Аналогично для р = рк
10 - к определим фк как действие а^ с параметрами
р(Н\к)=р1, р(Н\к + 1) =р1+ъ Як = а, дк+1=/3.
Утверждение 3. При р € Р для значения К™'13 (р,<т,]) выигрыша первого игрока верны оценки
ттК™'р (р1,ф1,]) ^ 0, штК™"3 (рк,фк,А ^ а/3. (3)
з^ '
Справедливость утверждения устанавливается подстановкой фк и фк в (2). Заметим, что если р € Р, то при применении инсайдером на первом шаге игры фк и фк, значения апостериорных вероятностей также принадлежат Р. Таким образом, можно продолжить применение ф1 и фк на последующих шагах игры, тем самым определив стратегию о* в игре О™''3 (р), где р € Р, п € N.
Пусть Ь™'*3 (р) при р € Р — гарантированный выигрыш первого игрока в игре О™''3 (р) при применении стратегии а*. В силу рекурсивной структуры игры О™'*3 (р) (см. [3]) и неравенств (3) для Ь™'*3 (р) справедливы формулы
((к + Р)/т) = а/3 + (к/т) + /ЗЬ™!_{ ((к + 1 )/т), к = 0,т- 1,
Ь™"3 (к/т) = /3 ((к- 1 + /3 )/т) + ((к + /3 )/т), к = 1,т- 1, (4)
(0) = (1) = о.
Так как Ь™'*3 (р) не убывает по п и ограничена сверху, то устремив п к бесконечности, получим нижнюю оценку Ь™'*3 (р) выигрыша первого игрока в игре О™'*3 (р), р € Р. Введем следующие обозначения:
Ь2к = Ь^(к/т), к = Ь2к+1 = Ь^((к + Р)/т)), к = 0,т-1.
Тогда справедливы формулы
Ь2к+1 = а/3 + аЬ2к + РЬ2(к+1), к = 0,т-1,
Ь2к = рЬ2к-1 + аЬ2к+1, к = 1,т-1, (5)
-^0 = 1-'2,11 = 0.
Введем матрицу В размера (2т — 1) х (2т — 1) и вектор Ь длины (2т — 1):
(1 -р 0 0 •• • 0 0 0 \ / а/3\
-р 1 —а 0 •• • 0 0 0 0
0 —а 1 -р •• • 0 0 0 , ь = а/3
0 0 0 0 •• • -р 1 —а 0
0 0 0 •• ■ 0 —а 1 / \аР/
Тогда (5) запишется в виде ВЬ = Ь, Ь0 = Ь2т = 0, где Ь = (1,1, !. >...., Ь2т-\)Т.
Систему Мх = / с трехдиагональной матрицей М. имеющей структуру
/с! Ъг 0 ••• О О 0 \
а2 с2 Ь2 ••• О О О
М =
О'П-1 Сп-1 Ьп-1 О ап сп
о о о • \о о о •
можно решать методом прогонки, используя следующие формулы для прогоночных коэффициентов и неизвестных (см. [8]):
Ьг
Тг+1 =
¿г+1 =
Ьг
Сг + ЩЪ ' /г - а-Л
% — 2« > > > > тъ 1»
Сг + Йг7г Хг = 1г+1Хг+1 + ¿¿+1,
% = 2, . . . , П,
г = п — 1,
1,
72 = ч
С1
¿2 = А
С1
Хп — ¿п+1
Утверждение 4. Для матрицы В прогоночные коэффициенты определяются для 1 ^ к ^ ^ т — 1 следуют,ими формулами:
12к ~ -Т.-' 12к+1 ~
к
¿2 к =
а(к^1 + 2/3)
$2к+1 ~
к ' * + /3'
Данное утверждение доказывается по индукции. Из (5) следует, что ^2к-1 = 12к12к + 1^2к + 1 + 12к$2к+1 + ¿>2к1
к[3(к — 1 + 2/3) 2(к + Р) '
к = 1,т — 1.
Подстановкой Я™'*3 ((к + /3)/т) вместо Ь2к+1 это равенство обращается в тождество. Тем самым доказано
Утверждение 5. Решение системы (5) дается следуют,ими формулами:
1
к
1^2к+1 = ^[(т - (к +/3))(к +/3) + а/3], к = 0,т-1, Ь2к = -^(т-к), к = 0,т.
Итак, мы определили функцию Ь^'*3 (р) при р € Р. Для ре [0,1] \ Р стратегия инсайдера основана на применении выпуклой комбинации стратегий для крайних точек интервала, в котором находится р.
Утверждение 6. При А € (0,1), ¡3 ^ 1/2, к = 0,т — 1 для значения выигрыша первого игрока верны оценки
ттК^ (Арак + (1 - Х)Р1\Ф1 + (1 " *)Ф1З) > " А),
ттКГ'13 (Ар1 + (1 - Х)р1+Ъ\ф1 + (1 - \)ф1+ъз) ^ а(3\.
Утверждение следует из линейности К™''3 (р, с,]) по с и равенства (2).
Утверждение 7. При А € (0,1), ¡3 ^ 1/2, к = 0,т — 1 для гарантированного выигрыша первого игрока в игре О™'*3 (р) справедливы равенства
Ь™"3 (Ар° + (1 - А)р£) = А/.'»- ! (р°) + (1 - А)/.'»- ! (р1
^ (Лр2 + (1 - А)р2+1) = А/.'»-! (р£) + (1 - А)/.'»-! (р°) .
Доказательство. Пусть р = Ар^ + (1 — А)р^+1, где к = 0, т — 2, А € (0,1). Обозначим через
+ (1 — А)<^+1 распределение, при котором первый игрок рандомизирует выбор ставок к, к + 1, к + 2 с параметрами
<7к = Аа, д/г+1 = /3, дк+2 = (1 - А)а, р(Н\к)=р°к, р(Н\к + 1) = Ар^+1 + (1 — А)р^, р(Н\к + 2) = рк+1-
Тогда по аналогии с (4) выписывается следующая рекуррентная формула:
L™"3 (р) = а/3 А + An/.'"'1 (pi) + (1 - A (pf+1) + /3 L™"3 ((1 - A )pf + Ар°+1) .
Так как (1 — А)рк + Ар^+1 € \PkiPk+i)i т0 для -^аэ'3 ((1 — ^)Pk + ^fc+i) справедливо аналогичное
представление. Приведя подобные члены, получим L^{р) = (аРХ + пА/''"'1 + (1" X)aL^ +
+/3 («/3(1 - А) + (1 - A(pi) + An/.'"'1 (pf+1 = ((А; + l)(m - А; - 1) + «А(2к - т + 2/3 + 1)) /2 = А/.'"' ! (pf) + (1 - А)/-'"' ! (р°+1) . (6)
Пусть р = \рк + (1 — А)рк, где А; = 1,m — 1, A G (0,1). Обозначим через Аф\ + (1 — А)фк распределение, при котором первый игрок рандомизирует выбор ставок к и к + 1 с параметрами
Як = А/3 + (1 - А)(1 - /3), р{Н\к) = +
Як Як
Як+i = А(1 - /3) + (1 - А)/3, р(Я + 1) = ^^pf + (1^A)/?pg+1.
Як+1 Як+1
Замечая, что р(Н\к) Е (pk-i^P'kj и Р{Н\к + 1) G (рк'Рк+1)' с помощью (6) получим
L™"3 (р) = A/3L™"3 (pf.,) + (1 - А)(1 - (pg) + A(1 - /3)L™'^ (pf) + (1 - (p°+1) =
= \LZ- 1 (p°) + (1 - A)/,'"' ! (pf) . При p G и p G доказательство проводится аналогично.
Заметим, что при /3 < 1/2 полученные результаты также имеют место, а стратегию а* можно
получить, рассмотрев игру G1^^ (р). Таким образом, мы определили L™'*3 (р) и о* для любых PG[0,1],/3G[0,1].
Лемма 2. При использовании первым игроком стратегии а* в игре G™'*3 (р), его выигрыш ограничен снизу функцией L1^^ (р), т. е.
min KZ>4p,°\r)>L^{p).
Tfc 1
Отметим, что приведенная стратегия инсайдера для р G [0,1] \ Р принципиально отличается от его стратегии в [7], которая оптимальна только при /3 = 1/2.
Теорема. Игра G™'*3 (р) имеет значение V™'13 (р) = if™'*3 (р) = Ь™'*3 (р). Яры этом а* — оптимальная стратегия первого игрока, а т* — оптимальная стратегия второго игрока. Доказательство по форме повторяет доказательство аналогичной теоремы из [3].
СПИСОК ЛИТЕРАТУРЫ
1. De Meyer В., Saley Н. On the strategic origin of Brownian motion in finance // Intern. J. Game Theory. 2002. 31. N 2. P. 285-319.
2. Aumann R. J., Maschler M.B. Repeated Games with Incomplete Information. Cambridge, Massachusetts: The MIT Press, 1995.
3. Domansky V. Repeated games with asymmetric information and random price fluctuations at finance markets // Intern. J. Game Theory. 2007. 36. N 2. P. 265-281.
4. К репс В. JI. Повторяющиеся игры, моделирующие биржевые торги, и возвратные последовательности // Известия РАН. Теория и системы управления. 2009. № 4. С. 109-120.
5. Сандомирская М.С., Доманский В. К. Решение одношаговой игры биржевых торгов с неполной информацией // Математическая теория игр и ее приложения. 2012. 4. № 1. С. 32-54.
40
ВЕСТН. МОСК. УН-ТА. СЕР. 15. ВЫЧИСЛ. МАТЕМ. И КИБЕРН. 2016. № 1
6. Chatterjee К., Samuelson W. Bargaining under incomplete information // Operations Research. 1983. 31. N 5. P. 835-851.
7. Пьяных А. И. Об одной модификации модели биржевых торгов с инсайдером // Математическая теория игр и ее приложения. 2014. 6. № 4. С. 68-84.
8. Самарский А. А., Гулин А. В. Численные методы. М.: Наука, 1989.
Поступила в редакцию 15.04.15
MULTISTAGE BIDDING MODEL WITH BARGAINING
Pyanykh A. I.
This paper is concerned with a modification of a discrete multistage bidding model. Bidding takes place between two players for one unit of a risky asset. The first player (an insider) knows the real price of the asset, while the second player knows only a probability distribution over the price. At each stage of the bidding players make integral bids. The higher bid wins and one unit of the asset is transacted to the winning player, wherein the price of the transaction equals to a convex combination of bids. This model is reduced to a repeated game with incomplete information. The solution for the infinite game is found.
Keywords: repeated games, asymmetric information, bargaining.