Научная статья на тему 'Модифицированная многошаговая модель биржевой игры со счетным множеством состояний'

Модифицированная многошаговая модель биржевой игры со счетным множеством состояний Текст научной статьи по специальности «Математика»

CC BY
109
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МНОГОШАГОВЫЕ АНТАГОНИСТИЧЕСКИЕ ИГРЫ / АСИММЕТРИЧНАЯ ИНФОРМАЦИЯ / ИНСАЙДЕРСКАЯ ТОРГОВЛЯ

Аннотация научной статьи по математике, автор научной работы — Пьяных Артем И.

Рассматривается упрощенная модель финансового рынка, на котором два игрока ведут торговлю однотипными акциями в течение некоторой последовательности шагов. Первый игрок (инсайдер) информирован о настоящей ликвидной цене акции, которая может принимать любое значение из $\mathbb{Z}_{+}$. В то же время второй игрок знает только вероятностное распределение $\bar p$ цены акции и что первый игрок – инсайдер. На каждом шаге торгов игроки делают целочисленные ставки. Игрок, предложивший бо́льшую ставку, покупает у другого акцию по цене, равной выпуклой комбинации предложенных ставок с некоторым коэффициентом $\beta$. После каждого хода сделанные ставки становятся известны обоим игрокам. В работе получено решение повторяющейся антагонистической игры неограниченной продолжительности для распределений $\bar p$ с конечной дисперсией.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Модифицированная многошаговая модель биржевой игры со счетным множеством состояний»

УДК 519.83 ББК 22.18

МОДИФИЦИРОВАННАЯ МНОГОШАГОВАЯ МОДЕЛЬ БИРЖЕВОЙ ИГРЫ СО СЧЕТНЫМ МНОЖЕСТВОМ СОСТОЯНИЙ1

Пьяных А. И.2

(Московский государственный университет имени М.В. Ломоносова, Москва)

Рассматривается упрощенная модель финансового рынка, на котором два игрока ведут торговлю однотипными акциями в течение некоторой последовательности шагов. Первый игрок (инсайдер) информирован о настоящей ликвидной цене акции, которая может принимать любое значение из Z+. В то же время второй игрок знает только вероятностное распределение р цены акции и что первый игрок — инсайдер. На каждом шаге торгов игроки делают целочисленные ставки. Игрок, предложивший большую ставку, покупает у другого акцию по цене, равной выпуклой комбинации предложенных ставок с некоторым коэффициентом После каждого хода сделанные ставки становятся известны обоим игрокам. В работе получено решение повторяющейся антагонистической игры неограниченной продолжительности для распределений р с конечной дисперсией.

Ключевые слова: многошаговые антагонистические игры, асимметричная информация, инсайдерская торговля.

1 Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта №16-01-00353а. Автор признателен своему научному руководителю к.ф.-м.н., доценту В.В. Морозову за помощь в написании данной статьи.

2 Артем Игоревич Пьяных, аспирант ([email protected]).

Введение

В данной работе рассматривается упрощенная модель финансового рынка [1, 10], в которой два игрока ведут торговлю однотипными акциями на протяжении п ^ те шагов. Перед началом торгов случайный ход определяет цену акции € 5 на весь период торгов в соответствии с вероятностным распределением р = (ря, в € Б). Выбранная цена сообщается первому игроку (инсайдеру). Второй игрок при этом знает только вероятностное распределение р и не осведомлен о настоящем значении цены. Второй игрок знает, что первый игрок — инсайдер. На каждом шаге торгов игроки одновременно и независимо назначают некоторую цену за акцию. Игрок, сделавший большую ставку, покупает акцию у другого; если ставки равны, сделки не происходит. После каждого шага торгов выбранные ставки сообщаются игрокам. Задачей каждого игрока является максимизация стоимости итогового портфеля, состоящего из некоторого числа купленных акций и суммы денег, полученных в результате торгов. Данное описание считается известным обоим игрокам.

Впервые подобная задача была рассмотрена Б. Де Мейером и Х. Салей в [9]. В их модели цена акции может принимать два значения 0 и 1, а игроки делают произвольные ставки из отрезка [0,1]. Эту модель будем называть непрерывной. В рамках такой модели торгов на финансовом рынке авторами была продемонстрирована возможность стратегического происхождения броуновского движения в эволюции цен на финансовые активы.

Позднее В.К. Доманским в [10] была исследована модель, в которой цена акции также может принимать два значения 0 и 1, но игроки могут делать ставки только из конечного множества {г/т, г = 0, т}, т € N. Эту модель будем называть дискретной. Формально дискретная модель описывается повторяющейся игрой с неполной информацией (см. [7]). В работе [10] показано, что последовательность верхних значений п-шаговых игр ограничена, что позволяет определить и решить игру с бесконечным

количеством шагов. Установлено, что при применении игроками оптимальных стратегий последовательность ожидаемых ликвидных цен акции образует симметричное случайное блуждание по множеству допустимых ставок с поглощением в крайних точках. В момент поглощения оценка вторым игроком ликвидной цены акции совпадает с истинным значением этой цены. В этот момент торги могут быть остановлены, так как последующий выигрыш первого игрока равен нулю.

Для игр с конечным количеством шагов аналитические решения получены только в частных случаях: М.С. Сандомирской и В.К. Доманским в [6] найдено решение одношаговой игры при произвольном натуральном значении т, а В.Л. Крепс в [2] построено решение п-шаговых игр при т ^ 3.

В работе [1] рассмотрено обобщение дискретной модели на случай, когда цена акции может принимать любое значение в € 5 = Ъ+. Решение игры с бесконечным количеством шагов найдено в предположении конечности дисперсии цены акции. Авторами установлено, что в данном случае оптимальная стратегия инсайдера также порождает симметричное случайное блуждание цен сделок.

В указанных выше работах сделка осуществляется по цене, равной наибольшей из выбранных ставок. Можно, однако, рассмотреть другой механизм, предложенный в [8], и положить цену сделки равной выпуклой комбинации ставок с коэффициентом @ € [0,1], т.е. если игроками были сделаны ставки г = то акция будет продана по цене

Р шах(г, ]) + (1 — р) шт(г, ]). Фактически, в [1, 10] коэффициент [3 равен 1. Дискретная модель с двумя возможными ценами акции и @ = 1/2 рассмотрена в [4], ее обобщение на случай произвольного [3 € [0,1] см. в [5].

В данной работе это обобщение проведено для дискретной модели со счетным множеством возможных значений цены акции. Установлено, что оптимальная стратегия инсайдера порождает случайное блуждание последовательности ликвидных цен акции, которое, однако, уже не является симметричным. Описа-

ние возникающих в рассматриваемой модели случайных блужданий дается в п. 4. Появление случайного блуждания в более общей модели подтверждает гипотезу Б. Де Мейера и Х. Салей о возможном стратегическом происхождении случайных флукту-аций цен на фондовых рынках.

Доказательства утверждений вынесены в приложение.

1. Постановка задачи

Пусть множество состояний рынка 5 = Ъ+. Перед началом игры случай выбирает состояние рынка 8 € 5 в соответствии с вероятностным распределением р = (р/, в € Б), имеющим конечную дисперсию состояния В р < те. Множество всех таких распределений обозначим Р.

На каждом шаге игры £ = 1, п, п ^ те, игроки делают ставки ц € I, € 3, где I = 3 = Z+. В силу того, что игрок, предложивший большую ставку, покупает акцию у другого по цене, равной выпуклой комбинации предложенных ставок, выплата первому игроку в состоянии 8 равна

На шаге Ь обоим игрокам достаточно принимать в расчет лишь последовательность (11,12,... ,1^1) действий первого игрока на предыдущих ходах. Это связано с тем, что информация, получаемая вторым игроком относительно состояния 8, может передаваться лишь посредством действий первого игрока. Подробное обсуждение данного факта можно найти в [11].

Обозначим через А(Х) совокупность всех вероятностных распределений на множестве X.

Определение 1. Стратегией первого игрока является последовательность ходов а = (а1,... ,ап), где : в х 14-1 ^ А(1). Множество стратегий первого игрока обозначим £.

Определение 2. Стратегией второго игрока является последовательность ходов Т = (т1,..., тп), где ъ : 14-1 ^ А(7). Множество стратегий второго игрока обозначим Т.

Таким образом, первый игрок на каждом шаге игры рандо-мизирует свои действия в зависимости от состояния рынка 8 и истории своих ставок. Второй игрок, в свою очередь, не имея информации о состоянии рынка 8, опирается только на историю ставок инсайдера.

Будем считать, что игроки обладают неограниченными запасами рискового и безрискового активов, т.е. торги не могут прекратиться по причине того, что у одного из игроков закончатся акции или деньги. Кроме того, предположим, что в начальный момент времени оба игрока имеют нулевые портфели.

При использовании игроками стратегий а и т ожидаемый выигрыш первого игрока равен

п

(р,а,т) = ) £ а^(ц,Ъ),

4=1

где математическое ожидание берется по мере, индуцированной р, а и т на множестве 5 х 1п х .]п. Заданную таким образом игру обозначим сП(р).

Определение 3. Если для некоторых стратегий а* € £, Т* € Т выполняются равенства

inf К?(р,а*,Г) = К?(p,â*,f *) = supК?(p,â,f *) =f reT ses

то говорят, что игра сП(р) имеет значение vi(p), а стратегии а* и f * называются оптимальными.

Нижнее и верхнее значения игры сП(р) обозначим соответственно

У£(р) = sup inf КП(р, я, f ), уП(р) = inf sup К ?(р, â, f ).

ses r eT r eTaes

Данные функции являются вогнутыми на Р. Доказательство этого утверждения проводится аналогично [10]. 10

Следуя [1], опишем рекурсивную структуру игры Представим стратегию первого игрока в виде а = (а,аг,г € I), где а — его ход на первом шаге, а аг — его стратегия в игре продолжительности п — 1 в зависимости от ставки г, выбранной им на первом шаге. Аналогично, стратегию второго игрока представим в виде г = (т,тг, г € I). Далее, обозначим полную вероятность, с которой первый игрок делает ставку г € I, а д = (яг, г € I) — соответствующее распределение. Также обозначим р/\г апостериорную вероятность состояния в зависимости от ставки г первого игрока, и рг = (р^1, € Б) — соответствующее апостериорное распределение. Тогда для функции выигрыша первого игрока в игре Сп(р) справедлива формула (1) (р, а, т) = К{(р, а,т) + £ ^К^Р, аг, тг).

2. Оценка сверху выигрыша первого игрока в игре С^(р)

В [1] определена следующая чистая стратегия второго игрока тк = (тк, £ = 1, те):

{]- — 1, Ч-1 <к-1, Н-1, 4-1 = #-1,

у— + 1, Ц-1 >Зг-1.

Другими словами, второй игрок делает ставку равную к на первом шаге, а далее либо подражает инсайдеру, либо смещается на единицу к ставке инсайдера предыдущего шага. Положим

х+ = тах(0, х), х € М.

Лемма 1. При применении стратегии тк в игре Сп (р) второй игрок в состоянии 8 гарантирует себе проигрыш не более

(п-1

^(к — 8 — £ — 1+ Р)+, 8 < к,

К(тк) =

4=0 га-1

^(8 — к — £ — Р)+, 8>к.

{ 4=0

Для любого s G S последовательность )}0 1 не убывает,

ограничена сверху и сходится к

(2) hs00(fk) = (s - k + 1 - 2fi)(s - k)/2. Следующие множества распределений зададим ограничениями на математическое ожидание состояния:

&(х) = {р G Р : Eр = х} , Л(х, у) = {р G Р : х < Eр ^ у] .

Пусть f * — стратегия второго игрока, состоящая в применении fk при р G A(k - 1 + fi,k + fi). Отметим, что при заданном распределении р выбор к зависит от значения fi. Отсюда следует, что стратегия f * также зависит от fi.

Теорема 1. При использовании вторым игроком стратегии т* выигрыш первого игрока в игре g0o(p) ограничен сверху функцией

#0 (Р) = ^ Y,Psh0o(rk).

ses

Функция н0 (р) является кусочно-линейной вогнутой с областями линейности Л(к — 1 + fi, к + fi) и областями недифференцируемости &(к + fi) при к G S. Для распределений р с E р = к — 1 + fi + г], ц G (0,1], ее значение равно

(3) #0(р) = (Вр + fi(1 - fi) - ч(1 - л)) /2. Заметим, что в данном случае наблюдается сдвиг областей линейности на fi относительно Eр в сравнении с областями из [1].

3. Оценка снизу выигрыша первого игрока в игре G00(p)

Перейдем к описанию стратегии первого игрока, гарантирующей ему выигрыш не менее (р). Пусть of — компонента хода a первого игрока, т.е. вероятность сделать ставку г в состоянии s. По правилу Байеса о\ = р^гqz/ps. В частности, справедливы равенства J2.Sçs asPS = (t, i G I. Таким образом, ход a первого игрока можно определить, задав следующие параметры: полные 12

вероятности дг сделать ставку г и апостериорные вероятности р3% для € . Тогда его одношаговый выигрыш выражается следующим образом:

(4) К? (р ,а, Л = ЕЕ ^^ (1,1)

3 (п Л- о) = О^^п3'3 (

ге! вея

Обозначим ьП(р, о) гарантированный выигрыш первого игрока, использующего стратегию а в игре сП(р), т.е.

^ПСР,ё) = ™1Кп(Р^, 7).

те т

Лемма 2. Пусть р1, р2 € Р, а1 ,а2 € £ — стратегии первого игрока. Тогда для р = Хр1 + (1 — А)р2, А € [0,1], найдется такая стратегия ас € £, что

ЬП(Р, (Гс) ^ АЬП(р 1, (Г1) + (1 — А)ЬП(Р2, ^2).

Обозначим е 3 вырожденное вероятностное распределение с носителем в точке в . Пусть рх(1, г) € &(х) — распределение с носителем {I, г}, I < г. При этом распределении вероятности реализации состояний I и г равны (г — х)/(г — 1) и (х — 1)/(г — I) соответственно, а дисперсия

В рх(1, г) = (х — I )(г — х).

Как показано в [1], любое распределение р = (рв, в € Б) € в(х) может быть представлено в виде выпуклой комбинации распределений с двухточечными носителями следующим образом:

' те х-1

х х

(5) Р =

рхех + (р)рх(1 ,г), х € Б,

г=х+11=0 те \х— 1]

Е £ а1'г(Р)Рх(1,г), х/в,

чг=|_х+1] I=0

Г х 1]

(6) аг,г(р) = (г — 1)р1 рг/ ^ р%х — г),

=0

где |_х] — целая часть х, а |~х~| — наименьшее целое у ^ х.

Обозначим через Ь1({в2}) банахово пространство последовательностей (Iв Е Б) с нормой \\1\\ = ^^=0 в2118|. Множества Р и О(х) являются выпуклыми замкнутыми подмножествами пространства Ь1({з2}).

Лемма 3. Пусть последовательность {1п} С Ь1({з2}) такая, что для любых 8 Е Б и п ^ 1 верно 1яп ^ 0, 1яп ^ 1п+1. Тогда если существует ее сходящаяся по норме подпоследовательность {Цп}, то и сама последовательность {1п} сходится по норме.

Лемма 4. Для любого распределения р Е &(х) ряд в разложении (5) сходится к р по норме.

В силу того, что функционал ¥.П(Р) вогнут на Р и по теореме 1 ограничен на данном множестве, то он непрерывен на Р (см. [3, теорема 1.7.1]). Отсюда и из леммы 4 следует, что для распределений р Е &(х) выполнено

' те X — 1

^П(Р) > РхШех) + ЕЕ «V (Р)У-П (Рх(1, г)), X Е Б,

г=х+11=0 те [х—1]

у-П(р) > ЕЕ а>,г шп (рх(1, г)), х е б.

г=|_х+1] I=0

Из данных неравенств, теоремы 1 и леммы 2 следует, что для доказательства совпадения верхней и нижней оценок выигрыша в игре С^ (р) можно ограничиться рассмотрением только распределений р = рк+/3(I, г) Е &(к + Р), к Е Б, I = 0,к, г = к + 1, те. Для таких распределений мы построим стратегию первого игрока а*, для которой Ь^(р, а*) = Н^(р). Отсюда будет следовать, что ^ (р) = Н^ (р), а а* и т* — оптимальные стратегии игроков в игре С^ (р).

Обозначим <Гк ход первого игрока, состоящий в выборе ставки из множества {к, к+1}. Ход <Гк определяется заданием полных вероятностей д к ,дк+1 и апостериорных распределений рк ,рк+1, причем дк + дк+1 = 1. Следующая лемма является обобщением утверждения 2 из [5]. 14

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Лемма 5. При использовании <к одношаговый выигрыш первого игрока равен

КГ1 (р,<к, ]) = <

Ер - 3к - (1 - 13)з - ¡3дк+1, з<к,

(Е рк+1 -к - 3) чк+1, ) = к1

(к + 3 - Ерк)Чк, ) = к +1, (1 - 3)к + ¡2 - Е р +(1 - 3) дк+1, 2>к + 1.

Определим стратегию а* первого игрока в игре Око (р). Введем множество распределений

Р(I, г) = {рк(I, г), р3+3(I, г), к = 1/т, = 1,г - 1} .

При р £ Р(I, г) первый ход а* стратегии а* определяется следующим образом. Если р = р1(1, г) или р = рг(I, г), то первый игрок использует ставки I и г, соответственно, с вероятностью 1. В противном случае он использует <Гк с параметрами из таблицы 1.

Таблица 1. Параметры хода а* при р £ Р(I, г)

р дк+1 -к рк рк+1

рк(1, г) 3 1 -3 рк-1+Р (1, г) рк+3 (1, г)

рк+3 (1, г) 1 -3 3 рк (1, г) рк+1(1, г)

На последующих шагах игры ход а* применяется рекурсивно для соответствующих значений апостериорных вероятностей. В результате определили стратегию а* для распределения

р £ Р(I, г).

Обозначим Щ(а) = ьП(рх(1, г), а), а £ £. Следующая теорема является обобщением утверждения 5 из [5].

Теорема 2. Пусть 3 £ (0,1). При использовании стратегии а* в игре Око (р) для распределения р £ Р(I, г) гарантированный выигрыш первого игрока удовлетворяет следующей системе:

(7^ Ь1(а*) = 3Ьк~1+р (а*) +

+ (1 - 3)Ьк+13(а*), к = 1 + 1, г - 1,

(7Ь) Ьк+(а*) = Р(1 -Р) + (1 - Р)Ь^(а*) +

+ рЬк0+1(а*), к = 1,г - 1, (7с) Ь1Х (а*) = Ь^ (а*) = 0.

Ее решение дает нижнюю оценку выигрыша первого игрока, равную

Ь^ (рк+Р (I, г), а*) = (Г-к)(к + Р - 1)+13(1 -р).

Поскольку Врк+Р(I, г) = (г - к - Р)(к + Р - I), а распределение рк+Р(I, г) удовлетворяет условию теоремы 1 с ] = 1, выражения для НР(рк+Р(I, г)) иЬ^(рк+Р(I, г) , а*), к = 1,г - 1 совпадают. Из теоремы 1 также следует, что

НР(Р 1(1, г)) = НР(рг(I, г))=0.

В самом деле, распределения р1 ( I, г) и рг (I, г) удовлетворяют условию теоремы 1с ] = 1 - Р и имеют нулевую дисперсию.

Для произвольного распределения р Е &(к), к Е Б, стратегию а* определим следующим образом. Если реализуется состояние в = к, то гарантированный выигрыш первого игрока не превышает 0 и он прекращает игру. Таким образом, первый игрок, следуя стратегии а*, прекращает игру с вероятностью рк. В противном случае игрок использует конструкцию леммы 2 для построения стратегии, соответствующей выпуклой комбинации распределений рк(I, г) в разложении р. Первый ход такой стратегии использует две ставки к и к + 1 с полными вероятностями (1 - рк)Р и (1 - рк)(1 - Р) соответственно. Апостериорные вероятностные распределения являются выпуклыми комбинациями соответствующих апостериорных двухточечных распределений и даются следующими формулами:

те к—1

рк = £ (р)рк—1+Ро, ^

Р г=к+11=0 1 те к—1

Рк+1 = £ (р) Рк+Р (I, г).

1 Р I 1 7—П

г=к+11=0

Для распределений р со счетным носителем сходимость по норме данных рядов устанавливается аналогично доказательству леммы 4.

Аналогичные рассуждения справедливы и для распределений р е <3>(к + Р) и Л(к, к + Р), к Е Б.

4. Решение игры С^ (р)

Подчеркнем, что приведенная в п. 3 стратегия инсайдера а* определена только при Р Е (0,1).

Нетрудно проверить справедливость следующего равенства:

аг'Р(г, з) = а1'1—Р(г+ 1 - г, г + 1 - з).

Из него вытекает, что решение игры С^(рх(1, г)) сводится к решению игры с1оР(р 1+г—х(1, г)). При этом ставки, используемые в соответствующих смешанных стратегиях инсайдера, симметричны относительно точки (I + г)/2. Аналогичные рассуждения справедливы для игры С^ (р) при любом распределении р Е Р.

Оптимальная стратегия а* инсайдера в игре С^ (р) при Р = 1 найдена в [1]. Решение С^(р) при Р = 0 может быть получено при помощи описанной выше конструкции из решения С^ (р) при Р = 1. Таким образом, при любом Р Е [0,1] справедлива следующая

Теорема 3. Игра С^ (р) имеет значение

(р) = НР (р) = ь^ (р),

а а* и Т* — оптимальные стратегии игроков.

Применение первым игроком стратегии а* при р Е Р(I, г) порождает случайное блуждание последовательности апостериорных вероятностей, изображенное на рисунке 1, которое в отличие от [1] происходит по более широкому множеству и уже не является симметричным, за исключением случая Р = 1/2.

р1(I, г) р'+Р(I, г) р1+1(I, г)

3

1 -3

щг-!+¡3 (1, г) рг (1, г) ^^ 1 1 -3 3

Рис. 1. Случайное блуждание последовательности апостериорных вероятностей, порожденное а*

В дополнение к стратегии а* построим еще одну оптимальную стратегию £* инсайдера. Введем множество распределений

Р'

''(I, г) = {р\1, г),рг(I, г)} и {рк+3(I, г), к = 1,г - 1} .

При р £ Р'(I, г) первый ход £* стратегии £* определяется следующим образом. Если р = р1(1, г) или р = рг(I, г), то первый игрок использует ставки I и г, соответственно, с вероятностью 1. В противном случае он использует <Гк с параметрами из таблицы 2.

Таблица 2. Параметры хода {* при р £ Р' (I, г)

1

р дк+1 -к Рк рк+1

р1+3 (1, г) 1 1+3 3 1+3 р1(1, г) р1+1+3 у, г)

рг-1+3 (1, г) 1-3 2-3 1 2-3 рг-2+3(1, г) рг (1,г )

рк+3({, г) 1 2 1 2 рк-1+3 (1, г) рк+1+3 (1, г)

Для остальных распределений р стратегия {* определяется аналогично тому, как это было сделано для стратегии а*.

Использование стратегии £* при р £ Р'(1, г) порождает случайное блуждание последовательности апостериорных вероятностей, изображенное на рисунке 2. Данное блуждание симметрично с вероятностями перехода в соседние состояния равными 1 /2, симметрия нарушается только в крайних и соседних к ним состояниях.

р1(I, г) р'+Р(I, г)р1+1+Р (I, г)

1+Р (I, г) рг (I, г)

1-1 2-/3

1

2 — @

Рис. 2. Случайное блуждание последовательности апостериорных вероятностей, порожденное

1

Из леммы 4 можно вывести, что

11 (и = ТГр, 11 (и = 2-р, 1 2,

Ьк+ (1*) = 1, к = 1 + 1, г - 2.

(8а) Ь+ (I *) = + Т^БЬ1Ж (I *) + (I *),

Отсюда следует, что при использовании стратегии £* в игре О4о(р) для распределения р Е Р'(I, г) гарантированный выигрыш первого игрока удовлетворяет следующей системе:

1

1 + р ' 1~гтеК* ' ' 1 + Р' (8Ь) ь:-1+ра*) = + ц-2+р(I*) + ^ьте(1 *),

(8с) а*) = 1+Ьте-^(I*)+

+ а*), к = 1 + 1, г - 2,

^ ьтеа *)=ьгоа(£ * )=0.

Нетрудно проверить, что подстановкой

н,р {-к+р {1 г)) = (г-к-Р)(к + Р - 1)+Р а-у),

нр(р1(1, г)) = нр(рг(I,г))=0,

вместо Ь,те+13(I*), к = 1,г - 1, Ь1те(I*) и Ьгте(I*) соответственно данные равенства обращаются в тождества. Отсюда, как и для стратегии а*, следует, что стратегия £* является оптимальной.

Отметим, что в отличие от стратегии â* стратегия определена при P G [0,1] и совпадает с оптимальной стратегией инсайдера из [1] при P = 1. При этом обе стратегии â* и порождают существенно различные случайные блуждания апостериорных вероятностей.

Приложение

Доказательство. [Лемма 1] Проведем доказательство индукцией по п для случая s > к. При п = 1 оптимальный ответ первого игрока на тк будет i = к + 1. Тогда его выигрыш в игре g4 (р) равен

h{(fk ) = s- P (к + 1) - (1 -P)k = s-к -P.

База индукции проверена. Предположим, что утверждение верно при п ^ N. При п = N + 1 первый игрок имеет два разумных ответа на тк : ставка i = к + 1, что соответствует покупке акции по наименьшей возможной цене, и ставка г = к - 1, что соответствует продаже акции за наибольшую возможную цену. Найдем оценки выигрыша в каждом из случаев. Для г = к + 1 выигрыш первого игрока не превосходит величины

N

s-к - р + hsN (fk+1) = Y^s -к -t- P)+.

t=0

Аналогично для г = к - 1 тот же выигрыш не превосходит

N-2

рк + (1 -P)(k - 1) - S + hN (fk-1 ) = ^ (S -к -t- P ) + .

t=0

При s ^ к формула для hsn(тк) доказывается аналогично. Сходимость последовательности {h'S(fk)} 1 к h'0o(fk) следует из равенств hS(fk) = hS+1(fk) при п ^ s - к.

Доказательство. [Теорема 1] Воспользовавшись (2), получим

hs00(fn = (i2 + (2P - 1 - 2Ep) j-

(П.1) ses

-(2P - 1) Ep + Eр2)/2.

Квадратичная функция /(х) = х2+(2(3-1-2 Е р)х достигает минимума при х = Е р-(3+1/2. Отсюда при р Е Л(к-1+(3, к+/3) выражение (П.1) достигает минимума при 3 = к. Равенство (3) проверяется непосредственной подстановкой Ер = к - 1 + $ + ] в (П.1).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Доказательство. [Лемма 2] Без потери общности будем считать, что второй игрок использует стратегии т, в которых распределения на множестве ставок имеют конечные математические ожидания. В противном случае ожидаемый выигрыш первого игрока будет равен бесконечности. Множество таких стратегий обозначим Т'.

Докажем следующее утверждение: найдется такая стратегия = (&с, &гс) Е £, что при всех т Е Т' справедливо равенство (П.2) К%(р,ас, т) = \К%(Р1,а1, т) + (1 - Л)К%(рг,аг, т). Доказательство проведем по индукции. Пусть дг = (д^, г Е I) и ргн = (р^г, в Е Б) — векторы полных и апостериорных вероятностей, соответствующие первому ходу аг стратегии а г, Ь = 1,2. Определим первый ход ас стратегии ас параметрами

дг = Лд\ + (1 - Л) <й, г Е I, р3г = (лЛд[р3}г + (1 - Л)д2р2}г) М гЕ I, в Е Б. Подставив эти выражения в (4), для любого з Е ■ имеем:

КР (Р,ас, з) = гРФа3'Р (г, з) =

ге1 ее я .г^Ф I (л \\„г/пФ)

-а"

^ дг(. М1Р1 +(1 -Л) ЯгРг) аз,р ^

ге1,зея

= ЛКр(р1,<п,з) + (1 - Л)Кр(р2,02,з).

Осредняя это равенство по произвольному т Е А(■), получим (П.2) при п = 1. Предположим, что утверждение имеет место при любых п ^ N. Поскольку для каждого г Е I

г Лд\ г (1 - Л) <й г

Р =— Р\ + ~-Рг,

1 дг 11 дг 121

для а\, аг2 найдется такая стратегия первого игрока агс в игре

G^r(рг), что для любой стратегии тг

KßN(рг, к, тг) = A^KßN(р\, а\,тг) + V-ШKßN(PI, äl, тг).

В результате для ас = (ас, агс) € £ и любой стратегии т (т, тг) € Т' в игре С^+1 (р) справедливо равенство

kN+\(Р , а с, f) = Kß (р, а с, T) + J2 4iKßN (f, К, тг) =

ге1

= \Kß(р\,а\, г) + (1 - \)Kß(р2, ai, т)+

+ ( (Р\ ,аг1,тг)+(-1—^ Kß (pl,alX)) = ге1 ^ '

= AKN+l(P l,al, f) + (1 - A)KN +1(í>2,a2, T). Утверждение доказано. Из него следует

Lß(p,äc) = ini Kß (p,äc, j) ^ A minKß (p,äi, j) +

r€T' r€T'

+ (1 - A) min Kßß(p, äi, j) = ALßn(pi,äi) + (1 - A)Lß(p2, ä2).

Доказательство. [Лемма 3] Пусть подпоследовательность {ljn} сходится. Тогда для любого е > 0 существует М такое, что для любых f,g ^ М выполнено ||ljf — ljg || ^ е. Положим N равное jM.

Для любых m ^ п ^ N можно найти q такое, что jq ^ т. В силу покомпонентной монотонности последовательности {lß} выполнено неравенство

II 1ш - 1п\\ = Е ^ 2| 13т - 18п \ ^ ^ 2| II - Цм | = || 13д - 13м || < ^ 8=0 8=0

Отсюда последовательность {1п} фундаментальна и в силу полноты пространства Ь ({з2}) сходится. 22

Доказательство. [Лемма 4] Проведем доказательство для х Ев. Рассмотрим последовательность

п х-1

Эп = рхех + £ Еа1'г(р)Рх(1, г).

г=х+1I=0

Тогда для т ^ п справедливо

|| $ т ¿>п|| —

£ [рг(г — х)-

ЕХ-о1 Н

ТХ— рг(х — ^

г=п+1 \ т

Е рг

г=п+1

+ ргег

г2 + (г — х)-

ЕХ="р №2

ЛХ-1 Л

£х=о р'(х — г )

Так как Шр < ж, последовательность вп — фундаментальна. Ее сходимость к р следует из покомпонентного равенства векторов вероятностных распределений:

г — х

— р1, 1 — 0,х — 1,

£ ®1,г (Р)

г=х+1

х— 1 х I

£ а.1,г (р)-- — рг, г — х + 1, ж.

1=0

Отсюда в силу леммы 3 получаем, что ряд в разложении (5) сходится к р по норме.

Доказательство для нецелых значений х проводится аналогично.

Доказательство. [Лемма 5] Можно показать, что

8 — Рк — (1 — р)э — р^+1,

а*'13(ак, Я — Г* — к — Р У ') \к + 3 — з)а1,

^(1 —3 )к + 3з — з + (1 — 3 )а1+1,

< ,

— к, 3 — к + 1, 3 > к + 1.

Отсюда непосредственно следует утверждение леммы.

Доказательство. [Теорема 2] Для р € Р(I, г) стратегия а* определяется аналогично работе [5] с заменой 0 и т на I и г соответственно. Из леммы 4 нетрудно вывести, что

Ь\(а*) = 0, Ьк+ (а*)=3 (1 -3). Для к = I + 1, г - 1 имеем

Ькоо (а*) = Ьк (а*) + дкЬкс-1+(а*) + дк+1Ь^ (а*) =

= рЬк-1+И (а*) + (1 -Р)Ьк+е (а*).

Аналогично для к = 1,г - 1 получаем

Ьк+13 (а*) = Ьк+ (а*) + дкЬк(а*) + дк+1Ьк+1(а*) =

= 3(1 -3) + (1 - 3)Ько(а*) + 3Ьк+1(а*).

Полученная система (7) является системой с трехдиагональной матрицей и решается методом прогонки (см. [5]).

Литература

1. ДОМАНСКИЙ В.К., КРЕПС В.Л. Теоретико-игровая модель биржевых торгов: стратегические аспекты формирования цен на фондовых рынках // Журнал Новой экономической ассоциации. - 2011. - Вып. 11. - С. 39-62.

2. КРЕПС В.Л. Повторяющиеся игры, моделирующие биржевые торги, и возвратные последовательности // Известия РАН. Теория и системы управления. - 2009. - №4. -С. 109-120.

3. ПОЛОВИНКИН Е.С., БАЛАШОВ М.В. Элементы выпуклого и сильно выпуклого анализам.: ФИЗМАТЛИТ, 2004.

4. ПЬЯНЫХ А.И. Об одной модификации модели биржевых торгов с инсайдером // Математическая теория игр и ее приложения. - 2014. - Т. 6, №4. - С. 68-84.

5. ПЬЯНЫХ А.И. Многошаговая модель биржевых торгов с асимметричной информацией и элементами переговоров // Вестн. Моск. ун-та. Сер.15. Вычисл. матем. и ки-берн. - 2016. - №1. - С. 34-40.

6. САНДОМИРСКАЯ М.С., ДОМАНСКИЙ В.К. Решение одношаговой игры биржевых торгов с неполной информацией // Математическая теория игр и ее приложения. -2012. - Т. 4, №1. - С. 32-54.

7. AUMANN R.J., MASCHLER M.B. Repeated Games with Incomplete Information. - Cambridge, Mass.: The MIT Press, 1995.

8. CHATTERJEE K., SAMUELSON W. Bargaining under Incomplete Information // Operations Research. - 1983. -Vol. 31, No. 5.-P. 835-851.

9. DE MEYER B. On the strategic origin of Brownian motion in finance // International Journal of Game Theory. - 2002. -Vol. 31, No. 2.-P. 285-319.

10. DOMANSKY V. Repeated games with asymmetric information and random price fluctuations at finance markets // International Journal of Game Theory. - 2007. -Vol. 36, No. 2.-P. 241-257.

11. MERTENS J.-F., SORIN S., ZAMIR S. Repeated games. -Cambridge: Cambridge University Press, 2015.

MODIFIED MULTISTAGE BIDDING MODEL WITH A COUNTABLE SET OF STATES

Artem Pyanykh, Lomonosov Moscow State University, Moscow, post-graduate student ([email protected]).

Abstract: A simplified financial market model with two players bidding for one unit of a risky asset for several consecutive stages is considered. First Player (an insider) is informed about the liquidation price of the asset which can take any value in Z+. At the same time Second Player knows only probability distribution p of the price and that First Player is an insider. At each bidding stage the players place integer bids. The higher bid wins and one unit of the asset is transacted to the winning player at the cost equal to a convex combination of the bids with some coefficient ft. After each stage the bids are announced to the players. In this paper we obtain a solution to an infinitely long zero-sum game for distributions p with finite variation. The optimal strategy of the insider player generates a non-symmetric random walk of the asset price which supports the hypothesis that stock price fluctuations have a strategic origin.

Keywords: repeated zero-sum games, asymmetric information, insider trading.

Статья представлена к публикации членом редакционной коллегии Л. А. Петросяном.

Поступила в редакцию 26.04.2016. Дата опубликования 30.11.2016.

i Надоели баннеры? Вы всегда можете отключить рекламу.