Сер. 10. 2012. Вып. 1
ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА
УДК 519.833
В. В. Мазалов, А. Ю. Кондратьев
ЗАДАЧА О СДЕЛКАХ С НЕПОЛНОЙ ИНФОРМАЦИЕЙ*)
1. Введение. Рассмотрим игру двух лиц с неполной информацией, которая относится к модели двойного закрытого аукциона [1-6]. Игроки здесь продавец и покупатель. Каждый из них обладает приватной информацией о своей резервной цене, которую не знает другой игрок. Резервная цена - это цена, ниже которой продавец не согласен продавать свой товар, либо максимальная цена, которую готов заплатить покупатель. Для продавца это могут быть затраты на производство товара s, а для покупателя - его оценка данного товара b. В работе [1] было найдено равновесие в игре для случая, когда резервные цены и продавцов, и покупателей равномерно распределены на рынке. Было показано, что оптимальные стратегии, формирующие равновесие по Нэшу, существуют и имеют линейный вид, соответственно 2/3s +1/4 для продавца и 2/3b + 1/12 для покупателя. Такая модель проведения сделок является оптимальной в смысле суммарного дохода обоих участников [2]. В [5] приводится обзор других возможных механизмов проведения сделок. В работе [6] оптимальные стратегии построены для линейных распределений резервных цен.
В настоящей работе построим равновесие по Нэшу для случая произвольных распределений для резервных цен. Предположим, что при случайной встрече резервные цены продавцов s и покупателей b есть независимые случайные величины на интервале [0,1] с функциями распределения F (s) и G(b) соответственно (плотностями f (s) и g(b), если они существуют).
Игроки появляются на рынке и обьявляют цену на товар (не обязательно совпадающую с резервными ценами). Будем считать их функциями от резервных цен, соответственно S = S (s) и B = B(b). Сделка происходит, если B ^ S. Естественно полагать, что S (s) ^ s и B(b) ^ b, т. е. продавец завышает, а покупатель занижает истинную цену на продукт, чтобы получить дополнительный доход от сделки. Если сделка состоялась, то примем, что она происходит по цене (S(s) + B(b))/2.
Выигрышами в игре является разница между резервными ценами и ценой сделки, т. е. для продавца это (S(s)+B(b))/2 — s, для покупателя - b-(S(s)+B(b))/2. Поскольку b и s случайные величины, то в качестве выигрышей рассмотрим средние значения
Мазалов Владимир Викторович — профессор Института прикладных математических исследований Карельского научного центра РАН. Количество опубликованных работ: 95. Научные направления: теория игр, стохастическое динамическое программирование, математическая биология. E-mail: [email protected].
Кондротпьев Алексей Юрьевич — студент-магистрант Петрозаводского государственного университета. Научное направление: теория игр. E-mail: [email protected].
*) Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проект № 10-01-00089-а) и Отделения математических наук РАН.
© В. В. Мазалов, А. Ю. Кондратьев, 2012
и
Нь(В, S) = EbiS ^b--——^ I{B(b)^s(s)}- (2)
Стратегиями в данной байесовской игре являются функции S(s) и B(b). Логично предположить, что это неубывающие функции, поскольку чем больше затраты у продавца или оценка стоимости предмета у покупателя, то и предложения игроков должны быть больше. Ниже подробно рассмотрим некоторые частные примеры игр и увидим, что могут существовать байесовские равновесия, где функции S (s) и B(b) имеют пороговый или нелинейный вид. Но прежде всего нас будут интересовать решения, в которых функции S (s) и B(b) непрерывны и имеют ненулевые конечные производные справа и слева в каждой точке интервала [0,1]. Если таких решений несколько, то можно предложить то из них, которое максимизирует суммарный выигрыш (1) и (2) продавцов и покупателей.
Определение. Стратегии S (s) и B(b) определяют байесовское равновесие, если для любого продавца с резервной ценой s G [0,1] его личный выигрыш как функция предлагаемой цены S
Hs (S) = Eb + _ ^ 1{в{ь)>3} (3)
достигает наибольшего значения при S = S (s). Аналогично для любого покупателя с резервной ценой b G [0,1] его выигрыш
Нь (В) = Е,(ъ- + I{B>s{a)} (4)
достигает наибольшего значения при B = B(b).
2. Уравнения, определяющие равновесие в задаче о сделках. Предположим, что резервные цены продавцов и покупателей s и b распределены на интервале [0,1] с непрерывными плотностями распределения соответственно f (s), s G [0,1], и g(b), b G [0,1].
Определим оптимальные стратегии игроков. Будем считать их функциями от резервных цен, соответственно S = S(s) и B = B(b). Логично предположить, что это монотонно возрастающие функции. Тогда существуют обратные функции U = B-1 и V = S-1, т. е. соответственно s = V (S) и b = U (B).
Для нахождения равновесия воспользуемся следующими соображениями. Сделка происходит, если B ^ S. Если сделка состоялась, будем считать, что она происходит по цене (S(s) + B(b))/2. Функции выигрыша игроков имеют вид (3) и (4), где математическое ожидание берется по соответствующим распределениям. Для его нахождения зафиксируем стратегию покупателя B(b) и установим наилучший ответ продавца для различных значений параметра s.
Условие B(b) ^ S эквивалентно b ^ U (S). Выигрыш продавца равен
чт п г fS + B(b) \ Hs(B,S) = Еь I ----s J I{B(b)^s} =
1
fS + B(b) \ f (B(b) + S \
4-2--sJI{b>u(s)}= / ( -2--s\g(b)db. (5)
U (S)
Дифференцируя (5) по установим наилучший ответ покупателя из условия
откуда получаем дифференциальное уравнение для определения оптимальных стратегий (точнее обратных фунций) и(Б),У(Б)
ишя - ПЙОЫ^)) = (6)
Аналогично, пусть 5(в) - стратегия продавца. Найдем наилучший ответ покупателя для различных значений параметра Ь. Его выигрыш
НЬ(В, Я) = Еа(ъ- + 1{в>3(а)}
У(Б)
= ЕВ[Ъ---- )1{^у(в)}= I (Ь--^-)f<ys)ds■ (7)
о
Дифференцируя (7) по Б, имеем наилучший ответ покупателя
дН 1
-д£ = (Ь- В)/(У(В))У(В) - -Р(У(В)) = о,
откуда выводим второе дифференциальное уравнение для определения оптимальных стратегий и(Б),У(5)
У(В)(и(В) - В)!{У{В)) = У(В)). (8)
Делая в (6), (8) замену и(х) = 0(и(х)),у(х) = 1 — Б(V(х)), приходим к системе уравнений
и'{х) (х - Р~1( 1 - «(ж))) = 1 , (9)
у'(х) (х - С-1{и{х))) = 1 . (10)
3. Построение равновесия и границ сделки. В силу предположения V(5) -возрастающая функция, поэтому функция у(х) убывает, т. е. у'(х) < 0, х € [0,1]. Тогда из (10) следует, что и(х) расположена над кривой О(х). График функции у(х) лежит над кривой 1 — Б(х) и и'(х) > 0. На рис. 1 изображены графики функций и(х) и у(х), где х1 и х2 - точки, где значения функций равны 1.
В точке х1 у(х1) = 1. Тогда из (10) следует, что и(х1) = 0(х1). Аналогично из (9) вытекает у(х2) = 1 — Б(х2). Для производных и(х) и у(х) в точках х1 и х2 из (9), (10) находим
1 -и(х 1) 1 ~ С(Х1)
и
г, с
Остается неопределенность в значениях х\ ,Х2, это границы, в которых ищется решение системы уравнений (9), (10). Найдем их из следующих соображений.
Рассмотрим функцию и(х) в окрестности точки Х2. В самой точке Х2 и(х2) = 1. В уравнении (9) для и'(х) в точке Х2 неопределенность вида 0/0. Предположим, что и'(х2) существует и конечна. Тогда по правилу Лопиталя получаем
, 1 - и(х) -и'(х2)
и (X2) = ПП1 —
Х^х2-0 2(Х- Р-Ч1-У(х))) о (л -У'(х2) \
-и'(х2) -и'(х2)
• (13)
о (л I__у'(х2) 9 Л ,
/ + Р,(Р-1(Р(Х2))) ) * ^ + Д^) )
Из (13) следует выполнение в точке х2 соотношения (при д(1) = 0)
3
Вместе с (12) это приводит к соотношению
^(х2) = 3/(х2)(1 - х2)• (14)
Теперь рассмотрим функцию у(х) в окрестности точки х\. В точке х\ ) = 1. В уравнении (10) для у'(х) в точке х\ неопределенность вида 0/0. Предположим, что V1 (хх) существует и конечна. Тогда по правилу Лопиталя получаем
у'(хл)
Иш
1 - v(x)
-^(х{)
1+о 2 (х - С-^и(х))) 2 Л _ иЧх.) \
V °'(а 1(и(х1))))
(«0*1))), х1)
2 1-
и'{х1)
21
и'{х1)
ЗО1) .
х—УХ
Из (15) следует выполнение в точке х\ соотношения (при ](0) = 0)
3
и'(х 1) =
Вместе с (11) это приводит к соотношению
1 — 0(х1) = 3д(х1)х1. (16)
Лемма. На интервале [0,1] существует решение уравнений (14), (16).
Доказательство. Для доказательства существования решения, например, уравнения (14) заметим, что при Х2 =0 левая часть уравнения (14) не превосходит правой части, а при Х2 = 1 наоборот, правая часть не превосходит левой. Кроме того, функции Б(х),/(х) предполагаются непрерывными. Аналогично проводятся рассуждения для уравнения (16).
Уравнения (14), (16) определяют границы хх,х2. Однако при этом должно выполняться хх ^ х2. Перейдем от построенных решений п(х),у(х) на интервале [хх,х2] к функциям и(х),У(х) и наконец к оптимальным стратегиям. На рис. 2 приведен вид оптимальных стратегий В(Ь) и Б (в).
Видно, что хх,х2 представляют собой маргинальные значения для сделки, ниже значения х\ продавец не опускает цену, а выше значения х2 покупатель не покупает товар.
Итак, доказано следующее утверждение.
Теорема 1. Пусть хх,х2 - решения уравнений (14), (16), причем хх ^ х2. Тогда оптимальные стратегии в задаче о сделках с распределением Б (в), О(Ь) резервных цен имеют вид
Б = У-1 (в), В = и-1(Ь),
где функции и = С(и (х)), V = 1 — Б (У (х)) определяются системой дифференциальных уравнений (9), (10). При этом сама сделка совершается в границах цен [хх,х2].
На рис. 3 представлена область сделки с криволинейной границей в данном случае.
В, Б
4. Сделки с фиксированными ценами. Предположим, что продавец использует стратегию порогового типа
^ (в) =
а, если в ^ а, в, если а < в < 1,
т. е. для малых значений резервных цен продавец устанавливает фиксированную цену а, и только если в превышает значение а, он называет истинную цену в.
Установим наилучший ответ покупателя для различных значений параметра Ь. Заметим, что сделка происходит, только если резервная цена покупателя Ь не меньше а. Если же Ь ^ а, то сделка может осуществляться при условии, что В ^ ^(в). Найдем выигрыш покупателя
ИЬ(В,Б) = Еа[ Ь —
2
{Б^З(з)}
/ (ь - Я»)*+ /(»)*•
Производная этой функции имеет вид
дНъ-(Ь В)« В) р{в) — -(Ь-ВЩВ)-—.
(17)
Отсюда следует, что если на интервале В € [а, 1] выражение (1 — В)/(В) — неположительно, то и производная (17) будет неположительна, и тогда максимум выигрыша будет достигаться при В(Ь) = а,Ь € [а, 1].
Аналогичные рассуждения можно провести и для покупателя. Предположим, что покупатель использует стратегию В(Ь) = шт{а, Ь}, т. е. для больших Ь он устанавливает фиксированную цену а, а для малых значений Ь ^ а называет истинную цену.
Выигрыш продавца равен
Н3(В,Б) — Еь ( —+ ^ ^ - в ) 1{в(ь)^з)}
Ъ + Б 2
1
Находим производную
дН3 1-ОД _ = (8-<7М<7) + —-.
Отсюда, если для всех х € [0, а] имеет место неравенство
(18)
, ч 1 - С(х) -хд{х) +-^ > 0,
то и производная (18) будет неотрицательна.
Теорема 2. Пусть для некоторого а € [0,1] выполняются следующие условия:
2хд(х) ^ 1 — О(х), х € [0, а],
(19)
а
а
2(1 - х)/(х) < ^(х), х € [а, 1]. (20)
Тогда оптимальными стратегиями в задаче о сделках являются стратегии
51 (в) = шах{а, в}, В(Ь) = шт{а, Ь}.
При этом область сделки имеет вид, изображенный на рис. 4. Таким образом, при выполнении условий теоремы сделка всегда происходит по фиксированной цене а.
Замечание 1. Отметим, что если неравенство (19) выполняется на интервале [0, ах] и неравенство (20) на интервале [а2,1] и при этом ах ^ а2, то условия теоремы 2 будут выполнены для любого а € [а2, ах], т. е. существует множество равновесий.
5. Сравнение оптимальных стратегий. Покажем, что множество стратегий, найденных в теоремах 1 и 2, является достаточным для построения равновесия в любых играх. Действительно, если выполняются условия теоремы 2, то в качестве оптимальных стратегий можно использовать пороговые стратегии.
Теперь предположим, что условия теоремы 2 не выполняются. Обозначим через ах и а2 соответственно решения уравнений
2хд(х) = 1 — О(х)
и
2(1 — х)/(х) = ^ (х).
Если условия теоремы 2 не выполняются, то ах < а2. Тогда, если хх - корень уравнения (16), то
1 — О(хх) = 3ххд(хх) ^ 2ххд(хх).
Поскольку неравенство 1 — О(х) ^ 2д(х) имеет место в области х ^ ах, то хх ^ ах.
Аналогично показывается х2 ^ а2. Но в таком случае хх ^ х2 и равновесием являются стратегии, найденные в теореме 1.
Замечание 2. Нетрудно видеть, что условия теоремы 2 выполняются для распределений
^(в) = 1 — (1 — в)п, С(Ь) = Ьп, п > 3,
при a = 1/2. В данном случае равновесие имеет вид
S (s) = max{i,s}, B(b) = min{i, b}. При этом ожидаемые выигрыши составляют величину 1 i
Hb = Hs = i ubn-1db i(1/2 - s)n(1 - s)n-1ds =
l/„o ^ n (2П - 1)(2n(n - 1) + 1)
2(п +1)4™
1 и
2
которые при увеличении п сходятся к 1/2.
В таблице представлены оптимальные стратегии, выигрыши игроков и вероятности сделки для различных распределений резервных цен. В симметричном случае выигрыши игроков совпадают. В четвертом и пятом примерах покупатель находится в более предпочтительном положении, чем продавец, и его выигрыш больше. В третьем и четвертом примерах можно использовать равновесие в двух видах. При этом заметим, что равновесие, найденное в теореме 1, предпочтительнее для обоих игроков, чем в теореме 2.
Оптимальные стратегии и выигрыши игроков
F(s) S(s) B(b) EHS EHb P(B^S)
s fc. 3 4 ¥ + ± 0.070 0.070 0.281
1-(1-Sy b2 Теорема 1 Теорема 1 0.164 0.164 0.587
l-(l-sy b3 Теорема 1 Теорема 1 0.236 0.236 0.775
max{0.5, s} min{0.5, b\ 0.232 0.232 0.766
l-(l-s)4 b2 Теорема 1 Теорема 1 0.202 0.239 0.740
max{0.425, s} min{0.425, b} 0.195 0.238 0.730
l-(l-s)0 b3 max{0.438, s} min{0.438, b} 0.254 0.303 0.865
Литература
1. Chatterjee K., Samuelson W. Bargaining under incomplete information // Operations Research. 1983. Vol. 31, N 5. P. 835-851.
2. Myerson R., Satterthwait M. A. Efficient mechanisms for Bilateral Trading // Journal of Economic Theory. 1983. Vol. 29. P. 265-281.
3. Myerson R. Two-Person Bargaining Problems with Incomplete Information // Econometrica. 1984. Vol. 52. P. 461-487.
4. Klemperer P. The Economic Theory of Auction. Northampton, MA: Edward Elgar Publishing Inc., 2000. 692 p.
5. Зенкевич Н. А. Механизмы заключения сделки на В2В рынках: Сравнительный анализ // Вестн. С.-Петерб. ун-та. Сер. 8: Менеджмент. 2008. Вып. 1. С. 3-30.
6. Мазалов В. В., Токарева Ю. С. Равновесие в задаче о сделках с неравномерным распределением резервных цен // Математическая теория игр и ее приложения. 2011. Т. 3, вып. 2. C. 37-49.
Статья рекомендована к печати проф. Л. А. Петросяном. Статья принята к печати 20 октября 2011 г.