Научная статья на тему 'Стохастическая модель торговли неликвидным товаром'

Стохастическая модель торговли неликвидным товаром Текст научной статьи по специальности «Математика»

CC BY
66
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СТОХАСТИЧЕСКАЯ ОПТИМИЗАЦИЯ / МНОЖИТЕЛИ ЛАГРАНЖА / МАРКОВСКОЕ УПРАВЛЕНИЕ / ОПТИМАЛЬНОЕ ПОТРЕБЛЕНИЕ / РЫНОЧНОЕ РАВНОВЕСИЕ / STOCHASTIC OPTIMIZATION / LAGRANGE MULTIPLIERS / MARKOV CONTROL / OPTIMAL CONSUMPTION / MARKET EQUILIBRIUM

Аннотация научной статьи по математике, автор научной работы — Поспелов Игорь Гермогенович, Жукова Александра Александровна

В работе исследуется поведение потребителя, который стремится оптимальным образом распределить свое благосостояние между безрисковым активом и рискованной покупкой неликвидного товара. Риск связан с невозможностью продажи или покупки товара в произвольный момент времени. Вместо этого товар может торговаться в случайные дискретные моменты времени. Предполагается, что покупатель получает полезность, зависящую от объема имеющегося товара. Представлена и проанализирована стохастическая оптимизационная модель поведения торговца. Проведен анализ оптимального поведения потребителя. Это описание применено к модели рынка с большим числом участников. Показано, что даже в условиях полного предвидения динамика равновесной цены может иметь вид, характерный для «финансовых пузырей».

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Stochastic model of illiquid asset trade

This work studies the behavior of a consumer who seeks to allocate his welfare optimally between risk-free saving and a risky illiquid asset. The risk of the illiquid asset emerges from inability to trade it at an arbitrary moment of time. Instead, the illiquid asset may be traded at random discrete moments of time. It is assumed that the trader receives a certain utility from the amount of the illiquid asset he owns. A stochastic optimization model of the trader behavior is proposed and analyzed. This analysis is applied to modeling a market with multiplicity of traders. It is shown that even under conditions of perfect foresight, the equilibrium price dynamics may have a shape characteristic of a ≪financial bubble≫.

Текст научной работы на тему «Стохастическая модель торговли неликвидным товаром»

УДК 519.857.3

И. Г. Поспелов1'2, А. А. Жукова2'3

1 Московский физико-технический институт (государственный университет) 2Вычислительный центр им. A.A. Дородницына РАН 3НИУ Высшая школа экономики

Стохастическая модель торговли неликвидным товаром

В работе исследуется поведение потребителя, который стремится оптимальным образом распределить свое благосостояние между безрисковым активом и рискованной покупкой неликвидного товара. Риск связан с невозможностью продажи или покупки товара в произвольный момент времени. Вместо этого товар может торговаться в случайные дискретные моменты времени. Предполагается, что покупатель получает полезность, зависящую от объема имеющегося товара. Представлена и проанализирована стохастическая оптимизационная модель поведения торговца. Проведен анализ оптимального поведения потребителя. Это описание применено к модели рынка с большим числом участников. Показано, что даже в условиях полного предвидения динамика равновесной цены может иметь вид, характерный для «финансовых пузырей».

Ключевые слова: стохастическая оптимизация, множители Лагранжа, марковское управление, оптимальное потребление, рыночное равновесие.

1. Введение

Целью данной работы является исследование поведения рацонального агента на рынке неликвидного товара длительного пользования. Товар длительного пользования неликвиден в том смысле, что он может быть продан или куплен не в произвольный момент времени, а только в некоторые, возможно, случайные, моменты времени. Другой причиной неликвидности могут быть транзакционные издержки, связанные с покупкой или продажей товара. Этот случай был рассмотрен в известной статье (1). В ней рациональный агент принимает решения о том, каким образом перераспределять свое благосостояние между вложением в безрисковые или рискованные активы и покупкой товара длительного пользования, а также моментом совершения этой покупки. Момент покупки может быть выбран произвольным образом. Однако в присутствии транзакционных издержек при торговле товаром длительного пользования агент ждет наиболее выгодного момента для торговли. Авторы (1) отмечают, что для лучшего соответствия реальности модель должна учесть такую осбенность торговли товарами длительного пользования, как случайность возможных моментов сделок.

В данной работе мы концентрируемся на неликвидности, связанной с моментами сделок, и пока исключаем транзакционные издержки из рассмотрения. Мы немного отходим от привычных для портфельной теории рамок моделей САРМ или ССАРМ, учитывающих возможность вкладывать средства в рискованные активы. В представленной здесь модели отсутствует риск непредвиденного изменения цен на какие-либо товары и активы. Траектории всех цен здесь известны заранее. Однако для каждого отдельного агента на рынке присутствует риск, что сделка в нужный момент будет невозможна и придется ждать подходящего предложения. Мы предполагаем, что моменты возможных сделок имеют пуассоновское распределение, как если бы каждый агент ожидал встречи с контрагентом для совершения сделки купли или продажи.

Основная часть работы посвящена решению задачи одного агента, где строго выводятся достаточные условия оптимальности и доказывается их выполнимость для данной задачи. В конце работы кратко рассматривается результат исследования рановесия на рынке недвижимости. Показано, что динамика цены может иметь форму «пузыря», несмотря на то, что в рамках модели все агенты этот пузырь предвидят совершенно точно и по срокам, и по размерам.

1. Модель поведения потребителя

1.1. Динамика недвижимости и сбережений

Рассмотрим потребителя, который получает доход в виде процента по сбережениям и от продажи недвижимости, а расходует его на покупку новой недвижимости и обслуживание имеющейся. Особенность описания рынка недвижимости в модели состоит в предположении о его неполной ликвидности. Агент не всегда может сразу продать то, что он имеет, или найти подходящую покупку. Ему приходится ждать момента, когда он может осуществить сделку (см. также (3)). Других особенностей рынка ликвидности - разнокачественность и ограниченная неделимость, большие транзакционные издержки и т. п. - мы здесь не учитываем.

Пусть М(¿) - величина покупки (при М > 0) или продажи (при М ^ 0) недвижимости, если сделка происходит в момент В этот момент объем недвижимости агента N(Ь) скачком меняется на величину М (¿), а сбережения 5 (Ь) опять-таки скачком изменяются на величину -р(£)М(Ь). Здесь р(Ь) - текущая цена недвижимости. Функция р(Ь) предполагается неслучайной (см. последний раздел), настолько гладкой, насколько потребуется, отделенной от 0 и не слишком быстро растущей при £ ^ те:

<1, 1> 0. (2.1)

Согласно принципу рациональных ожиданий считается, что агент знает правильный прогноз этой цены на все будущее время. Остальные цены, которые появятся в модели, считаются постоянными.

В промежутках между сделками недвижимость не изменяется, а сбережения растут за счет непрерывного начисления процента по фиксированной ставке р. Кроме того, считаем, содержание недвижимости требует непрерывных расходов1 дЫ (Ь).

В рамках модели агент выбирает только величину М(¿) - величину покупки/продажи, если £ - возможный момент сделки. Если учесть, что время ожидания следующей сделки не зависит от Б(Ь) и N(¿) и того, сколько эту сделку уже ждали, то можно считать, что моменты сделок образуют пуассоновский поток ^(Ь) с частотой Л. Этот процесс имеет кусочно-постоянные реализации, которые мы будем считать непрерывными слева. Ассоциированный с процессом ц(-) поток сигма-алгебр обозначаем через {£г}г>о , а естественную меру (в соответствии с (2)) на }г>о _ через Н. Все встречающиеся ниже ожидания являются интегралами именно по этой мере.

Назовем неупреждающим управлением М(I) € К1 процесс, измеримый относительно {£г}г^0 с непрерывными слева реализациями, ограниченными на каждом конечном интервале:

м($ = м(г - 0), м($ = е {м(г) \щ [г, те)}. (2.2)

Теперь динамику состояния агента 5 (Ь), N (Ь) можно описать стохастическими дифференциальными уравнениями

^(г) = М(г) йф), (2.3)

йв(г) = рв(г) <и - дИ(г) <и - р(г) м (г) йф), (2.4)

£ € [0, те), 5(0) = 5о, N(0) = N0. (2.5)

В качестве решений (2.3) — (2.4) мы снова рассматриваем непрерывные слева случайные функции N(Ь) и 3(Ь). Тогда можно считать, что

й-ч {Ь) = <и ^ 5(г - Тк). (2.6)

Г к >0

где 5(-) — функция Дирака, а — случайные моменты пуассоновского потока г/, и искать

1 Можно считать, что это все текущие потребительские расходы, а реальное текущее потребление дополнительно к размеру недвижимости.

Р^) > Рш > 0,

р' (У р®

и для каждой реализации {¿^} как обычные решения дифференциальных уравнений с импульсными воздействиями, а на разрывах доопределять их пределами слева. Из такого построения очевидно следует, что 5(¿), N(¿) будут неупреждающими процессами, подобно (2.2):

N (г) = N (г - 0), N (г) = е {ы (¿) [г, ж)}, в (¿) = - 0), 5 (¿) = е {5 (¿) [г, ж)}. (2.7)

1.2. Значения в точках разрыва как выражения условий информированности

Процесс, описываемый уравнениями (2.3) — (2.5) можно реализовать и непрерывными

справа функциями. Все зависит от того, как определить значения на разрыве для исходного «генератора случайности» — кусочно-постоянной функции ц (¿). Содержательно эти процессы отвечают разным условиям информированности агента. Процесс, непрерывный слева, который мы и будем изучать, соответствует ситуации, когда агент выставляет объявлении о продаже или покупке недвижимости (возможно, меняя условия каждый день), но когда появляется контрагент, сделка заключается согласно объявлению. Так происходят, например, сделки на бирже, работающей по правилу двойного аукциона. В случае процесса, непрерывного справа, объявление играет роль рекламы, а определение объема сделки происходит по факту появления контрагента.

Более наглядно эта разница проявляется при традиционном подходе к решению задачи стохастического оптимального управления методом динамического программирования. Процессу, непрерывному справа, соответствует уравнение Беллмана с усреднением максимального значения, а процессу, непрерывному слева, — уравнение с максимизацией условного среднего. Собственно и приводимые ниже результаты исследования модели были первоначально получены из уравнения Беллмана. Однако если доказать существование единственного непрерывного решения уравнения Беллмана для рассматриваемой задачи сравнительно несложно, то обосновать корректность его асимптотического разложения при большой частоте сделок, как всегда, очень затруднительно. Поэтому мы избрали здесь несколько необычный подход на основе достаточных условий оптимальности.

Процесс, непрерывный справа (с торгом по факту сделки), содержательно может показаться более реалистичным, и такой подход широко распространен в моделировании скачкообразных процессов (4), (5). Однако при увеличении частоты продаж такое описание приводит к тривиальной и нереалистичной динамике детерминированной задачи. В то же время процесс, непрерывный слева, имеет при увеличении частоты продаж нетривиальный предел, который мы и предлагаем рассматривать как модель рынка недвижимости (см. последний раздел).

1.3. Условие кредитоспособности и переменная богатства

На выбор неупреждающего управления М (¿) наложим еще два естественных ограничения. Первое состоит в том, чтобы недвижимость оставалась неотрицательной, причем, очевидно, достаточно требовать этого только в начале процесса и после каждой сделки:

где т — начало процесса или момент сделки.

Второе связано с ограничением на 5(¿). Пока мы не предполагали, что 5(¿) ^ 0. Отрицательные сбережения можно трактовать как кредит, взятый под тот же процент р, и допускать возможность, что этот кредит будет возвращен в результате продажи недвижимости2. Мы, однако, предположим, что агент ведет себя достаточно осторожно, чтобы не допустить неограниченного роста задолженности. Предположим, что задан сколь угодно большой, но конечный, лимит кредитования: Ь > 0.

N(т + 0) ^ 0,

(2.8)

11с следует смешивать это с ипотекой, при которой кредит может быть погашен самой недвижимостью, а не выручкой от ее продажи.

Утверждение 1. Если иеуиреждающее управление М(■) обеспечивает неотрицательность недвижимости (2.8), то превышение лимита кредитования, т.е. событие

5 (г) < —Ь, (2.9)

при некотором £ ^ 0 имеет нулевую вероятность тогда и только тогда, когда

рв (т + 0) ^ дЫ (т + 0), (2.10)

где т — начало процесса или момент сделки.

Доказательство. В силу (2.4) с момента т последней сделки или начала процесса и до следующей сделки сбережения меняются по закону

5 {1) = ^ (т + 0) + (рв(г + 0) - дМ(т + 0)) ер). р

Если рв(т + 0) — дМ(т + 0) < 0, то в силу (2.11) в (Ь) ^ —го при £ ^ те. Но время

-

жительной вероятностью оно может стать достаточно большим, чтобы выполнилось (2.9). Напротив, если рв(т + 0) — дЫ(т + 0) ^ 0, то в силу (2.11) вплоть до следующей сделки

р 5 (¿) — д N (г) = рв (г) — дЫ (г) = (рв (т) —дМ (т)) еР т) ^ 0, (2.12)

р

откуда в силу (2.8) следует, что событие (2.9) между сделками не выполняется с вероятностью 1. ■

Ясно, что в отличие от сбережений величина богатства потребителя

w (г)=р(г)м (г) + з(г) (2.13)

не изменяется в результате сделки, поэтому ее удобно использовать в качестве фазовой переменной вместо в(£). Выразив сбережения в(Ь) через W(Ь) и подставив в (2.4), получим уравнение динамики богатства:

<ш(г) = {рw(г) — рв(г) N(г) + ¿(^ы(г))(И, з(г) = р(г) + ^ > 0, (2.14)

которое представляет собой обыкновенное дифференциальное уравнение при каждой реализации скачкообразного случайного процесса (2.3).

Утверждение 2. При выполнении условий кредитоспособности

0 < W(г) < W(0) е(р+1) \ 0 < N(^ < W(0) е(р+1) Урт . (2.15)

Доказательство. Из условия N (Ь) ^ 0 и (2.10) следует, что в (Ь) ^ 0, а тогда из (2.13) следует, что

w(г) ^ р(г)ы(г). (2.16)

Поэтому из (2.14), (2.1)

^рw ® + Р® N (I) < (í + P)W (I). (2.17)

Из (2.17) получается первое неравенство в (2.15), а из него и (2.16), (2.1) следует второе.

Условие кредитоспособности (2.10) в новых перменных (2.13), (2.14) дает вместе с (2.8) требование на начальные условия:

W(0) ^ s(0) N(0) ^ 0 (2.18)

и

W(t) ^ N(t) + М(t) ^ 0. (2.19)

s(t)

Хотя выполнения этого неравенства достаточно требовать только в момент сделки, в непрерывном слева пуассоновском процессе событие сделки относится к будущему (^(¿+0)), поэтому для неупреждающего управления М(t) мы требуем выполнения (2.19) во все моменты. Заметим, что из (2.19), (2.17) вытекает ограниченность М(t) на каждом конечном интервале и экспоненциальная оценка для его роста при t ^ ж аналогичная (2.15). I

При задании неупреждающего управления М(■) уравнения (2.3) — (2.5) задают меру на выпуклом множестве LC пар кусочно-непрерывных и непрерывных слева, ограниченных на каждом конечном интервале функций W, S : [0, ж) ^ R1 с фиксированными начальными значениями, сосредоточенную на решениях (2.3) — (2.5).

1-4- Задача потребителя

Итак, формально для потребителя вопрос сводится к выбору трех неупреждающих процессов М(t),N(t),W(t), удовлетовряющих условиям (2.3), (2.14), (2.19), реализации которых принадлежат подпространству

LC 4 J f (t) = f (t - 0), sup If (t) *} < ж 1 (2.20)

[ ie[o,^) L J J

пространства кусочно-непрерывных функций f : [0, ж) ^ R1. При этом начальные условия N(0),^(0) фиксированы и удовлетворяют (2.18).

Считаем, что интересы потребителя заключаются в максимизации ожидаемой полезности от обладания недвижимостью E {f^ U (N (т)) е-йтdr} . Мы рассматриваем случай полезности с постоянным относительным отвращением к риску (CRRA), в частности, логарифмической пол63ности. Еб выр^жбниб им66т ^^д.

Nа - 1

и(ы) = ——, а е (0,1). (2.21)

Такая функция полезности часто встречается в анализе финансовых рынков и формирования оптимального портфеля (см. классические работы Каратцаса (6) и Мертона (7)). Из (2.15) следует, что при 5 > а (р + С) функционал

U

и [М() = Е \\ и (Ж (т)) е-&т(1т| (2.22)

определен для любого неотрицательного N(■) е ЬС, (2.20). 2. Достаточные условия оптимальности

2.1. Определение функционала Лагранжа и свойства входящих в него интегралов Анализ задачи, сформулированной в предыдущем разделе, проведен по аналогии с методом, предложенным в (8) для случая винеровского процесса. В данной работе случайная составляющая имеет скачкообразный характер и анализ несколько отличается. Кроме того он проводится более строго, чем в (8) и (II)3. Мы опираемся на общее соображение о том, что для нахождения оптимального решения при ограничениях достаточно найти седловую точку функционала Лагранжа без ограничений.

оо

3Там аналогичные условия голословно объявлены необходимыми.

Обозначим через 1(Ь), й)(Ь) знаконеопределенные множители Лагранжа к ограничениям-равенствам (2.3), (2.14), а через ¡1(1) ^ 0 — неотрицательный множитель Лагранжа к левому ограничению-неравенству в (2.19). Функционал Лагранжа для задачи потребителя тогда формально имеет вид

[ N(•),№(•),м(•)] =

( /0°° и (К(I)) е-НМ + /0°° 1(1) (М(1)йг,(I) - (Ш(I)) + ) = е I + й^) ((рш (г) - (^(г) + ¿(г) N (г)) м - йш (г)) + \. (3.1) i + г № р (Ш (г) - 8(1) (м (г) + N (г))) (г)+ )

Мы здесь не «снимаем» множителем Лагранжа правое ограничение в (2.19). Оно должно выполняться автоматически в силу того, что и' (0) = те. Рокафеллар и Ветс в (12) предложили включать в функционал Лагранжа ограничения неупреждения типа второго равенства в (2.2). Мы этого не делаем, поскольку при использовании достаточных условий надо обязательно искать двойственные к этим ограничениям.

Чтобы придать функционалу С строгий смысл, надо определиться с классом, в котором находятся двойственные переменные. Будем искать их как достаточно гладкие функции от {£, N(Ь + 0), Ш(Ь)}. Мотивировкой такого выбора служит, как и в (8), (11), то, что «правильные» множители Лагранжа должны быть частными производными функции Беллмана, а выбор оптимального управления определяется значением функции Беллмана в том состоянии, в которую приводит этот выбор. Поэтому будем считать, что

а(г) = и(г(г + о),ш(г)), й(г)=и(1 (г + о),ш(г)). (3.2)

При таком определении множители Лагранжа как функции времени оказываются непрерывными справа, причем эти функции могут иметь разрывы только в точках скачка процесса г]. Что же касается ¡(Ь), то указанное ниже условие дополняющей нежесткости (3.10) можно трактовать как конечное уравнение, выражающее КЬ) через М (¿), N (Ь), Ш (Ь), поэтому для него естественно ожидать непрерывности слева. В любом случае, все функции в (3.1) считаются однозначными, кусочно-непрерывными и ограниченными. Тогда интегралы по (Ш(¿), йШ(Ь) и йг](Ь) можно понимать в следующем смысле:

гЬ ^ ^ ГТк+1

/ Х(г)йп(г) = ^2Х(тк)А^к + (г)ш, (3.3)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

к=0 к=0

где п, А : [а, Ь] ^ М1 - кусочно-непрерывные функции, которые имеют на отрезке [а, Ь] конечное число разрывов первого рода в точках Тк, к = 1,..., Т, то — а, тт+1 — Ь, причем п(^) дифференцируема между разрывами.

Хотя формула интегрирования по частям для (3.3), вообще говоря, не верна, в том специальном случае, который нам понадобится, она имеет место (9).

Утверждение 3. Если а, Ь не являются точками разрыва п и А, п(^) непрерывна слева п(тк - 0) = п(тк), п(тк + 0) = п(тк) + Апк, а А(-) непрерывна справа А(Тк - 0) = А(Тк) - ААк, А(Тк + 0) = А(Тк), а между разрывами обе функции гладкие, то для (3.3) выполняется соотношение

¡■Ь рЬ

/ А(г) йп(г) = п(Ь) А(Ь) - п(а) А(а) - п($ йА($. (3.4)

а а

Доказательство получается обычным интегрированием по частям в правой части (3.3) и последующим приведением подобных с учетом соотношений непрерывности справа и слева. ■

Для вычисления производных функционала Лагранжа по прямым переменным надо

п, А

чайные функции.

Утверждение 4. Пусть п, Л — измеримые относительно меры Н процессы (неважно, неупреждающпе или нет) с кусочно-непрерывными (неважно, справа или слева) экспоненциально ограниченными реализациями, причем реализации Л могут иметь разрывы только в моменты Тк скачков процесса г?, а в промежутках Л имеет производную Тогда

е|У n(t)dЛ(t)^=J Е^п(г) (*)+ЛЕ {п(г)АЛ($ = тк }| М, (3.5)

где Е {■ = Тк } ожидание при условии, что в момент £ происходит событие пуассоновского потока г]. Оно определено корректно, поскольку Тк — марковский момент (2).

Доказательство. Разобьем интеграл по [ а, ж) в сумму интегралов по малым полуинтервалам длины А. По формуле полного ожидания

( к+1) А—0 I | ( к+1) А—0

Е

к А I I к А

+ Л.)А —0 . . (к+1)А — 0 .

I n(t)dЛ(t)I = Е„[к а,(к+1) А) I I Е {n(t)dЛ(t) |г? [к А, (к + 1) А) }| .

(3.6)

Реализация пуассоновского процесса на интервале ц [к А, (к + 1) А) не зависит от того, что происходит вне интервала [ к А, (к + 1) А), причем с вероятностью 1 — ЛА + о(А) на этом интервале событий не происходит, с вероятностью А А + о(А) происходит одно со-

[ к А, ( к + 1) А) (А)

происходит более одного события. Поэтому из (3.6), (3.3)

Г (к+1) А—0 ^ ( к+1) А

Е / n(t)dЛ(t)\=(1 — ЛА + о(А)) / Е{п® §(I) |Тк / [к А, (к + 1) А)} +

{ к А ) к А

( (к+1) А \

+ (ЛА + о(А))

I Е{п(1) §(I) |Тк е [к А, (к + 1)А)} +

к А

( к+-1) А

+А / Е {п(в)АЛ(в) ^ = Тк }dв к А

+ (А).

Суммируя эти выражения по к и переходя к пределу при А ^ 0, получаем (3.6). I 2.2. Седловая точка функционала, Лагранжа

Утверждение 5. Пусть для некоторых непрерывных справа (не обязательно неупре-ждающих) процессов И(Ь), о!(Ь), ¡1(1) ^ 0, таких что интеграл в (3.1) с учетом определения (3.3) сходится при всех (Ж(-),Ш(-), М(■)) е ЬС хЬСхЬС, найдется тройка неупреждающих процессов (■), (■), М„е ЬС х ЬС х ЬС, удовлетворяющих заданным начальным

условиям на N, ]¥„, которые

а) доставляют максимум функционалу Лагранжа (3.1):

(■), (■), М„(■)) е Агдтах %.)Ж.),д(.)| [Ж(■), Щ(■), М(■)] (3.7)

по множеству неупреждающих процессов ( N (■),W (■),М (■)) с реализациями из ЬС х ЬС х ЬС с заданными начальными условиями N(0), W(0);

dNv (t)=^í(t)dт] (г), (3.8)

(г) = (р (г) — рз(г) N(г) + ¿(г) (^ dt, (3.9)

щЩ(I) > (I) + М„(I), 1(1) > 0, 1(1) р (I) — 8(1) (ы„(I) + N(1)^ = 0. (3.10)

Тогда (•), Ш(•),Мг](•)у — решение задачи, поставленной в разд. 2.4.

Доказательство. Во-первых, заметим, что в силу (3.8) — (3.10) процессы N.(•), (•),М,(•) удовлетворяют всем ограничениям, сформулированным в начале разд. 2.4. Рассмотрим какую-то другую допустимую в этом смысле тройку процессов \¥(),М()^. Она удовлетворяет равенствам, аналогичным (3.8), (3.9), и неравенству, аналогичному первому неравенству в (3.10). Поэтому из (3.1) и второго неравенства в (3.10) следует, что

и

Щ)

^ с

Но тогда в силу (3.7)

С

Наконец, в силу последнего равенства в (3.10) все «добавки» в функционале Лагранжа на требуемой утверждением траектории обнуляются, поэтому

С

N. (•),М (•)

и

М (•)

т.е. Ы

Щ)

М (•)

2.3. Достаточные условия оптимальности в терминах случайных процессов Как обычно, при поиске максимума функционала Лагранжа приходится интегрировать по частям, чтобы исключить дифференциалы фазовых переменных. Возможность выполнить эту операцию на бесконечном интервале накладывает дополнительные требования на рост двойственных переменных, заменяющие обычные условия трансверсальности на конечном интервале.

Утверждение 6. Если с вероятностью 1 процессы 1(Ь), й)(Ь) гладкие между скачками процесса г], ¡(Ь) ^ 0 и при некотором С > 0 и е > 0

№ )| е

( ь+р) *

йй, . и

е(1+р) \ 111(1 )| е(1+р) \

йй , . л ®

е( 1+р) \ Кг) е(1+р)* < Се

-еЬ

(3.11)

где под производными понимаются производные гладких составляющих, то для (3.7) достаточно выполнения с вероятностью 1 следующих соотношений:

Е^>те) {Л (Е {И(1) II = Тк }- т Р8(1))} = 0,

йй

Еф,Х) ((т + т) Р + (¿)) + ле {(й(1) - ну - 0)) II = Тк} = 0,

и' (Мг,(^ е-* + Е^о,^

й(1) (-Р 8(1) + 8>(1) ) - ¡(1) Р8(1) + §(1) +

+ЛЕ {(1(1) - 1(1 - 0)) ^ = Тк }

(3.12)

(3.13)

= 0.

Доказательство. Функционал (3.7) очевидно вогнутый и гладкий по N(•),ШТ(•),М(•), поэтому для (3.7) необходимо и достаточно, чтобы в точке {Nn(•),Шn(•),Мn(•)^| обращались в 0 производные по всем направлениям в ЬС (с учетом начальных условий). При этом мы должны рассматривать свою вариацию при каждой реализации г](), но можем игнорировать возможность совпадения скачка с фиксированной точкой временнй оси (например, с Ь = 0), поскольку такие события имеют вероятность 0.

Начнем с вариации N.(•) и положим N(Ь) = N.(¿) + еп(Ъ, Що,г)):

п(г, •) е ьс, п(г) = е {-ш(г) ^, те)}, п(0) = 0.

(3.15)

Тогда, учитывая, что N(Ь) — неупреждающая,

■ [п\= Е ^

/о 4 4 7 / J 0

[п\= Е | ^ (и' (X (¿)) е-3г + ш(Ь) (—р а{Ъ) + а'{Ъ)) — р(г) р п(Ь) аъ + ^ 1(Ь) dn(t)^ = Е | ^ {и' + ш(г) (—р + в'(г)) — ¡¡(г) Рп^йъ — ^ n(t)dl(t)^ =

= I Е { (и' (^ е-3г + й(Ъ) (—р з(Ь) + з'(Ь)) —

— р(г) Р+ ^(г) + ЛЕ{А1(г) ^ = тк^ dt =

= Г Ег .¡пт(и' (миЛ е-* + Ег <*) + —№)р *$) + ш л

- ]о Е„[ад |п(*) {Ще + Е„[ад | +Ле {{т — 1(1 — 0)) ц = Тк } })}

п( )

выполнения (3.14). Аналогично, только проще, вычисляются вариации по неупреждающим

М„(г) и (г). I

2-4- Двойственные перемнные как функции времени

т)

риваются только оптимальные процессы ]¥„,(■), Мп(^, поэтому индекс г] и «шляп-

ку» в их обозначении опускаем.

N (г + 0) = ж (г) + м (г), (3.16)

поэтому в силу (3.2)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

е {) ^ = тк} = , N (г) + м (г), щ (г)), (3.17)

е {(¡¡(г) — — 0)) ^ = тк} = ш (г, N (г) + м (г), щ (г)) — ш (г, N (г), щ (г)), е {(1(г) — 1(г — 0)) ^ = тк} = и (г, N (г) + м (г), щ (г)) — и (г, N (г), щ (г)). Между скачками согласно (3.8), (3.9)

dW , dN

® = Р Щ (г) — з№ (г) + 8'(г) N (Ц, ^ (V = 0, (3.18)

поэтому из (3.8)

Ц(I) = ^ (I, N(Ц, Щ(I)) + (р Щ(I) — р 8т(Ц + 8>(1) N(Ц) (I, N(Ц, Щ(I)), (3.19)

^(I) = ^ (I, N(Ц, Щ(I)) + (р Щ(I) — р 8т(Ц + 8'(1) N(Ц) , N0), Щ(I)) . (3.20)

Заметим, наконец, что, как уже отмечалось выше, исходя из (3.10) естественно искать ¡¡(Ь) как неупреждающий непрерывный слева процесс:

1(1) = Е {¡1(1) ^ [0,1) } . (3.21)

Правые части всех равенств (3.17) — (3.20) являются неупреждающими процессами, поэтому знак ожидания по будущему Ефв (3.12) — (3.14) можно опустить. Из (3.12), (3.17) тогда получится, что

Ли(1 ^ (Ц + М (1),Щ (1)) р(1) =-^-. (3.22)

3. Двойственные переменные как функции состояния

3.1. Достаточные условия оптимальности в терминах неслучайных функций состояния

Поскольку реализации процесса ^(Ь),Ш(Ь)} блуждают по всему фазовому пространству, выполнения (3.12) — (3.14) при (3.17) — (3.20 естественно требовать не вдоль трактоМ

яния, М(¿) = М(Ь^(Ь),Ш(¿)) и исключая ¡¡(Ь) с помощью (3.22), окончательно получаем из (3.13) - (3.14):

^ (г, N, ш) + (рШ -Р зт + 8'(г) N) (I, N ш) +

(4.1)

+ (Л "( , Ш) (^, N, Ш) ^ Р + Л(ш + М,Ш)-й (1,^Ш)) = 0,

% (г, N, ш) + (рШ - Р8(1) N + 8'(г) N) (г, N ш)) + ш(г, N ш) (-р 8(г) + 8'(г)) + +и' (ы) е-ь - Л и (г, N, ш ) = 0,

(4.2)

а из (3.10), (3.22)

ш ^ 8(г(), и (г ^ + м,ш ) ^ 0, и (г ^ + м,ш ) (ш - з(г)(м + N )) = 0. (4.3)

Если мы найдем функции ), ) и М(Ь), удовлетворяющие (4.1)

— (4.3), и такие, что вдоль реализаций процесса

йн (г) = м (г, N (г), ш (г)) йф), йш (г) = (р ш (г) - р з(г) N (г) + ¿(г) N (г)) м

с вероятностью 1 выполняются оценки (3.11), то закон управления М(Ь^, Ш) будет оптимальным с точки зрения максимизации функционала (2.22).

3.2. Выражения для двойственных переменных через функцию Кротова в случае однородной полезности

Условия дополняющей нежесткости и кредитоспособности (4.3) выделяют две области, которые можно условно назвать областью инвестиций в сбережения и областью инвестиций в недвижимость. В первой из них доля недвижимости N + М в общем благосостоянии ш

в (4.3) — выполнялось как строгое. Во второй покупка недвижимости N + М такова, что ограничение кредитоспособности — первое неравенство в (4.3) — выполняется как равенство. Иными словами, в последнем случае доля сбережений минимально возможная, и все свободные средства уходят на покупку недвижимости.

Двойственные переменные естественно искать как частные производные некой функции

V (Ь) (функции Кротова) (10):

и(1 ,И,Ш) = ^ (I,М,Ш), й (г) = (I,И,Ш). (4.4)

После подстановки (4.4) в (4.1), (4.2) и интегрирования функция трех переменных

V (Ь, N, Ш) выражается через новые неизвестные функции двух переменных Р (Ь, Ш) и Р1 ^, Ш) в виде

V (г, N Ш) = и((Л+6)Н + емЛ е-ЛгР (г, N (з (т) - е-Р(т)з ($) +

(4.5)

+е-р(1-т)Ш) йт + еЛ1Р1 {И, (Ш - в (^ N) е-р*) .

Частные производные V (Ь) должны падать со временем (см. (4.4), (3.11)). Ограниченное по времени решение уравнения V (Ь, N, Щ) представлено первыми двумя слагаемыми в (4.5), поэтому положим Р1 = 0. Что же касается оставшейся неизвестной функции Р(Ь, Щ), исходя из вида функции полезности (2.21), будем искать ее в виде

Р (г )=и(г)а~ 18 (г)—аЩае~р *, М (г )+N = г($=8(1)е ~р К (4.6)

( )

( )

(4.6) следует, что

г(т) = г(г) еа % , ((г) ^р — ь. (4.7) В предположении (4.6) соотношения (4.1) — (4.3) принимают вид

—^п,1+\а— 1 г<х>

е~му(1)

(Л + )

/те

е-Лг ((1 — у (¿)) г(1 )+г (т) у (т))а-1 ^ (т)1—аи (т) 1т = и(1), (4.8)

Л ем [е-Лг ((1 — У (г)УМГ1 (^ _2(т))и (т)1т — Г^+Г!) х

>0

х = 0.

>0

(4.9)

4. Существование быстро убывающих двойственных переменных

и( )

( ) и( )

соотношения можно свести к одному уравнению, если рассмотреть функцию

Н ^^ Уа&~&* + Г и (т)Л((1 — у)г(1) + г(т)у)ае ~Л(-—* 1

Н<),У) = (ЛГбТа +1 -Офуа-(т. (5-1)

Утверждение 7. Если измеримая и(Ь) > 0 ограничена, то при достаточно большом Л функция Ни(.) (Ь, у) строго вогнута и дифференцируема по у, при у е [0,1\ :

дНи(-) (, ,) = уа~ 1е-" + (г (т) — г (Ц) и (т)Ла ((1 — у)г(1)+г (т) у)а~1 л(т—^ ду ^ У)= Л + 6 +]% г(т)а 6 ^

причем

дНи()

—^ (г, 0) = +ж. (5.3)

д

Л

(5.2) сходится, откуда по теореме Лебега следуют дифференцируемость Ни(.) (Ь, у) по у и ограниченность производной.

При и(Ь) > 0 интеграл в (5.1) представляет собой положительную комбинацию строго

вогнутых функций ((1 — у) г(€) + х (т) у)а от у. Поэтому Н(Ь, у) строго вогнута. Поскольку

,

производные (((1 у)х((У+х(т)у)

у=0

счет внеинтегрального члена в (5.2) (см. (2.21)).

Из строгой вогнутости (t, у), уравнения (4.9), выражения (5.2) и равенства (5.3) следует, что условие дополнительности (4.9) можно записать в виде

f^1 (t ,У (t))) х (1 - y(t))=0 у (t) = arg max (Ни{.) (t, у)) . (5.4)

V °У / 4-*-' ye [0,1]

4-„-' >0

>0

„ с те -и(т )Л ((1 -y)z(t)+z(r )y)ae-A (,

Ьсли теперь выразить интегралы Jt —^—-— ¿(т)а -ит и

г те / \ и(т )Ла ((1-y)z(t)+z(r )y)a-1 —Л (т—t) j ir in ir on

Jt —-—z(T)a—— e Л(1 чат из (5.1), (5.2) и подставить выражение вто-

рого из них в (4.8), то получится уравнение

дН

и (t) = аН (t, y(t)) + (1 - y(t)) — (t, y(t)) ,

которое в силу (5.4) приобретает вид

и (t) = а max Ни(.) (t, у). (5.5)

ye[0,i]

4-2. Существование u(t) > 0

и( )

точкой оператора:

Н K)1 (t) = max { ^ + f " и ^ - VW+.' ) Л , (,6>

ye [0,1] [(А + д) Jt z (r) J

действующего на пространстве C+ неотрицательных непрерывных функций

и : [0, те) ^ R+ с нормой4 ||и|| = sup {u(t) еёг}.

t

Утверждение 8. Н [и(-)] £ Cj',

#Ы0 -U2(-)1 < ||U1 U2У ■ . (5.7)

Л + д + а(

Доказательство. Из (5.6) очевидно следует, что оператор Н переводит неотрицательную непрерывную функцию в неотрицательную непрерывную и что

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

гУ, ,м ¿t„ „ ifе.-* ТЛ ((1 - у) z(t)+z(r)y)a е-Л(г - f) А

#Ы0 -П2(-)] < е ||и1 -U2| max -^-ю -dr .

ye[0,1] уЛ г (т) у

(5.8)

Поскольку а < 1, из (4.7) ((1 - y)z(t)+z(r)y)a z(t ) , max

< , 1J. < maxj ea ¿Г c(s)ds, 1} < ea (p-i)(T-f).

г (т)а \\г(т)

Но тогда из (5.8) интегрированием получается (5.7). I

Из утверждения 8 следует, что уравнение (5.6) определяет единственную функцию и,(Ь):

0 ^и(^) < К е-6\ " " (5.9)

а эта функция, в свою очередь, определяет у(Ь) второй формулой в (5.4).

4Интегральная часть оператора Н сжимает любое из пространств C++ при а > 0. Пространство C++

выделяется тем, что именно ему принадлежит свободный член в (5.6).

и( ) ( )

переменных:

" ^ N. Щ) = ^+Л /«Л« -) и (г) —^»Д.+>"" «г)—т> (г,

(Л + ) ( )— а

(5.10)

/те

еЛ(*—т) и (т) (N (г (т) — г (г)) + е—р*Щ)а е—рЧт. (5.11)

Одновременно мы находим и оптимальную стратегию управления (см. (4.6)):

М ^ ,W,N) = Í^)W — N. (5.12)

( )

4-3. Оценка роста двойственных переменны,х

Для завершения доказательства оптимальности стратегии (5.12) осталось получить оценки роста двойственных переменных вдоль траектории и проверить выполнение условий (3.11). Для этого мы возвращаемся от функций состояния (5.10), (5.11) к случайным процессам (3.19), (3.20). При этом получается, что

1М = -(Ш^ /те «Л« - )и (г) ^ М)" М+ ^ _ 2 ^

(Л + 0) г (т)

(5.13)

/те

еЛ(т) и (т) (N (Ь) (г (т) — г (г)) + е—р*Щ (Ь»а е—рЧт, (5.14)

где Щ (¿) и N (¿) - реализации процесса (3.16), (3.18), при стратегии покупок/продаж недвижимости (5.12).

Пусть Ьк - момент к-й сделки. В силу (2.14), (4.6) богатство агента Щ(Ь) меняется по закону (г) = рЩ (г) + (г» ер^(г), а N(Ь) между сделками не меняется. Поэтому до следующей сделки

Щ (1) = Щ (Iк) ер*—рЪ + N (Iк + 0) ерг (г (I) — г (Iк)), (5.15)

и из (5.13), (5.14) следует

1 (г) = N (к +Л0+а— * + Iте (г (г) — г (1)) г (т)—а Як (I, т)а—1 Ли (г) еЛ(*^)+(1—а)рЧт,

/те

Ък (г, т)а~1 г (т)—аи (т) е-(Л+р)(т)—арт(1т, (5.17)

где

Як ^, т) = Щ (1 к) ерт—р* + (г (т) — г (Iк)) е»^ (Iк + 0).

Выражения (5.16) — (5.17) позволяют получить оценку роста двойственных переменных.

Утверждение 9. Если 5 достаточно велико, то случайные функции 1 (Ь), ш (¿) удовлетворяют условиям утверждения 5.

Доказательство. В моменты сделок выполняется условие кредитоспособности 0 * Ш (г к) - к )N (гк + 0) .Следовательно, Ък (г, т) > ерт г (т) N (г к + 0) и а < 1, Z (I, т)а-1 * (ертг (т) N ^))а-1. Поэтому получаем оценки

.а_и е-Н Г°е-Л(т-)Л 1и (т)Цг (т) - Х

и^ и к+°У-'(К +1° ................*

е-Лт-рг+Лг\и (т)\

1й(Ь)1 (1к + 0)а-1 Л ---^А^йт.

н *(V

а 1

В силу (5.9), (4.7) интегралы не превосходят Л+г+КР- 1)(а-1) И д(А+ р +<5) соответственно поэтому для доказательства утвержения достаточно показать, что N(1к + 0)а-1 не может расти быстрее экспоненты (т.е. N(Ьк + 0) не может быстро падать). Оценку величины N(Ьк + 0) можно получить из выражения оптимальной покупки (5.12):

N(1к + 0) = N(Iк) + М (1к, Ш(1к^(Iк)) = у(1к) 8(1к) Ш(1к). (5.18)

а < 1

V * (Л + 6) К + Поэтому ,13 (5.18)

N(<к)а-1 = У(>к)а-1 «к)1-аш«к)а-1 * К ((Л + 6) + л + б+Х^6)а - 1)) (ЖТ)

Но величина к)1-а растет не быстрее экспоненты (см. (2.1), (2.14)), а богатство агента Ш( к)

Ш (1к+{) = Ш (1к) ер*к+1-р1к + N (Iк + 0) ерь (г (Iк+1) - г ^)) = = Ш (Ък) ер(*к+1-^ ( 1 - у (1к) + у (Ък) >

> Ш (гк) ер(Ьк+1 ь-Ьк) (1 - у (гк) + у (гк) е("-р)(Ьк+1-Ьк^ > Ш (гк) ер(Ьк+1-Ьк)е("-р)(Ьк+1-Ьк) =

= Ш ^к) е1( *к+1- 1к) > Ш ^к). ■

5. Равновесие рынка недвижимости в случае логарифмической полезности и большой частоты сделок

5.1. Приближенное выражение для оптимальной стратегии в случае логарифмической полезности и большой частоты сделок

В соотношениях (4.8), (4.9), определяющих оптимальную стратегию (5.12), можно выделить предельный случай, в котором стратегия очень просто выражается через состояние и допускает агрегирование для большого числа разнотипных независимых потребителей.

Во-первых, в (4.8), (4.9) не возникает никакой особеннсти при а ^ +0. Поэтому, полагая а = 0

^У(<)-1 + Гж Л*(-)и (г) еЛ(<-) йг = и® (6 1)

(Л+ 6) +Л (1 -У (г ))г(г ) + г(т)у(т)йТ = U{t), ^

Л (г (г) - г (г)) и (г) еЛ(г-т) е-Ну(Ь)

1

/4 (1 - у(1))г(1)+г(т)у(т) (Л+ 6) __, >о

йг--, X (у(1) - 1)=0, (6.2)

>0

которые дают приближенное выражение для оптимальной стратегии агента, имеющего функцию полезности (см. (2.21)):

оо

Na - 1

U(N) = lim -= ln(N). (6.3)

a^+0 a

Во-вторых, будем считать частоту сделок Л много большей, чем остальные параметры модели - ö, р, I, имеющие раз мерность время-1. В этом случае для оценки интегралов в (6.1), (6.2) можно применить асимптотическое разложение Лапласа5. Оно дает выражения

мeA(i-r) -dr=и{t)+\ (-^m-1+vw«(t) + uit)y

It (1 -y (t))z(t) + z(T)y(T) w Л^ z(t) dt w j Л2

f™ Л(г(1) - z(t))u (t) eA(t-)d = и (t) jz (t) + ^t) Jt (1 - y(t))z(t)+z(T)y(r) г(1)Л + Л2

Отсюда в старшем порядке при Л ^ ж из (6.1), (6.2) получаем

(iz (*)) (-1 + V(t))u (t) , d

+ —и (t) = 0. (6.4)

у (t) z (t) dt

(ш + *Sfit- <->

о__Ls >o

>0

Нетрудно проверить, что в обоих режимах условия дополняющей нежесткости (обращении в 0 первого или второго сомножителя в (6.5)) из (6.4) получается одно и то же уравнение на иЩ: + * = 0. Единственным решением этого уравнения, удовлетворяющим (5.9), служит функция

и(^ = 1 е—н.

( )

^ ш* (^ > ,

и( ) ^ —6 г(1) (^ (¿))—1, £г 0) < —5 г(1).

I

Отсюда в силу (5.12), (4.6) получаем приближенное выражение для оптимальной стратегии потребителя в случае логарифмической полезности и большой частоты сделок, которое и будем использовать в дальнейшем:

зо

N + М = х (г ) = щшт {к (г, 5), 1}, к (г, г) = г^шах|0,р — ^ . (6.6)

На основе найденной стратегии можно построить выражения для динамики спроса и предложения совокупности агентов с различными характеристиками начальных запасов и предпочтения времени. Детали построения и исследование равновесия рынка планируется представить в отдельной публикации. Здесь анонсируем только окончательный результат.

1. При достаточно большом числе агентов равновесную цену можно считать неслучайной, то есть исходное предположение о том, что агенты считают цену неслучайной, является самосогласованным.

Ш -1

5Интегрировать по частям так, чтобы большое Л уходило в знаменатель. Исходя из соотношений по теореме о неявной функции можно показать, что возникающие при интегрировании по частям производные существуют и остаточные члены равномерно ограничены.

2. Динамика равновесной цены зависит от начального распределения богатства между агентами.

3. В некоторых случаях траектория цены может иметь вид, изображенный на рис. 1, похожий на характерный для рынка недвижимости, так называемый «пузырь».

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Важно подчеркнуть, что в рамках данной модели «пузырь» цены является разумным компромиссом (конкурентным рыночным равновесием) между рациональными агентами, предвидящими такую динамику.

Рис. 1. Численный расчет s(t) — пунктирная линия

Данная работа выполнена при поддержке гранта РФФИ № 11-01-00644, РГНФ № 11-02-00241а, ПФИ ОМН РАН № 3, ПФИ Президиум РАН № 14, РФФИ 11-01-12136 - офи_м -2011, РФФИ 12-01-00916-а.

Литература

1. Grossman S.J., baroque G. Asset Pricing and Optimal Portfolio Choice in the Presence of Illiquid Durable Consumption Goods /7 Econometrica. 1990. V. 58. P. 25 51.

2. Липцер Р.Ш., Ширяев A.H. Теория Мартингалов. M.: Наука, 1986.

3. Жукова А.А.. Поспелов И.Г. Монетарное и бартерное равновесие в стохастической модели обмена товарами в системе с большим числом агентов. М.: Учреждение Российской академии наук Вычислительный центр им. А.А. Дородницына РАН, 2009.

4. Oksendal В., Sulem A. Applied stochastic control of jump diffusion. New York: Springer Verlag, 2004.

5. Sennewald K., Wdlde K. «Ito's Lemma» and the Bellman Equation for Poisson Processes: An Applied View /7 .Journal of Economics. 2006. V. 89, N. 1. P. 1 36.

6. Karatzas I., Lehoczky J.P., Shreve S.E., Xu G.L. Martingale and duality methods for utility maximization in an incomplete market /7 SIAM .Journal of Control & Optimization. 1991.

V. 29. P. 702 730.

7. Merton R.C. Optimum consumption and portfolio rules in a continuous-time model /7 ■Journal of Economic Theory. 1973. V. 3. P. 373 413.

8. Chow G.C. The Lagrange method of optimization with applications to portfolio and investment decisions /7 .Journal of Economic Dynamics and Control. 1996. V. 20.

P. 1 18.

9. Беленький В.З. Оптимизационные модели экономической динамики. Беллмановский подход. Понятийный аппарат. Одномерные модели. М.: Наука, 2007.

10. Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. М.: Наука, 1973.

11. Situ R. Optimization for a Financial Market with Jumps by Lagrange's Method // Pacific Economic Review. - 1999. - V. 4, N 3. - P. 261-275.

12. Rockafettar R.T., Wets R.J.-B. Nonanticipativitv and ^-martingales in stochastic optimization problems // Stochastic Systems: Modeling, Identification and Optimization, Math. Programming Study. ^1976. - V. 6. - P. 170-187.

13. Situ R. Theory of Stochastic Differential Equations with Jumps and Applications // Book series «Mathematical and Analytical Techniques with Applications to Engineering». — Springer Science and Business Media. — 2005.

Поступим в редакцию 18.01.2012.

i Надоели баннеры? Вы всегда можете отключить рекламу.