Научная статья на тему 'Задача теории контрактов для модели «простого» агента'

Задача теории контрактов для модели «простого» агента Текст научной статьи по специальности «Математика»

CC BY
241
57
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Губко М. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Задача теории контрактов для модели «простого» агента»

Губко М.В. Задача теории контрактов для модели «простого» агента

Введение

Теория контрактов изучает механизмы стимулирования в условиях вероятностной неопределенности [6-9].

Задачи стимулирования очень часто встречаются в экономической практике. Каждый раз, когда между людьми или организациями возникают взаимоотношения, при которых один субъект может рассматриваться как работодатель (центр), определяющий для другого субъекта, так называемого агента, некоторую компенсацию за работу, которую тот должен выполнить, встает вопрос стимулирования и мотивации. Специфика этой задачи заключается в активности агента и центра, т.е. предполагается, что агент выбирает свое действие в соответствии с собственными интересами.

Задача также осложняется тем, что результат деятельности агента в общем случае не совпадает с выбираемым им действием, а описывается некоторым распределением вероятности. Насколько известно из литературы, на сегодняшний день общая задача стимулирования для базовой модели теории контрактов аналитически до сих пор не решена, хотя еще в начале 80-х годов были сформулированы частные условия, при которых она сводится к поиску стационарной точки математического ожидания функции полезности [7, 9]. Различными учеными [1-2, 4-6] были развиты численные методы решения этой задачи, а также получены достаточные условия оптимальности для ряда частных случаев.

1. Общая постановка задачи

Рассмотрим следующую модель. Центр заключает с агентом контракт, состоящий из кусочнонепрерывной функции стимулирования o(z)>0 и следующего порядка функционирования.

Агент может выбирать произвольное действие у из множества A. Здесь и далее предполагается, что A=[0, A]c^+. Затраты агента по выполнению действия у описываются положительной возрастающей непрерывно дифференцируемой функцией затрат с(у), измеренной в единицах полезности агента. После выбора действия yeA реализуется случайный результат zeA c интегральной функцией распределения F(z, у) и плотностью вероятности p(z, у), известными как центру, так и агенту. Далее центр производит выплату стимулирования s(z) по результату работы, т.е. центр не знает, какое действие выбрал агент на самом деле. Полезность стимулирования s(z) для агента равна v(s (z)), где v(s) - непрерывно дифференцируемая строго возрастающая фон-неймановская функция полезности (функция отношения к риску), причем 0<v’(0)<¥. Различают следующие три вида агентов. Нейтральные к риску агенты имеют линейную функцию отношения к риску, склонные к риску - выпуклую, не склонные к риску - вогнутую [7].

Примем гипотезу рационального поведения, согласно которой агент стремится выбрать действие, максимизирующее его ожидаемую полезность, т.е. максимизирующее выражение:

А+ А +

(1) f (y,s) = J f (z, у)dF(z, y)dz = Jv(s(z))P(z, y)dz - c(y),

0 0

где fz, у) = v(o(z))-с(y) - функция полезности агента, а f (у) - его целевая функция. Это выражение представляет собой математическое ожидание полезности агента (при выборе им действия у) по различным результатам действия z.

Примем также гипотезу благожелательности, то есть если у агента есть несколько действий, которые приводят к одинаковому значению его целевой функции, то агент выбирает из них действие, приводящее к большей полезности центра.

Будем считать, что центр нейтрален к риску, т.е. его функция полезности Ф(z, у) = H(z) - s(z), где H(z) - функция дохода центра. Задача состоит в том, чтобы, варьируя s(z), максимизировать ожидаемую полезность центра

А

(2) <~(s) = max J(H(z) - s(z))p(z, y)dz ,

ye Arg max f (y,s ) J

причем наложено ограничение: $y*eA: f (y*,s) > 0. Это условие означает, что центр обязан гарантировать агенту неотрицательную полезность при выборе агентом некоторого действия у*.

2. Модель «простого» агента

«Простым» агентом [4] называется агент со следующей функцией распределения результата деятельности в зависимости от его действия.

(3) F( ) JF(z)z < y;

(3) ^ у) = i

L 1 z > y-

где F(z) - монотонно возрастающая функция, 0<F(z)<1 при z>0.

Для таких агентов и будет решаться задача стимулирования.

3. Использованный подход

Для последующего рассмотрения более удобна модернизованная постановка задачи, введенная в [6, 7]. Решение задачи разбивается на два этапа.

На первом шаге для каждого действия y*eA ищется функция стимулирования, которая делает выгодным для агента выбор у* и при этом минимизирует затраты центра на стимулирование (или, как еще говорят, минимизирует затраты центра на реализацию действия у*). Таким образом, получается параметрически заданное семейство функций стимулирования s(z, у*). На втором шаге максимизируется ожидаемая полезность центра путем выбора из множества возможных действий A реализуемого действия у* и соответствующей ему оптимальной функции стимулирования.

Самой важной частью решения является первый этап, так как, если найдено семейство минимальных функций стимулирования, то остается найти

max J[ H ( z ) - s ( z, y*)]dF ( z, у *)

у A

то есть найти максимум функции одной переменной.

Фиксируем y*eA и найдем функцию стимулирования, минимизирующую затраты центра на реализацию этого действия.

Для этого несколько изменим обозначения. Далее будем обозначать w(z):=v(s(z)). Также обозначим t(w):=s_1(w) - функция, обратная к функции отношения к риску. Для склонного к риску агента t(w) -вогнутая функция, для не склонного - выпуклая. Таким образом, за основу теперь принимаем не денежное выражение стимулирования s(z), а стимулирование w(z), выраженное в единицах полезности агента. Тогда задача ставится так:

Минимизировать ожидаемые затраты центра на стимулирование (4) при условии, что ожидаемое значение полезности агента (5) при выборе им действия у* больше нуля и выбор остальных действий у, не равных у*, дает агенту не большую полезность (6), чем при выборе действия у*.

(4) Jt(w(z))dF(z, у*) ® min при условиях

J w( z)

(5) f (y*, w) = Jw(z)dF(z, y*) - c(y*) > 0,

A

(6) Jw(z)dF(z, y) - c(y) = f (y, w) < f (y*,w),"y e A .

A

Ограничения (5, 6) включают линейные функционалы. Для не склонного к риску агента выражение

(4) задает выпуклый функционал, для склонного к риску - вогнутый.

Сначала рассмотрим случай не склонного к риску агента.

Класс рассматриваемых функций стимулирования можно [7] ограничить функциями, удовлетворяющими (5) как равенству.

Определение 1: функция стимулирования w(z) называется допустимой для у*, если она удовлетворяет (6) и удовлетворяет (5) как равенству.

Лемма 1 : Функция стимулирования

c

(7) w0(z) = J—

c'(x) dx

о - ^ ( Х)

является возрастающей функцией z и является допустимой для всеху*е А. Доказательство : Функция (7) - это решение уравнения

у

(8) |Цz)p(z+ Цу)[1 - F(у)] - с(у) = 0 .

о

Действительно, дифференцируя обе части уравнения (8) по у,

н( У) p(y) + Н (у)(1 - F (У)) - w(y) p(y) - с'(у ) = 0, то есть

н'(у) = С (у) . Значит н’(у) = [ С (х) dx + С .

1 - F (у) ^ 01 - F (х)

Константу С положим равной 0 для соблюдения условия (5) как равенства. Так как с(х) - возрастающая функция х, подынтегральное выражение - положительная функция. Следовательно, н0^) возрастает по z.

Уравнение (8) представляет собой условие (6), записанное, как равенство. То есть н0, как решение (8) удовлетворяет (5) и (6) как равенствам для любого у*.

Теорема 1: Функция стимулирования н0^) оптимальна для не склонного к риску «простого» агента при любом у*еА.

Доказательство : Представим произвольную допустимую функцию стимулирования н^) в виде н( z) = Н0( z) + (р (z), где (р (z) кусочно-непрерывная функция.

Чтобы н^) была допустимой, по определению необходимо выполнение условия (5) как равенства и условия (6). Подставим в эти выражения н(z) = Н0(z) + р(z) . Так как н0^) удовлетворяет этим условиям как равенствам, их можно упростить. Тогда условия допустимости н^) будут следующими:

у*

(9) |р(z)р(z)dz + [1 - F(у*)]р(у*) = 0,

0

У

, (z)р(z)dz +1

0

Необходимо доказать, что для произвольной р(х), удовлетворяющей (9) и (10) справедливо

(10) J j(z)p(z)dz + [1 - F(y)]j(y) < 0 "y e A .

(11) }тК((z, У*) < |тК(z) + Р((z, У*).

А А

Представим т (н) в виде разложения Тейлора в окрестности точки Н0.

(12) т(Н(z) + Р(z)) = тК(z)) + т'К(z))Р(z) + 0(^Р(z)),

где 0(.) - остаточный член разложения.

Так как т (V) - выпуклая функция, то 0(.)>0 и можно сделать оценку снизу:

|тК (z) + Р(z))й^(z, У*) [тК(z)) + т' К(^)Р(z)]dF(z, У*)

А А

То есть (11) будет справедливо, если верно неравенство

Jt'(w0(z))j(z)dF(z, y*) > 0 .

A

(13) Jt '(w0( z)) j(z) p( z )dz +[1 - F (y*)]t '(w0( y*))j(y*) > 0.

Для «простого» агента этот интеграл можно записать как:

У *

■' z))р(z)р(z)dz + |

0

Разделим это неравенство на т '(н0(у*)) и отнимем от левой части выражение из левой части равенства

(9). Теперь надо доказать, что

У *

(14) Jg(z)j(z)p(z)dz < 0

0

где введе g(z) :=1 -

0

где введено обозначение

t ,(w0( y*))

Так как t(.) и w0(.) - возрастающие положительные функции своих аргументов, g(z) будет убывающей положительной на [0, у*) функцией.

Из условия (9) следует, что <jz) не может быть положительной на всем отрезке [0, у*]. Обозначим через z0,...,zN_j левые точки интервалов, где j(z)<0, а через z0,5,Zi,5,...,zN+0,5 левые точки интервалов, на которых j(z)>0. Положим zN:=y*.

Из условия (10) следует, что

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

zi

lim Jj (z )dF (z, y) = Jj (z ) p( z)dz + [1 - F (zt)] lim j (y) < 0

у®zi-0J J у-0

i A 0 i

Так как точка zi - это точка изменения знака j(z) с положительного на отрицательный, то lim j(у) > 0

у ® zi-0

и можно сделать вывод, что

(15) | Р(z)р(z)d

z )dz < 0

Чтобы получить верхнюю оценку левой части выражения (14), сделаем верхнюю оценку у(г) на интервалах, где Р(г) положительна, и нижнюю оценку у(г) там, где Р(г) отрицательна.

Так как у(г) убывает с ростом г, это будут значения 7=Хт1+0.5) в правых и левых точках соответствующих отрезков [г1,г1+0.5] и [г1_0.5,г1] (см. рис. 1). Введем дополнительно 7к=0.

Сделаем следующую верхнюю оценку левой части выражения (14):

У * N-1 гг+1

(16) 17 ( т)Р ( т ) Р( < X У г | Р ( т ) Р( т .

0 г =0 г1

Коэффициент у можно представить в виде 7=7+1+(У4-у+1). Тогда можно от пределов интегрирования от г1 до г1+1 можно перейти к пределам от 0 до г1+1 следующим образом:

N-1 тг+1 N-1 тг+1

X 7г |Р(т)Р(= X (7г - 7г +1) |Р(Т)Р(Т.

г=0 г=0 0

Теперь, замечая, что, так как у - убывающая функция, то у;-у+1>0, а (по формуле (15)) все интегралы под знаком суммы отрицательны, можно сделать вывод, что

У* N-1 тг+1

17(т)Р(т)Р(z)dz < X (7г - 7г+1) IР(т)Р(т< 0,

0 г =0 0

что и требовалось доказать.

Теперь можно перейти к рассмотрению склонного к риску агента.

Лемма 2 : Функция стимулирования

(.„ ( *) |с(У*)/[1 -F(У*)] при т = у *

(17) у*) = <!

[ 0, при г Ф у *

является допустимой для у*.

Доказательство производится подстановкой этой функции в условия допустимости (5) и (6).

Если для не склонного к риску агента оптимальная функция стимулирования не зависела от реализуемого действия у*, то для склонного к риску агента оптимальная функция стимулирования уже будет зависеть от реализуемого действия.

Теорема 2: Функция стимулирования (17) является оптимальной при реализации центром действия у* в случае склонного к риску агента.

Доказательство : Аналогично доказательству теоремы 1 представим произвольную допустимую функцию стимулирования в виде н(г,у*) = Н'1(г,у*) + Р(г,у*), и получим формулы (9), (10) в качестве

условий допустимости Р(г,у*). Далее для компактности пишем н(г) вместо н(г, у*), так как действие у* фиксировано.

Заметим, что на интервале [0, у*) Р(г)>0, как следствие требования н(г)>0. Значит, из (9) следует,

что р(у*)<0. Кроме того, используя условие (10) можно показать, что н(г)<н\(у*) для всех г.

Затраты центра при использовании функции стимулирования н(г) равны

У *

(18) |т(Р(г))р(г^ +[1 - F(У*)]т[' (У*) + Р(У*)].

0

Так как н(г)<н\(у*) для всех г, а т(.) - вогнутая функция, можно сделать оценку т('(г)) > т(|'((3*.)) '(г) "г е [0,у*].

'( у*)

Сделаем нижнюю оценку выражения (18):

у*

Iт (р (г)) р( гМг+[1 - F (у*)]т К (у*)+р (у*)] >

0

у *

т ('((У**))){ I Р( г) Р( г >* + [1 - F (у*)]р( г) + [1 - F (у*)', (у*)}

'1(у*) 0

Условие (5) допустимости р(г) имеет вид

у*

I р(г) р( +[1 - F (у *)]р (г) = 0,

0

то есть нижней оценкой (18) будет

(19) - F (у*)]», (у*) = т (' (у*))[1 - F (у*)] .

'1( у*)

Но (19) - это затраты центра при использовании функции стимулирования ',(г). Следовательно, затраты при использовании ',(г) меньше, чем при использовании '(г).

Проведение второго этапа поиска оптимальной системы стимулирования, как было отмечено ранее, не представляет трудности и сводится к поиску максимума функции Ф(.) по переменной у*.

4. Обсуждение результатов

Итак, была найдена оптимальная функция стимулирования для «простого» агента. Ее вид существенно зависит от того, склонен агент к риску или нет.

Для склонного к риску агента центр максимально использует его авантюризм, предлагая, по сути дела, максимально рискованную сделку, предполагающую выплату стимулирования только в случае, когда результат в точности равен действию агента. В остальных случаях (вероятность реализации которых равна F(y*)), выплаты агенту равны нулю. Соответственно, с уменьшением вероятности (1^(у*)) реализации результата г, равного действию у*, центр вынужден повышать выплаты в случае, если ъ =у*.

Наоборот, оптимальное стимулирование не склонного к риску агента предполагает насколько возможно большее страхование агента в случае реализации действия г, меньшего, чем его действие у*. Стимулирование меньших результатов ограничено только тем, чтобы выбор действия у* оставался не менее предпочтительным, чем выбор меньшего действия. Ведь, выбирая меньшие действия, агент, тем самым, повышает вероятность реализации меньших результатов. Предельный случай, как раз и приводящий к наименьшим затратам центра на стимулирование, состоит в том, чтобы целевая функция агента была постоянна вне зависимости от выбираемого им действия. В этой связи приобретает очень большое значение благожелательность агента, ведь выбор действия никак не влияет на его ожидаемую полезность.

От условия благожелательности можно отказаться, но тогда существует только е-оптимальная функция стимулирования. Она совпадает с найденной ранее функцией v0(z) везде, кроме точки у*, которую центр хочет заставить агента выбрать. При точной реализации результата г=у* центр повышает стимулирование на малую величину. Тогда, соответственно, на малую величину увеличиваются ожидаемые затраты центра на стимулирование, но теперь выбор агентом действия у=у* дает единственный максимум его целевой функции.

5. Перспективы

Сходство полученных результатов с другими выводами теории контрактов [6-9] позволяет выдвинуть следующую гипотезу. Не является ли стратегия центра, приводящая к одинаковым значениям целевой функции агента, оптимальной, как это имеет место в детерминированных системах, если не для произвольных агентов, то хотя бы для «обобщенно-простых» агентов с функцией распределения результата вида

77/ 4 GZ’ У) при Z < У

F y) = 1 ! > ’

[ ! при z > y

где, G(z, y) - некоторое распределение условной вероятности реализации результата z при выборе действия у, причем выбор действия у2 стохастически доминирует выбор меньшего действия уь то есть G(z, y1)>G(z, у2). «Обобщенно-простой» агент есть обобщение простого, но его анализ пока не проводился.

Полученные параметрические зависимости оптимальных функций стимулирования от реализуемого ими действия очень удобны при решении синтеза задачи стимулирования нескольких агентов при условии ограничений на ожидаемое стимулирование, а также при решении задачи стимулирования с ограниченными рисками, например, рисками невыполнения плана или риска превышения лимита по зарплате и т. д.

6. Резюме

В работе решена задача стимулирования (2) для базовой модели теории контрактов в частном случае «простого» агента (3).

Показано, что, для не склонного к риску агента, функция стимулирования, реализующая действие у* с минимальными затратами, имеет вид (7). Для склонного к риску агента вид этой функции, описываемой формулой (17), принципиально иной.

Литература

1. БУРКОВ В.Н., ЕНАЛЕЕВ А.К., НОВИКОВ Д.А. Вероятностная задача стимулирования // А и Т. 1993. № 12.

2. БУРКОВ В.Н., НОВИКОВ Д.А. Оптимальные механизмы стимулирования в активных системах с вероятностной неопределенностью. II// А и Т. 1995. № 10, С 121-126.

3. КОЛМОГОРОВ А.Н., ФОМИН С.В. Элементы теории функций и функционального анализа. М.: Наука, 1989.

4. НОВИКОВ Д.А. Стимулирование в вероятностных активных системах: роль неопределенности. // А и Т. 1997. № 8, С. 168-177.

5. НОВИКОВ Д.А., ПЕТРАКОВ С.Н. Курс теории активных систем. М.: СИНТЕГ, 1999. - 108 с.

6. GROSSMAN S. An introduction to theory of rational expectation under asymmetric information // Review of Economic Studies. 1981. Vol. 48. №3 P. 541-560.

7. GROSSMAN S., HART O. Implicit contracts under asymmetric information // Quarterly J. оf Economics. 1982. №1. P. 110-124.

8. HART O. HOLMSTROM B. Theory of Contracts // Advances in economical theory. 5th world congress. Cambridge: Cambridge Univ. Press, 1987. P. 71-155.

9. ROGERSON W. The first order approach to principal-agent problem // Econometrica. 1985. Vol. 53. №3. P. 1353-1368.

i Надоели баннеры? Вы всегда можете отключить рекламу.