У
правление в социально-экономических системах
УДК 021.8 + 025.1
ОПТИМАЛЬНЫЙ СОГЛАСОВАННЫЙ МЕХАНИЗМ В СИСТЕМЕ С НЕСКОЛЬКИМИ АКТИВНЫМИ ЭЛЕМЕНТАМИ1
А.К. Еналеев
Рассмотрены задачи синтеза оптимальных механизмов управления в активной системе, состоящей из центра и нескольких активных элементов (АЭ), связанных друг с другом общим фондом поощрения, при неполной информированности центра о параметрах модели АЭ. Найдены оптимальные механизмы, включающие в себя процедуры планирования, функции штрафов и поощрений, процедуры определения размера и распределения фонда поощрения, при которых АЭ заинтересованы сообщать в центр достоверную информацию и выполнять планы.
Ключевые слова: организационная система, иерархия, механизм управления, принцип согласования, оптимизация, неманипулируемость.
ВВЕДЕНИЕ
Задача синтеза оптимальных механизмов управления (совокупности процедур планирования и систем стимулирования) была поставлена в первых работах по теории активных систем и в общем виде представлена в монографии [1].
В работах [2—5] получено решение задачи синтеза оптимального механизма для случая полной информированности центра и доказана оптимальность согласованных механизмов. В статье [5] установлена связь с результатами теории игр с непротивоположными интересами [6]. Дальнейшее развитие задачи анализа и синтеза механизмов стимулирования в условиях полной информированности получили в работах [6—9].
Если для случая полной информированности центра задачи синтеза [2—9] хорошо исследованы и, можно сказать, почти полностью решены, то для случая неполной информированности решению оказалось доступно только довольно ограниченное подмножество задач.
Здесь необходимо разделить множество моделей на два подмножества: модели с одним или не-
1 Работа выполнена при частичной финансовой поддержке РФФИ, грант № 15-07-07790.
сколькими несвязанными активными элементами (АЭ) и модели со связанными друг с другом АЭ.
Для модели с одним АЭ, когда центр знает функцию распределения случайного параметра, характеризующего АЭ, решение задачи синтеза оптимального механизма для рассматриваемой активной системы приведено в работах [2, 8—15]. Ряд результатов в этих работах пересекается и дополняет исследования в теории контрактов [16].
Для случая неполной информированности центра в модели с одним АЭ, когда центр знает только нижнюю и верхнюю границы параметра АЭ, и АЭ сообщает ему оценку своего параметра, получен ряд результатов по синтезу оптимального механизма [17—21]. Доказано, что в число оптимальных механизмов входят так называемые правильные, согласованные механизмы, обеспечивающие сообщение достоверной информации и выполнение назначаемого центром плана (оптимальность согласованных механизмов).
В работах [18—21] рассматривалась модель, в которой целевая функция АЭ представима в виде функции поощрения за выбор значения состояния минус функция штрафов за отклонение состояния от плана и минус функция затрат, зависящая от значения состояния АЭ и его параметра. Для функции затрат предполагается выполнение условий Спенса — Мирлиса [22].
Для модели с несколькими АЭ задача синтеза одной из составляющих механизма управления, а именно, оптимальной процедуры планирования (принятия решений), которая являются не-манипулируемой, в основном решена для задачи распределения ресурсов и активной экспертизы [8, 23, 24]. В работе [23] дан подробный анализ состояния исследований в этой области и полученных результатов. Задачи синтеза оптимальных механизмов управления в активных системах для модели с несколькими АЭ в условиях неопределенности остаются в настоящее время слабо исследованными.
В предлагаемой работе такого рода задача исследуется в случаях, когда:
— активные элементы связаны заданным общим фондом поощрения и центр распределяет этот фонд между АЭ;
— центр выбирает размер общего фонда.
В настоящей статье существенно используются результаты работ [19—21].
1. МОДЕЛЬ И ПОСТАНОВКА ЗАДАЧИ
1.1. Модель
Активная система, состоит из центра и п АЭ. Обозначим Дл, у, г{) целевую функцию АЭ. Здесь X — назначаемый /-му АЭ план; X — множество допустимых планов; у. — выбираемое активным элементом состояние; у — множество допустимых состояний; гг — параметр, характеризующий АЭ; Л. — множество допустимых значений параметра г{, где / = 1, ..., п. Будем предполагать, что
У. = X. = [ хн, хв ], А1 = [ ггн, гв ], т. е. множества допустимых состояний, планов и значений параметра гг представляют собой отрезки на числовой оси. Здесь индексы «н» и «в» означают нижнюю и верхнюю границу отрезка.
Будем рассматривать целевые функции АЭ вида
Дл, у, ^ = Дл, у) - см, г,),
где £г(у-, гг) — функции затрат АЭ при выборе состояний у; ¿Д, у) = стг(у) - хг(лг, у) — функции стимулирования за выбор активным элементом состояния у. при плане хг. Здесь функции аг(у.) — поощрения за выбор величины у, 0 < аг(уг) < £г, где g¡ — фонд поощрения /-го АЭ, < С, С — суммарный фонд поощрения, а %г(хр у) — функции штрафов за отклонение состояния у. от плана л{, причем х(хг, у-) ^ 0, х(у-, у-) = 0. Будем считать да-
лее, что функции стг(у.) полунепрерывны сверху, а %г(у, у.) полунепрерывны снизу.
Предположим, что функции затрат £/(хг, гг) дважды дифференцируемы по у, дифференцируемы по г;, и СХ (л, г) > 0, С« (л, г) > 0, С (л, г) < 0, С,'г (л, г) < 0 при всех л е X, г е Л. Здесь, в неравенствах, для простоты записи индекс / не отмечен.
Первые два неравенства указывают, соответственно, на возрастание функции затрат и ее выпуклость. Третье неравенство характеризует монотонность функции затрат по параметру г{. Четвертое неравенство соответствует хорошо известным в микроэкономике условиям Спенса — Мирлиса и характеризует упорядоченность АЭ по возможным значениям параметра гг, когда с увеличением гг снижаются затраты и темп роста затрат, связанных с увеличением л{.
Обозначим Ф(л, у, g, г) целевую функцию центра, где л = Ц.}, у = {у}, г = {гг}, g = {£.}. Предположим, что Ф(л, у, ^ г) = X Ф/(лг, у, &, гг),
г = 1...п
ФО^ уР & гг) ^ Ф^р уР ^ гг) ^ 0, (1)
где функции Фг(у, у, гг) непрерывны по всем аргументам, не возрастают по g¡. и строго квазивог-нуты по у. при всех гге Лг, / = 1, ..., п.
План лг назначается центром в соответствии с некоторой выбранной процедурой планирования лг = пг(*), где пг(*) отображает множество Л в мно-
п
жество Хг; пг : Л ^ Хг, где Л = П Лг. Далее предпо-
г = 1
лагается, что отображение пг(*) кусочно-непрерывно [19].
Фонды поощрения для АЭ задаются центром в соответствии с правилом распределения суммарного фонда С, где g(•) = {^(")} отображает множество допустимых сообщений Л в множество допустимых значений фондов, представляющем декартово произведение О п отрезков [0, С], и вып
полняется условие
X £(•) < С.
г= 1
Совокупность процедур планирования л. = п .(•), распределение фонда поощрения и функций стимулирования 5{(л{, у), / = 1, ..., п, составляет механизм функционирования ц = п ¿(•), 5{.(л{, у.)}.
Введем предположения об информированности и порядке функционирования в рассматриваемой активной системе.
Активному элементу известно значение параметра г,, а центру известны только множества А, допустимых значений этих параметров. Функционирование рассматриваемой активной системы описывается следующим образом (порядком ходов). Центр выбирает и сообщает механизм ц = {#,(•), лг(-), 5,(хг, у,)}, после этого АЭ сообщают оценки р, параметров г,, затем в соответствии с процедурой планирования я,(*) назначаются планы х, = л,(р) и определяются размеры фондов £г(р), затем АЭ выбирают состояния у,, стремясь максимизировать по у. свои целевые функции Дх., у, г.),
3 3 3 ^ ^
где р = {р,}, I = 1, ..., п.
Обозначим функцию предпочтения активного
элемента ф,(х., г.) = тах /.(х., у., г.) и функцию
уе Ъ
предпочтения центра ^(х, £, г) = шГ Ф(х, у, £, г),
у е Z( х, г)
где ^(х, г) — множество рациональных стратегий активных элементов при выборе состояний у (определение используемого в данной работе множества рациональных стратегий ^(х, г) = {2,.(х,, г,)} приведено ниже).
Для заданного механизма функционирования ц определим показатель его эффективности
ВД = inf
r е A
inf ¥(я(р), g(p), r)/^(r)
L P е R(r) B .
(2)
где R(r) — множество рациональных стратегий АЭ при выборе ими сообщений р (определение множества R(r) приведено ниже); ^B(r) — заданная непрерывная нормирующая (весовая) функция. В качестве нормирующей функции могут быть могут быть выбраны, например, одна из функций: Ув(г) = max Ф(х, x, 0, r) либо ^B(r) = const > 0. По-
x е X
ложим также, что нормирующая функция при всех гге Аг, i = 1, ..., n, больше некоторой положительной величины.
Далее будем предполагать выполнение «слабого условия благожелательности АЭ» [19], при котором множества рациональных стратегий АЭ для i = 1, ..., n принимают вид:
r) =
хг, если xt е Argmaxfi(x„ y, rt),
Уе Y
Arg max ft (xt, yt, rt) в противном случае,
У е Y
R(r) =
Г/, если r,- е Argmax ф(яг(рг, р!г<r)), r,),
р«е
Argmaxф(пt(рг, р-1(r)), гг-) в противном случае,
р«е Ai
Z(x, r) = {Z(x, r,.)}, R(r) = {R( р*, р!г- (r)} — множество решений игры АЭ при выборе сообщений. Здесь р* — равновесные стратегии АЭ. Рассматриваются случаи, когда такие равновесия существуют. Понятно, что обоснование и исследование этих случаев представляет собой отдельную и, вообще говоря, нетривиальную задачу. Далее при рассмотрении этой задачи как раз исследуется случай существования равновесия в доминантных стратегиях.
Особый интерес представляют собой механизмы, обеспечивающие выполнение планов и сообщение достоверной информации (неманипулиру-емость), т. е.
Z(x, r) = {х}, R(r) = {r}.
Такие механизмы цпр в теории активных систем принято называть правильными. Заметим, что для правильных механизмов цпр выражение для критерия эффективности существенно упрощается (по сравнению с выражением (2)):
) = шш[Ф(я(г), n(r), g(r), г)/ВД].
^ r е A
1.2. Постановка задачи
В теории активных систем ставится общая задача синтеза оптимального механизма функционирования ц*:
вд = sup ад - е, (3)
ц е М
где М — некоторое заданное множество механизмов, а s — достаточно малое положительное число.
Обозначим Мпр множество правильных механизмов, и пусть множество М таково, что M П Мпр ^ 0.
Задача. Охарактеризовать множества допустимых механизмов М, для которых выполняется
К(ц*) = max К(ц) = max К(ц),
ц е М
ц е MПМп
т. е. оптимальный механизм на множестве М принадлежит множеству правильных механизмов:
ц* е M П Мпр. ♦
(4)
Здесь вместо sup можно использовать max и принять s = 0, так как для принятых в работе предположений (правильность механизма, свойства функции затрат, условия благожелательности АЭ) величина max К(ц) достижима, [20, 21].
ц е M ПМпр
Далее будут найдены и исследованы достаточные условия выполнения соотношения (4), характеризующие множество механизмов М для рассматриваемой модели активной системы.
Забегая вперед, скажем, что эти условия будут представлять собой некоторые условия согласованности механизмов функционирования.
В качестве множества допустимых систем стимулирования примем
£ = {¿(л, у) | 0 < аг(л) < g¡, Х{(л, у/) -
- X¡(л¡, у{) < их¡Су^ у/ X ^ ур у/ е УР I = 1, ..., п},
где g{. — заданные положительные числа (фонды поощрения), а и .(у,, у/) — заданные показатели максимального роста функции штрафов за невыполнение плана, функции и ,.(*,*) удовлетворяют нера-
X1
венству «треугольника»: и% ¡(л, у) + и% .(у, у') > и% ¡(л, у'), т. е. являются «сильно согласованными» [2—4].
Замечание 1. Функции и .(л, у), вообще говоря, могут зависеть от функций стг(л). В данном случае
имеется в виду, что и .(л, у) может быть ограничена
и
сверху функцией стг(л). Соответствующий пример приведен в статье [21]. ♦
В качестве множества допустимых процедур планирования примем непрерывные отображе-
п
ния п{ : Л ^ X, где Л = П Л{.
г = 1
В качестве множества допустимых процедур формирования фондов поощрения примем отоб-
п
ражения g¡ : Л ^ [0, С] при условии X < С.
г = 1
Таким образом, эти допустимые множества в совокупности характеризуют множество М допустимых механизмов в выражениях (3) и (4).
Замечание 2. Исследование поставленной задачи будем проводить в два этапа. Сначала определим оптимальный правильный механизм в предположении, что распределение фондов g = произвольно и фиксировано. Затем предложим оптимальную процедуру распределения фондов g(•) = {^(')}, при которой сохраняется правильность и обеспечивается оптимальность механизма. ♦
2. СОГЛАСОВАННЫЕ МЕХАНИЗМЫ
2.1. Условия согласования
Центр, назначая планы из множества выгодных для АЭ планов,
ВД = {л, е Xур г,) < У{(л¡, л,, г,) уу,. е у}
определенным образом согласовывает свои интересы с интересами АЭ. Это множество будем называть множеством согласованных планов.
Множество согласованных планов Р{(г{) при сделанных предположениях о свойствах функции затрат представимо в виде отрезка Р{(г{) = [ лн, лр (г{)],
р
где (г{) — неубывающая функция [20].
Пусть у* = у* (л) — выбор состояния АЭ при плане л{, т. е. у * е ^Сл, г). Известно [2, 3], что если функция штрафов является сильно согласованной, т. е. удовлетворяет неравенству «треугольни-
с
ка», и план л{ удовлетворяет условию согласования лс е Р{(г{), то у* = лс, т. е. согласованные планы выгодно АЭ выполнять, если же л. £ Р{(г{), то
у* е Р/Сг,) = [ лН, лР (г,)].
Функцию предпочтения АЭ можно записать в виде
Ф/Ц, г/) =
ГСт{(л,) - (л/, г/), если л, е Р,(г,),
у*) - С/(у*, г/) - Х/(л/, у,*), если л, £ Р,(г,),
где у * = у * (л,).
Соответственно, функцию предпочтения центра можно представить в виде
г) =
Ф(л, л, g, г), если л е Р( г),
Ф(л, у*, g, г), если л £ Р( г),
где Р(р) = П Р{(Р{).
г = 1
Так как у* е Р{(г{), то выбором плана л{ = у* всегда можно, в силу предположения (1), обеспечить выбор активным элементом состояния у*, т. е. функцию предпочтения центра достаточно рассматривать в области определения л{ е Р{(г{), а, следовательно, достаточно рассматривать только те процедуры планирования п(-), значения которых принадлежит множеству Р(р).
Оптимальная процедура планирования для случая равновесия в доминантных стратегиях содержится в множестве так называемых процедур открытого управления. По определению процедура открытого управления пОУ(-) задается условием «совершенного согласования» [17]:
Ур е А : ф,.(пОУ (р), р,) = тах Фг(л, р,), (5)
Х Е ХгС(р-(.)
где Х,С (р-{) — устанавливаемое центром замкнутое подмножество множества X/, не зависящее от сообщаемой активным элементом оценки р{. Именно
выбором центром множеств Xе (р-{) и условия (5)
определяется конкретная процедура открытого управления.
Процедура открытого управления стимулирует АЭ сообщать достоверную информацию р = г, так как Ур, г е А: Фг(лОУ(р), г,) < Ф,(лОУ(г), г,).
Отсюда следует, что для процедур открытого управления функция предпочтения центра имеет
вид ^(лОУ(г), я, г).
Из этого свойства вытекает, что для процедуры открытого управления критерий эффективности (2) имеет вид
К(ц) = тш[ДлОУ(г), пОУ(г), я, г)/^в(г)].
г е А
Поскольку оптимальная процедура планирования при произвольной фиксированной целевой функции АЭ содержится в множестве процедур открытого управления (5), то определение оптимального механизма при оптимальной процедуре открытого управления сводится к нахож-
с
дению множеств X (р_,) в условии (5), оптимального распределения фонда поощрения {} и оптимальной системы стимулирования л* (х,, у,) = = ст* (х,) - х* (х,, у,), / = 1, .., п. Далее для рассматриваемого случая неполной информированности центра будет исследована задача (3) синтеза оптимального механизма ц* на множестве
М = {ц | я(р) е О, л(х, у) е х = п(р), х, у е X, р е А},
где п(р) — кусочно-непрерывные функции, определенные на множестве А и принимающие значения в множестве X.
2.2. Вспомогательные построения
Для случая, когда функции затрат АЭ удовлетворяют условиям Спенса — Мирлиса, процедура открытого управления пОУ(г) представляет собой набор неубывающих по г, непрерывных функций
пОУ (г) [19, 20], принимающих значения в множествах согласованных планов Рг(г,) и Х,с (р-г). Предположим сначала, что размеры фондов поощрения я, для всех АЭ известны и фиксированы, тогда задача синтеза оптимального механизма распадается на п независимых задач определения оптимальной процедуры планирования и системы стимулирования для каждого АЭ. Для этих задач уже получено решение [20, 21].
Пусть для /-го АЭ задан размер фонда поощрения я,.
Зафиксируем некоторое значение у = уг(?г). Введем в рассмотрение множество N. неубывающих непрерывных функций х, = я (г), отображающих
множество А в множество Р(г) = П Рг'(гг) при
, = 1,..., п
выполнении условия
ф,(хр хр г,) > уВД. (6)
Пусть у = у, таково, что неравенство (6) разрешимо в множестве X, при У г, е А,, / = 1, ..., п, тогда множество всех точек (х, г), удовлетворяющих этому неравенству, можно представить в виде
о, = {(хР г)1 «1 (Yг, г) < х, < «2 (уР ^ г е A, х, е
где q1 (уг, r) и q2 (y;, r) — непрерывные функции [19, 20]. Здесь r = (r1, ..., r;, ..., rn).
Рассмотрим функции #1 (уг, r) = max #1 (уг, rp
rH < P < r,
..., r/ - l, p r/ + l, ..., rn) #2 (Yp r) = min„ #2P (Yp 1 ...,
r, < p < r,
- l, Р + l, ..., А^ где «2 1 ..., г, - 1, Р г, + 1,
..., гп) = т1П{ «2 (уР 1 ..., г,- 1, Р г, + 1, ..., ^ хр (Р)}.
Очевидно, что «1 (у,, г) и «2 (у,, г) — неубывающие, непрерывные по г, функции.
Если ^ 0, то «1 (у,, г) < «2 (у,, г) при всех г е А. Тогда условие (6) в определении множества N.
можно заменить условием «1 (у,, г) < х,(г) < «2 (у,, г), т. е.
= {х,(г) е Р,(г,)|«1 (у,, г) < х,(г) < «2 (у,, г), г е А},
где х,(г) — непрерывные, неубывающие по г, функции.
Заметим, что N , ^ N,, если у1 > у2. Пусть у, такое, что N . ^ 0. Обозначим а, =
= (ур 1 ..., г, - l, , г, + Р ..., гп) и выберем
Xе (р-г) = [а,, хв ] в условии совершенного согласования (5).
Рассмотрим процедуру планирования
(r) =
а/, если r/ < г/ <рг-, #1(Y/, r), если р/ < r/ < rB,
где Р/=^ если а > (Y{, гl, ..., г/ - l, гВ, г/+l, ..., ^
либо определяется как решение уравнения
41 (У{', гl, ..., г, - l, Р/, г, + l, ..., гп) = аР если а/ < ^ (У{', в \
г1, ..., г/ - 1, гв , г/ + 1, ..., гп).
Заметим, что по построению п^. (г) неубывающая по г{ непрерывная функция. Отсюда следует [19], что существует функция Я! (л,), принимаю-
Ч {
щая значения в множестве Л1 = [ гн, гв ], обратная
к п^. (г), определенная на множестве допустимых планов X за исключением, быть может, счетного
числа точек, при этом Я! (л.) неубывающая.
Ч {
3. ОПТИМАЛЬНОСТЬ СОГЛАСОВАННОГО МЕХАНИЗМА
Обозначим для всех / = 1, ..., п:
п
К(ц) = X У{(£),
г = 1
л/ = % (г) = где У/, = У/С^
а/, если гн < г, < р,, 41 (У/, г), если в, < г, < гв,
хД, у) = и/х (л{, у^
(7)
(8)
(9)
а/л) =
0 при лг < л{ <а,
IС// (?,^(0)при а,<л,<п^.(гв), (10) а
_ / ✓ В* ^ в
g¡ при пу. (г, )< л, < л,,
в, пу(г )
= | (?, г; сОМ/, (11)
где
' ^ в
пъ (п)
= I (?, Я'. < .
(12)
Примечание. В выражениях (10)—(12) Си (?,
Я. (?)) обозначает частную производную по первой переменной ? функции затрат /-го АЭ. ♦
В работах [19—21] доказана оптимальность механизма (7)—(12) для случая одного АЭ.
Отметим, что процедура планирования (8), по построению, удовлетворяет условиям совершенного согласования, соответственно, представляет собой процедуру открытого управления и обеспечивает сообщение достоверной информации при механизме (7)—(12).
Для заданных и фиксированных фондов поощрения g = задача определения оптимального механизма
пп
КС ц) = X У{ С&) = тах X У/(^)
г = 1 1 = {уг} г = 1
представляет собой п независимых однотипных задач нахождения оптимальных процедур планирования и стимулирования, для которых выполняются условия
У{ = У{ (&) = тах {у,. = у/Св/)!* 0, < g¿} (13)
и условия (7)—(12), [20, 21]. При этом обеспечивается выполнение планов и сообщение достоверной информации.
Замечание. Если функции Ф{Су, у{, g{•, г{) не зависят от ^ то величины у.(g{.) не убывают по ^. Это следует из выражения (13). ♦
Отсюда следует, что задачу выбора оптимальных фондов g * = {g*} = {g* (р)} можно поставить как задачу оптимального распределения ресурсов
при условии
X У{ С$(р)) ^ тах
г = 1
X £(р) < С.
г = 1
(14)
(15)
Как известно [23—25], в условиях неполной информации оптимальным является анонимный механизм последовательного распределения ресурсов. При этом он неманипулируемый, т. е. АЭ не заинтересованы сообщать искаженную информацию о своих потребностях в ресурсе.
Описанием этого механизма для рассматриваемой задачи распределения фондов поощрения.
Сначала для всех АЭ, исходя из выполнения
I . в,
Vг )
условий
Г/ = I (?, г; (?))Л и У/ = У/С£{.) =
= тах{у{ = у¡(£{. )|^ 0}, определяются величи-
ны g., т. е. они вычисляются в предположении, что
п
а
а
а
У
на них не наложены ограничения сверху вида (12). Затем определяются те АЭ, для которых < С/п. Обозначим 11 подмножество номеров таких АЭ. Для этих АЭ выделяется фонд поощрения, равный , / е /1. Далее процедура повторяется для оставшихся АЭ, / £ 11 и оставшегося общего фонда
С = С — X . Если элементов, для которых вы-
г е ¡1
полняется условие < С /п не найдено, то оставшийся фонд С распределяется между оставшимися АЭ поровну.
Совокупность представленных утверждений об оптимальности механизма [19—21], определяемого условиями (5), (7)—(12), (14) и (15), и оптимальности описанного механизма последовательного распределения фонда поощрения позволяет сформулировать теорему.
Теорема 1. Выражения (7)—(12), описывающие выбор процедуры планирования и системы стимулирования, в совокупности с анонимным механизмом последовательного распределения фонда поощрения определяют оптимальный механизм. Этот механизм является правильным, т. е. согласованным и не-манипулируемым.
Доказательство. Зафиксируем некоторое произвольное распределение £ = {,.} общего фонда поощре-
п
ния С, X £ ^ & Доказано [19—21], что для каждого г'-го
г = 1
АЭ при заданном фонде , механизм (8)—(12) оптимальный, т. е. достигаются максимальные значения у; = у;(,;), и правильный, т. е. обеспечивается выполнение планов и сообщение достоверной информации. Предложенный выше механизм последовательного распределения обеспечивает оптимальность и неманипулируемость. Отсюда следует, что механизм, представленный выражениями (7)—(12), в совокупности с упомянутым механизмом распределения фонда, является оптимальным и правильным.
4. ВЫБОР РАЗМЕРА ОБЩЕГО ФОНДА ПООЩРЕНИЯ
Рассмотрим теперь задачу синтеза согласованного механизма ц = {£.(•), п.(•), ¿.(л., у), С(-)}, при котором центр наряду с рассмотренными выше составляющими механизма дополнительно может выбирать и суммарный фонд поощрения С = С(р)
из отрезка 0 < С < Стах, где р — совокупность сообщений АЭ о параметрах г. При заданном механизме выбор сообщений р будем рассматривать как игру п лиц с функциями предпочтений
Ф/(п¡(р), г,) = а¡(п¡(р)) — С¡Сп¡(р), г,). Будем предполагать, что АЭ при выборе своих сообщений действуют независимо (бескоалиционная игра).
Пусть сначала зафиксирована некоторый размер общего фонда С. Применим для данного значения С рассмотренный выше механизм последовательного распределения фонда между АЭ. Разобьем множество I = {1, ..., п} всех номеров АЭ на два подмножества /МЗ и /НЗ, I = {1МЗ, 1НЗ}. В множество /МЗ входят номера всех АЭ, для которых
выделены фонды поощрения, равные , / е /МЗ. Назовем эти АЭ «максимально загруженными». АЭ с номерами из /НЗ назовем «незагружеными». В это множество входят все АЭ, получающие одинаковые фонды поощрения в соответствии с процедурой последовательного распределения фонда, равные
= (С -. X ^ /т,
¡МЗ
где т — мощность множества /НЗ, т. е. число «незагруженных» АЭ равно т, т < п.
Теорема 2. Оптимальный механизм определяется выражениями (7)—(12), процедурой пропорционального распределения фонда С. При этом оптимальное значение общего фонда С определяется как
п
1) С = X , если т = 0,
г= 1
2) С = Стах, если т > 0.
Доказательство. В первом случае, когда т = 0, т. е. все АЭ являются максимально загруженными,
п
С > X , при оптимальном механизме все АЭ по-
г = 1
лучают £г, г = 1, ..., и, в соответствии с рассмотренной выше процедурой последовательного распределения фонда. Следовательно, в оптимальном механизме меж-
п
ду АЭ будет распределен фонд С = X £.
г = 1
Рассмотрим второй случай. Пусть между АЭ распределяется некоторый фонд С. Активные элементы с номерами г е 1МЗ получают фонды поощрения £г. Оставшиеся АЭ с номерами из множества 1НЗ получают поровну из оставшегося фонда С — X £. При этом из
условий (13) следует, что при увеличении фонда г'-го АЭ, если г е 1НЗ, величина у; = y¡ (,), по крайней мере, не убывает. Таким образом, при увеличении фонда С до Стах эффективность механизма не уменьшается, отсюда следует С = Стах, если т > 0.
5. СОГЛАСОВАННЫЙ механизм при общем
ОГРАНИЧЕНИИ НА СОСТОЯНИЕ АКТИВНОЙ СИСТЕМЫ
Расширим рассматриваемую модель активной системы. Предположим, что имеется дополни -тельное балансовое ограничение на совокупный выбор состояний всех АЭ:
п
I ¿Л = В, (16)
, = 1
где и В заданные положительные величины.
Исследуем условия, при которых благодаря выбору размера общего фонда поощрения О = О(р) оптимальный механизм (7)—(12) позволяет обеспечивать балансовое ограничение (16), и при этом АЭ не заинтересованы манипулировать своими сообщениями при формировании общего фонда.
Для простоты ограничимся случаем, когда штрафы за невыполнение плана настолько сильные, что обеспечивается выполнение плана при всех допустимых значениях фондов £ = {я,}, т. е. в выражении (16) вместо состояний у, можно подставить планы
х, или
I йр. = В. Значения планов определяются
, = 1
соотношением (8) путем подбора размеров фондов я = {*,} так, чтобы I ¿, + I я,(р) = О(р) < Отах
, е Кл
, е Лт
и
& = я(р) = ( О(р) - I ¿, )/т
, е I,
МЗ
Обратим внимание, что в этом случае, вообще говоря, могут нарушаться и условия совершенного согласования (5), обеспечивающие сообщение АЭ достоверной информации, как доминантных стратегий в игре п лиц со стратегиями р,.
Очевидно, что обеспечить выполнение ограничения (16) путем подбора фондов £ = {£,} удастся не всегда, а только тогда, когда позволяют параметры модели, а именно диапазон выбора планов в выражении (8) в зависимости от фондов поощрения. Далее вопрос о реализуемости условия (16) оставим за скобками рассмотрения, а сосредоточимся на вопросе неманимулируемости сообщений.
Предположим, что выполняется гипотеза слабого влияния каждого отдельного АЭ на размер получаемого им фонда поощрения.
Заметим, что условие слабого влияния на цену ресурса было введено еще в работе [1] при исследовании некоторых моделей распределения ресурса в активных системах с несколькими АЭ. Была доказана оптимальность принципа открытого управления для систем с несколькими АЭ при сла-
бом влиянии сообщений на общий для всех АЭ параметр модели [17].
Для рассматриваемой в настоящей статье задачи гипотеза слабого влияния содержательно может быть сформулирована следующим образом. При заданном механизме ц, включающего в себя процедуру последовательного распределения фонда поощрения, изменение в сообщении каждого отдельного /-го АЭ, т. е. сообщение недостоверной информации, р, ф г,, приводит к столь малому изменению его выигрыша, что каждый отдельный АЭ, действующий независимо от других АЭ, отказывается сообщать недостоверную информацию.
Это согласуется с житейским опытом, что люди склоняются говорить правду в том случае, если обман не приносит значительной выгоды, т. е. моральные потери от завышения или снижения сообщаемой оценки превышают увеличение выигрыша АЭ. В связи с этим рассмотрим условия, при которых условие слабого влияния фонда приводит к слабому влиянию на размер выигрыша отдельного АЭ при попытке манипулировать сообщением.
Лемма. Функция предпочтения АЭ для рассматриваемой модели активной системы при механизме (7)—(12) непрерывно зависит и от его фонда поощрения.
Доказательство. Рассмотрим АЭ с номерами г е 1НЗ, так как для АЭ с номерами г е 1МЗ величины у; в рассматриваемом механизме принимают максимально возможные значения.
A. Из выражений (10) и (11) следует, что функция
поощрения а(х) непрерывна по х, так как гу'. (?) ограничена [19]. Следовательно, функция предпочтения Ф;(х;, г) непрерывна по х.
Б. Функция х; = л] (г) неубывающая и непрерывная по г; по построению. Кроме того, она непрерывна по у; в силу непрерывности и строгой квазивогнутости функции Ф ¡(у, у¡, g¡, г) и непрерывности функции ^в(г).
B. Величины у; непрерывно зависят от g¡. Это следует из строгой квазивогнутости функции Ф(у, у, g¡, г) и непрерывности функций Ф/у, у, g¡, г), ^в(г) и соотношения (6).
Из п. А, Б и В получаем непрерывность функции предпочтения ф/п/р), г) = а/п/р)) - ^(п/р), г) от величины g¡ как следствие суперпозиции непрерывных функций. Лемма доказана. ♦
Из непрерывности функции предпочтения АЭ от размера его фонда следует, что для любого заданного достаточно малого порога чувствительности 8 АЭ существует величина е5 такая, что
А^ рг) = ^ - ..., - Р р,, + Р ..., гп)| < £8.
Тогда при попытке искажения информации на величину |г, — рг] АЭ не увеличит свой выигрыш больше порога чувствительности и, следовательно,
он не будет заинтересован в сообщении ложной информации.
Теорема 3. При достаточно большом числе m незагруженных АЭ выполняются условия слабого влияния АЭ на выбираемый фонд поощрения и, таким образом, обеспечивается достоверность сообщаемой информации.
Доказательство. Справедливо Ag(r, р;) < ig/r^ ...,
ri - l, г], г. + J, ..., гл) - g.^ ..., г. - J, , г. + J, ..., гл)|. Отсюда получаем Ag.(r, р;) < |G(rJ, ..., r; - j, r], r; + j, ..., rn) -— G(rj, ..., r; - j, r", r; + j, ..., rn)|/m. В силу того, что величина AG = |G(rj, ..., r, - j, r], r, + j, ..., rn) — G(rj, ..., r, - j,
rH, r. + j, ..., rn)i ограничена, при достаточно большом числе m выполняется неравенство Ag(r, р;) < AG/m < sg. Теорема доказана.
ЗАКЛЮЧЕНИЕ
В работе [17] было введено понятие комплексных механизмов. Под таковыми понимаются механизмы, составленные, как в конструкторе, из простейших блоков, т. е. из некоторых базовых механизмов. Результаты настоящей статьи можно интерпретировать как построение оптимального комплексного механизма, составленного из механизмов: планирования, формирования штрафов за отклонение состояния от плана, поощрения АЭ за выбор состояния, распределения фонда поощрения между АЭ и, наконец, определения общего фонда поощрения. Отметим, что при выборе оптимальных «локальных» механизмов удается построить оптимальный комплексный механизм.
ЛИТЕРАТУРА
1. Бурков В.Н. Основы математической теории активных систем. — М.: Наука, 1977. — 256 с.
2. Еналеев А.К. Разработка механизмов стимулирования и управления в двухуровневых активных системах: автореф. дис. ... канд. техн. наук. — М.: МФТИ, 1980. — 18 с.
3. Бурков В.Н., Еналеев А.К., Кондратьев В.В. Двухуровневые активные системы. IV. Цена децентрализации механизмов функционирования // Автоматика и телемеханика. — 1980. — № 6. — С. 110—116.
4. Элементы теории оптимального синтеза механизмов функционирования двухуровневых активных систем. I. Необходимые и достаточные условия оптимальности правильных механизмов функционирования в случае полной информированности центра / В.Н. Бурков, А.К. Еналеев, В.В. Кондратьев, А.В. Цветков // Автоматика и телемеханика. — 1983. — № 10. — С. 139—144.
5. Элементы теории оптимального синтеза механизмов функционирования двухуровневых активных систем. II. Синтез оптимальных правильных механизмов функционирования в случае полной информированности центра / В.Н. Бурков, А.К. Еналеев, В.В. Кондратьев, А.В. Цвет-
ков // Автоматика и телемеханика. — 1984. — № 11. — С. 86—92.
6. Гермейер Ю.Б. Игры с непротивоположными интересами. — М.: Наука, 1978. — 327 с.
7. Бурков В.Н., Кондратьев В.В. Механизмы функционирования организационных систем. — М.: Наука, 1981. — 384 с.
8. Большие системы: моделирование организационных механизмов / В.Н. Бурков, Б. Данев, А.К. Еналеев и др. — М.: Наука, 1989. — 245 с.
9. Новиков Д.А. Стимулирование в организационных системах. — М.: СИНТЕГ, 2003. — 312 с.
10. Бурков В.Н, Новиков ДА Как управлять организациями. — М.: СИНТЕГ, 2004. — 400 с.
11. Новиков Д.А. Теория управления организационными системами. — М.: Изд-во физико-математической литературы, 2007.
12. Еналеев А.К., Казахбаева Г.У. Стимулирование эффективности управления производственными процессами / В кн.: Вопросы создания АСУТП и АСУП. — Алма-Ата: Каз. ПТИ им. В.И. Ленина, 1983. — С. 44—52.
13. Еналеев А.К, Лавров Ю.Г. Оптимальное стимулирование в активной системе со стохастическим элементом // Автоматика и телемеханика. — 1990. — № 2. — C. 104—113.
14. Бурков В.Н., Еналеев А.К., Новиков Д.А. Механизмы стимулирования в вероятностных моделях социально-экономических систем // Автоматика и телемеханика. — 1993. — № 11. — С. 3—30.
15. Бурков В.Н., Еналеев А.К, Новиков Д.А. Вероятностная задача стимулирования // Автоматика и телемеханика. — 1993. — № 12. — С. 125—130.
16. Bolton P., Dewatripont M. Contract Theory. — Cambridge, Mass & London, England: MIT Press, 2005. — 740 p.
17. Бурков В.Н., Еналеев А.К. Оптимальность принципа открытого управления. Необходимые и достаточные условия достоверности информации в активных системах // Автоматика и телемеханика. — 1985. — № 3. — С. 73—80.
18. Бурков В.Н, Еналеев А.К, Лавров Ю.Г. Синтез оптимальных механизмов планирования и стимулирования в активной системе // Автоматика и телемеханика. — 1992. — № 10. — C. 113—120.
19. Еналеев А.К. Оптимальный механизм функционирования в активной системе с обменом информацией // Управление большими системами. — 2010. — № 29. — С. 108—127.
20. Еналеев А.К. Оптимальность согласованных механизмов функционирования в активных системах // Управление большими системами. — 2011. — № 33. — С. 143—166.
21. Еналеев А.К. Оптимальные согласованные механизмы в активных системах и задачи теории контрактов // Управление большими системами. — 2014. — № 49. — С. 167—182.
22. Mas-Collel A, Whinston M.D. Green J.R. Microeconomic theory. — N.-Y.: Oxford Univ. Press, 1995. — 977 р.
23. Коргин Н.А. Неманипулируемые механизмы принятия решений в управлении организационными системами: автореф. дис... докт. техн. наук. — М.: ИПУ РАН, 2014. — 48 с.
24. Бурков В.Н, Коргин Н.А., Новиков Д.А. Введение в теорию управления организационными системами: учебник. — М.: Кн. дом «ЛИБРОКОМ», 2009. — 264 с.
25. Механизмы управления / Под ред. Д.А. Новикова. — М.: ЛЕНАНД, 2011. — 192 с.
Статья представлена к публикации членом редколлегии
В.Н. Бурковым.
Еналеев Анвер Касимович — канд. техн. наук,
ст. науч. сотрудник, Институт проблем управления
им. В.А. Трапезникова РАН, г. Москва,
® (495) 334-79-00, И anverena@mail.ru.