УДК 021.8 + 025.1 ББК 78.34
ОПТИМАЛЬНЫЙ МЕХАНИЗМ ФУНКЦИОНИРОВАНИЯ В АКТИВНОЙ СИСТЕМЕ С ОБМЕНОМ ИНФОРМАЦИЕЙ
Еналеев А. К.1
(Учреждение Российской академии наук Институт проблем управления РАН, Москва)
Для модели активной системы, состоящей из центра и активного элемента, в условиях неполной информированности центра о функции затрат активного элемента разработан оптимальный механизм функционирования. Оптимальный механизм включает в себя процедуру планирования и систему стимулирования, включающую две составляющие: поощрение за выполнение плана и поощрение за «напряженность» плана.
Ключевые слова: принцип открытого управления, достоверность информации, выполнение плана, согласование интересов.
1. Введение
Общая постановка задачи синтеза оптимального механизма функционирования в условиях неполной информированности центра и обмена информацией между активным элементом и центром была поставлена еще в ранней работе [1] по теории активных систем, однако полного решения этой задачи до сих пор нет. В настоящей работе предлагается решение этой задачи при достаточно естественных предположениях о множестве допустимых механизмов функционирования.
1 Анвер Касимович Еналеев, кандидат технических наук, старший научный сотрудник (anver.en@gmail.com).
108
Следует отметить, что задача синтеза оптимальных механизмов в теории активных систем рассматривалась для различных случаев и ранее. Так, например, в [4] описано решение этой задачи синтеза для случая полной информированности центра. В [2] доказана оптимальность принципа открытого управления при заданной системе стимулирования активного элемента. В [3] решена задача синтеза механизма функционирования при предположении о действии «сильных штрафов» за отклонение состояния активного элемента от плана. При этом фактически не рассматривался этап функционирования активной системы, связанный с выбором активным элементом своего состояния.
В настоящей работе, используя результаты [3], получено решение задачи синтеза оптимального механизма функционирования без предположения о «сильных штрафах», то есть решается в комплексе задача синтеза механизма функционирования (системы стимулирования за выполнение плана, системы стимулирования за «напряженность» плана и закона планирования), обеспечивающих максимальное значение критерия эффективности функционирования активной системы.
В работе показано, что оптимальный механизм функционирования принадлежит множеству механизмов, в котором используется принцип согласованного управления.
2. Модель и постановка задачи
Рассматривается активная система, состоящая из центра и активного элемента (АЭ). Пусть ^(х, у, г) = £(у, x) - С,(у, г) -целевая функция активного элемента, зависящая от выбираемого активным элементом состояния у, назначаемого центром плана (задания, норматива и пр.) x, параметра г, характеризующего функцию затрат С(У, г). Здесь £(у, х) - функция стимулирования АЭ, х є X = [хн, хв], у є У = [ун,ув], г є А = [гн, Г]. Далее для простоты примем хн = ун, хв = ув.
Обозначим как Ф(х, y, г) целевую функцию центра. Предполагается, что Ф(у, y, г) > Ф(х, y, г) > 0 и Ф(у, y, г) непрерывна и строго квазивогнута по y при всех г е A.
Будем предполагать, что план x назначается центром в соответствии с некоторой процедурой планирования x = п(.), где п(.) отображает множество A в множество X.
Совокупность процедуры планирования x = п(.) и системы стимулирования S(., .) составляет механизм функционирования Л = {п(.), S(., .)}. В теории активных систем, например [1], процедуру планирования принято называть также законом управления.
Введем предположения об информированности в рассматриваемой активной системе.
Активному элементу известно значение параметра г, а центру известно только множество A допустимых значений этого параметра. Предполагается также, что при заданном механизме функционирования л активный элемент сообщает центру оценку рпараметра г, ре A.
Пусть задан механизм л, тогда функционирование рассматриваемой активной системы описывается следующим образом: АЭ сообщает оценку р параметра г, затем в соответствии с процедурой планирования п(.) назначается план x = п(р), затем АЭ выбирает состояние y, стремясь максимизировать по y свою целевую функцию f(x, y, г).
Обозначим функцию предпочтения активного элемента j( x, г ) = max f (x, y, г ) и функцию предпочтения центра
yeY
Y(x, г) = min Ф(x, y, г),
yeZ (x, г)
где Z(x, г) - множество рациональных стратегий активного элемента при выборе состояния y (определение используемого в данной работе множества рациональных стратегий Z(x, г) приведено ниже).
Здесь и далее для простоты записей предположим, что соответствующие операции max и min определены.
Для заданного механизма функционирования л определим показатель его эффективности
(1) K (m ) = min[min Y (p( р), г ) / Y в (г )],
ге A ре Я(г)
где Я(г) - множество рациональных стратегий АЭ при выборе им сообщения р (определение множества Я(г) приведено ниже), Y^) - заданная нормирующая функция. В качестве нормирующей функции могут быть могут быть выбраны, например, следующие функции: YB (г ) = max Y (x, г), либо
xeX
Ye (г) = max Ф(x, x, г), либо YB (г) = const > 0.
xeX
Определим множества рациональных стратегий Z(x, г) и Я(г) в предположении о благожелательности АЭ.
Далее будем предполагать выполнение «слабого условия благожелательности АЭ», при котором множества рациональных стратегий АЭ имеют следующий вид:
{x}, если x е Arg max f (x, y, г),
yeY
Z (x, r ) =
{r}, если r є Argmax j(p(p), r)
Arg max f (x, y, г) в противном случае,
yeY
R(r) =
ре A
Arg max ф(ж(р), г) в противном случае.
ре A
Содержательно это условие означает, что если для АЭ сообщение достоверной информации является рациональной стратегией, то эта стратегия единственна, и, соответственно, если стратегия выполнения плана является рациональной, то она также единственна. Нетрудно убедиться, что «слабое условие благожелательности» выполняется, если справедливо «условие благожелательности», используемое в работах [5, 6], в которых предполагается, что второй игрок (АЭ) максимизирует целевую функцию первого игрока (центра) на множестве своих рациональных стратегий. При этом, как доказывается ниже, максимум целевой функции центра достигается при сообщении
достоверной информации и выполнении планов. Заметим также, что для справедливости результатов настоящей работы достаточно предположений о выполнения принятых в [5] «условий благожелательности».
Предположим, что функция затрат Z(x, r) дважды дифференцируема по х, дифференцируема по r и
Z\ (х, г) > 0, ZXx (х, г) > 0, zr (х, Г) < 0, d (х, г) < 0 при всех х е X, r е A.
Первые два неравенства указывают, соответственно, на возрастание функции затрат и ее выпуклость. Третье неравенство характеризует монотонность функции затрат по параметру r. Четвертое неравенство соответствует хорошо известным в микроэкономике условиям Спенса-Мирлиса [8], и характеризует, в рассматриваемом случае упорядоченность АЭ по возможным типам, задаваемым значениями параметра r, причем с увеличением типа, т. е. r, происходит снижение затрат и темпа роста затрат с ростом х.
Пусть функция стимулирования имеет вид S(y, х) = а(х) - с(х, у), где с(х, у) - функция штрафа за невыполнение плана, СУ, У) = 0, Сх, у) ^ 0; а(х) - функция поощрения за «напряженность» плана. Тогда целевую функцию АЭ можно записать в виде Дх, у, г) = а(х) - Z( У , г) - с(х, у).
Теперь, когда описан порядок функционирования активной системы и структура рассматриваемой модели, приведем постановку решаемой ниже задачи.
Требуется найти механизм /л такой, что
K (¿и*) = max K (и),
¿ueM
где множество допустимых механизмов функционирования задается условиями:
M = {и | 0 < с( х, у) £ h, 0 < s( х) < g, х = р(р), х е X, ре A} , здесь h - заданная величина максимально допустимого штрафа за отклонение реализации у от плана х, g - заданная величина максимального стимулирования за «напряженность» плана х, п(.) - непрерывные функции.
3. Оптимальные функции штрафов
Известно [2, 6], что оптимальной функцией штрафов на множестве функций, задаваемых условием 0 < с(х, у) < И, является функция
При этом множество согласованных планов определяется следующим образом Р(г) = {х е X| £(х, г) < И + ^(хн, г)}. Множество согласованных планов Р(г) включает в себя все планы х, которые активному элементу выгодно выполнять [2]. Таким образом, центр, назначая планы из множества Р(г), некоторым образом, согласовывает свои интересы с интересами АЭ.
Если план х удовлетворяет условию согласования х е Р(г),
* п/ \ * н * /—
то у = х, если же х ё Р(г), то у = х , где у - выбор состояния АЭ, т. е. у е 2(х, г).
Тогда функцию предпочтения АЭ можно записать в виде
Соответственно, функцию предпочтения центра можно представить в виде
Заметим, что в силу предположения Ф(у, у, г) > Ф(х, у, г) имеет место Ф(хн, хн, г) > Ф(х, хн, г). Но так как хн е Р(г), то выбором плана х = хн всегда можно обеспечить выбор активным
достаточно рассматривать в области определения х е Р(г), а следовательно достаточно рассматривать только те процедуры планирования п(.), значение которых принадлежит множеству Р(р).
При сделанных предположениях о функции затрат АЭ справедливо следующее
х\ X У)
И, если у ^ х,
0, если у = х.
элементом состояния у* = хн, т. е. функцию предпочтения центра
Утверждение 1. Множество Р(г) имеет вид Р(г) = [хн, хР(г)], где хР(г) - неубывающая непрерывная функция, дифференцируемая при всех значениях г е (гн, гв), кроме, быть может, одного.
Доказательство утверждения 1 приведено в приложении.
4. Оптимальные процедуры планирования
Известно [3], что оптимальная процедура планирования содержится в множестве процедур открытого управления.
По определению [3] процедура открытого управления пОУ(.) задается условием «совершенного согласования»:
(2) "ре А : (р(жОу (р), р) = тах ср( х, р),
хеХс
где Хс - устанавливаемое центром замкнутое подмножество множества X, не зависящее от сообщаемой АЭ оценки р.
В [3] доказано, что процедура открытого управления стимулирует АЭ сообщать достоверную информацию р = г, так как "р, г е А : (р(поу(р), г) < (р(поу(г), г).
Отсюда следует, что для процедур открытого управления функция предпочтения центра имеет вид ^(п (г), г).
Из этого свойства, а также из (1), вытекает
Утверждение 2. Для процедуры открытого управления, критерий эффективности (1) имеет вид
К (т) = тт[Ф (рОУ (г ), рОУ (г), г ) / ¥в (г )].
геА
Отметим, что из принятых выше предположений о свойствах функции затрат АЭ следует
Утверждение 3. Процедура открытого управления п (р) представляет собой неубывающую функцию, принимающую значения в множестве согласованных планов Р(р).
Доказательство утверждения 3 приведено в приложении.
Отсюда следует, что оптимальную процедуру планирования достаточно искать на множестве неубывающих функций.
5. Синтез оптимального механизма
Зафиксируем некоторое значение g показателя эффективности механизма /л. Введем в рассмотрение множество Ly всех неубывающих непрерывных функций ng.) таких, что Vr е A, x = py (r) е X: Y(x,r) > y Yb(r),
и множество Qy неубывающих непрерывных функций при выполнении также условия согласования x е P(r), т. е.
Vr е A, x = py (r) е P(r) : Ф(x, x, r) > y Yb (r) .
Справедливо следующее утверждение.
Утверждение 4. Предположим, что функция F(x, x, r) непрерывна и строго квазивогнута по x, и пусть g таково, что неравенство F(x, x, r) > gY^r) разрешимо в множестве X Vr е A, тогда множество всех точек (x, r), удовлетворяющих этому неравенству, можно представить в виде {(x, r) | qx(g, r) < x < qx(g, r), r е A, x е X}, где qi(y r) и q2(g, r) -непрерывные функции.
Доказательство утверждения 4 приведено в приложении. Рассмотрим функции
qi(g, r) = max qi(g, p), q^(g, r) = min qP (g, p),
r н <p<r r<p<re
где qP(g, p) = min{ q2(g, p), xP (p) }.
Очевидно, что q1(g, r) и q2(g, r) - неубывающие непрерывные функции.
Справедливо также следующее Утверждение 5. Если Qy Ф f, то
1) q1(g, r) < q2(g, r) при всех r е A,
2) Qg = Ny, где_
Ng = {x(r) 1 qi (g,r) < x(r) < q^y, r), x(r) е Qg, r е a}
Доказательство утверждения 5 приведено в приложении
Заметим, что N ^ N, если у1 > у2 . Пусть у такое, что
Ыг Ф ф. Обозначим а = #2(у,г Н) . Рассмотрим процедуру планирования
а, если гн < г < Ь [Ч\(у,г), если Ь<г < гв где р = гв, если а > ^ (у, гв), либо Ь определяется как решение уравнения д\(у,Ь) = а, если а < ^(у, гв) .
Ру(Г) = <{_
.Рис. 1. Структура оптимальной процедуры планирования
Заметим, что по построению Ру(г) является неубывающей непрерывной функцией и ее график является связным множеством. Отсюда следует, что существует функция ~у*(х), обратная
к ру (г) , определенная на множестве допустимых планов X за
исключением, быть может, счетного числа точек, при этом ~g (x) является неубывающей.
Теорема. Оптимальный механизм функционирования ц* определяется следующими выражениями
K (m) = g \
* | a, если rн < r < b,
(3) х = n/(r) = i- ( * ) b в
[ Ч\(g ,r), если b< r < r ,
. fh, если y Ф x,
c (x У) = *L
[0, если y = x,
0 при xн < x < a,
* rx * *
S (x) = i I z (t, r (t))dt при a < x < n , (rs ),
<i a ' /
при n**(rs ) < x < xs.
При этом показатель эффективности оптимального механизма функционирования * удовлетворяет условию g* = max { g | Qg Ф f}, откуда, в частности, следует требование
/* * н \
выполнения неравенства a > qx(g ,r ), а величина g должна удовлетворять условию
n t(r’ )
_ У
g = I Z't (t,rg*(t))dt < g .
Примечание. В математических выражениях в формулировке теоремы ({, ?**($)) обозначает частную производную по
первой переменной функции затрат АЭ.
Доказательство теоремы приведено в приложении.
Из доказательства теоремы также получаем два следствия. Следствие 1. с*(х) - неубывающая непрерывная функция. Следствие 2. Величина К(^) = у* не убывает с ростом g.
Заметим, что в некоторых приложениях, в случае использования дополнительного поощрения перевыполнения плана, более естественно в качестве функции штрафов использовать
* \И, если у < х,
функцию с (х, У) = \ а в качестве функции
[0, если у > х;
стимулирования за напряженность плана - функцию
ч |ст(х), если у > х,
о (х,у)
[0, если у < X.
В содержательных терминах теорема показывает, что для рассмотренной модели активной системы, как и в условиях полной информированности центра, выполнение планов обеспечивается применением максимальных штрафов, а процедура планирования конструируется таким образом, чтобы наиболее «экономично» использовался фонд стимулирования для обеспечения «выгодности» назначаемых планов.
В [6, 7] задача синтеза оптимальной стратегии первого игрока (центра) решена для случая, когда целевая функция центра не зависит от значения неизвестного параметра г, но в гораздо более слабых предположениях о свойствах целевых функций игроков (центра и АЭ), а именно, в этих работах предполагалась только непрерывность целевых функций игроков. Полученное в [6, 7] при таких слабых предположениях решение задачи выглядит достаточно громоздким и сведено к решению серии задач поиска экстремумов целевых функций игроков на специально построенных множествах, которые могут иметь очень сложную структуру.
Использование в настоящей статье ряда предположений о свойствах целевой функции АЭ: разделение целевой функции на систему стимулирования и функцию затрат, предположение о свойствах первых и вторых производных функции затрат АЭ, позволило доказать монотонность решений (утверждения 1 и 3). Эти свойства решений позволили найти в достаточно конструктивном виде решение задачи синтеза оптимального механизма функционирования для рассмотренной модели активной системы.
6. Заключение
Обратим внимание на структуру полученного оптимального механизма функционирования. При малых значениях параметра г, а именно, при гн < г < Д устанавливается независимо от г фиксированный план х = а (центр является «диктатором»), при Д < г < гв устанавливается «выгодный» для АЭ план («диктатором» является АЭ).
Для обеспечения выполнения плана применяется функция штрафов, где величину Н можно интерпретировать как «степень централизации» механизма. Поощрение о (х) имеет следующую структуру. При хн < х < а, а по сути, при х = а, о(х) = 0, т. е. действуют только штрафы (действует централизованное управление). При х > а начинает действовать составляющая функции поощрения, которую можно интерпретировать как согласование интересов АЭ и центра. Поэтому величину g, определяющую возможности согласования, можно рассматривать как степень согласованности интересов (действует принцип согласования целевых функций). И, наконец, величину неопределенности |гв - гн| можно рассматривать как степень неопределенности.
Таким образом, для конкретных моделей активных систем можно исследовать и, при возможности, выбирать соотношение таких показателей, как степень централизации, степень согласования интересов и степень неопределенности.
Приложение
Доказательство утверждения 1. Р(г) Ф ф, так как хн е Р(г) при г е А Заметим, что Р(г) выпукло. Это следует из выпуклости функции затрат <^(х, г) по х на [хн, хв].
Зафиксируем произвольную точку г0 е (гн, гв).
Если ^(хв, г0) < Н + ^(хн, г0), то в силу теоремы о промежуточном значении существует точка х0 е (хн, хв) для которой фю, г0) - Н - ^(хн, г0) = 0.
Положим Цх) = £(х, г0) - Н - ^(хн, г0) = 0.
3
Производная —у(х0,г0) = %'х(х0,г0) > 0. Так как эта произ-
3х х
водная отлична от нуля, то в силу теоремы о неявной функции в некоторой окрестности точки г0 определена непрерывная функция и, такая, что Ци(г), г) = 0. Эта функция дифференцируема при г = г0, и ее производная равна
и'(г0) = -3- (x0, г0)/(^ го) > 0.
3г 3х
В силу непрерывности, в некоторой, быть может, меньшей окрестности точки г0 выполняется неравенство и (г) < гв, и поэтому в этой окрестности х(г) = и(г) (в силу неравенства С (х, г) > 0). Отсюда следует дифференцируемость и монотонность функции хР(г) в точке г = г0.
В частности отсюда следует также то, что существует не более одной точки г* е (гн, гв) для которой
£(х0, г*) - Н - ^(хн, г*) = 0. Если такой точки не существует, то утверждение, очевидно, справедливо. Если же такая точка существует, то хР(г) = и(г) при г < г , а для таких точек утверждение уже доказано; при г > г имеем хР(г) = хв и функция хР(г) имеет нулевую производную. В точке г функция хР(г) может быть негладкой. Утверждение доказано.
Доказательство утверждения 3. пОУ(р) является неубывающей, если из Р\ < р2 следует
пОУ(р1) < пОУ(р2). Предположим противное, т. е.
ОУ / \ \ ОУ / \ т->
ж (р\) > ж (р2). В соответствии с условием «совершенного согласования» запишем следующие неравенства: ф^Р)^) > ф(жОУ(р2),р1),
Ф(ЖОУ(Р2),Р2) > фЖ^^р)..
Так как рассматриваются процедуры планирования из множества Р(р), то условия «совершенного согласования» можно записать в виде:
о(жОУ(Р1) - С(жОУ(Р1), Р1) > о(жОУ(Р2) - С(жОУ(Р2\ Р1), о(жОУ(Р2) - С(ЖОУ(Р2),Р2) > о(жОУ(Р1) - С(ЖОУ(Р1),Р2).
Сложив эти неравенства, получим
ZXbPl) - <Т(ХьР2) < Z(X2, Pl) - Z(X2, Pt)-
Здесь Xi = noy(pi), Xi = noy(pi).
Из полученного неравенства следует £ (x1, p) > Z (x2, P) при некотором значении p e [p1, p2 ]. Но это противоречит при x1 > x2 предполагаемому свойству функции затрат Z (x, r) < 0 . Таким образом доказано, что пОУ(р) является неубывающей функцией.
Доказательство утверждения 4.
Пусть ун = min Ф(xH, xH, r) /max Ye(r).
reA / reA
Очевидно, что Ф(xн,xн,r) > y^r), следовательно, существует такое число y = ун , при котором
xн e lg (r) = {x e X|Ф(x, x, r) > yH Ye (r)}ф ф при "r e A.
Заметим также, что если имеются два значения у1 и y2, Yi < ут, такие, что lg (r) Ф ф, g (r) Ф ф, то g (r) i lg (r).
Итак, пусть задано некоторое число у, при котором неравенство Фф, x, r) > yx¥e(r) разрешимо в множестве X при "r e A.
Выберем произвольное ro e A- Из квазивогнутости и непрерывности функции Ф(x, x, r0) вытекает выпуклость и замкнутость множества lg(r0) = {x e X|ф(x, x, r0) > g Ye (r0)}, следовательно, множество ly(r0) можно представить в виде отрезка qi(y, r0) < x < q2(y, r0).
В силу строгой квазивогнутости функции Ф^, x, r) на отрезке x e X = [xн, xв ] величины qi(y, r0) и q2(y, r0) однозначны и в силу непрерывности функций Ф^, x, r) и ¥e(r) неравенство Ф(q1(y, r), qj(y, r), r) > yx¥e(r) выполняется для всех r достаточно близких к r0. Поэтому существуют ri < r0 и r2 > r0 такие, что на отрезке [ri; r2] условия Ф(q1(y, r), qi(y, r), r) > y¥e(r) определяют однозначную функцию q1(y, r). В силу непрерывности функций Ф^, x, r) и ¥e(r) график этой функции замкнут. Тогда, в силу леммы о замкнутом графике функция q1(y, r) непрерывна на
[г1, г2]. Поскольку точка г0 выбиралась произвольно, функция д1(у, г) непрерывна на всей области определения, г е А. Непрерывность функции д2(у, г) доказывается аналогично.
Доказательство утверждения 5. Согласно утверждению 4 множество Qy представляет собой множество неубывающих функций ж(г), удовлетворяющих условию "г е А, х = р(г) е Р(г): (у, г) < р(г) < д2 (у, г).
Требуется доказать, что Qy = Ыу, то есть для всех рг) е Qу выполняется q\(у, г) < р(г) < q (у, г). Предположим противное, т. е. 3 г' е А такое, что ql(у,г') > р(г"). По определению функции q\ (у, г ’), либо q\(у, г') = q\(у, г ’) , либо существует точка г ' такая, что г " < г ' и ql(у,г’) = q\(у,г") . В первом случае из #\(у, г’) > ж(г') следует ql (у, г') > р(г"), что противоречит принадлежности закона управления р(г" ) множеству Q7, а именно, выполнению условия q\(у, г" ) < р(г") < q2(у, г" ).
Во втором случае из того, что р(г) е Qу, следует
р(г") > (у, г") = q\ (у, г'), но по предположению
^(у, г') > р(г" ) получаем ж(г") > р(г') при г" < г', что противоречит предположению о неубывании функций ж(г) из множества Qy. Таким образом, доказано, что q\ (у, г) < р(г) . Аналогично доказывается р(г) < q2(у, г). Отсюда следует
справедливость пункта 2) утверждения, из которого следует также справедливость пункта 1) утверждения.
Доказательство теоремы. Зафиксируем некоторое значение у, при котором множество Му Ф ф. Рассмотрим некоторую
произвольную процедуру планирования ру (.) е Ыу. Заметим,
что жу(.) - неубывающая непрерывная функция, принимающая значения в множестве Хс = [ж7(гн), ж7(гв)].
Поставим сначала задачу нахождения функции поощрения а(х) такой, чтобы рассматриваемая процедура планирования жу(.) являлась процедурой открытого управления, т. е. удовлетворяла условию совершенного согласования (2), или "р е А : (р(Жу (р), р) = тах <р(х, р).
хєХс
Запишем необходимые условия экстремума функции предпочтения ф(х, г) = а(х) - £(х, г), в приведенном выше условии совершенного согласования.
Эти условия в предположении о существовании субдифференциала 3ст( х) имеют вид
(4) "ре А, хе Хс : С'"(х,р) е3ст(х).
Рассмотрим функцию
&( х) =
при х < л(тн),
С + I (ґ,г у(ґ))А, при пу(тн) < х< р(гв),
с + I С/(^,?у(*))Ж, при х > р(гв),
р (гн)
где гу(х) - функция, обратная ж7(о), С - произвольная константа.
Заметим также, из того, что С"(^,г у($)) > 0, следует, что сг( х) - неубывающая непрерывная функция.
Рассмотрим точки области определения этой функции, в которых субдифференциал не определен. Это точки, в которых функция стимулирования ст( х) недифференцируема в обычном смысле и локально невогнута. Покажем, что в этих точках не может выполняться условие совершенного согласования (2). Рассмотрим малую окрестность (хс —8, х + 8), где 3 - достаточ-
но малое положительное число, в которой функция s( x) строго локально невогнута. Рассмотрим два случая. В первом случае пусть s(x + d) - s(x) > Z(x + d, p) - Z(x). Отсюда получаем j( X + d, p) > j(jc, p), т. е. в точке x условие совершенного согласования не выполняется. Во втором случае, когда s(x + d) - s(X) < Z(X + d, p) - Z(X), из условия строгой локальной невогнутости функции s(x) в окрестности точки X следует s(x) -s(x -d) < s(x + d) -s(x). Но тогда существует достаточно малое число d > 0, при котором s(X) - s(X - d) < Z(X - d, p) + Z(X, p), следовательно s(X)-Z(X,p) <s(X-d)-Z(X-d,p), т. е.
j(X - d, p) > j(X p).
Таким образом, во втором случае условия совершенного согласования также не выполняются.
Следовательно, в точке X условия совершенного согласования не соблюдаются, и ее можно исключить из рассмотрения.
Подставляя функцию s( x) в (4), получаем справедливость необходимых условий для выполнения соотношения (2) совершенного согласования для x = nY(p)
Поскольку искомая функция поощрения должна удовлетворять условию 0 < s(x) < g, константу С следует выбрать равной нулю, C = 0.
Рассмотрим функцию pg(r), определяемую выражением (3).
Обозначим через rg (t) - функцию, обратную к пу (г) .
Рассмотрим разность
Dr = S(p( гв)) - s(pg(rв)) =
p(.r‘) p(r‘)
= J Z't(t,r7(t))dt- J Z(t,r*(t))dt = I + A1 + ¡2.
p( rH ) p( r“ )
Здесь
р (гн)
/\ = | с;(;, у (;м,
р,(г“)
ру*( г‘)
а1 = | ш,у®)—С(;,~утл,
ж**(гн)
Ру( г‘ )
12 = | С/(;, у (;М.
р**( У)
Из жу(гн) < ру(гн) = а и ру(гв) = я(у,гв) < жу(гв) следует 1\ > 0, 12 > 0 .
Рассмотрим величину А1. Так как жу(г н) < ру*(гн ) и ру(г 6 ) > ж у (гв), а также в силу того что функции к7(г) и жу (г) непрерывные и неубывающие, существует точка г' е [г н, гв ], для которой ру(г ) < ру*(г') при всех г < г' и
ру(г ) > ж у (г" ) при всех г > г '. Отсюда следует, что гу(Х) < гу*(^) для всех ; е [ ж*у(гн),ж*у(гв)]. Докажем этот факт от противного, то есть предположим, что существует х е [жу (гн), ж*у (гв)] такое, что ~ (х) > ту* (х). Заметим, что
х = жу (~ (х)) и х = ж*у (гу (х)). В силу г' < ~ (х) и определения точки г' имеем ж(~,(х)) > ж*(гу(х)). Следовательно, ж*у (гу (х)) > ж* (Гу (х)) , где ~ (х) > Г у (х) по предположению. Полученное неравенство противоречит монотонности функции п*(г). Таким образом, доказано, что гу(;) < гу*^). Отсюда и из того, что С (х,г) < 0, следует, что А1 > 0. Отсюда получаем Ау > 0. Следовательно,
<?(ру (гв)) > &(р*у(гв)).
Из того, что Ng i Ng2 для g > g2, следует, что
S(pgi(rв))>cr(p*g^(rв)). Увеличивая у до некоторого значения
у*, получим либо Ng = ф , либо &(pg,(rв)) = g .
В случае Ng* = f максимальное значение функции поощрения будет равно &(pg> (rв)) = g .
Теорема доказана.
Литература
1. БУРКОВ В. Н. Основы математической теории активных систем. - М.: Наука, 1977. - 256 с.
2. БУРКОВ В. Н., ЕНАЛЕЕВ А. К. Оптимальность принципа открытого управления. Необходимые и достаточные условия достоверности информации в активных системах // Автоматика и телемеханика. - 1985. - №3. - С. 73-80.
3. БУРКОВ В. Н., ЕНАЛЕЕВ А. К., ЛАВРОВ Ю. Г. Синтез оптимальных механизмов планирования и стимулирования в активной системе // Автоматика и телемеханика. - 1992. - №10. - C. 113-120.
4. БУРКОВ В. Н., КОНДРАТЬЕВ В. В. Механизмы функционирования организационных систем. - М.: Наука. 1981. -384 с.
5. ГЕРМЕЙЕР Ю. Б. Игры с непротивоположными интересами. - М.: Наука, 1978. - 327 с.
6. ГОРЕЛИК В. А., КОНОНЕНКО А. Ф. Теоретико-игровые модели принятия решений в эколого-экономических системах. - М.: Радио и связь, 1982.
7. КОНОНЕНКО А. Ф. Роль информации о функции цели
противника в играх двух лиц с фиксированной последовательностью ходов // ЖВМиМФ. - 1973. - №2. -
C. 311-317.
8. MAS-COLLEL A., WHINSTON M. D. GREEN J. R. Microeconomic theory. - N.Y.: Oxford Univ. Press, 1995.
OPTIMAL MECHANISM FOR AN ACTIVE SYSTEM WITH COMMUNICATION
Anver Enaleev, Institute of Control Sciences of RAS, Moscow, Cand.Sc., chief research officer (anver.en@gmail.com).
Abstract: For an active system consisting of a principal and a single agent where the principal has incomplete information about the cost function of the agent the optimal mechanism is developed. Optimal mechanism includes both planning and incentive schemes. Incentive scheme consists of two components: a reward for plan execution, and a reward for plan tightness.
Keywords: open control principle, information reliability, plan execution, coordination of interests.
Статья представлена к публикации членом редакционной коллегии В. Н. Бурковым