Научная статья на тему 'ОПТИМАЛЬНОСТЬ СОГЛАСОВАННЫХ МЕХАНИЗМОВ В СЕТЕВЫХ ОРГАНИЗАЦИОННЫХ СТРУКТУРАХ'

ОПТИМАЛЬНОСТЬ СОГЛАСОВАННЫХ МЕХАНИЗМОВ В СЕТЕВЫХ ОРГАНИЗАЦИОННЫХ СТРУКТУРАХ Текст научной статьи по специальности «Математика»

CC BY
38
5
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Проблемы управления
ВАК
Область наук
Ключевые слова
ИЕРАРХИЯ / СЕТЕВАЯ СТРУКТУРА / РАЗРАБОТКА МЕХАНИЗМА / ОПТИМИЗАЦИЯ / СОГЛАСОВАНИЕ / РАВНОВЕСИЕ / УСТОЙЧИВОСТЬ / НЕМАНИПУЛИРУЕМОСТЬ / HIERARCHY / NETWORK STRUCTURE / MECHANISM DESIGN / OPTIMIZATION / COORDINATION / EQUILIBRIUM / SUSTAINABILITY / NON-MANIPULATION

Аннотация научной статьи по математике, автор научной работы — Еналеев А.К.

Рассмотрены задачи построения оптимальных механизмов управления системой связанных между собой агентов в условиях неполной информированности управляющего органа (центра) о параметрах агентов. Связи агентов этой системы представлены в виде ориентированного графа, не содержащего контуров. Агенты имеют собственные цели и передают центру информацию о своих параметрах, которую они могут намеренно искажать, если им это выгодно. Центр управляет поведением агентов. Поведение агентов заключается в сообщении центру информации о своих параметрах и выборе своих состояний. От выбранного каким-либо агентом состояния зависят возможности выбора состояний последующих агентов. Структура предшествования агентов определяется заданным ориентированным графом. Управление центра заключается в выборе механизма, включающего в свой состав процедуры планирования в виде функций, зависящих от полученной от агентов информации, и системы стимулирования. Система стимулирования состоит из функций штрафов за отклонение состояния агента от плана и функций поощрения агентов за выбор состояния. Построены оптимальные механизмы, при которых агенты не заинтересованы манипулировать сообщаемой центру информацией и реализацией планов. Определены условия согласования, обеспечивающие такое поведение агентов без уменьшения оптимального значения целевой функции центра. Результаты исследования могут применяться для управления реализацией сложных проектов или сборочных производств.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Еналеев А.К.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

OPTIMALITY OF THE INCENTIVE COMPATIBLE MECHANISMS IN NETWORK ORGANIZATIONAL STRUCTURES

The paper considers the problems of optimal control mechanisms design for an interconnected agents system provided incomplete awareness conditions of the governing body (center) about the parameters of agents. A directed graph that does not contain contours presents the connections of the agents in this system. Agents have their own goals and transmit information about their parameters to the center. They can intentionally distort data if distortion is beneficial to them. The center controls the behavior of agents. The behavior of agents is to inform the center about their parameters and the choice of their states. The ability of subsequent agents to select their states depends on the state selected by a preceding agent. The given directed graph determines the precedence structure of agents. The center’s management consists of choosing a mechanism that includes planning procedures in the form of functions that depend on the information received from the agents and the incentive system. The incentive system consists of the functions of fines for deviating the state of the agent from the plan and the functions of encouraging agents for choosing the state. Optimal mechanisms are designed in accordance with which agents are not interested in manipulating the information communicated to the center and the implementation of plans. Conditions of incentive compatibility are determined that ensure this behavior of agents without decreasing the optimal value of the objective function of the center. The results of the study can be useful in managing the implementation of complex projects or assembly plants.

Текст научной работы на тему «ОПТИМАЛЬНОСТЬ СОГЛАСОВАННЫХ МЕХАНИЗМОВ В СЕТЕВЫХ ОРГАНИЗАЦИОННЫХ СТРУКТУРАХ»

У

правление в социально-экономических системах

УДК 330.4 + 519.86 + 519.83 + 334.027 РС!: http:/^do^.org/10.25728/pu.2020.1.3

ОПТИМАЛЬНОСТЬ СОГЛАСОВАННЫХ МЕХАНИЗМОВ В СЕТЕВЫХ ОРГАНИЗАЦИОННЫХ СТРУКТУРАХ1

А.К. Еналеев

Аннотация. Рассмотрены задачи построения оптимальных механизмов управления системой связанных между собой агентов в условиях неполной информированности управляющего органа (центра) о параметрах агентов. Связи агентов этой системы представлены в виде ориентированного графа, не содержащего контуров. Агенты имеют собственные цели и передают центру информацию о своих параметрах, которую они могут намеренно искажать, если им это выгодно. Центр управляет поведением агентов. Поведение агентов заключается в сообщении центру информации о своих параметрах и выборе своих состояний. От выбранного каким-либо агентом состояния зависят возможности выбора состояний последующих агентов. Структура предшествования агентов определяется заданным ориентированным графом. Управление центра заключается в выборе механизма, включающего в свой состав процедуры планирования в виде функций, зависящих от полученной от агентов информации, и системы стимулирования. Система стимулирования состоит из функций штрафов за отклонение состояния агента от плана и функций поощрения агентов за выбор состояния. Построены оптимальные механизмы, при которых агенты не заинтересованы манипулировать сообщаемой центру информацией и реализацией планов. Определены условия согласования, обеспечивающие такое поведение агентов без уменьшения оптимального значения целевой функции центра. Результаты исследования могут применяться для управления реализацией сложных проектов или сборочных производств.

Ключевые слова: иерархия, сетевая структура, разработка механизма, оптимизация, согласование, равновесие, устойчивость, неманипулируемость.

ВВЕДЕНИЕ

Рассматривается система, состоящая из управляющего органа (далее — центра) и нескольких подчиненных ему агентов. Задача центра — путем выбора управляющих воздействий влиять на агентов, добиваясь желаемого их поведения. Центр имеет ограниченную информацию о параметрах агентов, но может запрашивать информацию о значениях этих параметров у самих агентов. Агенты, помимо сообщений центру о значениях их параметров, выбирают также свои состояния. Множество допустимых состояний агента может зависеть

1 Исследование выполнено при частичной финансовой поддержке РФФИ и ОАО «РЖД» в рамках научного проекта № 17-20-05216.

от состояний некоторых других агентов. Таким образом, состояния некоторых агентов определяют множество допустимых состояний рассматриваемого агента и, по существу, представляют собой входные параметры. Такая взаимосвязь агентов образует сеть, описывающую структуру отношений предшествования при выборе состояний агентами. На практике такие системы могут описывать процессы изготовления деталей и сборки из них сложного изделия. В рассматриваемой далее модели будем предполагать наличие интересов у агентов, зависящих от выбираемых в системе состояний. Ставится задача выбора центром механизма управления сетью агентов для достижения заданной цели. Под механизмом управления понимается совокупность процедур планирования, поощрения и штрафов, посредством выбора которых центр воздействует на интересы агентов.

Модель исследуется с помощью терминологии, понятий и методов теории активных систем [1—4]. В этой теории принято называть подчиненных центру агентов активными элементами системы. Поскольку авторы работ [5—7] и многих других публикаций в рамках этой теории при рассмотрении аналогичных моделей оперируют понятием «агент», будем пользоваться этим термином.

Модели сетевых активных систем исследовались в работах [8, 9] для случая полной информированности центра о моделях агентов. Для случая неполной информированности центра задача построения оптимальных комплексных механизмов управления, включающих в свой состав процедуру планирования, функции штрафов и поощрений, распределения общего фонда поощрения между агентами для системы, в которой агенты связаны друг с другом только общим фондом поощрения, была рассмотрена в статье [10]. Отметим, что задачи синтеза неманипулируемых механизмов управления в многоагентных активных системах изучены достаточно полно только для задач распределения ресурсов и активной экспертизы [4—7, 11]. В работе [11] представлен подробный обзор и анализ исследований в этой области.

В предлагаемой работе приводится обобщение результатов этих исследований активной системы при наличии технологических связей между агентами, образующих сетевую структуру без контуров. Результаты исследования моделей организационных механизмов в системах, состоящих из агентов, связанных друг с другом сетевой структурой, могут быть применены на практике при разработке организационных механизмов, стимулирующих выполнение комплекса связанных между собой работ и проектов.

1. МОДЕЛЬ И ПОСТАНОВКА ЗАДАЧИ

1.1. Модель

Рассматриваемая модель расширяет и обобщает модели, описанные в статьях [10, 12, 13]. Пусть система состоит из центра и п связанных между собой агентов, где п > 1. Для п = 1 исследование было проведено в статьях [12, 13]. Обозначим у. состояние 1-го агента, которое он выбирает из

множества допустимых состояний У. = у.( у1), где у1 = у, у е У1, — набор состояний агентов с номерами из множества У1. Здесь У1 — множество номеров агентов, от состояний которых зависит множество допустимых состояний 1-го агента. Заметим, что если множество У1 допустимых состояний /-го агента не зависит от состояний других агентов, то У1 = 0. Рассматриваемая модель системы взаи-

модействующих друг с другом агентов представима в виде ориентированного графа, в котором агентам сопоставлены вершины графа, а связям между

агентами, определяемым множествами У1, — дуги этого графа. Будем предполагать, что агенты связаны между собой таким образом, что в соответствующем графе нет контуров. Показано, что в сети без контуров можно так перенумеровать и упорядочить вершины, что у < /, если у е У1 [14]. Поэтому будем считать, что агенты пронумерованы так, что множество допустимых состояний /-го агента может зависеть только от состояний агентов с меньшими номерами. Такая нумерация вершин называется правильной [14]. Заметим, что в системе присутствуют агенты, по крайней мере агент с номером / = 1, множество допустимых состояний которых не зависит от состояний других агентов, и номера этих агентов равны / = 1, ..., п0, где п0 < п,

и для / < п0 имеет место У1 = 0. Будем называть эти агенты начальными. В системе имеются также агенты, по крайней мере агент с номером п, от состояния которых не зависит множество допустимых состояний ни одного агента. Будем называть такие агенты конечными. Пусть номера этих агентов начинаются с номера п*, п0 < п* < п.

Обозначим Дхг, у;, г) целевую функцию /-го агента. Здесь х. — назначаемый центром /-му агенту план из множества его допустимых состояний

У = У( X1), где X1 = (х., у е У1) — набор планов, со-11 }

ответствующий набору состояний у1 = (у, у е У1), г; — параметр, характеризующий /-го агента, Л. — множество допустимых значений параметра гр / = 1, ..., п. Примем, что целевые функции агентов представимы в виде Дх., у., г.) = ¿.(х., у.) - ^(у., г.), где ^-Су, гг) — функции затрат агентов при выборе ими состояний у; 51(х1, у.) = аг(у) - х1(х1, у) — функции стимулирования за выбор агентом состояния у. при плане х;. Пусть а (у) — функции поощрения за выбор состояния у;, а х1(х1, у.) — функции штрафов за отклонение состояния у; от плана хг; 0 < а (у) < где g¡ — заданный центром фонд поощрения /-го агента. Сначала будем считать, что g¡ являются параметрами, а в конце статьи рассмотрим расширение задачи, когда они являются управлениями центра. Примем х1(х1, у) > 0, %г(у., у) = 0. Предположим, что функции а (у) полунепрерывны сверху, а х1(х1., у) — полунепрерывны снизу.

Можно воспользоваться следующей интерпретацией: показатели состояния у. характеризуют в некотором содержательном смысле уровень качества выполненных агентом работ либо некоторый

другой скалярный показатель эффективности агента. Поэтому примем, что множества допустимых

состояний описываются отрезками ^ = У') =

г Ь и Ь и и/-1\

= [У , У{ (У )], где у- и у1 = у1 (у ) представляют

собой соответственно нижние и верхние границы допустимых значений состояний агентов. Аналогично, предполагая, что параметр г. представляет собой некоторую внутреннюю обобщенную характеристику агента, например, показатель производительности, примем г. е [ гЬ, ги ]. Здесь индексы «X» и «и» означают заданные нижние и верхние границы отрезка А. = [ гЬ, ги ]. Предположим, что

функции уи = уи (у1) не убывают по своим аргументам.

Пусть функции затрат ^-Су, г) дважды дифференцируемы по у., дифференцируемы по г. и существуют производные (у, г) и ^(у, г). Предположим, что су (У, г) > 0, ^ (У, г) > 0, С (у, г) < 0, Суг (у, г) < 0 при всех допустимых значениях аргументов. В этих неравенствах для простоты записи индекс / опущен.

Неравенства (у, г) > 0 и ^ (у, г) > 0 свидетельствуют о возрастании функции затрат и ее выпуклости. Неравенство (у, г) < 0 указывает на монотонность снижения затрат по параметру гг Неравенство (у, г) < 0 отражает известные в микроэкономике условия Спенса — Мирлиса и характеризует упорядоченность агентов по возможным значениям параметра гр когда с увеличением г. снижается темп роста затрат, связанных с увеличением у..

Обозначим целевую функцию центра Ф (Х, у, г) = X ф/(%/, у1, у, гг)/Ф0 (у1, Г), где Ф/у, у1,

г = 1,..., п

уг, г) — показатель эффективности состояния у. /го агента при заданных значениях входных показателей у1 и плане *, Ф0 (у1, гг) — функции нормировки, % = (%1, ..., %п), у = (ур ..., уп), г = (гр ..., гп)

и Фг(%г, у1, уг, гг) = Ф.(%., у., гг) при / = 1, ..., п0. Для общности здесь введена зависимость целевой функции центра от параметров г = (г1, ..., гп). Функции нормировки выбираются центром, исходя из желания, например, рассматривать «удельную эффективность» по отношению к максимальной эффективности при каждом значении параметра г. по каждому слагаемому. Примерами

функций нормировки могут служить Ф0 (у1, гг) = = тах Ф/Хр у1, %г, гг) или Ф0 (у1, гг) = 1. В пер-

х, е У, (у, г,)

вом случае нормирующая функция характеризует

максимальное значение составляющей Ф1(%1, у1, у., г) при безусловном выполнении плана и известном значении параметра г.. Во втором случае

имеем Ф (Х, у, г) = = Ф(Х, у, г) = X Ф/*, у',

1 = 1,..., п

у? г1).

Предположим, что

Ф^р у 1, уР Г) > Фг(х1, у 1, у!, г1) > 0. (1) Условия (1) означают наличие потерь центра в

размере Ф.(у, у1, у., гг) - Ф.(х., у1, у., гг) при невыполнении плана, так как его целевую функцию

можно представить в виде Ф1(х1, у1, у, гг) = Ф1-(у1, у1,

уг, гг) - [Ф1(у1, у1, у, гг) - Ф1(х1, у1, у, гг)]. Условиям (1) можно дать и такую интерпретацию: для заданного реализованного состояния у. «выигрыш» центра не уменьшается при назначении плана х1 = у..

Планы х1 устанавливаются центром в соответствии с некоторыми выбранными им процедурами планирования пг(*), где пг(*) отображает множест-

п

во А в множество 11; пг: А ^ 11, где А = П А1 — де-

1 = 1

картово произведение множеств А1. Будем предполагать, что отображения п1(*) кусочно-непрерывны.

Набор процедур планирования * = п1(*) и функций стимулирования 51(х1., у1), / = 1, ..., п, определяет механизм функционирования ц = {п1.(*),

^ -)}| пОпишем порядок функционирования системы и предположения об информированности центра и агентов.

Агенту с номером / известно точное значение параметра г1, а центру известны только множества А1 допустимых значений этих параметров. Функционирование рассматриваемой активной системы описывается следующим порядком ходов. На первом шаге центр выбирает механизм ц и сообщает его агентам, на втором шаге агенты сообщают центру оценки р. параметров г1, р. е А1. На основании полученных оценок р. от всех агентов в соответствии с процедурой планирования центр назначает и сообщает агентам планы * = п1( р), где

р = (рх, ..., ри). Затем агенты в последовательности ходов, определяемой нумерацией агентов и упорядоченной сетевой структурой связей между ними, выбирают состояния у1, стремясь максимизировать по у. свои целевые функции 1/1(х1, у., г;), / = 1, ..., п. Предполагается, что в момент принятия решений агент / знает выборы, сделанные агентами, от которых зависят его возможности.

Функцию предпочтения агента после выбора

им своего состояния обозначим ф1(х1, у1, г) =

= тах , Ду, ур г1).

У,- е (у')

Функцию предпочтения центра, вычисляемую после выбора всеми агентами своих состояний,

обозначим х, г) = тТ Ф (х, у, г), где

у е Zг)

Zц( х, г) — множество рациональных стратегий агентов при выборе состояний у. Множество

Z ц( х, г) определяется следующим образом.

Будем предполагать выполнение «слабого условия благожелательности агентов», при котором множество рациональных стратегий для агентов с номерами / = 1, ... , п0 имеет вид:

21(х1, г) =

{х,}, если х, е arg maxf<х,, y, r,),

yi e yi

arg max f (хг, y,-, r,-) в противном случае,

У' e Y

(2)

а для агентов с номерами / = п + 1, ..., п при заданных входных состояниях у1 принимает вид:

Д(хр у 1, г1) =

{X,}, если X, е arg max , f<хг, уг, r,),

У, e у')

arg max f (хг, уг, rf) в противном случае.

У, e YXy')

(3)

Заметим, что на момент выбора /-м агентом

состояния у; набор входных состояний у1 и план ему известны. Поэтому выбор агентом состояния

у; е 21(хг, у1, гг) является доминантной стратегией агента.

Благожелательность агентов означает, что из равновыгодных для агента состояний он выберет состояние, равное плану. На практике центр может это обеспечить, выплачивая небольшое дополнительное вознаграждение агенту в случае выполнения плана.

Множества рациональных решений агентов в сетевой структуре. Вследствие наличия связей между агентами в рассматриваемой сети структура множества рациональных стратегий агентов при выборе состояний довольно сложная и требует детального описания. Для построения конструкций, позволяющих дать такое описание, заметим, что для конечных агентов возможна произвольная их нумерация, начиная с номера п* и выше, п* < п. Поэтому будем рассматривать все перестановки номеров конечных агентов. Число таких перестановок равно (п — п* + 1)!

Пусть задана некоторая перестановка конечных

агентов N * = (/Щ*, /Щ* +1, ..., /Щ). Рассмотрим первый конечный агент /*(1) = /Щ* в перестановке N*, /*(1) > п*. Для этого агента определим все номера агентов У , чьи состояния являются входящими для агента / *(1). Затем для всех агентов с номерами из У определим номера агентов, состояния которых являются входящими для всех агентов из

множества У ( \ Обозначим соответствующее мно-

1 *(1)

жество таких агентов Ь(У ( Для всех агентов из

1 *(1)

множества Ь(У ( )) повторяем процедуру, т. е. определяем номера всех агентов, чьи состояния являются входящими для агентов с номерами из

Ь(У*(1)). В результате получаем номера агентов

1*(1)

Ь(Ь(У ( О). Продолжаем выполнение процедуры до тех пор, пока агенты, чьи состояния являются входящими, не окажутся начальными, т. е. с номерами не больше, чем п0. Обозначим множество номеров этих начальных агентов I0*(1). Таким образом, для агента с номером /*(1) формируется подсеть исходной сети, определяющая зависимость состояния этого агента от состояний других аген-

1*(1)

тов. Обозначим эту подсеть Ь ( ).

Опишем структуру подсети Ь ^(1) для конечного агента с номером / *(1), где / *(1) > п*. Рассмотрим для подсети Ь 4 ' множество начальных агентов

т-0 л г1*(1)

у* (1). В соответствии с построением подсети Ь 4 '

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

в множество I0* (1) включены, быть может, не все

00 номера начальных агентов, у*(1) с (1, ..., п ), а

только номера тех агентов, состояния которых являются входными для агентов, на вход которых поступают состояния лишь начальных агентов.

Зная множество У0* (1), построим множество номе-

т-1 т-1 / 7-0 ч т-1'*(1)

ров агентов у* (1) = у* (1) (у* (1)) из подсети Ь 4 ' та-

1

кое, что у* (1) содержит номера агентов, соединен-

Ч* (1)

т0

ных дугами только с агентами из множества I,

г*(1) .

Следующее множество 12* (1) = 12* (1) (I0 (1), //* (1))

включает в себя номера агентов, соединенных ду-

01

гами с агентами только из множеств (1) и (1).

Затем по аналогии строится множество 113* (1) =

— т"3 ( 1® т1 т2 \ тк —

= 11*(1) (1 1*(1) , 1 1*(1) , 1 1*(1) ) и т. д., 1 1*(1) =

тк / т0 Т1 тк -1 ч = 1*(1) (1*(1), 1*(1), ..., 1*(1)) до тех пор, пока для

некоторого к = к*(1) множество /^(х^ не будет включать в себя единственный номер конечного агента, равный /*(1), т. е. Ц**!^ = {/*(1)}.

Рассмотрим последовательность выборов агентами состояний в подсети Ь ' в соответствии с построенной структурой множеств (10 (1), 111* (1),

2 к*(1) 1*(1), ..., 1*(1) ). Сначала зафиксируем некоторые

состояния у I е ^Хр г) для / е 10 (1), затем для

агентов с номерами / е 1/* (1) фиксируем состояния

У1 е ^(%1, у 11*(1), г), где уг11*(1) = (у-, у е 10(1)), затем для агентов с номерами / е 12* (1) фиксируем

состояния у1 е ^-Ц, Уо 1*( 1), г.), где -01*(1) = (у,-, у е 1/*(1)), и т. д., пока на шаге к* = к*(1) не зададим состояние у^ для агента с номером /*(1), удовлет-

~ ^ , ~ 1*( 1) воряющее условию у1*(1) е 4»(1)(х1*(1), У(к*( 1) -1) 1* 1),

ч -1*(1) ■ ,-к*(1) - К ^

г1*(1)), где У(к*(1) -1)1*( 1) = (У,, У е Ц*. Д/ ). Совокуп-

-1 -1 -1*( 1) ность состояний (У01*, у 11*, ..., У(к*(1)-1) 1*(1), У;*),

где /* = /*(1), к* = к*(1), назовем набором рациональных стратегий агентов, входящих в подсеть Ь1 (1) для первого конечного агента с номером / *(1) из перестановки N *.

Рассмотрим второго агента с номером / *(2) = = /п* +1 из перестановки N *. Для этой перестановки и конечного агента с номером /*(2) построим подсеть Ь1 (2) по схеме, приведенной выше для подсети Ь 4 ', и соответствующую совокупность множеств /¿*(2) = /1*(2) (11*(2) , Л*(2), ..., Л*(2) )). Для агентов, которые принадлежат обеим подсетям, *(1) *(2)

Ь *(1) и Ь *(2), оставим значения состояний, зафиксированных при рассмотрении набора рациональ-

*(1)

ных стратегий для подсети Ь (). Для агентов из

*(2) *(1)

множества Ь ( )\Ь ( ), т. е. принадлежащих подсе-

*(2) *(1) ти Ь (), но не входящих в подсеть Ь (), выберем

и зафиксируем некоторое состояние у1 е ^С*, г),

. т0 - -1 -1 если / е 1-*(2), и у 1 е 21(х1, Ук 1*(2), г), если ук 1*(2) =

= (у,, у е 11* (2)), где 1 < к = к*(2). Таким образом,

мы зафиксировали некоторые рациональные стра-

*(1) *(2)

тегии для подсетей Ь 4 ' и Ь 4 ' в перестановке конечных агентов N *. Затем повторяем описанные операции для подсети Ь1*(3), в результате чего фиксируются стратегии для совокупности подсетей

1*(1) 1* (2) 1*(3) Ь1 (1), Ь1 (2), Ь1 (3). Аналогичные действия для последующих конечных агентов для перестановки N * приводят нас в конце концов к определению фиксированного рационального выбора состояний всеми агентами всей сети в рассматриваемой перестановке конечных агентов. Описанный выбор фиксированных состояний у1 всеми агентами сети определяет некоторую «траекторию» связанных состояний. Изменяя выбор состояний из множеств, описываемых условиями (2) и (3), мы получим множество возможных рациональных траекторий при установленной нумерации конечных агентов, определяемой перестановкой N *. Объединив множество рациональных траекторий, полученных для всевозможных перестановок конечных агентов, мы получим множество Х, г) всех рациональных выборов агентами своих состояний. Изменяя описанную фиксацию рациональных стратегий агентов в рамках множеств, описываемых условиями (2)

и (3), получаем множество (Х, г) всех рациональных выборов агентов сети для заданной перестановки N * конечных агентов.

Примечание 1. Обратим внимание на то, что для описания множества рациональных стратегий агентов при выборе состояний достаточны лишь требования компактности множеств допустимых состояний агентов. ♦

Определим теперь выбор рациональных стратегий агентов при сообщении центру данных о значениях параметров г . Заметим, что при выборе своей стратегии по сообщению оценки р агенту

не известны ни значения входных состояний у 1, ни значения планов. Для выбора своей стратегии р . агенту необходимо сформировать какой-либо прогноз этих параметров в зависимости от стратегий других агентов. Даже при небольшом числе агентов в рассматриваемой системе такой прогноз становится для агента трудновыполнимой вычислительной задачей. В общем случае это крайне осложняет возможность описания множеств рациональных сообщений агентов в системе. Поэтому целесообразно рассмотреть такие механизмы, при которых рациональные стратегии являются доминантными, т. е. стратегии агентов, выбор которых

не зависит от стратегий других агентов. Существование таких стратегий и эффективность механизма для них, вообще говоря, не очевидны.

Далее в статье будут рассмотрены условия существования равновесий в доминантных стратегиях, при которых каждому агенту выгодно сообщать достоверную информацию о его параметре независимо от выбора остальных агентов.

Аналогично тому, как вводилось условие благожелательности агентов по отношению к центру при выборе состояний, примем слабое условие благожелательности агентов при сообщении ими в центр оценок рг. Оно формулируется так: рг = rf, если

rf е arg max фг(лг(рг, р-г), yг, rf) при всех допусти-

Pie Ai

мых р-г, y г, где р-г = (рр ..., Pf - р Pf + l, ..., рп) -

сообщения всех агентов, кроме /-го, / = 1, ..., n, р =

= (рг, P-i). Это условие означает, что если сообщение достоверной информации обеспечивает агенту не меньший выигрыш по сравнению с выигрышем при сообщении другой информации, то агент будет сообщать достоверную информацию Pi = ri.

Для механизма функционирования ц определим показатель его эффективности

мального механизма на множестве Л: требуется определить механизм ц* такой, что

к(ц, r) = inf р), r),

P e Ä(F)

(4)

где Д г) = Д г, ц) — множество рациональных стратегий агентов при выборе ими сообщений р о параметрах г. Как уже упоминалось, в качестве множества Л( г) рассматривается множество всех доминантных стратегий. Понятно, что если Л( г) = 0, то выражение (4) теряет смысл.

Сосредоточимся на задачах построения так называемых правильных механизмов цсог, обеспечивающих выполнение планов и сообщение достоверной информации (неманипулируемость) как доминантных стратегий, т. е. Zц( х, г) = {х} и Л( г) = {г}.

Для правильных механизмов цсог выражение для критерия эффективности существенно упрощается (по сравнению с выражением (4)):

r) = Ф (п(r), п(r), r).

(5)

1.2. Постановка задачи

Поставим задачу определения механизма ц*, оптимального для любых значений параметров г е Л при заданном множестве неопределенности Л. Назовем ее задачей определения равномерно опти-

V r е A: К(ц*) > sup к(ц, r)

ц e M

S.

(6)

Как отмечалось в работах [1—6, 12, 13], привлекательны именно правильные механизмы, которые мотивируют агентов выбирать состояния, совпадающие с планами, и сообщать достоверную информацию центру о своих параметрах. Обозначим множество таких механизмов Мсог. То, что множество Мсог не пусто, показано в упомянутых работах. Для рассматриваемого случая сетевой структуры примером, показывающим, что множество Мсог непустое, служит задание агентам фиксированных планов хг е у независимо от сообщаемых оценок р; и «сильных» штрафов, обеспечивающих выполнение этих планов.

Достоинство таких механизмов состоит еще и в том, что критерий эффективности правильного механизма существенно упрощается, так как вместо выражения (4) достаточно рассматривать более простое выражение (5). Таким образом, рассматриваемая задача (6) для множества правильных механизмов М приобретает вид: определить меха-

V r е A: K(ц*ог) > sup Ф (п(r), п(r), r) - s. (7)

Ц е Мсог

Требование правильности механизмов может, вообще говоря, существенно сузить множество допустимых механизмов и привести к потерям в их эффективности. В связи с этим возникает задача определения условий, которым должно удовлетворять исходное множество M допустимых механизмов, чтобы выполнялось соотношение

V r е A: sup к(ц, r) =

ц е М

Л *

= max Ф (п(r), п(r), r) = К(ц ). (8)

ц е М п Mcor

Отметим, что соотношение (8) подразумевает в том числе определение условий, при которых обеспечивается достижимость максимума в средней части равенства (8).

Выражение (8) означает, что существует оптимальный на множестве M механизм ц*, принадлежащий множеству правильных механизмов: ц* е M n Mcor.

Пусть множество M допустимых механизмов Ц = (¿(О, п(-), ст(-), х(-, •)), где g(-) = (gx(-), ..., gn(-)), п(-) = (Л1(-), ..., л„(-)), ст(-) = (CTl(-), ..., ст„(-)), %(% •) = (Х1(-, •), ..., %„(', •)), описывается следующими соотношениями:

низм ц* , такой, что

— функции поощрения удовлетворяют ограничениям

0 < ст^у) < £, (9)

где g¡ — заданные фонды поощрения, / = 1, ..., п;

— приросты функций штрафов при фиксированном плане ограничены «показателями максимального роста штрафов» [13]

Х/ХР У1) - хМр У1) < "¿Ур У1), (10)

где "(у, у:) — заданные показатели максимального роста штрафов, удовлетворяющие «неравенству треугольника», х1, у., у 1 е у = у(у1);

— процедуры планирования п1.(*) представляют собой кусочно-непрерывные отображения

пг: А ^ у( у1), (11)

п

где А = П А1.

1 = 1

Постановка задачи: определить механизм ц*, удовлетворяющий условиям (8)—(11).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. СОГЛАСОВАННОСТЬ ПРАВИЛЬНЫХ МЕХАНИЗМОВ ДЛЯ СЕТИ АГЕНТОВ

Для обеспечения правильности механизмов, т. е. выполнения планов и сообщения агентами неискаженной информации о параметрах, требуется определить условия, которым должны удовлетворять компоненты механизма. Такими условиями служат условия максимального и совершенного согласования.

2.1. Максимальное согласование

Условия максимального согласования впервые были рассмотрены в работах [2, 3]. Опишем эти условия для рассматриваемой сетевой модели.

Если хг е р(у1, гг) = {% е у.(у1 )|/.(у, у, гг) < ./К*,,

х1, г1), Уу. е у(у1)} и выполняется приведенное выше слабое условие благожелательности (2) и (3), то /-й агент будет выполнять назначаемый ему план,

у. = хр / = 1, ..., п. Множество Р^ у 1, г^ определяет «выгодные» для /-го агента планы при условии выбора агентами с номерами / = 1, ..., п — 1 «входных» состояний у 1, поэтому р( у 1, г) будем называть множеством согласованных планов с интересами агента для состояний у 1.

Чем шире эти множества, тем больше у центра возможности назначить план, который будет выполняться. Поэтому условием максимального со-

гласования при заданной целевой функции агента называется условие «максимального размера» множества р.( у 1, г^, при котором множество всех выбираемых /-м агентом состояний будет совпадать с выполняемыми планами. Это условие формулируется так: % е Рмс (у 1, г) = и , 21(У, гр у 1). Ин-

У е ^-(У')

декс «МС» в обозначении множества согласованных планов означает «максимальное согласование (англ. тах/тит сотрай'Мйу)».

Определение 1. Будем говорить, что система стимулирования агента максимально согласована, если выполняется условие максимального согласования. ♦

Показано [3], что для максимальной согласованности достаточно выполнения условий сильной согласованности для целевых функций агентов. Для рассматриваемой здесь модели с выделенной функцией штрафов в целевой функции агентов это условие формулируется как требование выполнения «неравенства треугольника» для функций штрафов

[2, 3]: х 1-(% 1, у\) + х 1-(у;, у) < X¿(Х, у) при всех допустимых значениях аргументов.

Так как выбираемое агентом состояние

у* е РМС (у 1, г), то выбором плана % = у* всегда можно, без уменьшения значения функции Ф 1(х1,

у 1, у, г) в силу предположения (1), обеспечить выбор активным элементом состояния у* = х , т. е. функцию предпочтения центра достаточно рассматривать в области определения % е Рмс (у 1, г), а следовательно, достаточно рассматривать только те процедуры планирования пД*), значения которых принадлежат множеству Р1 (у , рр.

Из результатов, изложенных в статье [13] следует, что для принятой модели агента множество согласованных планов можно представить в виде

Г.МС/-1 ч г Ь МС/-1 Ч1 отрезка р (у , р .) = [ у- , хг- (у , р .)], и в силу

того, что у = у( у 1) = [ уЬ, уи (у 1)], где уи (у 1), — неубывающая по всем аргументам функция, верх-

МС ✓ -1 ч

няя граница этого отрезка х ( у , р ) является неубывающей функцией.

2.2. Совершенное согласование

Условия сообщения достоверной информации исследовались во многих работах (см., например, обзор в автореферате [11]). В рамках исследований по теории активных систем такие условия представлены в работах [1, 15].

Условия «совершенного согласования» [15] применительно к рассматриваемой здесь модели сете-

вой структуры связей агентов формулируются таким образом:

Vp е A: фг.( npC ( y1, р ), рг, y1 ) = = max фг(х, pi, y1 ). (12)

x e гг(y')

Здесь верхний индекс PC означает аббревиатуру от словосочетания «perfect compatibility». В выражении (12) XPC ( y1, р_г ) обозначает специально подбираемое центром компактное множество планов, не зависящее от сообщения г-го агента р;. Ниже при построении оптимальной PC-процедуры планирования будет осуществляться выбор соответствующего множества XPC ( y1, р_г ). Заметим, что множество XPC ( y1, р_г ) может зависеть от набора планов X1 вместо набора состояний y1 предшествующих агентов, поскольку планы X1 и выбор

состояний y1 также не зависят от сообщения г-го агента из-за отсутствия в рассматриваемой сети контуров.

Определение 2. Будем называть nPC ( y1, р ) совершенно согласованной процедурой планирования для системы с сетевой структурой связей агентов, если выполняются условия (12). ♦

Применение процедуры планирования, удовлетворяющей условиям (12), совместно со слабым условием благожелательности в механизме обеспечивает сообщение агентами достоверной информации [15]. Таким образом, выражение (12) описывает класс процедур планирования, обеспечивающих сообщение неискаженной информации, а

подбор множества XPC ( y1, р_г ) определяет конкретную такую процедуру. Показано [15], что оптимальная процедура планирования для случая равновесия в доминантных стратегиях содержится в множестве процедур, удовлетворяющих условиям (12).

Рассмотрим теперь объединение условий максимального и совершенного согласований (MPC). Оно выглядит следующим образом:

W - л t MPC, -1 -\ -Î\

Vp е A: фг( п ( y, р ), рр y) =

= pc ' max mc ' Ф1(Х, Р1, y'). (13)

x E X' (y ,Pj)n P' ( y, P')

Обратим внимание, что в выражении (13), в отличие от условий (12), г-му агенту назначается план, максимизирующий его функцию предпочте-

ния на множестве, зависящем от его сообщения рг Этот факт делает необоснованным прямое применение теоремы о достаточности условия совершенного согласования [15] для обеспечения сообщения агентом достоверной информации. Тем не менее, для рассматриваемой здесь модели ниже формулируется условие достоверности сообщаемой информации и выполнения плана.

Теорема 1. Механизм для рассматриваемой модели сетевой структуры, в котором для всех агентов сети применяются MPC-процедуры планирования (13), является правильным.

Доказательство. Отметим, что множества „мс,-i ч

P ( У , Г) удовлетворяют соотношению

„мс , - i 1Ч пмс , - i 2Ч 1 . 2 /1i14

"i (У , ri ) — "i (У , ri ), если ri < ri . (14)

Справедливость этого соотношения, с учетом принятых предположений о свойствах функций затрат агентов, непосредственно следует из леммы 2, доказанной в статье [13].

Пусть р; < r,.. Сравним максимальные значения целевой функции агента при сообщениях р; и r,.. Вследствие соотношения (14) имеет место:

- Л , MPC, - i -i \ -i\

Vpe A: Ф;( %i ( y, p, p;), p,, y) = = max ф,.(х, p,) y' <

„pc-i - , „mc-i , x e Xi (y , p_i) n Pi (y , pi)

< max ф.(х, r, yi ) =

„pc-i - , „mc-i ^ ' '

X e Xi (y , P i) n Pi (y , ri)

, MPC,-i -i ч -К

= ф'< ni ( y, p, r,), r,, y). Пусть теперь p; > r,, тогда P'MC (у' , r,) — P'MC (yi, p,). Предположим, что A = PMC (yi, p,)\PMC (yi, r,) ф 0. Пусть существует план x * е A, такой, что ф,(х *, p,, yi ) = = max ф,(х, p,, yi ). Рассмотрим макси-

X e XpC(yi, p_i) n PMC (y, pi)

мальное значение целевой функции агента при этом плане: ф,(х*, yi, r,) = f(x*, y*, r,) = max f(x*, y,, r,).

yt e Yi(yi)

В силу условия максимальной согласованности справед-

„ nMC ,-i ч , _ -i ч ,

ливо y* е Pi (y , r,), а это означает, что фДх*, y , r,) <

<ф,(У*, Уi, r,). Таким образом, при сообщении агентом достоверной информации r; и при плане, равном y*, выигрыш агента больше, чем при плане х *. Следовательно при сообщении достоверной информации план, удовлетворяющий условию MPC, обеспечивает большее значение функции предпочтения агента, чем при завышенной оценке p; > r;. ♦

Учитывая совпадение выбираемого /-м агентом состояния с планом, условие MPC можно переписать также в виде:

Vp е A: nMPC ( y1, р), p,) = = рс max с f(x, x, p.).

x e xfC(y', p ,•) n PMC(y', P(.)

Примечание 2. Вместо y1 в выражении (14)

можно подставить x1. Чтобы обосновать это, рассмотрим произвольного конечного агента / *. Поскольку для начальных агентов при выполнении условий МРС механизм является правильным, мы,

л

рассматривая агенты с номерами из множества I*

при выполнении условий МРС, получаем правильный механизм для этих агентов. Рассуждая аналогично, получаем правильные механизмы для

агентов с номерами I2* = I2* ( 1°, //* ) и так далее Tk Tk , т0 T1 Tk -1 ч

I ¿* = I* (I ¿*, I*, ..., I* ) до тех пор, пока для не-

k*

которого k = k* множество /¿* не будет включать

в себя единственный номер конечного агента, рав-

k*

ный /* т. е. I* = {/*}. Очевидно, в этой последовательности агентов состояния каждого агента совпадают с планами. ♦

Таким образом, условие МРС (13) можно записать также в виде:

W - л t MPC,-/ \ -К

VР е A: ф.(Л; (x , р ), р., x ) = = max ф ¿(x, p., x 1 )

X e XPC(x', p '• ) n PMC(x', P')

или Vp е A: f( nMPC ( x 1, p), p.) = = max f(x, x, p г).

X e xfC(X', p '•) n PMC(X', P')

Для случая одного агента показано [13], что

MPC

процедуры планирования лг (•) для принятых

свойств функций затрат в модели агента представляют собой неубывающие функции параметров p . на отрезке Аг Этот факт переносится и на рассматриваемый случай связанных агентов, так как /-й агент не влияет на выбор планов x 1. Таким образом, nMPC ( x 1, p ) является неубывающей функцией параметра p . на отрезке Аг

2.3. Структура правильного механизма

Рассмотрим случай, когда фонды поощрения g = (gp ..., gn) для всех агентов заданы и фиксированы. Для этого случая исследуем возможность

построения согласованных механизмов для агентов последовательно в порядке их нумерации.

Далее будем предполагать, что функции Ф 1(у, у 1, у, г) непрерывны, не убывают по каждой компоненте из У 1 и строго квазивогнуты по у1 при всех г1 е Аг

Каждой составляющей Ф 1(%1, у 1, у, г) целевой функции центра поставим в соответствие неотрицательное число у1 и рассмотрим систему неравенств

ф 1(xp y 1, у. Г) > угф°( y 1, Г)

(15)

при i = 1, ..., n, где х. е Y.(y ).

Пусть уг = уг( y1, g) таково, что неравенство (15)

разрешимо на множестве Y( У ') при Vr е А, тогда множество всех точек (хг, гг), удовлетворяющих этому неравенству, можно представить в виде:

ОСуР y г, ri) = {(хР ri)lq1 (YP y г, ri) < х < q2 (YP y г, г) Г' е Ар X е Y( y ')},

где q1 (у., y г, r.) и q2 (у ., y г, r.) — непрерывные функции [12, 13].

Рассмотрим функции q1 (уг, y г, r;) = max q1 (уг,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Г,- < Р < r,

-г ч 2, -г ч . 2MC / -г ч

y , p) и q, (yi, y , Гг) = mm . q, (у, y , p), где

— r, < p < Г.

2MC / -г ч • f 2, -i ч MC /-г

q,' (уг, y , p) = mm[q; (уг, y , p), хг (y , p)].

По построению q1 (уг, yг, Гг) и q2 (уг, yг, Гг) — неубывающие и непрерывные по Гг функции. Если

Q/СУр yг, Гг) * 0, то q1 (уг, yг, Гг.) < q2 (у, yг, Гг.) при всех Гг е Аг.

Обозначим N'(Yp у ', Гг) множество неубывающих непрерывных функций п (yг, r), отобража-

i r>M^ - г ч

ющих множество A в множество Рг (y , r;) и удовлетворяющих неравенствам (15). Множество

N'CYp У', rj) можно представить в виде:

NгcУг, yг, rj) = {пуг(yг, r/)| q1 (Уг, y', rj) < < п /y г, r) < q2 (уг, y г, r¿), r; е Аг).

12 1 — г 2 — г

Если у > у , то N(y , У , Г) Ç N(Y , У , Г).

Множества N^Yp y!, r) определяют для каждого i класс непрерывных неубывающих функций, при-

nMC / -г ч

нимающих значения из множества Рг (y , гг) ç

ç [yL, xMC (yг, гг)] и обеспечивающих достижения уровня Y; для функции Фг(хг, хг, гг). Среди них будем выбирать процедуру планирования, удовлетворяющую условиям MPC, т. е. принимающую значе-

„М^ - г ч „ „PC , - г - ч

ния из множества Рг (y , гг) n Хг (y , р_г ). Определим вид множества X?C ( yг, Р-г ).

Пусть Y, такое, что Nî(yî, У', гг) ^ 0. Обозначим П г (y,, у ', Г_г ) = q2 (Y', y ', rp ..., rt -i, rL ) и вместо

множества X?C ( yг, Р-г ), фигурирующего в условиях совершенного согласования (13), установим

множество X?C (y,, y', р_г ) = [ni(Yi, У', Р-г ), yf], зависящее от параметра Yr

Будем рассматривать процедуры планирования вида

Пг'(Yг', У', Рг, Р-г ) =

Пг(Yi, У, Р-г), если гг < Рг< рг-, qi(Yi, У', Рг), если рг- < Рг < rf,

(16)

где Рг = ги, если п1-(у1, у1 1, р-г) > 91 (уг, у1, ги), либо в = Р1(У1, у1 -1, Р-г) определяется из решения уравнения 91 (уг, у1, рг) = п/Ур у1, р-1), если п,(ур у1, р--)

< 9 у , гг ).

По построению процедура (16) является неубывающей и непрерывной функцией по р;.

Показано [12], что для процедуры планирования вида (16) существует функция г{(у1, у1, х1), обратная функции (16), принимающая значения в

л г X и -I

множестве Л; = [ г; , г; ] и определенная по х; на отрезке [уХ, хМС (у1, г;)], за исключением, быть может, счетного числа точек.

Рассмотрим для фиксированных (не зависящих от сообщений р1) значений фондов g = ..., gл} механизм, включающий в свой состав процедуры

планирования, функции штрафов и поощрения, удовлетворяющие условиям допустимости механизма (9)—(11) и условиям MPC (13).

В качестве процедуры планирования этого механизма примем лг(уг, У1, Р ), определяемую выражением (16), при этом функции штрафов совпадают с показателями их максимального роста

Хг(хР Уг) = иг(хр У^ в качестве функции поощрения выберем

0 при y <хг< пг(y,, у', р-г),

(17)

стг(хг) =

j Zit(t, r¡-(Yj-, Уг, t))dt

n,-(ré У p ù

при ^¡'(Yî' У, Р-г) < хг < Щ(yj, Уг, Р-г, rf), g при п ¡(Yi, Уг, Р-г, rf) < хг < yf,

(18)

где

, -г - к

пг(гг, У ,Р г, гг )

g = j Zit(t, (Yi, Уг, t))dt < g. (19)

n,-(Y y ,p i)

Примечание 3. В выражениях (8), (19) Zit (t, r (Y',

y ', t)) обозначает частную производную по первой переменной t функции затрат i-го активного элемента.

Теорема 2. Механизм, определяемый выражениями (16)—(19), удовлетворяет условиям МРС.

Доказательство того, что процедура планирования лг^г, У ', Р ) удовлетворяет условиям MPC (13) при выборе функций штрафов (17) и функций поощрения (18), проверяется подстановкой в целевые функции агентов и проверкой необходимых и достаточных условий их максимума. Для случая одного агента доказательство этого утверждения приведено в статье [13]. Для рассматриваемого здесь случая нескольких агентов доказательство аналогично.

В соответствии с примечанием 2 вместо yг мож-- г

но подставить х .

Примечание 4. В выражениях (16)—(19) параметры Y' зависят от значений g из-за необходимости выполнения условия (19).

x

3. ОПТИМАЛЬНОСТЬ СОГЛАСОВАННЫХ МЕХАНИЗМОВ В СИСТЕМЕ С СЕТЕВОЙ СТРУКТУРОЙ

3.1. Случай фиксированных фондов поощрения агентов

Пусть фонды поощрения g¡ фиксированы. В этом случае, очевидно, из механизма исключается процедура распределения фонда поощрения, т. е. рассматриваемый механизм включает в свой состав только процедуру планирования, систему функций штрафов и функций поощрения. Рассмотрим последовательную процедуру формирования оптимального механизма для всей системы, начиная с первого агента, в порядке их нумерации.

Оптимальный механизм для случая, когда целевая функция центра равна только /-й составляющей Фг(хр у , хр Ф0 (у , г;), назовем /-оптимальным механизмом. Тогда 1-оптимальный механизм формируется, когда первый агент — единственный в системе. Решение такой задачи получено в работах [12, 13].

Отметим, что параметр у1 = у1(ц1, при заданном механизме зависит от размера выделенного, в рассматриваемом случае фиксированного, фонда В этом случае 1-оптимальный механизм

= (Я1) представляет собой решение оптимизационной задачи

КД) = тах уД^,

когда процедура планирования, функции штрафов и поощрения определяются как

ni(Yp Pi) -

ni(Yi), если rj <pi <pi, q 1 (Yi), если pi <pi < rf,

Xi(xi, yi) - "i(*i, yi),

CTi(Xi) -

0 при y[ <xi <ni(Yi),

J Z it(t, ^i(Yi, t))dt при ni(Yi)<Xi <ni(Yi, rf),

n1 (y1)

gi при ni(Yi, rf)< Xi < yf,

и,

п1(у1, г1)

¿1 = | СЬ (/, г{ (уг, 1))А < gv

П1 (У1)

Здесь М1 = М1(^1) — множество допустимых механизмов, заданное выражениями (9) и (11) при / = 1.

Механизм ц| является правильным. Учитывая, что при таком механизме агенты мотивированы сообщать достоверную информацию и выполнять планы, pi — ri и yi — xj — ni(y!, ri), где y! — оптимальное значение составляющей Ф1(х|,

х|, r1)/Ф0 (r1) критерия эффективности механизма для Vr1 е A1,

Y! — Y! ( ц!, gi) > Ф1(х!, х!, rj)/Ф0 (rj). (20)

Затем, зная состояние y1 — х| и, следовательно, зависимость по r2 множества Y2 — xj, r2) при вычисленном значении xj, по той же схеме определим оптимальный механизм для второго агента и т. д. по индукции.

Для /-го агента (/ — 2, ..., n) задача определения /-оптимального механизма ц* — ц* (g) имеет вид:

K( ц* ) — max Yi(х*1, ц, g) (21)

при условиях (9)—(11), при этом, в силу выполнения условий MPC, y1 — X*1, где X*1 — (х*, j е J1) — оптимальные планы агентов, предшествующих в

сети /-му агенту, и р1 — r1 — (r, j е J1), M. — мно-

j 1

жество допустимых механизмов, заданное выражениями (9)—(11).

По аналогии с выражением (20) обозначим y*

оптимальное значение составляющей Фг(хг, y1, y,

r)/Ф0 (y1, г) нормированной целевой функции

центра для Vr; е A, y* — Y* (X*1, g) > Фг(х*, X*1, х*,

— * 1 \ — 1 — 1 — * 1 — 1 г.)/ Ф¡ ( х , r;) при условии y — X .

Лемма. Значения показателей эффективности Y* — y* (X*1, ц*, g) при нормирующих функциях

11 не

Ф0 (у', Г) = 1 не убывают по х*(г) (/) и g¡, где х*(г) (/)

—у'-я компонента набора X*' входов /-го агента, / = 2, ..., и; у = 1, ..., / - 1.

Доказательство. Покажем, что если х]'' < х*(' ,

то

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

у; = у; (х', н?, < у* (х*', ц*, (22)

где х*' = (х*( при Уд е /'), х' = (х] '', у е /', х*( при Уд е /'\у), ц? — оптимальный механизм при входе х ', у; — значение показателя эффективности при механизме н? и входе х '.

Так как в i-оптимальном механизме для i-го агента процедура планирования удовлетворяет условиям МРС, то для нее справедливо выражение (13). При входе Xi построение оптимальной МРС-процедуры планирования по сути предполагает выбор в условиях (13)

подмножества, XPC (Xi, p . ), такого, что xfC (x' , p . ) n n PMC (x', p,) ф 0. Отметим, что

„MC, -i s. „MC,-*! ч

Pi ( x , p,) Ç Pi ( x , p;)

(23)

поскольку Yi(x1) с Yi(x*1), поэтому yU = yU(y1) не убывают по своим аргументам. Из выражения (23) сле-

X^PC / - 1 — 4 _ пМС / - i 4 ^

дует, что если Xj (x , р_;) п Р, (x , р;) ф 0, то

vPC,-*i - ч _ „MC,-*i ч „ „PC,-*; - ч

X (x , р_;) п р (x , р;) ф 0, где X1 (x , р_;) =

- V-PC/ rrj - ч = Xi (x, p_l).

Пусть множество X-C (x1, p_;) = X-C (y,, x1, p_;) является тем множеством совершенно согласованных планов в условиях (13), при котором выбран оптимальный механизм ц? и, соответственно, реализуется значение показателя эффективности у*. Рассмотрим это же множество, но для условия совершенного согласования при

*( i) w л -С/ MPC,-*< -ч ч

входе x*', а именно Vp е A: /Дп, (x , р), р;) =

= max f(x, x, р;). Так как X-C (x1, р_;) п

x е XPC(X*', р ) n PMC(X*', р^)

nMC ,-i ч £-PC,-*< - ч ^ nMC, *i ч r

п Pi (x , p;) с Xi (x , p_;) п Pi (x* , p;), то выбором X1PC (x1, p_;) = XfC (x1, p_;) п Y(x1) при входе x*(1) обеспечивается y^ (x1, ц?, g) < y* (x*1, p*, g), т. е. выражение (22) справедливо. Следовательно, у* = у* (x*1, p*, g) не убывают по x*(i).

Неубывание функции у* = у* (x*1, p*, g) по g следует из выражения (19). На самом деле, при увеличении g ограничение (19) для допустимых механизмов ослабляется. ♦

Теорема 3. Если функции Фг(уг, уг, уг, г) непрерывны, возрастают по у. и каждой компоненте из

множества уг при i = 1, ..., n* — 1, то оптимальный механизм ц* = (ц1, ..., цП) при фиксированных фондах поощрения g = (g1, ..., gn) при нормирующих функциях

Ф0 (уг, r) = 1, i = 1, ..., n, определяется из последовательности решения задач (21) в порядке нумерации агентов. Эффективность оптимального меха-

n

низма К(ц*) = ^ у*.

г = 1

Доказательство. При заданном фонде gj план и выбираемое первым агентом состояние не зависят от механизма и, соответственно, от выбираемых состояний всех других агентов. Поэтому максимальное значение yi

не зависит от выбранного механизма для последующих агентов. В силу предположения о том, что функция Ф1(У1, У1, rj) не убывает по yj, и свойства [13], по которому процедура планирования xj = nj( y 1, Pj) не убывает по pj, при оптимальном механизме первому агенту назначаются максимальные МРС-планы для всех допустимых pj при заданном фонде gj. Следовательно, на вход последующих агентов поступает наибольшее из возможных значений xj при каждом значении параметра pj. Аналогичные рассуждения применимы для второго агента, учитывая, что функции Ф2(х2, yj, y2, r2) и yf = yf (yj) не убывают по своим аргументам, максимальное значение y2 достигается при наибольших значениях yj = xj = = nj(yi, pj) и не зависит от выбора механизма последующих агентов. С учетом того, что функции Ф;(х;, y1, y, r;)

и yU = yU (y!) не убывают по своим аргументам, продолжая подобные рассуждения для i < и*, приходим к тому, что при заданном фонде g максимальное значение у* достигается при наибольших значениях yj = Xj = = п* (у*, pj), где j = 1, ..., i — 1. Для i > и* i-оптимальный механизм и, соответственно, максимальное значение у* определяется также при максимальных значениях

yj = X = П*(у*, pj). ♦

Примечание 5. Рассмотренный механизм обладает свойством «стабильности» в процессе функционирования системы в том смысле, что если в процессе деятельности агентов (последовательности выбора ими состояний) какой-либо, например, i-й агент «не выполнит» план, уг < хг, то назначив хг = уг, по описанной схеме можно пересчитать оптимальный правильный механизм для последующих агентов с номерами / + 1, ..., n.

Примечание 6. Для варианта Ф0 (уг, rf) =

= max Фг(хг, yг, хг, г) построить оптимальный

х, e Y-(У', Г,)

механизм системы в виде последовательного формирования механизмов для агентов, как сформулировано в теореме 2, вообще говоря, не удается.

3.2. Распределение общего фонда поощрения

Рассмотрим теперь задачу определения оптимальных механизмов, предусматривающих процедуру распределения фонда поощрения G. В этом случае индивидуальные фонды поощрения g. агентов задаются центром в соответствии с процедурами g.(-) распределения суммарного фонда G, где

g (") = (g^i('), gn(")) отображает множество A = = A1 х А2 х ... х An в симплекс, задаваемый неравенством

X G

/ = 1

(24)

и условием неотрицательности фондов ^¡.( р).

Теперь механизм функционирования н = {£г(*),

пг(*), *)}| ^ описывается набором процедур планирования X' = Л'.(-), распределением фонда поощрения £;(*) и функциями стимулирования 5'.(хг, У'), / = 1, ..., и.

Задача нахождения оптимального механизма задается условиями (5)—(10), и дополнительными ограничениями (24).

Включение процедуры распределения фондов 8(") = (яД"), ..., 8И(")) в состав механизма приводит к необходимости прогнозирования агентами назначаемых им не только планов, но и фондов поощрения в зависимости от сообщаемых оценок. Если план /-го агента зависит непосредственно от

сообщаемой им оценки и плана входов X*'-1 предшествующих агентов, то выделяемый /-му агенту фонд зависит уже от стратегий всех агентов в сети. Прогноз /-м агентом влияния сообщаемой информации р; на выделяемый ему фонд 8;( р ) представляет для агента сложную вычислительную задачу, а воздействие на фонд 8;( р) от манипулирования сообщаемой информацией р' может оказаться пренебрежительно малым при наличии достаточно большого числа агентов в сети (по предварительным оценкам , и > 5). Кроме того, манипулирование сообщениями может привести к назначению агенту «невыгодного» плана в условиях МРС-пла-нирования. В связи с этим примем гипотезу о «слабом влиянии» сообщения отдельного агента на размер выделяемого ему фонда поощрения, согласно которой он при выборе своего сообщения не учитывает его влияние на фонд поощрения, а только учитывает влияние оценки на назначаемый ему план. Оценка числа агентов, при котором правомерно принятие гипотезы слабого влияния, требует отдельного исследования, но выходит за рамки данной статьи.

На примерах простых моделей для задачи распределения ограниченного ресурса показана справедливость гипотезы слабого влияния сообщения отдельного активного элемента на цену ресурса при таких же количественных оценках числа активных элементов [1].

В этом случае задачу распределения фонда G можно свести к оптимизационной задаче выбора параметров распределения g = (gp ..., gn) для рассмотренного выше оптимального механизма при заданном распределении фондов. Ограничимся рассмотрением именно этой задачи: определить механизм ц* = (ц1, ..., цП) такой, что

n n

К(ц*(Г)) = X KV'V*)) = max X ¿/W)) (25)

i = 1 g / = 1

при распределении фондов g = (gp ..., gn), удовлетворяющем ограничению (24), где g' = (gp ..., g. _ 1),

^*(g') = (ц1 (g1), ..., ц* (g')), ц* = ц* (g') - механизм для /-го агента, являющийся решением задачи (21).

Из приведенного выше исследования задачи построения механизмов следует справедливость следующей теоремы, определяющей решение задачи (25).

Теорема 4. Если выполняется гипотеза слабого влияния, то оптимальный механизм для сетевой структуры агентов определяется из решения задачи

К(ц*(g*)) = max X Y* (X*' (ц'*(g')), g), (26)

g i = 1

где y* (x* (ц (g)), g) — значения параметра, характеризующего эффективность механизма для /-го агента на множестве М. при заданном наборе механизмов ц' и заданных значениях фондов g 1 предшествующих по нумерации агентов при условии выполнения ограничения (24).

Примечание 7. Решение задачи (26), сформулированной в теореме 4, уже не предполагает ее декомпозицию на последовательность задач построения механизмов агентов в порядке их нумерации, как в теореме 2.

Примечание 8. Теорема 4 справедлива для обоих

вариантов, когда Ф0 (y', r) = max Ф/х, y', x, r)

. ^ /V '

xi e У , r,0

либо Ф0 (у'-1, г) = 1.

Примечание 9. При выполнении условий теоремы 4 имеет место инвариантность свойства не-манипулируемости относительно изменения таких параметров механизма, как фонды стимулирования агентов.

ЗАКЛЮЧЕНИЕ

Кратко перечислим основные результаты: — поставлены задачи построения оптимальных механизмов (процедур планирования, системы стимулирования, распределения фондов поощрения)

n

в сетевой структуре активной системы в условиях неполной информированности центра о моделях агентов;

— показано, что оптимальный механизм достаточно искать на множестве МРС-механизмов;

— предложены процедуры построения оптимальных механизмов в сетевой структуре в виде последовательности решения задач согласно нумерации агентов в сети, соответствующей порядку зависимости множеств допустимых состояний агентов от значений входов предшествующих агентов;

— описана задача распределения фонда поощрения агентов в виде оптимизационной задачи на множествах локально оптимальных механизмов для последовательности агентов;

— исследованы свойства монотонной зависимости эффективности оптимальных механизмов от параметров задач.

Представленные результаты могут применяться при построении и анализе систем организационного управления комплексами научно-технических разработок, в мультипроектных системах, для обеспечения функционирования сетевых структур сложных производственных процессов, например, сборочных производств, и разработки механизмов их ресурсного обеспечения.

Дальнейшее развитие результатов видится в направлении разработки механизмов управления в сетевых структурах, для которых неправомерно применение гипотезы о слабом влиянии сообщаемой агентами информации на выделяемые им фонды поощрения.

ЛИТЕРАТУРА

1. Бурков В.Н. Основы математической теории активных систем. — М.: Наука, 1977. — 256 с. [Burkov, V.N. Fundamentals of the mathematical theory of active systems. — Moscow: Nauka, 1977. — 256 p. (In Russian)]

2. Бурков В.Н., Кондратьев В.В. Механизмы функционирования организационных систем. — М.: Наука, 1981. — 384 с. [Burkov, V.N., Kondratiev, V. V. The mechanisms of functioning of organizational systems. — Moscow: Nauka, 1981. — 384 p. (In Russian)]

3. Еналеев А.К. Разработка механизмов стимулирования и управления в двухуровневых активных системах: автореф. дис. канд. техн. наук. — М.: МФТИ, 1980. — 18 с. [Ena-leev, A.K. Razrabotka mekhanizmov stimulirovauiya i upravleni-ya v dvukhurovnevikh aktivnikh sistemakh: avtoref. dis. kand. tekhn. nauk. — Moscow: MPhTI, 1980. — 18 s. (In Russian)]

4. Бурков В.Н., Данев Б., Еналеев А.К. и др. Большие системы: моделирование организационных механизмов. — М.: Наука, 1989. — 245 с. [Burkov, V.N, Danev, B., Enaleev, A.K., et al. Large-scale systems: organizational mechanisms modeling. — Moscow: Nauka, 1989. — 245 p. (In Russian)]

5. Механизмы управления / под ред. Д.А. Новикова. — М.: ЛЕНАНД, 2011. — 192 с. [Mekhanismi upravleniya / pod. red. D.A. Novikova. — Moscow: LENAND, 2011. — 192 s. (In Russian)]

6. Новиков Д.А. Теория управления организационными системами. — М.: Физматлит, 2007. — 584 с. [Novikov, D.A. Teoriya upravleniya organizatsionnimi sistemami. — Moscow: Fizmatlit, 2007. — 584 s. (In Russian)]

7. Бурков В.Н, Коргин Н.А., Новиков Д.А. Введение в теорию управления организационными системами: учебник. — М.: Кн. дом «ЛИБРОКОМ», 2009. — 264 с. [Burkov, V.N, Korgin, N.A., Novikov, D.A. Vvedeniye v teoriyu upravleniya organizatsionnimi sistemami. — Moscow: Kn. dom «LIBRO-KOM», 2009. — 264 s. (In Russian)]

8. Новиков Д.А. Сетевые структуры и организационные системы. — М.: ИПУ РАН, 2003. — 101 с. [Novikov, D.A. Sete-viye strukturi i organizatsionniye sistemi. — Moscow: IPU RAN, 2003. — 101 s. (In Russian)]

9. Белов М.В., Новиков Д.А. Сетевые активные системы: модели планирования и стимулирования // Проблемы управления. — 2018. — № 1. — С. 47—57. [Belov, M.V., No-vikov, D.A. Seteviye aktivnite sistemi: modeli planirovaniya i stimulirovaniya // Problemi upravleniya. — 2018. — No. 1. — S. 47—57. (In Russian)]

10. Еналеев А.К. Оптимальный согласованный механизм в системе с несколькими активными элементами // Проблемы управления. — 2015. — № 3. — С. 20—28. [Enaleev, A.K. Optimal incentive compatible mechanism in a system with several active elements // Automation and Remote Control. — 2017. — Vol. 78, no. 1. — P. 146—158.]

11. Коргин Н.А. Неманипулируемые механизмы принятия решений в управлении организационными системами: автореф. дис. д-ра техн. наук. — М.: ИПУ РАН, 2014. — 48 с. [Korgin, N.A. Nemanipuliruyemiye mekhanizmi prinyatiya resheniy v upravlenii organizatsionnimi sistemami: avtoref. dis. d-ra tekhn. nauk. — Moscow: IPU RAN, 2014. — 48 s. (In Russian)]

12. Еналеев А.К. Оптимальный механизм функционирования в активной системе с обменом информацией // Управление большими системами. — 2010. — № 29. — С. 108—127. [Enaleev, A.K. Optimalniy mekhanizm funktsionirovaniya v ak-tivnoy sisteme s obmenom informatsiey // Upravleniye bolshimi sistemami. — 2010. — No. 29. — S. 108—127. (In Russian)]

13. Еналеев А.К. Оптимальность согласованных механизмов функционирования в активных системах // Управление большими системами. — 2011. — № 33. — С. 143—166. [Enaleev, A.K. Optimal incentive-compatible mechanisms in active systems // Automation and Remote Control. — 2013. — Vol. 74, iss. 3. — P. 491—505.]

14. Бурков В.Н, Заложнев А.Ю., Новиков Д.А. Теория графов в управлении организационными системами. — М.: СИНТЕГ, 2001. — 124 с. [Burkov, V.N, Zalozhnev, A.Yu, Novikov, D.A. Teoriya grafov v upravlenii organizatsionnimi sis-temami. — Moscow: SINTEG, 2001. — 124 s. (In Russian)]

15. Бурков В.Н., Еналеев А.К. Оптимальность принципа открытого управления. Необходимые и достаточные условия достоверности информации в активных системах // Автоматика и телемеханика. — 1985. — № 3. — С. 73—80. [Burkov, V.N., Enaleev, A.K. Optimalnost printsipa otkritogo upravleniya. Neobkhodimiye i dostatochniye usloviya dostover-nosti informatsii v aktivnikh sistemakh // Avtomatika i teleme-khanika. — 1985. — No. 3. — S. 73—80. (In Russian)]

Статья представлена к публикации членом редколлегии

В.Н. Бурковым.

Поступила в редакцию 21.01.2018, после доработки 15.09.2018.

Принята к публикации 16. 09.2018.

Еналеев Анвер Касимович — канд. техн. наук,

Институт проблем управления им. В.А. Трапезникова РАН,

г. Москва, И anverena@mail.ru.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

OPTIMALITY OF THE INCENTIVE COMPATIBLE MECHANISMS IN NETWORK ORGANIZATIONAL STRUCTURES

A.K. Enaleev

V.A. Trapeznikov Institute of Control Sciences of Russian Academy of Sciences, Moscow, Russia

M anverena@mail.ru

Abstract. The paper considers the problems of optimal control mechanisms design for an interconnected agents system provided incomplete awareness conditions of the governing body (center) about the parameters of agents. A directed graph that does not contain contours presents the connections of the agents in this system. Agents have their own goals and transmit information about their parameters to the center. They can intentionally distort data if distortion is beneficial to them. The center controls the behavior of agents. The behavior of agents is to inform the center about their parameters and the choice of their states. The ability of subsequent agents to select their states depends on the state selected by a preceding agent. The given directed graph determines the precedence structure of agents. The center's management consists of choosing a mechanism that includes planning procedures in the form of functions that depend on the information received from the agents and the incentive system. The incentive system consists of the functions of fines for deviating the state of the agent from the plan and the functions of encouraging agents for choosing the state. Optimal mechanisms are designed in accordance with which agents are not interested in manipulating the information communicated to the center and the implementation of plans. Conditions of incentive compatibility are determined that ensure this behavior of agents without decreasing the optimal value of the objective function of the center. The results of the study can be useful in managing the implementation of complex projects or assembly plants.

Keywords: hierarchy, network structure, mechanism design, optimization, coordination, equilibrium, sus-tainability, non-manipulation.

Funding. The work is performed with financial support of Russian Foundation of Basic Research and JSC Russian Railways within the framework of the project No. 17-20-05216.

Новая книга

Тертычный-Даури В.Ю. ГАЛАМЕХ: в 6 т.: т. 6. Математическая механика. —

2-е изд., перераб. и доп. — М.: Физматлит, 2019. — 612 с. — ISBN 978-5-94052-272-0.

Книга состоит из четырех частей. В первую, обзорную, часть вошли главы, посвященные некоторым современным методам решения задачи устойчивости. Во второй и третьей, исследовательских, частях представлены оригинальные результаты по синтезу алгоритмов параметрического регулирования задачи приведения динамических систем в устойчивое состояние, рассмотрены также разнообразные задачи обеспечения условной, оптимальной и стохастической устойчивости динамических систем с помощью надлежащей настройки их параметров; содержатся результаты по выводу аппроксимирующих оценок вариационных и субоптимальных приближений. В приложении, которое составляет четвертую, справочную, часть книги, кратко изложены основы качественной теории устойчивости решений дифференциальных уравнений, важнейшие понятия, теоремы и методы Ляпунова в теории устойчивости, вопросы устойчивости систем автоматического управления и специальные вопросы теории устойчивости.

i Надоели баннеры? Вы всегда можете отключить рекламу.