Научная статья на тему 'Согласованные механизмы управления в активных системах'

Согласованные механизмы управления в активных системах Текст научной статьи по специальности «Математика»

CC BY
110
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОРГАНИЗАЦИОННАЯ СИСТЕМА / РАВНОВЕСНОЕ СОСТОЯНИЕ / УПРАВЛЕНИЕ / КООРДИНАЦИЯ / ПРАВДИВЫЕ ДАННЫЕ / ПЛАНИРОВАНИЕ / СОГЛАСОВАННОЕ СТИМУЛИРОВАНИЕ / ОПТИМИЗАЦИЯ / ORGANIZATION / EQUILIBRIUM / MANAGEMENT / COORDINATION / PLANNING / INCENTIVE COMPATIBILITY / REVELATION / OPTIMIZATION

Аннотация научной статьи по математике, автор научной работы — Еналеев Анвер Касимович

Представлены предыстория и последние результаты выполненных автором исследований согласованных механизмов управления в активных системах: оптимальность правильных механизмов при полной информированности центра; оптимальность принципа открытого управления, оптимальность согласованных механизмов при неполной информированности центра и сообщении активными элементами ему информации; построение оптимальных согласованных механизмов в сетевых активных системах; согласование разбиений сетей; механизмы управления в многоэлементных активных системах с дуальной сетевой структурой связей. В первых частях статьи сведены воедино методы согласованного управления, опубликованные в различное время, а в последней части описаны новые результаты построения и анализа согласованных механизмов для дуальных сетевых структур, основывающиеся на результатах предыдущих исследований. Дуальные связи агентов определяются совокупностью связей между множествами допустимых значений стратегий агентов и совокупностью связей в целевых функциях агентов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Еналеев Анвер Касимович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Coordinated management mechanisms in active systems

The background and recent researches of the incentive compatible mechanisms in active systems performed by the author are presented. These include the correct mechanisms optimality with full awareness of the center, the optimality of open control principle, the optimality of the incentive compatible mechanisms with incomplete awareness of the center, building optimal incentive compatible mechanisms in network active systems, coordination of network partitions, mechanisms in multi-element active systems with a dual network communication structure. The first parts of the article bring together the methods of coordinated management published at different times, and the last part describes the new results of constructing and analyzing coordinated mechanisms for dual network structures based on the results of previous studies. The dual relationships of agents are determined by the totality of relationships between the sets of acceptable values of agent strategies, and the totality of relationships in the goal functions of agents.

Текст научной работы на тему «Согласованные механизмы управления в активных системах»

СОГЛАСОВАННЫЕ МЕХАНИЗМЫ УПРАВЛЕНИЯ В АКТИВНЫХ СИСТЕМАХ

Еналеев А. К.1

(ФГБУН Институт проблем управления им. В.А. Трапезникова РАН, Москва)

Представлены предыстория и последние результаты выполненных автором исследований согласованных механизмов управления в активных системах: оптимальность правильных механизмов при полной информированности центра; оптимальность принципа открытого управления, оптимальность согласованных механизмов при неполной информированности центра и сообщении активными элементами ему информации; построение оптимальных согласованных механизмов в сетевых активных системах; согласование разбиений сетей; механизмы управления в многоэлементных активных системах с дуальной сетевой структурой связей. В первых частях статьи сведены воедино методы согласованного управления, опубликованные в различное время, а в последней части описаны новые результаты построения и анализа согласованных механизмов для дуальных сетевых структур, основывающиеся на результатах предыдущих исследований. Дуальные связи агентов определяются совокупностью связей между множествами допустимых значений стратегий агентов и совокупностью связей в целевых функциях агентов.

Ключевые слова: организационная система, равновесное состояние, управление, координация, правдивые данные, планирование, согласованное стимулирование, оптимизация.

1. Введение

Идеи и принципы согласованности в теории активных систем, в частности принцип открытого управления, были сформулированы в пионерских работах В.Н. Буркова в 1971 г. и были в последующем аккумулированы им в монографии [1].

Основываясь на этих подходах и результатах, начиная с 1978 года параллельно с развитием теории игр с непротивоположными интересами [14] начался новый этап в развитии теории активных систем. Первые исследования согласованных механизмов (СМ) проводилось в работах [3-6, 12, 15] преимущественно для простейших моделей структур активных систем типа «центр - активный элемент», либо структур «веерного» типа

1 Анвер Касимович Еналеев, к.т.н., с.н.с. (anverena@mail.ru).

с несколькими независимыми агентами - активными элементами (АЭ). Эти исследования послужили в дальнейшем фундаментом для исследования более сложных моделей.

Можно условно выделить следующую последовательность решения задач.

1. Построение и исследование оптимальных механизмов в условиях полной информированности центра об АЭ. Доказательство оптимальности СМ [3-6, 12, 15].

2. Исследование оптимальных процедур планирования при неполной информированности центра об АЭ и сообщении активными элементами центру правдивой информации. Доказательство оптимальности принципа открытого управления [2].

3. Исследование оптимальности механизмов для случая вероятностной неопределенности в активной системе [8, 9, 15, 22, 23].

4. Построение оптимальных механизмов, включающих процедуру планирования и систему стимулирования, в условиях неполной информированности центра. Определение условий оптимальности СМ и построение оптимальных СМ для простейших активных систем «центр - активный элемент» [7, 16-18].

5. Обобщение результатов п. 4 на некоторые случаи много-агентных систем: системы со «слабо связанными АЭ»; системы с сетевой структурой «технологических» связей, описываемых графом без контуров; двухканальные активные системы [10, 19-21, 29,30, 32].

6. Применение разработанных методов для задачи согласования границ разбиений в сетевых структурах [24-26, 33].

7. Исследования механизмов управления в многоэлементных активных системах с дуальной сетевой структурой связей [27, 28, 34].

Рассмотрим модели, постановки и некоторые основные результаты решения этих задач.

2. Полная информированность центра

Содержательно задача ставится как получение максимального гарантированного результата (значения целевой функции)

центра на множестве рациональных выборов стратегий АЭ. При этом стратегией центра является назначение плана и системы стимулирования АЭ. Определены условия на выбор согласованных планов и системы стимулирования, при которых выполнение плана является рациональной стратегией АЭ. Определены условия оптимальности согласованных планов, выполнение которых обеспечивает максимальное значение целевой функции центра. В случае, когда система стимулирования задается как функция штрафа за отклонение стратегии АЭ от назначенного центром плана, достаточные условия выполнения плана, когда множество всех выполнимых планов совпадает с множеством всех рациональных стратегий АЭ (условие «максимального согласования») и оптимальности, определяются неравенством «треугольника», которому должна удовлетворять функция штрафа. Условие выполнения этого неравенства принято называть условием «сильного согласования».

Эти результаты позволили ставить и решить ряд задач синтеза оптимальных функций стимулирования при наличии ограничений сверху и снизу на величину целевой функции АЭ и на «показатель максимального роста» функции штрафов.

Формальная постановка задачи выглядит следующим обра* ~

зом: определить механизм ^ такой, что K (u) = max K (u),

¡ueM

где л = {n(.), f(., .)} - механизм; x = п(.) - процедура планирования, f(., .) = fx, y) - система стимулирования (целевая функция АЭ), x - план, y - состояние (стратегия) АЭ, x e X, y e Y, M - множество допустимых механизмов, к(u ) = min Ф(x, y),

У eZ ( u)

Ф^, y) - целевая функция центра,

{x}, если x e Arg max f (x, y),

Z(u) = < yeY - множество ра-

Argmax f (x, y, r ) в противном случае,

yeY

циональных стратегий АЭ.

Вообще говоря, при некоторых системах стимулирования АЭ даже для оптимальных механизмов рациональный выбор агента может не совпадать с планом. В связи с этим возникает

вопрос. Каким условиям должен удовлетворять оптимальный механизм, при которых рациональный выбор агента совпадает с планом? Такие механизмы в [3, 12, 15] было принято называть правильными.

Эта задача формулируется следующим образом: определить условия, при которых

(1) K(jli) = тахК(р) = max K(jli) ,

¡ueM /ieMRMnp

где Мпр - множество правильных механизмов.

Решение этой задачи содержатся в следующих утверждениях.

Утверждение. Достаточным условием выполнения (1) является выполнение условия максимальной согласованности

(2) P=Z,

где Z = U Z (x, f), P = {x e X\f(x, y) < f(x, x), Wy eY} .

reJ

Теорема 1. Для максимальной согласованности (2) достаточно сильной согласованности, определяемой выполнением неравенства

f Ж, Я) + fx, y) > fx, ж) + f Ж, y) для Уж, y e Z, Wx e X.

В случае когда целевая функция АЭ представима в виде fx, y) = h(y) + a(x) - x(x, y), где x(x, y) - функция штрафов АЭ за невыполнения плана, условие последней теоремы приобретает вид неравенства «треугольника»

X(x, y) < x(x, п) + х(п, y).

Эти утверждения позволили получить решения задач выбора оптимальных функций стимулирования.

Отметим здесь лишь следующее утверждение. Пусть задана сильно согласованная целевая функция f (x, y). Определим множество F (r) допустимых целевых функций АЭ f(x, y) следующего вида:

F(r) = {fx, y) I fix, y) - fix, y') < /(y y) - f(y, y'), где x, y'e X, y e P }. Здесь P*(r) = {x e XI f(x, y) < f (x, x) Wy e Y} - множество согласованных планов для целевой функции АЭ f (x, y).

Теорема 2. Сильно согласованная целевая функция /(х, у) оптимальна на множестве Ь .

Следствие. Функция штрафа х (х, у) оптимальна на множестве функций штрафов

^ = {х(х, У) \х(х, у) - х(х, У) ^ Х(У,У), где х,у,у еГ} .

3. Согласованное планирование при неполной информированности центра об АЭ

В [2] определены условия оптимальности процедуры открытого управления и необходимые и достаточные условия сообщения достоверной информации, развивающие результаты исследования законов открытого управления в [1].

В [2] показано, что оптимальная процедура планирования содержится в множестве процедур открытого управления.

К процедурам открытого управления относятся процедуры планирования, назначаемый план согласно которым удовлетворяет условиям «совершенного согласования». В этом случае АЭ получает план, который максимизирует его функцию предпочтения на некотором выбранном центром множестве планов, не зависящем от сообщаемой агентом информации. Отметим, что это множество может зависеть от сообщений других АЭ, если их в активной системе несколько.

Представим формальное описание условий совершенного согласования.

Пусть в системе имеется п АЭ и их целевые функции АХъ у, г) зависят от параметров г, которые известны АЭ, но неизвестны центру. Центр вычисляет планы х1 = Щ (р) для АЭ на основании заранее выбранных процедур п;(.) и информации р = {р, г = 1,..., п}, сообщаемой активными элементами центру о параметрах г = {г,г = 1,...,п}.

Задача заключается в выборе процедур п(.) таких, чтобы АЭ было выгодно сообщать в центр достоверную информацию, р = Г.

В [2] показано, что при рациональном поведении АЭ необходимым и достаточным условием сообщения достоверной ин-

формации в активных системах является выполнение для соответствующих процедур планирования щРС (y', р) соотношений «совершенного согласования»:

Vp е А: ф' (щРС (р) р, y') = max ф.(x, Р'),

хеХ[с (р_, )С\Г,

где ф (x, Г ) = max f (xt, y, r) - функция предпочтения АЭ,

y eTi

XPC(p) - подбираемые центром компактные множества планов, не зависящее от сообщения i-го агента р.

В система со связанными АЭ подбор допустимых множеств XPC(p) представляет собой в общем случае сложную задачу, - особенно подбор таких множеств, для которых выполнение условий совершенного согласования обеспечивает оптимум целевой функции центра.

Для случая одного АЭ доказана оптимальность принципа открытого управления, основанного на условии совершенного согласования.

Для случая нескольких АЭ, связанных общими ограничениями решены отдельные задачи. Обзор исследований в этой области и ряд результатов изложены в [13, 31]. Описанные в [1, 2] условия совершенного согласования для моделей активных систем аналогичны условиям не искажения сообщаемой агентами информации в [36].

4. Оптимальный механизм при вероятностной неопределенности в активной системе

Задача заключается в определении функции поощрения АЭ, когда центру известна только функция распределения неизвестного параметра, характеризующего функцию затрат АЭ. Формальная постановка задачи имеет следующий вид:

гв

К(ег')> sup [ inf Ф (y(r),CT(y(r)))dF(r),

0<a(-)<g ^н У(г>Г(/)

y(r) е 7(г) = Arg max(ö-(z) - г)) .

zeY(r )

Здесь а(.) - дважды кусочно-дифференцируемые функции; Дг) - абсолютно непрерывная функция распределения на [гн, гв], функция затрат г) определена в У (г) = [0, у (г)) , где у (г) - неубывающая функция, принимающая значения на числовой оси; ^(у, г) дважды непрерывно дифференцируема по любой из переменных, £(0,г) = 0, £у(у,г)>0, ¿¡Г(у,г)<0,

(У->г) > ¿¡уг (у, г) < 0 при у > 0, г > 0. Целевая функция центра имеет вид Ф(у, а(у)) = ц(у) - а а (у), ц(у) - неубывающая дифференцируемая функция.

Эта задача сведена к задаче

да

\[F(r(y,и)) -1][ф(у) - au]dy

^ min.

u

где и(у) = о(у), г (у, и) определяется из решения уравнения ¿¡у(у,г)=и относительном, 0<o■(y)<g.

Для решения этой задачи можно использовать принцип максимума Понтрягина. Гамильтониан имеет вид Н(у,и,Л) = [1 -Р(г(у,и)У\[ф(у) -аи\ -Ям . Оптимальная функция и(у,Я) определяется из условия максимума Н(у, и, Я) по и,

y

г(y) = ju(t,Ä(g))dt .

где параметр определяется из условия j u( y,A)dy = g.

0

y

а <У(У) = ш

0

Рассмотренная модель активной системы предполагает, что в момент выбора стратегии y АЭ знает реализовавшееся значение случайного параметра r. При этом выбор стратегии y соответствует совершенно согласованному плану для АЭ, если бы y назначалось центром для АЭ в качестве плана.

Первые результаты по построению оптимального механизма были сначала описаны в [15] для случая линейной функции затрат вида ¿%z, r) = z/r, затем в [22] - для кусочно-линейных функций. В [11] эти результаты представлены в виде решения одной из задач теории контрактов [35].

о

Отметим, что в работах [8, 9] рассматривалась также другая постановка задачи со случайными воздействиями, когда они накладываются на состояние АЭ после выбора им своей стратегии.

5. Оптимальные механизмы в условиях интервальной неполной информированности центра

Рассмотрим систему, состоящую из центра и одного АЭ. Пусть целевая функция центра Ф(х, y, r) и АЭ fx, y, r) = -- x(x, y) - Q(y, r) зависят от параметра r, значение которого активному элементу известно. Центру известны только границы отрезка A = [гн, rB], которому принадлежит значение этого параметра. Здесь a(y) - функция поощрения, x(x, y) - функция штрафов, Qy, r) - функция затрат, удовлетворяющая отмеченным выше свойствам.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Предполагается, что центр устанавливает механизм ц = (я(.), о(.),х(; .)), зная A = [гн, rB], допустимые границы переменных состояния и плана Y = X = [хн, xB], функцию затрат Q., .) и свою целевую функцию.

Определим показатель эффективности механизма K(ц) = inf[ inf ¥(л(р), g, r)/WB (r)],

re A peR(r)

где ¥(x, g, r) = inf Ф(х, y, g, r), Щ (r) - весовая функция,

yeZ (x,r ) в

Z (x, r) = <

R(r) =

{x}, если x e Arg max f (x, y, r), Argmax f (x, y, r) в противном случае,

yeY

{r}, если r e Argmax cp(n(p),r),

peA

Argmax cp(n(P), r) в противном случае.

pe A

Задача синтеза оптимального механизма / : K(ц*) = sup K(ц) - 8 .

цеМ

Механизм правильный, если Z(x, r) = {x}, R(r) = {r}. Для правильного механизма

K (Muv ) = mm^(n(r),n(r), r)/ ^ (r)].

F re A

Задача оптимальности правильных механизмов. Охарактеризовать множества допустимых механизмов М, для которых выполняется

K(jli) = maхК(/л} = max K(jli) .

¡иеМ /ieMRMnp

Рассмотрим множество допустимых механизмов M, определяемое ограничениями 0<^0<g,

X(x, У') - У) < "Х(У, У'), x, y, y' e Y, где ux(x, y) удовлетворяет неравенству «треугольника».

Теорема 3. Оптимальный механизм функционирования ^ определяется следующими выражениями:

K (к) = /,

I а, если rн < r < ¡3,

x = п * (r) = < _ (

7 [ q (7*, r), если ¡< r < rъ,

Х'(x,y) = ux(x,y),

0 при xн < x <а,

г х

<т* (х) = \ I (t,г' (t))dt при а < х < л (гв),

* а 7 7

g при п * (rв) < x < xB.

п * (гв )

7

g = J С (t,r*(t))dt < g.

Параметры а, [1 и функции £/, (у ,г), ?у (!) вычисляются, используя следующие утверждения и обозначения [16, 17].

Неравенство Ф(х, х, г) > у^¥в(г) представимо в виде неравенства д1(у, г) < х < д1(у, г), где д1(у, г) и д2(7, г) - непрерывные функции, если Ф(х, х, г) строго квазивогнута по х. Рассмотрим функции

и

— P

Ч\(Г,r) = max qi(r,р), q^ir,r) = min Чр(У,P),

rн<p<r r<p<rв

где qP (r, P) = min{ q2(r, PXxP (P) } •

ß = rB, если а> q (r, rB), либо ß определяется как решение

уравнения qi(r,ß) = а, если а < q (r, rв) • P(r) = [хн, xP(r)].

Полученные результаты обобщены и адаптированы для построения механизмов управления в двухканальных активных системах [29, 30].

На основе результатов, полученных для случая одного АЭ, построены правильные механизмы и определены условия их оптимальности в многоагентных системах со «слабо связанными» АЭ [19], а также в системах с сетевой структурой «технологических связей» [10, 20, 21, 31], описываемых графом без контуров. Слабая связанность АЭ понимается как взаимозависи-

n

мость АЭ через общий фонд поощрения G, когда ^ g. (р) < G .

1=1

6. Применение методов для задачи согласования границ разбиений в сетевых структурах

Рассмотрена задача согласования границ полигонов управления в крупномасштабных сетевых структурах между различными типами разбиений сети на полигоны. Определяются условия, обеспечивающих меньшие затраты на управление при совпадении границ полигонов одного типа разбиения с границами полигонов другого типа разбиения. Такого рода задачи актуальны при исследовании задач управления движением и обслуживанием инфраструктуры в транспортных сетях.

Управление функционированием распределенной системы, состоящей из разнотипных агентов, расположенных в вершинах и ребрах крупномасштабной сети, затруднительно без разбиения этой сети на комплексы полигонов управления. Примером такой системы является транспортная сеть, содержащая в своих вершинах и ребрах разнотипные объекты, такие как вокзалы, средства подвижного состава, автоматизированные системы регулирования движения, станции обслуживания движущихся средств,

службы по эксплуатации дорог и др. В транспортной сети разбиение на полигоны может раздельно осуществляться как для системы управления движением, так и для системы обслуживания инфраструктуры транспортной сети. Таким образом, существуют несколько типов разбиений сети, по крайней мере, как в вышеописанном примере, два типа. Аналогичные примеры разбиения сети на разные разбиения можно привести и в других областях, например, энергетике, связи и др.

Разбиение сети на полигоны порождает над ней иерархическую структуру управления. В свою очередь, формирование иерархической структуры управления приводит к появлению интересов у элементов этой структуры. Соответственно, эффективное функционирование такой системы управления требует решения задач согласования интересов и действий элементов иерархической структуры. Максимальная степень согласования разбиений соответствует заинтересованности элементов иерархии в полном совпадении границ разбиений различных типов.

Основную идею подхода к согласованию проиллюстрируем для двух типов разбиений. Пусть за первое разбиение отвечает некоторая структура в организационной системе, которую будем отождествлять с центром, а за второе разбиение отвечает структура, которую будем отождествлять с АЭ. Центр выбирает разбиение первого типа на сети, АЭ выбирает разбиение второго. Вводится понятие целевых функций Ц и АЭ, исходя из того, что у каждого из них имеются выгода от выбора того или иного разбиения и потери от несовпадения разбиений первого и второго типов. Потери АЭ можно интерпретировать как штрафы за несовпадение состояния (разбиение, выбранное АЭ) от плана (разбиение, установленное центром). В [24] вводится формальное описание этих потерь. Теперь задача свелась к построению согласованного механизма, рассмотренного выше, в разделе 1.

7. Механизмы управления в многоэлементных активных системах с дуальной сетевой структурой связей

Рассмотрим ориентированный граф О = (I, А) без контуров, где I обозначает множество, состоящее из п вершин, А - множество дуг. Для графа без контуров возможна такая нумерация

вершин, при которой все дуги (7, у) е А удовлетворяют следующему свойству: у > 7, если 7 - номер вершины, из которой выходит дуга, а у - номер вершины, в которую входит дуга. В [11] показана возможность такой нумерации вершин для графа без контуров; такая нумерация названа «правильной». Будем считать, что исходная нумерация вершин графа является «правильной». Для простоты и, по существу, без ограничения общности предположим, что конечная вершина графа, в которую входит хотя бы одна дуга и ни одной не выходит, единственна и имеет номер п. Обозначим J7 множество номеров вершин, от которых дуги направлены в вершину с номером 7.

Примем, что вершине с номером 7 соответствует агент,

принимающий решение у7, где 7 = 1, ..., п; у- еУ{(у1), у(у1) -множество допустимых решений 7-го агента, у1 = (у у, у е Ji} -набор решений агентов с номерами из множества 37. Будем считать, что множества У] (у1) компактны и у (у1) с У где У - множество с заданной топологией.

Пусть дугам соответствуют функции потерь Ау = Л7](к7уу]-, у,) > 0 за отклонение решения у7 от взвешенного решения к7ууу агента с номером у е J7, где ку - заданные коэффициенты, характеризующие соответствие решений у7 и уу агентов 7 и у, Л7](у7, у7) = 0. Для всех агентов определим целевые функции

¡1(х, у, у_1) = (у) - х(Х, у) _ X % (ку у у, у1 ) , где

}

у_1 = (л,..., у_1, у1+1,..., уп) - совокупность решений всех агентов за исключением 7-го агента; И7(уг) - функция дохода, либо функция затрат, 7-го агента от реализации решения у7; х(х7, у7) -штрафы, устанавливаемые Центром агенту за отклонение решения у7 от назначенного Центром плана х7, х7 е У, х(х7, у7) ^ 0, Хг(у„ уг) = 0.

В рассматриваемой системе связи между агентами определяются зависимостями множеств У] (у1) допустимых решений каждого агента от решений предшествующих агентов. Назовем их связями первого типа. Связи второго типа между агентами

определяются функциями потерь Лу = Лу(к¿у, у) > 0, включенных в целевые функции агентов. Наличие таких двух типов связей определяет дуальную структуру связей между агентами.

Будем считать, что коэффициенты ку таковы, что кууу е Y. Предположим, что функция Н(у) полунепрерывна сверху, а Xi(xi, yi) и Лу(к,уУу, у) полунепрерывны снизу по всем переменным, каждая из которых может принимать значение на множестве Y. Пусть также задана целевая функция центра F (х, y), где х - совокупность всех планов, y - совокупность решений всех агентов. Предположим, что F (х, y) также полунепрерывна сверху по всем своим аргументам.

Агенты последовательно в порядке их нумерации выбирают

*

решения yi из условия

(3) yi е Zi(х,y*i) = Arg max f (х, y,y!i).

УгеУг (y*)

Будем предполагать, что это равновесие существует. Обозначим Z = Z(х, %) множество стратегий всех агентов,

удовлетворяющих условию (3), и рассмотрим показатель эффек-

_ _ _ _*

тивности системы K(х,%) = inf F(х, y ) . Здесь зависи-

y"eZ(х,%)

мость множества Z от х и % обозначена потому, что предполагается, что Центр может выбирать механизм управления, т.е. планы xi и функции штрафов %(., .) из заданных множеств Y и 0г-. В качестве множеств ®i допустимых функций штрафов %(., .) будем рассматривать 0г = {%(.,.) | %(x,у) - %(x,v) < 6»(v,у), Vx, у, v е Y}, где $(., .) - заданные показатели роста для функций штрафов, удовлетворяющие неравенству «треугольника» dt(x, у) < di(x, v) + di(v, у) при Vx, у, v е Y. В общем случае проблема ставится следующим образом. Постановки задач.

1. Определить оптимальные планы и оптимальные функции _* _*

штрафов (х ,% ):

(4) K(х*,%) > _sup K(х,%)-s ,

(х ,%)еМ

где М = (Г, 0) - множество допустимых механизмов, 0 = (01, ..., 0п), £ - достаточно малое положительное число.

2. Определить условия выполнения агентами планов: у7 = х7, 7 = 1,..., П.

В случае когда все Лу = Л^ку у7) = 0, в [15, 17] для задачи (4) показано, что оптимальные планы содержатся в множестве согласованных планов, т.е. планов, которые агентам выгодно выполнять, а оптимальные функции штрафов совпадают с их показателями максимального роста в(х,у). Заметим, что в этом случае эти показатели характеризуют степень централизации: если в/(х, у) > вг2(х, у), то для штрафов с индексом 1 степень централизации выше, чем для штрафов 2.

Под стимулированием агентов будем понимать управление выбором решений агентов посредством назначения штрафа за отклонение решения от плана.

Теорема 4. Если /7(х7,у7) = в(х7,у7) для всех 7 = 1, ..., п и

Г Ф 0, то решения у = х представляют собой равновесия по

_* * _

Нэшу в игре п агентов, где х е X = {х, / х, е Р, (х_,), 7 = 1,..., п} ,

п

Р,(х_7) = {х, е У, (х7)|к, (xi) _ X %(%ху,х,) >

] =1 ) Ф7

п

> К(у,) _в,(х,,у,.) _ X %(Ьуху,у ), ^У, еУ,(у7)} .

]=1 ) ф,

Доказательство. Так как функции в7(х7, у7) удовлетворяют неравенству «треугольника», то I) (у_7) = 2, (х,. у_1).

щ^ЧУ1)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рассмотрим некоторый равновесный план х из множества X. Для плана х по определению множества X для всех агентов имеет место х* е 27 (х* , х_,). Отсюда вытекает справедливость неравенства

п п

к(х*) _ X %(кчх],х*) >(у,) _вi(х*,у,) _ X %(кух*],у) ]=1 ]=1 ]Фi

Анализ и синтез систем управления * _*

при всех у7 е Уь т.е. х* е р (х_/) . Теорема доказана.

Назовем р (х_) множеством условно согласованных планов, так как назначаемый агенту из р (х_1) план согласуется с интересами агента в том смысле, что ему выгодно выполнять этот план при условии выполнения планов остальными агентами.

Рассмотрим функции штрафов вида

п

(5) X(х, У) = Х°(х, У) + Е 5ч(х1' У/),

j я, у=1

где д у (Уj, У) > в у (Уj, УI) = тах[4(у ) _ 4 (^ Уj )]. Здесь

геУ

в7(х7, у7) характеризует показатель максимального роста функции потерь 7-го агента при отклонении его решения от выбора /-го агента

Теорема 5. Если функции штрафов всех агентов имеет вид (5), функции ^°(х7,у7) удовлетворяют неравенству «треугольника» и х/ ер0(X) = {хе У(X)|Лг-(х)>^(У)_X0(х,У),

_I _* _

У1 е У (х )} , то У = х как доминантные стратегии.

Доказательство. Рассмотрим выбор решения 7-м агентом при плане х^ е р0 (х') . Для того чтобы решение у7=х7, было выбрано агентом как доминантная стратегия, необходимо выполнение следующего неравенства при V у7, у/ е У

п

(6) ^(х) _ Е Лу'(куУу, х) >

п п

>Ь(У ')_Х°(х,У)_ Е 5у'(х,У')_ Е яу'(куУу,У').

Так как х^ е р0 (х1) по предположению, то И7(хг) >

> Ьг(уг) - Х°(х7,У7). Для справедливости (6) достаточно выполнения неравенств у7) > ^/(ку, уг) - Л^к/, у, Х7). Теорема доказана.

Теорема 5 определяет размер устанавливаемых Центром

штрафов для обеспечения выполнения планов агентами независимо от структуры сети и соотношения потерь Ау = ДД^у, у7) различных агентов. Учет специфики топологии сети и соотношений потерь агентов позволяет Центру «экономить» в размерах штрафов и порождает большое разнообразие постановок задач в зависимости от этой специфики. Здесь мы ограничимся простейшей из них.

Будем считать, что имеется выделенный агент, скажем, с номером I, влияние которого на другие агенты существенно превышает влияние окружающих агентов на него. Такая асимметрия выражается соотношениями Лт^цу, у!) < Дг(кгу, у/). Эти неравенства означают, что потери 1-го агента от несовпадения с решением любого другого агента меньше, чем потери этого агента от несовпадения его решения с решением 1-го агента. Более того, для простоты примем, что все к/ = 1 и влияние на 1-й со стороны остальных агентов равно 0, ¿¡¡(уь у/) > 0, ^/(у, уО = 0. Также предположим независимость множеств У7 от выбора решений предшествующими агентами. При сделанных предположениях рассмотрим возможность для Центра управлять принятием решений агентов опосредованно, воздействуя только на ¡-й агент.

Пусть Центр назначает !-му агенту план х7 из множества согласованных планов р = {хеУ11 Щ(х) >Щ()_(х,у/), у[ еУ{} , тогда у* = х1. Для агентов с номерами 7, отличающимися от I, план х7 не устанавливается и ^¡(., .) = 0. Рассмотрим множества

п

р = {х е^Щ (х) _ X % (у], х) > ]=1, ] ф, ,] ф1

п

> Щ (у,) _ %(x, у,) _ X %(у], у,), уу, е¥,}.

]=1, ] Ф,,] Ф1

Эти множества включают планы, которые будут выполняться агентами при наличии потерь от выбора решения ¡-м агентом.

Теорема 6 Если функция потерь Л7(х, у7) удовлетворяет неравенству «треугольника», О/ /0. где О/ = /} Р| /у. и X/ е О/.

М

то у = при всех / = 1, ..., п является равновесием по Нэшу;

п

если ЛЦ (XI, у) = Х1(X, у) + X 5ц (XI, у), то любой план Хъ

М, г=1

такой что х/ е Р/ Р , где я)" = = {х е1 /г;(у ) -¿/(х,)'^),

у, еУ,- }, определяет выбор решений агентов у, = х7 как доминантных стратегий.

Доказательство. Поскольку по предположению Яц(х, у,)

удовлетворяет неравенству «треугольника», то Р\ = (х/).

х,е¥

Поскольку по предположению Р/ Р| Р^ Ф 0, план х\, во-первых

М

выполняется 1-м агентом. Из X/ е.Р} = Zг■(x ) следует, что

х еГ

XI е Zг■(x) . Следовательно, у* = х7 является равновесием по Нэшу. Доказательство второй части утверждения использует логику доказательства теоремы 5. Пусть Центр назначил для

1-го агента план XI е Р{. Для того чтобы ,-й агент выбрал свое

*

решение у, = XI как доминантную стратегию достаточно выполнения для всех у,, уу е У следующих соотношений: п

(7) Ь, (х1) - X Л (у,, х1) > ]*',]=1

п п

> Ь (у,) -х1( х1, у,) - X 5]1(х1, у,) - X Л(У], у,). ]*,,]=1 ]*1,]=1

Так как по предположению Х[ е Р0, а следовательно, Н,(х) > И,(у,) - ^0(хг, у,), то для справедливости (7) достаточно выполнения неравенств ¿¡¡(х{, у,) > ^г(у, у,) - ^¿(у, хг). Теорема 3 доказана.

Множество Ql (X) по сути является областью влияния Центра на агенты через 1-й агент.

Теорема 6 определяет условия, при которых Центр может

устанавливать штрафы только одному агенту, занимающему «лидирующее» положение в рассматриваемой сетевой структуре. При этом определяются границы области влияния этого агента на свое окружение.

8. Заключение

Статья описывает, преимущественно в хронологическом порядке, исследования механизмов согласованного управления в организационных системах, выполненные автором или в соавторстве. Сюда включены исследования начиная с 1979 г. по настоящее время (2019 г.). Следует отметить, что статья не является полным обзором работ по рассматриваемой тематике, хотя необходимость такого обзора со сравнением и анализом работ многих авторов является весьма актуальной.

Изложенные в статье результаты могут быть использованы при разработке оптимальных механизмов стимулирования, обеспечивающих сообщение в Центр достоверных данных. Выводы разделов 5-6 статьи могут быть использованы при анализе и разработке механизмов управления в системах, имеющих сетевую структуру, например, сборочных производствах, а также при исследовании взаимного влияния агентов в социальных сетях.

Литература

1. БУРКОВ В.Н. Основы математической теории активных систем. - М.: Наука, 1977. - 256 с.

2. БУРКОВ В.Н., ЕНАЛЕЕВ А.К. Оптимальность принципа открытого управления. Необходимые и достаточные условия достоверности информации в активных системах // Автоматика и телемеханика. - 1985. - №3. - С. 73-80. Англ.: V.N. BURKOV, A.K. ENALEEV Optimality of the principle of open control. Necessary and sufficient conditions for reliability of information in active systems // Automation and Remote Control. - 1985. - Vol. 46, No. 3. - P. 341-348.

3. БУРКОВ В Н., ЕНАЛЕЕВ А.К., КОНДРАТЬЕВ В В. Двухуровневые активные системы. IV. Цена децентрализации механизмов функционирования // Автоматика и телемеханика. - 1980. - №6. - С. 110-116. Англ.: BURKOV V., ENALEEV A., KONDRAT'EV V. Two level Active systems. IV. The Cost of Decentralization of Operating Mechanisms. // Automation and Remote Control. - 1980. - Vol. 41, No 2. -P. 829-835

4. БУРКОВ ВН., ЕНАЛЕЕВ А.К., КОНДРАТЬЕВ ВВ., ЦВЕТКОВ А.В. Элементы теории оптимального синтеза механизмов функционирования двухуровневых активных систем. I Необходимые и достаточные условия оптимальности правильных механизмов функционирования в случае полной информированности центра // Автоматика и телемеханика. - 1983. - №10. - С. 139-144. Англ.: V.N. BURKOV, A.K. ENALEEV, V.V. KONDRAT'YEV, A.V. TSVETKOV Elements of the theory of optimal design for functioning mechanisms of two-level active systems. I // Automation and Remote Control. - 1983. -Vol. 44, No. 10. - P. 13561360.

5. БУРКОВ ВН., ЕНАЛЕЕВ А.К., КОНДРАТЬЕВ ВВ., ЦВЕТКОВ А.В. Элементы теории оптимального синтеза механизмов функционирования двухуровневых активных систем. II. Синтез оптимальных правильных механизмов функционирования в случае полной информированности центра // Автоматика и телемеханика. - 1984. - №11. -С. 86-92. Англ.: V.N. BURKOV, A.K. ENALEEV, V.V. KONDRAT'YEV, A.V. TSVETKOV Fundamentals of theory of optimal design for functioning mechanisms of two-level active systems. II // Automation and Remote Control. -1984. - Vol. 45, No. 11. - P. 1457-1463.

6. БУРКОВ ВН., ЕНАЛЕЕВ А.К., КОНДРАТЬЕВ ВВ., ЩЕПКИН А.В., МАРИН Л.Ф. Правильные механизмы функционирования организационных систем // В кн.: YIII Всесоюзное совещание по проблемам управления. Тезисы докладов. Книга 2. - Москва, Таллин: Изд. Института проблем управления и Госплана ЭССР, 1980. - С. 382-384.

7. БУРКОВ В Н., ЕНАЛЕЕВ А.К., ЛАВРОВ Ю Г. Синтез оптимальных механизмов планирования и стимулирования в активной системе // Автоматика и телемеханика. - 1992. -№10. - C. 113-120. Англ.: V.N. BURKOV, A.K. ENALEEV, YU.G. LAVROV. Design of optimal mechanisms for planning and stimulation in an active system // Automation and Remote Control. - 1992. - Vol. 53, No. 10. - P. 1579-1585

8. БУРКОВ ВН., ЕНАЛЕЕВ А.К., НОВИКОВ ДА. Механизмы стимулирования в вероятностных моделях социально-экономических систем // Автоматика и телемеханика. -1993. - №11. - С. 3-30. Англ.: V.N. BURKOV, A.K. ENALEEV, D A. NOVIKOV. Stimulation mechanisms in probability models of socioeconomic systems // Automation and Remote Control. - 1993. - Vol. 54, No. 11. - P. 1575-1598.

9. БУРКОВ ВН., ЕНАЛЕЕВ А.К., НОВИКОВ Д А. Вероятностная задача стимулирования // Автоматика и телемеханика. - 1993. - №12. - С. 125-130. Англ.: V.N. Burkov, A.K. Enaleev, D.A. Novikov A probabilistic stimulation problem // Automation and Remote Control. - 1993. - Vol. 54, No. 12. - P. 1846-1851.

10. БУРКОВ ВН., ЕНАЛЕЕВ А.К., СТРОГОНОВ В.И. Модели и структура управления разработкой и внедрением инновационных средств и технологий (на примере железнодорожного транспорта). II. Модель механизма стимулирования энергоэффективности и элементы структуры управления проектами // Управление большими системами. - 2018. -Вып. 76. - С. 219-238. - URL: https://doi.org/10.25728/ ubs.2018.76.7.

11. БУРКОВ ВН., ЗАЛОЖНЕВ А.Ю., НОВИКОВ ДА. Теория графов в управлении организационными системами. - М.: Изд-во Синтег, 2001. - 124с.

12. БУРКОВ В Н., КОНДРАТЬЕВ В В. Механизмы функционирования организационных систем. - М.: Наука, 1981. -384 с.

13. БУРКОВ ВН., КОРГИН НА., НОВИКОВ ДА. Введение в теорию управления организационными системами: учебник. - М.: Кн. дом «ЛИБРОКОМ», 2009. - 264 с.

14. ГЕРМЕЙЕР Ю.Б. Игры с непротивоположными интересами. - М.: Наука, 1978. - 327 с.

15. ЕНАЛЕЕВ А.К. Разработка механизмов стимулирования и управления в двухуровневых активных системах: автореф. дис... канд. техн. наук. - М: МФТИ, 1980. - 18 с.

16. ЕНАЛЕЕВ А.К. Оптимальный механизм функционирования в активной системе с обменом информацией // Управление большими системами. - 2010. - №29. - С. 108-127.

17. ЕНАЛЕЕВ А.К. Оптимальность согласованных механизмов функционирования в активных системах // Управление большими системами. - 2011. - №33.- С. 143-166. Англ.: ENALEEV A.K. Optimal incentive-compatible mechanisms in active systems // Automation and Remote Control. - 2013. -Vol. 74, No. 3. - P. 491-505.

18. ЕНАЛЕЕВ А.К. Оптимальные согласованные механизмы в активных системах и задачи теории контрактов // Управление большими системами. - 2014. - №49. - С. 167-182.

19. ЕНАЛЕЕВ А.К. Оптимальный согласованный механизм в системе с несколькими активными элементами // Проблемы управления. - 2015. - №3. - С. 20-28. Англ.: ENALE-EV A.K. Optimal incentive compatible mechanism in a system with several active elements // Automation and Remote Control. - 2017. - Vol. 78, No. 1. - P. 146-158.

20. ЕНАЛЕЕВ А.К. Модель оптимального согласованного механизма в цепочке активных элементов // Труды 9-й Международной конференции по исследованию операций, 22-27 октября 2018 г., Москва, Россия. - М.: МАКСПРЕСС, Москва, 2018. - Том 2. - С. 23-28.

21. ЕНАЛЕЕВ А.К. Оптимальность согласованных механизмов в сетевых организационных структурах // Проблемы управления. -2020. - №1. - С. 24-38.

22. ЕНАЛЕЕВ А.К., КАЗАХБАЕВА Г У. Стимулирование эффективности управления производственными процессами // В кн.: Вопросы создания АСУТП и АСУП. - Алма-Ата: Каз. ПТИ им. В.И. Ленина, 1983. - С. 44-52.

23. ЕНАЛЕЕВ А.К., ЛАВРОВ Ю.Г. Оптимальное стимулирование в активной системе со стохастическим элементом // Автоматика и телемеханика. - 1990. - №2. - С. 104-113. Англ.: A.K. ENALEEV, YU.G. LAVROV. Optimal incentives in an active system with a stochastic element // Automation and Remote Control. - 1990. - Vol. 51, No. 2. - P. 223-231

24. ЕНАЛЕЕВ А.К. Согласованные разбиения в сетевых организационных структурах // Проблемы управления. - 2016. -№6. - С. 18-25. Англ.: ENALEEV A.K. Coordinated Partitions in Organizational Network Structures // Automation and Remote Control. - 2018. - Vol., No. 79(2). - P. 337-349.

25. ЕНАЛЕЕВ А.К. Согласованное управление в многовариантных организационных сетевых структурах // Труды международной научно-практической конференции «Теория активных систем» (ТАС-2016), 16-17 ноября 2016 г. Москва, ИПУ РАН, 2016. - С. 297-299.

26. ЕНАЛЕЕВ А.К. Механизмы управления согласованием разбиений крупномасштабной сети // Материалы 10-й Международной конференции «Управление развитием крупномасштабных систем (MLSD'2017), 2-4 октября 2017 г., Москва, Россия. - М.: ИПУ РАН, Москва, 2017. - Т. 1. -С. 416-424.

27. ЕНАЛЕЕВ А.К. Консолидированные равновесия в согласованной активной системе с сетевой структурой // Материалы 10-й Всероссийской мультиконференции по проблемам управления (МКПУ-2017), 11-16 сентября 2017 г., с. Дивно-морское, Геленджик, Россия. - Изд-во Южного федерального университета, Ростов-на Дону, Таганрог, 2017. - Т. 3. -С. 23-25.

28. ЕНАЛЕЕВ А.К. Согласованное планирование и стимулирование в сетевой структуре // Труды совещания ВСПУ-2019, Москва, 17-20 июня 2019 г. - М.: Изд.: ИПУ РАН. -С. 2069-2073.

29. ЕНАЛЕЕВ А.К., САМАТОВ Р.А. Анализ и синтез механизмов управления в двухканальных активных системах // Системы управления и информационные технологии. - 2016. -№4(66). - С. 28-34.

30. ЕНАЛЕЕВ А.К., САМАТОВ Р.А. Пересчетные модели в двухканальных механизмах управления сложными строительными проектами // Системы управления и информационные технологии. - 201б. - №4.1(66). - С. 150-155.

31. КОРГИН Н.А. Неманипулируемые механизмы принятия решений в управлении организационными системами: авто-реф. дис... докт. техн. наук. - М: ИПУ РАН, 2014. - 48 с.

32. ENALEEV A.K. Optimal Mechanism at Network Active Systems // Proc. of 11th IEEE Conf. Management of Large-Scale System Development (MLSD'2018), Moscow. - 2018. - URL: https://ieeexplore.ieee.org/document/8551780.

33. ENALEEV A.K. Promoting the coincidence of different partitioning types at large-scale network // 10th IEEE Int. Conf. Management of Large-Scale System Development (MLSD'2017), Moscow, Russia. - IEEE Conference Publications, 2017. -URL: http://ieeexplore.ieee.org/document/8109616/.

34. ENALEEV A.K. Coordinated Management in Hierarchical Network Structures // Proc. of 12th IEEE Conference Management of Large-Scale System Development MLSD'2019. - Moscow: IEEE, 2019. - URL: https://ieeexplore.ieee.org/ document/8911041.

35. BOLTON P., DEWATRIPONT M. Contract Theory. -Cambridge, Mass & London, England: MIT Press, 2005. -740 p.

36. MASKIN E., DASGUPTA P., HAMMOND P. The Implementation of Social Choice Rules: Some General Results on Incentive Compatibility // Review of Economic Studies. - 1979. - Vol. 4б, No. 2. - P. 185-21б.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

COORDINATED MANAGEMENT MECHANISMS IN ACTIVE SYSTEMS

Anver Enaleev, V.A. Trapeznikov Institute of Control Sciences of RAS, PhD, senior researcher (anverena@mail.ru).

Abstract: The background and recent researches of the incentive compatible mechanisms in active systems performed by the author are presented. These include the correct mechanisms optimality with full awareness of the center, the optimality of open control principle, the optimality of the incentive compatible mechanisms with incomplete awareness of the center, building optimal incentive compatible mechanisms in network active systems, coordination of network partitions, mechanisms in multi-element active systems with a dual network communication structure. The first parts of the article bring together the methods of coordinated management published at different times, and the last part describes the new results of constructing and analyzing coordinated mechanisms for dual network structures based on the results of previous studies. The dual relationships of agents are determined by the totality of relationships between the sets of acceptable values of agent strategies, and the totality of relationships in the goal functions of agents.

Keywords: organization, equilibrium, management, coordination, planning, incentive compatibility, revelation, optimization.

УДК 06.35.51; 73.01.77 ББК 65

DOI: 10.25728/ubs.2020.83.1

Статья представлена к публикации членом редакционной коллегии Я.И. Квинто.

Поступила в редакцию 29.12.2019.

Опубликована 31.01.2020.

i Надоели баннеры? Вы всегда можете отключить рекламу.