Научная статья на тему 'МОДЕЛЬ УПРАВЛЕНИЯ ОГРАНИЧЕНИЯМИ ДЕЯТЕЛЬНОСТИ'

МОДЕЛЬ УПРАВЛЕНИЯ ОГРАНИЧЕНИЯМИ ДЕЯТЕЛЬНОСТИ Текст научной статьи по специальности «Математика»

CC BY
25
5
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Проблемы управления
ВАК
Область наук
Ключевые слова
ИНСТИТУЦИОНАЛЬНОЕ УПРАВЛЕНИЕ / ИЕРАРХИЧЕСКИЕ ИГРЫ С ЗАПРЕЩЕННЫМИ СИТУАЦИЯМИ / ДЕЦЕНТРАЛИЗАЦИЯ УПРАВЛЕНИЯ / INSTITUTIONAL CONTROL / GAMES WITH FORBIDDEN SITUATIONS / DECENTRALIZATION OF CONTROL

Аннотация научной статьи по математике, автор научной работы — Горелов М.А.

Рассматривается модель иерархической системы типа Центр - агент, в которой Центр управляет множеством выборов агента. Моделью такой системы является иерархическая игра двух лиц с запрещенными ситуациями. В этой игре Центр выбирает некоторое подмножество фиксированного множества, а агент осуществляет выбор своего управления из этого подмножества. Выигрыш агента явно зависит только от его собственного выбора, а выигрыш Центра зависит как от управления агента, так и от его собственного выбора. Зависимость выигрыша Центра от его выбора предполагается монотонной по отношению включения на множестве его стратегий. Ставятся задачи вычисления максимального гарантированного результата Центра в предположении доброжелательности агента и без такого предположения. Предлагается новое определение максимального гарантированного результата Центра в игре с доброжелательным агентом, корректное и в том случае, когда для некоторых стратегий Центра максимум выигрыша агента не достигается. Доказывается эквивалентность этого определения классическому определению Штакельберга в тех случаях, когда последнее корректно. В общем случае поставленные задачи предполагают вычисление максимина со связанными ограничениями на сложных бесконечномерных пространствах. Предлагаются методы, позволяющие существенно упростить эти задачи. В случае конечного основного множества предлагаются алгоритмы, позволяющие решать задачу за полиномиальное по числу элементов этого множества время. В случае бесконечного основного множества задача сводится к решению последовательности обычных задач оптимизации. Предлагаемые методы позволяют строить и исследовать многие содержательные модели подобного типа.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A MODEL OF MANAGING BUSINESS CONSTRAINTS

A model of hierarchical system of the Center - agent type is considered, in which the Center manages the set of agent’s choices. A model of such a system is a hierarchical two-person game with forbidden situations. In this game, the Center selects some subset of the fixed set, while the agent selects his control from this subset. The agent’s payoff explicitly depends only on his own choice, while the Center’s payoff depends both on the agent’s control and on its own choice. The dependence of the Center's payoff on its choice is assumed to be monotonic with respect to relation of inclusion on the set of its strategies. The tasks are set of calculating the maximum guaranteed result of the Center under the assumption of the benevolence of the agent and without such an assumption. A new definition is proposed of the maximum guaranteed result of the Center in the game with a benevolent agent, staying correct also in the case when the maximum of agent’s payoff is not reached for some of Center’s strategies. The equivalence of this definition to the classical definition of Stackelberg is proved in cases when the latter is correct. In general case, the problems posed assume the calculation of maximin with connected constraints on complex infinite-dimensional spaces. Methods are proposed that significantly simplify these problems. For the case of a finite basic set, algorithms are proposed that allow solving the problem in a polynomial time with respect to the number of elements of this set. For the case of an infinite basic set, the problem is reduced to solving a sequence of ordinary optimization problems. The methods proposed allow to build and explore many meaningful models of such type.

Текст научной работы на тему «МОДЕЛЬ УПРАВЛЕНИЯ ОГРАНИЧЕНИЯМИ ДЕЯТЕЛЬНОСТИ»

правление в социально-экономических системах

УДК 519.865 + 519.95 РС!: http://doi.org/10.25728/pu.2019.4.4

МОДЕЛЬ УПРАВЛЕНИЯ ОГРАНИЧЕНИЯМИ ДЕЯТЕЛЬНОСТИ

М.А. Горелов

Аннотация. Рассматривается модель иерархической системы типа Центр — агент, в которой Центр управляет множеством выборов агента. Моделью такой системы является иерархическая игра двух лиц с запрещенными ситуациями. В этой игре Центр выбирает некоторое подмножество фиксированного множества, а агент осуществляет выбор своего управления из этого подмножества. Выигрыш агента явно зависит только от его собственного выбора, а выигрыш Центра зависит как от управления агента, так и от его собственного выбора. Зависимость выигрыша Центра от его выбора предполагается монотонной по отношению включения на множестве его стратегий. Ставятся задачи вычисления максимального гарантированного результата Центра в предположении доброжелательности агента и без такого предположения. Предлагается новое определение максимального гарантированного результата Центра в игре с доброжелательным агентом, корректное и в том случае, когда для некоторых стратегий Центра максимум выигрыша агента не достигается. Доказывается эквивалентность этого определения классическому определению Штакельберга в тех случаях, когда последнее корректно. В общем случае поставленные задачи предполагают вычисление максимина со связанными ограничениями на сложных бесконечномерных пространствах. Предлагаются методы, позволяющие существенно упростить эти задачи. В случае конечного основного множества предлагаются алгоритмы, позволяющие решать задачу за полиномиальное по числу элементов этого множества время. В случае бесконечного основного множества задача сводится к решению последовательности обычных задач оптимизации. Предлагаемые методы позволяют строить и исследовать многие содержательные модели подобного типа.

Ключевые слова: институциональное управление, иерархические игры с запрещенными ситуациями, децентрализация управления.

ВВЕДЕНИЕ

В данной статье рассматривается модель, предложенная Д.А. Новиковым [1, 2]. Смысл исследуемых конструкций таков. Два игрока выбирают управление из заданного множества V Выбор производится в два этапа. Один игрок (Центр) фиксирует непустое подмножество множества V, из которого второй игрок окончательно выбирает управление. При этом предполагается, что второй игрок принимает решение рационально, а первый игрок знает его цели и потому в состоянии заранее оценить множество его оптимальных выборов. Считается, что выигрыш второго игрока зависит только от выбранного им управления, а выигрыш первого игрока зависит еще и от выбранного им множества, что обусловлено «тем, что введение тех или иных ограничений может потребовать от Центра определенных затрат».

Об интерпретации этой модели можно прочесть в работах [1, 2]. Она вызывает некоторые вопросы, но на этом вряд ли пока стоит останавливаться, поскольку модель можно обобщить или модифицировать так, чтобы снять возникающие проблемы.

Рассматриваемые задачи принадлежат новому классу: нужно найти оптимальное подмножество некоторого множества. Эффективных способов решения таких задач до сих пор не предлагалось. В работах [1, 2] отмечается сложность задачи и предлагается заменить ее поиском оптимального подмножества в каком-нибудь параметрическом семействе множеств. Но при этом чисто формально задача сразу переходит из упомянутого нового класса в класс обычных теоретико-игровых задач. А содержательно остается вопрос о выборе параметрического семейства. Если выбрать его «узким», то велика вероятность найти результат го-

раздо худший возможного. А если выбирать его «широким», то, скорее всего, возникнут проблемы с поиском оптимального подмножества в этом семействе. К данной модели обращались и другие авторы [3, 4], но эффективных способов решения предложено не было.

Этому и посвящена данная статья. Сразу же отметим, что трудно рассчитывать на то, что задачу удастся решить, не делая каких-то дополнительных предположений о характере функций выигрыша. В конце концов, даже обычную задачу оптимизации невозможно решить без подобных предположений (обычно налагают условия гладкости или выпуклости). Предположения типа гладкости или выпуклости в данном случае использовать затруднительно. Но есть другой путь.

Класс подмножеств данного множества частично упорядочен отношением включения. Поэтому можно предположить монотонную зависимость выигрыша первого игрока от его выбора. Далее рассматриваются неубывающие функции, что вроде бы соответствует приведенной в первом абзаце цитате. Формально можно рассмотреть и не-возрастающие функции, но эта задача совсем простая, а кроме того, не имеет убедительной интерпретации, поэтому не рассматривается.

Кроме того, налагаются стандартные топологические ограничения, а в случае отказа от предположения доброжелательности, еще и некие дополнительные ограничения, исключающие из рассмотрения в известном смысле вырожденные, редко встречающиеся задачи. В этих условиях удается найти достаточно конструктивные решения поставленных задач.

1. ОБЩАЯ ПОСТАНОВКА

Будем употреблять обозначения: Ф(Х, У) — класс всех функций, отображающих множество X в множество У, Е(Х) — семейство всех непустых подмножеств множества X, а ^(Х, У) — семейство всех точечно-множественных отображений, ставящих в соответствие каждой точке х е X непустое подмножество множества У Буква К, как обычно, обозначает множество действительных чисел.

Как отмечалось во Введении, в статье будет рассматриваться игра, в которой множество возможных выборов игрока нижнего уровня зависит от решения Центра. Поэтому адекватной моделью является игра с запрещенными ситуациями. Формализуется это следующим образом.

Игрой с запрещенными ситуациями или просто игрой будем называть набор Г = (Ц V О, g, к), где и и V — множества, О е V), а g и к —

функции из множества Ф(Цх V К).

Интерпретируется эта конструкция таким образом. Центр вправе выбрать любое управление

u е U. Если такой выбор сделан, то второй игрок может выбрать любое управление v из множества Q(u) с V Если игроки выбрали управления u и v, то они получат выигрыши g(u, v) и h(u, v) соответственно.

Чтобы замкнуть модель, нужно задать порядок ходов и отношение игроков к неопределенности. Далее будут применяться два подхода, восходящие к Ю.Б. Гермейеру и Г. фон Штакельбергу. В обоих случаях считается, что Центр обладает правом первого хода.

В таком случае проблем с описанием отношения второго игрока к неопределенности не возникает, поскольку если управление u Центра уже фиксировано, то результат второго игрока зависит только от его собственного выбора (т. е. неопределенности попросту нет). Поэтому ему следует выбирать управления из множества

BR(u) = • v е Q(u): h(u, v) = max h(u, ю) I. (1)

I ffl e 0(u) I

Если Центр знает интересы партнера, он может оценить это множество. Поэтому с гарантией он может рассчитывать на получение результата

R(r) = sup inf g(u, v). (2)

u e Uv e BR( u)

Можно сделать дополнительное предположение о доброжелательности второго игрока к Центру, т. е. считать, что из множества BR(u) он всегда будет выбирать то управление, которое лучше для Центра. В таком случае Центр может рассчитывать на получение результата

S(r) = sup sup g(u, v). (3)

u e U v e BR (u)

В данной статье будет рассмотрена игра специального вида. А именно, будем считать, что U = S(F), Q(u) = u для любого множества u с U, а функция h не зависит от u, т. е. h(u, v) = f(v).

Интерпретация такова. Сначала Центр выбирает ограничение u, налагаемое на второго игрока. После этого второй игрок вправе выбрать любое управление v из множества u, и его выигрыш зависит только от этого выбора. Выигрыш Центра тоже зависит от выбора второго игрока, но еще он несет некие затраты на отслеживание ограничения, поэтому его выигрыш зависит еще и от выбранного множества u.

Относительно вида функции g сделаем еще одно существенное предположение. Будем считать, что при любом фиксированном v эта функция монотонно зависит от u, т. е. включение u с w влечет неравенство g(u, v) < g(w, v).

Множество V будем считать наделенным топологией и компактным, функцию f непрерывной, а функцию g непрерывной по v при любом фиксированном u. Эти предположения достаточно стандартны.

Вычисление величин Я(Г) и ^(Г) в игре описанного вида будет основной задачей в данной статье. В одном отношении постановка этой задачи требует уточнения. Поскольку множество ы может быть достаточно произвольным, максимум в определении множества БЯ(ы) может и не достигаться. Поэтому формально отображение БЯ должно быть доопределено. Это будет сделано там, где потребуется, а начнем исследование с рассмотрения случая, когда этих проблем не возникает. А именно, будем сначала предполагать множество V конечным.

В этом случае множество и тоже будет конечным, поэтому формально игра Г будет представлять собой стандартную игру с запрещенными ситуациями. Однако понятно, что если множество V содержит п элементов, то вычисление величин Я(Г) и ^(Г) непосредственно по определениям, без учета специфики игры, потребует перебора 2" — 1 стратегий первого игрока, что в общем случае сложно. Поэтому задачу можно будет считать решенной, если удастся найти процедуру, требующую перебора полиномиального по п числа вариантов.

Рассмотрение конечной игры делает более прозрачным содержательный смысл дополнительных предположений и используемых идей. Кроме того, результаты, полученные для этого случая, формально не следуют из результатов для игр с бесконечными множествами V.

2. КОНЕЧНАЯ ИГРА ГЕРМЕЙЕРА

В данном параграфе будет принято следующее дополнительное предположение.

Гипотеза регулярности RD. Функция f такова, что для всех управлений v и ю из множества Vнеравенство v ^ ю влечет неравенство f(v) ^ f(ra). ♦

Обсуждение этого предположения отложим до конца параграфа.

Для действительного числа X определим множество D(X) = {v е V f(v) < X}, а для любого подмножества w множества V определим величину

l(w) = sup f(v).

v e w

Пусть u — произвольная стратегия Центра. Рассмотрим еще стратегию w = D(l(u)). По определению множества D и величины l имеем l(u) = l(w). В силу гипотезы RD каждое из множеств BR(u) и BR(w) состоит из одной точки, а потому BR(u) = BR(w) = {v0}. Кроме того, по построению u с w. Поэтому

inf g(u, v) = g(u, v0) < g(w, v0) = inf g(w, v).

v e u v e w

Таким образом, при поиске оптимальной стратегии Центра можно ограничиться рассмотрением множеств вида D(X).

Отсюда немедленно следует

Теорема 1. При сделанных предположениях имеет место равенство

Я(Г) = тах £ДО), у(Х)), (4)

Хе К.

где (единственное) управление у(Х) определяется условием /(у(Х)) = /(Щ(Х)). ♦

Понятно, что в этой теореме можно рассматривать лишь те значения Х, для которых найдется такое ю е V, что Х = /(ю). Поэтому для вычисления максимума в формуле (4) достаточно перебрать п значений функции /, а для поиска множества Щ(Х) и управления у(Х) для каждого Х потребуется перебор не более п вариантов. Таким образом, для вычисления величины Я(Г) имеем процедуру квадратичной сложности.

Обсудим содержание гипотезы RD. Согласно общепринятой стратегии, восходящей к А. Пуанкаре, исследование новых математических объектов следует начинать с исследования объектов общего положения и лишь затем переходить к изучению разного рода вырожденных случаев. Условие RD как раз и есть условие общности положения. Формализовать это можно разными способами. Например, так. Если число элементов п множества V фиксировано, то рассматриваемая игра вполне характеризуется упорядоченным набором чисел — выигрышей игроков. Такой набор можно рассматривать как элемент конечномерного линейного пространства (размерности п22"). Если рассмотреть на этом пространстве евклидову топологию, то при таком отождествлении играм, не удовлетворяющим условию RD, будет соответствовать множество первой категории (в смысле Бэра). Если на том же пространстве рассмотреть меру Лебега, то нерегулярным играм будет соответствовать множество меры ноль.

К чему приведет отказ от этого предположения? Нетрудно видеть, что в общем случае не удается избежать перебора подмножеств множества Щ*(Х) = {V е V. /(V) = Х}. Вообще говоря, число элементов множества Щ*(Х) может быть близко к числу элементов множества V, поэтому получить полиномиальный алгоритм не получается. Можно пробовать заменить гипотезу RD каким-то предположением, «увязывающим» зависимость функции g от двух ее аргументов, но достаточно естественных предположений такого рода не видно.

Наконец отметим, что при отказе от гипотезы RD задача вычисления величины Я(Г) становится неустойчивой. при (бесконечно) малом изменении значений функции / величина Я(Г) может измениться сильно. Поэтому задача вычисления величины Я(Г) в значительной степени теряет смысл. Осмысленным является вычисление верхней и нижней регуляризирующих оценок данной величины. Но это уводит слишком далеко от темы данной статьи.

3. КОНЕЧНАЯ ИГРА ШТАКЕЛЬБЕРГА

Величина S(r) вычисляется даже проще, и дополнительных предположений типа регулярности здесь не требуется.

Вновь рассмотрим произвольную стратегию u е U и сравним ее со стратегией w = D(l(u)).

Как и выше, устанавливается, что l(u) = l(w) и u с w. А поскольку по определению BR(u) = {v е u: f(v) = l(u)} и BR(w) = {v е w: f(v) = l(w)}, выполняется включение BR(u) с BR(w). Следовательно, max f(v) > max f(v). Таким образом, опти-

v e BR(w) v e BR(u)

мальную стратегию можно искать среди стратегий вида D(X).

Положим q(X) = max g(D(X), v). Тогда справедлива ve (I)

Теорема 2. Имеет место равенство

S(r) = max q(X). ♦

leR

В общем случае в рассматриваемой игре может существовать несколько оптимальных стратегий (например, если функция g постоянна, то оптимальной будет любая стратегия). В этой связи представляет определенный интерес

Следствие. Существует такая оптимальная стратегия u, что для любой оптимальной стратегии w выполняется включение w с u.

3. БЕСКОНЕЧНАЯ ИГРА ГЕРМЕЙЕРА

Обратимся к задаче вычисления величины R(r) в случае бесконечного множества V Теперь стратегия u с V может быть выбрана так, что верхняя грань sup f(v) не будет достигаться, и величина R(r)

v e V

окажется неопределенной. Поэтому определение максимального гарантированного результата требует уточнения. Сделаем это стандартным образом для игр общего вида.

Будем считать, что если верхняя грань sup h(u, w) достигается, то множество BR(u) оп-

w e П(u)

ределяется формулой (1), а в противном случае — формулой

BR(u) =

= • v е Q(u): h(u, v) > sup h(u, w) — к!>, (5)

I w e D(u) j

где к — некоторое фиксированное число. Величину R(r) будем определять той же формулой (2).

Далее вновь потребуется некое условие типа общности положения. Сформулируем его следующим образом.

Гипотеза регулярности RC. Для любого v е V и любого числа X выполняется равенство g(D(X), v) =

= g(D0(X), v), где D0(X) = {v е V f(v) < X}. ♦

Обсудим это условие на неформальном уровне. На самом деле в нем «спрятано» два содержательных предположения:

а) множество уровня ^*(Х) функции f представляет собой «маленькое» множество;

б) при неизменной стратегии V второго игрока выигрыш Центра не изменится, если к его стратегии «прибавить» маленькое множество.

Основной модельный пример таков: множество V — выпуклое подмножество конечномерного евклидова пространства с непустой внутренностью, функция f — непостоянный многочлен, а функция g может быть представлена в виде g(и, V) = ф(ц(и), V), где функция ф е Ф(К* V, К), а ц — внешняя (или внутренняя) мера Лебега. В этом случае условие ЯС заведомо выполняется.

Условие а) — это условие общности положения. В «типичном» случае множество уровня функции — это гиперповерхность, которая «имеет нулевую меру», имеет «первую категорию» и т. д. Взятые в кавычки термины можно определить точно и соответствующие утверждения доказать, но это выходит за рамки данной статьи.

Условие б) — это условие «непрерывности», которое вряд ли может вызвать возражение.

Весьма вероятно, что условие ЯС нельзя существенно ослабить, сохраняя при этом возможность конструктивного решения поставленной задачи. В то же время, можно подумать о том, чтобы его изменить, например, ослабив условие а), одновременно усилив условие б), или наоборот. Впрочем, особой нужды в этом пока не видно.

Приступим к решению поставленной задачи. Введем обозначения:

r(u) =

inf g(u, v),

e BR(u)

E(X) = \ v e D*(X): g(D(X), v) = max g(D(X), w) \.

[ w e D*(I) J

Фиксируем произвольную стратегию u e U. Рассмотрим еще стратегию w = D0(/(u)) U E(/(u)). Сравним результаты r(u) и r(w).

Выберем последовательность vp v2,... элементов

множества BR(u) так, что lim f(vk) = sup f(v) (если

kveu

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

максимум в формуле (1) достигается, эту последовательность можно выбрать постоянной). В силу компактности множества V можно, не ограничивая общности, считать, что эта последовательность сходится к элементу v0. Тогда в силу непрерывности функции f имеем f(v0) = /(u).

Поскольку элементы vk содержатся в множестве BR(u), выполняются неравенства g(u, vk) > r(u). Следовательно, в силу непрерывности функции g справедливо неравенство g(u, v0) > r(u). А так как

ы с б(1(ы)), то в силу монотонности g(D(l(ы)), У0) > > г(ы).

Непосредственно проверяется, что БЯ(м') = = Е(1(ы)). Поэтому для любого ю е БЯ(м') выполняются условия

g(D(l(ы)), Уо) < жты)), ю) = &ты)), V).

V е В К (н>)

Но так как по построению $°(1(ы)) с ^ с Б(1(ы)), то в силу монотонности для любого V выполняются неравенства g(D0(l(ы)), у) < g(w, у) < g(D(l(ы)), у). Но в силу условия ЯС имеет место равенство

g(D0(l(ы)), у) = g(D(l(ы)), у), поэтому g(w, у) = = g(D(l(u)), у) и, значит,

г(мг) = тГ g(w, V) = М ^в(1(ы)), у).

V е ВК( V) V е ВК (V)

Суммируя сказанное, получим неравенство г(ы) < г(т). Следовательно, среди стратегий, позволяющих с любой наперед заданной точностью получить результат Л(Г), непременно найдется стратегия, представимая в виде _О0 (X) и Е(Х) для некоторого числа X. Поэтому имеет место

Теорема 3. Справедливо равенство

ДГ) = Бир тах g(D(X), ♦

X е К. V е П*(Х)

Обсудим соотношение между условиями RD и ЯС. Если множество V конечно, то несложно понять, что условие ЯС выполняется только для тех функций g, которые не зависят от ы. Это малоинтересно. В свою очередь условие RD может быть выполнено только в том случае, когда размерность множества V не превосходит единицы, что тоже весьма ограничительно. Таким образом, теоремы 1 и 3 независимы. Обе они имеют смысл, но каждая — в своей области.

4. МАКСИМАЛЬНЫЙ ГАРАНТИРОВАННЫЙ РЕЗУЛЬТАТ

В ИГРЕ С ДОБРОЖЕЛАТЕЛЬНЫМ ВТОРЫМ ИГРОКОМ

Для того чтобы вычислять величину ^(Г) в игре с бесконечным множеством V, снова нужно уточнение определения. Вот с этим возникает проблема. Подобные модели рассматривались неоднократно, но в большинстве случаев точные определения отсутствуют.

Использовать идеи, примененные при уточнении определения величины Л(Г), не получается по следующим причинам. При определении множества рациональных ответов формулами (1) и (5) Центр «подталкивается» к тому, чтобы специально выбирать стратегию так, чтобы максимум в формуле (1) не достигался. Это плохо соответствует содержательным представлениям. По сформулированной причине результат ^(Г) будет зависеть от величины к. Это затрудняет как интерпретацию,

так и идентификацию получающейся модели. Кроме того, решения аналогичных задач оказываются весьма сложными (см., например, работу [5]). А потому применение полученных результатов становится затруднительным. Можно ожидать, что то же будет относиться и к нашему случаю.

Поэтому поступим следующим образом.

Для рассматриваемой нами задачи в предположениях, сделанных в § 2, справедлива

Лемма 1. Величина Л(Г) равна точной верхней грани чисел у, для которых существуют такие стратегия ы е и и число X е К, что выполняются условия:

— существует стратегия ю, для которой к(ы, ю) > X и g(ы, ю) > у;

— для любой стратегии V е V либо g(ы, ю) > у, либо к(ы, ю) < X. ♦

Эта лемма в дальнейшем не используется, поэтому ее доказательство опустим. О технике доказательства достаточно подробно говорится в работе [6]. Подобного рода конструкции неоднократно применялись и доказали свою полезность. Далее они применяются для определения величины £(Г).

Определение 1. Величина ^(Г) равна точной верхней грани чисел у, для которых существуют такие стратегии ы е и и число X е К, что выполняются условия:

1) существует стратегия ю е О(ы), для которой к(ы, ю) > X и g(u, ю) > у;

2) для любой стратегии V е О(ы) либо g(ы, у) > у, либо к(ы, у) < X.

Число у в этом случае называется гарантированным результатом. ♦

Содержательный смысл этого определения понятен. Если стратегия ы выбрана и известна второму игроку, то для него все свои стратегии V разбиваются на два класса: выгодные, для которых к(ы, ю) > X, и невыгодные, для которых к(ы, ю) < X. Понятно, что Центру следует выбирать свое управление так, чтобы все выборы партнера, дающие Центру недостаточно хороший результат, были невыгодны для второго игрока. За это отвечает п. 2 определения 1. В п. 1, во-первых, фиксируется существование выгодной стратегии второго игрока, а во-вторых, отмечается его доброжелательность.

Дополнительно обосновать целесообразность употребления этого определения можно, сравнив его с традиционным определением в том случае, когда последнее корректно. Поэтому докажем следующее утверждение.

Лемма 2. Пусть игра такова, что для любой стратегии ы е и максимум в формуле (1) и верхние грани в формуле (3) достигаются. Тогда величины, заданные формулой (3) и определением 1, совпадают.

Доказательство. Временно обозначим величину, задаваемую определением 1, через £0(Г). Нужно доказать равенство £(Г) = £0(Г). Начнем с доказательства неравенства £(Г) < £0(Г).

Выберем стратегию u е U так, что max g(u, v) =

v e BR(u)

= max max g(w, v) = S(r). Пусть управление ш е BR(u)

w e U v e BR(u)

удовлетворяет условию g(u, ш) = max g(w, v) = S(r), а

v e BR( u)

число X = max h(u, v).

v e q(u)

Тогда по построению для числа у = S(r) выполняется п. 1 определения 1. В силу выбора числа X для v е Q(u) выполняется неравенство h(u, v) < X, а значит и п. 2 определения 1. Следовательно, у — гарантированный результат, а потому у = S(r) < S0(r).

Теперь докажем обратное неравенство S(r) > S0(r). Фиксируем произвольный гарантированный результат у. Пусть стратегия u е U, число X е К и стратегия ш е Q(u) выбраны так, что выполняются п. 1 и 2 определения 1. Не ограничивая общности, можно считать, что X = max h(u, v).

v e q(u)

Действительно, если h(u, ш) = max h(u, v), то все

v e q(u)

очевидно. В противном случае выберем произвольный элемент ш0 так, что h(u, ш0) = max h(u, v). Тогда будет

v e q(u)

выполнено неравенство h(u, ш0) > X, и в силу п. 2 определения будем иметь g(u, ш0) > у. Но тогда для той же стратегии u, числа X0 = max h(u, v) и стратегии ш0 будет

v e q(u)

выполнен п. 1 определения 1. А п. 2 этого определения будет выполнен в силу неравенства X0 > X.

Но если X выбрано так, что X = max h(u, v), то стра-

v e q(u)

тегия ш, существование которой предусмотрено п. 1 определения 1, принадлежит множеству BR(u). Значит

у < g(u, ш) < max g(u, v) < max max g(u, v) = S(r).

v e BR(u) u e U v e BR(u)

В силу произвольности у отсюда следует неравенство S(r) > S0(r). Лемма 2 доказана.

Замечание. Условие леммы 2 можно немного ослабить. Это удлинит рассуждения, но ничего не изменит по существу. Поэтому более общий результат не рассматриваем.

5. БЕСКОНЕЧНАЯ ИГРА ШТАКЕЛЬБЕРГА

Приступим к вычислению величины S(r), понимаемой в смысле определения 1. Употребим прежние обозначения:

D(X) = {v е V f(v) < X}, D*(X) = {v е V f(v) = X}, q(X) = max g(D(X), v).

v e D*(I)

Справедлива

Теорема 4. Имеет место равенство S(r) = sup #(а).

ae R

Доказательство. Докажем сначала неравенство S(r) > sup q(X). Фиксируем произвольное число s > 0 и

выберем X так, что q(X) > sup q(a) — s. Положим u = D(X)

ct el

и выберем стратегию ш е D*(X) так, что g(u, ш) = = max g(u, v). Тогда число у = g(u, ш) будет гаранти-

v e

рованным результатом. В самом деле, п. 1 определения 1 выполнен, поскольку у = g(u, ш), и в силу выбора ш е D*(X) выполняется равенство h(u, ш) = X. А п. 2 определения 1 выполняется, так как для всех v е u = D(X) по определению справедливо неравенство h(u, v) < X. Таким образом,

S(r) > у = g(u, ш) = max g(u, v) = max g(D(X), v) =

v e v e

= q(X) > sup q(a) — s.

ct el

В силу произвольности s отсюда следует нужное неравенство.

Докажем теперь неравенство S(r) < sup q(X). Пусть

iel

у — произвольный гарантированный результат. Выберем стратегию u е U, число X е К и стратегию ш е Q(u) так, чтобы выполнялись п. 1 и 2 определения 1.

Положим a = sup f(v). Если f(ш) = a, то ш е D*(a) и

v e U

у < g(u, ш) < max g(u, v) < max g(D(a), v) = q(a)

v e d*(ct) v e d*(ct)

(здесь учитываются монотонность функции g и включение u с D(a)). В противном случае множество {v е u: f(v) > X} не пусто. Выберем последовательность vp v2, ...

элементов множества {v е u: f(v) > X} так, что lim f(vk) =

k ^ «

= sup f(v) = a. В силу компактности множества V мож-

v e u

но, не ограничивая общности, считать, что эта последовательность сходится к некоторому элементу v0. Так как f(vk) > X, в силу п. 2 определения 1 выполняются неравенства g(u, vk) > у (k = 1, 2, ...). Но тогда в силу непрерывности функции g имеем g(u, v0) > у. Но в силу непрерывности функции h выполняется включение v0 е D*(a), а потому

Y < g(u, v0) < max g(u, v) < max g(D(a), v) = q(a).

v e d*(ct)

v e d*(ct)

Итак, в любом случае у < q(a) < sup q(X). В силу произвольности у отсюда следует неравенство S(r) < sup q(X).

xeK

Теорема 4 доказана.

Следствие. При выполнении условия RC имеет место равенство R(r) = S(r).

Замечание. Из приведенных доказательств теорем 2 и 4 видно, что в качестве s-оптимальных стратегий Центра в данной игре всегда можно рассматривать замкнутые множества. Постановку основной задачи можно модифицировать, допустив в качестве стратегий Центра лишь компактные подмножества множества V. Такая задача тоже выглядит осмысленно. Из сказанного следует, что максимальный гарантированный результат Центра (и в смысле Гермейера, и в смысле Штакельберга) при такой модификации постановки не изменит-

ся. Можно показать, что в модифицированной игре максимальный гарантированный результат Центра в смысле определения 1 можно вычислять по формуле (3). Доказательство почти дословно повторяет доказательство леммы 2.

ЗАКЛЮЧЕНИЕ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Итак, удалось найти предположения, имеющие достаточно убедительные содержательные интерпретации, при которых рассматриваемые задачи допускают эффективное решение. Найденные решения выглядят достаточно просто. Поэтому можно подумать об исследовании более сложных и интересных моделей подобного типа. Наиболее перспективными представляются следующие направления исследования.

Стоит рассмотреть модели, учитывающие наличие внешнего неопределенного фактора и асимметричную информацию игроков об этой неопределенности.

Можно конкретизировать структуру стратегий Центра, предположив, что он имеет возможность получать информацию о выборе партнера. Возможно, в этом случае целесообразно учитывать наличие ограничений на объем этой информации.

Помимо того, что семейство подмножеств данного множества является частично упорядоченным множеством, оно еще является алгеброй относительно операций объединения и пересечения. Поэтому на вид функции выигрыша Центра вместо условия монотонности можно накладывать ограничения типа супераддитивности или субаддитивности. Можно подумать об интерпретации этих условий и решении рассмотренных выше задач в таких предположениях.

ЛИТЕРАТУРА

1. Новиков Д.А. Теория управления организационными системами. — М.: Физматлит, 2012. — 604 с. [Novikov, D.A. Teoriya upravleniya organizatsionnymi sistemami. — M.: Fiz-matlit, 2012. — 604 s. (In Russian)]

2. Новиков Д.А. Институциональное управление организационными системами. — М.: ИПУ РАН, 2003. — 68 с. [Novikov, D.A. Institutsional'noe upravlenie organizatsionnymi sistemami. — M.: IPU RAN, 2003. — 68 s. (In Russian)]

3. Алгазин Г.И. Централизация и децентрализация в базовых игровых моделях организационных систем // Управление большими системами. — 2012. — Вып. 36. — С. 144—172. [Algazin, G.I. Centralization and decentralization in basic game-theoretic models of organizational systems // Large-Scale Systems Control. — 2012. — Iss. 36. — Р. 144—172. (In Russian)]

4. Михеева Т.Н. Об эффективности институционального управления в теоретико-игровой модели корпоративной производственной системы с использованием принципов системного компромисса // Известия АлтГУ. — 2013. — № 1 (77). — С. 84—86. [Mikheeva, T.N. Ob ehffektivnosti in-stitutsional'nogo upravleniya v teoretiko-igrovoi modeli korpo-rativnoi proizvodstvennoi sistemy s ispol'zovaniem printsipov sistemnogo kompromissa // Izvestiya AltGU. — 2013. — No. 1 (77). — S. 84—86. (In Russian)]

5. Горелов М.А. Об одной гипотезе в основаниях теории иерархических игр // Управление большими системами. — 2010. — Вып. 28. — С. 5—23. [Gorelov, М.А. On a Basic Hypothesis of Hierarchical Games Theory // Automation and Remote Control. — 2013. — Vol. 72, No. 7. P. 345—354.]

6. Горелов М.А. Максимальный гарантированный результат в иерархических играх // Управление большими системами. — 2017. — Вып. 67. — С. 4—31. [Gorelov, М.А. Maximal guaranteed result in hierarchical games // Large-Scale Systems Control. — 2017. — Iss. 67. — Р. 4—31. (In Russian)]

Статья представлена к публикации членом редколлегии

Д.А. Новиковым.

Поступила в редакцию 18.03.2019, после доработки 4.04.2019.

Принята к публикации 22.05.2019.

Горелов Михаил Александрович — канд. физ.-мат. наук,

Федеральный исследовательский центр «Информатика

и управление» РАН, г. Москва, Н griefer@ccas.ru.

Abstract. A model of hierarchical system of the Center — agent type is considered, in which the Center manages the set of agent's choices. A model of such a system is a hierarchical two-person game with forbidden situations. In this game, the Center selects some subset of the fixed set, while the agent selects his control from this subset. The agent's payoff explicitly depends only on his own choice, while the Center's payoff depends both on the agent's control and on its own choice. The dependence of the Center's payoff on its choice is assumed to be monotonic with respect to relation of inclusion on the set of its strategies. The tasks are set of calculating the maximum guaranteed result of the Center under the assumption of the benevolence of the agent and without such an assumption. A new definition is proposed of the maximum guaranteed result of the Center in the game with a benevolent agent, staying correct also in the case when the maximum of agent's payoff is not reached for some of Center's strategies. The equivalence of this definition to the classical definition of Stackelberg is proved in cases when the latter is correct. In general case, the problems posed assume the calculation of maximin with connected constraints on complex infinite-dimensional spaces. Methods are proposed that significantly simplify these problems. For the case of a finite basic set, algorithms are proposed that allow solving the problem in a polynomial time with respect to the number of elements of this set. For the case of an infinite basic set, the problem is reduced to solving a sequence of ordinary optimization problems. The methods proposed allow to build and explore many meaningful models of such type.

Keywords: institutional control, games with forbidden situations, decentralization of control.

A MODEL OF MANAGING BUSINESS CONSTRAINTS

M.A. Gorelov

Dorodnicyn Computing Centre, Federal Research Center «Computer Science and Control» of Russian Academy of Sciences, Moscow, Russia

h griefer@ccas.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.