УДК 338.24.01
МЕХАНИЗМ ВЗАИМОДЕЙСТВИЯ В ОДНОУРОВНЕВОЙ СИСТЕМЕ С ТРАНСФЕРАБЕЛЬНОЙ ПОЛЕЗНОСТЬЮ
© 2005 В. Д. Богатырев
Самарский государственный аэрокосмический университет
В работе рассматривается задача управления одноуровневой системой с трансферабельной полезностью, которая решается путем построения механизма стимулирования с явными выплатами, реализующего оптимальную стратегию всей системы.
Традиционно в работах по управлению социально-экономическими системами рассматриваются организационные системы с фиксированной структурой, в которых одни участники выступают в роли управляющего органа - центра, другие в роли управляемых субъектов [3, 6, 10, 12, 13]. В последнее время большое внимание уделяется задачам синтеза оптимальной структуры [4, 8, 11, 14, 15].
В настоящей работе исследуется одноуровневое взаимодействие участников системы, когда все они являются равноправными партнерами без явного выделения управляющего органа. Необходимость изучения такого взаимодействия вызвана актуальностью решения ряда практических проблем по управлению социально-экономическими системами, например, задач управления поставками [1], задач управления проектами [5], задач антикризисного управления [2]. В ряде случаев взаимовыгодные всем участникам одноуровневой системы условия заключенного контракта становятся невыгодными для некоторых участников, например, из-за изменившихся условий внешней среды, неточностей при планировании. Тогда некоторые участники могут посчитать целесообразным изменить условия контракта и предложить остальным заключить контракт на новых условиях. Все это вызывает необходимость исследования механизмов управления одноуровневой системой, обеспечивающих заинтересованность всех участников в переходе к новым условиям контракта и устойчивость системы при новых условиях.
Рассмотрим одноуровневую систему,
состоящую из множества I = (1,2,3,...,#} ак-
тивных элементов, стратегией каждого из
которых является выбор действия уп е Уп
(п е I). Предположим, что элементы системы являются сильно связанными, то есть целевая функция каждого зависит от действия
всех 1п(у):¥ ^ где у = П Уп .
пе1
Совокупность (1,( /п( У))пе1,(уп)пе1 } множества элементов, их целевых функций
и допустимых множеств определяют игру Г0
в нормальной форме, в которой все элементы одновременно и независимо выбирают свои действия [9].
Пусть все элементы заключают контракт, согласно условиям которого элементы выбирают игровую ситуацию
ул = (У\ ,...,Уп ,...,Уы ) еУ, от которой им невыгодно отклоняться.
Если для п-го элемента выполняется следующее условие:
VУ-пеУ-пУУпеуп !п(уйп,у-п) ^!п(Уп,У-п), где
N
У-п = (У1 ,...,Уп-1 ,Уп+1 ,...,У#)еУ-п = ПУт -
т=\,т^п
обстановка игры для п-го элемента, то такой элемент имеет доминантную стратегию. Совокупность доминантных стратегий всех активных элементов называется равновесием в доминантных стратегиях (РДС).
Если выполняется
Уп е 1,Ууп е уп /п(уа„,у"п) > иУп,У<1-п),
то вектор действий у называется равновесием Нэша.
Пусть вследствие изменившихся каких-либо причин - условий внешней среды или устранения неточностей планирования - найдется игровая ситуация x еУ, обеспечивающая строго большую суммарную полезность,
чем ситуация yd:
N
ф(х,ул) = ^qn(x,yd) > °
n=1
где Vn(x,yd) = fn( х) - fn(yd).
Если вектор х не является единственным, то выберем произвольный элемент множества
Arg max Ф(y,yd ), и далее вектор х будем на-
ye У
зывать планом.
В этом случае некоторые элементы могут посчитать целесообразным изменение условия контракта и предложить остальным заключить контракт на новых условиях.
Для утверждения нового контракта необходимо согласие всех элементов, а для это -го новые условия должны обеспечивать не меньшие значения полезностей, чем при старом контракте. Если кто-то получает меньшую полезность, то новый контракт не заключается, и, следовательно, старый остается в силе. Поэтому элементам целесообразно разработать механизм управления взаимодействием в системе, то есть договориться о перераспределении полезностей (дохода), когда им всем выгодны переход от действия y d к действию x и соблюдение условий нового контракта. Система перераспределения полезностей является системой стимулирования, цель которой - заинтересовать все элементы в выполнении плана x.
Используя гипотезу благожелательности [6], задачу управления одноуровневой игрой в формализованном виде можно записать следующим образом:
max S
ПЄ0
n 1
—*) fn(y) - fn(yd)
y-Y(n)
Фактически решение задачи управления одноуровневой системой делится на два этапа. Первый этап - выбор оптимального
плана, обеспечивающего максимум Ф( х,ул ) в предположении его безоговорочного выполнения всеми элементами (решение данной подзадачи достаточно полно изучено и описано в литературе [7, 16]). Второй этап - выбор системы стимулирующих воздействий, обеспечивающих заинтересованность всех элементов в выполнении плана.
Определим потери каждого элемента
при реализации стратегии хп при условии, что все остальные реализуют стратегию
N
х-п = (х1 ,-,Хп-1 ,Хп+1 ,-,^)еУ-п = П ¥т :
Agn(x) =
maxfn(yn,xn) - fn(x)
yn — Yn
Разобьем все элементы одноуровневой системы на три группы (рис. 1):
I, ={г^1/п(х) + ^,(х) < /„(у1)}
12 = in - 1
fn(x) + Agn(x) > fn(yd),\
Agn(x) > 0
13 =
f f 1 fn (x, fd) ^ 0 и Agn (x) = о}.
где п е © - система стимулирующих воздействий, приводящая к возможным ситуациям из множества У (п).
Очевидно, что I = I, и I2 и 13 и
I, П 12 П 13 =0 .
В первую группу попадут элементы (п е I,), которые «проиграли» при переходе
от игровой ситуации ул к ситуации х, т. е. ^п(х,ус1) < 0, и которые не могут увеличить свою полезность по сравнению со старым контрактом, т. е. тах/п(Уп,х-п) < 1п(Уй).
Уп е Уп
Этим элементам достаточно компенсировать полезность до уровня старого контракта
/п(ул ), чтобы они согласились на условия нового контракта.
m=1.m£n
Рис. 1. Распределение элементов по группам
Во второй группе окажутся элементы ( n е 12), из которых при переходе от игровой
ситуации yd к ситуации x одна часть проиграла: tyn(x,yd) < 0, а другая часть выиграла
- tyn(x,yd) > 0, но все они могут увеличить
свою полезность по сравнению со старым контрактом и с новым контрактом, если выберут действие, отличное от плана
max fn(yn,x-n) > fn(yd ). Элементам в
Уп eYn,yn *xn
этой группе необходимо оставить их новую полезность и, кроме того, компенсировать
каждому потери в размере Agn (x), чтобы им было невыгодно отклоняться от выполнения плана.
Третья группа ( п є І3) будет состоять из
выигравших элементов фп( х,уа ) > 0, кото -рые не могут улучшить свою полезность по сравнению с новым контрактом: Agn (х) = 0 . Эта группа будет делиться полезностью с предыдущими двумя.
Тогда новые целевые функции элементов примут вид:
Уп є1 ^(х,и\,у) = /п(у) + £и\т(хп,уп),
ШЄІ3
^ є 12 К(х,и1 ,У) = !п(У) + £ и2пт(Xn,Уn),
тєІз
^ЄІ3 Рт(х,ит,У) = їт(У) ~
— £ и1 (х , У ) — £ и 2 (х ,У ),
т т
пєІ
пєІ2
где ипт > 0 - полезность (доход), которой т - ый элемент (те 13) делится с п-ым
элементом (п е11 и 12); и\ = (и \т)те13 , и п (и пт)т е 1з , ит пт)пе 1, ,(и пт)пе 12 } -
вектора изменений целевых функций для элементов из первой, второй и третьей групп, соответственно. Таким образом, система стимулирующих воздействий представляет со-
Ґ
бой п = и =
т є Із
Для того, чтобы перераспределение полезностей стимулировало элементы к выполнению плана х, предлагается использовать компенсаторную систему [5-7, 9-14]:
и1 (х ,у ) =
п т ' п ’ у п /
и
У п = х п Уп * х п
Элементы из третьей группы согласятся на новый контракт, только если дополнительный эффект, получаемый каждым из них
при переходе от ситуации уа к ситуации х, не меньше, чем полезность, перераспределяемая в пользу элементов из первой и второй групп:
Утє І з фт(х,уй ) >£ и1 + £
т т
пЄІі пЄІ 2
(4)
Утверждение 1. Для любого элемента при фиксированной системе стимулирования вида (1), удовлетворяющей неравенствам (2), (3), (4), вектор действий х является равновесием Нэша:
Еы( х) = \ хєУ
Vп є ^ ^у п є Уп 1
Рп(х,и,х) > рп(х,и,у п,х—п)1
Доказательство утверждения 1. Последовательно рассмотрим все три группы элементов.
Для первой группы подставим и в условие равновесия Нэша:
и2 (х ,у ) =
т
и
У п = х п У п * х п ’
(1)
когда элементы из третьей группы делятся с остальными, только если последние выполняют план х.
Система и должна удовлетворять ряду условий. Сумма полезностей, полученная каждым элементом из первой группы, долж-
Упє І1 УУп * х„ / п(х) +£ и!т >
тєІз
> /п(Уп,х—п ) + 0,
£ и1 > Л( у п, х—п)—А(х).
тєІз
Вектор и\ выбирается с учетом (2): на обеспечивать достижение уровня !п(Уа): уПе I, £ипт >-фп(х,уЛ), поэтому
^п є Л £ и \т >—Ф п(х,Уй).
(2)
тєІз
Для элементов второй группы суммарная полезность, перераспределяемая в пользу каждого из них, должна быть не меньше по-
терь от реализации действия хп:
Уп є І2 £ и1т >^п(х).
тєІз
(з)
Уп є І1, Ууп * хп £ и1т >—Фп(х,УЛ) >
тєІз
> /п(Уп,х—п) — fn(x),
—(Л(х)—їп (уй)) > Л(уп, х—п)—!п(х) /п(уЛ) > тах/п(Уп,х—п) > /п(Уп,х—п).
УпєУп
2
2
и
и
2
пт
пт
0
0
/т (х) = тах /„ (уп , х-п ) > /т (ут , х-т ).
упеУп
Последнее неравенство выполняется, так как все элементы в первой группе удов -летворяют этому условию.
Аналогично для второй группы элемен-
2
тов подставим ип в условие равновесия Нэша:
У„ е ^ , Ууп * хп /п(х) + £ и1т >
mе1з
> /п(уп,х-п) + 0
£ и1т > /п (уп, х-п ) - /п (х).
те1з
Последнее условие выполняется, так как и2п выбирается с учетом (3):
Уп е 12 £ иПт >ЛЕп(х) ;
те13
Уп е 12 , ууп * хп £ и1т >^п(х) >
те13
> /п(уп,х-п) - /n(x),
тах /п(уп, х-п) - /п (х) > /п(уп, х-п) - /п (x),
упеУп
тах/п (уп, х-п) > /п(уп, х-п).
упеУп
Элементы из третьей группы могут выбрать действие, отличное от плана, но не могут отклониться от перераспределения полезности в пользу элементов из первой и второй групп, так как выплаты являются обязательным условием контракта и производятся при выполнении плана остальными элементами:
Ут е Л, У у * х / (х)-£ и1 (х , у ) -
3’ у т т т' / / -< пт\ п’ У п/
пе1,
- £ и2 (х , у ) > / (у ,х ) -
пт\ п у п / у т \ у т ’ -т /
пе12
-£и1 (х ,у )-£и2 (х ,у ),
т т
пе11 пе12
/т (х) > /т (ут , х-т ),
Последнее условие выполняется, так как для всех элементов в третьей группе
Л?п(х) = °.
Возможность предложить всем элементам новый контракт, обеспечивающий заинтересованность в выполнении плана и не меньшую полезность, чем при старом, описывается утверждением 2.
Утверждение 2. Условие реализации согласованного взаимодействия в системе следующее:
Ф(х,уй) >£[ (хУ ) + Л?п(х)] (5)
пе12
В том случае, когда неравенство (5) не выполняется, в системе реализация плана х, при котором достигается максимальная суммарная полезность, невозможна.
Рассмотрим частный случай - систему со слабо связанными элементами, когда полезность каждого не зависит от действий других, но при этом существует одно общее для всех ограничение. Все элементы делятся на группы: в первой - элементы, получающие дополнительную полезность, а в третьей - элементы, перераспределяющие полезность. Второй группы нет, так как
УпеI тах/п(уп) = / п(уйп) . Если в тре-
уп еУп
тьей группе один элемент, то условия выбора размеров перераспределяемых полезностей (2), (3), (4) сводятся к упрощенной системе:
Фт(х,уЛ) >£ ип,(т е 13 )
пе11
Упе 11 ип >Л?п(х) ,
то есть, с одной стороны, дополнительный
эффект Фт(х,ул) элемента из третьей группы должен быть не меньше суммы выплат
£ и п, а, с другой стороны, каждый элемент
пе11
из третьей группы должен получить допол-
нительную полезность и не меньшую, чем
его потери Л?п (х) при выполнении плана.
Таким образом, описаны условия нового контракта, который предлагается элементам одноуровневой системы и предусматривает выполнение плана х, обеспечивающего большую суммарную полезность, а также взаимные выплаты. Элементы делятся на три группы: первая и вторая группы содержат элементы, которые будут получать дополнительную полезность при выполнении плана, а третья группа - элементы, которые будут делиться полезностью. Предлагаемая в новом контракте система взаимных выплат фиксирована условиями (1)-(4) и обеспечивает каждому элементу полезность не меньше, чем при старом контракте, и, кроме того, ни один элемент в одиночку не может увеличить свою полезность, отклонившись от плана (утверждение 1).
Перспективным направлением дальнейших исследований является изучение взаимодействия для максимально широкого круга систем с целью построения механизмов управления организационными системами, удобных для использования на практике.
Список литературы
1. Богатырев В. Д. Модели механизмов взаимодействия в активных производственно - экономических системах. - Самара: СНЦ РАН, 2003.
2. Богатырев В. Д. Модели и механизмы согласованного взаимодействия в задачах антикризисного управления. - Самара: СНЦ РАН, 2004.
3. Бурков В. Н. Основы математической теории активных систем. - М.: Наука, 1977.
4. Бурков В. Н., Кузнецов Н. А., Новиков Д. А. Механизмы управления в сетевых
структурах // Автоматика и Телемеханика. -
2002. № 12. - С. 96 - 115.
5. Бурков В. Н., Новиков Д. А. Как управлять проектами. - М.: Синтег-ГЕО, 1997.
6. Бурков В. Н., Новиков Д. А. Теория активных систем: состояние и перспективы. -М.: Синтег, 1999.
7. Вагнер Г. Основы исследования операций. Т.1, Т.2. - М.: Мир, 1972.
8. Воронин А. А., Мишин С. П. Оптимальные иерархические структуры. - М.: Институт проблем управления Российской Академии Наук, 2003.
9. Гермейер Ю. Б. Игры с непротивоположными интересами. - М.: Наука, 1976.
10. Губко М. В., Новиков Д. А. Теория игр в управлении организационными системами. - М.: Синтег, 2002.
11. Новиков Д. А. Сетевые структуры и организационные системы. - М.: ИПУ РАН,
2003.
12. Новиков Д. А. Стимулирование в организационных системах. - М.: Синтег,
2003.
13. Новиков Д. А., Цветков А. В. Механизмы стимулирования в многоэлементных организационных системах. - М.: ИПУ РАН, 2001.
14. Новиков Д. А., Цветков А. В. Механизмы функционирования организационных систем с распределенным контролем. - М.: ИПУ РАН, 2001.
15. Мишин С. П. Оптимальное стимулирование в многоуровневых иерархических структурах // Автоматика и телемеханика. -
2004. № 5. - С. 96-119.
16. Фролькис В. А. Введение в теорию и методы оптимизации для экономистов. 2-е изд. - СПб: Питер, 2002.
INTERACTION MECHANISM IN A SINGLE-LEVEL SYSTEM WITH TRANSFERABLE UTILITY
© 2005 V. D. Bogatyrev
Samara State Aerospace University
The paper deals with the problem of managing a single-level system with transferable utility which is solved by constructing an incentive mechanism with obvious payments, realizing an optimal strategy of the whole system.