Научная статья на тему 'Сетевые активные системы: модели планирования и стимулирования'

Сетевые активные системы: модели планирования и стимулирования Текст научной статьи по специальности «Экономика и бизнес»

CC BY
93
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Проблемы управления
ВАК
Область наук
Ключевые слова
АКТИВНАЯ СИСТЕМА / ACTIVE SYSTEM / КОМПЛЕКСНАЯ ДЕЯТЕЛЬНОСТЬ / COMPLEX ACTIVITY / РАСШИРЕННОЕ ПРЕДПРИЯТИЕ / EXTENDED ENTERPRISE

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Белов Михаил Валентинович, Новиков Дмитрий Александрович

Введены в рассмотрение и исследованы модели сетевых активных систем, включающих в себя конечное множество взаимодействующих в рамках заданной сети агентов, характеризуемых технологией своей деятельности (зависимостью результатов их деятельности от собственных действий и результатов деятельности других агентов). Поставлены и решены задачи стимулирования и планирования. Обсуждены возможности применения сетевых активных систем для моделирования и оптимизации деятельности расширенных предприятий.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Models of network active systems including a finite set of agents interacting within a given network, characterized by the technology of their activity (the dependence of the results of their activity on their own actions and the results of the activity of other agents) are introduced and examined. The tasks of stimulation and planning are set and solved. The possibilities of using network active systems, for modeling and optimizing the activities of extended enterprises are discussed.

Текст научной работы на тему «Сетевые активные системы: модели планирования и стимулирования»

У

правление в социально-экономических системах

УДК 519.21;519.714.3;681.518

СЕТЕВЫЕ АКТИВНЫЕ СИСТЕМЫ: МОДЕЛИ ПЛАНИРОВАНИЯ И СТИМУЛИРОВАНИЯ1

М.В. Белов, Д.А. Новиков

Введены в рассмотрение и исследованы модели сетевых активных систем, включающих в себя конечное множество взаимодействующих в рамках заданной сети агентов, характеризуемых технологией своей деятельности (зависимостью результатов их деятельности от собственных действий и результатов деятельности других агентов). Поставлены и решены задачи стимулирования и планирования. Обсуждены возможности применения сетевых активных систем для моделирования и оптимизации деятельности расширенных предприятий.

Ключевые слова: активная система, комплексная деятельность, расширенное предприятие.

ВВЕДЕНИЕ

В работе [1] предложены общие модели логической, причинно-следственной и процессной структур деятельности. Их общность, с одной стороны, позволяет единообразно описывать любую комплексную деятельность (КД), реализуемую организационно-техническими системами (ОТС), а с другой стороны, требует развития адекватного математического аппарата, позволяющего конструктивно анализировать и оптимизировать КД.

Управление КД и осуществляющими ее ОТС, согласно работе [1], заключается в оказании воздействия на КД и ОТС, призванного обеспечить поведение объекта управления (КД и ОТС), приводящего к достижению целей субъекта управления. Так как комплексная деятельность и реализующая ее ОТС составляют сложную систему (систему, состоящую из систем), для их операционального описания и изучения необходимы множественные модели, каждая из которых отражает определенную совокупность свойств КД и ОТС. Одним из существенных свойств КД и ОТС как объекта управления является активность ОТС (ОТС в целом или ее элементов) как субъекта КД. Активность объекта управления (или его элементов) побуждает использовать соответствующие модели и привлекать адекватный математический аппарат для исследования и решения задач управления КД и

1 Работа выполнена при частичной финансовой поддержке Российского научного фонда (грант № 16-19-10609).

ОТС. Рассмотрению именно этого аспекта и разработке математических моделей и методов посвящена данная работа, расширяющая теорию активных систем на случай управления субъектами комплексной деятельности.

Логическая структура КД описывает структуру целей КД и вместе с ней отношения подчиненно -сти и ответственности элементов КД и их субъектов. Логическая структура, как правило, иерархич-на, в то время как причинно-следственная и процессная структуры лучше описываются (на заданном уровне детализации) сетями.

Аппарат теории графов, давно и успешно применяемый для описания транспортных, производственных, социальных, экономических и других сетей (см. обзоры в работах [2, 3]), управления проектами [4, 5] и др., не всегда позволяет учитывать целенаправленность субъектов д еятельности — элементов ОТС, агентов (как ее учитывают, например, теоретико-игровые модели, используемые в теории активных систем и в смежных с ней науках [6]). Поэтому возникает необходимость разработки и исследования класса моделей, «интегрирующих» сетевую структуру ОТС и активность ее элементов, которые далее предложено называть сетевыми активными системами (САС).

Изложение материала настоящей работы имеет следующую структуру. В § 1 приведена общая модель САС, в § 2 — задача планирования и методы декомпозиции игры агентов. Важный результат, полученный в работе, заключается в доказательстве возможности независимого стимулирования субъектов КД: в § 2 показано, что оптимальная сис-

тема стимулирования может быть задана для каждого из агентов автономно и что она не зависит от причинно-следственной структуры КД и совокупности технологических функций нижестоящих элементов КД. Параграфы 3 и 4 посвящены частным случаям — производственной функции Леонтьева (отражающей технологию деятельности агентов) и последовательной структуре САС (производственной цепочке) соответственно. В § 5 кратко рассмотрена постановка задач календарного планирования в САС, в § 6 — использование САС в качестве моделей расширенных предприятий. В § 7 обсуждены возможности применения аппарата иерархических игр для моделирования САС, в § 8 описаны «фрактальные» САС. В Заключении приведены перспективные направления будущих исследований САС.

1. ОБЩАЯ МОДЕЛЬ СЕТЕВОЙ АКТИВНОЙ СИСТЕМЫ

Рассмотрим конечное множество N = {1, 2, ..., п} агентов, п > 2, и сеть О = (^ Е) (ориентированный связный граф без циклов), вершины которой соответствуют агентам, а множество дуг Е с NsN отражает «технологические» связи между агентами, причем номера агентов образуют правильную нумерацию [4] вершин сети. Обозначим через Ni = {у е у; г) е Е} множество предшественников 1-го агента в сети О, i е N.

Предположим, что сеть имеет единственный выход (вершину, не имеющую исходящих дуг) — п-ю вершину. Обозначим через М0 с N множество входов рассматриваемой сети (вершин, не имеющих входящих дуг), через Мк — множество вершин, в которые входят дуги только из вершин, принадле-

жащих множествам {М}, у = 0, к - 1 (число к(г) называется рангом вершины i, принадлежащей множеству Мк), к = 1, т, т < п — 1, Мт = {п}. Набор множеств {Мк}, к = 0, т, является разбиением мно-

к - 1

жества N. Обозначим через Мк = У Мк, к = 1,

У = о

т,

и положим М = 0.

Пусть г-й агент характеризуется своими скалярными действием у1 > 0 и результатом деятельности > 0. Обозначим через уБ вектор действий агентов из множества Б с N, через 7Б — вектор результатов деятельности агентов из этого множества. Связь результата деятельности агента с его действием и используемыми им в процессе этой деятельности результатами других агентов определя-

М +1 1

ется «технологической функцией» Ог: ЭТ+ ^ ЭТ+, т. е. 7 = 7N.); для г е М0 имеет место N. = 0,

поэтому положим 7 = О (У , 70), 70 — ^-мерный вектор «входов» сети. Отметим, что рассматриваемая модель агента подразумевает, что выход агента един для всех его последователей (множество последователей г-го агента определим как Щ = {у е N|(г; у) е Е}), т. е. эта модель имеет условную структуру «несколько входов, действие, один результат». Более общим (но выходящим за рамки настоящего исследования) является случай структуры «несколько входов, действие, несколько результатов».

Совокупность множества агентов N (быть может, с их интересами и предпочтениями), сети О и набора {•)} технологических функций назовем сетевой активной системой. Допустим, что выполнено Предположение А.1. Функция (•, 7м.) взаимно однозначна, т. е. при заданных результатах деятельности предшественников агента его действие однозначно определяет результат его деятельности, и наоборот — зная результаты деятельности агента и его предшественников, можно однозначно восстановить его действие, г е N. ♦

Модель САС имеет д ва обширных класса содержательных интерпретаций.

Первый — описание технологии совместной деятельности агентов, рассматриваемой в рамках методологии комплексной деятельности [1], или управления проектами [6], или управления производственными системами [7, 8]. При этом, как правило, вариантов (комбинаций результатов деятельности агентов) достижения заданного результата САС (значения выхода сети) не много (технология «жесткая», т. е. технологические функции обычно удовлетворяют предположению А.3 — см. далее).

Второй класс содержательных интерпретаций — системы оценки деятельности (комплексного оценивания [7, 9], агрегирования информации [10] и т. п.), когда требуется комплексировать набор значений частных показателей в один или несколько более общих показателей. При этом число вариантов, приводящих к одному и тому же агрегированному результату, как правило, велико (технология «мягкая», т. е. технологические функции обычно удовлетворяют предположению А.1, но не удовлетворяют предположению А.3).

Выбор действия у{ требует от г-го агента затрат с.(у), где для функции затрат выполняется

Предположение А.2. с{(-) — гладкая строго монотонно возрастающая положительнозначная выпуклая функция затрат, г е N. ♦

Таким образом, технология деятельности г-го агента описывается кортежем с.(*), •)).

Предположим, что г-й агент получает за результат 7г своей деятельности вознаграждение (стиму-

лирование) ст.(7) > 0. Также предположим, что каждый агент рационален, т. е., выбирая свое д ействие у { > 0, 1-й агент, I е Мк, стремится максимизировать свою целевую функцию /(у к(), у), представляю-

I ]М *

щую собой разность между вознаграждением и затратами:

/(Умк(0, у) = ст¡(Q¡(yг., (умк(,)))) - с/у^

I е N.

(1)

В частности, САС является обобщением модели «производственных цепочек» [11] на случай сетевой структуры.

Сформулируем задачу стимулирования в САС. Обозначим через стБ вектор-функцию стимулирования агентов из множества Б с N. Предположим, что агенты выбирают свои действия однократно, одновременно и независимо, причем сеть О = (М, Е), технологии деятельности всех агентов и их целевые функции (включая функции стимулирования) являются для них на момент выбора действий общим знанием [9]. Обозначим через Ем(стм) множество равновесий Нэша в рассматриваемой игре в нормальной форме (данное множество в теории управления организационными системами [9] называется множеством действий, реализуемых системой стимулирования стм):

Е^) = { у* е

V I е N I е Мк Уу, > 0 ст(О(у*, 1м1 (у^о)) -- с(у*) > ст Щ(ур 1М1 (у*мк,))) - С](у.)}. (2)

Предположим, что конечной (например, рыночной) ценностью обладает только результат 7п деятельности выхода сети (результата САС в целом), который реализуется по цене Я,(гл) > 0, зависящей от размера предложения — результата 7п. Тогда целевая функция САС (критерий эффективности управления (стимулирования) САС) представляет собой разность между выручкой и суммарными затратами на стимулирование всех агентов:

фЫ = * тп [Х(0п(y*n, (у]п))) X

уме ЕМ(стм) п м

* Оп(Уп, гмп (у] п )) - X ст ¡(О ¡( у* , N (у] к (¡) ))]. (3)

¡ = 1

*

I ^ мк

Задача управления заключается в выборе системы стимулирования, имеющей максимальную эффективность:

Ф(стм) ^ тах.

м стм

(4)

Значение функционала (3), достижимое в результате решения задачи (4), назовем эффективностью САС и обозначим через К. Задача (2)—(4) далеко не тривиальна, т. е. «лобовой» поиск ее решения не представляется возможным. Поэтому воспользуемся свойствами САС, позволяющими применить общие теоремы о декомпозиции игры агентов [9, 11].

2. ЗАДАЧА ПЛАНИРОВАНИЯ И ДЕКОМПОЗИЦИЯ ИГРЫ АГЕНТОВ

Если субъекту, осуществляющему управление САС (будем называть его центром), известны технологии деятельности всех агентов, то он может:

— прежде всего, по набору функций {О ¡(у, 7м. ),

I е М найти функцию О(ум, определяющую за-

висимость результата 7п деятельности п-го агента

от вектора уМ д ействий всех агентов и входа САС ^

(данную функцию можно условно считать агреги-

рованной технологией САС в целом);

— затем, для заданного значения выхода сети

7 = х > 0 найти множество

А(х) = {ум е <|О(у№ 7,) = х}

(5)

векторов действий агентов, приводящих к требуемому результату х;

— далее, для заданного значения выхода сети х > 0 найти множество

А*(х) = Лгб тш X с (у¡)

ум е А(х)1 = 1

(6)

векторов действий агентов, приводящих к требуемому результату х с минимальными суммарными затратами агентов

С(х) = т1п X с(у);

ум е А(х),= 1

(7)

— наконец, решить задачу планирования — найти оптимальный план (значение выхода сети), максимизирующий разность между выручкой и суммарными затратами всех агентов:

х * = а^тах [Х(х)х - С(х)].

х > 0

(8)

В силу свойств технологической функции (предположение А.1), центр имеет возможность основывать стимулирование каждого агента на его действии, а не на результате его деятельности. Поэтому связь между задачами (2)—(4) и (5)—(8) устанавливается утверждением 1 — см. далее. Фиксируем произвольные х > 0 и вектор ум(х) е А*(х). Обозначим через и{ резервную полезность ¡-го агента (ре-

зервная полезность — выигрыш агента при отказе от участия в данной системе [9]).

Рассмотрим два класса систем стимулирования агентов со стороны центра — компенсаторные и линейные [9].

Компенсаторные системы стимулирования основаны на идее компенсации затрат агента при выборе им действий, устраивающих центр. Оптимальную компенсаторную систему стимулирования характеризует

Утверждение 1. Если выполнены предположения А.1 и А.2, то система стимулирования

ч [ ci(У(x)) + ui, yi > y(x), ,Q4 c* (x, yi) = L , j. j (9)

i j [0, yj < y(x), i e N,

реализует вектор действий агентов yN(x) как равновесие в доминантных стратегиях их игры с минимальными суммарными затратами центра на стимулирование. Выигрыши всех агентов в этом равновесии тождественно равны их резервным полезностям.

Доказательство утвержд ения 1. Фиксируем произвольный номер агента i e N и произвольную обстановку y4 = (y1, ..., yi- 1, yi + 1, ..., yn) игры для него. Покажем, что Vy{ > 0f(y(x), y) > f(y, y). Действительно, подставляя систему стимулирования (9) в целевую функцию агента (1), получим при y( < y(x)

c(y(x)) + Щ - c(y(x)) > 0 - c(y). (10)

В силу неотрицательности как резервной полезности, так и функции затрат, данное неравенство всегда выполнено. При y= y(x) получим ui > 0. При y( > y(x) получим

c,(y,(x)) + ui - Ci(y(x)) > c(y(x)) + ui - c(y),

т. е. c(y(x)) < c(y), что выполнено в силу предположения А.2.

Таким образом, мы показали, что любому агенту, независимо от обстановки игры, выгодно выбирать соответствующую компоненту вектора yN(x), при этом он получит выигрыш, в точности равный своей резервной полезности (см. левую часть выражения (10)). А это и есть определение равновесия в доминантных стратегиях (РДС); (напомним, что любое РДС является и равновесием Нэша) [12].

Следовательно, система стимулирования (9) реализует вектор действий агентов yN(x) как РДС. Суммарные затраты центра на стимулирование при этом

C(x) = £ (c(y(x)) + и). (11)

i = 1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Пусть существует другая система стимулирования cN (•), реализующая тот же вектор действий агентов и характеризующаяся строго меньшими суммарными затратами центра на стимулирование. Тогда найдется агент j e N, для которого выполнено cj (y(x)) < Cj(yj(x)) + и,, следовательно, значение его целевой функции строго мень-

ше резервной полезности. В силу свойств функций затрат и стимулирования (неотрицательность), любой агент всегда может, отказавшись от участия в данной системе, обеспечить себе выигрыш, равный резервной полезности. Получили противоречие. ♦

Множество значений выходов сети, реализуемых всевозможными компенсаторными системами стимулирования, обозначим через Z = {х > 0 | А(х) ф 0}.

Из утверждения 1 следует, что эффективность САС (выигрыш центра)

К = тах [Х(х)х - С(х)]. (12)

х Е Z

Отметим, что оптимальная система стимулирования (9) не зависит от структуры сети О и совокупности технологических функций (последние определяют только множества (6) и Z)!

Имеет смысл также подчеркнуть, что результат утверждения 1 и оптимальная компенсаторная система стимулирования (9) могут быть корректно расширены на случай, когда множество возможных действий у{ каждого из агентов ограничено. Соответственно и в этом случае функции стимулирования агентов формируются независимо друг от друга и не зависят от технологии КД.

Важность такого расширения определяется не сложностью получающейся математической модели, напротив, модель становится практически тривиальной. Дело в том, что на современном этапе развития экономики в подавляющем большинстве случаев моделирование «нетривиального» множества возможных действий агентов оказывается не вполне адекватным. При вступлении в отношения с центром (или отказе от этого) у агента в большинстве случаев нет множества альтернативных действий, описываемых полупрямой у > 0. Если агент вступает в отношения с центром, то от него требуется вполне определенный результат г,, определяемый узким диапазоном его характеристик, в условиях развитых технологий отвечает этому результату практически единственное действие у (х). Это происходит и в случае взаимоотношений «сотрудник — работодатель», и в случае взаимоотношений фирм заказчика и подрядчика; т. е. по сути выбор агента бинарен: участвовать в САС или предпочесть альтернативную деятельность и получить резервную полезность.

Линейные (пропорциональные) системы стимулирования характеризуются линейной зависимостью размера вознаграждения от действия агента или результата его деятельности, а коэффициент пропорциональности называется ставкой оплаты, т. е. <зи(у) = у , у,, у, > 0. Множество значений выходов сети, реализуемых всевозможными линей-

ными системами стимулирования, обозначим через ZL.

При заданной линейной системе стимулирования 1-й агент выбором своего действия максимизирует свою целевую функцию, т. е. решает задачу

^ у - Ф) ^ та?.

' ' ' ' у. > 0

(13)

Задача (13) в силу предположения А.2 имеет единственное решение уи(у.) = с,- *(у.).

Для того чтобы 1-й агент выбирал действие у i(x), центру следует применять ставку оплаты

У (X) = с; (у(х)). (14)

Эффективность линейных систем стимулирования в сравнении с компенсаторными характеризует

Утверждение 2. При линейных системах стимулирования множество реализуемых значений выходов САС не шире, а выигрыш центра не выше, чем при компенсаторных, системах стимулирования.

Доказательство утвержд ения 2. Докажем сначала соответствующее соотношение м ножеств реализуемых выходов. Для того чтобы агент согласился участвовать в данной САС, необходимо, чтобы его выигрыш был не меньше его резервной полезности, т. е. реализуемыми линейными системами стимулирования являются значения выходов сети х, для которых м ножество А(х) не пусто, и выполнена (см. выражения (14)) система условий:

с, УМУМ - c¡(y .^ > u,, , е N (15)

т. е. 7Ь = ^ > 0 | A(x) ф 0, (15)}. Напомним, что компенсаторными системами стимулирования реализуемы любые значения выходов сети x, для которых множество A(x) не пусто. Наличие дополнительного требования (15) не расширяет множество реализуемых выходов сети, следовательно с Z

Вычислим теперь суммарные затраты центра на стимулирование по реализации некоторого значения x выхода сети при линейных системах стимулирования:

CL(x) = Е с; (yi(x))yi(x).

(16)

,= 1

Из выражений (11), (15) и (16) следует, что CL(x) > С^). ♦

Обозначим через Кь эффективность САС с линейной системой стимулирования (сравните с выражением (12)):

КТ = тах [X(x)x — Ст(x)].

L x е ^ L

Из утверждения 2 следует справедливость соотношения Кь < К, т. е. эффективность САС с линейной системой стимулирования не выше эффек-

тивности САС с компенсаторной системой стимулирования.

Пример 1. Пусть затраты агентов квадратичны: c¡(y¡) = (у;)2/(2г;), где константы ^ > 0. Тогда из выраже-

п

ний (11) и (16) получаем, что 0x0 = Сь(ос)/2 + Е u. ♦

,= 1

Утверждение 1 характеризует простую структуру системы стимулирования (9), которая не только оптимальна, но и децентрализует игру агентов (и, более того, делает поведение агентов независящим от структуры технологических связей между ними). При этом вся «сложность» оказывается сконцентрированной в задаче планирования — действительно, поиск множеств (5), (16) и последующее решение задачи (7) могут оказаться достаточно трудоемкими. Ситуация существенно упрощается, например, в следующем частном случае, когда накладываются достаточно жесткие ограничения на технологические функции.

Предположение А.3. Выполнено предположение А.1 и, кроме того, функция 0(у,,') взаимно однозначна, т. е. при заданных результатах деятельности агента и его действии однозначно определяются результаты деятельности его предшественников, , е N. ♦

Если выполнено предположение А.3, то множества (5) и (6) состоят из единственного вектора

(обозначим его через ум(гп) = (уД^), ..., Уп (£„))), а задача (7) сводится к вычислению суммарных затрат при действиях агентов у 1(^п), ..., уп(¿п).

Далее приводятся два примера САС, удовлетворяющих предположениям А.1 и А.3 — см. соответственно § 3 и § 4.

3. ФУНКЦИЯ ЛЕОНТЬЕВА

Пусть технологическая функция ,-го агента имеет вид

Ф,, ¿м-) = тш \ У; тш к,, } е N ,

, е М, (17)

где к, > 0, (}; ,) е Е; к.. = 0, (}; ,) г Е — технологи} }

ческие коэффициенты (так называемые коэффициенты комплектности).

Функция (17) удовлетворяет предположению А.1 (но не удовлетворяет предположению А.3, так как множество (5) представляет собой конус). Более того, имеет место конструктивно доказываемое

Утверждение 3. Если выполнено предположение А.2, то для технологической функции Леонтьева

А*М = { Ум

Доказательство утвержд ения 3. Обозначим через L0 = {п}, Lk с N — множество вершин графа

О, из которых исходят дуги в вершины из множества

^к - Р к = 1 2

При заданном требовании к выходу х сети вектор ум (х) может быть найден в результате применения следующего алгоритма:

Шаг 0: у. (х) = 0, I = 1, п _ 1, уя(х) = к х.

Шаг у = 1, п _ 1: уп (х) : = тах{уп . (х); тах [кп - пу, (х)]}.

I > п _у

В силу свойств функции затрат, определяемых предположением А.2, именно этот вектор является единственным решением задачи м инимизации суммарных затрат агентов.

4. ПРОИЗВОДСТВЕННАЯ ЦЕПОЧКА

Пусть граф О представляет собой одну цепь, тогда каждая технологическая функция зависит от д вух аргументов — действия соответствующего агента и результата деятельности его предшественника:

zi = 0(у, 7 _ 1), I = 1, п ■ Если функции {()(•, •)} непрерывны и строго монотонны по обоим аргументам, то выполнено предположение А.3, в частности — существуют однозначные и непрерывные «обратные» функции § .(7, у.), которые определяют требования к результату деятельности предшественника ьго агента в зависимости от действия и результата деятельности последнего.

Агрегированная технология производственной цепочки легко записывается в явном виде:

1п = 7,) = Qn - 1у - 1, Qn - 2(уп - 2,

(■■■, О^, (у 1, 7,)))))).

Например, для функции типа Кобба — Дугласа <2(у,, 7 _ 1) = А Су)" (7 -1)1 - где константы Л{ > 0, а е [0; 1], выражение (17) примет вид:

7п = (7,)(1 _ а) ПА^У ¡= 1

,(1 _ а)'

(п _ 0

Аналогично, при заданном выходе 7п, можно записать систему требований к результатам деятельности агентов:

7 = ^ + ^ + 2(■■■, уп - Р ^п^ Уn)), Уг•), 1 = 0 п _

Задача (5)—(8) с учетом результата утверждения 1 примет вид:

Х(0(у№ 7,)) 7о) - £ Ф) ^ тах+. (18)

¡= 1

Пример 2. Пусть технологическая функция линейна: <2 (у, 7 _ 1) = В у ( + г,- _ 1, цена X постоянна, а затраты

агентов квадратичны: с(у) = (у(.)2/(2г,.), где константы

В ( > 0, > 0. Тогда выражение (17) примет вид: = 70 +

п

+ £ Ву, а решением задачи (18) является у* = ХВ(.г(, . = 1

I = 1, п .

5.КАЛЕНДАРНОЕ ПЛАНИРОВАНИЕ

Выше рассматривались задачи «объемного» планирования (в терминах календарно-сетевого планирования и управления (КСПУ) [4—6]), например, задача планирования (8). Для того, чтобы иметь возможность рассматривать задачи календарного планирования, введем в модель САС зависимости ^(у ) времени деятельности ьго агента от выбираемого им действия, . = 1, п .

Обозначим через Т(ум) длину критического пути в сети О при векторе действий агентов у^

Для заданного выхода сети х можно найти множество пар «затраты — продолжительность» {(С(у^); Т(у^) | уы е Л(х)}, характеризующих варианты достижения заданного результата и позволяющих производить двухкритериальное сравнение этих вариантов в терминах КСПУ.

Пример 3. Пусть в условиях примера 2 имеет место линейная зависимость времени деятельности агента от

его действия: I (у) = а у, I = 1, п .

п

Тогда Т( у*к) = X £ а ¡В ¡г.

. = 1

6. РАСШИРЕННЫЕ ПРЕДПРИЯТИЯ

В работе [1] отмечается, что в последние десятилетия имеет место тренд существенной транс -формации принципов образования связей в организационно-технических системах, прежде всего — снижение роли организационных связей. Интеграция в современном мире стала глобальной, особенное развитие получила такая форма организации, как расширенные предприятия — совокупности предприятий и фирм, объединенные едиными технологическими процессами и связями без юридического и финансового объединения. В расширенных предприятиях основными являются технологические связи, а не организационная структура или акционерный капитал.

Приведенная выше модель компенсаторного стимулирования в САС может рассматриваться как модель расширенного предприятия, где на основе технологии предприятие-интегратор (центр) централизованно производит все расчеты с агентами с учетом всей «производственной кооперации» (технологической сети).

Линейная система стимулирования может рассматриваться как модель расширенного предпри-

ятия, где закупка производственных факторов производится на рынке (или имеет место «централизованный хозрасчет» в рамках фиксированного состава САС) и осуществляется сборка в соответствии с технологией. Эффективность такой САС (в силу утверждения 2) ниже, чем централизованной.

Внешний рынок. Рассмотрим модель, в которой агент может, помимо обеспечения требуемого своего результата для САС, работать, используя те же производственные мощности, и на внешний рынок, реализуя на нем свои действия (обладающие определенной «аддитивностью») в объеме V 1 > 0 по известной ему и центру цене р. > 0. Целевая функция агента с учетом выражения (9) имеет вид:

V) = с(у ^ + и + рV, — с(у(х) + ^

I = ттп. (19)

Так как при фиксированных x и системе стимулирования (9) первые два слагаемые в выражении (19) — константы, то в силу предположения А.2 оптимальный уровень реализуемых на рынке действий определяется как

у.(л) = с\ (р.) — у .(л), , = 1, п .

(20)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В силу предположения А.2 первое слагаемое в выражении (20) монотонно по рыночной цене, поэтому минимальная рыночная цена, при которой ,-му агенту еще выгодно предлагать на рынок свои «дополнительные» (помимо у (к)) действия, равна

с\ (у (я)).

Рассмотрим две альтернативы для агента. Первая — участвовать в САС и, быть может, работать на внешний рынок; вторая — отказаться от участия в САС и работать только на внешний рынок в оптимальном для себя объеме с\-1 (р.). Сравнение выигрышей агента в этих двух случаях обосновывает Утверждение 4. Участие в САС выгодно для агента, если

р , У,^) < с (у (рс)) + и, I = ТТп . ♦ (21)

С учетом утверждения 4 множество реализуемых САС значений выходов сети примет вид = {x > 0 | A(x) ф 0, (21)}. Выше было показано,

что р . > с\ (y,(x)), , = 1, п .

Утверждение 5. При линейных системах стимулирования агент, имеющий возможность работать на внешний рынок, согласится участвовать в САС только тогда, когда

р, = У, = с ,(у i(x)), , = 1, п . ♦

(22)

Справедливость утверждения 5 следует из того, что объединение двух систем неравенств — (15) и (21) — совместно тогда и только тогда, когда выполнено условие (22).

Содержательно утверждение 5 тривиально — если центр применяет линейную систему стимулирования и предлагает агенту ставку оплаты, меньшую рыночной, то последний не согласится участвовать в САС. Отметим, что при этом мы не учитываем организационные и информационные издержки центра и агентов, эти издержки заслуживают отдельного исследования, и их введение в модель может изменить результаты, соответствующие утверждениям 4 и 5.

Пример 4. В условиях примера 2 выражение (20) примет вид:

VI = (р,- — ^В)гр , = 1, п ,

а система неравенств (21): Х£(.г(.(р(. — ХБ/2) < и, , = 1, п . ♦

Рассмотренная выше модель «внешнего рынка» соответствует случаю:

— ограниченных ресурсов агента, когда он вынужден оптимизировать их распределение для получения максимального выигрыша;

— «конфликтных» отношений центра и агента, когда они «делят выигрыш» от совместной деятельности.

Следствием этих априорных предположений становится фундаментальный вывод, что оптимальна компенсаторная схема стимулирования, основной принцип которой «дать агенту ровно столько, сколько ему необходимо для осуществления желаемого центру д ействия». Отчасти это обусловлено тем, что центр делает ход первым, предлагая «правила игры» агенту (см. обсуждение множества компромисса в работе [9]).

Другими словами, именно дефицит ресурсов приводит к тому, что центр и агент «жестко делят» ограниченный совокупный выигрыш.

Однако современный уровень развития технологий и экономики в целом характеризуется существенным смягчением ограничений на финансовые ресурсы, а, следовательно (на «длинном периоде времени»), и материально-технические, и трудовые ресурсы. Это создает предпосылки возникновения иных, кооперативных отношений между центром и агентом, когда они не столько делят выигрыш, сколько совместно увеличивают его. Поэтому имеет смысл расширить рассмотренную выше постановку задачи.

Дополним две рассмотренные выше альтернативы для агента (участвовать в САС и, быть может, работать на внешний рынок; или — отказаться от участия в САС и работать только на внешний рынок в оптимальном для себя объеме) третьим вариантом — расширения деятельности агента.

Предположим, что 1-й агент (самостоятельно или совместно с центром) может привлечь дополнительные ресурсы и трансформировать свою технологию деятельности: заменить в сети О единый элемент с технологической функцией 7 = О(у,, 7 _ х),

, = 1, п, и функцией затрат с (у (X)) на совокупность из М{ одинаковых «производственных, элементов» с теми же самыми технологической функцией и функцией затрат. «Аддитивность» действий агента предполагает возможность для агента распределять «план» у,(х) + V; для реализации между производственными элементами. Если с,(0) = 0, то монотонность и выпуклость функции затрат с очевидностью подсказывает целесообразность назначать каждому из производственных элементов план как можно меньшего размера, а число элементов М — выбрать соответственно требуемому плану

У;(х) + V.

Вместе с тем, очевидно, существует ограничение снизу на размер реализуемого плана — технологическая функция О(у,, 7 _ 1) не может быть реализована для действий у., меньших некоторого априори известного, задаваемого технологией деятельности агента и центра, уровня а,. Тогда для каждого плана у,(х) + V. найдется оптимальная организация агента, состоящая из М . = [(у,(х) + V.)/а,] производственных элементов (где [•] обозначает целую часть числа). «Оптимально организован -ный агент» будет иметь исходную технологическую функцию 7 = О (у,, 7 _ 1), при этом функция затрат трансформируется к виду

с* (у) = [у/а]с(а) + с(у{ - [у/а]а) + Ьр (23)

где Ь — известная константа, отражающая затраты на организацию агента. В качестве отступления отметим, что для того, чтобы избавиться от требования с,(0) = 0, можно считать, что Ь{ — затраты на организацию одного производственного элемента, а второе слагаемое в выражении для функции затрат считать равным [у,/а,]Ь,. Заметим, что для «трансформированной» функции затрат (23) справедливо соотношение:

с* (у) < ^ у + Ь,, (24)

а

причем равенство достигается в точках у. = а,Р, где Р принимает натуральные значения. Такая транс -формация будет выгодна, прежде всего, центру.

При любых размерах плана у.(г) > у^р (где граничное значение у^ — решение относительно у уравнения с,(у) = [у/а,] с,(а,) + с (у - [у/а,]а,) + р.),

трансформация снижает размер компенсируемых центром затрат агента.

Проанализируем выгоду агента от трансформации, используя выражение для его целевой функции (19) с учетом трансформированной функции затрат (23) и соотношения (24):

g*(х, v¡) = с*(у,(х)) + и + р V -- [(у(х) + V,)/а,]с,(а,) - с,((у,(х) + V) -

- [(уг(х) + v)/a]a) - Ь,, , = М . (25)

Рассмотрим поведение целевой функции при возрастании V . от нуля.

Прежде всего, определим минимальный уровень цен р,, при которых агент будет заинтересован работать на внешний рынок; для этого продифференцируем целевую функцию (25) по V.:

= р , - с; ((у,(х) + V) - [(у,(х) + v)/a]a,),

1 = ттп. (26)

Из выражения (26) видно, что агент будет заинтересован работать на внешний рынок только при ценах р , > с\ (у,(х) - [уг.(х)/аг.]а,). Заметим, что данное пороговое значение цен строго меньше порогового значения с, (у,(х)) в случае функции затрат без трансформации (см. выражение (22)).

В выражении (25) первые два слагаемых (с* (у,(х)) + и) и последнее (Ь,) не зависят от V. Поэтому для дальнейшего анализа перепишем целевую функцию, опустив эти слагаемые:

£** (х, v) = р V - [(у.(х) + v)/а,]с(а1) -

- с,((у,(х) + V,) - [(уг.(х) + v)/a,]а,), , = ТТп.

Нетрудно показать, учитывая соотношение (24), что при р , > с,(а,)/а,, начиная с некоторого значения аргумента V,, функция g** (х, V.) будет строго положительной и неограниченно возрастающей с ростом V,. В этом случае оптимальным для агента уровнем реализуемых действий будет весь доступный объем рынка.

Таким образом, выгода трансформации для агента заключается, прежде всего, в снижении порога цен, при которых ему выгодно работать на рынке, а также в возникновении условий, при которых оптимальный уровень реализуемых на рынке действий V (х) совпадает с объемом рынка, т. е. агенту выгодно «захватить весь рынок».

Разделение выигрыша от трансформации между центром и агентом зависит от их взаимной информированности:

— если центр знает функцию затрат агента, он получит свою долю выигрыша, применяя трансформированную функцию затрат (23) вместо исходной; агент получит свою долю выигрыша, реализуя д ействия на внешнем рынке и затрачивая на это меньше усилий;

— если центр не знает о возможности и/или факте трансформации, то весь выигрыш достанется агенту.

Приведенное рассуждение имеет смысл дополнить следующим содержательным соображением, выходящим за рамки данной формальной модели. Для любой трансформации агента необходимо определенное изменение технологии всей САС, элементом которой является агент. А это может сделать только центр. Поэтому с содержательной точки зрения агент, как правило, не м ожет не проинформировать центр об изменении технологии. В свою очередь центру м огут потребоваться д опол-нительные затраты для трансформации всей технологии САС, которые, могут компенсироваться из выигрыша агента (в частности, от реализации действий на внешнем рынке) или центра, в зависимости от их договоренностей. Таким образом проявляется необходимость кооперативных стратегий для описанной трансформации.

Приведенная модель хорошо иллюстрирует выгоды кооперативного поведения агента и центра, но не учитывает такие факторы, как: необходимость ресурсов для трансформации, неопределенность спроса — доступный объем рынка, информированность центра и агента о рынке, наличие конкурентов, динамика спроса и поведения агента и центра во времени. Все перечисленные факторы усложняют модель и служат предметом дальнейших исследований.

Модель «самоорганизации». В заключение настоящего раздела рассмотрим модель побочных платежей между агентами (условно назовем ее моделью «самоорганизации» САС), заключающуюся в следующем: будем считать, что центр отсутствует (условно, его роль выполняет п-й агент (соответствующий выходу сети), т. е. тот, чей результат представляет ценность для внешней среды), а агенты договариваются между собой (сеть О и технологические функции каждого агента являются среди них общим знанием), что они реализуют значение выхода сети x, причем в случае, когда каждый из агентов выбрал требуемое действие (у, = у^),

I = 1, п) ,'-й агент выплачивает у'-му агенту сумму ст.,^) > 0, I,' = 1, п , а если хотя бы один агент выбрал действие, отличающееся от требуемого, то все платежи равны нулю.

Утверждение 6. Для любого значения выхода сети, реализуемого в САС с «самоорганизацией», существует компенсаторная система стимулирова-

ния агентов центром, реализующая то же значение выхода сети и обеспечивающая не меньшее суммарное значение выигрышей центра и всех агентов.

Доказательство утвержд ения 6. Фиксируем произвольное значение x е А^) выхода сети, реализуемого в САС с «самоорганизацией». Легко проверить, что при фиксированной системе побочных платежей {Ст'^)} выбор требуемых действий будет равновесием Нэша игры агентов в нормальной форме при условии, что каждому агенту в равновесии обеспечивается выигрыш, не меньший его резервной полезности, т. е.

X(x)xI(i = п) + £ ст — с (у (к)) — ^ стй(x) > и,

} е Щ ' V е Щ "

, = 17"п , (27)

где !(•) — функция-индикатор.

Если система неравенств (27) совместна, то, суммируя все ее п неравенств, получим

X(x)x — £ с (у (%)) > £ и

, е N . е N

Следовательно (см. выражение (11)), X x — С^) > 0 (сравните с выражением (12)), т. е. компенсаторная система стимулирования (9) реализует то же значение выхода сети с не меньшей эффективностью. ♦

Результат утверждения 6 гласит, что для любой САС с «самоорганизацией» найдется «централизованная» САС, условно говоря, не меньшей эффективности. Отметим, что мы не учли информационные и когнитивные затраты агентов на необходимый в первом случае поиск системы побочных платежей {ст-^)}, удовлетворяющей системе неравенств (27), а также то, что, возможно, набор таких платежей будет не единственным. Более того, если рассматривать теоретико-игровой процесс «переговоров» агентов о выборе конкретной системы побочных платежей (например, в рамках игры формирования сети [2, 13]), то задача еще более усложнится и потребует от них немалых временных и когнитивных усилий, а также наличия механизмов «наказания» отклоняющихся от достигнутого соглашения (в «централизованном» случае роль такого органа выполняет центр, в «децентрализованном» случае — судебная система и/или репутаци-онные воздействия и т. п.).

Для полноты картины осталось рассмотреть случай, когда в САС с «самоорганизацией» используются линейные побочные платежи. Результат очевиден и формулируется как

Следствие. При линейных побочных платежах между агентами множество реализуемых значений выходов САС не шире, чем при произвольных побочных платежах. ♦

Действительно, добавление к системе неравенств (27) набора условий

стМ =

= I УуУ/x), (У,.) е Е,

0, (у',,') г Е,

отражающих пропорциональность побочных платежей действиям агентов, не расширяет множество ее решений.

7.ИЕРАРХИЧЕСКИЕ ИГРЫ В СЕТЕВЫХ АКТИВНЫХ СИСТЕМАХ

Взаимодействие м ежжду агентами выше рассматривалось в рамках игр в нормальной форме, в которых игроки выбирают свои действия однократно, одновременно и независимо. Выбор центром системы стимулирования (например, (9)) и сообщение ее агентам соответствует иерархической игре типа Г2(Г0) в терминологии работ [9, 14]. В то же время, в рамках общих теоретико-игровых моделей сетевых организационных систем [10] было показано, что последовательность принятия решений (выбора действий/стратегий, быть может, условных, т. е. являющихся функционалами от действий других игроков) соответствует «иерархии» оргструктуры, и наоборот.

Применение этого общего подхода к САС затруднено спецификой последних, заключающейся в том, что конечную ценность для внешней среды представляет выход сети — результат агента с номером п, т. е. он и только он получает всю выручку от реализации результатов. Поэтому рассматривать модели, в которых агенты принимают решения в последовательности, соответствующей возрастанию рангов (см. § 1), не имеет смысла, так как ни один агент, кроме п-го, не может «пообещать» никакого «вознаграждения» другим агентам. Поэтому остаются два варианта — либо отождествить п-го агента с центром (тогда получаем модель, рассмотренную в § 2), либо интерпретировать в терминах иерархических игр модель самоорганизации, когда агенты должны выбирать условные стратегии («договариваться» с остальными) в порядке, соответствующем их рангам. Однако такая интерпретация представляется громоздкой и искусственной.

8. «ФРАКТАЛЬНЫЕ» СЕТЕВЫЕ АКТИВНЫЕ СИСТЕМЫ

В работе [1] отмечается, что комплексная деятельность, как правило, имеет фрактальную структуру — когда КД декомпозируется на элементы, которые в свою очередь являются КД. Поскольку САС претендуют на описание КД, то фрактальной назовем такую САС, агент которой сам является САС.

В рамках рассматриваемой в настоящей работе модели САС агент описывается своей технологической функцией, отображающей вектор его вхо-

дов и действие в результат деятельности (выход): 7 = 0(у , ), а также функцией затрат с (у). Сетевая активная система в целом описывается агрегированной технологией, отображающей вектор ее входов и вектор действий агентов в результат деятельности САС в целом (выход сети): х = 0(ум, 70), а также, в соответствии с утверждением 1, функцией затрат САС, которую определим как

п

с(ум) = £(с (у ) + и) 1 = 1

Утверждение 7. Если технологические функции (функции затрат) всех, агентов удовлетворяют предположению А.3 (соответственно А.2), то и агрегированная технология САС (функция затрат САС) удовлетворяет предположению А.3 (А.2).

Справедливость утверждения 7 следует, прежде всего, из того, что граф О является сетью с единственным выходом, и, зная значение этого выхода и действия всех агентов, можно однозначно восстановить значения входов сети. Далее, легко убедиться, что операция суммирования сохраняет гладкость, монотонность и выпуклость функции нескольких переменных. Таким образом, САС наследуют свойства своих элементов.

К сожалению, свойство А.1 не наследуется при переходе к агрегированному описанию САС.

Пример 5. Пусть технологические функции агентов имеют вид (17), а все коэффициенты комплектности равны единице (легко видеть, что такие технологические функции удовлетворяют предположению А.3). Тогда агрегированная технология САС имеет вид

х = тш] тт {70.}; тш {у..}

I з

-- 1, Ь

3 = 1, п

(28)

и также удовлетворяет предположению А.3.

Технологию (28) условно можно назвать жесткой, так как результат определяется минимальным из входов САС и действиями входящих в нее агентов. Для жесткой технологии, в силу предположения А.2 и связности графа О (независимо от структуры), имеет место: Л*(х) = Л(х) = {(х, х)}, а задача (8) является задачей безусловной скалярной оптимизации:

х * = а^тах

х > 0

Х(х)х_ £ с(х) .= 1

Например, если цена X постоянна, а затраты агентов

2 п 1 квадратичны: с(у) = (у.) /(2г(), то х* = X/ £ - . ♦

. = 1г.

Таким образом, описание агента, входящего в САС, и самой САС полностью унифицировано — любая САС, удовлетворяющая предположениям А.2 и А.3 фрактальна!

Подобная унификация дает возможность представлять и рассматривать агентов как САС, и на-

оборот — агрегированно описывать САС или ее часть (подграф) как одного агента, причем без потери существенной информации или снижения эффективности управления. Данное свойство представляется чрезвычайно привлекательным для задач управления проектами [6], моделирования комплексной д еятельности [1], комплексирования механизмов управления [15] и многих др.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Отдельной (и очень перспективной) задачей представляется исследование оптимальных по тем или иным критериям механизмов агрегирования и декомпозиции фрактальной структуры САС, причем в общем случае эти процессы могут быть как централизованными (осуществляться центром), так и/или децентрализованными (осуществляться «по инициативе» агента, групп агентов и т. д.).

ЗАКЛЮЧЕНИЕ

Перспективными направлениями будущих исследований САС — сетевых активных систем — представляется развитие моделей:

— внутренней структуры агентов, детерминирующей свойства соответствующих технологических функций;

— синтеза оптимальной технологии (сети технологических функций и выбора последних — например, по аналогии с работами [16, 17]);

— выбора состава агентов (назначения), реализующих те или иные элементы технологии;

— кооперативного поведения групп агентов в САС;

— календарного планирования (например, в случае, когда ¿,.(у,., ст,.) — неубывающая по у1 и не-возрастающая по ст,. функция) и распределения ресурса на сети;

— учитывающих неопределенность/риски деятельности агентов (например, если действия агентов принципиально ненаблюдаемые и невосста-навливаемые центром, то следует применять системы стимулирования, оптимальные в условиях неопределенности и/или агрегирования информации в задачах стимулирования [11]);

— распределенного контроля в САС [9];

— векторных действий и результатов деятельности агентов;

— надстройки управленческой иерархии над «технологическим графом» О — например, по аналогии с работами [18, 19];

— «фрактальных» САС как отражающих комп-лексирование м еханизмов управления [15], различных для разных вершин сети или их групп.

ЛИТЕРАТУРА

1. Белов М.В., Новиков Д.А. Методология комплексной деятельности. — М.: Ленанд, 2018. — 320 с.

2. Jackson M. Social and Economic Networks. — Princeton: Princeton University Press, 2010. — 520 p.

3. The Oxford Handbook of the Economics of Networks. — Oxford: Oxford University Press, 2016. — 856 p.

4. Бурков В.Н., Горгидзе И.А., Ловецкий С.Е. Прикладные задачи теории графов. — Тбилиси: ВЦ АН ГССР, 1974. — 232 с.

5. Голенко-Гинзбург Д.И. Стохастические сетевые модели планирования и управления разработками. — Воронеж: Научная книга, 2010. — 284 с.

6. Математические основы управления проектами / ред.

B.Н. Бурков. — М.: Высшая школа, 2005. — 423 с.

7. Mechanism Design and Management: Mathematical Methods for Smart Organizations. — N.-Y.: Nova Science Publishers, 2013. — 163 p.

8. Белов М.В. Организация современной производственной программы и управление ею: состояние и тенденции развития // Управление проектами и программами. — 2015. — № 2. — С. 86—99.

9. Novikov D.A. Theory of Control in Organizations. — N.-Y.: Nova Science Publishers, 2013. — 341 p.

10. Новиков Д.А. Сетевые структуры и организационные системы. — М.: ИПУ РАН, 2003. — 101 с.

11. Новиков Д.А., Цветков А.В. Механизмы стимулирования в многоэлементных организационных системах. — М.: Апостроф, 2000 — 184 с.

12. Myerson R.B. Game Theory: Analysis of Conflict. — London: Harvard University Press, 1997. — 584 p.

13. Kupferman O, Tamir T. Hierarchical Network Formation Games / A. Legay, T. Margaria (eds.) Tools and Algorithms for the Construction and Analysis of Systems. TACAS 2017. Lecture Notes in Computer Science. — Berlin: Springer, 2017. — Vol. 10205. — P. 229—246.

14. Гермейер Ю.Б. Игры с непротивоположными интересами. — М.: Наука, 1976. — 327 с.

15. Бурков В.Н., Коргин Н.А. Новиков Д.А. Проблемы комплек-сирования и декомпозиции механизмов управления организационно-техническими системами // Проблемы управления. — 2016. — № 5. — С. 14—23.

16. Воронин А.А., Харитонов М.А. Модель адаптации операционного ядра организации // Вестник ВолГУ. Сер. 1. Математика. Физика. — 2016. — № 4. — С. 44—65.

17. Воронин А.А., Харитонов М.А. Модель численной оптимизации структуры операционного ядра организации // Управление большими системами. — 2012. — № 39. —

C. 165—183.

18. Губко М.В. Математические модели оптимизации иерархических структур. — М.: Ленанд, 2006. — 264 с.

19. Мишин С.П. Оптимальные иерархии управления в социально-экономических системах. — М.: ПМСОФТ, 2004. — 207 с.

Статья представлена к публикации руководителем РРС А.А. Ворониным.

Белов Михаил Валентинович — канд. техн. наук, зам. ген. директора, компания ИБС, г. Москва, Н mbelov59@mail.ru,

Новиков Дмитрий Александрович — чл.-корр. РАН, директор, Институт проблем управления им. В.А. Трапезникова РАН, г. Москва, Н novikov@ipu.ru.

i Надоели баннеры? Вы всегда можете отключить рекламу.