Научная статья на тему 'КООПЕРАТИВНЫЕ ДИФФЕРЕНЦИАЛЬНО-ИГРОВЫЕ МОДЕЛИ УПРАВЛЕНИЯ ИННОВАЦИЯМИ'

КООПЕРАТИВНЫЕ ДИФФЕРЕНЦИАЛЬНО-ИГРОВЫЕ МОДЕЛИ УПРАВЛЕНИЯ ИННОВАЦИЯМИ Текст научной статьи по специальности «Экономика и бизнес»

CC BY
35
9
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЕКТОР ШЕПЛИ / КООПЕРАТИВНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ / УПРАВЛЕНИЕ ИННОВАЦИЯМИ

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Мальсагов Мухарбек Хасанович, Меркулова Мария Валерьевна, Угольницкий Геннадий Анатольевич

Разработка и использование инноваций определяют магистральный путь устойчивого развития организаций любого типа и являются необходимым условием экономического роста. В статье рассмотрены задачи мотивации сотрудников организации к продвижению инноваций путем распределения вознаграждения, формализованные как кооперативные дифференциальные игры. При построении таких игр использованы три различные характеристические функции: классическая функция Неймана - Моргенштерна, функции Петросяна - Заккура и Петросяна - Громовой. Первая всегда супераддитивна, но исходит из не вполне реалистичной гипотезы антагонизма между данной и дополнительной коалицией. Вторая более адекватно использует выигрыши игроков в равновесии Нэша, но не всегда гарантирует супераддитивность. Третья функция обеспечивает некий компромисс, гарантируя супераддитивность и используя гарантированный выигрыш коалиции при выборе ее участниками кооперативных стратегий. Во всех трех случаях в качестве решения игры использован вектор Шепли, компоненты которого находились аналитически и численно с использованием пакета Maple. Проведен сравнительный анализ результатов для тестового примера с тремя игроками для различных параметров модели, сделаны выводы относительно эффективности указанных способов распределения вознаграждения.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Мальсагов Мухарбек Хасанович, Меркулова Мария Валерьевна, Угольницкий Геннадий Анатольевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

COOPERATIVE DIFFERENTIAL GAME THEORETIC MODELS OF INNOVATIONS CONTROL

Creation and use of innovations determine a mainstream of the sustainable development of organizations of any type and are a necessary condition of the economic growth. In this paper we consider the problems of incentives of the employees for promotion of innovations by means of their reward allocation. The problems are formalized as cooperative differential games. In building of such games we used three different characteristic function: the classical Neumann-Morgenstern function as well as the functions proposed by Petrosyan and Zaccour, and Petrosyan and Gromova. The first function is always superadditive but is based on a not very realistic hypothesis of antagonism between a coalition and its complement. The second function more adequately used the players' payoffs in a Nash equilibrium but cannot guarantee the superadditivity. The third characteristic function provides a superadditive trade-off by guaranteeing the maximal payoff of a coalition when its members use their cooperative strategies. In all three cases the Shapley value is used as the optimality principle. Its components are calculated analytically and numerically by means of the Maple package. A comparative analysis of the results is made for a model example with three players for different values of the model parameters. The conclusions about the efficiency of the described methods of reward allocations are made.

Текст научной работы на тему «КООПЕРАТИВНЫЕ ДИФФЕРЕНЦИАЛЬНО-ИГРОВЫЕ МОДЕЛИ УПРАВЛЕНИЯ ИННОВАЦИЯМИ»

КООПЕРАТИВНЫЕ ДИФФЕРЕНЦИАЛЬНО-ИГРОВЫЕ МОДЕЛИ УПРАВЛЕНИЯ ИННОВАЦИЯМИ1

Мальсагов М. Х.2

(Ингушский государственный университет, Назрань) Меркулова М. В.3, Угольницкий Г. А.4

(Южный федеральный университет, Ростов-на-Дону)

Разработка и использование инноваций определяют магистральный путь устойчивого развития организаций любого типа и являются необходимым условием экономического роста. В статье рассмотрены задачи мотивации сотрудников организации к продвижению инноваций путем распределения вознаграждения, формализованные как кооперативные дифференциальные игры. При построении таких игр использованы три различные характеристические функции: классическая функция Неймана - Моргенштерна, функции Петросяна - Заккура и Петросяна - Громовой. Первая всегда супераддитивна, но исходит из не вполне реалистичной гипотезы антагонизма между данной и дополнительной коалицией. Вторая более адекватно использует выигрыши игроков в равновесии Нэша, но не всегда гарантирует супераддитивность. Третья функция обеспечивает некий компромисс, гарантируя супераддитивность и используя гарантированный выигрыш коалиции при выборе ее участниками кооперативных стратегий. Во всех трех случаях в качестве решения игры использован вектор Шепли, компоненты которого находились аналитически и численно с использованием пакета Maple. Проведен сравнительный анализ результатов для тестового примера с тремя игроками для различных параметров модели, сделаны выводы относительно эффективности указанных способов распределения вознаграждения.

Ключевые слова: вектор Шепли, кооперативные дифференциальные игры, управление инновациями.

1. Введение

Приоритетной целью государственной политики в области науки и технологий объявлен переход к инновационному пути

1 Работа выполнена при финансовой поддержке РНФ, проект №17-19-01038.

2МухарбекХасановичМальсагов, к.ф.-м.н., доцент (mmm1956@bk.ru).

3 Мария Валерьевна Меркулова, магистр прикладной математики и информатики (scarlett1994@mail.ru).

4 Геннадий Анатольевич Угольницкий, д.ф.-м.н., профессор (ougoln@mail.ru).

развития России. Внедрение технологических инноваций названо в качестве одной из основных целей в указе Президента РФ.

Инновациями считаются любые технические, организационные, экономические и управленческие изменения, отличные от существующей практики в данной организации. Их внедрение является сложным и конфликтным процессом, часто приводящим к немалым трудностям. Организации обладают различной восприимчивостью к инновациям. Инновационный потенциал и восприимчивость существенно зависят от параметров организационных структур менеджмента, профессионально-квалификационного состава, промышленно-производственного персонала, внешних условий хозяйственной деятельности и других факторов. Инновации находятся, с одной стороны, в противоречии со всем консервативным, направленным на сохранение существующего положения, с другой - нацелены, в пределах стратегии изменений, на значительное повышение технико-экономической эффективности деятельности организации [3].

Разработка и использование инноваций определяют магистральный путь устойчивого развития организаций любого типа. В РФ утвержден перечень крупных компаний с государственным участием, которые должны разработать и реализовать Программы инновационного развития.

Важнейшим аспектом реализации программы инновационного развития служит создание системы управления инновационной деятельностью компании. Дело в том, что инновации -это внедрение новшеств, а внедрение - процесс насильственного проникновения инородных элементов в сопротивляющуюся среду. Теория и практика внедрения инноваций убедительно показывают, что попытки внедрения новшеств обязательно вызывают противодействие у значительной части сотрудников компании, заинтересованных прежде всего в достижении собственных целей и сохранении существующего порядка. Система управления инновационной деятельностью призвана реализовать механизмы согласования частных интересов сотрудников организации с общей целью разработки и использования инноваций [5]. Без таких механизмов «мотивации инноваций» инновационная система окажется лишенной реального субъекта разработки и сопровождения и будет обречена на неудачу [10].

В данной статье рассматривается компания, состоящая из нескольких сотрудников и руководителя. Руководитель компании заинтересован во внедрении инноваций, а сотрудники (подчиненные) настроены консервативно. Ставится задача мотивировать коллектив на внедрение инноваций, оценить вклад сотрудников в их продвижении и оптимально распределить полученный в итоге доход между руководителем и подчиненными.

Для решения этой задачи предлагается динамическая кооперативно-игровая формализация задачи управления инновационной деятельности компании [6, 7]. При построении кооперативной дифференциальной игры используются три различные характеристические функции [2, 7, 12, 13], для которых вычисляется вектор Шепли [14], см. также [4, 7, 11]. Авторский подход представлен в[9, 10, 15].

2. Постановка задачи

Рассмотрим сначала иерархическую дифференциальную игру в нормальной форме:

ад

(1) J = J e~pt [ ^^ 1 - u. (t) + x(t)]dt ^ max,

0 jeM

(2) S: (t) > 0, ^ (t) = 1;

jeM

(3) J = Je~pt [д/l - u (t) + 5 (t)x(t)]dt ^ max,

0

(4) 0 < u (t) < 1, i e M;

(5) X = — x(t) Uj (t), x(0) = X0.

jeM

Здесь множество игроков N = {0, 1, ..., n} = {0} uM; множество стратегий S игрока 0 задаётся соотношениями (2), множества стратегий остальных игроков i e M - соотношениями (4). Все игроки используют программные стратегии. Далее, 0 < р < 1 -коэффициент дисконтирования, связанный с инфляцией, амортизацией и т.д., т.е. уменьшающий выигрыш во времени относительно выигрыша в начальный момент игры. Переменная x(t)

моделирует выигрыш от внедрения инноваций, её динамика и начальный выигрыш в базовом году описываются соотношениями (5). Переменные u(t), i е M, описывают временные затраты на работу сотрудника над инновациями, тогда 1 - u(f) - время на исполнение других обязанностей сотрудника. Переменные si(t) интерпретируются как доля сотрудника в выигрыше при внедрении инноваций (например, бонус). Работа, затраченная сотрудником на внедрение инновационного проекта, а также его выигрыш, контролируются руководителем, интересы которого отражает функционал Jo. Каждый сотрудник и руководитель стремятся максимизировать свой общий доход, включающий выигрыш от инноваций, на бесконечном периоде времени. Функции выигрыша описывают соотношение «общественных» интересов (выигрыша от внедрения инноваций и «частных» интересов (дохода от использования оставшегося времени). В качестве функции дохода от частных интересов естественно взять стандартную степенную «производственную» функцию .Jl — ut

[15]. Для простоты считается, что в целом интересы руководителя и подчинённых сонаправлены, что действительно должно иметь место при правильном менеджменте.

Для реализации различных версий данной модели инновационного развития компании используются три основных способа построения кооперативной игры в форме характеристической функции на основе игры в нормальной форме [2, 7, 12]. Классический подход предложен Дж. фон Нейманом и О. Мор-генштерном:

(6) v(K) = sup inf ^ J, (uk , un \ к X

UK UNK ieK

где uk - вектор стратегий игроков, входящих в коалицию K; un\k - вектор стратегий участников дополнительной коалиции N\K. Доказано, что функция (6) супераддитивна, т.е. для любых двух непересекающихся коалиций сумма их выгод по отдельности не больше их выгоды при объединении. Однако в реальных приложениях совсем не очевидно, что если несколько игроков образуют коалицию, то остальные должны играть строго против них. В частности, при рассмотрении инноваций это не так.

Поэтому Л.А. Петросян и Ж. Заккур предложили новую характеристическую функцию [12]:

(7) v(K) = supXJ (uK,uZ ),

UK ieK

где игроки из коалиции K максимизируют свой суммарный выигрыш, а остальные используют равновесные по Нэшу стратегии. Существование и единственность равновесия Нэша в рассматриваемой модели определяется структурой функций выигрыша. К сожалению, характеристическая функция (7) может быть не супераддитивной, что нарушает основной принцип кооперативных игр «объединяться выгодно». Чтобы обойти этот недостаток, Е.В. Громова и Л.А. Петросян ввели характеристическую функцию [2]

(8) v(K) = inf X J, (ucK,uN,K),

UN\K ,ек

где участники коалиции K используют кооперативные стратегии. Для данной версии модели доказано, что функция супераддитивна. Также отметим, что во всех случаях (6)—(8):

(9) v( N) = X J. (uK ) = JK.

ieN

В настоящей работе решение игры в форме характеристической функции ищется в виде вектора Шепли [4, 6, 7], который всегда существует и единственен. Это решение определяется формулой

Ф, (v) = X r(k)[v(K) — v(K \ {i}]], i e N,

K с N :ieK

(10) k =| K |, r(k) = (k—1)!(n — k)!.

n!

Поиск решения кооперативных дифференциальных игр сводится к задачам оптимального управления. Основными методами исследования таких задач являются принцип максимума Понтрягина [8] и уравнение Гамильтона — Якоби — Беллмана [1]. В данной работе используется второй подход.

3. Характеристическая функция по Дж. фон Нейману и О. Моргенштерну

Для (1)-(5) определим характеристическую функцию по Нейману - Моргенштерну и вычислим вектор Шепли. В этом случае v(K) - выигрыш коалиции K в антагонистической игре против дополнительной коалиции N\K, данная характеристическая функция супераддитивна. Получим {0} ё K ^ Vt Si(t) = 0, 7 е K, так как руководитель обеспечит доходом от внедрения инноваций сотрудников только из своей коалиции. Это означает, что ^(0=0, 7 е К. Учитывая всё вышесказанное, определим доход коалиции, состоящей только из одного подчиненного:

ш 1 1г

(11) у({/}) = Гейг = —; у(К) = -, К с М. о Р Р

Если коалиция состоит только из руководителя, то имеем иг(0 = 0, 7 е M. Тогда выигрыш от внедрения инноваций изменяется согласно уравнению: х = -х(г) ^ х(г) = х0е . Подстановка

дает следующий выигрыш руководителя:

(12) г({0}) = Ге[п + хоег ]йг = п(1 + р) + ХоР . 0 Р(1 + Р)

В общем случае, когда некоторые сотрудники кооперируются с руководителем:

у({0} и К) = тах {X, + У Ji} =

0<и. <1,1е{0}иК

1еК 0

0<м, <1,1е{0}иК

йг -

тах {Ге-0 У1 -ы.(г) + х(г)

0<М,<1,,е{0}иК 0 [ ¿М^ 1

ю

е-0 у 1 - Н1 (г) + (г)х(г)] йг} =

" 0

да

тах {Ге-0 у 1 -ы1 (г) + у Л -и(г) + х(г)

<1-'е{0}иК Г ЦеК 1

я

е-0 [V1 - и (г) + (г) х(г)] йг}

.еК 0

1еМ\К

п - -

йг -

Р

да

ад

+2 max (e~pi x(t) + X*Il — u(t)

0<u, <1,ie{0}uKJ W ¿гЛ .W

dt;

= — x(t) + X u, (t), x(0) = .

При условии объединения всех сотрудников компании и

ад Г _

руководителя: v(N) = 2 max I e~pi x(t) + X \/1 — u (t) dt, ди-

1 0 L ,eM _

намика пользы от инноваций описывается уравнением (5).

Для простоты вычислений и без ограничения общности предположим, что компания состоит из трех человек: руководителя и двух сотрудников, т.е. N = {0, 1, 2}, n = 2. Вычислим вектор Шепли по формуле

Ф,(v) = Xr(k)[v(K) — v(K \ {i}]], i e N,

K с N :ieK

Г = (1/3,1/6,1/3), k =|K |. Имеем:

1

Ф 0(v) — v({0}) + -

3

v({0,1} — v({1})] + ^[v({0,2}) — 6

— v({2})] + -[v( N) — v({1,2})

2(1 + p) + x0p | 1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3p(1 + p) 3

+ -maxJe p ^ 1 — щ(t) + x(t)

dt -

1

= - max

3 u2

2

+ —

3

dt -

J e~pt U1 — щ (t) + x(t)

2 0 _

ад _ __^

max J e~pt [M — u, (t) +J1 — u (t) + x(t)]dt--

о Р_

Для вычисления второго и третьего слагаемого получаем задачи оптимального управления:

J = J e pt [^1 — u(t) + x(t)]dt ^ max,

0 < u(t) < 1; x = —x(t) + u(t), x(0) = x0.

0

ад

0

ад

0

Уравнение Гамильтона - Якоби - Беллмана имеет вид (13) - рУ = шах[К (и - х) + л/1 - и + х].

0<и<1

Для нахождения оптимального управления вычислим производную правой части уравнения (13) по переменной и, полу-1

чим u* = 1 —

г2 ■

х

4V2

1

Замена дает — pV = Vx +-+ (1 — Vx ) x.

4Vx

Предполагая, что функция Беллмана линейная: У(х) = Ах + В, Ух = А, получим:

А = -Ц В = -4 + (1 , и* = 1 - <ЬР1 = С(р). 1 -р 4р(1 -р) 4

В этом случае динамика описывается уравнением

х *(/) = С(р) - [С(р) - Хо]е-

и выигрыш равен:

1 -Р

ад

J * = J ep 1 -—r + K (p) — [K (p) — x0 ]e-(I dt =

0

1 — p+ K(p) K(p) — x0 _ 5 + 2(1 + 2x0)p — 3p2

2p p 1 + p 4p(1 + p)

На границах отрезка [0, 1] имеем:

,(0V,4_v -t т(0) _ 1 + (1 + x0)p .

если u = 0, то x(U>(t) = x0e—, J(0 = ■

p(1 + p)

если u = 1, то x(1)(t) = 1 — (1 — x0 )e—, J(1) = 1 + X0p

p(1 + p)

Сравнение J *, J(0), J(1) дало следующие результаты: 1J*,0 <p< 1/3,

j max _ <

= J(0), 1/3 <p< 1.

Вычисление четвертого слагаемого также сводится к задаче оптимального управления:

J = J e~pt - u (t) + V 1 - Щ (t) + x(t)

dt ^ max,

0 < u (t) < 1; 0 < u2 (t) < 1; x = -x(t) + u (t) + u (t),

x(0) = xq.

Уравнение Гамильтона - Якоби - Беллмана примет вид (14) -pV = max [V (u + u -x) + Jl-U + лА-U + x].

0<Uj <1,0<u2 <1 ' У

Для нахождения оптимального управления вычислим производную правой части уравнения (14) по переменным щ, U2, получим:

* * * Л 1 u = u* = u = 1--г-.

1 2 V

Предположив, что функция Беллмана линейная: V(x) = Ax + B, имеем:

u* = C(p), x* = 2C(p) - [2C(p) - x0 ]e-. Сравнив выигрыш на границах отрезка [0, 1] с J*, получим: Г J \o <p< 1/3,

j-max _ <

= |J(0), 1/3 <p< 1,

5 + 2(1 + xq)p- 3p2 q) 2 + (2 + xq)p

где J * =-, J =-.

2p(1 + p) p(1 + p)

Закончив расчеты и собрав результаты, получаем следующие компоненты вектора Шепли: для 0 <p< 1/3

15 + 2(3 + 5xq)p-9p2 _ 15 + 2(3 + xo)p-9p\

Ф 0 =---^-, Ф1 = Ф 2 =

0 6p(1 + p) 1 2 12p(1 + p)

для 1/3 < p < 1

Ф = 6 + 2(6 + 5xo)p ф =ф =6 + (6 + xq)p 0 3p(1 + p) , 1 2 6p(1 + p) .

o

4. Характеристическая функция по Л.А. Петросяну и Ж. Заккуру

Теперь определим для игры (1)-(5) характеристическую функцию по Петросяну - Заккуру (7) и вычислим вектор Шепли. Аналогично, для простоты вычислений предполагаем, что компания состоит из трех человек: руководителя и двух подчиненных.

В данном способе построения кооперативной игры сначала ищутся равновесия по Нэшу. Каждый игрок стремится максимизировать свой выигрыш:

да

J = I" e~pt [Jl - u (t) + J1 - u (t) + x(t)]dt ^ max ,

Q ^(t(t)

да

J = I" e~pt [Jl - u (t) + s (t)x(t)]dt ^ max,

J u(t)

да

J = [ e~pt [Jl - u (t) + s2 (t)x(t)]dt ^ max;

0 U2(t)

(16) x = -x + u (t) + u2 (t), x(0) = x0,

где динамика выигрыша от внедрения инноваций описывается уравнением (16).

Для нахождения равновесия по Нэшу необходимо решить систему уравнений (15). Обозначим функцию Беллмана для этой задачи через V = V(x). Выпишем уравнения Гамильтона -Якоби - Беллмана для подчиненных:

(15)

(17)

-pV = max[V (и + U - x) + Jl - и + sx],

0<U <1 1 2 v 1 1

-pV = max[V (U + U - x) + 1 - U + s2x],

0<и2 <1

Находим оптимальные управления подчиненных, для этого дифференцируем правые части системы (17) по переменным ы\, Ы2 соответственно:

1 : + v = 0, и (г) = 1- 1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2yf\-u x ' 4vx

2 '

x

Сделав предположение о том, что функция Беллмана линейная: ¥(х) = Ах + В, Ух = А, получим: 1

- р(Лх + В) =-+ s(t) х + V (-х + и), Л =-,

2ГХ 1 -р

* 1

u = 1 -

(1 -p)2 2(t)

Получили следующие оптимальные управления сотрудников:

(18) u * = 1 -

(1 -p)2 45? (t)

* i

, u 2 = 1 -

(1 -p)2 4^22(t)

Уравнение динамики имеет вид: x = -x + u (t) + u (t) = -x + 2 - (1 p) - (1 p) , x(0) = x0,

4<(t) 452 (t)

откуда

(19) x(t) = 2 - - + e - (xq - 2 + + <b£)

45Г (t) 4522 (t)

45140 452 (t)

Подставляя (18), (19) в первое уравнение системы (15), получим:

J0 = J e pt ,J1- u (t) +y] 1 -u2 (t) + x(t)

dt =

= J e

0

t

pt

1-p. + ±p+2 (1-p)2 (1-P)2 ,

252 (t) 252 (t) 4s2 (t) 452 (t)

+e * (x0 -2 +

(1- p)2 , (1- p)2

dt

max .

51 (t )Mt)

452(t) 4522(t)

Поиск оптимального управления руководителя программно реализован в математическом пакете Maple, получены следующие результаты (очевидные в силу симметрии игроков):

51*(t) = 5*(t) =1.

Стратегии игроков в равновесии по Нэшу равны

„NE 1 NE 1 /1 \2 NE л /л \2

„N^ ' NE 1 /1 \2

51 (t) = 52 (t) = " , U« = 1-(1-p) ,

= 1-(1-Р )2.

0

зо

Следующим шагом выступает поиск характеристических функций по способу Петросяна - Заккура:

v(K) = supinf X Ji \ик, un\k ), где игроки из коалиции K мак-

«к unk ieK

симизируют свой суммарный выигрыш, а остальные используют равновесные по Нэшу стратегии.

Вычисляем выигрыш руководителя: v ({0}) = sup J о =

51,52

да

= sup

s ,s

J e pt yj1 - и (t) + Л/1 - и (t) + x(t)

dt =

2 о

да

J e~pt [(1 - p) +(1 - p) + x(t )]dt,

где уравнение динамики: (I) = 2 — 2(1 — р)2 + et (— —2 + 2(1 — р)2), тогда выигрыш руководителя равен:

(20) v({0}) =

-4p2 + 4p + x0 p + 2

Р(Р +1)

Выигрыш коалиции, состоящей только из первого сотрудника, рассчитывается по формуле

x(t)"

dt,

v({1}) = sup J = sup J e~pt ф - и (t) s1, s2 s1, s2 0 -

что сводится к задаче оптимального управления:

I- x

- pV = V1 - и + - + Vx (-x + и).

Предполагая, что функция Беллмана линейная: V(x) = Ax + B, Vx = A, получим:

A =-1-, и * = 1 - (1 -p)2,

2(1 -p)

x*(t) = 2-2(1 -p)2 + e-(x0 -2 + 2(1 -p)2),

- 4p2 + 4p + x0 p + 2 2p(p +1) '

(21) v({1}) =

0

Так как сотрудники в рассматриваемой фирме симметричны, то у({2}) = у({1}).

Теперь найдем характеристическую функцию для коалиции руководителя и сотрудника:

1-Р

у({0,1}) = 8ир(J0 + = 8ир |^р [V1-«ДО + —р + х(0 + 1 - « ^) + • (t)x(t)]Л ■

= 8Ир

| в~Р ($) + х^)(1 + ^ (t)) +

1-Р

51,52 о 2s2(t)

её поиск сводится к задаче оптимального управления:

-рУ = 271^1 + x(t )(1 + (t)) + ^Ьр + Гх (-х + «1).

252 (t)

Функцию Беллмана ищем в виде У(х) = Ах + В, Ух = А, тогда

1 + • * 1 (1-Р)

2

2 '

Л =-^, и 2 = 1-

1-Р (1 + ^1)

х\х) = 2- (1-(1 Р)2 + е-(хо-2 + (1-Р)\ +

'' (1 + ^(О)2 4^2 (1 + Sl(t ))2

+

45 2

Оптимальное управление руководителя найдено с помощью программного комплекса:

) = ^) = ^

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

,, ,ч - 23р2 + 26р + 9х Р +15

(22) у({0,1}) =-Р р оР-.

6р(1 + р)

Так как сотрудники симметричны, то v({0,1})=v({0,2})

Поиск выигрыша коалиции из двух подчиненных сводится к решению уравнения Гамильтона - Якоби - Беллмана, которое рассмотрено в пункте 3, поэтому

-3р2 + 2р + 2х0 р + 5

(23) у({1,2}) =

2р(1 + р)

Рассчитаем выигрыш максимальной коалиции по формуле:

да

v(N) = sup (J + J + J) = Je~pt [2^1 - U(t) +

+2

2^1 - и (t) + 2x(t)]dt

сводим эту задачу к решению уравнения Гамильтона - Якоби Беллмана:

- pV = 2^/1 - и + 2^1 - u2 + 2x + V (-x + U + M2) . Предполагая, что V(x) = Ax + B, Vx = A, получим

A = -

2

1 -p'

и = и* = м = 1 -

(1 -p)2

„ (1 -p)2 t, „ (1 -p)\ x (t) = 2 - ^ + e- (x0 - 2 + ^ )

2

- 3p2 + 2p + 2 x0 p + 5

2

(24) v(N) =

2K1 + p)

Вычислим вектор Шепли по формуле

Ф,(v) = X r(k)[v(K)-v(K\{i}]],i eN,

K с N :ieK

Г = (1/3,1/6,1/3),к = | K |, используя найденные выигрыши (20)-(24):

1

ф 0(v) — v({0}) + -

3

v({0,1} - v({1})] + ^({0,2}) - v({2})] 6

+ - [v( N) - v({1,2})

1 -4p2 + 4p + x0 p + 2 3 p(1 + p)

+

1

+ —

6 1

+ —

6 1

+ -3

-23 p2 + 26p + 9x0p +15 -4p2 + 4p + x0p + 2

—3 p2 + 2p + 2x0p + 5 —3 p2 + 2p + 2x0p + 5

p(1 + p)

2p(1 + p)

0

-44р2 + 44р +18х0 р + 36

18р(1 + р)

®i(v) =1 v({1}) +1

3 6

+ 1[v( N)-v({0,2})

v({0,1})-v({0})] + - [v({1,2})-v({2})] + 6

1 -4р + 4р + х0 р + 2 3 2р(1 + р0

+

1

+ — 6

1

+ —

6 1

+ -3

- 23р2 + 26р + 9 х0р +15 -4р2 + 4р + х0р + 2

6р(1 + р)

P(1 + Р)

-3р2 + 2р + 2 х0 р + 5 -4р2 + 4р + х0 р + 2

2р(1 + р)

2р(1 + р)

- 3р + 2р + 2х0р + 5 - 23р + 26р + 9х0р +15

P(1 + Р)

6р(1 + р)

-5р2 -4р + 9х0р + 27

18р(1 + р)

Так как сотрудники симметричны, то Ф^у) = Ф2(v)

5. Характеристическая функция по Л.А. Петросяну и Е.В. Громовой

Наконец, определим для игры (1)-(5) характеристическую функцию по Петросяну - Громовой (8) и вычислим вектор Ше-пли. Для простоты вычислений вновь предполагаем, что компания состоит из трех человек: руководителя и двух сотрудников.

Первым этапом построения кооперативной игры служит поиск кооперативных решений. Этот поиск сводится к задаче оптимального управления

(25) JC J ^ max.

Поиск кооперативных решений был программно реализован в математическом пакете Maple, получены следующие результаты:

0,14^2

г=1

sC (t) = sC (t) = 1, uC (t) = uC (t) = 1 - <L-PL.

Далее нужно вычислить характеристическую функцию по способу Петросяна - Громовой: v(K) = inf X J , umK), где

UN\ K 1G_K

участники коалиции K используют кооперативные стратегии, а участники дополнительной коалиции N\K играют строго против них.

Для поиска всех значений характеристической функции по способу Петросяна - Громовой был разработан программный комплекс на основе метода имитационного моделирования стратегий в математическом пакете Maple. Получены следующие результаты:

• для коалиции, состоящей только из руководителя: u* (t) = u* (t) = 1, x* (t) = 2 + e- (x0 - 2),

(26) v({0}) =

px0 + 2 р(р +1)

• для коалиции, состоящей только из одного подчиненного:

42 f (Л „\2\

/ (г) = 0, и* (г) = 0, х* (г) = 1 -(1 р) + е (27) г{{1}) =

так как сотрудники симметричны, то v({1}) = у({2}), • для коалиции, состоящей только из подчиненных:

**(') = ¿(') = 1, *(') = 2 - +

0-р\ .-.i -! + (1-P)2

У

+e-t

\ - 2+

0 2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2 У

-3р2 + 2р + 2хп р + 5 (28) у({1,2}) = р р °р ;

2р(р +1)

• для коалиции, состоящей из одного подчиненного и руководителя:

и2{1) =

х\г) =

0, 0 <р<-, 2

1 1 <р<1; 1-^ +

х0-1"

2-

(1- Р)2 4

V (

+ е

хо 2"

(Ь_Р)

4

(1- Р)

2

0 <р<1 2

(29) у({0,1>) =

-11р2 + 14р +12 х0 р + 25

8р(р +1)

У

21 1 1

- , Т<р< 1-

У 2

, 0<р<2-

-11р2 + 6р +12 х0 р + 29 1

8р(р +1)

, ^<р<1

учитывая симметричность сотрудников, получим, что у({0, 1}) = у({0, 2}); • при полной кооперации компании все сотрудники используют кооперативные стратегии (9), тогда динамика пользы от инноваций описывается уравнением

х'(г) = 2-

(1- р)2

(

+ е

х0 2"

(1- р)

и выигрыш равен

(30) У(Ы) =

-3р + 2р + 2 х0 р + 5

2р(р +1)

Вычислим вектор Шепли по приведенной ранее формуле. Собрав результаты (26)-(30), получим: для 0 <р< 1/2

Ф 0 =

- 19р + 22р + 28х0 р + 57 24р(1 + р) :

Ф, =Ф 2 =

- 53р2 + 26р + 20х0р + 63 48р(1 + р) '

для

1/2 <р< 1

4

_ - 19р2 + 14р + 28x0р + 61

0 = 24р(1 + р) ,

ф =ф =- 53р2 + 34р + 20хор + 59

1 2 48р(1 + р) .

6. Сравнительный анализ и оценка эффективности различных версий модели

В предыдущих трех пунктах описаны три версии кооперативной дифференциально-игровой модели инновационного развития компании и для каждой найден вектор Шепли. Выполним сравнительный анализ этих версий, чтобы получить представление о сильных и слабых сторонах каждой. При реализации оценки эффективности моделей был разработан программный комплекс в математическом пакете Maple.

Начнем c анализа способа Неймана - Моргенштерна. Выигрыши игроков: v({0}) = n(1 + р) + хор, v({1}) = v({2}) = -;

р(1 + р) р При полной кооперации, когда выигрыш был разделен между участниками компании по принципу Шепли, доход для каждого составил:

для 0 <р< 1/3

15 + 2(3 + 5x0 )р-9р2

Ф = Ф 0

Ф: =Ф 2 =

6р(1 + р)

15 + 2(3 + x0 )р-9р2

12р(1 + р) для 1/3 < р < 1

Ф 0 =

Ф, =Ф 2 =

6 + 2(6 + 5x0 )р 3р(1 + р) '

6 + (6 + x0 )р 6р(1 + р) '

Приведем графики функций выигрыша всех трех игроков и графики значений характеристических функций в кооперативном случае при различном начальном выигрыше от инноваций в базовом году при р = 0,1 (рис.1):

р=0.1

400300-

ф

200100-

100 150 200 250 300 _Ю_

— ФО Ы-М Ф1,Ф2 Ы-М

— у({0}) М-М — у({1}),у({2}) Ы-М

Рис. 1. Прибыль игроков в случае конкуренции и кооперациипо способу Неймана - Моргенштерна

Здесь прямые Ф0, Ф1 и Ф2 моделируют выигрыши руководителя и сотрудников в случае кооперации, а у({0}), у({1}), у({2}) в случае конкуренции. Как видим, прибыль руководителя и сотрудников в случае кооперации больше, чем при конкуренции. Анализируя полученные результаты, приходим к выводу: при данном способе построения характеристической функции выгодно объединяться. Далее проанализируем дележ по принципу Шепли для первой версии модели. Рассмотрим графики распределения доходов сотрудников и руководителя компании при различных начальных выигрышах от инноваций в базовом

году и различных коэффициентах дисконтирования (р = 0,1, р = 0,4, р = 0,8):

Рис. 2. Распределение дохода при р = 0,1

На рис. 2 прямые Ф0, Ф1 и Ф2 моделируют выигрыши руководителя и сотрудников в случае кооперации. По графику видно, что при увеличении начального выигрыша от инноваций в базовом году растет доход всей компании. Также заметно, что чем больше доход компании, тем большую часть получит руководитель. Например, при начальном выигрыше в 100 у.е. и р = 0,1, прибыль компании составит 229 у.е., из них 175 у.е. достанется руководителю, что составляет примерно 76,5% от общего дохода. А при начальном выигрыше в 1000 у.е. доход составит 1865 у.е., и руководителю отойдет 1538 у.е., что уже составляет 82,5% от всей прибыли.

С увеличением начального выигрыша от внедрения новшеств наблюдается рост дохода компании, и аналогично преды-

дущему случаю, когда р = 0,1, увеличивается разрыв между доходом руководителя и подчиненного.

Численное моделирование показало, что при коэффициенте дисконтирования р = 0,1 в среднем около 80% прибыли от внедрения новшеств получит руководитель, остальные 20% распределятся между сотрудниками. При р = 0,4 прибыль распределится следующим образом: 90% от общей прибыли достается руководителю, а подчиненные получат по 5%, а при р = 0,8 руководитель получит около 95% всего дохода, остальные 5% достанутся подчиненным.

Анализируя полученные результаты, можно сделать вывод о том, что при данном способе построения модели инновационного развития компании почти весь доход от внедрения новшеств получит руководитель. Данный способ применим на практике в случае, когда сотрудники сильно дорожат своим местом работы (например, в период циклической безработицы), так как данная версия модели почти не мотивирует подчиненных компании и может вызвать противодействие у значительной её части.

Далее проанализируем способ Петросяна - Заккура. Прибыли игроков:

у({0>) = -4р2 + 4р + х0р + 2

р(р +1)

- 4р2 + 4р + х0 р + 2

у({1>) = у({2>) =

2р(р +1)

При полной кооперации, когда выигрыш делится между участниками компании по принципу Шепли, доход каждого составит:

- 44р2 + 44р + 18х0 р + 36

Ф0ОО=

ФХ(У) = Ф 2ОО =

18 р (1 + р )

-5р2 -4р + 9х0р + 27

18р(1 + р)

Рассмотрим графики функций дележа в кооперативном случае и графики значений характеристических функций всех

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

трех игроков при различном начальном выигрыше от инноваций в базовом году при р = 0,1 (рис.3):

250-

200-

150-

100-

100 150 200 250

хО

-фо р-г ф1.ф2 р-г

-Ч{о}) р-г ЧШХЙ) р-г

Рис. 3. Прибыль игроков в случае конкуренции и кооперации по способу Петросяна - Заккура

На рис. 3 прямые Фо, Ф1 и Ф2 моделируют выигрыши руководителя и сотрудников в случае кооперации, прямые у({0}), у({1}), v({2}) - в случае конкуренции.

Как уже отмечалось ранее, характеристическая функция, построенная по способу Петросяна - Заккура, может быть не супераддитивной, что наглядно видно на графике: доход участника процесса внедрения инноваций, при условии, что участник ни с кем не вступает в сотрудничество, почти совпадает с дележом Шепли, а для руководителя даже превосходит его.

Аналогично проанализируем дележ по принципу Шепли для второй версии модели. Рассмотрим графики распределения дохода компании между сотрудниками и управляющим при различном начальном выигрыше от инноваций в базовом году,

и различных коэффициентах дисконтирования р = 0,1 (рис. 4), р = 0,4 (рис. 5):

900800700-

еоо-

ф J00-400300200100100 200 300 400 500 600 700 800 900 1000 __

— Ф0 P-Z — Ф1.Ф2 P-Z Рис. 4. Распределение дохода при р = 0,1

На рис. 4-5 прямые Фо, Ф1 и Ф2 моделируют выигрыши руководителя и сотрудников в случае кооперации. Видно, что с увеличением начального выигрыша от внедрения новшеств наблюдается рост дохода компании, и разрыв между доходом руководителя и подчиненного почти не увеличивается.

Вычисления показали, что при коэффициенте дисконтирования р = 0,1 и р = 0,4 в среднем 49% прибыли достанется руководителю компании, а 51% сотрудникам. При р = 0,8 руководитель получит около 50% всего дохода, остальные 50% достанутся подчиненным.

Анализируя полученные результаты, можно сказать, что при данной версии модели инновационного развития компании

прибыль распределяется между руководителем и сотрудниками почти равномерно.

Рис. 5. Распределение дохода при р = 0,4

Проанализируем способ Петросяна - Громовой. Прибыли

игроков равны у({0}) = РХ + 2 , г({1>) = г({2}) =

Р(Р +1) 2р

При полной кооперации, когда выигрыш делится между участниками компании по принципу Шепли, доход каждого составит: для 0 < р < 1/2

Ф о =

-19р2 + 22р + 28*0 р + 57 24р(1 + р) :

Ф1 =Ф2 =

-53р2 + 26р + 20 х р + 63 48р(1 + р) :

для 1/2 < р < 1

Ф 0 =

-19р2 + 14р + 28х0 р + 61 24р(1 + р) !

Ф1 =Ф 2 =

-53р + 34р + 20 х0 р + 59

48р(1 + р)

Рассмотрим графики функций выигрыша всех трех игроков в случае конкуренции, и графики функций дележа в кооперативном случае при р = 0,1 (рис. 6).

На рис. 6 прямые Фо, Ф1 и Ф2 моделируют выигрыши руководителя и сотрудников в случае кооперации, а у({0}), у({1}), у({2}) - в случае конкуренции.

Рис. 6. Прибыль игроков в случае конкуренции и кооперации по способу Петросяна - Громовой

Из рис. 6 видно, что прибыль руководителя и сотрудников больше в случае кооперации, значит, при данном способе по-

строения характеристической функции необходимо объединиться, чтобы увеличить свой доход.

Проанализируем дележ по принципу Шепли для третьей версии модели. Рассмотрим графики распределения дохода компании между сотрудниками и управляющим при различном начальном выигрыше от инноваций в базовом году и различных коэффициентах дисконтирования р = 0,1 (рис. 7), р = 0,4 (рис. 8):

Рис. 7. Распределение дохода при р = 0,1

На рис. 7-8 прямые Ф0, Ф1 и Ф2 моделируют выигрыши руководителя и сотрудников в случае кооперации. С увеличением начальной пользы от внедрения новшеств наблюдается рост дохода компании, разрыв между доходом руководителя и сотрудника увеличивается незначительно.

100 200 300 -400 j00 600 700 800 900 1000

_л_

Ф0 P-G — Ф1,Ф2 P-G

Рис. 8. Распределение дохода при р = 0,4

7. Заключение

В статье изучены три версии модели инновационного развития компании, формализованные как дифференциальные кооперативные игры с различными характеристическими функциями, выполнен сравнительный анализ представленных версий. Для реализации моделей и оценки их эффективности был разработан программный комплекс в математическом пакете Maple.

Численные расчеты показали, что при трех выбранных значениях коэффициента дисконтирования доход распределялся почти одинаково: в среднем, около 58% получал руководитель, а сотрудники пополам делили оставшуюся часть.

Таким образом, анализируя полученные результаты, можно сказать, что данная модель инновационного развития компании распределяет прибыль между участниками внедрения новшеств достаточно лояльно: чуть более половины дохода уходит к ру-

ководителю, остальная часть равномерно распределяется между подчиненными. Данная модель применима на практике только в той компании, руководитель которой заинтересован в развитии организации, а не только в своем доходе. Наиболее эффективная мотивация сотрудников к продвижению инноваций достигается при распределении дохода согласно характеристической функции Петросяна - Громовой.

Литература

1. БЕЛЛМАН Р. Динамическое программирование. - М.: Издательство иностранной литературы, 1960. - 400 с.

2. ГРОМОВА Е.В., ПЕТРОСЯН Л.А. Об одном способе построения характеристической функции в кооперативных дифференциальных играх // Математическая теория игр и ее приложения. - 2015. - №7(4). - С. 19-39.

3. ЖДАНОВА О.А. Роль инноваций в современной экономике // Экономика, управление, финансы: материалы Между-нар. науч. конф., г. Пермь, июнь 2011 г. - Пермь: Меркурий, 2011. - С. 38-40.

4. ЗЕНКЕВИЧ Н А., КОЗЛОВСКАЯ Н.В. Устойчивый вектор Шепли в кооперативной задаче территориального экологического производства // Управление большими системами. - 2010. - Вып. 31.1. - С. 303-330.

5. НОВИКОВ Д А., ИВАЩЕНКО А.А. Модели и методы организационного управления инновационным развитием. -М.: ЛЕНАНД, 2006. - 336 с.

6. ПЕТРОСЯН Л.А., ДАНИЛОВ Н.В. Кооперативные дифференциальные игры и приложения. - Томск: Изд-во Томского университета, 1985.

7. ПЕТРОСЯН Л.А., ЗЕНКЕВИЧ НА., ШЕВКОПЛЯС ЕВ. Теория игр. - СПб., БХВ-Петербург, 2012. - 432 с.

8. ПОНТРЯГИН Л.С., БОЛТЯНСКИЙ В.Г., ГАМКРЕЛИД-ЗЕ Р.В., МИЩЕНКО Е.Ф. Математическая теория оптимальных процессов. - М.: Наука, 1976. - 393 с.

9. ТАРАСЕНКО Л.В., УГОЛЬНИЦКИЙ Г.А., ДЬЯЧЕНКО В.К. Модели кооперации в системе социального партнерства // Инженерный вестник Дона. - 2013. - №1. - URL: ivdon. ru/magazine/archive/n 1y2013/1555.

10. УГОЛЬНИЦКИЙ Г.А., УСОВ А.Б. Теоретико-игровая модель согласования интересов при инновационном развитии корпорации // Компьютерные исследования и моделирование. - 2016. - №8(4). - С. 673-684.

11. GROMOVA E., PLEKHANOVA K. A differential game of pollution control with participation of developed and developing countries // Contributions to Game Theory and Management. -2015. - No. 8. - P. 64-83.

12. PETROSJAN LA., ZACCOUR G. Time-consistent Shapley value allocation of pollution cost reduction // Journal of Economic Dynamics and Control. - 2003. - Vol .27. No. 3.

13. REDDY P.V., ZACCOUR G. A friendly computable characteristic function // Mathematical Social Sciences. - 2016. -Vol. 82. - P. 18-25.

14. SHAPLEY L.S. A value for n-person games // Contributions to the Theory of Games II. Eds. Luce R.D., Tucker A.W. - Princeton University Press, 1953. - P. 307-317.

15. UGOL'NITSKII G.A., USOV A.B. Dynamic Models for Coordinating Private and Public Interests in Economic Corruption // Journal of Computer and Systems Sciences International. -2020. - Vol. 59(1). - P. 39-48.

COOPERATIVE DIFFERENTIAL GAME THEORETIC MODELS OF INNOVATIONS CONTROL

Mukharbeck Malsagov, Ingush State University, Nazran, Cand. Sc., Associate Professor (mmm1956@bk.ru).

Maria Merkulova, Southern Federal University, Rostov-on-Don, Master of Science (scarlett1994@mail.ru).

Gennady Ougolnitsky, Southern Federal University, Rostov-on-Don, Doctor of Sc., Professor (ougoln@mail.ru).

Abstract: Creation and use of innovations determine a mainstream of the sustainable development of organizations of any type and are a necessary condition of the economic growth. In this paper we consider the problems of incentives of the em-

ployees for promotion of innovations by means of their reward allocation. The problems are formalized as cooperative differential games. In building of such games we used three different characteristic function: the classical Neumann-Morgenstern function as well as the functions proposed by Petrosyan and Zaccour, and Petrosyan and Gromova. The first function is always superadditive but is based on a not very realistic hypothesis of antagonism between a coalition and its complement. The second function more adequately used the players' payoffs in a Nash equilibrium but cannot guarantee the superadditivity. The third characteristic function provides a superadditive trade-off by guaranteeing the maximal payoff of a coalition when its members use their cooperative strategies. In all three cases the Shapley value is used as the optimality principle. Its components are calculated analytically and numerically by means of the Maple package. A comparative analysis of the results is made for a model example with three players for different values of the model parameters. The conclusions about the efficiency of the described methods of reward allocations are made.

Keywords: cooperative differential games, innovations control, Shapley value.

УДК 512.8

ББК 22.14+22.19я73

DOI: 10.25728/ubs.2020.85.7

Статья представлена к публикации членом редакционной коллегии В.Н. Бурковым.

Поступила в редакцию 24.09.2019.

Опубликована 31.05.2020.

i Надоели баннеры? Вы всегда можете отключить рекламу.