УДК 330.46
И. Н. Дубина, Н. М. Оскорбин
Алтайский государственный университет пр. Ленина, 61, Барнаул, 656049, Россия E-mail: [email protected]
МОДЕЛИРОВАНИЕ ПОВЕДЕНИЯ СУБЪЕКТОВ ИННОВАЦИОННОЙ ДЕЯТЕЛЬНОСТИ ПРИ РАЗЛИЧНЫХ СХЕМАХ СТИМУЛИРОВАНИЯ *
На основе теории игр и теории активных систем предложены иерархические модели поведения участников инновационных проектов при различных вариантах стимулирования. Определены оптимальные стратегии участников и проведена оценка их чувствительности к изменениям параметров моделей. Проведен сравнительный анализ особенностей практического применения схемы стимулирования на основе разделения прибыли от проекта и схемы фиксированных выплат.
Ключевые слова: инновация, творчество, стимулирование, иерархическая игра, имитационное моделирование.
Введение
Анализ отношений участников инновационной деятельности связан с вопросом о разделении результатов осуществления инновационных проектов. Этот вопрос обычно решается на основе распределения суммарного дохода, полученного от проекта, между участниками с учетом их реального вклада. На практике используются различные варианты такого распределения: от простых схем распределения пропорционально затратам каждого участника до более сложных моделей, разработанных на основе теории кооперативных игр [1-3] и анализа динамических моделей долевого финансирования инноваций [4]. Как правило, подобные схемы и модели служат для анализа и оптимизации взаимоотношений равноправных участников инновационных проектов, вступающих в переговоры (например, партнеров по инновационному консорциуму). В меньшей степени в литературе представлены модели для распределения результатов инновационной деятельности в иерархически организованных системах на внутрифирменном уровне, когда один из участников (центр), в силу своего статуса, устанавливает правила распределения результатов проекта, а остальные участники (агенты), зная эти правила, принимают решение об участии в проекте или отказе от него. Задача центра в этом случае заключается в определении таких правил, которые бы максимизировали его прибыль с учетом возможной реакции агентов. Например, подобная задача возникает, когда менеджер организации (администратор ресурсов) намерен активизировать и эффективно использовать творческий потенциал сотрудников, выбирая определенную схему стимулирования новаторской активности персонала.
Методология моделирования поведенческих характеристик субъектов иерархических организационных систем (в том числе при различных механизмах стимулирования) сформировалась в рамках теории иерархических игр [5], теории активных систем [6] и теории управления организационными системами [7]. На основе этой методологии разработан комплекс математических моделей и методов организационного управления инновационной деятельностью компании [8]. В данной статье сделана попытка дальнейшего развития и, в большей степени, конкретизации этих моделей для формирования эффективных механизмов стимулирования новаторской активности.
* Работа выполнена при финансовой поддержке РГНФ (проект № 10-02-60204а/Т).
ISSN 1818-7862. Вестник НГУ. Серия: Социально-экономические науки. 2010. Том 10, выпуск 4 © И. Н. Дубина, Н. М. Оскорбин, 2010
Общая постановка задачи и ее формализация
Предположим, что руководство фирмы (центр) стремится интенсифицировать инновационную деятельность за счет мобилизации творческого потенциала персонала, привлечения новых идей сотрудников (агентов) и реализации на этой основе новых проектов, направленных на более эффективное использование ресурсов, снижение себестоимости производства, повышение качества продукции, расширение производственных возможностей, создание новых или усовершенствование имеющихся продуктов, их более эффективное продвижение на рынке и т. п. При этом предполагается, что затраты на осуществление идеи (проекта) несет центр, а вклад агента заключается в его «интеллектуально-творческом ресурсе», реализуемом в проекте (в некоторых случаях желаемый эффект может быть достигнут вообще без прямых затрат со стороны центра, а за счет креативного решения, предложенного агентом).
В этих условиях центр должен принять решение о схеме и уровне поощрения за предложенную новую идею или осуществление нового проекта и заранее сообщить эту информацию агенту. Стимулирование может выражаться в виде фиксированной добавки к заработной плате на время выполнения проекта, некоторого фиксированного платежа, зависящего от результативности проекта, передаваемой агенту доли прибыли, получаемой от проекта и т. д. Зная о «правилах стимулирования», принятых центром, агент принимает решение об инициировании нового проекта, степени (интенсивности) его реализации или отказе от него.
Поведение центра и агента моделируется на основе теории иерархических игр, описывающих динамическое взаимодействие участников с неравноправным статусом и различной степенью взаимоинформированности о стратегиях друг друга. В рамках данной статьи рассматриваются два варианта такого взаимодействия. В первом случае центр, не зная о стратегии агента, сообщает ему свою стратегию x («буду действовать так») и следует этому сообщению, а агент выбирает свою стратегию y из условия максимизации своего выигрыша с учетом сделанного сообщения (игра Штакельберга). Во втором случае центр сообщает агенту свою стратегию x(y) в виде «правил реагирования» на действия агента («буду действовать так, если агент поступит так-то»).
Пусть u - прибыль, получаемая от инновационного проекта, и эта величина не может быть точно оценена (задана), поскольку зависит от усилий, активности исполнителя, степени реализации его интеллектуально-креативного потенциала и т. п., при этом 0 < u < Umax, где Umax -максимально возможная прибыль. Для стимулирования активности исполнителя центр определяет поощрение r. При указанных предположениях u можно считать стратегией агента, которая будет зависеть от выбранной системы и уровня стимулирования r (стратегия центра). Тогда взаимодействие центра и агента в самом общем виде можно представить в виде игры
ГM0(r,u) — max
\ r (1) I M 1( r, u) — max v y
I u
где M0(r, u), M1(r, u) - платежные функции центра и агента соответственно.
Будем считать, что усилия и затраты z «интеллектуально-творческой энергии» агента на выполнение проекта зависят от достигнутого им результата (прибыли) u. Для дальнейшего анализа взаимоотношений центра и агента необходимо выбрать вид функции z(u). В литературе трудозатраты исполнителя в трудовых процессах моделируются различными функциями, удовлетворяющими «естественным требованиям» к таким моделям: считается, что трудозатраты z являются нулевыми при нулевом получаемом эффекте и прогрессивно растут при его увеличении, а при приближении результатов труда u к некоторой предельно достижимой (рекордной) величине Umax трудозатраты резко возрастают [9]. Эти свойства функций
трудозатрат математически определяются как z(0) = 0; z'(u) > 0; z''(u) > 0; lim z(u) = ~ .
u —Umax
В качестве базовых функций, удовлетворяющих этим свойствам, при моделировании тру-
дозатрат могут использоваться такие, например, функции как z(u) = k ln(1 — ц—)
u
max
и
z(u) = к- и др., где к > 0 - параметр [10]. Однако использование таких относительно
- u
max
сложных функций может существенно затруднять решение игры с технической точки зрения и, как следствие, осложнять применение соответствующих теоретико-игровых моделей на практике.
На основе приведенных соображений, а также следуя принципу парсимонии, применительно к рассматриваемой ситуации предлагается следующая модельная зависимость затрат «интеллектуально-творческой энергии» агента г на выполнение инновационного проекта:
z (u) = к
u2
U max
где к - положительный параметр, характеризующий темп возрастания трудозатрат агента в зависимости от получаемого эффекта при осуществлении проекта. В данном случае максимальный эффект от осуществления проекта Umax рассматривается как достижимый, что требует от агента хотя и значительных, но конечных затрат zmax: limz(u) = zmax . Величина па-
u^U max
раметра к = zmax/Umax может зависеть от вида и специфики проекта, интенсивности труда, организационного климата для творчества и инноваций и других факторов. На практике значение параметра может быть определено, если известна пара значений (zi, ui). Функция трудозатрат отражает также степень предпочтения агентом денежного вознаграждения и идентифицируется, как правило, на основе информации о поведении реальных агентов в той или иной мотивационной среде [10; 11].
Реальная зависимость трудозатрат агента, осуществляющего новый проект, может, разумеется, отличаться от априорно выбранной функции z(u). Поэтому включим в модель некоторое возмущение (случайную переменную £,):
2
z (u) = к — (1+ £).
U
max
Аналогично, в силу новизны проекта (опыт осуществления которого отсутствует), величина Umax также не может быть определена точно. Для включения неопределенности в оценке результатов проекта в модель будем считать, что максимально возможная прибыль от проекта может отличаться от предполагаемого значения в большую или меньшую сторону: UmaxM = Umax-(1 + ю), где ю - случайное возмущение. С учетом сделанных предположений и введенных параметров базовая игра (1) будет конкретизироваться при использовании различных систем стимулирования.
Стимулирование на основе отчисления доли прибыли от проекта
Предположим, центр стимулирует новаторскую деятельность персонала (разработку и реализацию новых идей) путем передачи сотруднику-новатору (агенту) части прибыли от проекта (распределение полученной прибыли в определенной пропорции). Применение такой схемы стимулирования может быть оправдано тем, что при введенных предположениях (агент не вносит материальный вклад в проект, а задействует свой интеллектуально-творческий ресурс) агент может прикладывать больше усилий на выполнение проекта, заранее зная, что от этого будет зависеть получаемая им доля прибыли. Такая схема оказывается довольно универсальной для любого проекта: чем более полезной для центра оказывается предложенная и реализованная агентом идея, тем лучший результат получают оба участника. При венчурном инвестировании также иногда применяется схема распределения прибыли инвестора («прибыль в обмен на идеи»), а не дохода от проекта, как в случае прямых инвестиций, когда инвесторы распределяют доход в зависимости от материального вклада каждого из них в проект. Вопрос заключается в том, в какой пропорции распределять прибыль, чтобы максимально эффективно стимулировать агента и мобилизовать его интеллектуально-творческий ресурс для получения наилучшего результата для центра.
Формализуем данную ситуацию на базе игры (1) с учетом всех введенных ранее обозначений. Пусть se [0, 1] - стратегия центра, определяющая долю прибыли, передаваемую агенту. Тогда имеем иерархическую игру:
[Ы0 (s, u) = (1 - s)u ^ max
s
Ы1(s, u) = su - z ^ max .
u
Используя введенные функции Umax(®) и z(u,£), получаем
Ы0(s, u) = (1 - s)u ^ max (2)
s
u 2
Ы 1(s, u, o>, = su - k-(1 + ^ max'
U (1 + o>) u
max V '
Поскольку в данной игре центр имеет «право первого хода», он выбирает свою стратегию s, зная, что агент будет выбирать стратегию u, реагируя на сообщение центра. Поэтому центр выбирает и сообщает такую стратегию s*, которая обеспечивает ему максимальное значение Ы0 при соответствующем отклике агента (равновесие Штакельберга).
Оптимальные стратегии игроков (s*, u*) определяются аналитически на основе принципа обратной индукции. Наилучший отклик агента на стратегию центра u*(s) определяется из
dM 1
условия
du
SU max (1 + Ю) п
= U : u * (s) = —2k (1—— . Подставляя это выражение в платежную
ф dM 0
функцию центра, из условия
= 0 находим оптимальную стратегию центра s* = У.
ds
Следовательно, в целях наиболее эффективного стимулирования сотрудников центру следует сообщить им о том, что прибыль, получаемая от осуществления новых проектов, будет делиться пополам между центром (организацией) и агентами (сотрудниками, предложившими и осуществившими новый проект), и действовать согласно этому сообщению. Теоретически, это является наиболее эффективным (с точки зрения максимизации результата центра) стимулом для осуществления новаторской деятельности сотрудников.
Такое заключение, полученное на основе лишь математических и логических принципов, совпадает с интуитивным представлением о «справедливом» распределении результатов. С практической точки зрения подобное решение является весьма удобным для центра, поскольку является универсальным, т. е. не зависит от вида и характеристик проекта, хотя поведение агента и результаты, получаемые участниками, зависят от этих факторов. В ситуации равновесия платежи игроков составят:
M 0 = U max(1 +Ю)
0 8k (1+ S)
M = U max (1 + Ю) ,
1 16k (1 + £)
т. е. конечный результат, получаемый центром при такой схеме стимулирования, превышает результат, получаемый агентом, на величину
U max (1 + Ф 16k (1 + £) '
которая может рассматриваться как «плата за риск».
Для анализа того, как случайные возмущения влияют на решение игры (2), с помощью программы Palisade Risk проводилось имитационное моделирование поведения центра и агента. При этом было принято, что при любой стратегии центра s агент выбирает u = 0, если при всех других возможных стратегиях его платеж M1 < 0. Рассматривалось влияние таких параметров модели, как Umax, k, £ и ю на выбор игроками стратегий (s* и u*) и результаты этого выбора (платежи игроков) M0 и M1. Для оценки влияния каждого из указанных параметров проводилось 1 000 итераций. Параметры £ и ю определялись как нормально распределенные случайные переменные со средним значением 0 и стандартным отклонением 0,3,
u=u
т. е. около 90 % всех генерируемых значений £ и ю попадают в интервал [-0,5, 0,5], обеспечивая тем самым довольно широкий диапазон отклонений в моделируемом поведении агента (исполнителя проекта), определяемом его функцией затрат z(u) х (1 + £), и в оценке параметра, характеризующего максимальный ожидаемый результат от проекта Umax х (1 + ю). Полученные результаты свидетельствуют об устойчивости оптимальной стратегии центра: в 90 % случае s* попадает в интервал [0,425, 0,550] со средним 0,485, что практически совпадает со значением, полученным аналитически (s* = 0,5).
Для параметров Umax и к устанавливалось равномерное распределение соответственно в диапазонах [0,01, 100] и [0,5, 5]. Это довольно широкие диапазоны изменений параметров, характеризующих инновационный проект. Они устанавливают различия в ожидаемых результатах до 10 000 раз, а различия в трудоемкости проекта - до 10 раз (значение к = 5 соответствует пятикратному превышению затрат агента над достигнутым результатом, и дальнейшее увеличение значения этого параметра делает проект трудновыполнимым и малопривлекательным для агента). Результаты численных экспериментов по оценке чувствительности стратегии центра к изменениям данных параметров модели приведены в табл. 1 (величины а1 и а2 соответствуют нижней и верхней границам интервала, в который попадает 90 % значений изменяемых параметров модели и результатов, полученных на ее основе).
Таблица 1
Влияние параметров Umax и к на стратегию центра
Параметр Мин. Среднее Макс. а1 а2
значение значение значение
Влияние Umax
Umax 0,016 50,001 99,955 4,995 94,906
s* 0,375 0,482 0,575 0,375 0,575
Влияние к
к 0,504 2,750 4,999 0,721 4,774
s* 0,325 0,456 0,575 0,350 0,525
Результаты имитационного моделирования демонстрируют устойчивость оптимальной стратегии центра (величина изменяется в сравнительно узком диапазоне при весьма значительных изменениях параметров, со средним значением близким к 0,5). Это обстоятельство делает удобным практическое применение этой схемы для широкого круга ситуаций и осуществляемых проектов, поскольку оптимальное значение доли прибыли, выделяемой агенту, слабо зависит от характеристик проекта. Согласованность данной стратегии с представлением о «справедливом» распределении результатов может давать исполнителю дополнительные «психологические» стимулы.
Стимулирование на основе фиксированных выплат
Рассмотрим схему стимулирования на основе фиксированных выплат. Очевидно, что и в этом случае величина выплаты должна зависеть от результативности проекта (достигаемого агентом результата). Допустим, что центр сообщает агенту следующее правило, определяющее поощрение: агент получит выплату Хь если в результате осуществления проекта будет получена прибыль иначе агент не получает ничего:
Г х,, и > и, Ва (х^ и) = ] 0 < и \ у 0, и < Ц
где Ва(хь иь и) - премиальная выплата агенту за осуществление проекта.
Таблица 2
Влияние случайных возмущений на решение игры (3)
Параметр Мин. Среднее Макс. a1 a2
значение значение значение
Изменяемые параметры
E -0,92 0 0,90 -0,49 0,49
Q -0,99 0 0,90 -0,49 0,49
Численное решение игры
X*1 0,00 2,33 4,75 0,00 4,00
Mq 0,00 2,19 4,75 0,00 3,75
U* 0,00 4,53 5,00 0,00 5,00
M1 0,00 0,11 0,25 0,00 0,24
Подобная схема взаимоотношений моделируется игрой:
M0 (x1, U1, u) = u(x1, U1) - xl ^ max (3)
) xi,U i
M1 (x1, U1, u, ю, = Ba (x1, U1, u) - z(u, ю, ^ max
u
Численное решение данной игры дает оптимальные значения x*1 и U*1; которые максимизируют платеж центра. Взаимоотношения участников, построенные по типу игры (3), обеспечивают центру более высокие платежи, чем схема выплат на основе игры (2). Так, при Umax = 10 и k = 1 при использовании оптимальной стратегии в игре (2) платеж центра M0 = 1,5, тогда как в игре (3) его максимальный платеж при этих же параметрах составляет 2,25 при значениях 1,2 < x1 < 4,2 и 3,2 < U1 < 6,4. Однако такая схема стимулирования (в работе [8] она называется компенсаторной) требует достаточно точного определения характеристик проекта, так как решение игры в этом случае очень чувствительно к возможным возмущениям параметров модели. В частности, если центр неточно знает функцию затрат агента или неточно оценивает ожидаемый результат от проекта, то малая неточность может приводить к значительным изменениям реализуемых действий. В табл. 2 приведены результаты численного решения игры (3) при фиксированных параметрах Umax = 10, k = 1, U1 = 5 и случайных возмущениях £ и ю.
Как следует из табл. 2, диапазон изменений оптимальной стратегии центра (значения выплачиваемого поощрения) при рассматриваемых возмущениях весьма широк, что свидетельствует о сильной чувствительности модели к изменению параметров. Инновационные проекты, и особенно так называемые «радикальные инновации», часто связаны со значительной неопределенностью как результатов, так и процессов их достижения. Поэтому практическое использование этой схемы представляется ограниченным областью достаточно хорошо «просчитываемых» проектов и инкрементальными инновациями. Также обращает на себя внимание то, что при данной системе стимулирования разница в платежах центра и агента значительно больше, чем при схеме стимулирования, основанной на разделении прибыли, что может приводить к конфронтации участников проекта.
Предложенные в статье модели могут использоваться как для разработки системы стимулирования новаторской активности персонала, так и для согласования схемы и уровня вознаграждения при переговорах об осуществлении конкретных проектов между руководством и сотрудниками фирмы.
Список литературы
1. Jarimo T., Pulkkinen U., Salo A. Encouraging Suppliers to Process Innovations: A Game Theory Approach // Int. J. of Technology Intelligence and Planning. 2005. Vol. 1. Ко. 4. P. 403-423.
2. Watanabe N., Muto S. Stable profit sharing in bargaining outcomes // International Journal of Game Theory. 2008. Vol. 37. P. 505-523.
3. Zakharov V., Gan'kova A., Dementieva M., Neittaanmaki P. Comparing solutions in joint implementation projects // International Game Theory Review. 2008. Vol. 10. Ко. 1. P. 119-128.
4. Косачев Ю. В. Эффективность корпоративной структуры, реализующей инновации // Экономика и математические методы. 2001. Т. 73, № 3. С. 36-61.
5. ГермейерЮ. Б. Игры с непротивоположными интересами. М.: Наука, 1976. 326 с.
6. Бурков В. Н, Новиков Д. А. Теория активных систем: состояние и перспективы. М.: СИНТЕГ, 1999. 128 с.
7. Новиков Д. А. Теория управления организационными системами. М.: МПСИ, 2005. 584 с.
8. Новиков Д. А., Иващенко А. А. Модели и методы организационного управления инновационным развитием фирмы. М.: КомКнига, 2006. 332 с.
9. Ватель И. А., Ерешко Ф. И. Математика конфликта и сотрудничества. М.: Знание, 1973. 64 с.
10. Мамченко О. П., Оскорбин Н. М. Многоагентные системы принятия решений: декомпозиционный подход. Барнаул: Изд-во Алт. ун-та, 2008. 64 с.
11. Дубина И. Н. Управление творчеством персонала в условиях инновационной экономики. М.: Academia, 2009. 376 с.
Материал поступил в редколлегию 10.09.2010
I. N. Dubina, N. M. Oskorbin
MODELLING OF INNOVATION PROCESS PARTICIPANTS BEHAVIOR UNDER DIFFERENT STIMULATION MECHANISMS
This paper suggests and discusses models of innovation process participant interaction under different schemes of stimulation. The suggested models are based on the principles and methods of hierarchical game theory and the theory of active systems. The principal and agent's optimal strategies are identified and illustrated with computer simulation techniques.
Keywords: innovation, creativity, stimulation, hierarchical game, computer simulation.