Научная статья на тему 'Рефлексивные модели репутации и норм деятельности'

Рефлексивные модели репутации и норм деятельности Текст научной статьи по специальности «Теория игр и ее применение в кибернетических системах»

502
45
Поделиться

Похожие темы научных работ по кибернетике , автор научной работы — Ермаков Н.С., Иващенко А.А.,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Текст научной работы на тему «Рефлексивные модели репутации и норм деятельности»

РЕФЛЕКСИВНЫЕ МОДЕЛИ РЕПУТАЦИИ И НОРМ ДЕЯТЕЛЬНОСТИ

Н.С. Ермаков, А.А. Иващенко1

(Самарский государственный аэрокосмический университет, Московский физико-технический институт)

1. Введение

Настоящая работа посвящена теоретико-игровым моделям репутации и норм деятельности, учитывающих рефлексию участников. Приведем определения основных понятий. Репутация - «создавшееся общее мнение о достоинствах или недостатках кого-либо, чего-либо, общественная оценка» [10, с. 431]. Норма - «узаконенное установление, признанный обязательным порядок» [10, с. 338], общепризнанное правило, стандарт, образец поведения.

Норма деятельности агента (индивидуального или коллективного) в рамках формальных моделей описывается отображением множества возможных значений существенных параметров во множество действий агента. Качественно говоря, норма определяет, какие действия в каких ситуациях агент выбирает. С этой точки зрения репутацию можно рассматривать как ожидаемую (другими агентами) норму деятельности агента - какого поведения от него ожидают остальные. Репутация оправдывается, если выбор агента в рамках нормы деятельности совпадает с тем, чего от него ожидают остальные. Будем считать, что репутация любого агента в его собственных глазах определяется нормой его деятельности. Обзор моделей репутации и норм деятельности проведен в [3].

В [8] введено понятие рефлексивной игры - игры реальных и фантомных (существующих в сознании других реальных или фантомных агентов представлениях о соответствующем оппоненте) агентов. Исходом этой игры является информационное равновесие - совокупность действий реальных и фантомных агентов, являющихся их наилучшими ответами на выбор оппонентами тех действий, которые тот или иной агент считает рациональными в

1 Статья написана совместно с Д.А. Новиковым.

рамках той информированности, которую он приписывает оппонентам. В терминах рефлексивных игр согласованная с интересами агента норма его деятельности должна быть подмножеством множества его действий, входящих в информационное равновесие. Репутацией реального агента можно считать совокупность действий его фантомных "представителей", то есть фантомных агентов первого уровня - его образов в сознании оппонентов. Информационное равновесие называется стабильным [7], если ожидания всех реальных и фантомных агентов оправдываются. Поэтому целесообразно считать, что поведение агента соответствует его репутации (подтверждает его репутацию), если информационное равновесие стабильно.

Таким образом, зависимости действий, образующих информационное равновесие, реальных агентов от структур их информированности определяют нормы их деятельности. А зависимости действий фантомных агентов от структур их информированности определяют репутацию реальных и фантомных агентов.

Рассмотрим организационную систему [2], состоящую из одного агента и одного центра (описываемая ниже модель допускает непосредственное обобщение на случай нескольких агентов и/или нескольких центров), например - исполнителя и заказчика.

Предпочтения агента описываются его целевой функцией

в), где у е Л - действие агента, в е О - состояние природы. Предпочтения центра описываются его целевой функцией Е(у, в) также зависящей от действия агента и состояния природы.

2. Модель рационального поведения

Нормой деятельности агента будем считать отображение К: О ® Л, ставящее каждому состоянию природы в е О в соответствие множество (или точку) К(в) сЛ. То есть, норма деятельности предписывает агенту при состоянии природы в выбирать действия из множества К(в).

Репутацией агента (с точки зрения центра) будем считать отображение О ® Л, ставящее каждому состоянию природы в е О в соответствие множество (или точку) Ш(в) с Л. Репутация отражает, каких действий ожидает центр от агента в зависимости от состояния природы.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Норма •) деятельности агента согласована с его предпочте-

ниями, если

(1) "веП Х(в) с P/в),

где Pf (в) = Arg max fy, в) - множество рационального выбора.

ysA

Репутация Ш(') агента согласована с предпочтениями центра,

если

(2) "веП Ш(в) с Рр(в),

где Pf(6) = Arg max F(y, в) - множество наиболее предпочти-

ysA

тельных с точки зрения центра выборов агента. Будем считать, что поведение агента подтверждает его репутацию у центра, если выбираемые им в рамках гипотезы рационального поведения действия соответствуют ожиданиям центра:

(3) "веП Р(в) ^Ш(в).

Если ввести гипотезу благожелательного отношения агента к центру [1], то условие (3) можно ослабить, записав его в виде:

(3') "веП Р(в) п Ш(в) #0.

Норма деятельности агента согласована с его репутацией, если:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(4) "веП Х(в) п Ш(в) Ф 0.

Предпочтения агента и центра согласованы, если

(5) "веП Pf( в) п Р(в) Ф 0.

Итак, имеем четыре подмножества множества A, зависящих от состояния природы:

PF{0) - "предпочтения" центра;

Pj(0) - "предпочтения" агента;

Ш(в) - репутация агента у центра;

Л*(в) - норма деятельности агента.

Возможны различные соотношения (в теоретико-

множественном смысле - пересечения, вложенности и т.д.) между этими подмножествами:

- Л*(в) ^ PA®) отражает согласованность нормы деятельности агента с его предпочтениями;

- Ш(в) с PF(6) отражает согласованность репутации агента с предпочтениями центра;

- Pfyd) сШ(в) отражает подтвержденность репутации агента;

- К(в) п Ш(в) Ф 0 отражает согласованность нормы деятельности агента с его репутацией;

- РДв) п Р(в) Ф 0 отражает согласованность предпочтений агента и центра.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Содержательно в рамках модели "заказчик - исполнитель", условие (2) означает, что данный заказчик может обратиться к исполнителю с данной репутацией, а (3) означает, что исполнителю выгодно подтвердить свою репутацию в глазах заказчика.

Свойства (1)-(5) не являются независимыми. Так, из (1), (2) и

(4) следует (5); из (1) и (3') следует (4); из (1), (2) и (3) следует (4) и

(5). Но из (1), (2) и (5) в общем случае не следует ни (3), ни (4).

В частном случае репутация агента полностью определяется (совпадает с) нормой его деятельности, то есть V в е О К(в) = Ш(в) и, следовательно, выполнено (4). Тогда из (1) и (2) следует (5), а из (1), (2) и (3) следует, что Vв е О Р(в) ^Рр(в), что является более сильным условием, чем (5).

Если и норма деятельности агента, и репутация являются однозначными отображения, то из (4) следует, что они совпадают, из

(3) - что множество рационального выбора агента состоит из одной точки, из (1) следует, что эта точка определяется нормой деятельности, а для выполнения условия (5) достаточно выполнения условий (1) и (2). В рассматриваемом случае для существования хотя бы одной согласованной с предпочтениями всех участников нормы деятельности (репутации) агента достаточно, чтобы предпочтения центра и агента были согласованы.

3. Модель ограниченной рациональности

Рассмотренные выше определения согласованности нормы деятельности агента с его предпочтениями и согласованности его репутации с предпочтениями центра основывались на гипотезе рационального поведения - предположении о том, что агент выбирает одно из действий, максимизирующих при данном состоянии природы его целевую функцию, а для центра наиболее предпочтительны такие действия агента, которые максимизируют целевую функцию центра. В случае если каждое из множеств РДв) и Р/(в) состоит из одной точки, то, если выполнено (9), то эти точки совпадают, и согласованная норма совпадает с согласованной репутацией и определяется однозначно. Следовательно, для расширения

"свободы для маневра" - расширения множества согласованных норм и множества согласованных репутаций - необходимо ослаблять требования к рациональности поведения соответственно агента и центра.

Для этого воспользуемся концепцией ограниченной рациональности [9], в соответствии с которой субъекты выбирают не оптимальные (максимизирующие целевую функцию на допустимом множестве) альтернативы, а рациональные альтернативы, то есть, приводящие к удовлетворяющему субъекта значению его целевой функции. Ряд формальных моделей ограниченной рациональности рассматривался в [4, 5]. Ниже мы приведем две модели ограниченной рациональности. В первой субъект выбирает e-оптимальные при заданном в е П альтернативы, где e >0 выступает в качестве параметра (при e = 0 получаем модель классической рациональности). Во второй модели субъект выбирает альтернативы, обеспечивающие ему при заданном веП

фиксированный уровень полезности и.

Определим множества рационального выбора центра и агента двумя способами:

(6) PF{0, e) = {y е A | F(y, в) > max F(y, в) - e},

ysA

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(7) P(Q, 8) = {y еA I fy, в) > max fy, в) - S},

ysA

(8)Pf(B, u) = {y еA | F(y, в) >u},

(9)p(® v) = {y еA I fy, в) >v}.

Определения согласованности при этом будут иметь вид (1)-

(5) с соответствующей заменой множеств рационального выбора. Дальше возможны различные постановки задач.

Рассмотрим сначала задачи

(10) e + 8 ® min

{(e,8)|VeeQ PF (0,e)nPf (в,8)Ф0}

(11) и + v ® max ,

{(u, v)|"веО pF (в,и)пpf (®,v)ф0} заключающиеся в поиске таких минимальных параметров "потерь" (e, 8) или максимальных уровней полезности (и, v) соответственно, что интересы центра и агента согласованы. Решения этих задач могут интерпретироваться как стоимость компромисса [6] между центром и агентом (сумма в целевых функциях используется для получения Парето-эффективного решения).

Обозначим: ydO) = arg max [F(y, в) + f(y, в)],

ysA

y(в) = arg max fy, в), = arg max F(y, в),

ysA ysA

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Утверждение 1. Пусть либо функции F(-) и f(-) непрерывны по совокупности переменных, а множества A и П компактны, либо множества A и Пконечны. Тогда решение задачи (10) имеет вид:

(12) e* = max [FO^, в - F^^B, в],

BgQ

8* = max Шв, в) -в)],

BgQ

а решение задачи (11) имеет вид

(13) и* = min F(yo(в), в,

веО

v* = min fydty, в).

BgQ

Имея решения задач (10) и (11), можно ставить и решать задачу поиска согласованных нормы деятельности Л*(0 и репутации

Ш):

(14) "в еП Ы(в) с P(Q, 8*),

"ве П Ш(в) с Pf(B, e),

"веП Х(в п Шв) Ф 0.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

или

(15) "веП Ы(в) с pj{0, v*),

"веП Ш(в) ср^в, и*),

"веП Л*(в п Ш(в) Ф 0.

Решения задач (14) и (15) существуют (так как в силу утверждения 1 интересы центра и агента согласованы) и обеспечивают Парето-эффективные значения выигрышей центра и агента.

4. Рефлексивная модель

В рассмотренной выше модели с двумя участниками - центром и агентом - фактически, имелся один активный субъект -агент, выбирающий собственные действия. Поэтому рассмотрим модель, в которой имеется множество N = {1, 2, ..., п} активных агентов. Агент i еN выбирает действие y е Ai, а его целевая функция fi(y, в) зависит от вектора y = (y1, y2, ..., yn) действий всех

агентов и от состояния природы в є £ то есть/: А' х £2 ® 9І1, где

А' - П А ■

7еЫ

Предположим, что информированность агентов описывается информационной структурой I — (І1г І2, Іп), где

І7 — (в, ву, вф ...), І, ], к є Ы, - структура информированности 7-го агента, І є Ы, в7 - его представления о состоянии природы, в^ - его представления о представлениях 7-го агента, в7]к - представления І-го агента о том, что 7-ый агент думает о представлениях к-го агента и т.д. в общем случае до бесконечности [8].

Если задана структура информированности I, то тем самым задана и структура информированности каждого из агентов (как реальных, так и фантомных - то есть существующих в сознании других реальных и фантомных агентов). Выбор т-агентом, где т-некоторая последовательность индексов из множества Ы, своего действия хт в рамках гипотезы рационального поведения определяется его структурой информированности 1т, поэтому, имея эту структуру, можно смоделировать его рассуждения и определить его действие. Выбирая свое действие, агент моделирует действия других агентов (осуществляет рефлексию). Поэтому при определении исхода игры необходимо учитывать действия как реальных, так и фантомных агентов.

Обозначим Е+ - множество всевозможных конечных последовательностей индексов из Ы, Е- объединение Е+ с пустой последовательностью, |а| - количество индексов в последовательности а (для пустой последовательности принимается равным нулю).

Набор действий хт, т є Е+, называется информационным равновесием [8], если выполнены следующие условия:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. структура информированности I имеет конечную сложность V то есть, дерево I содержит конечный набор попарно различных

поддеревьев;

\ / /1 ^ ^

2- VА, Ц Є Іі —1т хл — хт ;

3. " І є Ы, " а є Е (16) х* Є АгБ т ах /г (вет., х0і,і--і , У і , а+1 а) .

Уі єАі

Структура информированности является бесконечным деревом, отражающим иерархию представлений агентов в рефлексив-

ной игре [8]. Информационное равновесие (16) (как решение рефлексивной игры) существует в случае, если структура информированности конечна. Конечность информационной структуры по своему определению означает не конечность ее дерева, а существование конечного базиса, в рамках которого рассмотрение фантомных агентов, имеющих ту же информированность, что и другие реальные или фантомные агенты, не дает новой информации и поэтому нецелесообразно.

Действия, выбираемые реальными и фантомными агентами в рамках информационного равновесия, зависят от структуры их информированности, то есть

* *

Ха = (1а), а £ Е+.

Обозначим - множество всевозможных «-деревьев, элементы которого принадлежат множеству П.

Согласованной нормой деятельности /-го агента (реального) '/: Зп ®Аг будем называть отображение '(I) его информационной структуры 1г во множество допустимых действий Аг (см. также

[4]), / £ N. Это отображение (при условии, что целевые функции и допустимые множества всех агентов являются общим знанием)

*

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

совпадает с отображением хг (1г), / £ N. Другими словами, нормой

деятельности реального агента будем считать соответствующую компоненту информационного равновесия (эта норма будет согласованной в силу определений согласованной нормы и информационного равновесия - см. выше). То есть, норма деятельности определяет, какие действия выбирает агент в зависимости от своей информированности (в зависимости от той ситуации, в которой он принимает решения).

Репутацией ау -агента (фантомного, то есть а £ | а| > 1) в

глазах реального (при |ст| = 1) или фантомного (при | а| >2) а-агента будем называть отображение Зп ®Ау его информационной структуры 1а- во множество допустимых действий Ау, а £ £+ у £ N. Это отображение (при условии, что целевые функции и допустимые множества всех агентов являются общим знани-

*

ем) совпадает с отображением хау (1а), а £ £+ у £ N. То есть, репутация определяет, выбора каких действий ожидают от агента другие агенты в зависимости от той информированности, которую

они ему приписывают (в зависимости от той ситуации, в которой он с их точки зрения принимает решения). Например, репутация

*

Щу-го агента в глазах /-го отражает, каких действий х/у ожидает /-

ый агент от у-го.

Таким образом, зависимости действий, образующих информационное равновесие (16), реальных агентов от структур их информированности определяют нормы их деятельности. А зависимости действий фантомных агентов от структур их информированности определяют репутацию реальных и фантомных агентов.

Приведенное выше определение отражает индивидуальную репутацию агентов. Рассмотрим группу S ^N агентов и предположим, что другие агенты наблюдают агрегированный результат ws = wS(ys), где у, = (у/)/ £я - вектор действий агентов из группы S, у$ £ А$ = ^ А . То есть ws: А$ ® Ж$, где - множество возмож-

/е5

ных агрегированных результатов деятельности группы.

Коллективной репутацией группы ^ в глазах реального (при И = 1) или фантомного (при |а >2) а-агента будем называть отображение Ща (ЗЬ)^ ® совокупности информационных структур (1а)] £$ во множество допустимых агрегированных результатов деятельности группы S, а £ Е+ $ ^N.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Согласованность репутации с поведением агентов ("оправды-ваемость" репутации) тесно связана с понятием стабильности информационного равновесия (см. качественное обсуждение выше) [7, 11]. Приведем формальные определения.

Напомним, что рефлексивная игра задается кортежем (А/)/ £^/(•)/ £N, I}, где N = {1, 2, ..., п} - множество участников игры (игроков, агентов), А/ - множество допустимых действий /-го агента, /(•): Ь хА’ ® Щ - его целевая функция, / £ NI - структура информированности. Дополним эту конструкцию набором функций w/(■): ЬхА’ ®Ж/, / £ N.. каждая из которых отображает вектор (в х) в элемент w/ некоторого множества Ж/. Этот элемент wi и есть то, что /-ый агент наблюдает в результате разыгрывания игры.

Функцию w/(•) будем называть функцией наблюдения /-го агента. Будем считать, что функции наблюдения являются общим знанием среди агентов. Если w/(в у) = (в у), т. е. Ж/ = Ь хА’, то /-

ый агент наблюдает как состояние природы, так и действия всех агентов. Если, напротив, множество Ж/ состоит из одного элемента, то /-ый агент ничего не наблюдает.

Пусть в рефлексивной игре существует информационное равновесие хт, т £ £+ (напомним, что т - произвольная непустая конечная последовательность индексов из ^. Зафиксируем / £ N и рассмотрим /-го агента. Он ожидает в результате игры пронаблюдать величину w/ (в/, х/1, ..., х/,/-1, х/, х/,/+1, ..., х/п). На самом же деле он наблюдает величину wi (в хь ..., х2-1, х/, х/+1, ..., хп). Поэтому требование стабильности для /-агента означает совпадение этих величин, являющихся элементами некоторого множества Ж/.

Другими словами, для стабильности репутации необходимо, чтобы каждый реальный агент наблюдал ту величину, которую он и ожидал увидеть в силу приписываемой им оппонентам репутации. Но этого мало - для стабильности равновесия (репутации) необходимо чтобы и у-агент, /, у £ N наблюдал «нужную» величину. Он ожидает в результате игры пронаблюдать

(вР х/]1, "' , Xijj-1, х/у, Xij’j+1, '' ^ хуп).

На самом же деле (т. е. /-субъективно, ведь у-агент существует в сознании /-агента) он наблюдает величину

w] (в, х/1, ..., хг>я, х/у, ху+ь ..., х/п).

Поэтому требование стабильности для /у-агента означает совпадение этих величин.

В общем случае, т. е. для т-агента, т/ £ £+, условие стабильности определяется следующим образом [7, 11]: информационное равновесие хт , т/ £ £+, называют стабильным при заданной структуре информированности I , если для любого т/ £ £+ выполняется

(17) wi (0т/, хй1, ■■■ , Xтi,i-\, хт xt,i+1, •••, хт/п)

wi (вт xт1, ", хт/-1, xt, хт/+1, •••, хтп).

В частном случае, когда функцией наблюдения является вектор действий всех агентов: wi (в, х1,., хп) = (х1,., хп), стабильным является информационное равновесие х = (ха)/ £и, а£., удовлетво-

* *

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ряющее следующему соотношению: V/ £ N V а £ £ ха/ = х/ ,

которое означает, что действие любого реального агента совпадает с действием, ожидаемым от него любым другим (реальным или фантомным) агентом.

Информационное равновесие, не являющееся стабильным, называют нестабильным. Соответственно, репутацию будем называть оправданной, если она определяется стабильным информационным равновесием.

Стабильные информационные равновесия разделяют на два класса - истинные и ложные равновесия. Пусть набор действий xt, ti е S+, является стабильным информационным равновесием. Будем называть его истинным равновесием, если набор (хь ..., xn) является равновесием в условиях общего знания о состоянии природы в. Из этого определения, в частности, следует, что в условиях общего знания любое информационное равновесие является истинным.

Стабильное информационное равновесие, не являющееся истинным, называют ложным. Таким образом, ложное равновесие -это такое стабильное информационное равновесие, которое не является равновесием в случае одинаковой информированности агентов (в условиях общего знания).

Соответственно, оправданную репутацию назовем истинной, если она определяется истинным информационным равновесием. Оправданную репутацию, определяемую ложным информационным равновесием, назовем ложной. Таким образом, оправданная репутация может быть как истинной, так и ложной.

Результаты исследований свойств стабильности и истинности информационных равновесий можно найти в [7, 11]. Их использование при построении моделей норм деятельности и репутации представляется целесообразным и многообещающим. Некоторые примеры приведены в настоящей работе ниже.

Завершая описание рефлексивной модели, рассмотрим следующий вариант взаимной информированности агентов. Пусть с точки зрения i-го агента состояние природы в е W является общим знанием. Тогда определения репутации и норм деятельности (с учетом условия (16)) примут вид:

(18) "i eN Л*(в) eArg max /(в, Шг1(в), ...

yi ^Ai

яш(в), У, ЗД))-

(19) "i, j eN Щв) eArg max /(в, Щв), ...

Уj eAj

■■■, ЯцМ, yj Щ+Ш ЗД)).

Если, в частном случае, репутации агентов {Щ(-)} являются общим знанием, то условия (18), (19) примут вид:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(20) "i eN КЩ eArg max f(в, Щв), ...

У i eAi

..., Щ-Щ У г, Щ+Щ Щв)).

(21) "i, j eN Щв) eArg max /(в, Щв), ...

yj eAj

Щ(в), y, Щ+Щ Щв)).

В заключение рассмотрим ряд модельных примеров.

5. Примеры

Пример 1. Пусть fy, в) = Gy - y2 / 2 r, F(y, в) = Gy - y2 / 2 R, y >0, в e [1/2; 1]. Тогда y/в) = вг, yF(G) = GR, P(G) = {у/Щ}, Pf(G) = {yF(G)}. Норма деятельности К(в) = Gr является единственной, удовлетворяющей (1), а репутация Ш(в) = GR - единственной, удовлетворяющей (2). При этом (3), (4) и (5) выполнено только при r = R. Видно, что согласование в данном случае (когда множество рациональных действий состоит из одной точки) возможно только при полном совпадении интересов центра и агента -получили в некотором смысле вырожденный случай.

Исследуем, какие нормы деятельности и репутации окажутся согласованными в рамках моделей ограниченной рациональности.

2 в R r

Вычислим y0(G) = ---------. Из (12) получаем (максимумы в

R + r

(12) достигаются при G = 1):

R(R - r)2 . r(R - r)2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2(Я + г)2 ’ 2(Я + г)2 '

Значение целевой функции в оптимальном решении задачи

(10) равно —-------). Очевидно, оно обращается в ноль при пол-

2( Я + г )

ном совпадении интересов центра и агента (то есть, при Я = г).

Пусть для определенности Я >г, тогда

* Я — г Я — г

Р(в, 5*) = [г (в- ----); г (в + ---)],

Я + г Я + г

* Я — г Я — г

РАЄ, е*) = [Я (в- -----------------); Я (в + -)].

Я + г

Я + г

Найдем

* * Я — г Я — г

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(22) Р(в 3) пРМ е) = [Я (в- ------------------------); г (в+ -------------)].

Я + г

Я + г

Видно, что при в = 1 Р(1, 5*) пРр{1, £*) = у0(1)

2 Яг

Я + г

Норма деятельности агента и его репутация, удовлетворяющие (14), должны давать непустое пересечение образов, принадлежащее (22).

* Я2г * Яг2

Из (13) получаем: и = ------------V = ------------- Значение

2( Я + г )2 2( Я + г )2

целевой функции в оптимальном решении задачи (11) равно

Яг

----) . Минимумы в (13) достигаются при в = 1/2, поэтому при

полном совпадении интересов центра и агента (то есть, при Я = г) оптимум в (11) равен г / 4.

Пусть для определенности Я > г, тогда

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Р(в, V*) = [г (в-

рр(в и) = [Я (в-Найдем

І

в2 —

Я

Я + г

); г (в +

в2 —

Я

Я + г

)],

в2 —

Я + г

); я (в +

в2 —

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Я + г

)].

(23) р(в, V*) прр(в, и*) = [Я (в-

в2 —

; г (в +

в2 —

Я

Я + г

)].

Я +г, , ^ ,

Норма деятельности агента и его репутация, удовлетворяющие (15), должны давать непустое пересечение образов, принадлежащее (23).

Пример 2. Пусть целевая функция агента представляет собой разность между доходом 1у, получаемым им от "продажи" центру

2

2

2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2

г

г

2

2

г

результатов своей деятельности у >0 по цене Х > 0, и затратами у2 / 2 в, где в > 0 — эффективность деятельности агента:

М в Х) = Ху - у2 / 2 в.

Целевая функция центра не зависит от параметра в и представляет собой разность между его доходом 2 Я т]~у и вознаграждением Ху, выплачиваемым агенту: Е(у, Х) = 2 Я д/у - Ху.

Рассматривая данную модель как модель стимулирования [6], получим:

у(Х в) = Х є уДХ) = (Я / Х)2,

Е(у(Х, в), Х) = 2 Я 4Хв - Х2 в.

Максимум функции Р(у/(Х в), Х) по Х>0 достигается при Х(в) = (Я2 / 4 в)1/3, что приводит к у(в) = (Я в/ 2)2/3, у^Є) = (4 Я Є)2/3. При этом у0(Є = (в Я)23. Следовательно, если положить Л*(в) = у(Є, $КЄ = ув то получим, что

УвєП Х(Є <у0(в) <Ш(в), то есть в рамках классической рациональности центра и агента согласованных норм деятельности и репутаций не существует. Модели ограниченной рациональности могут рассматриваться так же, как и в примере 1.

6. Заключение

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таким образом, в настоящей работе рассмотрены теоретико-

игровые модели репутации и норм деятельности, учитывающие

рефлексию агентов. Под нормой деятельности агента понимается

правило, предписывающее ему то или иное поведение в зависимо-

сти от ситуации. В случае если равновесий игры агентов несколь-

ко, норма деятельности определяет, какое равновесие выбирает

агент. Репутация является, в некотором смысле, рефлексией над

нормой деятельности - она определяет, каких действий от агента

ожидают другие агенты в той или иной ситуации.

Теоретический анализ свидетельствует, что адекватным инст-

рументом описания репутации и норм деятельности является

рефлексивная игра. Зависимость образующих информационное

равновесие действий реальных агентов от их представлений о

существенных параметрах отражает нормы их деятельности. Зави-

симость образующих информационное равновесие действий фантомных агентов от их представлений о существенных параметрах отражает репутацию их прообразов. Репутация является оправданной, если информационное равновесие стабильно, то есть если ожидания агентов относительно поведения других агентов оправдываются.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Литература

1. Бурков В.Н., Новиков Д.А. Идентификация активных систем / Труды международной конференции «Идентификация систем и процессы управления». М.: ИПУ РАН, 2000. С. 101 - 121.

2. Бурков В.Н., Новиков Д.А. Как управлять организациями. М.: Синтег, 2004. - 400 с.

3. Ермаков Н.С., Иващенко А.А., Новиков Д.А. Модели репутации и норм деятельности. М.: ИПУ РАН, 2005. - 63 с.

4. Новиков Д.А. Институциональное управление организационными системами. М.: ИПУ РАН, 2003. - 68 с.

5. Новиков Д.А. Сетевые структуры и организационные системы. М.: ИПУ РАН, 2003. - 108 с.

6. Новиков Д.А. Стимулирование в организационных системах. М.: Синтег, 2003. - 312 с.

7. Новиков Д.А., Чхартишвили А.Г. Прикладные модели информационного управления. М.: ИПУ РАН, 2004. - 130 с.

8. Новиков Д.А., Чхартишвили А.Г. Рефлексивные игры. М.: Синтег, 2003. - 160 с.

9. Саймон Г. Науки об искусственном. М.: Мир, 1972. - 147 с.

10. Словарь иностранных слов. М.: Русский язык, 1982.

11. Чхартишвили А.Г. Теоретико-игровые модели информационного управления. М.: ПМсОфТ, 2004. - 227 с.