Научная статья на тему 'Модели управления толпой'

Модели управления толпой Текст научной статьи по специальности «Математика»

CC BY
576
115
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Проблемы управления
ВАК
Область наук
Ключевые слова
КОЛЛЕКТИВНОЕ ПОВЕДЕНИЕ / ПОРОГОВАЯ МОДЕЛЬ / ПРИНЯТИЕ РЕШЕНИЙ / УПРАВЛЕНИЕ ТОЛПОЙ / COLLECTIVE BEHAVIOR / THRESHOLD MODEL OF DECISION MAKING / MOB CONTROL

Аннотация научной статьи по математике, автор научной работы — Бреер Владимир Валентинович, Новиков Дмитрий Александрович

Рассмотрена пороговая модель поведения группы агентов, которые, принимая бинарные решения (действовать или бездействовать), учитывают выбор других членов группы. Поставлена и решена задача управления порогами и репутацией агентов в целях снижения числа агентов, выбирающих решение «действовать».

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Threshold model of a group of agents is considered. These agents, making binary decisions to act or not to act, take in to account the decisions of the rest of the group. The problem of control of thresholds and reputations is set and solved. The aim of control is to reduce the number of agents that decided to act.

Текст научной работы на тему «Модели управления толпой»

УДК 519.876.2

МОДЕЛИ УПРАВЛЕНИЯ ТОЛПОЙ

В.В. Бреер, Д.А. Новиков

Рассмотрена пороговая модель поведения группы агентов, которые, принимая бинарные решения (действовать или бездействовать), учитывают выбор других членов группы. Поставлена и решена задача управления порогами и репутацией агентов в целях снижения числа агентов, выбирающих решение «действовать».

Ключевые слова: коллективное поведение, пороговая модель, принятие решений, управление толпой.

ВВЕДЕНИЕ

1. ПОРОГОВАЯ МОДЕЛЬ ПОВЕДЕНИЯ ТОЛПЫ

Термин «управление толпой» (crowd control, group navigation) в научной литературе имеет несколько устойчивых и распространенных значений.

Управление движением множества агентов (достижение цели, избежание столкновений, обход препятствий, сохранение формации и т. д.): flock, herd (стадо, стая, толпа) control; formation (строй, формация) control. Данное направление группового управления активно развивается с начала 2000-х гг. и включает в себя две обширные области — аналитические и имитационные (агентные) модели. По каждой из этих областей опубликованы тысячи статей и десятки обзоров.

Управление поведением (принятием решений1) толпы. Здесь можно выделить два больших направления — гуманитарные дескриптивные исследования (в рамках социальной психологии, точнее, ее раздела — психологии толпы) и математическое моделирование (см., например, краткий обзор [1]). В последнем можно также выделить два основных направления. Первое — модели команд (совместного адаптивного принятия решений группами людей на основе поступающей информации о неопределенных факторах — см. обзор в книге

[2]). Классической работой здесь является статья

[3]. Второе направление, которому принадлежит и настоящая работа, инициировано ставшими классическими статьей [4] и монографией [5], породившими целую лавину исследований в области математического моделирования порогового поведения (см. обзор [1]) и, в частности, поведения толпы. Тем не менее, на сегодня формальные постановки задач управления толпой практически отсутствуют.

1 Отдельный аспект — выбор набора мероприятий по «физическим» мерам воздействия на толпу (в целях предотвращения давки, массовых беспорядков и т. д.) — также составляет предмет многочисленных исследований, но нами рассматриваться не будет.

Рассмотрим модель толпы — множество N = = {1, 2, ..., n} агентов, каждый из которых выбирает одно из двух решений — «1» (действовать, например, принимать участие в беспорядках) или «0» (бездействовать). Агент i е N характеризуется своим:

— влиянием на другого агента J.. > 0 — тем «ве-

Ji

сом», с которым к его мнению прислушивается или его действия учитывает другой агент j; будем считать, что для каждого агента j выполнены условия нормировки у j. = 1, t.. = 0;

¿ш^ Ji ''

i * j

— решением xt е {0; 1};

— порогом в. е [0; 1], определяющим, будет ли агент действовать в той или иной обстановке (при векторе x— решений всех остальных агентов). Формально, действие x. i-го агента определим как наилучший ответ (best response — BR) на сложившуюся обстановку:

x = rnxxj =

1, если £ j >9г,

j * i

0, если £ tyxj <Q,. Î * i

(1)

Поведение, описываемое выражением (1), называется пороговым [1]. Равновесием Нэша будет вектор xNдействий агентов такой, что xN = BR(xN) [6].

Рассмотрим по аналогии с работой [7] следующую модель динамики коллективного поведения: в начальный момент времени все агенты бездействуют, далее в каждый из последующих моментов времени агенты одновременно и независимо действуют в соответствии с процедурой (1). Обозначим

Q0 = [I е N19г = 0},

Qk = Qk - i u j i G Nl £ tj > e(|

t j e Qk_ i,j * i J k = 1, 2, ..., n — 1.

(2)

Очевидно О0 с 01 с ... с 0п - 1 с 0п = N. Обозначим через Т = {?..} матрицу влияний агентов, через 9 = (91, 92, ..., 9п) — вектор их порогов. Вычислим следующий показатель:

q(T, 9) = min {k = 0, n - 1\Qk + 1 = Q

k>'

(3)

Равновесие коллективного поведения x* (РКП) определим следующим образом:

x* (T, 9) =

1, если i е Q

q (T,0),

0, если i е N\ Qq(Т в), i е N.

(4)

Утверждение 1. Для любых матриц влияния Т и порогов агентов 9 РКП (4) существует, единственно и является одним из равновесий Нэша для игры с наилучшим ответом (1).

Доказательство. Для доказательства существования необходимо доказать, что множество, по которому берется минимум в выражении (3), не пусто. Предположим противное, т. е. что это множество пусто. Иными словами, в последовательности множеств 00 с 01 с ... с 0п - 1 с 0п не существует совпадающих. Это означает, что каждое последующее множество отличается от предыдущего, как минимум, на один элемент. Но в последовательности имеются п + 1 множеств, а элементов п. Мы пришли к противоречию.

Единственность следует из определения РКП (4) и единственности показателя (3).

Пусть х*(Т, 9) — РКП. Значит все агенты, принадлежащие множеству в), действуют. Но, согласно выражениям (1) и (2) этот выбор совпадает с их наилучшими ответами. Все агенты, принадлежащие множеству в), бездействуют. Согласно формулам (2) и (3)

для этих агентов ^ г.. < 9;, г е в). Согласно

выражению (1) в этом случае наилучшим ответом является бездействие. Значит х; = ВЯ(х_) для всех г, и х*(Т, 9) является равновесием Нэша. Утверждение 1 доказано. ♦

Подчеркнем, что определение РКП конструктивно (см. выражения (2)—(4)) — сложность его вычисления невелика. Отметим также тот факт, что, если отсутствуют агенты с нулевыми порогами, то бездействие всех агентов является РКП. Для управления этот факт, в частности, означает, что в первую очередь следует обращать внимание на «зачинщиков» — агентов, принимающих решение «действовать» даже когда остальные бездействуют.

Модель с репутацией. Обозначим среднее влияние агента у е N на всех остальных агентов через 1

r1 =

-У t... Назовем r. относительной репута-

n - 1h'- 1 1

г * 1

цией, другими словами тем «весом», с которым к его мнению прислушиваются или его действия учитывают остальные агенты. Влияние в модели с репутацией можно характеризовать вектором

Г = {Г} е N.

Действие х. 1-го агента в модели с репутацией определим как наилучший ответ на сложившуюся обстановку:

x, = BR(xJ =

1, если ^ ГуХу >9 ¡,

у * I

0, если ^ ГуХу <9 ¡.

у * I

Частным случаем модели с репутацией — так называемый анонимный случай, когда репутации

1

всех агентов одинаковы и равны r. =

n - 1

В этом

случае в качестве порогов можно выбрать целые т , которые образуют вектор по-

числа mx, m2,

рогов m. Упорядочим агентов в порядке неубывания порогов: mx < m2 < ... < mn и, считая m0 = 0, mn + j > n, определим число p(m) е {0, ..., n}:

p(m) = min {k е N u {0}\mk < k, mk + j > k}. Тогда РКП имеет следующую структуру: x* = 1,

I = 1, р(т); х* = 0, I = р(т) + 1, п, т. е. действовать будут первые р(т) агентов (в случае р(т) = 0 считаем, что все агенты бездействуют).

В работе [2] показано, что равновесие Нэша в анонимной модели можно найти, решая следующее уравнение:

Др) = р, (5)

где И(р) = |{/ е N : т1 < р}| — число агентов с порогами, меньшими р. Очевидно, что РКП будет соответствовать минимальное решение уравнения (5).

Итак, зная пороги и репутации агентов, можно вычислить РКП. Рассмотрим теперь задачи управления — если имеется возможность изменять степени влияния и/или пороги агентов, то как это следует делать, чтобы добиться реализации требуемого РКП, причем исходя из содержательных интерпретаций рассматриваемой модели, будем считать, что цель заключается в уменьшении числа агентов, выбирающих решение «действовать».

2. ПОСТАНОВКА ЗАДАЧИ УПРАВЛЕНИЯ

Агрегированным показателем состояния толпы будем считать число действующих агентов:

ад 9) = 0)|.

В модели с репутацией вместо матрицы Т подставляется вектор г. В анонимном случае К(т) = р(т).

Обозначим векторы начальных значений матриц влияния и порогов агентов Т0 и 90 соответственно. Пусть заданы множества допустимых значений влияний и порогов агентов — соответственно

Т и 0, а также заданы выигрыш H(K) управляющего органа — центра — от достигнутого состояния

толпы K и его затраты С(Т, 0, Т°, 0°) на изменение репутаций и порогов агентов.

Критерием эффективности управления будем считать значение целевой функции центра, равной разности между выигрышем H(•) и затратами С(*). Тогда задача управления примет вид:

Н(ЦТ9 0)) - ОД 0, Т°, 0°) ^

тах . (6)

Т е Т,0е0

Для анонимного случая задача управления (6) примет следующий вид:

Н(р(т)) — C(m, m ) ^ тах,

т е М

(7)

где M — множество допустимых значений векторов порогов в анонимном случае, а m и m° — конечный и начальный векторы порогов соответственно.

Рассмотрим различные частные случаи общей задачи (6), а именно — задачу управления порогами для анонимного случая (§ 3) и задачу управления репутацией для неанонимного случая (§ 4).

3. УПРАВЛЕНИЕ ПОРОГАМИ В АНОНИМНОМ СЛУЧАЕ

Пусть задача центра состоит в том, чтобы обеспечить число действующих агентов равным заданному числу X* > 0, т. е. в реализации нового РКП с числом действующих агентов X *, не превышающего старое РКП с числом действующих агентов р(т). Содержательной интерпретацией является задача центра уменьшить число действующих в РКП агентов. Другими словами, центр, управляя значениями порогов, должен перевести положение РКП в точку, с числом действующих агентов X *. В анонимном случае репутации агентов одинаковы, и задача (7) примет следующий вид:

С(т, т) ^ тт ^ .

т е \Р(Л) = к*}

(8)

Пусть g — неубывающая функция от неотрицательного аргумента, который равен модулю разности между начальным и конечным значениями порога управляемого агента. Будем считать, что затраты на управление порогом одного агента

с(т, т°) = g(|m/ — т° |).

(9)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

По смыслу затрат ^(0) = 0. Полные затраты равны сумме индивидуальных затрат:

С(т, т°) = ^ с(т, т°) = ^ — т° |). (10)

I = 1 I = 1

Для иллюстрации принципа управления порогами предположим сначала, что функция распределения порогов Г(-) — неубывающая, определен-

о.

2 ^

/ / / /

/ / /

X /

Л / / / /

/ / / /

/ /к / к* _1 р(г 1_1 п)

Рис. 1. Вид начальной (/*) и измененной (О) функций распределения порогов

ная на множестве неотрицательных чисел, непрерывная слева и имеющая предел справа в каждой точке. Равновесием в данном случае, по аналогии с уравнением (5), является левая точка пересечения функции распределения порогов с биссектрисой первого квадранта. Эта часть графика функции распределения изображена на рис. 1; функция распределения порогов С (•), полученная в результате управления, изображена жирной линией.

Так как р(т) — минимальное решение уравнения (5) (точка (4, 4) на рис. 1), то

V X < р(т)ДК) > X. (11)

Возможны два случая: Д0+) < X* и Д0+) > X* (например, X * = 3 и X * = 1 соответственно).

Если Д0+) < X*, то, решив уравнение Д^) = X*,

можно найти такую точку Кх = Г*).

В силу выражения (11) X* = Д^) > Кх = F-1(K*). Процесс управления заключается в том, что центр изменяет все пороги, находящиеся внутри интервала [Г '(X*), X*), делая их равными X *. Новая функция распределения С(•) будет равна X* на

7-1/

всем интервале [Г-1^ *), X *]. Значит ^ *) = X *.

Таким образом, мы получили новое значение РКП с числом действующих агентов X *, соответствующее целям центра. Новая функция распределения С (•) совпадает на рис. 1 со старой функцией распределения Г(-) во всех точках вне интервала

[Г-1^*), X*).

Для оценки затрат на перемещение порогов из некоторого малого интервала ¿2] окружающего

п

п

точку ? в точку К* будем считать, что функция Р изменяется на этом интервале на малую величину. Поскольку число агентов на этом интервале равно Д?2) — Р^^, то искомые затраты будут приблизительно равны g(K* - ^Щ^) - Д^)].

Легко показать, что тогда затраты центра на управление в случае Д0) < К * будут равны величине

к *

J g(K* - t)dF(t).

В-1(К*)

Если Д0+) > К *, то у [Д0+) - К *] агентов с нулевыми порогами центр изменяет пороги, делая их равными К *. Затраты на изменение порога одного агента от нуля до К* будут, согласно формуле (9), равны g(K*). Затраты на изменение порогов [ Д0+) — К*] агентов с нулевыми порогами для всех случаев можно записать в виде g(K*)(Д0+) — К *)+,

где (•)+ означает положительную часть выражения в скобках.

Таким образом, полные затраты (10) центра

с(К*) = £(К*)(Д0+) - К*)+ +

к*

+ | g(K* - (12)

В-1( к*)

Утверждение 2. Затраты (12) минимальны для реализации центром РКП с числом действующих агентов К*.

Доказательство. В силу определения функции Д-), для уменьшения величины ДК*), которая согласно выражению (11) больше К*, необходимо увеличить пороги, находящиеся левее точки К *, на такую величину, чтобы их значения стали не меньше значения К *.

Поскольку функция затрат g неубывающая, то изменение значений порогов, превышающих величину К*, приводит к избыточным (неоправданным) затратам. Поэтому для минимизации затрат необходимо, чтобы новое значение изменяемых порогов равнялось К*.

Рассмотрим множество всех возможных результатов управления

Q = ^ A = U [о,, ^ K*; a,. + j > b,, i = 1, q;

i = 1

2 №,) - Да,.)] = ДК*) - К*} \.

г = 1

Управление заключается в перемещении всех порогов, входящих в указанные интервалы, в точку К*. Очевидно, что [^-1(К *), К *) е П.

Затраты на воздействие на множестве А е О

jgiK* - t)dF(t) = 2 Jg(K* - t)dF(t).

A i = 1 a

Сравним полные затраты на изменение значений порогов из интервала [F !(К*), K*) и произвольного множества A е Q. Каждые из этих затрат можно разложить на два слагаемых соответственно:

J g(K* - t)dF(t) = J g(K* - t)dF(t) +

[F-1(K*), K*) A n [F-1(K*), K*)

+ J g(K* - t)dF(t), (13)

[ F-1(K*), K*)\A

Jg(K* - t)dF(t) = J g(K* - t)dF(t) +

A A n [F-1(K*), K*)

+ J g(K* - t)dF(t). (14)

A\[F-1(K*), K*)

Первые слагаемые равенств (13) и (14) совпадают.

Если общие затраты для множества A и [F !(K*), K*) могут различаться, то только на множествах A\[F-1(K*), K*) и [F 1(K*), K*)\A. В силу определения множества Q справедливо следующее равенство:

2 №,) - F(a,.)] = X ТО» - F(a,)].

A\[F-1(K*), K*) [F-1(K*), K*)\A

Затраты на перемещение порогов из множеств A\[F-1(K*), K*) и [F-1(K*), K*)\A можно оценить снизу и сверху соответственно:

J g(K* - t)dF(t) > min g(K* - t) x

A\[F (K*), K*)

t e A\[F (K*), K*)

x 2 [F(b,) + F(a,)],

(15)

A\[F *(K*), K*)

J g(K* - t)dF(t) < max g(K* - t) x

[F-1(K*), K*)\A t e [F (K*)' k*)\a

x 2 [F(b,) + F(a,)]. (16)

[F-1 (K*), K*)\A

В силу монотонности функции затрат справедливо следующее неравенство:

max g(K* - t) < min g(K* - t). (17)

t e [F-1(K*), K*)\A t e A\[F-1(K*), K*)

Из неравенств (15)—(17) следует, что \ - t)dF(t) <

[F-1(K*), K*)\A

< \ g(K* - t)dF(t). (18)

A\[F-1(K*), K*)

Из выражений (13), (14) и (18) следует, что \ g(K* - t)dF(t) < Jg(K* - t)dF(t).

[F-1(K*), K*) A

Утверждение 2 доказано.

Следствие 1. В оптимальном управлении изменяются только пороги, принадлежащие интервалу

[F-1(К*), K*), если К* находится в области опре-

q

b

деления функции Г (•). Если К * находится вне области определения функции Г -1(*), то изменяются пороги, принадлежащие интервалу [0, К*).

Следствие 2. Решение задачи управления порогами не зависит в явном виде от начального РКП.

Следствие 3. Полученное в результате оптимального управления РКП не устойчиво. ♦

Действительно, малое изменение порогов влево от точки К * «уводит» систему в новое положение равновесия (в точку пересечения с биссектрисой (например, в точку (4, 4), см. рис. 1). Для обеспечения устойчивости нужно перемещать пороги правее от точки К*.

Следствие 4. Результат утверждения 2 останется в силе и в случае, когда затраты на изменение порога агента равны g(\mi — т00 |)/Д т00), где Ь(-) —

любая измеримая строго возрастающая функция от значения начального порога. ♦

Имея решение (12) задачи (8) (далее в Примерах 1 и 2 для ряда частных случаев получено аналитическое решение), можно вернуться к задаче (7), которая превратится в следующую задачу скалярной оптимизации:

Н(К *) - с(К *) ^ тах.

к *

Пример 1. Будем рассматривать относительные пороги 0г. = т/я. Пусть их функция распределения представляет собой распределение Парето с показателем а > 1:

а п

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

^ (х) = х + Р «р(х) 1 + в

х < 1, в > 0.

(19)

Тогда плотность распределения„4р(х) = аха У(1 + в). Обратная функция к функции распределения опре-

делена на отрезке

в

< х < 1 и имеет вид (х) =

1 + в

= ((1 + в)х - в)1/а.

Уравнение (5) для РКП запишется как

ха - (1 + в)х + в = 0. (20)

Пусть р — минимальный положительный корень уравнения (20). В силу строгого возрастания распределения (19) р > в/(1 + в).

Введем функцию затрат £(х) = |х |. Пусть целевая точка равновесия к* = К */я. Тогда затраты на реализацию этого РКП, р > к* > в/(1 + в),

= №в(к*) - к*)

СаР(к*) = \ ^ - =

\ = к

( к* )

к (п *ч а а ^ _ 1г*

1 + в

(к *)

(к*) + в

,*а + 1 т * 1 + 1/а

а ( ( к* ) - ( (1 + в ) к* - в ) ' )

а + в)(-+а) .

(21)

Рис. 2. Семейство функций затрат с(к*) на управление (Пример 1)

Пусть теперь 0 < к* < в/(1 + в). Тогда расходы на реализацию этого РКП

Сав(к*) = к*(Г|р - + /^ -

* а + 1

= к* (Д^ - к*1 + - ^ / ген =

1 + в

= к*

1 + в

1 + в

- к*) +

, * а + 1 ( к * )

+ в ) (к + а 1"

(22)

Семейство графиков функции затрат (21) и (22) для различных значений параметра а = 1,3; 1,5; 1,75; 2 и в = 0,25 изображено на рис. 2. Видно, что затраты возрастают при уменьшении показателя а распределения Парето. Это означает, если пороги распределены более равномерно (показатель а меньше), то целевое РКП реализуется с относительно большими затратами.

Максимум затрат достигается в тех точках, где функция распределения максимально «далека» от биссектрисы первого квадранта (см. также рис. 1). Это приводит к тому, что пороги относительно большого числа агентов нужно изменять на большую величину и, соответственно, затраты увеличиваются.

Для всех значений параметров а и в затраты на реализацию нулевого РКП равны нулю. Действительно, достаточно сдвинуть нулевые пороги на малую величину, чтобы получить малое РКП. Так что, если перед центром стоит задача реализовать новую точку РКП, меньшую, чем р (РКП без управления), то оптимальным управлением будет изменить нулевые пороги на малую величину, т. е., другими словами, избавить толпу от зачинщиков. ♦

к

В Примере 1 функция затрат на изменение порогов не зависит явным образом от начальных значений порогов агентов, а определяется только размером изменения порогов. Рассмотрим в следующем примере другую функцию затрат, которая явным образом зависит от начального значения порога.

Пример 2. Будем считать, что в условиях Примера 1 функция затрат на изменение порогов имеет следующий вид:

g(x1, х2) = X - х2|/хг (23)

Пусть целевая точка РКП равна к*. Тогда затраты для р > к* > р/(1 + р) будут равны:

к *

сар(к*) = \ g(k*, к* - =

-1

FTp (k)

= (FJk*) - Г)

(1 + ß) k *

tta - ldt =

Faß (k*)

, * а (k*) + ß 1 - ß

r * а + 1 T * а + 1/а

а ( ( k* ) - ( (1 + ß ) Г - ß ) ' ) k * (1 + ß)( 1 + а)

Пусть теперь 0 < к* < р/(1 + р). Тогда расходы на этом интервале будут бесконечно большие, так как необходимо изменить нулевые пороги на величину к*, а это, согласно формуле (23), требует бесконечно больших затрат. Это означает, что центр может реализовать только РКП из интервала р > к* > р/(1 + р). Семейство графиков функции затрат для различных значений параметра а = 1,3; 1,5; 1,75; 2 и р = 0,25 изображено на рис. 3. ♦ В Примере 2 функция затрат на управление обладает легко интерпретируемым свойством моно-

Рис. 3. Семейство функций затрат c(k*) на управление (Пример 2)

тонности — чем больше отклонение нового РКП (реализуемого центром в процессе управления порогами агентов) от старого (в отсутствии управления), тем выше затраты.

4. УПРАВЛЕНИЕ РЕПУТАЦИЕЙ

Пусть имеет место не анонимный случай, пороги агентов фиксированы, т. е. рассмотрим задачу управления репутацией. Предположим, что задача центра состоит в том, чтобы обеспечить число действующих агентов, не превышающее заданного

числа K* > 0. Тогда задача управления примет вид C(r, 0, r0, 0) ^ min .

r е R n {n || Q 0 | < K*}

1 111 q(n,Ö0)' '

В первоначальном РКП действуют только агенты из множества Qk, т. е. имеет место следующая система неравенств:

Z r > 0i, i е Qk,

j е Qk\ {i}

Z j <0,, i е N\ Qk.

j е Qk

(24)

Фиксируем некоторое множество Р с N и запишем по аналогии с выражением (24) условия того, что при новых значениях репутаций действуют только агенты из этого множества:

r > 0 ji

i е P,

X

У е Р\ {/}

X tj <0, I е N\Р.

У е Р

Обозначим через с(Р) оптимальное значение критерия следующей оптимизационной задачи:

C(r, 0, r0, 0) ^ min.

r: (38)

(25)

Отметим, что в задаче (25) минимизация ведется на множестве, описываемом п линейными неравенствами. Если и затраты линейны (или выпуклы), то это задача линейного (соответственно, выпуклого) программирования.

Значение с(Р) характеризует минимальные затраты на управление репутацией агентов, при котором действуют агенты из множества Р с N и только они. Если задача центра заключается в том, чтобы обеспечить число действующих агентов, равное заданному числу X* > 0, то для минимизации затрат на управление необходимо решить задачу (25)

для каждого из X* -элементных множеств Р, а затем выбрать то множество Р *, на котором достигается

минимум затрат: P* = arg

min

N ,

c(P).

P е{ W е 2n : | W| = K*}

k

а

5. РЕФЛЕКСИВНОЕ УПРАВЛЕНИЕ

Мы рассмотрели два случая управления со стороны центра — воздействия на пороги агентов и на их репутации. Проанализируем возможности рефлексивного (в рамках настоящей работы синоним — информационного) управления, в котором центр воздействует на представления агентов о параметрах друг друга, на представления о представлениях и т. д. [8]. В качестве предмета управления выберем пороги агентов. Рефлексивным управлением будет формирование у агентов структур информированности вида: 9.. — представления 1-го агента о по-ц

роге у-го (структура информированности второго ранга или глубины два); 9.к — представления 1-го агента о представлениях у-го агента о пороге к-го агента (структура информированности третьего ранга или глубины три) и т. д. Обладая той или иной структурой информированности, агенты выбирают действия, являющиеся информационным равновесием [8], в котором каждый агент выбирает свои действия как наилучший ответ на те действия, которые в рамках его представлений должны выбрать оппоненты.

Воспользовавшись результатами § 3 и 4, характеризующими значения порогов, приводящих к требуемому РКП, можно условно считать, что любой результат, достижимый путем реального изменения порогов, может быть по аналогии реализован информационным управлением (изменением представлений агентов о порогах друг друга). С этой точки зрения информационное управление порогами эквивалентно просто управлению порогами, будучи при этом, наверное, более мягким, чем последнее.

Однако при реализации информационного управления в задачах управления поведением толпы существует одна проблема. Одно из свойств «хорошего» информационного управления состоит в его стабильности [9] — свойстве, заключающемся в том, что все агенты наблюдают в реальности те результаты, которых ожидали.

Предположим, что в рассматриваемой модели толпы каждый агент апостериори наблюдает число агентов, принявших решение «действовать» (отметим, что это достаточно слабое предположение по сравнению с взаимной наблюдаемостью индивидуальных действий). Тогда стабильным будет информационное управление, при котором каждый агент увидит, что реально действует ровно столько агентов, сколько он и ожидал увидеть действующими. Требование стабильности существенно при длительных взаимоотношениях управляющего центра и агентов — если (при нестабильном информационном управлении) агенты один раз усомнятся в достоверности сообщаемой центром информации, то и в дальнейшем они будут иметь все основания в ней сомневаться.

Утверждение 3. В анонимном случае не существует стабильного информационного равновесия, при котором действует строго меньшее число агентов, чем в РКП.

Доказательство. Обозначим через QE множество агентов, действующих в стабильном информационном равновесии. Предположим, что их число не превышает числа действующих в РКП |QE| < |Qp(8)|. В силу стабильности информационного равновесия для каждого агента i е QE должно быть выполнено |QJ — 1 =

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

= 2 xj - (и — 1)9,-. Значит |Qp(8)| — 1 > (и — 1)9,, из чего

j * i

следует, что i е Qp(8). Таким образом, QE с Qp(8). Если существуют бездействующие агенты в Qp(8)\QE, то для них это равновесие нестабильно. Поэтому QE = Q^ для стабильного информационного равновесия. Утверждение 3 доказано. ♦

«Негативный» результат утверждения 3 свидетельствует о сложности осуществления долгосрочного информационного управления пороговым поведением толпы.

ЗАКЛЮЧЕНИЕ

Сформулированы и решены для ряда важных частных случаев задачи управления коллективным пороговым поведением толпы путем управления порогами агентов, репутацией агентов и путем рефлексивного управления. Перспективным представляется исследование эффективности совместного применения этих видов управления.

ЛИТЕРАТУРА

1. Crowd Behavior at Mass Gatherings: A Literature Review / K. Zeitz, H. Tan, M. Grief, et al. // Prehospital and Disaster Medicine. - 2008. - Vol. 24, N 1. - P. 32-38.

2. Новиков Д.А. Математические модели формирования и функционирования команд. — М.: Физматлит, 2008.

3. Banerjee A. A Simple Model of Herd Behavior // Quarterly Journal of Economics. - 1992. - Vol. 107, N 3. - P. 797-817.

4. Granovetter M. Threshold Models of Collective Behavior // The American Journal of Sociology. - 1978. - Vol. 83, N 6. -P. 1420-1443.

5. Schelling T. Micromotives and Macrobehaviour. - New York, London: Norton & Co Ltd, 1978.

6. Губко М.В., Новиков Д.А. Теория игр в управлении организационными системами. - М.: СИНТЕГ, 2002.

7. Бреер В.В. Теоретико-игровая модель неанонимного порогового конформного поведения // Управление большими системами. - 2010. - № 31. - С. 162-176.

8. Новиков Д.А., Чхартишвили А.Г. Рефлексивные игры. -М.: СИНТЕГ, 2003.

9. Чхартишвили А.Г. Теоретико-игровые модели информационного управления. - М.: ПМСОФТ, 2005.

Статья представлена к публикации членом редколлегии В.В. Кульбой.

Бреер Владимир Валентинович - бизнес-аналитик, ЗАО «Авиахэлп Групп», г. Москва, И [email protected], Новиков Дмитрий Александрович — чл.-корр. РАН, зам. директора, Институт проблем управления им. В.А. Трапезникова РАН, г. Москва, ® (495) 334-75-69, И [email protected].

i Надоели баннеры? Вы всегда можете отключить рекламу.