Научная статья на тему 'Стохастические модели управления толпой'

Стохастические модели управления толпой Текст научной статьи по специальности «Математика»

CC BY
525
137
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОЛЛЕКТИВНОЕ ПОВЕДЕНИЕ / МОДЕЛЬ ПОРОГОВОГО ПРИНЯТИЯ РЕШЕНИЙ / УПРАВЛЕНИЕ ТОЛПОЙ. / COLLECTIVE BEHAVIOR / MODEL OF THRESHOLD DECISION MAKING / MOB CONTROL

Аннотация научной статьи по математике, автор научной работы — Бреер Владимир Валентинович, Новиков Дмитрий Александрович, Рогаткин Андрей Дмитриевич

Рассматривается модель порогового поведения агентов, которые, принимая бинарные решения (действовать или бездействовать), учитывают выбор других членов группы. Ставится и решается задача управления – случайного выбора начальных состояний части агентов в целях изменения числа тех из них, кто в равновесии выбирает решение «действовать».

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Бреер Владимир Валентинович, Новиков Дмитрий Александрович, Рогаткин Андрей Дмитриевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Stochastic models of mob control

Considered a model of threshold behavior when each agent takes binary decision – to act or not to act according to the behavior of other agents. Problem of control is formulated and solved – the stochastically distributed initial state of part of agents is affected in order to change the equilibrium of acting agents.

Текст научной работы на тему «Стохастические модели управления толпой»

УДК 519.833.2 ББК 22.176

СТОХАСТИЧЕСКИЕ МОДЕЛИ УПРАВЛЕНИЯ ТОЛПОЙ

Бреер В. В.1, Новиков Д. А.2, Рогаткин А. Д.3

(ФГБУН Институт проблем управления РАН, Москва)

Рассматривается модель порогового поведения агентов, которые, принимая бинарные решения (действовать или бездействовать), учитывают выбор других членов группы. Ставится и решается задача управления - случайного выбора начальных состояний части агентов в целях изменения числа тех из них, кто в равновесии выбирает решение «действовать».

Ключевые слова: коллективное поведение, модель порогового принятия решений, управление толпой.

1. Введение

Рассмотрим модель некоторой социальной системы (примерами являются социальная сеть [7] или толпа [19]), включающей нескольких взаимодействующих агентов. Каждый агент может находиться в одном из двух состояний (принимать одно из двух решений): «1» (действовать, быть в возбужденном состоянии, например, принимать участие в беспорядках) или «0» (бездействовать, быть в нормальном, невозбужденном состоянии). При принятии своего решения каждый агент ведет себя конформно - принимает во внимание

1 Владимир Валентинович Бреер, к.т.н. ([email protected]).

2Дмитрий Александрович Новиков, чл.-корр. РАН, зам. директора, Институт проблем управления им. В.А. Трапезникова РАН (novikov@ipu. ги).

3 Андрей Дмитриевич Рогаткин, мл. науч. сотрудник, Институт проблем управления им. В.А. Трапезникова РАН, г. Москва (andreyrogatkin @gmail.com).

так называемое социальное давление [8, 9, 14], т.е. поведение (наблюдаемое или прогнозируемое) своего окружения: если определенное число (или доля) его «соседей» действует, то и он действует. Минимальное число/доля действующих соседей, при которой «возбуждается» данный агент, называется его порогом.

В многочисленных моделях порогового коллективного поведения (см. обзор [3]), являющихся развитием базовой модели [21], «равновесное» (в рамках динамики коллективного поведения) состояние толпы определяется функцией распределения порогов агентов. С точки зрения теоретико-игровых моделей порогового поведения [18], распределение порогов также является ключевой характеристикой, определяя множество равновесий Нэша игры агентов.

Другими примерами конформного поведения, не являющегося пороговым, являются модели марковского типа с вероятностью перехода из одного состояния в другое (см. например [22]). В отличие от рассматриваемой модели в них присутствуют смешанные стратегии поведения агентов.

Изучаемая в данной работе модель близка к агент-ориентированным моделям, таким как модель ограниченного окружения Шеллинга (bounded-neighborhood model) [26], но в изучаемой модели не участвует пространственная компонента, как например в другой модели Шеллинга - модели пространственного соседства (spatial proximity model) [26]. Пространственная компонента приводит к сильному усложнению аналитического решения, например модель пространственного соседства решена только методом имитационного моделирования.

Имея зависимость равновесного состояния системы (социальной сети, толпы и т.п.) от функции распределения порогов, можно исследовать задачи управления последними, например, поиска управления, приводящего систему в требуемое равновесие.

В [19] поставлена и решена задача управления порогами агентов, приводящего (с минимальными затратами на управление) к реализации заданного равновесия (т.е. к возбуждению заданного числа или доли агентов). При этом считалось, что изменениям подвержены пороги вполне

конкретных агентов, более того, один из этапов решения задачи управления как раз и состоял в выборе множества тех агентов, пороги которых необходимо изменять. Альтернативой является управление, заключающееся в целенаправленном начальном возбуждении некоторого множества агентов, после чего агенты, взаимодействуя, приходят в соответствующее равновесие - так называемая задача управления возбуждением сети, см. [12]. И в том, и в другом случае управление персонифицировано [25], т.е. управленческим воздействиям подвергаются состояния или/и характеристики (например, пороги) вполне конкретных агентов.

В отличие от перечисленных работ, ниже рассматриваются стохастические модели управления пороговым поведением, в рамках которых множество агентов, пороги которых изменяются, или значения этих порогов, выбираются случайным образом (см. также [4]). Одним из средств такого управления на практике может быть воздействие СМИ [7] или любые другие унифицированные (информационные, мотивационные и/или институциональные [25]) воздействия на агентов (см. обзоры в [1, 5, 13, 15]).

Например, возможны следующие интерпретации потенциальных управленческих воздействий: обнуляются (что соответствует «возбуждению») либо делаются максимальными (что соответствует «иммунизации» - полной невосприимчивости к социальному давлению) пороги заданной доли агентов, выбираемых случайным образом. Или можно считать, что каждый агент может быть с заданной вероятностью возбужден или/и иммунизирован. И т.д. Подобные трансформации порогов агентов приводят к соответствующему изменению равновесного состояния управляемой социальной системы (сети, толпы) - см. подробности ниже.

Еще одним способом управления пороговым поведением (а не порогами агентов) является управление составом (см. классификацию видов управления в [25]), т.е. внедрение в социальную систему дополнительных агентов с нулевыми (таких агентов будем называть провокаторами) и максимальными (таких агентов будем называть иммунизаторами) порогами. При этом равновесие социальной

системы будет зависеть от числа внедренных агентов соответствующего типа.

Если имеются два управляющих органа (центра), осуществляющих противоположные информационные воздействия на агентов, то такую ситуацию распределенного контроля [25] можно интерпретировать как информационное противоборство [6, 7] между центрами. Имея результаты анализа задач управления каждым из центров поодиночке, можно ставить задачи описания их взаимодействия в терминах теории игр.

Структура последующего изложения такова: во втором разделе описывается базовая модель порогового поведения агентов, в третьем и четвертом разделах - модели управления соответственно возбуждением и иммунизацией толпы, в пятом - модели информационного противоборства.

2. Базовая модель

Рассмотрим теоретико-игровую модель толпы - множество N = {1, 2, ..., n} агентов. Агент i е N характеризуется, во-первых, своим влиянием tji > 0 на агента j - тем «весом», с которым к его мнению прислушивается (или его действия учитывает) последний. Будем считать, что для каждого агента j выполнены следующие условия нормировки: ^ ф j tji = 1, tu = 0. Во-вторых, агент характеризуется своим решением Xi е {0; 1}. В-третьих - своим порогом Oi е [0; 1], определяющим, будет ли агент действовать при той или иной обстановке (векторе X-i решений всех остальных агентов). Формально действие Xi i-го агента определим как наилучший ответ (BR - best response) на сложившуюся обстановку:

\ если £ tt.Xj > в,,

j

0, если < в.

ij j i

j *i

Поведение, описываемое выражением (1), называется пороговым [3]. Равновесием Нэша будет вектор xn действий агентов, такой что xn = BR(xn), где BR(x) = (BRi(x_i), ..., BRn(x-n))

(1) хг = BR,(x-r) =

Рассмотрим приведенную в [19] модель динамики коллективного поведения: в начальный (нулевой) момент времени все агенты бездействуют, далее в каждый из последующих моментов времени агенты одновременно и независимо действуют в соответствии с процедурой (1). Обозначим, Qo = 0,

(2) Ql = {/ е N| в = 0},

Qk = Qk-l и {/ е N | £ Хц> в}, к = 1, 2, ..., п - 1.

Р-йк -1.1 &

Очевидно, что Qo с Ql с ... с Qn с N. Обозначим через Т = {%} матрицу влияний агентов, через в= (в, в2, ..., вп) -вектор их порогов. Вычислим следующий показатель:

Равновесие коллективного поведения (РКП) определим следующим образом:

(где # обозначает мощность множества) характеризует долю действующих в РКП агентов.

В [19] доказано, что для любых матриц влияния Т и векторов порогов агентов в РКП (3) существует, единственно и является одним из равновесий Нэша для игры с наилучшим ответом (1).

В дальнейшем будем рассматривать анонимный случай (когда граф связей между агентами является полным: Ц = 1/(п - 1)). Обозначим через [0; 1] ^ [0; 1] функцию распределения порогов агентов ) - неубывающая функция, определенная на единичном отрезке, в каждой точке непрерывная слева и имеющая предел справа), через {х^ > о -последовательность долей действующих агентов (в дискретном времени, где ^ обозначает номер момента времени (шага)).

д(Т, в) = Шп {к = 0.п -1 | Qk+l = Qk}.

(3)

Величина

Неанонимный случай не позволяет выразить решение РКП через функцию распределения порогов и требует других подходов.

В [12] решалась задача определения множества/доли хо первоначально возбуждаемых агентов, приводящей к требуемому равновесию. В рассматриваемых в настоящей работе моделях агенты возбуждаются «самостоятельно» (17). Предположим, что известна доля Хк агентов, действующих на км шаге (к = 0, 1, ...). Для последующих шагов справедливо следующее рекуррентное соотношение, описывающее динамику поведения множества агентов [18, 21]:

(4) Х/+1 = Щх/), I = к, к + 1, ... .

Положения равновесия системы (4) определяются начальной точкой хо (ниже считается, что хо = 0) и точками пересечения графика функции Щ-) с биссектрисой первого квадранта (в силу свойств функции распределения одним из равновесий всегда является единица):

(5) Щх) = х.

Устойчивыми могут быть точки равновесия, в которых график функции Щ-) пересекает биссектрису, приближаясь к ней «слева сверху». Обозначим через х* РКП, соответствующее функции распределения порогов Щ). Обозначим также у = т£ |х: х е (0,1], Г(х) = х| наименьший отличный от нуля корень уравнения Г (х) = х. В соответствии с (17) и (4) равновесием коллективного поведения (и равновесием Нэша игры агентов) будет точка ^ * |У, если У г е[0,у] F(г)> г, [0, иначе.

В силу свойств функции распределения, для того чтобы реализовалось отличное от нуля РКП, достаточно, чтобы было выполнено Щ(0) > 0.

Итак, в соответствии с выражениями (5) и (6) РКП толпы определяется функцией распределения порогов агентов. Следовательно, управление, заключающееся в изменении последней, будет приводить к соответствующему изменению РКП. Рассмотрим некоторые возможные постановки задач управления.

3. Управление «возбуждением» толпы

Предположим, что пороги агентов являются независимыми одинаково распределенными случайными величинами с теоретической функцией распределения Пусть в результате управленческого воздействия порог каждого агента независимо от других агентов может стать равным нулю с одинаковой для всех агентов вероятностью а е [0; 1]. Данную модель будем называть моделью I. Так как в соответствии с (1) агенты, имеющие нулевые пороги, выбирают единичные действия независимо от действий других агентов, то параметр а может интерпретироваться как доля первоначально возбуждаемых агентов.

Утверждение 1. В результате «возбуждения» пороги агентов будут описываться функцией распределения

(7) ^о(х) = а+ (1 - а) Щх).

Доказательства утверждений вынесены в Приложение.

Подставляя новую функцию распределения (7) в уравнение (5) можно найти а, которое приводит к реализации заданного РКП у:

(8) а(у) = У - р(У).

1 - ^ (у)

Из выражения (6) следует, что если для некоторого у е (0; 1] а(у) < 0, то данное РКП не может быть реализовано рассматриваемым видом управленческого воздействия.

Обозначим через х (а) РКП (6), соответствующее функции распределения (8),

к = и

ае[0;1]

- множество достижимости, т.е. множество таких долей агентов, возбуждение которых может быть реализовано как РКП при некотором управлении.

Простой аналитический вид функции распределения (8) позволяет легко получать ответы на многие содержательные вопросы.

Утверждение 2. Если - строго выпуклая функция и ^(0) = 0, то Жа = [0; 1], т.е. выбором значения параметра а

любая доля возбужденных агентов может быть реализована как РКП.

Если задан выигрыш центра Н(х) от возбуждения доли агентов х и его затраты са(а) на осуществление управленческого воздействия, то задача управления возбуждением толпы может быть сформулирована как

(9) Я(х*(а)) - са(а) ^ тах .

ае[0;1]

Пример 1. Рассмотрим в качестве примеров следующие функции распределения:

(I) ^(х) = х,

(II) ^п(х) = х2,

(III) ^Ш(х) = 4х .

Для функций распределения (^-(Ш) получаем из (8):

- аг(у) = 0, т.е. в этом случае единственным РКП является единичное = {1});

- 0*00 = , хп*(а) = 1"1" а № = [0; 1];

1 + у 2 (1 -а)

- аш(у) = - -у[у < 0, т.е. в этом случае единственным РКП

является единичное (ЖаШ = {1}).»4

Возможно «динамическое» обобщение рассматриваемой модели, когда в каждый период ' дискретного времени каждый агент может независимо возбудиться с вероятностью а (в том числе может оказаться, что один и тот же агент возбудился «несколько раз»). В этом случае получим функцию распределения

(10) х) = 1 - (1 - а)' + (1 - а)'Дх), г = 0, 1, 2, ... .

Другой вариант «динамического» обобщения - когда вероятности возбуждения в каждом периоде времени в общем случае различны - может быть сведен к случаю единственного периода времени. Действительно, легко проверить, что функция распределения, соответствующая двум периодам времени с

4 Символ «•» здесь и далее обозначает окончание примера, доказательства и т.д. 92

вероятностями независимого возбуждения а\ и аг соответственно, имеет вид (8), где (\\) а = а\ + аг - а\ аг.

Рассмотрим другой способ управления положением равновесия (модель II) - когда к множеству N (напомним, что #N = п) добавляются к внешних провокаторов (множество К). Они имеют пороги $ = 0 V 7 е К и всегда действуют. Тогда вероятность того, что произвольно выбранный агент из нового множества агентов N и К имеет порог, не превышающий х, складывается из вероятностей двух независимых событий:

\) вероятности того, что выбранный агент является внешним провокатором, а именно к

к + п '

2) вероятности того, что выбранный агент не является внешним провокатором и его порог не превышает х:

Таким образом, мы получили новое множество агентов, пороги которых являются независимыми и одинаково распределенными величинами со следующей функцией распределения:

(\2) ^ (- )=к+п+(' - к+п)* (1) •

В модели I вероятность а, кроме как вероятность возбуждения произвольного агента, может быть проинтерпретирована как вероятность встретить такого агента с нулевым порогом. Поэтому разумно ввести то же обозначение и для вероятности встретить внешнего провокатора во второй модели: к

а =-.

к + п

Как видно из сравнения функций распределения (7) и (\2), в случае, когда речь идет только о «возбуждении» части агентов, модели I и II являются эквивалентными.

Перейдем теперь к «обратному» управлению, а именно к снижению возбуждения, т.е. к так называемой «иммунизации» толпы.

4. Управление «иммунизацией» толпы

Пусть в результате управленческого воздействия порог каждого агента независимо от других агентов может стать равным единице с одинаковой для всех агентов вероятностью ¡5 е [0; 1]. Так как, в соответствии с (1), агенты, имеющие единичные пороги, действовать не будут, то параметр 5 может интерпретироваться как доля первоначально «иммунизируемых» агентов. По аналогии с тем, как это доказано в Приложении для функции распределения (8), можно показать, что в результате «иммунизации» пороги агентов будут описываться функцией распределения

л^т^ J*1 -5) F(x), x е [0; 1),

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(13) Ffa) = 1

I 1, x = 1.

Обозначим через x*(5 РКП (6), соответствующее функции распределения (13), через

Wp= (J х\Р)

М 0;1]

- множество достижимости.

Подставляя новую функцию распределения (13) в уравнение (5), можно найти ¡, которое приводит к реализации заданного РКП у:

(14) ¡(у) = 1 .

F (у)

Из выражения (13) следует, что если для некоторого у е (0; 1] ¡(у) < 0, то данное РКП не может быть реализовано рассматриваемым видом управленческого воздействия.

Утверждение 2а. Если F(-) - строго вогнутая функция и F(0) = 0, то W = [0; 1], т.е. выбором значения параметра в любая доля возбужденных агентов может быть реализована как РКП.

Утверждение 2а можно доказать аналогично утверждению 2.

Пример 2. Для функций распределения (I)—(III) получаем из (14):

- ßl(y) = 0, т.е. в этом случае единственным РКП является нулевое (Wßl = {0});

- ßn(y) = 1 - 1 ^ 0, т.е. в этом случае единственным РКП яв-

У

ляется нулевое (Wß11 = {0});

- ßni(y) = 1 - 4У, xin*(ß) = (1 - ß)2, Wß111 = [0; 1]..

Пример 3. Приведем пример решения задачи (9) с функцией распределения (III). Пусть центр заинтересован в минимизации доли возбужденных агентов: H(x) = - x, и несет затраты сДД) = — ß, где у> 0. Получим задачу -(1 - ß)2 - —ß^ max .

ße[Ü;1]

Решение этой задачи ß = 1 - — соответствует реализации

2

РКП —..

4

Рассмотрим, как и в третьем разделе, модель II - способ управления положением равновесия, когда к множеству N добавляются l иммунизаторов (множество L). Иммунизаторы не действуют никогда и имеют пороги dt = 1 V i е L. Тогда вероятность того, что произвольно выбранный агент имеет порог, не превышающий x < 1, равна вероятности того, что выбранный агент не является иммунизатором и его порог не превышает x < 1, т.е.

1 - jh)F (1) •

Так как вероятность того, что порог произвольно выбранного агента не превышает единицы, равна единице, то мы получили новое множество N и Ь агентов, пороги которых являются независимыми и одинаково распределенными величинами со следующей функцией распределения: I

(15) Fl (х) =

1 -I + n

1, х = 1.

j F ( х), х < 1,

В первой модели вероятность ¡, кроме как вероятность иммунизации произвольного агента, может быть проинтерпретирована как вероятность встретить такого агента с единичным порогом. Поэтому разумно ввести то же обозначение и для вероятности встретить внешнего иммунизатора во второй модели:

I + п

Как видно из сравнения функций распределения (13) и (15), в случае, когда речь идет только об иммунизации части агентов, модели I и II являются эквивалентными.

Перейдем теперь к управлению со стороны двух центров по возбуждению и иммунизации толпы одновременно.

5. Информационное противоборство в управлении толпой

Выше толпа рассматривалась как объект управления, осуществляемого одним субъектом - центром. В случае, когда существует несколько субъектов, заинтересованных в тех или иных состояниях сети и имеющих возможность оказывать на нее управляющие воздействия (так называемая система с распределенным контролем [25]), возникает взаимодействие между этими субъектами, которое в случае информационных воздействий, оказываемых ими на сеть, называется информационным противоборством (см. обзор [7]). Такие ситуации обычно описываются игрой в нормальной форме между центрами, причем выбираемые центрами стратегии определяют параметры игры между агентами [25]. Примерами служат модели информационного противоборства в социальных сетях [6], на когнитивных картах [24] и др. - см. обзор [11]. Как отмечается в [12], возможны и более сложные ситуации, когда управленческие воздействия «несимметричны» - например, в ситуации «нападение/защита» один центр воздействует на начальные состояния агентов, а другой (одновременно с первым или уже зная его выбор) изменяет структуру связей между ними

или/и их пороги. Такие ситуации могут быть описаны в рамках моделей иерархических игр.

Рассмотрим случай информационного противоборства, когда имеются два центра и доля a е [0, 1] агентов «возбуждается» первым центром, а доля ß е [0, 1] агентов «иммунизируется» (или каждый агент независимо с соответствующей вероятностью может быть возбужден или/и иммунизирован) вторым центром. Для определенности предположим, что если некоторый агент возбуждается и иммунизируется одновременно, то его порог не меняется (модель I). Тогда получим следующую функцию распределения порогов агентов:

, , (а(1 -ß) + (1 -a-ß+ laß) F(x), xе[0;1),

(16) Faß(x) = i

{ 1, x = 1.

Обозначим через x (a, ß) РКП (6), соответствующее функции распределения (16). Обозначим также

y (a,ß) = inf |x: x е (0,1], Fa ß (x) = xj- наименьший отличный от

нуля корень уравнения Fa ß (x) = x . В соответствии с (17) и (4)

равновесием коллективного поведения будет

х* (aß) = \ У (a,ß, есЛи Vz е С0, J (Faß (Z ^ " [0, иначе.

Утверждение 3. Для любого ß е [0, 1]

(17) x*(a, ß) монотонно неубывает по a.

Утверждение 4. Для любого ae [0,1] x*(a, ß) монотонно невозрастает по ß.

Доказательство утверждения 4 аналогично доказательству утверждения 3.

Обозначим через

W,,p = IJ x(a,ß)

(a,ß)e.[ 0;1]2

- множество достижимости.

Обозначим через Vaß множество достижимых равновесий, т.е множество тех точек, которые при выборе некоторого управления (a, ß) оказываются точками устойчивого равновесия системы (РКП). Из определения следует, что Wa,ß с Vaß. Точки

множества Уа,р являются точками, реализующими РКП при некотором выборе хо, в общем случае отличном от хо = 0, принятого в данной работе.

Подставляя новую функцию распределения (\6) в уравнение (5), можно найти пары (а, Р), которые приводят к реализации заданного РКП.

Пример 4. В качестве примера функции распределения рассмотрим выражение (I), для которого получаем

(\8) х:*(а, Р) = а(|.

а + р - 2ар

График функции распределения Р-арх) приведен на Рис. \.

Рис. 1. х'*(а, Р) для Р(х) = х

1-в(1-а)

а(1-в)

х

0

х1'(а, р)

1

Рис. 2. График функции распределения Р-а,рх)

В настоящем примере Жа,р с Уа,р = [0, 1]. • Для нахождения множества достижимости, а также для определения класса функций, для которых имеет место = [0, 1], запишем функцию распределения порогов агентов, получающуюся в результате воздействия центров, в виде

Легко убедиться, что не любые значения 8 е [0, 1], к е [0, 1] могут быть получены путём преобразования (19) некоторых а е [0, 1], р е [0, 1]. При этом ограничение к + 8< 1 (следующее из свойств функции распределения) не единственное (см. Рис. 3).

8(а,р) + к(а,Р)Р(х), х е[0,1),

1,

х = 1,

где

Рис. 3. Область значений преобразования (а, /3)^(5, к) (выделена серым цветом)

Утверждение 5. Множество значений преобразования (19) есть множество точек (5, к) единичного квадрата [0, 1] х [0, 1], удовлетворяющих условиям

(20) к < 1 -5, к > 275(1 -45) .

Для нахождения множества достижимости для произвольной гладкой функции распределения ^(х) может быть использовано следующее утверждение (см. рис. 4).

Утверждение 6. Точка х е [0, 1] принадлежит множеству достижимого равновесия функции распределения е С[0, 1] тогда и только тогда, когда выполнено либо ^(х) = 0, либо

(21)

*'( х ) * ( * )

х -

< 1.

(При ^(х) = 1/2 значение выражения в скобках следует понимать как его конечный предел, и условие (21) имеет вид 2х(1 - х)Р < 1).

Утверждение 7. Точка х е [0, 1] принадлежит множеству достижимоcти функции распределения Е(-) е С[0, 1] тогда и только тогда, когда она принадлежит её множеству достижимых равновесий и

(22) та (^(х )+(х)р (^)_ ^) -0,

где

Smax ( X) =

F ( x){ F ( X)

- 2

-1

F ( x )

-2

kmin ( X(X (X)) .

Пример 5. В работе [1] было проведено исследование реальных онлайн-сетей Facebook, Livejoumal и Twitter и показано, что F(x) может быть приближено функцией из семейства

(23) F (х,в,Х) =

arctg(Л(х - 0)) + arctg (Л0)

аг^ (Л(1 + аг^ (Лв) '

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где в - параметр, характеризующий происходящее в сети явление, приводящее к конформному поведению с бинарным действием, не зависящий от структуры сети, а Л - параметр, характеризующий исключительно граф связей социальной сети и не зависящий от происходящего в ней явления. В [1] была найдена наилучшая аппроксимация параметра Л: Ле ~ 13. На Рис. 4 изображена зависимость РКП от действий двух центров.

Как видно из Рис. 4., множество достижимости не является отрезком [0, 1], что означает, что не каждое состояние социальной сети Facebook может быть реализовано как РКП в игре двух центров.

Введём обозначения:

= {(х,в) : х е р для ^(х,в,л)}, где Е(х, в, Л) описывается (23)

2

2

<Р = {{х,в) : х е Жа р для Г(х,в,Х,

где Щ(х, в, Л) описывается (23).

На Рис. 5 и Рис. 6 изображены данные множества для различных значений параметра Л, полученные численно.

Р

Рис. 4. Результат численного вычисления х*(а, в) модели I для социальной сети ЩасеЬоок (в= 0.5, Лщ = 13) при функциирас-пределения (23)

Множество достижимости для социальной сети, описываемой (23), согласно определению , является

сечением множества при фиксированном в. Из Рис. 6 для

социальной сети БаееЬоок при Л= 13, в= 0,5 находим Wa.fi ~[0; 0,4) и (0,8; 1]. Этот результат согласуется с Рис. 4.

Рис. 5. УЛр при различных Л (серым цветом)

О 0,2 0,4 0,6 0,8 1 0 0,2 0,4 0,6 0,8 1

0.8 0.6 0.4 0.2 О,

1 -0,8 0,6 0,4 0,2

' 0 0.2 0.4 0,6 0,8 1 0 0.2 0,4 0.6 0.8 1

Рис. 6. Ж^р при различных Л (выделено серым цветом)

Теперь рассмотрим ситуацию информационного противоборства в рамках модели II, т.е. добавим к множеству N конформистов к провокаторов и I иммунизаторов (множества К и Ь соответственно). Тогда вероятность того, что произвольно выбранный агент имеет порог, не превышающий х < 1, складывается из вероятности двух независимых событий:

1. вероятности того, что выбранный агент является провокатором, а именно

к

к +1 + п '

2. вероятности того, что выбранный агент является конформистом и его порог не превышает х < 1:

—^(х) .

к +1 + п У '

Введем следующие обозначения для долей провокаторов и иммунизаторов относительно общего количества всех агентов соответственно:

(24) а = —к—; =

к +1 + п к +1 + п

(очевидно, что а' + / < 1). Величины а' и / 'соответствуют в некотором смысле значениям вероятностей а и / в рамках модели I противоборства двух центров, введенной вначале настоящего раздела. Вероятность а того, что произвольно выбранный агент окажется внешне возбужденным (в рамках модели I) равна вероятности а' того, что произвольно выбранный агент окажется внешним «провокатором» (в рамках модели II). Аналогично для вероятностей /и /'.

Так как вероятность того, что порог произвольно выбранного агента не превышает единицы, равна единице, то мы получили новое множество агентов N и К и Ь, пороги которых являются независимыми и одинаково распределенными величинами со следующей функцией распределения, соответствующей модели II:

ч Га ' + (1 -а' -/')Р(х),0 < х < 1,

(25) ^ (а', 3 ', х ) = \ (1 3 ) (), ,

11, х = 1.

Функции распределения (25) и (16) различны, соответственно модели I и II настоящего раздела не являются эквивалентными.

Утверждение 8. В модели II множество достижимости Жкь = (0, 1]. Если Е(0) = 0, то WкL = [0, 1].

На Рис. 7 приведен график точек равновесия для модели II для социальной сети БаееЬоок (6 = 0,5, Ле = 13) при функции распределения (23).

Рис. 7. Результат численного вычисления положения равновесия для к провокаторов и I иммунизаторов при п = 100

Полученные результаты анализа одновременных «противоположно направленных» воздействий на рассматриваемую сетевую структуру — свойства монотонности равновесия по управлениям (утверждения 3 и 4) и свойства структуры множеств достижимости (утверждения 5-7) являются основой для теоретико-игрового изучения моделей информационного противоборства, что представляет предмет

самостоятельного исследования, выходящего за рамки настоящей работы.

6. Заключение

В настоящей работе предложено макроописание (в терминах работы [4]) порогового поведения толпы в результате оказываемых на нее управленческих воздействий. Существенным плюсом использования подобных стохастических моделей представляется простой вид аналитической зависимости функций распределения порогов агентов (и, следовательно, равновесных состояний толпы) от выбираемых управлений. Эта «простота» дает возможность ставить и решать задачи управления («возбуждения» и «иммунизации» толпы), анализировать информационное противоборство субъектов, осуществляющих управление толпой. В статье рассмотрены два вида управления: воздействие на пороги агентов и управление составом. В простейшем случае полученные модели управления эквивалентны, но в случае противоборства они существенно отличаются.

Перспективными направлениями дальнейших исследований представляются следующие.

Во-первых, идентификация типовых функций распределения порогов (по аналогии с выражением (23), результатами, представленными в примере 5 выше, и др.) и анализ соответствующих типовых управленческих решений.

Во-вторых, развитие моделей коллективного поведения, в которых пороги агентов и пороговое поведение последних являлись бы следствиями каких-либо более общих содержательно интерпретируемых предположений.

И, наконец, в-третьих, сведение задачи информационного противоборства в управлении толпой к теоретико-игровой постановке позволит применять к этому важному классу задач весь богатый аппарат современной теории игр.

7. Приложение

Доказательство утверждения 1. Приведем обоснование функции распределения (8). Пусть дан вектор в = (01, ..., вП) независимых одинаково распределённых (с распределением F(■)) случайных величин. Над этим вектором производится преобразование (также содержащее случайность): каждый порог в с вероятностью а может обнулиться. В результате этого преобразования получаем другой случайный вектор в', который имеет некоторое распределение Fa(•). Найдем это распределение.

Компоненты вектора в' представим в виде 0' = вгде Р(£ = 0) = а, Р(£ = 1) = 1 - а, все элементы множества {£, в} попарно независимы.

Найдём функцию распределения Fа(■) случайной величины в':

Ра(х)ПР(в'1<х) = Р(в1 д < х) = Р(д = 0) + Р(д = Щ < х) . В силу независимости £ и в имеем Р(д = 1,в < х) = Р(д = 1)Р(в <х) = (1 -а)F(х),

и получаем выражение (8).«

Доказательство утверждения 2. В силу условия F(0) = 0 границы единичного отрезка реализуются как РКП при нулевых и единичных значениях параметра а.

Фиксируем произвольную точку Х1 е (0, 1). В силу выпуклости функции F(■) весь ее график лежит не выше биссектрисы и решение (8) 0 < а(х1) < 1 уравнения Fа(xl) = Х1 существует. Отсюда и в силу определения (7) следует

(26) Fа( х ) = а( Х1 ) + (1 -а( х)) F ( х ) = х и, соответственно,

(27) F (х1 ) = х1а± .

1 - а ( х )

Из (26) следует равенство

(28) Fа'(х -0) = (1 -а(х1))F'(х -0) .

Из строгой монотонности производной строго выпуклой функции следует, что

Г' (х - 0)} с1х Г' (х + 0)} с1х

Г(х - 0) =-^ <-

у ' 1 - х 1 - х

<

1

} г' (х + 0) с1х

х_=1 - г (х)

1 - х 1 - х

Далее, пользуясь (26), (27) и (28), получаем Г '(х -0) = (1 -а(х))Г '(х -0)< 1 х1 -а( х1) (1 -«(х)) 1 х1) < 1,

1 - х!

т.е. положение равновесия х\ является устойчивым, так как график функции пересекает биссектрису, приближаясь к ней «слева - сверху».«

Доказательство утверждения 3. Докажем первую часть

утверждения 3. Рассмотрим частную производную Г „ (х) в

да

произвольной точке х е [0, 1):

ГоДх) = А(а(1 -Р) + (1 -а-Р + 2аР) Г(х)) =

(1 -р) + ( 2Р-1) Г ( х ) = (1 -Р)(1 - Г ( х )) + рГ ( х). Заметим, что (1 - Р)(1 - F(x)) > 0 и pF(x) > 0. Получаем

д

— Г „ (х) > 0 . Отсюда следует, что

да а'Ру '

(29) ¥а1р (х) > (х) пРи а2 > а!.

Из того что р(х) > х Ух : х < х* (а,Р) при а2 > а1 и (29) следует Гар(х) > х Ух : х < х* (а,Р) . А значит, х*(а2, Р) > х*(а1, Р) в силу (6). «

Доказательство утверждения 5.

1. Докажем, что к(а, ¡¡) < 1 - д(а, ¡¡) при а е [0, 1], ¡3 е [0, 1]. Подставим 5(а, ¡3) в выражение (19) для к(а, ¡3):

к(а,р) = 1 -а-р + 2ар = 1 -3(а,р)-р(l -а).

¡(1 -а) > 0 к (а, р)< 1 -3(а, ¡)

Замечая, что 4 7 , получаем 4 7 4 7.

2. Докажем, что к (а,¡)> 2^3 (а,р) (1 -^3 (а,P)) при а е [0,1], ¡е[0,1].

п 3(а, 0) = 0

При а = 0 неравенство выполнено, так как 4 7 и к (а, ¡) = 1 -¡> 0

п Д п 3(а, ¡) = 0 к (а, ¡) = 1 -а> 0

При ¡ = 0 аналогично 4 7 и 4 7 .

При а > 0, @ > 0 выразим из первого уравнения системы (19)

P через а и 3(а,¡) и подставим во второе уравнение

системы (19):

( 3(а В)\ (30) к{а,А) = 1 - 3(а,р) - 1--(1 -а) =

а у

= а + S(a,ß) _2S(a,ß) .

а

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Зафиксируем 8 = 8 (a, ß) = const и найдём минимум к (a, 8) по а . Условие экстремума: дк(а, 8) ^ 8

да а2

Уравнение 1 - 3/a2 = 0 имеет единственное положительное решение a = 43 для 3е( 0,1] (что выполнено при a> 0,

ß > 0). В точке a = 43 функция к (a, 3) достигает минимума

по a: min к (a,3) = к (43, з) = 243(1 -3) .

Остаётся показать, что любая точка (8, к), лежащая в указанной области, является образом некоторой точки единичного квадрата. 3. Докажем, что

У8о е [0,1],ко е [0,1]: (1 — ,/8)< ко < 1 -8о За е [0,1],Зр е [0,1]: 80 = 8(а,р),к0 = к(а,р). При 80 = 0 искомыми а и р являются а = 0 и р = 1 — к . При 80 > 0 имеем а> 0, так как 80 =а(1 — Р) . Домножая (30) на а, получаем: а2 — а (280 + к ) + 8 = 0 .Это уравнение при 8 > 0, 2^/8(1 — -\/8) < к имеет два положительных корня

=1 ((280 + к )+^( 280 + к0 )2 1 (( 280 + к0 ) —280 + к0 )2

а2 = 1 ((280 + к0) — -уД 280 + к0 )2 — 480),

причём при к < 1 — 8 выполняется ае[0,1], а2е[0,1]. Полагая

с

р = 1 —0 = 1—а и а

р2 = 1—8 = 1—«1, а

получаем 8=8 (а, р), к = 8 (а, р2) .•

Доказательство утверждения 6. Напомним, что

принадлежность точки множеству достижимости означает

существование пары (а, р) е [0,1] х [0,1], такой что Еа р (х) = х (условие равновесия) и Е'а р( х) < 1 (условие устойчивости равновесия), где Еа р (х) является

преобразованием (16) функции Е (х) . Иными словами, точка

принадлежит множеству достижимости тогда и только тогда, когда

(31) min F'( x )< 1

{ae[0,1],ße[0,1]:Faß(x)=x} "'P V '

и множество {a e[0,l],ß e [0,1]: Fa ß(x) = x} не пусто. Производная x) имеет вид F^ß (x) = k(a,ß)F'(x), следовательно,

min F' „ (x) = min k(a,ß)-F'(x) =

{«e[0,1],ße[0,1]:Fa_ß(x)=x} a,ß W {ae[0,1],ße[0,1]:Fa,ß(x)=x} V ' V '

= kmin (x) F' (x) , где введено обозначение

mmV ' |cte[0,l],/?e[0,l]:i7a ^ (x)=x| V '

Ограничение Fa ^ (x) = x запишем в виде S(a,ß) + k(a,ß)F(x) = x .

Рассмотрим отдельно случай F (x) = 0 . Из гладкости

функции распределения следует, что Faß ( x) = F' ( x) = 0. Кроме того, ограничение удовлетворяется при a = x, ß = 0, так как S(x,0) = x . Это означает, что при F (x) = 0 точка x всегда принадлежит множеству достижимости.

При F (x) > 0 изобразим ограничение на плоскости Sk (см. рис. 7), где оно имеет вид прямой линии, соединяющей

точки

'а x ^

' F ( x ),

и (x,0).

Рис. 7. Иллюстрация метода нахождения множества достижимости.

Из рисунка видно, что при любых значениях х и Е (х) , минимальное значение ктт (х) достигается в точке пересечения этой прямой с кривой абсциссу которой

обозначим через 5тах ( х) . Имеем

Щ(¿тах (х) - х) = ^¿тах (х) (1 (х)) .

Это уравнение при любых значениях х и Е (х) имеет единственный корень, принадлежащий отрезку [0,1]:

^тах ( х) =

1

Е ( х)1Е ( х)

- 2

-1

Е ( х )

-2

Находя значение

ктт ( хЬ^) (х -^тах (х))

2

2

и выражая через него Еа р (х) получаем (19). •

Доказательство утверждения 7. Напомним, что

принадлежность точки множеству достижимости означает существование пары (а, Р) е [0,1] х [0,1], такой что Еа р ( х) = х (условие равновесия) ЕС р (х) < 1 (условие устойчивости равновесия), и

тш( Еар( у)- у)- 0,

где Еа р (х) является преобразованием (16) функции Е (х) .

Выше мы доказали+, что устойчивость положения равновесия при 5 (а р) = ^ (х), к (а, р) = ктш (х) эквивалентна принадлежности точки х множеству достижимого равновесия. Для доказательства утверждения достаточно показать, что именно при 5 (а, Р) = 5тах(х) к (а, Р) = ктт (х) в любой точке отрезка [0, х] достигается} максимум Еср( у) по всем а, Р, приводящим к устойчивому равновесию в точке х .

Пусть для некоторых значениях 5 Ф 5тах (х), к1 Ф ктах (х), реализуемых при некоторых а, Р, выполнено 5 + кхЕ (х) = х и кхЕ' (х) < 1. Покажем, что тогда при у < х выполнено

5тах + кттЕ (у )-5 + кхЕ (у) .

Перепишем неравенство в виде 5тах -51 +(кт1п - к1 ) Е (у )- 0 .

Из условия равновесия 5 + КЕ (х) = 5тах + кттЕ (х) = х выразим (ктт - к ) и подставим в неравенство, получая

( Т7(,\\

(5тах -51 )

Е ( у )'

1 —Щ - 0. , Е(х))

Выполнение неравенства при у < х следует из условия реализуемости 5 < 5тх и монотонности функции распределения.«

Доказательство утверждения 8. Точка 1 достигается в силу определения (25).

Пусть х е (0,1) . Если х1 е |х: Е(х) = 0} , то выполнения равенства Екь (а/, , х1 ) = х1 необходимо и достаточно, чтобы

а1' = х1, р/ — любое, удовлетворяющее неравенству а1' +р/ < 1. Производная слева функции Екь (а1', р1 ', х) (ее существование следует из монотонности функции распределения) в точке х Екъ+' (х ) = 0 . То есть функция Екь (а1', р1', х) пересекает биссектрису «слева сверху». Если |х: Е(х) = 0} = 0 , то точка х1 = 0 недостижима в силу неравенства а' + р' < 1.

Если Е (х1) > 0, то можно подобрать такое малое 8 > 0, что выполнены следующие неравенства (32) х —8> 0,

(33) 1 — х +8

'1 — 1 '

Е (х)

> 0,

8

(34) 1 — 0 и

Е ( х1)

(35) 8Е+'(х )< Е(х ) .

Пусть а/ = х — 8 > 0 в силу (32) и, решив уравнение Екь (а1',р', х1) = х1 относительно р', получим для него:

( 1 4

(36) р=р;=1—х+81—

I Е(х1),

Из свойств (33) и (34) соответственно следует, что р'> 0 и а ' + р'< 1.

Таким образом, мы получили функцию распределения

FKL (а1 ', Р1 ', х), пересекающую биссектрису в точке х, причем

«слева сверху» в силу (35).«

Литература

1. БАТОВ А.В., БРЕЕР В В., НОВИКОВ Д А и др. Микро- и макромодели социальных сетей: идентификация и имитационные эксперименты // Проблемы управления. -2014. - №6. - в печати.

2. БУХАРИН С. Н., ЦЫГАНОВ В В. Методы и технологии информационных войн. - М.: Академический проект, 2007. -384 с.

3. БРЕЕР В.В. Модели конформного поведения (обзор) // Проблемы управления. - 2014. - №1. - С. 2-13; №2. -С.2-17.

4. БРЕЕР В.В., НОВИКОВ Д.А., РОГАТКИН А.Д. Микро- и макромодели социальных сетей: теория // Проблемы управления. - 2014. - №5. - С. 28-33.

5. ГРАЧЕВ Г., МЕЛЬНИК И. Манипулирование личностью: организация, способы и технологии информационно-психологического воздействия. - М.: Институт философии РАН, 1999. - 153 с.

6. ГУБАНОВ ДА., КАЛАШНИКОВ АО., НОВИКОВ ДА. Теоретико-игровые модели информационного противоборства в социальных сетях // Управление большими системами. - 2010. - №31. - С. 192-204.

7. ГУБАНОВ ДА., НОВИКОВ ДА., ЧХАРТИШВИЛИ А.Г. Социальные сети: модели информационного влияния, управления и противоборства. - М.: Физматлит, 2010. -228 с.

8. ЗИМБАРДО Ф., ЛЯЙППЕ М. Социальное влияние. - СПб.: Питер, 2000. - 448 с.

9. МАЙЕРС Д. Социальная психология. - С.-Пб.: Питер, 2002. - 688 с.

10. МУЛЕН Э. Кооперативное принятие решений: аксиомы и модели. - М.: Мир, 1991. - 463 с.

11. НОВИКОВ Д.А. Игры и сети // Математическая теория игр и ее приложения. - 2010. - №2. - С. 107-124.

12. НОВИКОВ Д.А. Модели управления возбуждением сети // Труды XII Всероссийского совещания по проблемам управления. -М.: ИПУ РАН, 2014. - С. 6314-6324.

13. ПОЧЕПЦОВ Г.Г. Информационно-психологическая война. -М.: Синтег, 2000. - 180 с.

14. ЧАЛДИНИ Р. Психология влияния. - СПб.: Питер, 2001. -304 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

15. ШЕИНОВ В. П. Скрытое управление человеком (психология манипулирования). - М.: ООО «Издательство АСТ», 2002. -848 с.

16. ШИРЯЕВ А Н. Вероятность. - М: Наука, 1989. - 640 с.

17. BARABANOV I.N., KORGIN N.A., NOVIKOV D.A. et al. Dynamic Models of Informational Control in Social Networks // Automation and Remote Control. - 2011. - Vol. 71, No. 11. -P. 2417-2426.

18. BREER V.V. A Game-theoretic Model of Non-anonymous Threshold Conformity Behavior // Automation and Remote Control. - 2012. - Vol. 73, No. 7. - P. 1256-1264.

19. BREER V.V., NOVIKOV D.A. Models of Mob Control // Automation and Remote Control. - 2013. - Vol. 74, No. 12. -P. 2143-2154. (перевод статьи В.В. Бреер, Д.А. Новиков, "Модели управления толпой", Проблемы управления, 2012, № 2, 38-44).

20. GERMEIER YU. Non-antagonistic Games. - Dordrecht, Boston: D. Reidel Pub. Co., 1986. - 327 p.

21. GRANOVETTER M. Threshold Models of Collective Behavior // AJS. - 1978. - Vol. 83, No. 6. - P. 1420-1443.

22. KIRMAN A. Ants, Rationality and Recruitment // The Quarterly Journal of Economics. - 1993. - Vol. 108, No. 1. - P. 137-156.

23. NOVIKOV D.A., CHKHARTISHVILI AG. Reflexion and Control: Mathematical Models. - London: CRC Press, 2014. -298 p.

24. NOVIKOV D.A. Cognitive Games: a Linear Impulse Model // Automation and Remote Control. - 2010. - Vol. 71, No. 10. -P. 718-730.

25. NOVIKOV D. Theory of Control in Organizations. - New York: Nova Science Publishers, 2013. - 341 p.

26. SCHELLING T. Micromotives and Macrobehavior. - N.-Y.: WW Norton & Co, 1978. - 272 p.

STOCHASTIC MODELS OF MOB CONTROL

Vladimir Breer, Cand.Sc. ([email protected]).

Dmitry Novikov, Institute of Control Sciences of RAS, Moscow, Corr. Member RAS, deputy director ([email protected]). Andrey Rogatkin, Institute of Control Sciences of RAS, Moscow, post graduate student ([email protected]).

Abstract: Considered a model of threshold behavior when each agent takes binary decision - to act or not to act according to the behavior of other agents. Problem of control is formulated and solved - the stochastically distributed initial state of part of agents is affected in order to change the equilibrium of acting agents.

Keywords: collective behavior, model of threshold decision making, mob control

Статья представлена к публикации членом редакционной коллегии П.Ю. Чеботарёвым

Поступила в редакцию 22.07.2014.

Опубликована 30.11.2014.

i Надоели баннеры? Вы всегда можете отключить рекламу.