Научная статья на тему 'Импульсное управление системами сетевой структуры, описывающими процессы распространения политического влияния'

Импульсное управление системами сетевой структуры, описывающими процессы распространения политического влияния Текст научной статьи по специальности «Математика»

CC BY
91
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕЛАКСАЦИОННЫЕ РАСШИРЕНИЯ УПРАВЛЯЕМЫХ СИСТЕМ / TRAJECTORY RELAXATIONS OF CONTROL SYSTEMS / ИМПУЛЬСНОЕ УПРАВЛЕНИЕ / IMPULSIVE CONTROL / ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / OPTIMAL CONTROL / УПРАВЛЕНИЕ МУЛЬТИАГЕНТНЫМИ СИСТЕМАМИ / CONTROL OF MULTI-AGENT SYSTEMS

Аннотация научной статьи по математике, автор научной работы — Старицын Максим Владимирович, Малтугуева Надежда Станиславовна, Погодаев Николай Ильич, Сорокин Степан Павлович

Исследуется специальный класс вырожденных задач оптимального управления и соответствующих задач импульсного управления, допускающих содержательную трактовку в терминах описания процессов распространения информационного воздействия (политического влияния) в социальной сети, заданной взвешенным направленным графом. Дается постановка «прототипной» экстремальной задачи с неограниченным управляющим сигналом; обсуждается её импульсно-траекторное расширение в подходящей слабой топологии пространства функций ограниченной вариации, непрерывных справа. Для эквивалентной классической задачи управления, полученной в результате специальной разрывной параметризации расширенной системы, проводится детализация условий принципа максимума Понтрягина. Приводятся результаты численного исследования одной частной модели, иллюстрирующие импульсный характер управляющих воздействий; дается содержательная интерпретация полученных результатов. В заключительной части статьи для случая полного равновзвешенного графа исследуется вопрос о структуре модели при возрастании мощности сети: показано, что предельная (при стремлении числа агентов в сети к бесконечности) система описывается нелокальным уравнением неразрывности с «неограниченным» полем скоростей. Последнее может быть преобразовано с помощью разрывной замены времени к эквивалентному уравнению, управляемому «регулярным» векторным полем, представляющим собой (как и в конечномерном случае) корректное импульсно-траекторное расширение исходного уравнения неразрывности. Полученная таким образом задача управления распределенной системой является релаксацией исходной экстремальной задачи в случае«большого числа агентов».

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Старицын Максим Владимирович, Малтугуева Надежда Станиславовна, Погодаев Николай Ильич, Сорокин Степан Павлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Impulsive Control of Systems with Network Structure Describing Spread of Political Influence

We study a particular class of singular optimal control problems and corresponding impulsive control problems, which can be interpreted in terms of spread of a certain information impact (political influence) in a certain “social network” represented by a weighted directed graph. First, we give a statement of the “prototypic” extremal problem with unbounded input signals. Next, we discuss an impulsive trajectory extension of the prototypic model in an appropriate coarse topology of the space of right continuous functions with bounded variation. For an equivalent classical problem (obtained by a discontinuous time reparameterization of the extended system) we present a detalization of the Maximum Principle. As an illustration, we exhibit some results of numeric implementation of a toy model case and perform their practical interpretation. Finally, for the case of complete graph with equal weights we study the limit structureof the model as the power of the network tends to infinity: we show that the limit system is described by a nonlocal continuity equation with “unbounded” velocity field. This equation can be transformed by a discontinuous reparameterization to an equivalent equation with a regular vector field, which gives (as well as in the finite-dimensional case) a correct impulsive trajectory extension of the original continuity equation. The derived optimal control problem for the distributed system is, thus, a relaxation of the original extremal problem for “large” networks.

Текст научной работы на тему «Импульсное управление системами сетевой структуры, описывающими процессы распространения политического влияния»

Онлайн-доступ к журналу: http: / / mathizv.isu.ru

Серия «Математика»

2018. Т. 25. С. 126-143

УДК 517.977.5 МЭС 93С10, 93С23

Б01 https://doi.org/10.26516/1997-7670.2018.25.126

Импульсное управление системами сетевой структуры, описывающими процессы распространения политического влияния*

М. В. Старицын

Институт динамики систем и теории управления им. В. М. Матросова СО РАН, Иркутск, Российская Федерация

Н. С. Малтугуева

Институт динамики систем и теории управления им. В. М. Матросова СО РАН, Иркутск, Российская Федерация

Н. И. Погодаев

Институт динамики систем и теории управления им. В. М. Матросова СО РАН, Иркутск, Российская Федерация

С. П. Сорокин

Институт динамики систем и теории управления им. В. М. Матросова СО РАН, Иркутск, Российская Федерация

Аннотация. Исследуется специальный класс вырожденных задач оптимального управления и соответствующих задач импульсного управления, допускающих содержательную трактовку в терминах описания процессов распространения информационного воздействия (политического влияния) в социальной сети, заданной взвешенным направленным графом. Дается постановка «прототипной» экстремальной задачи с неограниченным управляющим сигналом; обсуждается её импульсно-траектор-ное расширение в подходящей слабой топологии пространства функций ограниченной вариации, непрерывных справа. Для эквивалентной классической задачи управления, полученной в результате специальной разрывной параметризации расширенной системы, проводится детализация условий принципа максимума Понт-рягина. Приводятся результаты численного исследования одной частной модели, иллюстрирующие импульсный характер управляющих воздействий; дается содержательная интерпретация полученных результатов. В заключительной части статьи для случая полного равновзвешенного графа исследуется вопрос о структуре модели

* Работа выполнена при финансовой поддержке РФФИ, гранты № 18-31-00425, № 16-31-60030, № 17-01-00733

при возрастании мощности сети: показано, что предельная (при стремлении числа агентов в сети к бесконечности) система описывается нелокальным уравнением неразрывности с «неограниченным» полем скоростей. Последнее может быть преобразовано с помощью разрывной замены времени к эквивалентному уравнению, управляемому «регулярным» векторным полем, представляющим собой (как и в конечномерном случае) корректное импульсно-траекторное расширение исходного уравнения неразрывности. Полученная таким образом задача управления распределенной системой является релаксацией исходной экстремальной задачи в случае «большого числа агентов».

Ключевые слова: релаксационные расширения управляемых систем, импульсное управление, оптимальное управление, управление мультиагентными системами.

1. Введение

Настоящая заметка посвящена одному специальному классу вырожденных задач оптимального управления обыкновенными динамическими системами «сетевой структуры», приводящему — после подходящим образом устроенной релаксации множества решений — к некоторой частной задаче импульсного управления с траекториями ограниченной вариации. Теория вырожденных задач динамической оптимизации и проблематика импульсного управления составляют один из обширных и хорошо изученных разделов современной математической теории управления (общие понятия и ключевые результаты этой теории изложены, например, в [1-4;6;7]), и остаются востребованными на практике при описании ряда процессов в физике, робототехнике и математической экономике.

Излагаемая ниже модель носит как раз прикладной характер. Мы будем трактовать её как задачу управления общественным мнением в ходе некоторой условной «предвыборной кампании», хотя она допускает ряд других содержательных интерпретаций, например в терминах проблемы вакцинации или борьбы с компьютерными вирусами.

Рассмотрим процесс распространения «влияния», выраженного некоторым показателем «лояльности», в рамках заданной сети, состоящей из N «агентов» (объектов воздействия). Мы предполагаем, что г-му агенту в каждый момент времени £ приписывается некоторая величина Хг{Ь) € К, характеризующая его текущую лояльность по отношению к референтному фактору (идее, человеку, политической партии и т.д.). Тогда, следуя [12], динамика состояния х^), г = 1, АГ, на интересующем нас временном интервале Т = [О, Т] (период предвыборной кампании, Т — момент выборов) описывается управляемым обыкновенным дифференциальным уравнением вида

\х% = /¿(Ж1, . . . ,Ждг) +Т^=19г]{Х1,...,Хм) + Щ Ы(Х1, . . . X М),

Здесь измеримые функции щ : Т ^ К играют роль управлений; в нашей интерпретации величина характеризует «интенсивность»

информационного или политического воздействия на г-го агента в момент времени £ (воздействие, направленное на повышение лояльности трактуется как неотрицательное, и наоборот); /¿,д^, 1ц, г,.] = 1,АГ, — заданные функции, принимающие действительные значения и достаточно регулярные, чтобы решения Каратеодори уравнений (1.1) при любых измеримых ограниченных управлениях были определены единственным образом на отрезке Т (например, можно потребовать выполнения стандартных условий локальной липшицевости и подлинейного роста). Функция описывает изменение мнения г-го агента в условиях изоляции, т. е. в отсутствии внешних информационных воздействий и коммуникации с другими агентами; функция д^ характеризует влияние -го агента на г-го; наконец, /г» отражает степень подверженности агента внешнему влиянию. Значения х® суть показатели лояльности всех агентов к началу периода планирования.

В дальнейшем, мы также будем рассматривать упрощенную модель, в которой

/¿(жь ... ,хм) = а,г}{хг), дц{х\,. . . , Хм) = Ъíjg(Xí - ж,-),

Ы(Х1 ,...,Хм)=ф{Хг), (1.2)

при этом мы предполагаем, что

д(-г) = -д(г), геК, Ъг] = Ъ]г, (1.3)

Таким образом, здесь «индивидуальность» г-го агента уже характеризуется не функциями, а лишь набором чисел ец, Ь^, ] = 1, N, а. Именно исследованию этой модели посвящена основная часть данной статьи.

2. Постановка экстремальной задачи

Рассмотрим теперь следующую задачу оптимального управления:

(Р) Е1^г£ЫТ))

на множестве решений системы уравнений (1.1), отвечающих входным сигналам и = (и\,..., и^) € ¿^(Т, со свойством

(2.1)

(множество таких управлений обозначим Ым)- Здесь £ : К и К — заданная функция; коэффициенты йг определяют удельный вес г-го агента в процессе принятия решения; || • Ц1 означает норму в вида

[ \\и\\кИ<М

||a;||i = J2i= 1 \xi\i М > 0 — заданная величина, представляющая суммарный "ресурс" управления (в нашей интерпретации — общий бюджет предвыборной кампании).

Ограничения типа (2.1) называются «ресурсными» или «энергетическими»; важно заметить, что наложенное условие не влечёт равномерной (существенной) ограниченности допускаемых управляющих воздействий, т. е. последние могут быть сколь угодно близки в Ь\ к распределениям типа ¿-функции Дирака.

Пусть, например, функция £ имеет вид £(r) = sign г (мы полагаем sign 0 = 0 по определению) и сЦ = 1/N для всех г = 1, N. Тогда значение целевого функционала на заданном процессе можно интерпретировать как результат подсчета голосов на выборах: мы предполагаем, что г-й агент, чей показатель лояльности Xi(T) положителен, голосует «за», если Xi(T) < 0 — агент голосует «против», в случае же Xi(T) = О, агент формально считается воздержавшимся от голосования. Другими словами, задача состоит в том, чтобы распределить имеющийся бюджет предвыборной кампании во времени и в рамках сети так, чтобы максимизировать число агентов, чья лояльность к заданному моменту Т окажется положительной (заметим, что при этом само значение показателя лояльности не важно).

Хотя в предложенной выше содержательной интерпретации поставленная задача выглядит довольно естественно, её математическая формулировка является вырожденной в смысле [1]. Это связано с аффинной по управлению структурой управляемой системы и отсутствием поточечных ограничений на управляющие воздействия. Действительно, как легко видеть, фазовые траектории могут оказаться сколь угодно близкими в поточечном смысле к разрывным функциям (не допускаемым уравнениями (1.1)); как следствие, множества достижимости системы (1.1), (2.1) не являются компактными в RN, а значит, максимум в задаче (Р), вообще говоря, не достижим, т.е. задача не имеет решения в классе допустимых процессов — пар (х, и), где и — управление класса Ым, а х — соответствующее абсолютно-непрерывное решение системы уравнений (1.1). Стандартный подход здесь состоит в расширении множества допустимых процессов, точнее, в переходе к "обобщенным управлениям", дающим замыкание трубки траекторий системы (1.1), (2.1) в некоторой слабой топологии. В нашем случае, роль обобщенных управлений будут играть борелевские меры на Т\ "обычные" управления и естественным образом вкладываются в множество обобщенных воздействий как абсолютно непрерывные (относительно меры Лебега Л) меры с соответствующей плотностью: и А; обобщенные управления могут иметь импульсный характер, т.е. могут оказаться мерами дира-ковского типа. Соответствующие траектории окажутся при этом функ-

циями класса ВУ+ = К^) — непрерывными справа на [0,Т) и

имеющими ограниченную вариацию на отрезке Т.

Отметим, что подобное расширение, т. е. признание допустимыми импульсных («шоковых» — имеющих высокую интенсивность наряду с пренебрежимо малой протяженностью во времени) воздействий, является оправданным и с практической точки зрения: читатель наверняка сможет вспомнить случаи, когда кратковременные события (вроде спортивной победы национальной сборной или террористического акта) существенно и почти мгновенно изменяли отношение общества к власти, или политическую конъюнктуру.

Перейдем к описанию расширения системы (1.1), (2.1). В качестве подходящей слабой топологии будем использовать топологию сходимости в точках непрерывности предельной функции и в концевых точках отрезка Т в пространстве ВУ+. Опираясь на результаты теории импульсного управления [4], можно показать, что итогом перехода к замыканию трубки решений (1.1), (2.1) в такой топологии является следующее простейшее интегральное уравнение с мерами:

Здесь мы обозначаем х° = ^ = где Рг = ¡г + ^ д^,

С = (^4?)^= ТТлГ' где Си = Ьг, Оу = 0, г ф Кроме того, х(£") есть левый односторонний предел функции х в точке £ (договоримся считать решения (3.1) непрерывными справа), ц, суть -мерная борелевская мера на Т, обозначает ее полную вариацию. Рассмотрим следующую задачу:

(Р) ~~^ шах на множестве решений х системы (3.1).

Задача (Р) есть задача оптимального импульсного управления [2-5]. Она является релаксацией (Р) в том смысле, что любая максимизирующая последовательность в одной задаче является таковой и в другой (задачи, «поставленные на максимизирующих последовательностях», совпадают), при этом задача (Р), в отличие от (Р), имеет решение.

С помощью известного метода разрывной замены времени [4] задача (Р) сводится к эквивалентной (в смысле, что любой допустимый процесс одной из задач соответствует допустимому процессу другой с тем

3. Импульсно-траекторное расширение. Анализ расширенной модели

(3.1)

же значением целевого функционала; как следствие, между множествами решений также имеется соответствие, и значения задач совпадают) классической задаче оптимального управления на нефиксированном отрезке времени 5 = [0, 5"] С [О, Т + М\:

(ЯР) £"1 <**%(£)) ^тах,

у> = аР(у) + С(у)(3, 2/(0)= ж0, ? = а, С(0)=0,

£(£) = т,

а> 0, а + Ц/ЗЦ1 < 1.

(3.2)

(3.3)

(3.4)

(3.5)

Здесь штрих означает дифференцирование по новой переменной времени Роль управлений теперь играют измеримые функции (а,/3) = (а, /?)(«) : 5 н-> а траекториями являются абсолютно-непрерыв-

ные функции (у, О = (у, ^

Связь задач (Р), (ЯР) и (Р) подробно излагается, например, в [4] и составляет существо широко применяемого в импульсном управлении подхода, называемого методом разрывной замены времени. На самом деле, любое управление и € Ым порождает пару (а,(3), удовлетворяющую условиям:

ГТ+М

а(в) йв = Т, а (в) > 0, а(в) +

(«)||1 = 1 почти всюду на 5.

Теперь расширим множество допустимых пар (а, /3) до класса

Л= {

а(з)> 0, а(в) + №)||1 < 1,

^ I. (3.6)

[ а(в) бя = Т Jo

Оказывается, что «дополнительные» управления (а, /3) из множества Л характеризуют некоторым образом все последовательности управлений {у,к} С Ым- Это и дает в итоге искомое расширение модели (Р).

Таким образом, анализ нашей расширенной модели сводится к исследованию классической задачи оптимального управления (ЯР) специального вида с терминальным ограничением типа равенства (3.4).

Для упрощения дальнейшего изложения сделаем две модификации преобразованной задачи. Во-первых, предположим, что выполнены условия (1.2) и (1.3), причем входящие в них функции /, д, Н, а также целевая функция непрерывно дифференцируемы. Во-вторых, будем считать, что ресурс импульсного управления в задаче (Р) всегда расходуется полностью, т.е. ограничимся импульсными управлениями со

свойством Н(Т) = М. В этом случае преобразованная система (3.2)-(3.5) перепишется в виде:

У'г = (! - \\v\h) («г/Ы + Т.] Ь^д(Уг - %•)) + (кУМуг), (3.7)

£' = (i-IMIi),

Уг(0)=х°г, £(0)=0, £(Т + М)=Т,

IKs)Hi<l, S € [0,T + M], i = l,N,

(3.8)

(3.9) (3.10)

с новым управлением V € £оо([0,Т + М],

Полученную задачу обозначим (ЯР) и выпишем для нее базовые конструкции принципа максимума. Функция Понтрягина имеет вид:

H(y,ip,r],v) = (1 - |M|i)í ^ец^г/Ы + Yjbv^9(yi ~Уз) + П

i i,3

+ ^2ciipiVih(yi),

где (1р,г)) — вектор переменных, двойственных к (у,£) (заметим, что Н не зависит от £). Поскольку, в силу условия (1.3),

Y Ъа^9(Уг ~ Уз) bijípig(yi - yj) + Y^ hj-:, \¡!ll'!lj ~ Уг

1,3

1,3

1,3

ñ^bijíipi -4>j)g(yi -Уз),

1,3

мы можем переписать понтрягиан в более удобном виде: Н(у,1р,г],у) = (1 - |М|1)( ^ецг/'г/Ы + г]) +

+ (1 - N11)2

1,3

Заметим, что при всех г и ] имеет место равенство

N = Ь1з(Ф1 ~ ^¿МУг ~ Уз) = Ь31(Фз ~ ^1)9^3 ~ Уг) = Рц,

поэтому слагаемое [Зу встречается в Н ровно два раза. Следовательно, сумма всех слагаемых, содержащих у г, есть

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(1-IMIi)

агфг1'(Уг) + Ь^(фг - 4>j)g(yi ~

+ Ci1piVih(yi

Это замечание позволяет вычислить частные производные Н по ус

tfyi = (i-|M|i)

aiipifyivi) + bi:j{i>i - ipj)gy(yi - Уз)

+ CiipiVihy(yi).

Гамильтонова система принципа максимума, очевидно, имеет вид

'Ж = (! - IMIi) (Hf(Vi) + J2biig(yi ~ + wMVi),

ф'г = (IMIi - 1) a%i>ify(v%) + Y^ - Ф^9у(Уг - Vj) - CilpiVihyiyi

с начально-краевыми условиями

Уг(0)=х°г] фг(Т + М) = с1г£уЫТ + М)).

При ЭТОМ Т] = const.

Гамильтониан задачи также может быть вычислен явно. Полагая

КУ, Ф) = + ~ ^з) 9(Уг ~ Vj),

i i,j

&(у, Ф) = (ciipih(yi),..., cNipNh(yN)),

находим H(y, ip, rj) = max H(y,ip,r],v) = max {f(y, ф) + rj, \\g(y, VOIU }, ||d||I<1

где || • ||oo — норма, сопряженная к || • ||i (т.е. чебышевская норма вида

IMIco = max \ipi\). {г=1 ,N}

Дальнейшее аналитическое решение задачи (RP) оказывается затруднительным, а характер решения существенно зависит от значений большого набора параметров. С другой стороны, ввиду специальной структуры задачи, можно предложить некоторые подходы итеративного, численного решения.

В качестве иллюстрации приведем некоторые результаты численного исследования задачи (RP) в предположении, что ец = Cj = di = 1 для всех г = 1, N, и

f(r) = - Се"Л2, д(г) = - 1Г

^ h(r) = 1, £(r) = — arctan (г/е).

1 7Г

Здесь > 0, 5 > 1 и е > 0 - заданные параметры. В качестве

матрицы (Ьу) возьмем матрицу весов ребер графа [10], вершины которого соответствуют главным героям романа В. Гюго «Отверженные» (рис. 1). Если два героя появлялись совместно в тексте романа ровно к раз, то соответствующие вершины графа соединяются ребром веса к/К, где К — общее число всех совместных появлений. Мы предположим, что

частота встреч героев эквивалентна интенсивности их влияния друг на друга.

Перечислим ряд особенностей этой задачи. Прежде всего, заметим, что £ есть гладкая аппроксимация функции sign. Таким образом, наша цель — добиться положительной лояльности у максимального числа агентов к окончанию периода планирования.

Предположим сначала, что / = 0 и v = 0, т. е. динамика системы (3.7) определяется лишь взаимным влиянием агентов. В этом случае, складывая уравнения системы и учитывая, что bij = bji, мы приходим к выводу, что «общая лояльность» в системе (3.7), (3.9) остается постоянной во времени:

Vi(s) Н-----b Vn(s) = const, seS. (3-11)

Кроме того, в этом случае функция V(y) = J2iLi Vi монотонно убывает вдоль всех решений системы (3.7), (3.9). Действительно, пользуясь тем же приемом, что при выводе гамильтоновой системы выше, находим:

d

fov(y(s)) =2 Yyi Y bii ~yj) = YI bii (yi ~ уJ) ~ vfi-

i j i,j

С учетом вида функции д, заключаем, что ¿V(y(s)) < 0, причем для полного графа сети, как нетрудно убедиться, равенство ¿V(y(s)) = О возможно только в случае, когда yi = yj для всех i,j. Ввиду равенства (3.11), заключаем, что решение системы (3.7), (3.9) асимптотически приближается к стационарному состоянию у = (L/N,..., L/N), где

т V^w О

L = ху — суммарная лояльность к началу периода планирования.

Приведенные выше факты позволяют сделать ряд выводов о характере решения задачи (RP) (и, стало быть, задачи (Р)) при нулевом дрифте / = 0 и достаточно большом горизонте планирования (большом финальном моменте времени Т). Во-первых, если L > 0, то для победы на выборах вкладывать ресурсы в систему не нужно. Действительно, к моменту времени Т система (3.1) окажется в окрестности точки у > О, а значит все агенты проголосуют нужным образом. Если же L < О, то при М > —L нам снова гарантирована победа. Здесь возможны следующие стратегии: 1) дождаться финального момента времени и затем «заплатить всем почти поровну», либо 2) «заплатить» (не важно кому) в начальный момент времени, подняв общий уровень лояльности до величины М + L > 0; тогда, располагая достаточным запасом времени, останется лишь дождаться финального момента, когда состояние системы придет достаточно близко к положению равновесия.

В общем случае, поскольку дрифт / всегда предполагается неположительным («усталость от власти»), суммарная лояльность при нулевом управлении будет убывать, и единственный способ ее повысить состоит во внешнем воздействии.

1 = Fantine

2 = Eponine

Рис. 1. Граф связей главных героев «Отверженных». Толщина ребра пропорциональна количеству совместных появлений в тексте романа.

Таблица 1 Результаты вычислений.

с = 0, M = 4 с = 0.5, M = 7

У( 0) y{S) У( о) y{S)

-0.23353 -0.32673 0.23353 0.21859

-0.65468 -0.33968 0.65468 0.22541

-0.19030 0.12105 0.19030 0.21220

-0.47681 -0.22218 0.47681 0.21296

-0.01649 0.11355 0.01649 0.20999

-0.88802 0.10492 0.88802 0.21169

-0.21910 0.12095 0.21910 -0.33588

-0.08994 -0.31629 0.08994 0.21670

-0.81931 0.09275 0.81931 0.20975

-0.08791 -0.28601 0.08791 0.21006

-0.30765 0.12261 0.30765 -0.42076

-0.72669 0.10462 0.72669 0.21054

Задача оптимального управления была дпскретпзована, затем полученная конечномерная оптимизационная задача решалась с помощью пакета COIN-OR IPOPT. Ниже приведены результаты вычислений при нулевом и ненулевом дрифте. В обоих случаях предполагаем, что со = 4, 7 = 10, 5 = 2, е = 0.01, Т = 10. Начальные и конечные состояния траекторий приведены в таблице 1.

При расчетах для нулевого дрифта (( = 0) исходные данные были выбраны так, чтобы все агенты в начальный момент времени имели от-

О 2 4 6 8 10 12 14 О 2 4 6 8 10 12 14

Рис. 2. Случай нулевого дрифта. Слева — график нормы управления 11'у(5)1|1 = И^)!) справа — "суммарной лояльности" Данное

решение отвечает стратегии управления в задаче (Р) с одним терминальным импульсом (промежуток, соответствующий ||г>||1 = 1).

Рис. 3. Случай ненулевого дрифта. Слева — график нормы управления 1'у(5)1|1 = (з)справа — "суммарной лояльности" г/;(в). В терминах

задачи (Р) данное решение отвечает стратегии с двумя импульсами.

рицательную лояльность и было выполнено неравенство М < —Ь. Найденная управляющая стратегия заключается в том, чтобы дождаться конечного момента времени Т, а затем «заплатить» семерым наиболее лояльным к этому моменту агентам (рис. 2).

Для случая ненулевого дрифта £ = 0.5, все начальные значения лояльности агентов предполагались положительными. Таким образом, цель состояла в том, чтобы наибольшее число агентов сохранило положительную лояльность в конечный момент времени. Полученная стратегия имеет два импульса (в задаче (ЯР) они соответствуют отрезкам времени, где = 1, см. рис. 3), сосредоточенные в конечном и некотором промежуточном моментах времени. Отметим, что ресурс был потрачен на увеличение лояльности всех агентов, за исключением 7-го и 11-го; именно эти вершины графа имеют наименьшее число связей. Таким образом, расчеты подтверждают естественное предположение о том, что для поддержания лояльности группы при ограниченных ресурсах нужно экономить на её «наименее влиятельных» представителях.

4. Структура модели при возрастании числа агентов

Одним из ключевых вопросов, связанных с моделированием муль-тиагентных систем и теорией управления такими системами, является описание структуры модели в случае «большого» числа агентов N. Другой смежной проблемой является поиск зависимости решения соответствующей экстремальной задачи от N, точнее, поведение решения при масштабировании сети, т. е. при N —>■ оо. В практическом аспекте, эта проблема приобрела особую актуальность в последние годы в связи с ростом мощности реальных информационных сетей и появлением проблемы «больших данных».

Ясно, что если агентов в сети достаточно много, отслеживание индивидуальной траектории каждого из них становится затруднительным (вычислительно трудоемким); в таких случаях удобнее рассматривать всю сеть как единый объект — ансамбль, роль состояния которого может играть вероятностное распределение или мера, показывающая, какой процент от общего числа агентов занимает то или иное подмножество фазового пространства. Можно предположить, что в результате указанного предельного перехода мы получим задачу управления некоторой распределенной системой, описывающей эволюцию такого объекта (меры) во времени. Подобные модели относятся к области теории управления в среднем поле (англ. "mean field control") — одному из популярных и быстро развивающихся направлений современной математики [9; 11; 13].

Рассмотрим случай, когда все агенты равнозначны и связаны между собой. Мы предполагаем, что ец = Cj = di = 1 /N, для всех г, и сеть, образованная агентами, является полным графом с весами рёбер bij = 1 /N2, для всех i,j. Кроме того, будем считать, что управление теперь является коллективным и никак не учитывает "индивидуальность" агентов. Иными словами, допустимы только такие управляющие воздействия, для которых щ = U2 = • • • = un = и. В этом случае задача (Р) приобретает вид:

jrZlA* COWinf,

Xi = f(xi) + jj Y^jLi 9(xi - Xj) + h(xi) u, Xi{0) = i = 1, N, (4.1)

u € Loo(T; IR), [ |u| dt<M. (4.2)

Jo

Заметим, что любое решение t н-> (x\(t),..., жлК^)) системы (4.1) определяет естественным образом кривую t н-> /j,n (t) в пространстве V = 'Р(К) вероятностных мер на R по правилу /J.N(t) = $xi(t)-

Легко показать, что если J^Li ~~^ $ слабо вРк некоторой абсолютно непрерывной вероятностной мере $ € V, то кривые t > ¡iN (t)

сходятся равномерно к абсолютно непрерывной кривой t > n(t). Последняя является решением (в слабом смысле) задачи Коши для нелокального уравнения неразрывности:

dtiH + V-(l4(f + g*lH + hxi(t))}=0, № = (4.3)

где д * /j,t — свёртка функции д и меры , определенная формулой

д* Ht(x) = / g(x-y)dfit(y). J R

Таким образом, в предельном случае при N —> оо мы приходим к следующей задаче оптимального управления:

(Р) / £(х) йцт{х) —> sup при ограничениях (4.3), (4.2).

J R

Легко видеть, что, как и в случае сосредоточенных систем, поставленная задача оказывается вырожденной ввиду незамкнутости множества решений в топологии равномерной сходимости пространства абсолютно непрерывных мерозначных кривых. Этот факт ставит перед нами проблему импульсно-траекторного расширения распределенной системы (4.3), (2.1), которая может быть решена в рамках подхода [14].

Опираясь на [5], можно заметить, что (4.3) эквивалентно следующему уравнению неразрывности с ограниченным полем скоростей:

d8vs + v-(v8((f+g*v8)a(s)+hp(s))^= 0, s € S, (4.4)

ММ) = (тхгтлГ' тттк) ' (4-5) V + Ш 1 + Н*)|у t=?w

где функция £: S н-> Т определяется условием £(s) = fj а(т) dr. Более точно, (/х, и) удовлетворяет (4.3) тогда и только тогда, когда (г/, а, (3) удовлетворяет системе (4.4), (4.5); при этом ¡it = v^-i(¿). Как и в конечномерном случае, нам остается расширить класс функций (а, (3) до (3.6), считая N = 1. Это приводит нас к следующем результату.

Теорема. Рассмотрим последовательности (ufc)fc€N управляющих воздействий, удовлетворяющих (3.2), и отвечающих им слабых решений (/ifc)fc€N уравнения (4-3). Пусть (ь,к, ак, (3k)k&] — соответствующая последовательность процессов системы (4-4)> (4-5) ■ Предположим, что меры икА сходятся слабо. Тогда

— последовательность (ь,к,ак,/Зк) сходится к некоторому (v,a,f3) в пространстве C(«S;P(IR)) х Л, где множество Л управляющих сигналов оснащено топологией a(L°°, L1) в смысле [8];

— (u,a,f3) удовлетворяет (4-4)> (4-5), и

— ßt —> слабо в точках непрерывности функции и в точке

t = Т, где ^ означает функцию, псевдо-обратную к т.е.

imi{seS : as)>t}, t<=[0,T), ? U \S, t = T.

Последнее утверждение представляет собой техническое обобщение результатов [14] и его доказательство опирается на те же аргументы, что и обоснование Теоремы 1 из [14]. Наконец, рассмотрим задачу

(RP) / £(х) dvs(x) —>• min, J R

dava + V-(va((f + g*va)a(s) + hß(s))^= 0, sGS, щ = tf,

(a,ß) € Л.

Простым следствием Теоремы 1 является тот факт, что (RP) представляет собой релаксацию задачи (Р), т.е. inf(P) = min(RP). Таким образом, (RP) дает искомую "корректную" постановку экстремальной задачи (Р) при N —> оо для случая полного равновзвешенного графа.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5. Заключение

Модели мультиагентных систем и систем сетевой структуры составляют один из наиболее востребованных в теоретическом и прикладном аспекте объектов изучения современной математической теории управления. В статье сделана попытка обобщения одного из простых классов таких систем на случай разрывных решений и применения к полученной модели аппарата теории импульсного управления.

Сложность математических постановок соответствующих задач управления требует широкого применения вычислительных методов и обширных численных экспериментов, реализацию которых мы относим к одной из приоритетных задач наших будущих исследований.

С теоретической точки зрения особый интерес представляет предельная модель — управляемое (нелокальное) уравнение неразрывности. Здесь к наиболее важным вопросам можно отнести получение необходимых условий оптимальности типа принципа максимума (хотя бы для изложенного, простейшего случая полного графа с равными весами рёбер). Наконец, вопрос о структуре предельной системы для произвольной сети также остается для нас открытым.

Представленные расчеты проводились на вычислительном кластере «Академик В. М. Матросов». Авторы благодарят Иркутский суперком-

пьютерный центр СО РАН (http://hpc.icc.ru) за предоставленные вычислительные ресурсы, а также К. В. Коневского за ценные замечания и внимание к работе.

Список литературы

1. Гурман В. И. Вырожденные задачи оптимального управления. М. : Наука, 1977. 304 с.

2. Дыхта В. А., Самсонюк О. Н. Оптимальное импульсное управление с приложениями. 2-е изд. М. : Физматлит, 2003. 256 с.

3. Завалищин С. Т., Сесекин А. Н. Импульсные процессы: модели и приложения. М. : Наука, 1991. 256 с.

4. Миллер Б. М., Рубинович Е. Я. Оптимизация динамических систем симпульс-ными управлениями. М. : Наука, 2005. 429 с.

5. Ambrosio Г., Savare G. Gradient flows of probability measures // Handbook of Differential Equations: Evolutionary Equations. Vol. III. Amsterdam : Elsevier/North-Holland, 2007. P. 1-136.

6. Arutyunov A. V., Karamzin D. Yu., Pereira F. Г. On constrained impulsive control problems // J. Math. Sci. 2010. Vol. 165. P. 654-688. https://doi.org/10.1007/sl0958-010-9834-z

7. Bressan A., Rampazzo F. Impulsive control systems without commutativity assumptions // Optim. Theory Appl. 1994. Vol. 81, N 3. P. 435-457. https://doi.org/10.1007/BF02193094

8. Clarke F. Functional Analysis, Calculus of Variations and Optimal Control, bondon : Springer-Verlag, 2013. 591 p.

9. Fornasier M., Solombrino F. Mean field optimal control // ESAIM Control Optim. Calc. Var. 2014 http://dx.doi.org/10.1051/cocv/2014009.

10. Knuth D.E. The Stanford GraphBase: A Platform for Combinatorial Computing. Boston : Addison-Wesley Professional, 1993. 592 p.

11. Marigonda A., Quincampoix M. Mayer control problem with probabilistic uncertainty on initial positions // J. Differential Equ. 2018. Vol. 264, N 5. P. 3212-3252. https://doi.Org/10.1016/j.jde.2017.ll.014

12. Newman M. Networks: An Introduction. Oxford : Oxford University Press, 2010. 720 p.

13. Pogodaev N. Optimal control of continuity equations // NoDEA Nonlinear Differential Equations Appl. 2016. Vol. 23, N 2. P. 21-24. https://doi.org/10.1007/s00030-016-0357-2

14. Staritsyn M. V. On "discontinuous" continuity equation and impulsive ensemble control // Syst. Control bett. 2018. Vol. 118. P. 77-83. https://doi.Org/10.1016/j.sysconle.2018.06.001

Максим Владимирович Старицын, кандидат физико-математических наук, научный сотрудник, Институт динамики систем и теории управления им. В. М. Матросова СО РАН, Российская Федерация, 664033, г. Иркутск, ул. Лермонтова, 134, тел.: (3952) 45-30-95 (e-mail: [email protected])

Надежда Станиславовна Малтугуева, программист, Институт динамики систем и теории управления им. В. М. Матросова СО РАН,

Российская Федерация, 664033, г. Иркутск, ул. Лермонтова, 134, тел.: (3952) 45-30-37 (e-mail: [email protected])

Николай Ильич Погодаев, кандидат физико-математических наук, старший научный сотрудник, Институт динамики систем и теории управления им. В. М. Матросова СО РАН, Российская Федерация, 664033, г. Иркутск, ул. Лермонтова, 134, тел.: (3952) 45-30-52 (e-mail: [email protected])

Степан Павлович Сорокин, кандидат физико-математических наук, научный сотрудник, Институт динамики систем и теории управления им. В. М. Матросова СО РАН, Российская Федерация, 664033, г. Иркутск, ул. Лермонтова, 134, тел.: (3952) 45-30-52 (e-mail: sorsp@mail. ru)

Поступила в редакцию 10.08.18

Impulsive Control of Systems with Network Structure Describing Spread of Political Influence

M. V. Staritsyn

Matrosov Institute for System Dynamics and Control Theory SB RAS, Irkutsk, Russian Federation

N. S. Maltugueva

Matrosov Institute for System Dynamics and Control Theory SB RAS, Irkutsk, Russian Federation

N. I. Pogodaev

Matrosov Institute for System Dynamics and Control Theory SB RAS, Irkutsk, Russian Federation

S. P. Sorokin

Matrosov Institute for System Dynamics and Control Theory SB RAS, Irkutsk, Russian Federation

Abstract. We study a particular class of singular optimal control problems and corresponding impulsive control problems, which can be interpreted in terms of spread of a certain information impact (political influence) in a certain "social network" represented by a weighted directed graph. First, we give a statement of the "prototypic" extremal problem with unbounded input signals. Next, we discuss an impulsive trajectory extension of the prototypic model in an appropriate coarse topology of the space of right continuous functions with bounded variation. For an equivalent classical problem (obtained by a discontinuous time reparameterization of the extended system) we present a detalization of the Maximum Principle. As an illustration, we exhibit some results of numeric implementation of a toy model case and perform their practical interpretation. Finally, for the case of complete graph with equal weights we study the limit structure

of the model as the power of the network tends to infinity: we show that the limit system is described by a nonlocal continuity equation with "unbounded" velocity field. This equation can be transformed by a discontinuous reparameterization to an equivalent equation with a regular vector field, which gives (as well as in the finite-dimensional case) a correct impulsive trajectory extension of the original continuity equation. The derived optimal control problem for the distributed system is, thus, a relaxation of the original extremal problem for "large" networks.

Keywords: trajectory relaxations of control systems, impulsive control, optimal control, control of multi-agent systems.

References

1. Gurman V.I. Vyrozhdennye zadachi optimal'nogo upravleniya [Degenerate Problems of Optimal Control]. Moscow, Nauka Publ., 1977, 304 p. (in Russian)

2. Dykhta V.A., Samsonyuk O.N. Optimal'noe impul'snoe upravlenie s prilozheniyami [Optimal Impulsive Control with Applications]. Moscow, Fizmatlit, 2000, 256 p. (in Russian)

3. Zavalishchin S.T., Sesekin A.N. Impul'snye processy: modeli i prilozhenija [Impulse Processes: Models and Applications]. Moscow, Nauka Publ., 1991, 256 p. (in Russian)

4. Miller B.M., Rubinovich E.Ya. Optimizatsiya dinamicheskikh sistem s impul'snymi upravleniyami [Optimization of Dynamic Systems with Impulsive Controls]. Moscow, Nauka Publ., 2005, 430 p. (in Russian)

5. Ambrosio L., Savare G. Gradient flows of probability measures. Handbook of Differential Equations: Evolutionary Equations, 2007, vol. Ill, Amsterdam, Elsevier/North-Holland, pp. 1-136.

6. Arutyunov A. V., Karamzin D.Yu., Pereira F.L. On constrained impulsive control problems. J. Math. Sci., 2010, vol. 165, pp. 654-688. https://doi.org/10.1007/sl0958-010-9834-z

7. Bressan A., Rampazzo F. Impulsive control systems without commutativity assumptions. Optim. Theory Appl, 1994, vol. 81, no. 3, pp. 435-457. https://doi.org/10.1007/BF02193094

8. Clarke F. Functional Analysis, Calculus of Variations and Optimal Control. London, Springer-Verlag, 2013, 591 p.

9. Fornasier M., Solombrino F. Mean field optimal control. E&AIM Control Optim. Calc. Var., 2014 http://dx.doi.org/10.1051/cocv/2014009.

10. Knuth D.E. The Stanford CraphBase: A Platform for Combinatorial Computing. Boston, Addison-Wesley Professional, 1993, 592 p.

11. Marigonda A., Quincampoix M. Mayer control problem with probabilistic uncertainty on initial positions. J. Differential Equ., 2018, vol. 264, no. 5, pp. 32123252. https://doi.Org/10.1016/j.jde.2017.ll.014

12. Newman M. Networks: An Introduction. Oxford, Oxford University Press, 2010, 720 p.

13. Pogodaev N. Optimal control of continuity equations. NoDEA Nonlinear Differential Equations Appl., 2016, vol. 23, no. 2, pp. 21-24. https://doi.org/10.1007/s00030-016-0357-2

14. Staritsyn M.V. On "discontinuous" continuity equation and impulsive ensemble control. Syst. Control Lett., 2018, vol. 118, pp. 77-83. https://doi.Org/10.1016/j.sysconle.2018.06.001

Maxim Staritsyn, Candidate of Sciences (Physics and Mathematics), Research Scientist, Matrosov Institute for System Dynamics and Control Theory SB RAS, 134, Lermontov st., Irkutsk, 664033, Russian Federation, tel.: (3952) 45-30-95 (e-mail: [email protected])

Nadezhda Maltugueva, Programmer, Matrosov Institute for System Dynamics and Control Theory SB RAS, 134, Lermontov St., Irkutsk, 664033, Russian Federation, tel.: (3952) 45-30-37 (e-mail: [email protected])

Nikolay Pogodaev, Candidate of Sciences (Physics and Mathematics), Senior Research Scientist, Matrosov Institute for System Dynamics and Control Theory SB RAS, 134, Lermontov st., Irkutsk, 664033, Russian Federation, tel.: (3952) 45-30-52 (e-mail: [email protected])

Stepan Sorokin, Candidate of Sciences (Physics and Mathematics), Research Scientist, Matrosov Institute for System Dynamics and Control Theory SB RAS, 134, Lermontov st., Irkutsk, 664033, Russian Federation, tel.: (3952) 45-30-52 (e-mail: [email protected])

Received 10.08.18

i Надоели баннеры? Вы всегда можете отключить рекламу.