Взаимодействие конкурирующих интеллектуальных агентов в распределенных мультиагентных системах обработки информации при экспоненциальном и равномерном возрастании числа контрагентов

Приходько М.А.

М.А. Приходько

ВЗАИМОДЕЙСТВИЕ КОНКУРИРУЮЩИХ ИНТЕЛЛЕКТУАЛЬНЫХ АГЕНТОВ В РАСПРЕДЕЛЕННЫХ МУЛЬТИАГЕНТНЫХ СИСТЕМАХ ОБРАБОТКИ ИНФОРМАЦИИ ПРИ ЭКСПОНЕНЦИАЛЬНОМ И РАВНОМЕРНОМ ВОЗРАСТАНИИ ЧИСЛА КОНТРАГЕНТОВ

В работе рассматривается взаимодействие конкурирующих интеллектуальных агентов в распределенных мультиагентных системах обработки информации при экспоненциальном и равномерном возрастании числа контрагентов. Приводятся математические модели взаимодействия. Рассматриваются алгоритмы реализации управляющего воздействия для нормализации функционирования системы обработки информации.

Ключевые слова: обработка информации, система обработки информации, мальтиагентная система, распределенная система, агент, контрагент, интеллектуальные агент, конкурирующие агенты, экспоненциальный рост, равномерный рост.

Системы обработки информации - тема, актуальная сегодня как никогда. Достаточно взглянуть на сеть Интернет - одну из наиболее ярких распределенных систем современности, чтобы в этом убедиться:

• темпы роста Интернет-трафика последние два года превышают 60% (61% в 2008 году и 79% в 2009 году);

• объем информации в сети Интернет увеличивается с каждым годом в геометрической прогрессии;

• увеличивается доля «сложной» для обработки информации: звуковой, графической, видео;

• доля спама в почтовой информации: свыше 90%.

Одновременно выдвигаются новые требования к качеству и

скорости обработки информации - для решения современных задач зачастую требуется обработка потокового аудио- и видео-потока в режиме реального времени, «на лету». Все больше систем представляют собой крупные распределенные комплексы в масштабе региона и даже целой страны. Возникают новые потребности - согласованного взаимодействия и интеграции распределенных систем, их эффективного управления и модернизации.

Процесс функционирования и сопряжения технического обеспечения (сетевых структур) крупных распределенных систем обработки разнородной информации порождает ряд проблем, вызванных непрогнозируемым изменением объема и характера обрабатываемой информации. Эти проблемы обусловлены появлением фракций контрагентов - элементарных процессов обработки информации, функционирующих ненадлежащим образом (недостаточно эффективно обрабатывающих информацию, вовсе не обрабатывающих информацию или обрабатывающих ее неправильно). Контрагенты конкурируют с агентами, входящими в состав распределенной мультиагентной системы обработки информации, в борьбе за ресурсы системы и нарушают ее нормальную работу. Возникновение таких ситуаций может привести к перегрузке сетевых каналов связи, нерегламентированному перераспределению вычислительных ресурсов между решаемыми задачами, а также к некорректной (ошибочной) обработке информации. Эффективно препятствовать этому может только активное управляющее воздействие, направленное на нормализацию работы распределенной системы. Целью такого управляющего воздействия может являться самоорганизация агентов, а также изменение природы возникших контрагентов и дальнейшее препятствование их появлению.

1. Равномерное возрастание числа контрагентов

Возможно возникновение нескольких случаев, различающихся в первую очередь характером распространения контрагентов в системе обработки информации, а также стратегией реализации управляющего воздействия. Рассмотрим первый случай - случайно равномерное распространение контрагентов в неделимой системе обработки информации (один узел распределенной системы) в условиях активного управляющего воздействия в виде конкурирующих агентов, целью которых является вытеснение контрагентов и препятствование их дальнейшему появлению в нормализованной агентами области системы обработки информации.

Пусть неделимая система обработки информации состоит из N компьютеров, а в ней взаимодействуют m = 2 конкурирующих интеллектуальных агента: K (контрагент) и A (агент).

Численность контрагентов K увеличивается со скоростью V контрагентов в единицу времени. Увеличение численности происходит равномерно случайным образом, т.е. все компьютеры систе-

мы обработки информации равновероятны с точки зрения размещения новой копии контрагента.

Управляющее воздействие заключается в размещении агентов А со скоростью размещения а агентов в единицу времени. Размещение агентов происходит равномерно случайно в той области системы обработки информации, которая еще не нормализована агентами. Т.е. вероятность размещения новой копии агента на компьютере с уже размещенным агентом равна 0. Свободные от агентов компьютеры равновероятны с точки зрения размещения новой копии агента.

Контрагент К не может быть размещен на компьютере с уже размещенным там агентом А. В свою очередь агент А может быть размещен на компьютере с ранее размещенным контрагентом К. В этом случае деятельность контрагента К прекращается. Цель фракции агентов - нормализовать работу системы обработки информации, сведя число контрагентов к нулю. Если обозначить функцией п(г) число контрагентов в момент времени г, то условие нормализации может быть записано в виде:

п(гнормализации) °.

Пусть в начальный момент времени г0 = 0 в системе обработки информации находится п0 контрагентов. До момента времени г = Т численность контрагентов увеличивается бесконтрольно. В момент времени Т начинается активное управляющее воздействие в виде размещения агентов А. Первоначально размещается q(T) = а0 агентов, где q(t) - функция, описывающая число агентов в момент времени г. Практический смысл времени Т - задержка между началом распространение контрагентов и фактическим обнаружением дестабилизации информационных процессов (время обнаружения) и введением управляющего воздействия.

В момент времени г < Т число контрагентов К описывается последовательностью п, подчиняющейся следующему дискретному уравнению:

П +1 = п + V * А,

где А = (Ы - пг) / N - доля свободных от контрагентов компьютеров системы обработки информации.

Последовательное применение данной рекуррентной формулы позволяет вывести формулу г-го члена последовательности для г < Т (случайно равномерное увеличение численности):

пс = Л/ -

Таким образом, к моменту введения управляющего воздействия t = Т число контрагентов будет равно:

Аналогичная формула может быть получена в непрерывном случае при использовании аппарата дифференциальных уравнений: п ^ + dt) = п + V * А * dt.

Данная формула описывает дифференциальное уравнение:

Решением уравнения (3) является функция:

С) а > д ( 3

V

— — - относительная скорость увеличения численности контрагентов,

а константа с находится из краевого условия п(0) = п0:

С = V- а п0.

Подставляя в (4) имеем:

-—с

Полученное выражение для числа контрагентов в момент времени t позволяет оценить скорость V, необходимую для полного нарушения работы системы обработки информации до момента введения управляющего воздействия t = Т. Для дискретного случая:

N - пТ < 1, откуда

V > N ** (6)

(.Л/ -

Для непрерывного случая: у > О ЫЛГ - Ид)) т '

Аналогично (1) и (5) позволяют оценить время, которое требуется контрагенту К, чтобы полностью нарушить работу системы

обработки информации в отсутствие управляющего воздействия в виде агентов A:

Т = log лг (Л/ - rif,) j е дискретом сл\"чае и iV- v

Т = --------—----— - Е НеПрерЫЕНОЗХ.

После введения агентов A в момент времени t = T характер изменения численности контрагентов K меняется. В этом случае число контрагентов nt в момент времени t > Т описывается рекуррентным соотношением:

N - nt- (а,-, - a[t- 7)) nt

tl+i = гг - V---------------------------а-------:------------—.

1+1 * .V N - ас. - a(t - Г))

Данное выражение учитывает активный характер управляющего воздействия, заключающийся в размещении новых агентов A только на тех компьютерах, где они пока не размещены: q(t) = ao + a(t — T) — число агентов A в момент времени t > Т. (7)

Последовательное применение данной рекуррентной формулы позволяет вывести формулу t-го члена последовательности для времени t > Г, однако более наглядная формула может быть получена в случае использования аппарата дифференциальных уравнений:

N N _

Решением уравнения, задающегося формулой (8), является функция:

= (N _ а - a(t-■ _N - п0~ ао eN

N

Из формулы (7) следует, что время до полного восстановления работоспособности системы обработки информации агентами А определяется условием: q(t) = N откуда

' N - а0 1

Рис. 1. Характерный график численности популяций агентов и контрагентов в случае равномерного увеличения

относительная скорость увеличения численности

агентов.

Это вполне согласуется с полученным в (9) решением, для которого (10) является одним из корней:

п (нормализации) 0.

Введем дополнительные обозначения для упрощения следующих вычислений:

/* / /'. относительное время нормализации,

ЛГ = Л/1

Пп

гц

= (1 -ре

-ап- ЛГ* е

0-1

Используя эту запись числа контрагентов, найдем производную функции п():

п

(1-/3 £*)ДГ а - $

а,п

ЛГ

)-1

Решим уравнение п'(0 = 0 и преобразуем его к виду:

В левой части уравнения (13) стоит строго монотонная возрастающая функция, в правой - монотонно убывающая. Следователь-

НО, у уравнения (13) существует корень ^ставшаищрш^ Причем единственный. Исходя из положительности значения левой части, можно сделать следующую оценку: а — &

. ^ тп _ ' 1

“■лямЯн ты ал н мм ~ л

стабилизации ' ~ ■ ^ ^

Неравенство (14) дает нам гарантированную оценку момента времени стабилизации численности контрагентов К, означающую, что при t > Стабилизации число контрагентов убывает:

п(0 < п(1-стабилизации)> t > ^'стабилизации-

Оценка (14) может быть уточнена, если прологарифмировать уравнение (13):

а £ = 1п

а затем учесть тот факт, что решением уравнения является положительное значение t > 0:

а Ь > 0, а следовательно

Г - < Т — — —

стабилизации ~ р ^

Уравнение (13) может быть преобразовано к виду: К* /1 1

е±а = а

N -а0

е ■- ")

Уравнение п’^) = 0 можно приближенно решить в предположении малости выражения:

1

I—I—<< 1-

«~Ц + Т

Логарифмируя уравнение (18) и раскладывая его в ряд в окрестности нуля, получаем:

М-аа\а $ }

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 2. Характерный график численности популяций агентов и контрагентов до момента «стабилизации»: t < tстабилизации

Выражение (19) позволяет с помощью формулы (11) приближенно оценить численность фракции контрагентов к моменту стабилизации, а также их долю от общего числа компьютеров системы обработки информации.

Полученные результаты могут использоваться при разработке алгоритма функционирования системы активного управляющего воздействия с целью противодействия распространению контрагентов в неделимой системе обработки информации. В зависимости от значения фиксированных параметров системы найденные оценки позволяют варьировать изменяемые параметры с целью достижения требуемого результата - гарантированного времени нормализации работы системы, а также непревы-шения гарантированного порогового числа (доли) дестабилизированных контрагентами компьютеров.

Пусть система обработки информации опрашивается с частотой V. По полученному ответу делается вывод о наличии или отсутствии сбоев в ее функционировании. В случае обнаружения сбоя в качестве значения задержки обнаружения Т берется худшая оценка:

_ 1

V

Далее производится детальный опрос системы обработки информации с целью определения числа нормально функционирующих компьютеров Ннорм. В качестве значения п(Т) берется также худшая оценка:

после чего по формуле (5) в предположении п0 = 0 вычисляется скорость увеличения численности контрагентов V:

N N

V = —1п-------.

Т N

нэрн

По формуле (10) можно оценить требуемое значение скорости увеличения численности агентов а, исходя из желаемого времени нормализации работы системы обработки информации Тнормализации (в предположении, что а0 = 0):

N

а ~ Т — Т

нзр.ио.тизацш:

Полученное значение а используется для вычисления времени стабилизации численности контрагентов tсmабилизации и числа дестабилизированных контрагентами компьютеров системы обработки информации к моменту стабилизации. В случае, если данное значение не соответствует требуемым критериям надежности функционирования системы обработки информации и

л ... . .г . ^формула (11) рассматривается как уравнение относительно переменной а, откуда находится уточненное значение скорости увеличения численности агентов.

После вычисления всех параметров производится математическое моделирование изменения численностей контрагентов и агентов, по результатам которого полученные значения параметров управляющего воздействия при необходимости уточняются. При соответствии результатов моделирования - времени стабилизации, численности контрагентов к моменту стабилизации, времени нор-

мализации - заявленным критериям надежности системы обработки информации реализуется управляющее воздействие.

Имитационное моделирование может использоваться и в ходе реализации управляющего воздействия для анализа и подтверждения характера изменения численности контрагентов, а также тонкого уточнения параметров управляющего воздействия. В дальнейшем данный алгоритм в качестве одного из элементов может быть положен в основу программной системы управления функционированием распределенной мультиагентной системы обработки информации в условиях непрогнозируемого изменения объема и характера обрабатываемой информации.

2. Экспоненциальное возрастание числа контрагентов

Рассмотрим теперь случай экспоненциального увеличения численности контрагентов в неделимой системе обработки информации (один узел распределенной системы) в условиях активного управляющего воздействия в виде конкурирующих агентов, целью которых является вытеснение контрагентов и препятствование их дальнейшему появлению в нормализованной агентами области системы обработки информации.

Пусть неделимая система обработки информации состоит из N компьютеров, а в ней взаимодействуют т = 2 конкурирующих интеллектуальных агента: К (контрагент) и А (агент).

Численность контрагентов К увеличивается со скоростью V контрагентов в единицу времени. Увеличение численности происходит экспоненциально случайным образом, т.е. все компьютеры системы обработки информации равновероятны с точки зрения размещения новой копии контрагента.

Управляющее воздействия заключается в размещении агентов А со скоростью размещения а агентов в единицу времени. Размещение агентов происходит экспоненциально случайно в той области системы обработки информации, которая еще не нормализована агентами. Т.е. вероятность размещения новой копии агента на компьютере с уже размещенным агентом равна 0. Свободные от агентов омпьютеры равновероятны с точки зрения размещения новой копии агента.

Контрагент К не может быть размещен на компьютере с уже размещенным там агентом А. В свою очередь агент А может быть размещен на компьютере с ранее размещенным контрагентом К. В этом случае деятельность контрагента К прекращается. Цель фрак-

ции агентов - нормализовать работу системы обработки информации, сведя число контрагентов к нулю. Если обозначить функцией п(0 число контрагентов в момент времени t, то условие нормализации может быть записано в виде:

п(1-нормали.зации) °.

Пусть в начальный момент времени t0 = 0 в системе обработки информации находится п0 контрагентов. До момента времени t = T численность контрагентов увеличивается бесконтрольно. В момент времени T начинается активное управляющее воздействие в виде размещения агентов A. Первоначально размещается q(T) = a0 агентов, где q(t) - функция, описывающая число агентов в момент времени t.

В момент времени t < T число контрагентов K может быть получено при помощи использования аппарата дифференциальных уравнений:

п^ + dt) = п(0 + п(0*У * А * dt,

где А = N - п) / N - доля свободных от контрагентов компьютеров системы обработки информации.

Данная формула описывает дифференциальное уравнение:

N

Решением уравнения (3) является функция:

N "ГО = Се-+1,где(4)

константа С находится из краевого условия п(0) = п0:

с =

па

Подставляя в (4) имеем: ь М _____________________

----^ - 1

Полученное выражение для числа контрагентов в момент времени t < Т позволяет оценить скорость V, необходимую для полного нарушения работы системы обработки информации до момента введения управляющего воздействия t = Т:

Л N-1,., '.Л

11п^Г

V > -----—

- ггп

Аналогично (2) позволяет оценить время, которое требуется контрагенту К, чтобы полностью нарушить работу системы обработки информации в отсутствие управляющего воздействия в виде агентов А:

N — 1

V - п0_)

1п ■

Т =

N

V

После введения агентов А в момент времени t = Т характер изменения численности контрагентов К меняется. В этом случае число контрагентов щ в момент времени £ > Г описывается уравнением:

— сії) = п[ы — V

К - п(о - ?(0

IV

.V М- ЦШ ■ -

Данное выражение учитывает активный характер управляющего воздействия, заключающийся в размещении новых агентов А только на тех компьютерах, где они пока не размещены: q(t) - число агентов А в момент времени t > Т.

В свою очередь число агентов А подчиняется дифференциальному уравнению:

о (с— г)

Таким образом, получается следующее дифференциальное

уравнение:

Лг

IV

N

аае^-Ъ "

Решением уравнения (5) является функция:

еТа — а^е

га

}

С2е

Константа

Л'д

находится

.г IV «„Л в

М-Пц+п

дпУ Є *>

„IV

(д0(а? + тг0(е7Т - 1)

из

АН

краевого

(6)

условия

■ Т1п

N тгг

откуда

п

4-

Др(ед::г-П-1^

? Ыа |

-- тр рУ - Др) - а0поеГ|У)

Рис. 3. Характерный график численности популяции агентов и контрагентов в случае экспоненциального увеличения их численности

Из формулы (4) следует, что время до полного восстановления работоспособности системы обработки информации агентами А определяется условием q(t) = N откуда

г - т + 11 **

а

ап

(8)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Определение времени стабилизации tсmабилизации, когда численность контрагентов начинает убывать, несколько усложняется по сравнению со случаем равномерно случайного увеличения численности контрагентов и агентов.

Для нахождения времени стабилизации tCтабилизации продифференцируем выражение (7), приравняем его к нулю и введем новую переменную:

N

Учитывая оценку (8) на максимальное значение t, можно сделать вывод, что У < 1

В новых переменных уравнение для нахождения времени стабилизации примет вид:

V

V _ ус

ео" =0----------- —-——------ггде

- (2+?)> +1

ап0

В =----------е Ка ( —

им ^ АГ/

(9)

1/Л/ ^-ЛГ

Уравнение (9) может быть решено численно. Для локализации

корня достаточно заметить, что у < 1, а знак выражения, стоящего

в правой части, определяется знаком знаменателя, который имеет

два корня у1<1 и у2>1:

Г ” т-

узд=---------------5-----------■

Левая часть уравнения (9) строго положительна, поэтому приближенное решение необходимо искать на отрезке [0, у1], что позволяет оценить сверху значение времени стабилизации:

о

Рис. 4. Характерный график численности популяций агентов и контрагентов до момента «стабилизации»: t < tстабилизации

На выбранном отрезке функции, соответствующие левой и правой частям уравнения (9), строго монотонны, что позволяет сделать вывод не только о существовании корня, но и его единственности.

Полученные результаты могут использоваться при разработке алгоритма функционирования системы активного управляющего воздействия с целью противодействия распространению контрагентов в неделимой системе обработки информации.

Пусть система обработки информации опрашивается с частотой V. По полученному ответу делается вывод о наличии или отсутствии сбоев в ее функционировании. В случае обнаружения сбоя в качестве значения задержки обнаружения Т берется худшая оценка:

_ 1

V

Далее производится детальный опрос системы обработки информации с целью определения числа нормально функционирующих компьютеров Nорм. В качестве значения п(Т) берется также худшая оценка:

после чего из формулы (2) в предположении п0 = 1 вычисляется скорость увеличения численности контрагентов V по формуле:

V = — 1п -

Т N

лор.и

По формуле (8) можно оценить требуемое значение скорости увеличения численности агентов а, исходя из желаемого времени нормализации Тнормашзщш{ъ предположении, что а„ /):

а ~ Т — Т

юршлшацш

Полученное значение а используется для численного решения уравнения (9) и вычисления времени стабилизации tсmабилизации и числа дестабилизированных контрагентами компьютеров системы обработки информации к моменту стабилизации. В случае, если данное значение не соответствует требуемым критериям надежности функционирования системы обработки информации ('^'илк ил -тп =•! гцдд и ^суяпбилцз-зц ии)? формула (7) рассматривается как уравнение относительно переменной а, откуда находится уточненное значение скорости увеличения численности агентов.

После вычисления всех параметров производится математическое моделирование изменения численностей контрагентов и агентов, по результатам которого полученные значения параметров управляющего воздействия при необходимости уточняются. При соответствии результатов моделирования - времени стабилизации, численности контрагентов к моменту стабилизации, времени нормализации - заявленным критериям надежности системы обработки информации управляющее воздействие реализуется непосредственно.

Имитационное моделирование может использоваться и в ходе реализации управляющего воздействия для анализа и подтверждения характера изменения численности контрагентов, а также тонкого уточнения параметров управляющего воздействия. В дальнейшем данный алгоритм в качестве одного из элементов может быть положен в основу программной системы управления функционированием распределенной мультиагентной системы обработки информации в условиях непрогнозируемого изменения объема и характера обрабатываемой информации, иш

— Коротко об авторе ----------------------------------------------------

Приходько М.А. - докторант, доцент кафедры Автоматизированные системы управления, кандидат физико-математических наук, e-mail spex19@mail.ru

Московский государственный горный университет,

Moscow State Mining University, Russia, ud@msmu.ru

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Приходько М. А.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Приходько М. А.