М.А. Приходько
ВЗАИМОДЕЙСТВИЕ КОНКУРИРУЮЩИХ ИНТЕЛЛЕКТУАЛЬНЫХ АГЕНТОВ В РАСПРЕДЕЛЕННЫХ МУЛЬТИАГЕНТНЫХ СИСТЕМАХ ОБРАБОТКИ ИНФОРМАЦИИ ПРИ ЭКСПОНЕНЦИАЛЬНОМ И РАВНОМЕРНОМ ВОЗРАСТАНИИ ЧИСЛА КОНТРАГЕНТОВ
В работе рассматривается взаимодействие конкурирующих интеллектуальных агентов в распределенных мультиагентных системах обработки информации при экспоненциальном и равномерном возрастании числа контрагентов. Приводятся математические модели взаимодействия. Рассматриваются алгоритмы реализации управляющего воздействия для нормализации функционирования системы обработки информации.
Ключевые слова: обработка информации, система обработки информации, мальтиагентная система, распределенная система, агент, контрагент, интеллектуальные агент, конкурирующие агенты, экспоненциальный рост, равномерный рост.
Системы обработки информации - тема, актуальная сегодня как никогда. Достаточно взглянуть на сеть Интернет - одну из наиболее ярких распределенных систем современности, чтобы в этом убедиться:
• темпы роста Интернет-трафика последние два года превышают 60% (61% в 2008 году и 79% в 2009 году);
• объем информации в сети Интернет увеличивается с каждым годом в геометрической прогрессии;
• увеличивается доля «сложной» для обработки информации: звуковой, графической, видео;
• доля спама в почтовой информации: свыше 90%.
Одновременно выдвигаются новые требования к качеству и
скорости обработки информации - для решения современных задач зачастую требуется обработка потокового аудио- и видео-потока в режиме реального времени, «на лету». Все больше систем представляют собой крупные распределенные комплексы в масштабе региона и даже целой страны. Возникают новые потребности - согласованного взаимодействия и интеграции распределенных систем, их эффективного управления и модернизации.
Процесс функционирования и сопряжения технического обеспечения (сетевых структур) крупных распределенных систем обработки разнородной информации порождает ряд проблем, вызванных непрогнозируемым изменением объема и характера обрабатываемой информации. Эти проблемы обусловлены появлением фракций контрагентов - элементарных процессов обработки информации, функционирующих ненадлежащим образом (недостаточно эффективно обрабатывающих информацию, вовсе не обрабатывающих информацию или обрабатывающих ее неправильно). Контрагенты конкурируют с агентами, входящими в состав распределенной мультиагентной системы обработки информации, в борьбе за ресурсы системы и нарушают ее нормальную работу. Возникновение таких ситуаций может привести к перегрузке сетевых каналов связи, нерегламентированному перераспределению вычислительных ресурсов между решаемыми задачами, а также к некорректной (ошибочной) обработке информации. Эффективно препятствовать этому может только активное управляющее воздействие, направленное на нормализацию работы распределенной системы. Целью такого управляющего воздействия может являться самоорганизация агентов, а также изменение природы возникших контрагентов и дальнейшее препятствование их появлению.
1. Равномерное возрастание числа контрагентов
Возможно возникновение нескольких случаев, различающихся в первую очередь характером распространения контрагентов в системе обработки информации, а также стратегией реализации управляющего воздействия. Рассмотрим первый случай - случайно равномерное распространение контрагентов в неделимой системе обработки информации (один узел распределенной системы) в условиях активного управляющего воздействия в виде конкурирующих агентов, целью которых является вытеснение контрагентов и препятствование их дальнейшему появлению в нормализованной агентами области системы обработки информации.
Пусть неделимая система обработки информации состоит из N компьютеров, а в ней взаимодействуют m = 2 конкурирующих интеллектуальных агента: K (контрагент) и A (агент).
Численность контрагентов K увеличивается со скоростью V контрагентов в единицу времени. Увеличение численности происходит равномерно случайным образом, т.е. все компьютеры систе-
мы обработки информации равновероятны с точки зрения размещения новой копии контрагента.
Управляющее воздействие заключается в размещении агентов А со скоростью размещения а агентов в единицу времени. Размещение агентов происходит равномерно случайно в той области системы обработки информации, которая еще не нормализована агентами. Т.е. вероятность размещения новой копии агента на компьютере с уже размещенным агентом равна 0. Свободные от агентов компьютеры равновероятны с точки зрения размещения новой копии агента.
Контрагент К не может быть размещен на компьютере с уже размещенным там агентом А. В свою очередь агент А может быть размещен на компьютере с ранее размещенным контрагентом К. В этом случае деятельность контрагента К прекращается. Цель фракции агентов - нормализовать работу системы обработки информации, сведя число контрагентов к нулю. Если обозначить функцией п(г) число контрагентов в момент времени г, то условие нормализации может быть записано в виде:
п(гнормализации) °.
Пусть в начальный момент времени г0 = 0 в системе обработки информации находится п0 контрагентов. До момента времени г = Т численность контрагентов увеличивается бесконтрольно. В момент времени Т начинается активное управляющее воздействие в виде размещения агентов А. Первоначально размещается q(T) = а0 агентов, где q(t) - функция, описывающая число агентов в момент времени г. Практический смысл времени Т - задержка между началом распространение контрагентов и фактическим обнаружением дестабилизации информационных процессов (время обнаружения) и введением управляющего воздействия.
В момент времени г < Т число контрагентов К описывается последовательностью п, подчиняющейся следующему дискретному уравнению:
П +1 = п + V * А,
где А = (Ы - пг) / N - доля свободных от контрагентов компьютеров системы обработки информации.
Последовательное применение данной рекуррентной формулы позволяет вывести формулу г-го члена последовательности для г < Т (случайно равномерное увеличение численности):
пс = Л/ -
Таким образом, к моменту введения управляющего воздействия t = Т число контрагентов будет равно:
Аналогичная формула может быть получена в непрерывном случае при использовании аппарата дифференциальных уравнений: п ^ + dt) = п + V * А * dt.
Данная формула описывает дифференциальное уравнение:
Решением уравнения (3) является функция:
С) а > д ( 3
V
— — - относительная скорость увеличения численности контрагентов,
а константа с находится из краевого условия п(0) = п0:
С = V- а п0.
Подставляя в (4) имеем:
-—с
Полученное выражение для числа контрагентов в момент времени t позволяет оценить скорость V, необходимую для полного нарушения работы системы обработки информации до момента введения управляющего воздействия t = Т. Для дискретного случая:
N - пТ < 1, откуда
V > N ** (6)
(.Л/ -
Для непрерывного случая: у > О ЫЛГ - Ид)) т '
Аналогично (1) и (5) позволяют оценить время, которое требуется контрагенту К, чтобы полностью нарушить работу системы
обработки информации в отсутствие управляющего воздействия в виде агентов A:
Т = log лг (Л/ - rif,) j е дискретом сл\"чае и iV- v
Т = --------—----— - Е НеПрерЫЕНОЗХ.
После введения агентов A в момент времени t = T характер изменения численности контрагентов K меняется. В этом случае число контрагентов nt в момент времени t > Т описывается рекуррентным соотношением:
N - nt- (а,-, - a[t- 7)) nt
tl+i = гг - V---------------------------а-------:------------—.
1+1 * .V N - ас. - a(t - Г))
Данное выражение учитывает активный характер управляющего воздействия, заключающийся в размещении новых агентов A только на тех компьютерах, где они пока не размещены: q(t) = ao + a(t — T) — число агентов A в момент времени t > Т. (7)
Последовательное применение данной рекуррентной формулы позволяет вывести формулу t-го члена последовательности для времени t > Г, однако более наглядная формула может быть получена в случае использования аппарата дифференциальных уравнений:
N N _
Решением уравнения, задающегося формулой (8), является функция:
= (N _ а - a(t-■ _N - п0~ ао eN
N
Из формулы (7) следует, что время до полного восстановления работоспособности системы обработки информации агентами А определяется условием: q(t) = N откуда
' N - а0 1
Рис. 1. Характерный график численности популяций агентов и контрагентов в случае равномерного увеличения
относительная скорость увеличения численности
агентов.
Это вполне согласуется с полученным в (9) решением, для которого (10) является одним из корней:
п (нормализации) 0.
Введем дополнительные обозначения для упрощения следующих вычислений:
/* / /'. относительное время нормализации,
ЛГ = Л/1
Пп
гц
= (1 -ре
-ап- ЛГ* е
0-1
Используя эту запись числа контрагентов, найдем производную функции п():
п
(1-/3 £*)ДГ а - $
а,п
ЛГ
)-1
Решим уравнение п'(0 = 0 и преобразуем его к виду:
В левой части уравнения (13) стоит строго монотонная возрастающая функция, в правой - монотонно убывающая. Следователь-
НО, у уравнения (13) существует корень ^ставшаищрш^ Причем единственный. Исходя из положительности значения левой части, можно сделать следующую оценку: а — &
. ^ тп _ ' 1
“■лямЯн ты ал н мм ~ л
стабилизации ' ~ ■ ^ ^
Неравенство (14) дает нам гарантированную оценку момента времени стабилизации численности контрагентов К, означающую, что при t > Стабилизации число контрагентов убывает:
п(0 < п(1-стабилизации)> t > ^'стабилизации-
Оценка (14) может быть уточнена, если прологарифмировать уравнение (13):
а £ = 1п
а затем учесть тот факт, что решением уравнения является положительное значение t > 0:
а Ь > 0, а следовательно
Г - < Т — — —
стабилизации ~ р ^
Уравнение (13) может быть преобразовано к виду: К* /1 1
е±а = а
N -а0
е ■- ")
Уравнение п’^) = 0 можно приближенно решить в предположении малости выражения:
1
I—I—<< 1-
«~Ц + Т
Логарифмируя уравнение (18) и раскладывая его в ряд в окрестности нуля, получаем:
М-аа\а $ }
Рис. 2. Характерный график численности популяций агентов и контрагентов до момента «стабилизации»: t < tстабилизации
Выражение (19) позволяет с помощью формулы (11) приближенно оценить численность фракции контрагентов к моменту стабилизации, а также их долю от общего числа компьютеров системы обработки информации.
Полученные результаты могут использоваться при разработке алгоритма функционирования системы активного управляющего воздействия с целью противодействия распространению контрагентов в неделимой системе обработки информации. В зависимости от значения фиксированных параметров системы найденные оценки позволяют варьировать изменяемые параметры с целью достижения требуемого результата - гарантированного времени нормализации работы системы, а также непревы-шения гарантированного порогового числа (доли) дестабилизированных контрагентами компьютеров.
Пусть система обработки информации опрашивается с частотой V. По полученному ответу делается вывод о наличии или отсутствии сбоев в ее функционировании. В случае обнаружения сбоя в качестве значения задержки обнаружения Т берется худшая оценка:
_ 1
V
Далее производится детальный опрос системы обработки информации с целью определения числа нормально функционирующих компьютеров Ннорм. В качестве значения п(Т) берется также худшая оценка:
после чего по формуле (5) в предположении п0 = 0 вычисляется скорость увеличения численности контрагентов V:
N N
V = —1п-------.
Т N
нэрн
По формуле (10) можно оценить требуемое значение скорости увеличения численности агентов а, исходя из желаемого времени нормализации работы системы обработки информации Тнормализации (в предположении, что а0 = 0):
N
а ~ Т — Т
нзр.ио.тизацш:
Полученное значение а используется для вычисления времени стабилизации численности контрагентов tсmабилизации и числа дестабилизированных контрагентами компьютеров системы обработки информации к моменту стабилизации. В случае, если данное значение не соответствует требуемым критериям надежности функционирования системы обработки информации и
л ... . .г . ^формула (11) рассматривается как уравнение относительно переменной а, откуда находится уточненное значение скорости увеличения численности агентов.
После вычисления всех параметров производится математическое моделирование изменения численностей контрагентов и агентов, по результатам которого полученные значения параметров управляющего воздействия при необходимости уточняются. При соответствии результатов моделирования - времени стабилизации, численности контрагентов к моменту стабилизации, времени нор-
мализации - заявленным критериям надежности системы обработки информации реализуется управляющее воздействие.
Имитационное моделирование может использоваться и в ходе реализации управляющего воздействия для анализа и подтверждения характера изменения численности контрагентов, а также тонкого уточнения параметров управляющего воздействия. В дальнейшем данный алгоритм в качестве одного из элементов может быть положен в основу программной системы управления функционированием распределенной мультиагентной системы обработки информации в условиях непрогнозируемого изменения объема и характера обрабатываемой информации.
2. Экспоненциальное возрастание числа контрагентов
Рассмотрим теперь случай экспоненциального увеличения численности контрагентов в неделимой системе обработки информации (один узел распределенной системы) в условиях активного управляющего воздействия в виде конкурирующих агентов, целью которых является вытеснение контрагентов и препятствование их дальнейшему появлению в нормализованной агентами области системы обработки информации.
Пусть неделимая система обработки информации состоит из N компьютеров, а в ней взаимодействуют т = 2 конкурирующих интеллектуальных агента: К (контрагент) и А (агент).
Численность контрагентов К увеличивается со скоростью V контрагентов в единицу времени. Увеличение численности происходит экспоненциально случайным образом, т.е. все компьютеры системы обработки информации равновероятны с точки зрения размещения новой копии контрагента.
Управляющее воздействия заключается в размещении агентов А со скоростью размещения а агентов в единицу времени. Размещение агентов происходит экспоненциально случайно в той области системы обработки информации, которая еще не нормализована агентами. Т.е. вероятность размещения новой копии агента на компьютере с уже размещенным агентом равна 0. Свободные от агентов омпьютеры равновероятны с точки зрения размещения новой копии агента.
Контрагент К не может быть размещен на компьютере с уже размещенным там агентом А. В свою очередь агент А может быть размещен на компьютере с ранее размещенным контрагентом К. В этом случае деятельность контрагента К прекращается. Цель фрак-
ции агентов - нормализовать работу системы обработки информации, сведя число контрагентов к нулю. Если обозначить функцией п(0 число контрагентов в момент времени t, то условие нормализации может быть записано в виде:
п(1-нормали.зации) °.
Пусть в начальный момент времени t0 = 0 в системе обработки информации находится п0 контрагентов. До момента времени t = T численность контрагентов увеличивается бесконтрольно. В момент времени T начинается активное управляющее воздействие в виде размещения агентов A. Первоначально размещается q(T) = a0 агентов, где q(t) - функция, описывающая число агентов в момент времени t.
В момент времени t < T число контрагентов K может быть получено при помощи использования аппарата дифференциальных уравнений:
п^ + dt) = п(0 + п(0*У * А * dt,
где А = N - п) / N - доля свободных от контрагентов компьютеров системы обработки информации.
Данная формула описывает дифференциальное уравнение:
N
Решением уравнения (3) является функция:
N "ГО = Се-+1,где(4)
константа С находится из краевого условия п(0) = п0:
с =
па
Подставляя в (4) имеем: ь М _____________________
----^ - 1
Полученное выражение для числа контрагентов в момент времени t < Т позволяет оценить скорость V, необходимую для полного нарушения работы системы обработки информации до момента введения управляющего воздействия t = Т:
Л N-1,., '.Л
11п^Г
V > -----—
- ггп
Аналогично (2) позволяет оценить время, которое требуется контрагенту К, чтобы полностью нарушить работу системы обработки информации в отсутствие управляющего воздействия в виде агентов А:
N — 1
V - п0_)
1п ■
Т =
N
V
После введения агентов А в момент времени t = Т характер изменения численности контрагентов К меняется. В этом случае число контрагентов щ в момент времени £ > Г описывается уравнением:
— сії) = п[ы — V
К - п(о - ?(0
IV
.V М- ЦШ ■ -
Данное выражение учитывает активный характер управляющего воздействия, заключающийся в размещении новых агентов А только на тех компьютерах, где они пока не размещены: q(t) - число агентов А в момент времени t > Т.
В свою очередь число агентов А подчиняется дифференциальному уравнению:
о (с— г)
Таким образом, получается следующее дифференциальное
уравнение:
Лг
IV
N
аае^-Ъ "
Решением уравнения (5) является функция:
еТа — а^е
га
}
С2е
Константа
Л'д
находится
.г IV «„Л в
М-Пц+п
дпУ Є *>
„IV
(д0(а? + тг0(е7Т - 1)
из
АН
краевого
(6)
условия
■ Т1п
N тгг
откуда
п
4-
Др(ед::г-П-1^
? Ыа |
-- тр рУ - Др) - а0поеГ|У)
Рис. 3. Характерный график численности популяции агентов и контрагентов в случае экспоненциального увеличения их численности
Из формулы (4) следует, что время до полного восстановления работоспособности системы обработки информации агентами А определяется условием q(t) = N откуда
г - т + 11 **
а
ап
(8)
Определение времени стабилизации tсmабилизации, когда численность контрагентов начинает убывать, несколько усложняется по сравнению со случаем равномерно случайного увеличения численности контрагентов и агентов.
Для нахождения времени стабилизации tCтабилизации продифференцируем выражение (7), приравняем его к нулю и введем новую переменную:
N
Учитывая оценку (8) на максимальное значение t, можно сделать вывод, что У < 1
В новых переменных уравнение для нахождения времени стабилизации примет вид:
V
V _ ус
ео" =0----------- —-——------ггде
- (2+?)> +1
ап0
В =----------е Ка ( —
им ^ АГ/
(9)
1/Л/ ^-ЛГ
Уравнение (9) может быть решено численно. Для локализации
корня достаточно заметить, что у < 1, а знак выражения, стоящего
в правой части, определяется знаком знаменателя, который имеет
два корня у1<1 и у2>1:
Г ” т-
узд=---------------5-----------■
Левая часть уравнения (9) строго положительна, поэтому приближенное решение необходимо искать на отрезке [0, у1], что позволяет оценить сверху значение времени стабилизации:
о
Рис. 4. Характерный график численности популяций агентов и контрагентов до момента «стабилизации»: t < tстабилизации
На выбранном отрезке функции, соответствующие левой и правой частям уравнения (9), строго монотонны, что позволяет сделать вывод не только о существовании корня, но и его единственности.
Полученные результаты могут использоваться при разработке алгоритма функционирования системы активного управляющего воздействия с целью противодействия распространению контрагентов в неделимой системе обработки информации.
Пусть система обработки информации опрашивается с частотой V. По полученному ответу делается вывод о наличии или отсутствии сбоев в ее функционировании. В случае обнаружения сбоя в качестве значения задержки обнаружения Т берется худшая оценка:
_ 1
V
Далее производится детальный опрос системы обработки информации с целью определения числа нормально функционирующих компьютеров Nорм. В качестве значения п(Т) берется также худшая оценка:
после чего из формулы (2) в предположении п0 = 1 вычисляется скорость увеличения численности контрагентов V по формуле:
V = — 1п -
Т N
лор.и
По формуле (8) можно оценить требуемое значение скорости увеличения численности агентов а, исходя из желаемого времени нормализации Тнормашзщш{ъ предположении, что а„ /):
а ~ Т — Т
юршлшацш
Полученное значение а используется для численного решения уравнения (9) и вычисления времени стабилизации tсmабилизации и числа дестабилизированных контрагентами компьютеров системы обработки информации к моменту стабилизации. В случае, если данное значение не соответствует требуемым критериям надежности функционирования системы обработки информации ('^'илк ил -тп =•! гцдд и ^суяпбилцз-зц ии)? формула (7) рассматривается как уравнение относительно переменной а, откуда находится уточненное значение скорости увеличения численности агентов.
После вычисления всех параметров производится математическое моделирование изменения численностей контрагентов и агентов, по результатам которого полученные значения параметров управляющего воздействия при необходимости уточняются. При соответствии результатов моделирования - времени стабилизации, численности контрагентов к моменту стабилизации, времени нормализации - заявленным критериям надежности системы обработки информации управляющее воздействие реализуется непосредственно.
Имитационное моделирование может использоваться и в ходе реализации управляющего воздействия для анализа и подтверждения характера изменения численности контрагентов, а также тонкого уточнения параметров управляющего воздействия. В дальнейшем данный алгоритм в качестве одного из элементов может быть положен в основу программной системы управления функционированием распределенной мультиагентной системы обработки информации в условиях непрогнозируемого изменения объема и характера обрабатываемой информации, иш
— Коротко об авторе ----------------------------------------------------
Приходько М.А. - докторант, доцент кафедры Автоматизированные системы управления, кандидат физико-математических наук, e-mail spex19@mail.ru
Московский государственный горный университет,
Moscow State Mining University, Russia, ud@msmu.ru