Научная статья на тему 'Метод оптимизации организационной структуры централизованных многоагентных систем в автоматическом режиме'

Метод оптимизации организационной структуры централизованных многоагентных систем в автоматическом режиме Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
3
1
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
многоагентная система / организационная структура / группа / агент / оптимизация / биогеографический алгоритм / multi-agent system / organizational structure / group / agent / optimization / biogeographic algorithm

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Юрий Владимирович Дубенко, Евгений Евгеньевич Дышкант, Александр Анатольевич Обозовский

Организационная структура многоагентной системы (МАС) представляет собой совокупность ролей и связей агентов, компонентов, осуществляющих управление их поведением, а также правил, регламентирующих взаимодействие элементов системы. Эффективность МАС во многом зависит от характеристик применяемой организационной структуры. Существующие решения в данной области обладают значительным недостатком, а именно низкой адаптивностью к изменениям параметров окружающей среды или корректировке условий поставленной задачи, которая заключается в необходимости повторного запуска процедуры синтеза организационной структуры МАС. Проблема автоматической оптимизации организационной структуры централизованных МАС в условиях изменившихся параметров окружающей среды или поставленной задачи особую актуальность приобретает для централизованных МАС, имеющих строгую иерархическую структуру, агенты которой могут быть разделены на два класса – агенты-менеджеры, агенты-подчиненные. Предметом исследования являются методы синтеза организационной структуры МАС. Целью работы является разработка метода оптимизации организационной структуры централизованных МАС в автоматическом режиме. Для достижения обозначенной цели были введены понятия первичного и вторичного ресурса агента, на основе биогеографического алгоритма разработан метод, регламентирующий перемещение агентовподчиненных между группами в зависимости от степени привлекательности агента-менеджера (зависит от суммы оценок эффективности управляемых им агентов-подчиненных, а также от удаленности от данного агента-подчиненного). Разработанный метод может найти свое практическое применение при реализации следующих задач: обследование или патрулирование (охрана) мобильными роботами инфраструктурных объектов, реализация искусственного интеллекта в компьютерных играх.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Юрий Владимирович Дубенко, Евгений Евгеньевич Дышкант, Александр Анатольевич Обозовский

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The optimizing method of centralized multi-agent systems organizational structure in automatic mode

The organizational structure of a multi-agent system (MAS) is a set of roles and relationships of agents, components that control their behavior, as well as rules governing the interaction of system elements. The effectiveness of the MAS largely depends on the characteristics of the organizational structure used. Existing solutions in this area have a significant disadvantage, namely low adaptability to changes in environmental parameters or adjustment of the conditions of the task, which consists in the need to restart the procedure for synthesizing the organizational structure of the MAS. The problem of automatic optimization of the organizational structure of centralized MAS in the conditions of changed environmental parameters or the task is of particular relevance for centralized MAS with a strict hierarchical structure, whose agents can be divided into two classes – agents-managers, agents-subordinates. The subject of the study is the methods of synthesis of the organizational structure of the MAS. The aim of the work is to develop a method for optimizing the organizational structure of centralized MAS in automatic mode. To achieve this goal, the concepts of primary and secondary agent resources were introduced, based on a biogeographic algorithm, a method was developed that regulates the movement of subordinate agents between groups depending on the degree of attractiveness of the agent manager (depends on the sum of estimates of the effectiveness of subordinate agents managed by him, as well as on the distance from this subordinate agent). The developed method can find its practical application in the implementation of the following tasks: inspection or patrolling (protection) of infrastructure facilities by mobile robots, the implementation of artificial intelligence in computer games.

Текст научной работы на тему «Метод оптимизации организационной структуры централизованных многоагентных систем в автоматическом режиме»

Вестник Астраханского государственного технического университета. Серия: Управление, вычислительная техника и информатика. 2024. № 1

Vestnik of Astrakhan State Technical University. Series: Management, computer science and informatics. 2024. N. 1 ISSN 2072-9502 (Print), ISSN 2224-9761 (Online)

КОМПЬЮТЕРНОЕ ОБЕСПЕЧЕНИЕ И ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА

COMPUTER ENGINEERING AND SOFTWARE

Научная статья УДК 004.81

https://doi.org/10.24143/2072-9502-2024-1-46-55 EDN TACQLO

Метод оптимизации организационной структуры централизованных многоагентных систем в автоматическом режиме

Юрий Владимирович Дубенко1, Евгений Евгеньевич Дышкант2ш, Александр Анатольевич Обозовский3

1Кубанский государственный технологический университет, Краснодар, Россия

2Армавирский механико-технологический институт (филиал) ФГБОУ ВО «Кубанский государственный технологический университет», Армавир, Россия, ed0802@yandex.ruш

3Краснодарское высшее военное орденов Жукова и Октябрьской Революции Краснознаменное училище

имени генерала армии С. М. Штеменко, Краснодар, Россия

Аннотация. Организационная структура многоагентной системы (МАС) представляет собой совокупность ролей и связей агентов, компонентов, осуществляющих управление их поведением, а также правил, регламентирующих взаимодействие элементов системы. Эффективность МАС во многом зависит от характеристик применяемой организационной структуры. Существующие решения в данной области обладают значительным недостатком, а именно низкой адаптивностью к изменениям параметров окружающей среды или корректировке условий поставленной задачи, которая заключается в необходимости повторного запуска процедуры синтеза организационной структуры МАС. Проблема автоматической оптимизации организационной структуры централизованных МАС в условиях изменившихся параметров окружающей среды или поставленной задачи особую актуальность приобретает для централизованных МАС, имеющих строгую иерархическую структуру, агенты которой могут быть разделены на два класса - агенты-менеджеры, агенты-подчиненные. Предметом исследования являются методы синтеза организационной структуры МАС. Целью работы является разработка метода оптимизации организационной структуры централизованных МАС в автоматическом режиме. Для достижения обозначенной цели были введены понятия первичного и вторичного ресурса агента, на основе биогеографического алгоритма разработан метод, регламентирующий перемещение агентов-подчиненных между группами в зависимости от степени привлекательности агента-менеджера (зависит от суммы оценок эффективности управляемых им агентов-подчиненных, а также от удаленности от данного агента-подчиненного). Разработанный метод может найти свое практическое применение при реализации следующих задач: обследование или патрулирование (охрана) мобильными роботами инфраструктурных объектов, реализация искусственного интеллекта в компьютерных играх.

© Дубенко Ю. В., Дышкант Е. Е., Обозовский А. А., 2024

Vestnik of Astrakhan State Technical University. Series: Management, computer science and informatics. 2024. N. 1 ISSN2072-9502 (Print), ISSN2224-9761 (Online)

Computer engineering and software

Ключевые слова: многоагентная система, организационная структура, группа, агент, оптимизация, биогеографический алгоритм

Для цитирования: Дубенко Ю. В., Дышкант Е. Е., Обозовский А. А. Метод оптимизации организационной

структуры централизованных многоагентных систем в автоматическом режиме // Вестник Астраханского го- ,

сударственного технического университета. Серия: Управление, вычислительная техника и информатика. О

2024. № 1. С. 46-55. https://doi.org/10.24143/2072-9502-2024-1-46-55. EDN TACQLO. |

t

и

Original article .

о

The optimizing method of centralized §

multi-agent systems organizational structure in automatic mode y

_ .

Yuri V. Dubenko1, Evgeny E. Dyshkant2^, Alexander A. Obozovsky3 h

1 e

Kuban State Technological University, p

Krasnodar, Russia i

B.

2Armavir Institute of Mechanical and Technological (branch) Federal State Budgetary Educational Institution 5'

of Higher Education "Kuban State Technological University ", g

Armavir, Russia, ed0802@yandex.ruB h

0

3 ^

Krasnodar Higher Military awarded by the Orders of Zhukov and by the Orders of October Revolution f

and the Red Banner School named after the general of the Army S. M. Shtemenko, g

Krasnodar, Russia r

1 n"

CD

Abstract. The organizational structure of a multi-agent system (MAS) is a set of roles and relationships of agents, com- g

ponents that control their behavior, as well as rules governing the interaction of system elements. The effectiveness of the t

MAS largely depends on the characteristics of the organizational structure used. Existing solutions in this area have a sig- ¿'

nificant disadvantage, namely low adaptability to changes in environmental parameters or adjustment of the conditions g

of the task, which consists in the need to restart the procedure for synthesizing the organizational structure of the MAS. s

The problem of automatic optimization of the organizational structure of centralized MAS in the conditions of changed ц

environmental parameters or the task is of particular relevance for centralized MAS with a strict hierarchical structure, 3

whose agents can be divided into two classes - agents-managers, agents-subordinates. The subject of the study is the methods of synthesis of the organizational structure of the MAS. The aim of the work is to develop a method for optimizing the organizational structure of centralized MAS in automatic mode. To achieve this goal, the concepts of primary and secondary agent resources were introduced, based on a biogeographic algorithm, a method was developed that regulates the movement of subordinate agents between groups depending on the degree of attractiveness of the agent manager (depends on the sum of estimates of the effectiveness of subordinate agents managed by him, as well as on the distance from this subordinate agent). The developed method can find its practical application in the implementation of the following tasks: inspection or patrolling (protection) of infrastructure facilities by mobile robots, the implementation of artificial intelligence in computer games.

Keywords: multi-agent system, organizational structure, group, agent, optimization, biogeographic algorithm

For citation: Dubenko Yu. V., Dyshkant E. E., Obozovsky A. A. The optimizing method of centralized multi-agent systems organizational structure in automatic mode. Vestnik of Astrakhan State Technical University. Series: Management, computer science and informatics. 2024;1:46-55. (In Russ.). https://doi.org/10.24143/2072-9502-2024-1-46-55. EDN TACQLO.

Введение новным их недостатком является низкая адаптив-

Теория многоагентных систем (МАС) является ность даже к незначительным изменениям пара-одним из важнейших направлений искусственного метров окружающей среды или корректировке интеллекта. Значительная роль в ней отводится условий поставленной задачи, которая заключается решению задачи синтеза (а также автоматической в необходимости повторного запуска процедуры корректировки в процессе работы) организацион- синтеза организационной структуры МАС. ной структуры МАС, обеспечивающей ее функци- Таким образом, имеет место проблема автома-онирование с максимальной производительностью. тической оптимизации организационной структу-В работах [1-5] для решения обозначенной за- ры МАС в условиях изменившихся параметров дачи предлагаются подходы, основанные на при- окружающей среды или поставленной задачи. Це-менении генетических алгоритмов, динамического лью данной работы является разработка методов программирования, методов теории графов. Ос- решения обозначенной проблемы.

ста

S

Вестник Астраханского государственного технического университета. Серия: Управление, вычислительная техника и информатика. 2024. № 1

ISSN2072-9502 (Print), ISSN2224-9761 (Online)

Компьютерное обеспечение и вычислительная техника

я

я я я

<

>я я и

ю

о

W

S-I

я и 0

Постановка задачи и методы

Дано:

- S - МАС;

- X = {A, T} - множество входных параметров, где T - поставленная задача; A - множество интеллектуальных агентов, A = {a,}, при этом существует хотя бы одна пара агентов

a, > a,+1 1 a, 6 A a,+1 6 A :Oa, * °ai+1 > Oa, - множество

технических характеристик агента a,, ca. 1 - множество технических характеристик агента a,+1 (т. е. агенты гетерогенные, т. к. их множества технических характеристик не совпадают, при этом под техническими характеристиками понимают тип и параметры транспортной платформы, вычислительной подсистемы, подсистемы машинного зрения, коммуникационной подсистемы, постоянного запоминающего устройства и т. д.), i = 1, aN , aN 6 N , где N - число интеллектуальных агентов. Каждый агент а, обладает множеством ресурсов Rsa = {Rs;- }, при этом Rsa = f (oa,) , где Rsj - некоторый ресурс, которым обладает агент

a, (под ресурсом понимается некоторая услуга, которую может предоставить агент, например сбор, обработка, хранение, передача данных), Rsj =(Rst, Rsmax), где Rst б[0, 1] - свободный

объем ресурса Rsj (выраженный в некоторых

условных единицах), которым обладает агент a, в текущий момент времени t; Rsmax - максимально возможный объем ресурса Rsj, которым может

В рамках рассматриваемой задачи автоматической оптимизации организационной структуры централизованной МАС агенты в зависимости от роли могут быть разделены на две группы: агенты-менеджеры (множество Alead); агенты-подчиненные (множество Asub).

Для агентов-менеджеров выделим следующие типы ресурсов:

1. Первичный ресурс (Rs<pkim) - множество ресурсов (вычислительные, коммуникационные ресурсы, постоянная память, оборудования для сбора данных об окружающей среде), которыми обладают агенты (a, 6 Asub), находящиеся в подчинении у агента-менеджера (a, 6 Alead) - некоторой группы Gk,

Rs%m = 1 a 6 Gk r a 6 Asub . i = 1 aN . aN 6 N }

обладать агент а, j = 1, RsaN , RsaN е N ;

- Z = {О5} - множество внутренних параметров 5", описывающих ее организационную структуру OS (совокупность ролей и связей агентов, компонентов, осуществляющих управление их поведением, а также правил, регламентирующих взаимодействие элементов системы [6]);

- Y - множество выходных параметров, описывающих результат выполнения множеством агентов А поставленной задачи Т;

- Е - множество параметров окружающей среды;

- Q = {/} - множество показателей эффективности системы, где / - время выполнения поставленной задачи Т.

Таким образом, необходимо разработать метод М, предназначенный для оптимизации организационной структуры Оц, при этом

М: {5, X, 7, Y, Е, Q} ^ {Л/ | Л/ > 0},

где Д = /ь - /а, /ь - значение показателя / Е Q до применения метода М; га - значение показателя / Е Q после применения метода М.

где a< - число агентов-подчиненных группы Gk. К числу первичных ресурсов в данном случае также относится опыт агентов-подчиненных a, 6 Asub

Rsskrn = f (Ba.) , где Bai - база знаний агента a,.

При этом относительная величина первичного ресурса, которым обладает группа (подгруппа) Gk, может быть выражена следующей функцией:

Rsprim = f (^^yai:ai6Gt^ai6Asub ^ ytypeRsat ' k,mp ) ,

где Rstylpe - объем ресурса типа type, которым обладает агент a,; kfypp - коэффициент важности ресурса типа type, ktmp6 [0,1].

2. Вторичный ресурс (Rs^ ) - величина, отражающая эффективность действий агентов-подчиненных a, : a, 6 Gk л a, 6 Asub при решении задач Tj,

RsGc =

f (Z Vat:at6Gkra^Jeffic (ai, Tj )' kdamp ) , (1)

где fфc - функция эффективности агента-подчиненного а^ при решении задачи (подзадачи) Т},

j = 1, T<Gk, T^ - число задач (подзадач), назначен-

ных агентам-подчиненным группы Gk, Тык е N; к-йатр - коэффициент затухания (реализует уменьшение значений функции fфc с течением времени),

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

kdamp = f lim f (0= 0; k = 1, Gn , Gn 6 N -

число групп, на которые разбито множество агентов системы S, t - некоторый интервал времени,

Vestnik of Astrakhan State Technical University. Series: Management, computer science and informatics. 2024. N. 1 ISSN2072-9502 (Print), ISSN 2224-9761 (Online)

Computer engineering and software

t e[tT, tT +At], t* £ {t0, tls ..., tZw }, т = О, т n , т n £ N , t* -1- =At.

Замечание: понятия первичный и вторичный ресурс группы (подгруппы) Gk тождественны понятиям первичный и вторичный ресурс агента-менеджера a £ Aiead л a е Gk.

Цель любого агента-менеджера заключается в максимизации вторичного ресурса RsGekc для Vi:

V(ai, t 1 ai e Alead V ai e Gk) : RsG

^ max.

(2)

Для выражения (2) имеют место следующие условия:

Rs¡rim ^ P (Rs2c ^ max

(3)

т. е. в случае роста первичного ресурса группы Gk (Rsrm) вероятность максимизации вторичного ресурса

(Rsfk) также увеличивается, P (RsGc ^ max) £ [0,1].

Таким образом, чем большим первичным ресурсом обладает агент at £ Alead, тем больше вероятность достижения им условия (2). При этом увеличение

первичного ресурса возможно исключительно за счет роста числа агентов-подчиненных в группе (подгруппе). Следовательно, имеет место зависимость вторичного ресурса от величины первичного ресурса:

V (а, 11 а £ А1еаё л а £ Gk): RsGc = / (RS%m ). (4)

В случае с (4), чем большим первичным ресурсом обладает агент-менеджер, тем больше вероятность достижения (2), т. к. агенты-подчиненные, обладающие высокопроизводительной аппаратной составляющей, могут выполнять поставленные задачи с большей эффективностью.

Однако большое число агентов-подчиненных может также повлечь и уменьшение функции (1) за счет чрезмерной нагрузки на вычислительную и коммуникационную подсистемы агента-менеджера (агент-менеджер не сможет оперативно получать и обрабатывать входящие сообщения от агентов-подчиненных, а также генерировать и высылать ответные сообщения). Обозначенная зависимость величины вторичного ресурса от объема первичного ресурса иллюстрируется на рис. 1.

О

s

b

сь

o

о Y

О

о

и

RsGk

sec p

RsGk

sec p

RsGk

prmpmx

RsGk

prim

ста сь

в

Рис. 1. Примерный график зависимости величины вторичного ресурса (Rsfjc) от объема первичного (RsGptrim) Fig. 1. Approximate graph of the dependence of the value of a secondary resource (Rsfjc) on the volume

of a primary resource (RsGvlrim)

Таким образом, с учетом ситуации, представленной на рис. 1, можно утверждать о неполноте условия (3), которое должно быть скорректировано следующим образом:

I RsGk t^ RsGk t 'Rspnm *1 sec 1

при RsGpüm < Rs"k

RsGk RsGk 1 при RsGk > RsGk

Rs prim Rssec 11ри Rs prim Rs pri

Gk .

primpmax ;

Gk > RsGk prim primpmax '

где Rsp

значение аргумента, при котором

величина Rssetc достигает максимума, т. е.

а^тЖ f = К™^,

где / соответствует (4).

Замечание: важную роль при формировании

RsGelc имеет способность агента-менеджера оптимально распределять задачи Т между агентами-

k

Вестник Астраханского государственного технического университета. Серия: Управление, вычислительная техника и информатика. 2024. № 1

ISSN2072-9502 (Print), ISSN2224-9761 (Online)

Компьютерное обеспечение и вычислительная техника

подчиненными таким образом, чтобы kf^ = 1, где V (ai, 11 ai 6 Asub rat 6 Gk): Rs^c = f (Rsa];iim). (7)

я

я я я

>я я и

ю

о

W

т

я и 0

type - опыт агента-менеджера.

Таким образом, необходимость максимизации первичного и вторичного ресурсов должна побуждать агента-менеджера к вербовке агентов-подчиненных в свою группу. Однако важно и наличие факторов, побуждающих агентов-подчиненных к миграции, величина которых может зависеть от успешности действий агента-менеджера (т. е. у агентов-подчиненных должен быть стимул для перехода в группу к более успешному агенту-менеджеру). Следовательно, для агентов-подчиненных также

необходимо ввести понятия первичный (Rsaprim)

и вторичный ресурс (Rs^ ), где ai 6 Asub . В качестве первичного ресурса для агента-подчиненного могут выступать технические ресурсы агента-менеджера (прежде всего вычислительная и коммуникационная составляющие), а также его опыт, а в качестве вторичного - показатель эффективности самого агента-менеджера, который рассчитывается для каждой решаемой задачи. Таким образом, первичный ресурс находится в функциональной зависимости от технических ресурсов и опыта агента-менеджера:

па, = f (у nstype _ ,<ype) prim f \La ytypeRaaprm kimp J ,

где a, - агент-подчиненный, a, : a, 6 Asub л a, 6 Gk; aprm - агент-менеджер, aprm 6 Aprim л a, 6 Gk; Rstyipe - объем ресурса типа type (включая опыт), которым обладает агент aprm, kfmpp - коэффициент

важности ресурса типа type, kfmpp 6 [0, 1]. При этом

вторичный ресурс агента-подчиненного a, находится в функциональной зависимости от показателя его эффективности при решении назначенных ему задач:

^sl = f (ffc (ai, Tj ) • kdamp ) , (5)

где kdamp - коэффициент затухания (реализует уменьшение значений ffc с течением времени),

kdamp = f (t) 6 [0,1], lim^ f (t ) = 0; k = Щ, t - некоторый интервал времени, 16 [tT, tT + At],

tT 1 tTN } т = Tn 6 N, tT - tT-1 =At.

Таким образом, цель любого агента-подчинен-ного заключается в следующем:

Rsaec ^ max. (6)

Для первичного и вторичного ресурсов агента-подчиненного также допустимо следующее соотношение:

В отличие от первичного и вторичного ресурсов агента-менеджера, в данном случае наличие соотношения (7) не столь очевидно, однако необходимо учитывать, что величина (5) складывается из двух составляющих: функции эффективности агента-подчиненного f^ic, а также коэффициента затухания kdamp. Следовательно, в случае, если

prim

агент-менеджер a редко назначает задачи аген-ту-подчиненному a, то Rs^ec ^ 0, поскольку с течением времени kdamp ^ 0. Подобная ситуация (редкость получения заданий от агента-менеджера) возможна в двух случаях:

- в группе Gk достаточно агентов, и агент является невостребованным (вне зависимости от величины Rsapinm);

- вычислительная и коммуникационная системы

prm

агента-менеджера a перегружены, и он не успевает назначить задачу агенту a, (имеет место зависимость от величины Rspr'rim, т. е. агент-менеджер,

обладающий значительными аппаратными возможностями, может с высокой производительностью координировать действия большого числа агентов-подчиненных).

При этом в случае регулярного назначения задач на величину функции эффективности агента-подчиненного feffic влияет способность агента-менеджера правильно распределять задачи, которая, в свою очередь, находится в зависимости от его опыта, также учитываемая при расчете первичного ресурса Rsp^.

Таким образом, можно утверждать, что соотношение (7) имеет место, однако его необходимо переписать со следующим ограничением:

|{( a,, T}lar 6 G) | = |{T;} : U T = T,

где ^, Т^ - пары агент - назначенная задача; {aj, Т] |а^ еОк^}| - число сформированных пар а^, Т^ в момент времени /; |{Т]1 - число отдель-

ных задач, на которые была разложена задача Т.

В [7] рассматривается алгоритм биогеографической оптимизации, основанный на моделировании процесса миграции животных и заселения ими различных территорий. Основная суть алгоритма заключается в анализе значения такого параметра, как привлекательность территории для миграции. При этом она может зависеть от таких характеристик, как климат, объем пищевых ресурсов, степень засе-

Vestnik of Astrakhan State Technical University. Series: Management, computer science and informatics. 2024. N. 1 ISSN2072-9502 (Print), ISSN 2224-9761 (Online)

Computer engineering and software

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ленности территории (чем больше видов проживает на этой территории, тем менее привлекательной для миграции она становится). Обозначенные принципы могут быть перенесены на рассматриваемую задачу оптимизации организационной структуры централизованных многоагентных систем в части обеспечения миграции агентов между группами. Для этого необходимо рассмотреть следующие понятия.

Баиг - показатель привлекательности агента-менеджера для агентов-подчиненньх. Агенты-подчиненные заинтересованы в максимизации собственного вторичного ресурса, что возможно лишь при условии регулярного получения задач от агента-менеджера. При этом от опыта агента-менеджера зависит и выполнимость заданий, получаемых агентами-ведомыми (т. е. агент-менеджер распределяет задания, учитывая опыт, технические характеристики и местоположение агентов-подчиненных). Следовательно, агенты-подчиненные, в случае неудовлетворения их потребности во вторичном ресурсе, будут стремиться перейти к более успешному агенту-менеджеру. Таким образом, имеем

Eattr

f (Rs?ekc ) .

(8)

где apW - новый (более привлекательный) агент-

менеджер, apw £ Gnew a Gnew £ S ; apnm - старый (утративший привлекательность) агент-менеджер;

nprim . nprim , nprim A nprim £ G A G t G ■ EGk -new new' attr

показатель привлекательности агента-менеджера

- показатель привлека-

aprm (и группы Gk); Eca¡

Рассмотрим применимость выражения (8) для нескольких ситуаций.

1. Число агентов-подчиненных в группе Ок настолько велико, что вычислительная и коммуникационная системы агента-менеджера арпт £ Gk работают с существенной задержкой, следовательно, агенты-подчиненные также получают новые задачи с задержкой, в связи с чем величина их вторичного ресурса падает (Rs'a!'ec ^) вопреки условию (6), что автоматически ведет к падению вторичного ресурса агента-менеджера, поскольку в выражении /фс (а^, Т} )• кёатр значение коэффициента затухания катр ^ 0 (т. е. чем меньше задач в единицу времени выполняют агенты-ведомые, тем меньше вторичный ресурс агента-менеджера). Таким образом, в ситуации, когда RsGekc имеем ^ . Падение привлекательности агента-менеджера (и возглавляемой им группы) побуждает агентов-подчиненных искать нового агента-менеджера:

apr¡m E G • EGk < EGnew

anew c Gnew : Eattr ^ Eattr ■

(9)

тельности агента-менеджера арГт (и группы Опе„).

2. Агент-менеджер арпт £ Gk потерял способность к передвижению, сохранив при этом работоспособность вычислительной и коммуникационной системы. При этом значение Е^ не будет падать, пока отсутствие мобильности агента-менеджера не будет негативным образом отражаться на эффективности взаимодействия с агентами-подчиненными. Однако в случае территориального смещения зоны выполнения задач, переданных от лица, принимающего решения (либо от агента-менеджера вышестоящего уровня), будет наблюдаться некоторая задержка (или потеря) связи между агентами-менеджерами и агентами-подчиненными, которая в итоге приведет к возникновению ситуации (9). Однако здесь возникает проблема выбора новых агентов-менеджеров при равенстве их показателей привлекательности. Очевидно, что в этом случае выбор должен быть сделан в пользу ближайшего агента-менеджера, однако возможны ситуации, при которых доступ к нему может быть ограничен или невозможен (что в ближайшей перспективе может привести к повторению описываемой ситуации), например, в случае наличия некоторого физического препятствия (стена, пропасть, водная преграда и т. п.). Таким образом, более целесообразным видится определение меры близости на основании следующих критериев:

- прямое расстояние до агента-менеджера (без учета препятствий);

- возможность прокладки кратчайшего пути к агенту-менеджеру по разведанной территории (может быть построен путем применения эвристических алгоритмов, например алгоритма Дейкстры), при этом необходимо учитывать актуальность имеющейся информации.

Следовательно, показатель привлекательности агента-менеджера должен рассчитываться с точки зрения агента-подчиненного и может быть записан в следующем виде:

о

u

b

CD

o

о Y

о

О

и

ста

CD

EGk/ai _ f[EGnew d (aprim a I aprim E G Л a Ф G ^ Eattr ~ f \Eattr , ushw\anew , ai 1 anew Gnew /xai *= Gnew Ц ,

где ЕО^®1 - коэффициент привлекательности агента-менеджера ар™ £ Опе№ для агента-подчиненного а; ¿¡¡^ - оценка кратчайшего пути между ар^™ и а.

(10)

Согласно [7], в рамках биогеографической оптимизации заселенные территории становятся менее привлекательными для миграции. Применительно к рассматриваемой ситуации перегружен-

Вестник Астраханского государственного технического университета. Серия: Управление, вычислительная техника и информатика. 2024. № 1

ISSN2072-9502 (Print), ISSN2224-9761 (Online)

Компьютерное обеспечение и вычислительная техника

рт

я

я я я

>я я и

ю

о

W

т

я и 0

ю

ный агент-менеджер должен обладать меньшей привлекательностью. Таким образом, перепишем формулу (8), добавив коэффициент «желания» агента-менеджера в привлечении новых агентов-подчиненных:

EGk =

f (RsGeC

prim

' kdes

prim J

где kl - f (и

type 6 lypeRsOpL ) 6 [0, 1] - показатель

prim

желания агента a принимать новых агентов-подчиненных, Rs^ppm - ресурс type, которым обладает агент apnm, Rs^ppm =(Rst, Rsmax), Rst - свободный

объем ресурса type в текущий момент времени t, Rsmax - максимально возможный объем ресурса type, Type - множество типов ресурсов, допустимых для агента apr,m.

E&sc - показатель готовности агентов-подчиненных к миграции. Складывается из «недовольства» агентов-подчиненных получаемым вторичным ресурсом, а также из степени территориальной удаленности агента-подчиненного от агента-менеджера. Является вспомогательным показателем, величина которого обратно пропорциональна коэффициенту привлекательности агента-менеджера для агента-подчиненного:

Eai = 1

d'sc pGk '

Eattr

Таким образом, метод обеспечения механизма миграции агентов между группами, основанный на применении алгоритма биогеографической оптимизации, сводится к выполнению следующих шагов.

Для агента-менеджера apnm 6 Gk:

1. Получение задачи T от лица, принимающего решения (либо агента-менеджера более высокого уровня иерархии). Декомпозиция задачи T на отдельные задачи (подзадачи) Tj.

2. Назначение задач (подзадач) Tj агентам-подчиненным a, 6 Asub, a, 6 Gk.

3. Анализ результатов выполнения задач (подзадач) Tj агентами-подчиненными a, 6 Gk - вычисление Va, значений функции ftfic(ah Tj) (функция определения показателя эффективности агента a, при решении задачи (подзадачи) Tj).

4. На основании feffic(ah Tj) выполняется расчет (обновление) значений вторичного ресурса агента-менеджера Rsf^ в соответствии с (1).

5. Привлечение новых агентов-подчиненных a, g Gk, для групп, в которых они состоят, имеет место условие (9).

6. Повторение шагов 1-5 до достижения цели задачи, поставленной группе Gk (результат выполнения задачи T : Tj с T ).

Для агентов-подчиненных:

1. Получение задачи (подзадачи) Tj от агента-

менеджера apnm 6 Gk .

2. Расчет (обновление) вторичного ресурса Rs^c по формуле (5).

3. Расчет показателя привлекательности агента-менеджера Ё^Т" (см. (10)) и показателя готовности к миграции Edfisc . Если E"sc < £ , £ 6 [0,1], то

повторение шагов 1-3, иначе - выполнение оценки других агентов-менеджеров, переход к такому

aprim 6 G : EG"ew/ai > EGk'"i Л EGnew1 ai ^ max "new G new : Eattr Eattr /XEattr ^ max .

Результаты

Цель эксперимента: в результате выполнения компьютерного моделирования доказать эффективность применения предложенного метода оптимизации организационной структуры, реализованного на основе биогеографического алгоритма, на примере централизованных МАС, основанных на применении парадигмы обучения с подкреплением с выполнением обмена опытом между агентами. Рассматриваемая многоагентная система и алгоритмы ее работы описываются в [8-11].

Описание решаемой задачи: достижение всеми агентами некоторого целевого положения на ограниченной территории (с наличием препятствий).

Описание внешней среды: виртуальный лабиринт, сформированный в среде Microsoft Unity, при этом стены в лабиринте устанавливаются случайным образом. Размерность лабиринта - 150 х 150, при этом под единицей размерности понимается клетка, соответствующая одному квадратному блоку, применяемому для формирования стен (для оценки размеров блока можно учитывать тот факт, что толщина стены соответствует одному блоку). Структура лабиринта в ходе эксперимента меняется случайным образом (изменение типа одной случайной клетки происходит с периодичностью в 5 с).

Тип применяемых агентов: виртуальные агенты, имитирующие мобильных роботов на колесной транспортной платформе, оснащенных видеокамерой.

Число агентов: 26, при этом первоначальное формирование групп выполнялось на основании алгоритма, приводимого в [9, 10]. Случайное обездвижение агента-менеджера выполнялось в среднем на 14 с (продолжительность времени обездвижения также выбиралась случайным образом из интервала 5-20 с, максимальное число одновременно обездвиженных агентов-менеджеров - 2).

Vestnik of Astrakhan State Technical University. Series: Management, computer science and informatics. 2024. N. 1 ISSN2072-9502 (Print), ISSN 2224-9761 (Online)

Computer engineering and software

Минимальное число агентов в группе - 3 (включая агента-менеджера).

Механизм выбора стартовых положений агентов: координаты стартовых положений генерируются случайным образом на каждой итерации.

Механизм выбора целевого состояния: координаты целевого состояния генерируются случайным образом на каждой итерации.

Критерий, позволяющий утверждать об успешном решении задачи: перемещение всех агентов в целевое состояние.

Число итераций (попыток): 200, при этом итерация считается выполненной в случае достижения критерия решения задачи.

3600

3240 3060 2Í80 2700 2520 2110 2160

Имитация загруженности вычислительной системы агента-менеджера: при назначении задач, а также при расчете подкреплений на каждого аген-та-подчиненного генерировалась задержка в 0,3 с.

Имитация задержки в канале связи в зависимости от расстояния: агент-подчиненный получал информационные сообщения от агента-менеджера с задержкой из расчета 0,2 с на 5 клеток прямого расстояния между ними.

Критерий оценки эффективности метода: время выполнения одной итерации.

Результаты, полученные в ходе эксперимента, в виде зависимости времени выхода всех агентов из лабиринта от номера итерации представлены на рис. 2.

с,

О

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

bg_opt(í) 19S0 1300

standart(i) ..... 1620

1440

1260

1QS0

900

720

340

360

ISO

0

. ;

№1

'11 ■Ч

i

Ï

ill

Uli 1 J" , i

Ï.1' А 1 '' ■ ¡ -iñ

IJ 1 h ■ Si. '■'. i , ¡ i

w \/k i ' :: ¿j. y ■ ■ \">

\P «p t

U K¡\ ÍV,

ГЛП

О s b

CD

o

о Y

О

y

O

h

ста

CD n

0 ID 20 30 40 50 M 70 Й0 90 100 110 120 130 140 150 160 170 130 190 200

Номер итерации

Рис. 2. Результаты эксперимента (зависимость времени выхода всех агентов из лабиринта от номера итерации): bg_opt - МАС [8-11] с применением разработанного метода оптимизации организационной структуры МАС; standart - МАС [8-11] без применения разработанного метода

Fig. 2. Experiment results (dependence of the exit time of all agents from the maze on the iteration number): bg_opt is MAS [8-11] using the developed method of optimizing MAS organizational structure; standart is MAS [8-11] without using the developed method

Обсуждение

Применение разработанного метода позволило уже к 50-й итерации улучшить время выполнения поставленной задачи в среднем на 12,3 % в сравнении со стандартной системой, а к 200-й итерации этот показатель достиг 53,3 % (см. рис. 2). Полученный выигрыш в производительности обусловлен минимизацией издержек (связанных с загруженно-

стью вычислительных систем агентов-менеджеров, а также с задержкой при обмене данными с агентами-подчиненными), которая достигается за счет оперативной адаптации состава групп агентов к изменениям параметров окружающей среды. Полученные экспериментальные данные свидетельствует о целесообразности применения разработанного метода в централизованных МАС.

Вестник Астраханского государственного технического университета. Серия: Управление, вычислительная техника и информатика. 2024. № 1

ISSN2072-9502 (Print), ISSN2224-9761 (Online)

Компьютерное обеспечение и вычислительная техника

Заключение

В результате выполнения данной работы был проведен анализ источников, посвященных задаче формирования организационной структуры МАС, предложен метод оптимизации организационной

структуры централизованной МАС в автоматическом режиме (выполняется в случае незначительных изменений условий задачи или параметров окружающей среды), основанный на применении биогеографического алгоритма.

Список источников

я

я я я

<

>я я и

ю

о

W

H

я и

s

1. Zhiqi Shen, Ling Yu, Han Yu. An Evolutionary Approach for Optimizing Hierarchical Multi-Agent System Organization. URL: https://doi.org/10.48550/arXiv.1411.6202 (дата обращения: 20.09.2023).

2. Bistaffa F., Farinelli F., Cerquides J., Rodriguez-Aguilar J., Ramchurn S. D. Anytime Coalition Structure Generation on Synergy Graphs. URL: https://www.researchgate. net/publication/269092245_Anytime_coalition_structure_gene ration_on_synergy_graphs (дата обращения: 22.09.2023).

3. Sims M., Corkill D., Lesser V. Knowledgeable Automated Organization Design for Multi-Agent Systems. URL: http://mas.cs.umass.edu/Documents/07-43.pdf (дата обращения: 22.09.2023).

4. Rahwan T., Michalak T. P., Wooldridg M., Jennings N. R. Coalition structure generation: A survey // Artificial Intelligence. 2015. N. 229. P. 139-174.

5. Rahwan T., Michalak T. P. Coalition Structure Generation on Graphs. URL: https://doi.org/10.48550/arXiv. 1410.6516 (дата обращения: 24.09.2023).

6. Horling B., Lesser V. A Survey of Multi-Agent Organizational Paradigms // The Knowledge Engineering Review. 2005. N. 19 (04). P. 281-316.

7. Саймон Д. Алгоритмы эволюционной оптимизации / пер. с англ. А. В. Логунова. М.: ДМК Пресс, 2020. 1002 с.

8. Дубенко Ю. В. Метод повторного применения и обмена опытом при коллективном взаимодействии интеллектуальных агентов // Вестн. Воронеж. гос. техн. ун-та. 2022. Т. 18, № 1. С. 62-72.

9. Дубенко Ю. В., Рудешко Н. А. Алгоритм обучения с подкреплением для децентрализованных многоагент-ных систем, основанный на обмене опытом и обучении агентов случайному взаимодействию // Вестн. Воронеж. гос. техн. ун-та. 2022. Т. 18, № 4. С. 30-36.

10. Дубенко Ю. В. Алгоритм коллективного взаимодействия интеллектуальных агентов в централизованных многоагентных системах // Вестн. компьютер. и инфор-мац. технологий. 2022. Т. 19, № 10 (220). С. 30-42.

11. Дубенко Ю. В., Дышкант Е. Е., Тимченко Н. Н., Рудешко Н. А. Гибридный алгоритм формирования кратчайшей траектории, основанный на применении многоагентного обучения с подкреплением и обмена опытом // Вестн. компьютер. и информац. технологий. 2021. Т. 18, № 11 (209). С. 13-26.

References

1. Zhiqi Shen, Ling Yu, Han Yu. An Evolutionary Approach for Optimizing Hierarchical Multi-Agent System Organization. Available at: https://doi.org/10.48550/arXiv.1411. 6202 (accessed: 20.09.2023).

2. Bistaffa F., Farinelli F., Cerquides J., Rodriguez-Aguilar J., Ramchurn S. D. Anytime Coalition Structure Generation on Synergy Graphs. Available at: https:// www.researchgate.net/publication/269092245_Anytime_coa lition_structure_generation_on_synergy_graphs (accessed: 22.09.2023).

3. Sims M., Corkill D., Lesser V. Knowledgeable Automated Organization Design for Multi-Agent Systems. Available at: http://mas.cs.umass.edu/Documents/07-43.pdf (accessed: 22.09.2023).

4. Rahwan T., Michalak T. P., Wooldridg M., Jennings N. R. Coalition structure generation: A survey. Artificial Intelligence,, 2015, no. 229, pp. 139-174.

5. Rahwan T., Michalak T. P. Coalition Structure Generation on Graphs. Available at: https://doi.org/10.48550/arXiv. 1410.6516 (accessed: 24.09.2023).

6. Horling B., Lesser V. A Survey of Multi-Agent Organizational Paradigms. The Knowledge Engineering Review, 2005, no. 19 (04), pp. 281-316.

7. Saimon D. Algoritmy evoliutsionnoi optimizatsii [Evolutionary optimization algorithms]. Moscow, DMK Press, 2020. 1002 p.

8. Dubenko Iu. V. Metod povtornogo primeneniia i ob-

mena opytom pri kollektivnom vzaimodeistvii intellek-tual'nykh agentov [The method of repeated application and exchange of experience in the collective interaction of intelligent agents]. Vestnik Voronezhskogo gosudarstvennogo tekhnicheskogo universiteta, 2022, vol. 18, no. 1, pp. 62-72.

9. Dubenko Iu. V., Rudeshko N. A. Algoritm obucheniia s podkrepleniem dlia detsentralizovannykh mnogoagentnykh sistem, osnovannyi na obmene opytom i obuchenii agentov sluchainomu vzaimodeistviiu [A reinforcement learning algorithm for decentralized multi-agent systems based on the exchange of experience and training of agents in random interac-tion]. Vestnik Voronezhskogo gosudarstvennogo tekhnicheskogo universiteta, 2022, vol. 18, no. 4, pp. 30-36.

10. Dubenko Iu. V. Algoritm kollektivnogo vzai-modeistviia intellektual'nykh agentov v tsentralizovannykh mno-goagentnykh sistemakh [The algorithm of collective interaction of intelligent agents in centralized multi-agent systems]. Vestnik komp'iuternykh i informatsionnykh tekhnologii, 2022, vol. 19, no. 10 (220), pp. 30-42.

11. Dubenko Iu. V., Dyshkant E. E., Timchenko N. N., Rudeshko N. A. Gibridnyi algoritm formirovaniia kratchaishei traektorii, osnovannyi na primenenii mnogoagentnogo obucheniia s podkrepleniem i obmena opytom [A hybrid algorithm for the formation of the shortest trajectory based on the use of multi-agent reinforcement learning and experience exchange]. Vestnik komp'iuternykh i informatsionnykh tekhnologii, 2021, vol. 18, no. 11 (209), pp. 13-26.

Статья поступила в редакцию 20.11.2023; одобрена после рецензирования 15.01.2024; принята к публикации 24.01.2024 The article was submitted 20.11.2023; approved after reviewing 15.01.2024; accepted for publication 24.01.2024

Vestnik of Astrakhan State Technical University. Series: Management, computer science and informatics. 2024. N. 1 ISSN2072-9502 (Print), ISSN 2224-9761 (Online)

Computer engineering and software

Информация об авторах I Information about the authors

Юрий Владимирович Дубенко - кандидат технических наук, доцент; доцент кафедры информатики и вычислительной техники; Кубанский государственный технологический университет; scorpioncool1@yandex.ru

Евгений Евгеньевич Дышкант - кандидат технических наук; доцент кафедры внутризаводского электрооборудования и автоматики; Армавирский механико-технологический институт (филиал) ФГБОУ ВО «Кубанский государственный технологический университет»; ed0802@yandex.ru

Yuri V. Dubenko - Candidate of Technical Sciences, Assistant Professor; Assistant Professor of the Department of Informatics and Computer Science; Kuban State Technological University; scorpioncool1@yandex.ru

Evgeny E. Dyshkant - Candidate of Technical Sciences; Assistant Professor of the Department of Internal Electrical Equipment and Automation; Armavir Institute of Mechanical and Technological (branch) Federal State Budgetary Educational Institution of Higher Education "Kuban State Technological University"; ed0802@yandex.ru

О u

b

сь

o

о Y

О

y

.

E

Александр Анатольевич Обозовский - преподаватель 11 кафедры; Краснодарское высшее военное орденов Жукова и Октябрьской Революции Краснознаменное училище имени генерала армии С. М. Штеменко; mr.bolduin@list.ru

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Alexander A. Obozovsky - Senior Lecturer of the 11th department; Krasnodar Higher Military awarded by the Orders of Zhukov and by the Orders of October Revolution and the Red Banner School named after the general of the Army S. M. Shtemenko; mr.bolduin@list.ru

era

a n

i Надоели баннеры? Вы всегда можете отключить рекламу.