Научная статья на тему 'МЕТОД ГРУППОВОГО УПРАВЛЕНИЯ В МУЛЬТИАГЕНТНЫХ РОБОТОТЕХНИЧЕСКИХ СИСТЕМАХ В УСЛОВИЯХ ВОЗДЕЙСТВИЯ ДЕСТАБИЛИЗИРУЮЩИХ ФАКТОРОВ'

МЕТОД ГРУППОВОГО УПРАВЛЕНИЯ В МУЛЬТИАГЕНТНЫХ РОБОТОТЕХНИЧЕСКИХ СИСТЕМАХ В УСЛОВИЯХ ВОЗДЕЙСТВИЯ ДЕСТАБИЛИЗИРУЮЩИХ ФАКТОРОВ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
134
36
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОПТИМИЗАЦИЯ / САМООРГАНИЗУЮЩИЕСЯ РОБОТОТЕХНИЧЕСКИЕ СИСТЕМЫ / УПРАВЛЕНИЕ РОЕМ / ПОВЕДЕНЧЕСКИЕ МОДЕЛИ / МОДЕЛЬ ДОВЕРИЯ / СРЕДНИЙ РИСК

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Зикратова Т. В.

Рассмотрена задача поиска оптимального решения в самоорганизующейся автономной групповой робототехнической системе в условиях неопределенности. Разработан метод оценки качества группового управления, основанный на статистико-вероятностном критерии принятия решения. Отличительной особенностью метода является использование метрик доверия. Данный подход позволяет выявлять и снижать влияние дестабилизирующих факторов в процессе информационного взаимодействия в автономной группе киберфизических объектов. Результаты могут быть использованы при разработке алгоритмов группового управления роев автономных робототехнических комплексов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Зикратова Т. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE METHOD OF GROUP CONTROL IN MULTI-AGENT ROBOTIC SYSTEMS UNDER THE INFLUENCE OF DESTABILIZING FACTORS

The problem of finding the optimal solution in a self-organizing autonomous group robotic system under conditions of uncertainty is considered. A method for assessing the quality of group management based on a statistical and probabilistic decision-making criterion under uncertainty conditions has been developed. A distinctive feature of the method is the use of trust metrics. This approach allows us to identify and reduce the influence of destabilizing factors in the process of information interaction in an autonomous group of cyber-physical objects. The results can be used in the development of algorithms for group control of swarms of autonomous robotic complexes.

Текст научной работы на тему «МЕТОД ГРУППОВОГО УПРАВЛЕНИЯ В МУЛЬТИАГЕНТНЫХ РОБОТОТЕХНИЧЕСКИХ СИСТЕМАХ В УСЛОВИЯХ ВОЗДЕЙСТВИЯ ДЕСТАБИЛИЗИРУЮЩИХ ФАКТОРОВ»

УДК 004.056 001:10.31854/1813-324Х-2021-7-3-92-100

Метод группового управления в мультиагентных робототехнических системах в условиях воздействия дестабилизирующих

факторов

Т.В. Зикратова1*

военный институт (Военно-морской политехнический) ВУНЦ ВМФ «Военно-морская академия», Санкт-Петербург, 196602, Российская Федерация *Адрес для переписки: ztv64@yandex.ru

Информация о статье

Поступила в редакцию 19.07.2021 Принята к публикации 06.08.2021

Ссылка для цитирования: Зикратова Т.В. Метод группового управления в мультиагентных робототехнических системах в условиях воздействия дестабилизирующих факторов // Труды учебных заведений связи. 2021. Т. 7. № 3. С. 92-100. Б01:10.31854/1813-324Х-2021-7-3-92-100

Аннотация: Рассмотрена задача поиска оптимального решения в самоорганизующейся автономной групповой робототехнической системе в условиях неопределенности. Разработан метод оценки качества группового управления, основанный на статистико-вероятностном критерии принятия решения. Отличительной особенностью метода является использование метрик доверия. Данный подход позволяет выявлять и снижать влияние дестабилизирующих факторов в процессе информационного взаимодействия в автономной группе киберфизических объектов. Результаты могут быть использованы при разработке алгоритмов группового управления роев автономных робототехнических комплексов.

Ключевые слова: оптимизация, самоорганизующиеся робототехнические системы, управление роем, поведенческие модели, модель доверия, средний риск.

Введение

К технологическим тенденциям, на которых базируется четвертая промышленная революция, относятся искусственный интеллект, большие данные и аналитика, «интернет вещей», виртуальная и дополненная реальность, системы компьютерного зрения, беспроводные технологии передачи данных и т. д. Перечисленные технологии легли в основу развития и внедрения в реальный сектор экономики киберфизических устройств (КФУ), которые представляют собой робототехнические комплексы (в том числе автономные и мобильные роботы), а также самоорганизующиеся группы (рои) роботов, использующие мультиагентные алгоритмы управления. Такие системы обычно включают в себя большое число относительно простых автономных и мобильных физических объектов, обладающих встроенными вычислительными и коммуникационными возможностями, и способны совместно решать сложные задачи, демонстрируя при этом интеллектуальное поведение [1, 2, 3]. Примерами использования таких систем могут служить группы (рои) беспилотных аппаратов наземного, воздушного и морского базирования, выполняю-

щие разведывательные, поисковые, ударные и другие функции.

Особенностью мультиагентных самоорганизующихся групп роботов является децентрализованное управление всем роем, когда процесс принятия решений на рациональное использование как всего роя, так и каждого его робота (агента) в отдельности, принимается непосредственно самими агентами путем информационного взаимодействия друг с другом и окружающей средой по единым критериям и алгоритмам [4, 5].

В тоже время следствием интеграции мобильных физических объектов в информационно-телекоммуникационные системы является появление ряда новых, не свойственных ранее автоматизированным системам управления, условий функционирования. Так, например, для роев самоорганизующихся мультиагентных робототехниче-ских систем (МРТС) специфика условий функционирования может быть обусловлена следующими факторами [6]:

- неполнотой и/или противоречивостью сведений у отдельных элементов МРТС о состоянии

других членов роя и внешней среды;

- разнообразием вариантов путей достижения цели самоорганизующимися системами, многообразием структур коллектива и отдельных КФУ, а также вариантов распределения ролей между ними;

- распределенностью группировки в пространстве, динамическим характером топологии сети и, как следствие, сложностью обеспечения устойчивой коммуникации как между агентами, так и с центром управления;

- расположением всего роя или отдельных КФУ вне пределов зоны контролируемой территории;

- непредсказуемой динамикой внешней природной и индустриальной среды, которая при ее изменении оказывает существенное влияние на реакцию системы;

- масштабируемостью системы в пространстве и времени;

- сложностью или невозможностью внешнего контроля за элементами МРТС;

- возрастанием требований к простоте и стоимости мобильных беспилотных аппаратов, энергосберегающим характеристикам;

- ограниченностью в вычислительных ресурсах и автономности;

- снижением эффективности существующих методов управления сложными техническими системами ввиду существенного роста участников информационного обмена, а также открытостью архитектуры некоторых видов МРТС.

При информационном взаимодействии агентов роя указанные особенности могут приводить к появлению дестабилизирующих факторов (ДФ), таких как сбои/ошибки в каналах передачи данных, затрудненные условия работы сенсорных устройств, неоптимальные условия наблюдения и др. Также в условиях влияния ДФ возможно возникновение нештатных ситуаций, которые приводят к снижению качества и эффективности применения сложных систем. Все это обуславливает актуальность решения задачи выработки оптимальных решений в условиях неопределенности.

Современные алгоритмы решения экстремальных задач в сложных технических системах базируются, как правило, на использовании искусственного интеллекта и нейротехнологий, основанных на знаниях предметной области. Однако из-за указанных выше особенностей функционирования автономных агентов и непредсказуемой динамики внешней среды использование традиционной парадигмы интеллектуальных систем, основанной на знаниях предметной области, не всегда позволяет эффективно решать задачи управления системами со сложным поведением [7].

В работе [1] в качестве теоретического фундамента предлагается использовать поведенческую парадигму искусственного интеллекта, основан-

ную не на знаниях, а на представлении поведенческих аспектов объектов и субъектов группового управления в сложных системах. Системы, в которых интеллект формируется как результат индивидуального поведения и взаимодействия множества физических сущностей (например, роботов) и/или виртуальных сущностей (программных агентов в динамической среде), получили название систем, основанных на поведении (BBS аббр. от англ. Behavior-Based Systems).

В настоящей статье, а также в работах [9, 10], для решения задачи оптимизации управления роем в условиях неопределенности предлагается применить поведенческую модель роя. Отличительной особенностью модели является использование метрики доверия агентов друг к другу в качестве характеристики поведения агентов в рое. Предлагаемьш метод группового управления основан на статистико-вероятностном подходе выработки алгоритма, обеспечивающего минимум среднего риска при выборе управляющего решения, исходя из условии оптимальности. В отличие от централизованных киберфизических и информационных систем оценка рисков осуществляется непосредственно в рое на основе формирования показателя доверия в процессе информационного взаимодействия.

Целью даннои работы является совершенствование поведенческих интеллектуальных механизмов поддержки принятия решения, позволяющих снизить влияние ДФ на эффективность роевых робототехнических систем.

Пример самоорганизации МРТС с децентрализованным управлением

Рассмотрим функционирование МРТС в варианте известной и распространенной итерационной процедуры оптимизации коллективного решения [4, 10]. Все члены роя получают исходные данные, необходимые для решения оптимизационной задачи по достижению цели, стоящей перед МРТС. Каждый робот коллектива (агент) Rj (j = 1,JV) обладает своим процессорным устройством (ПУ). Схема типовой структуры МРТС с децентрализованным управлением может иметь вид, показанный на рисунке 1.

В состав ПУ входят несколько функциональных устройств: ВБ - вычислительный блок; БПИ - блок передачи информации; БПрИ - блок приема информации; БОТС - блок определения текущего состояния; СБ - сенсорный блок. В составе сенсорного блока могут быть различные устройства, позволяющие осуществлять наблюдение за окружающей средой и роя в оптическом, инфракрасном или радиолокационном диапазонах волн.

Процессорное устройство робота связано с процессорными узлами других роботов каналами связи, по которым передается информация о текущих

состояниях 50 роботов и выбираемых ими в процессе выполнения итерационной процедуры действиях А1-+1, (к = 0, 1, 2, ...). Кроме того, ПУ получает информацию о состоянии б® своего робота, других агентов и окружающей среды Е0. На основании всей полученной информации ВБ у-го робота вычисляет значение приращения целевого функционала ДУ для всех возможных допустимых действий в текущей ситуации и в качестве нового действия А,-+1 выбирает то, для которого значение АУмаксимально.

Рис. 1. Децентрализованная система управления в МРТС

Fig. 1. The Decentralized Management System in the MRTS

Рассмотрим работу роя в процессе решения типовой задачи целераспределения. Пусть имеется M целей и коллектив из N роботов R¡ (j = 1,JV). На каждую цель должно быть выделено заранее известное число роботов, необходимое для обеспечения целей. После того, как каждую из целей выберет необходимое число роботов, задача считается выполненной. Оставшиеся роботы образуют резервный кластер.

Каждому агенту роя на старте алгоритма известны: свои координаты, координаты целей, координаты агентов роя, количество роботов, необходимое для обеспечения каждой цели.

Робот Rj оценивает эффективность своих действий по каждой цели и сообщает массив своих оценок Dj = [djlt dj2, ..., djM] остальным членам коллектива. В ПУ каждого робота формируется матрица D размерностью (N, M), элементами которой являются dji - оценки эффективности j-го робота для l-й цели.

После формирования матрицы D начинаются итерационные процедуры формирования коллективного плана, в результате которого для каждой цели обеспечивается максимум функционала:

N

У С = ^ djiUji ^ max, (1)

i.i=i

при следующих ограничениях:

N N

^Пц = 1, = <аХ' 0,

1=1 ]=1

_ (1, если ] — й робот выбрал I — ю цель, где п]1 |о, в противном случае.

Здесь ] = 1^, I = 1,Л, а п™* - необходимое количество роботов, которые должны выбрать /-ю цель.

Однако следует учесть, что под влиянием ДФ коммуникация между агентами может быть нарушена. В этом случае могут иметь место такие состояния агентов МРТС в отношении других агентов:

- состояние 51: «слышу и вижу объект»;

- состояние 52: «не слышу и вижу объект»;

- состояние 53: «слышу и не вижу объект»;

- состояние «не слышу и не вижу объект».

Пример 1.

Пусть МРТС имеет в своем составе шесть роботов N = 6), каждый из которых подключен к радиосети роя и оснащен GPS/ГЛОНАСС и лидаром. Задача роя состоит в распределении роботов по двум объектам: А и В. При этом на цель А необходимо назначить два аппарата, а на цель В - три (рисунок 2).

СО

Рис. 2. Рой беспилотников и цели перед выполнением задачи

Fig. 2. Swarm of Drones and Targets Before Completing the Task

Агенты могут общаться с теми членами группы, которые в данной ситуации доступны для радиосвязи (пунктирные линии). Некоторые агенты в зоне видимости наблюдают соседей посредством оптических сенсоров (стрелки). Тогда матрица состояний объектов будет иметь вид:

Ri R2 R3 R4 Rs Re

Ri S2 S4 Si S4 S2

R2 S2 Si S2 S4 Si

Ri S4 Si Si Si S4

R4 Si S2 Si Si S4

Rs S4 S4 Si Si S4

Re S2 Si S4 S4 S4

Выберем в качестве показателя эффективности В] = 1, dj2, ..., djM] расстояние от агента до цели. Чем меньше это расстояние, тем меньше

топлива и времени необходимо затратить рою для выполнения задачи, и тем большей эффективностью обладает агент. Тогда функционал (1) при тех же ограничениях можно записать в виде:

N

Ус = ^ djiUji ^ min. (2)

i.i=i

Предположим, что исходя из условий наблюдения и по результатам измерений расстояния от агента Rt до целей А и В имеют значения dt = = {34,46}. Эти данные робот Rt сообщает роботам R2, R4 и R6, которые находятся в зоне радиосвязи. Аналогично сообщение второго агента ( d2 = = {14,34}) принято роботами R3, R4 и R6, и так далее (таблица 1).

ТАБЛИЦА 1. Принятые при информационном обмене сообщения

TABLE 1. Messages received During the Information Exchange

После окончания обмена информацией, агенты запрашивают друг у друга недостающие сведения и заполняют матрицу оценок эффективности (дистанций) D в своих ОЗУ (таблица 2), которая перед первой итерационной процедурой будет иметь вид:

ТАБЛИЦА 2. Матрица оценок эффективностей в штатном режиме

TABLE 2. Matrix of Efficiency Estimates in the Normal Mode

А В

di 34 46

d2 14 34

ds 27 20

d4 31 24

d5 46 5

de 16 48

Тогда в результате выполнения итерационных процедур решение о назначении агентов на цель будет следующим (таблица 3). В итоге на цель А будут назначены агенты R2 и R6, на цель В - агенты R3, R4 и R5. Агент остается в резерве (рисунок 3).

Целевая функция при этом примет значение: Ус = (14 + 16) + (5 + 20 + 24) = 30 + 49 = 79.

Очевидно, что любое другое сочетание назначенных на цели агентов приведет к увеличению Yc.

А

В

Рис. 3. Результат решения задачи в штатном режиме

Fig. 3. The Result of Solving the Problem in the Normal Mode

ТАБЛИЦА 3. Результаты итерационной процедуры в штатном режиме

TABLE 3. The Results of the Iterative Procedure in the Normal Mode

Номер итерации Результат итерации Матрица D после итерации

А В

1 34 46

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Итерация 1 На цель А 3 27 20

назначен агент И2 4 31 24

5 46 5

6 16 48

А В

На цель А назначен агент И6. 1 34 46

Итерация 2 3 27 20

Цель А обеспечена. 4 31 24

5 46 5

В

Итерация 3 На цель В 1 46

назначен агент 3 20

4 24

На цель В В

Итерация 4 1 46

4 24

Итерация 5 На цель В В

назначен агент R4. 46

Цель В обеспечена. 1

Пример 2.

Рассмотрим задачу примера 1 при условии, что агент № 2 в результате воздействия тех или иных ДФ неверно оценил и передал в рой свою эффективность: расстояния до целей А и В оказались меньше, чем его реальное удаление от этих объектов (таблица 4).

ТАБЛИЦА 4. Матрица оценок эффективностей при воздействии ДФ

TABLE 4. Matrix of Efficiency Estimates Under the Influence of Destabilizing Factors

А В

d1 34 46

d2 4 3

d3 27 20

d4 31 24

ds 46 5

de 16 48

r2 R3 Rs Re

d1 + + + +

d2 + + + + +

d3 + + + +

d4 + + + + +

d5 + + +

d6 + + +

Тогда решение о назначении агентов на цель, выработанное в результате выполнения итерационных процедур, будет соответствовать данным в таблице 5.

На цель А будут назначены агенты R4 и R6, на цель В агенты R2, R3 и Rs. Агент R1 остается в резерве (рисунок 4).

ТАБЛИЦА 5. Результаты итерационной процедуры при воздействии ДФ

TABLE 5. Results of the Iterative Procedure Under the Influence of Destabilizing Factors

*

Рис. 4. Результат решения задачи в условиях воздействия ДФ

Fig. 4. The Result of Solving the Problem Under the Influence of Destabilizing Factors

Целевая функция, рассчитанная с учетом фиктивных данных от агента № 2, примет значение:

У? = (16 + 31) + (3 + 5 + 20) = 47 + 45 = 92.

Но фактически этот показатель будет равен:

YJ = (16 + 31) + (34 + 5 + 20) = 47 + 59 = 106.

Это означает, что присутствие в рое агента, передавшего ошибочные сведения, на 25 % ухудшило показатель Yc по сравнению со штатным режимом.

Модель доверия для МРТС

Исходя из приведенного описания алгоритма функционирования МРТС, под дестабилизирующим фактором, воздействующим на информационный обмен на k-й итерации, будем понимать влияние окружающей среды или внутренних сбоев на принятие управленческих решений роем. Данное влияние проявляется в отсутствии или снижении качества информационного взаимодействия агентов роя, в результате которого выбранное ими на k + 1 итерации новое действие Aj+1 не будет способствовать максимальному приращению целевого функционала AY МРТС в имеющихся условиях.

Соответственно возникает задача интеграции в МРТС так называемой «экспертной системы». По своей сути экспертная система является системой «интеллектуальной поддержки», обеспечивающей принятие правильного решения в условиях неопределенности, а также позволяющая снизить риски принятия неэффективных решений на основе анализа всеми агентами роя доступных им сведений о текущем местоположении каждого агента, передаваемой ими информации и принятых агентами решениях по улучшению целевого функционала.

Иначе говоря, экспертная система должна выявлять влияние ДФ на поведение системы и определять тех агентов, способность которых эффективно выполнить задачу в данных условиях обстановки вызывает сомнения. С этой целью предлагается разделить агентов роя по уровням доверия на основе анализа группового поведения.

Под доверием субъекта к объекту в данном случае будем понимать положительное отношение к агенту, основанное на уверенности в его эффективности и достоверности передаваемой им информации.

Формальное описание модели доверия представлено в работе [8]. Запишем его применительно к решаемой нами задаче в следующем виде: R = [R1, R2,..., ARn} - множество роботов-агентов в составе МРТС;

S = (s1, s2,..., sm} - множество состояний устройств коммуникации робота-субъекта; V = {False, True} - множество значений результатов проверки состояния агентов роя: False - ложь, Тгие - истина;

ST = RxSxV - множество ситуаций, в которых может находиться МРТС в текущей итерации; Щ ={ Wj1, W;2,... w;m} - вектор значений уровней доверия l-го робота-субъекта для роботов-объектов роя после завершения текущей итерации, I Ф т.

Номер итерации Результат итерации Матрица D после итерации

А В

1 34 46

Итерация На цель В 3 27 20

1 назначен агент И2 4 31 24

5 46 5

6 16 48

А В

На цель А 1 34 46

Итерация 2 3 27 20

4 31 24

5 46 5

А В

Итерация 3 На цель В 1 34 46

назначен агент 3 27 20

4 31 24

В В

1 46 46

Итерация 4 На цель В 4 24 24

назначен агент A

1 34

4 31

Итерация 5 На цель А A

назначен агент 1 34

Использование модели доверия состоит в следующем. После запуска итерационного цикла j-й робот (робот-субъект) (j = 1, N) вырабатывает действие Af+1 с максимальным приращением ДУ, и осуществляет доступ на запись информации о Ajj+1 в ПУ роботов-объектов. Остальные роботы-агенты, имеющие статус экспертов и получившие эту информацию, проверяют соответствие полученной информации реальной обстановке. Такая проверка осуществляется каждым агентом своими сенсорными устройствами (лидарами, радарами и т. д.).

Если i-й робот (робот-объект) при (i Ф j) в результате проверки на k + 1 шаге своими средствами переданного j-м роботом сообщения о своем состоянии Z° и Aj получил положительное заключение (результат проверки - True), он повышает уровень доверия для j-го робота w/ = w/ + Aw.

Если вследствие влияния ДФ (например, переданная роботом-субъектом информация противоречит данным наблюдения других агентов, или выбрано нерациональное действие) результат проверки оказался отрицательным (False), то уровень доверия робота-объекта для j-го робота-субъекта уменьшится: w/ = w/ — Aw.

Результаты оценки роботы сообщают всем членам роя для формирования коллективного показателя уровня доверия в отношении каждого из них. Таким образом, сформированный показатель доверия между агентами роя (назовем его «метрика доверия») может служить критерием для причисления агентов к тому или иному классу по степени их «полезности» в данной ситуации.

Например, в МРТС условно можно разделить агентов на 3 класса по уровням доверия:

- к первому классу отнесем агентов, находящихся в зоне устойчивой связи в радиосети и не подверженных воздействию ДФ;

- ко второму классу - агентов, периодически попадающих под воздействие ДФ (сбои систем беспилотного аппарата, слабое или непродолжительное воздействие природных или индустриальных помех и т. д.);

- к третьему классу - агентов, пребывающих под воздействием ДФ длительное время (отказы систем беспилотного аппарата, сильное и/или продолжительное воздействие природных или индустриальных помех и т. д.).

Становится очевидным следующее. Чтобы избежать ситуаций, описанных в примере № 2, рою при выполнении поставленной задачи целесообразно сначала использовать агентов с высоким уровнем доверия (агентов, отнесенных к 1-му классу), затем - со среднем уровнем доверия (2-й класс), а агентов с низким уровнем доверия (3-й класс) привлекать в последнюю очередь.

Таким образом, задача разбиения множества агентов роя по уровням доверия сводится к задаче

классификации объектов. Вероятности причисления агентов к тому или иному классу могут быть различны, а количество классов может быть произвольным. Учитывая данный факт, введем показатель, определяющий выбор роботом-агентом «своей» цели, исходя из условий оптимальности. Таким показателем может стать критерий, известный из теории принятия решений в условиях неопределенности - критерий минимума среднего риска [11]. Согласно этому критерию ситуация будет выглядеть следующим образом:

- если классификатор причисляет объект г к классу С(] = 1, Т, где Т - количество классов), когда на самом деле он принадлежит классу С^, то классификатор несет потери ;

- если для объекта вычислить математические ожидания таких потерь (условные средние риски):

т

ъ = ^1цР(н1 )р(£), (3)

1=1 1

где Р(Н1) - вероятность класса; р(г/Н^) - условная вероятность принадлежности атрибутов объекта г к классу СI, тогда объект будет причислен к тому классу, средний риск для которого минимальный.

Метод оптимизации управления роем в условиях ДФ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Пример 3.

Рассмотрим реализацию предложенного критерия применительно к нашему примеру (см. пример 2). Согласно выражению (3) средний риск отнесения объекта г к классу 1 будет равен:

¡1 = ЬцР(Н1)р (щ) + Ь21Р(Н2)Р (щ) + +Ьз1Р(Нз)р(-^.

Аналогично средний риск отнесения объекта к классу 2:

Г2 = Ь^РШр + Ь22Р(Н2)р (щ) + Ьз2Р(Нз)р(-^, и, соответственно, к классу 3:

Гз = Ь1зР(Н1)р (-¡^ + Ь2зР(Н2)р (щ) + +ЬззР(Нз)р(щ).

Пусть потери, которые несет классификатор при отнесении объекта класса / к классу С^, будут равны. Это означает, что классификация осуществлена правильно. В остальных случаях потери примем равными:

12 = Ь21 = Ь23 = Ь32 = 1,

L13 = L31 = 2.

Допустим, что априорные вероятности классов равны. Учитывая, что Y,iP(Hi) = 1, то Р(Н1) = = Р&2 ) = Р(Нз) = 0,33.

Эти данные записываются в ПЗУ агентов перед выполнением задачи в качестве констант. Кроме того, в ПЗУ необходимо записать априорные значения условных вероятностей принадлежности атрибутов объекта к классу, которые могут быть получены экспериментально на этапе предварительной подготовки. Предположим, что для объектов 1-го класса вероятность того, что результат проверки окажется истинным (True) равна 0,95, для 2-го класса - 0,5, и 3-го класса - 0,05. Тогда вероятность противоположного события (результат проверки - False) - соответственно, 0,05, 0,5 и 0,95. По аналогии зададим для каждого класса априорные вероятности того, что объект находится в зоне видимости лидара (атрибут «Вижу») и/или в радиосети (атрибут «Слышу») роя (таблица 6).

ТАБЛИЦА 6. Исходные данные в ПЗУ агента

TABLE. 6. Source Data in the Agent's ROM

Атрибуты Классы

i l 2 3

Вероятность класса P(Ht) 0,33 0,33 0,33

Атрибут «Слышу» P(rJHt) 0,9 0,S 0,l

Атрибут «Вижу» P(r2/Ht) 0,9 0,S 0,l

Атрибут «True» Р(Г3/Ъ) 0,9S 0,S 0,0S

Атрибут «Falce» Р(Г4/Н,) 0,0S 0,S 0,9S

ТАБЛИЦА 8. Наличие у агентов атрибута «Вижу»

TABLE 8. Whether Agents Have the "I See" Attribute

Видно R1 R2 R3 R4 Rs Re

R1 l 0 l 0 0

r2 l l 0 0 l

R3 0 l l l 0

R4 l 0 l l 0

Rs 0 0 l l 0

Re 0 l 0 0 0

ТАБЛИЦА 9. Наличие у агентов атрибута «True»

TABLE 9. Whether Agents Have the "True" Attribute

True R1 R2 R3 R4 Rs Re

R1 l

R2 l l l

R3 l l

R4 l l l

Rs l l

Re

ТАБЛИЦА 10. Наличие у агентов атрибута «False»

TABLE 10. Whether the Agents Have the "False" Attribute

False R1 R2 R3 R4 Rs Re

R1 l

R2

R3 l

R4

Rs

Re l

По результатам информационного обмена и проверки сообщений каждый агент формирует в оперативной памяти четыре хэш-таблицы. В двух таблицах содержатся результаты проверок сенсорными устройствами переданной информации, в двух других - сведения о наличии визуальной информации и информации, полученной по радиосвязи.

В нашем примере, когда агент R2 под влиянием ДФ передал неверную информацию, результаты проверок будут иметь вид, представленный в таблицах 7-10.

ТАБЛИЦА 7. Наличие у агентов атрибута «Слышу»

TABLE 7. The Presence of the "I Hear" Attribute in the Agents

Процедура классификации осуществляется агентами согласно выражению (3) путем вычисления среднего риска следующим образом:

- агент R1 находится в радиосвязи (атрибут «слышу») с тремя агентами R2, R4 и R6 (см. таблицу 7), двух из которых (Д2, Д4) он еще и «видит» (см. таблицу 8);

- согласно таблице 9 агент R1 дважды получил положительные результаты проверки (True от агентов R2 и Д4);

- никто из агентов не поставил агенту R1 оценку False (см. таблицу 10).

Предположим, что эти события являются независимыми, значение условной вероятности принадлежности атрибутов объекта R1 к классу С будет равно:

=^J'^CfC).

Аналогично подставляя значения атрибутов для разных классов из таблицы 6 получим:

р(г/Н1) = 0,93 * 0,92 * 0,952 * 0,5о = 0,533,

р(г/Н2) = 0,53 * 0,52 * 0,52 * 0,5° = 0,0078,

р(г/Н3) = 0,13 * 0,12 * 0,052 * 0,95° « 0.

Слышно R1 R2 R3 R4 Rs Re

R1 l 0 l 0 l

R2 l l l 0 l

R3 0 l l l 0

R4 l l l l 0

Rs 0 0 l l 0

Re l l 0 0 0

Тогда, с учетом потерь и вероятностей классов, средний риск отнесения объекта И1 к классу 1 будет равен:

Д = 0 * 0,33 * 0,533 + 1 * 0,33 * 0,0078 + 2 *

* 0,33 * 0 = 2,8-3.

Средний риск отнесения к классу 2:

2 = 1 * 0,33 * 0,533 + 0 * 0,33 * 0,0078 + 2 *

* 0,33 * 0 = 0,176.

Средний риск отнесения к классу 3:

[3 = 2 * 0,33 * 0,533 + 1 * 0,33 * 0,0078 + 0 *

* 0,33 * 0 = 0,354.

Таким образом, согласно критерию среднего риска агент И1 относится к классу 1, т. е. он обладает уровнем доверия, который подразумевает использование этого агента в решении поставленной задачи без ограничений. Аналогичные расчеты в отношении агента Я2 привели к следующим результатам: ^ = 1,6-3, ^ = 2-2, [3 = 1,9-3, что позволяет отнести его к классу 2. Проведенные расчеты в отношении остальных роботов показывают, что они могут быть отнесены к классу 1. Отсюда следует, что решение задачи целераспреде-ления будет осуществляться только между агентами 1-го класса. Опуская промежуточные итерационные вычисления, приведем конечный результат:

УЦ = цель А (34 + 16) + цель В(20 + 24 + 5) = 99.

На цель А назначаются агенты R1 и R6, на цель В агенты R3, R4 и R5. Очевидно, что данный результат хуже по сравнению с результатом, полученным в примере 1, т. к. не все агенты были в работоспособном состоянии. Но выявление и учет агента, передавшего ошибочные сведения, позволили на 7 % улучшить показатель Yc по сравнению с примером 2. Можно сделать вывод, что использование в составе роя экспертной системы позволяет выявить агентов, подверженных влиянию ДФ. Наряду с условиями наблюдения в качестве классификационных признаков для критерия минимума среднего риска использованы метрики доверия агентов друг к другу.

Заключение

Таким образом, поиск рационального варианта действий МРТС осуществляется на основе показателя уровня доверия, вырабатываемого членами коллектива в процессе их взаимодействия при достижении целевого функционала.

К достоинствам такого подхода можно отнести следующие факторы:

- отсутствие выделенного центра управления МРТС;

- учет реальной ситуации, возникающей в процессе выполнения роем задачи под воздействием дестабилизирующих факторов;

- простота реализации (все вычисления в процессорных устройствах агентов сводятся к выполнению тривиальных математических операций).

Список используемых источников

1. Городецкий В.И. Поведенческие модели кибер-физических систем и групповое управление: основные понятия // Известия ЮФУ. Технические науки. 2019. № 1(203). С. 144-162. D01:10.23683/2311-3103-2019-1-144-162

2. Brambilla M., Ferrante E., Birattari M., Dorigo M. Swarm robotics: a review from the swarm engineering perspective // Swarm Intelligence. 2013. Vol. 7. PP. 1-41. D0I:10.1007/s11721-012-0075-2

3. Кремлев А.С., Колюбин С.А., Вражевский С.А. Автономная мультиагентная система для решения задач мониторинга местности // Известия высших учебных заведений. Приборостроение. 2013. Т. 56. № 4. С. 61-65.

4. Каляев И.А., Гайдук А.Р., Капустян С.Г. Модели и алгоритмы коллективного управления в группах роботов. М.: ФИЗМАТЛИТ, 2009. 280 с.

5. Маслобоев А.В., Путилов В.А. Разработка и реализация механизмов управления информационной безопасностью мобильных агентов в распределенных мультиагентных информационных системах // Вестник МГТУ. 2010. Т. 13. № 4-2. С. 1015-1032.

6. Bell D.E., La Padula L.J. Secure Computer Systems: Unified Exposition and Multics Interpretation. MTR-2997 Rev. 1. Bedford: The MITRE Corporation, 1976. 134 p.

7. Городецкий В.И., Скобелев П.О. Многоагентные технологии для индустриальных приложений: реальность и перспектива // Труды СПИИРАН. 2017. № 6(55). C. 11-45. D0I:10.15622/sp.55.1

8. Зикратов И.А., Зикратова Т.В., Лебедев И.С., Гуртов А.В. Построение модели доверия и репутации к объектам мультиагентных робототехнических систем с децентрализованным управлением // Научно-технический вестник информационных технологий, механики и оптики. 2014. №. 3(91). С. 30-38.

9. Зикратов И. А., Викснин И. И., Зикратова Т. В. Мультиагентное планирование проезда перекрестка дорог беспилотными транспортными средствами // Научно-технический вестник информационных технологий, механики и оптики. 2016. Т. 16. № 5. С. 839-849. D0I:10.17586/2226-1494-2016-16-5-839-849

10. Юревич Е.И., Каляев И.А., Лохин В.М., Макаров И.М. и др. Интеллектуальные роботы: Учебное пособие для вузов. М.: Машиностроение, 2007. 360 с.

11. Jaynes E.T. Probability Theory: the Logic of Science. Cambridge: Cambridge University Press, 2007. 172 p.

* * *

The Method of Group Control in Multi-Agent Robotic Systems Under the Influence of Destabilizing Factors

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

T. Zikratova1

1 Military Institute (Naval Polytechnic) Military Educational and Scientific Center of the Navy "Naval Academy", St. Petersburg, 196602, Russian Federation

Article info

DOI:10.31854/1813-324X-2021-7-3-92-100 Received 19 th July 2021 Accepted 6th August 2021

For citation: Zikratova T. The Method of Group Control in Multi-Agent Robotic Systems Under the Influence of Destabilizing Factors. Proc. of Telecom. Universities. 2021;7(3):92-100. (in Russ.) D01:10.31854/I813-324X-2021-7-3-92-100

Abstract: The problem of finding the optimal solution in a self-organizing autonomous group robotic system under conditions of uncertainty is considered. A method for assessing the quality of group management based on a statistical and probabilistic decision-making criterion under uncertainty conditions has been developed. A distinctive feature of the method is the use of trust metrics. This approach allows us to identify and reduce the influence of destabilizing factors in the process of information interaction in an autonomous group of cyber-physical objects. The results can be used in the development of algorithms for group control of swarms of autonomous robotic complexes.

Keywords: optimization, self-organizing robotic systems, swarm management, behavioral models, trust model, average risk.

1. Gorodetsky V.I. Behavioral Model for Cyber-Physical System and Group Control: the Basic Concepts. IZVESTIYA SFedU. ENGINEERING SCIENCES. 2019;1(203):144-162. (in Russ.) D01:10.23683/2311-3103-2019-1-144-162

2. Brambilla M., Ferrante E., Birattari M., Dorigo M. Swarm robotics: a review from the swarm engineering perspective. Swarm Intelligence. 2013;7:1-41. DOI:10.1007/s11721-012-0075-2

3. Kremlev A.S., Kolyubin S.A., Vrazhevsky S.A. Autonomous Multi-Agent "Robot-Guide" System to Solve Area Monitoring Problems. Journal of Instrument Engineering (Izvestiya vysshikh uchebnykh zavedeniy. Priborostroenie). 2013;56(4):61-65. (in Russ.)

4. Kalyaev I.A., Gaiduk A.R., Kapustyan S.G. Collective Control Models and Algorithms in Groups of Robots. Moscow: FIZMATLIT Publ.; 2009. 280 p. (in Russ.)

5. Masloboev A.V., Putilov V.A. Development and Implementation of Mobile Agent Security Control Mechanisms in the Distributed Multi-Agent Information Systems. Vestnik of MSTU. 2010;13(4-2):1015-1032. (in Russ.)

6. Bell D.E., La Padula L.J. Secure Computer Systems: Unified Exposition and Multics Interpretation. MTR-2997 Rev. 1. Bedford: The MITRE Corporation; 1976. 134 p.

7. Gorodetsky V.I., Skobelev P.O. Industrial Applications of Multi-Agent Technology: Reality and Perspectives. SPIIRAS Proceedings. 2017;6(55):11-45. (in Russ.) D0I:10.15622/sp.55.1

8. Zikratov I.A., Zikratova T.V., Lebedev I.S., Gurtov A.V. Building a Model of Trust and Reputation for the Objects Of MultiAgent Robotic Systems with Decentralized Control. Scientific and Technical Journal of Information Technologies, Mechanics and Optics Scientific and Technical Journal of Information Technologies, Mechanics and Optics. 2014;3(91):30-38. (in Russ.)

9. Zikratov I.A., Viksnin I.I., Zikratova T.V. Multiagent Planning of Intersection Passage by Autonomous Vehicles. Scientific and Technical Journal of Information Technologies, Mechanics and Optics Scientific and Technical Journal of Information Technologies, Mechanics and Optics. 2016;16(5)839-849. (in Russ.) D0I:10.17586/2226-1494-2016-16-5-839-849

10. Yurevich E.I., Kalyaev I.A., Lokhin V.M., Makarov I.M., et al. Intellectual Robots: Textbook for Universities. Moscow: Mashinostroenie Publ.; 2007.360 p. (in Russ.)

11. Jaynes E.T. Probability Theory: the Logic of Science. Cambridge: Cambridge University Press, 2007. 172 p.

References

Сведения об авторе:

ЗИКРАТОВА Татьяна Викторовна

преподаватель кафедры «Информационные технологии» Военного института (военно-морского политехнического) ВУНЦ ВМФ «Военно-морская академия», ztv64@mail.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.