УДК 621.8 ,- БО! 10.21685/2307-4205-2017-4-5
ЛОГИКО-МАТЕМАТИЧЕСКИЕ ПРИНЦИПЫ МУЛЬТИАГЕНТНОГО УПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫМИ МОБИЛЬНЫМИ ОБЪЕКТАМИ И СИСТЕМАМИ В ДИНАМИЧЕСКОЙ СРЕДЕ1
/
А. К. Гришко, А. В. Лысенко, И. И. Кочегаров
Введение
Интеллектуальные мобильные системы находят широкое применение в различных областях деятельности и относятся к технологиям двойного назначения. Это и различные робототехниче-ские комплексы, беспилотные летающие аппараты, батискафы и т.д. Перед интеллектуальными объектами, наделенными мобильностью ставятся задачи, которые не могут быть решены одним отдельно взятым из них. Кроме того, среда, в которой они выполняют свою задачу, динамично развивается, и принципы централизованного управления становятся неэффективными. Эффективное достижение общей цели невозможно без организации взаимодействия и формирования коалиций между исполнителями. В данной статье представлено краткое описание логико-математического аппарата управления группой интеллектуальных мобильных объектов (ИМО) и как на основании этого аппарата предлагается организовывать мультиагентное взаимодействие ИМО внутри группы, а также анализируются проблемы, с которыми сталкиваются проектировщики систем группового управления.
Постановка задачи группового управления интеллектуальными мобильными объектами
Для начала дадим формальное описание задачи управления группой ИМО как явных представителей наукоемких систем [1-4].
Пусть некоторая группа Я, состоящая из N ИМО Я, (, = 1, Ы), функционирует в некоторой среде Е. Состояние каждого ИМО в момент времени t описывается вектор-функцией
Г ^) = [ 0,1 ( I Г, ,2 ( * ^ )]Г .
Состояние группы ИМО задается вектором Я(7) = [г1 (7),г2(7),...,гЫ^)]Т . Состояние среды
вокруг,-го ИМО - е, в момент времени t описывается вектором е,. = Це^ (),е2, (),...,ет,(t)] .
Тогда состояние среды, в которой функционируют ИМО рассматриваемой группы в момент времени t, описывается вектором е(^ = |е1 (),е2^),...,еЫ.
Под переменными состояниями г, ()(, = 1, И) ИМО обычно понимают, например, координаты его положения в среде Е, количество энергоресурса, направление перемещения (курсовой угол), скорость и т.д. в момент времени t [5-7]. Под переменными состояниями е1, ^)(/ = 1,w)
среды вокруг ,-го ИМО понимают, например, координаты расположения объектов среды (препятствий, других ИМО и др.), а также другие переменные, характеризующие состояние этих объектов в момент времени t [8-10].
Каждый ИМО может выполнять действия, описываемые вектором
а, ^) = К, (), а2,, (), ат,, 0)]т .
1 Статья подготовлена в рамках реализации проекта «Адаптивная интеллектуальная система вибрационных испытаний бортовой радиоэлектронной аппаратуры ракетно-космической и авиационной техники нового поколения на основе многофункциональной цифровой генерации испытательных сигналов» (Соглашение № 17-79-10281 от 24.07.2017) при финансовой поддержке Российского научного фонда.
Действия ИМО могут: переместиться в заданную точку, захватить некоторый объект, передать какое-либо сообщение другому ИМО и др. Множество действий, которые может выполнять группа ИМО, есть объединение множеств действий отдельных ИМО группы:
К ЬН иИ2 и-М^.
Действия, выполняемые группой ИМО в момент времени V, могут быть описаны с помощью вектор-функции ас(V) = [а1 (7),а2(7),...,ам(V)]т .
На состояния ИМО и среды, а также на действия ИМО в конкретных ситуациях могут налагаться некоторые ограничения, в общем случае определяемые системами неравенств [11-13]:
0(Г1 (), Г2 (),..., гы (), е ()) < 0; (1)
^ (),а (),Г (),а2 (),-,гы (),аы(),е()) < 0. (2)
С учетом введенных выше обозначений задача группового управления заключается в определении таких оптимальных действий а. (V) для каждого ИМО, которые с учетом ограничений (1)
и (2) наиболее эффективно решают задачу, стоящую перед группой ИМО.
Обозначим через ф(а.. (V)) для каждого ИМО, определяющую эффективность действий /-го
ИМО в контексте решения общей задачи в момент времени V. Если группа состоит из однотипных ИМО и является однородной, то фитнес-функция имеет одинаковый вид для всех ИМО. Если же группа неоднородна, то необходимо определять фитнес-функцию для каждого типа ИМО в группе. Это значит, что характер фитнес-функции напрямую зависит от тех задач, которые решает отдельно взятый ИМО.
Тогда требуется определить такие действия а. (V) каждого ИМО, при которых достигается
экстремум общего функционала для всей группы:
N
Ф (0 = !ф(а. ()). (3)
¿=1
Зависимость задачи управления от условий среды функционирования
Данная задача решается по-разному в зависимости от характера среды Е , в которой функционирует группа ИМО, и той задачи, которая поставлена перед группой. Возможны следующие варианты:
1) среда Е статична, общая задача детерминирована;
2) среда Е статична, общая задача недетерминирована;
3) среда Е не статична, общая задача детерминирована;
4) среда Е не статична, общая задача недетерминирована.
Под детерминированностью задачи понимается наличие эффективных алгоритмов ее решения с помощью группы ИМО.
Первый случай (статичная среда, задача детерминирована) наиболее прост в плане реализации, но встречается реже других случаев. При нем последовательность действий а. (V) ИМО
определяется один раз при проектировании группы ИМО и остается неизменной во время функционирования группы. ИМО сами определяют свои действия в каждый момент времени V по заранее определенному алгоритму. К сожалению, такие случаи практически не встречаются на практике.
Второй случай (статичная среда, недетерминированная задача) значительно сложнее. В этом случае у нас нет эффективного алгоритма решения поставленной общей задачи. Поэтому ИМО в каждый момент времени V приходится самостоятельно принимать решение о своих дальнейших действиях в контексте общей задачи и других ИМО группы. При этом выбор действий должен осуществляться в двух (возможно, противоречащих друг другу) направлениях:
1) выбор действий наиболее эффективных в контексте решения общей задачи А;
2) выбор действий наиболее эффективных в контексте взаимодействия с другими роботами группы.
Необходимость оптимизации действий ИМО по этим двум направлениям легко проиллюстрировать на следующем примере. Пусть у нас есть набор из М объектов. Необходимо переместить эти объекты из точки Pi в точку Рт . В нашем распоряжении есть N ИМО, каждый из которых может единовременно взять всего п объектов.
В контексте эффективности решения общей задачи ИМО должны направиться в точку Pi и взять столько объектов, сколько они могут транспортировать за одну итерацию. Однако если все ИМО одновременно отправятся в точку Pi, то они будут мешать друг другу и общая эффективность группы снизится. Поэтому роботы должны предварительно договориться друг с другом о том, кто, как и в каком порядке будет забирать транспортируемые объекты из точки р.
Задача выбора действий, наиболее эффективных в контексте решения общей задачи, сводится к поиску экстремума фитнес-функции ИМО на множестве допустимых в момент времени V действий [14-16]. Следует понимать, что данная задача оптимизации является многокритериальной. При принятии решения ИМО должен учитывать такие факторы, как: свое текущее положение, положение других ИМО группы, положение препятствий, количество энергоресурса и многие другие факторы.
Помимо этого, множество допустимых действий далеко не всегда является конечным множеством. Например, при выборе действий ИМО должен принимать решение о том, в каком направлении двигаться (поворачиваться) и с какой скоростью. Поэтому имеет место задача многокритериальной оптимизации фитнес-функции по всем переменным состояния каждого ИМО.
Задача выбора действий, наиболее эффективных в контексте взаимодействия с другими ИМО группы, сводится к задаче о сделках. Задача о сделках сводится к нахождению такого соглашения между ИМО, при котором их общая выгода максимальна. Согласно теореме Нэша наиболее оптимальным соглашением является соглашение, при котором находится максимум функции [17, 18]:
у(х) = (и1 (х)- и1 (( ))(и2 (х)- и2 (()) ^ тах, (4)
где х - соглашение на множестве возможных соглашений; ui (х) - функция полезности .-го участника переговоров, определенная на множестве возможных соглашений; ( - точка разногласия (исход, который получат участники, если переговоры не дадут результата).
При этом каждый ИМО не должен забывать об эффективности всей группы (3). Это значит, что принятие решения сводится к оптимизации функций Ф() и ^(х).
Получается, что задача принятия решения в общем виде сводится к многокритериальной оптимизации фитнес-функции ф(а. (V)) отдельного ИМО и функционала Ф() всей группы.
Третий случай (не статичная среда, детерминированная задача) представляет собой симбиоз первого и второго случаев. У нас есть эффективный алгоритм решения поставленной общей задачи, однако мы не можем использовать его в чистом виде (как в первом случае), так как динамичная среда Е неизбежно вносит свои коррективы. Из-за этого последовательность действий, которая была эффективна некоторое время назад, теперь могла стать менее эффективной.
В условиях изменяющейся среды фитнес-функция отдельного ИМО приобретает вид
N
Ф(0 = (0,е(0). (5)
¿=1
Задача принятия решения (как и во втором случае) сводится к многокритериальной оптимизации фитнес-функции отдельного ИМО и функционала всей группы. Однако в отличие от второго случая здесь есть два важных момента:
1) детерминированность решаемой задачи значительно сужает область поиска при оптимизации;
2) нестатичность среды Е , в которой функционирует группа ИМО, накладывает серьезные ограничения на время принятия решений.
Решение должно быть принято до того, как среда Е изменится значительным образом. Это предъявляет серьезные требования к используемым алгоритмам оптимизации.
Четвертый случай (не статичная среда, недетерминированная задача) является самым сложным. Этот случай похож на третий случай (не статичная среда, детерминированная задача) с той лишь разницей, что у нас нет эффективного алгоритма решения поставленной перед группой ИМО общей задачи. Поэтому область поиска при оптимизации априори ничем не ограничивается. При этом требование к скорости принятия решений сохраняется.
Первоначальной задачей группы ИМО является ее самоорганизация, т.е. самостоятельное формирование оптимальной структуры и оптимального алгоритма ее функционирования в соответствии с поставленной задачей, некоторым критерием качества и внешними условиями. Задача самоорганизации в конечном счете также сводится к задаче многокритериальной оптимизации.
Из всего вышесказанного следует, что эффективность функционирования группы ИМО напрямую зависит от эффективности используемых алгоритмов оптимизации.
Задача многокритериальной оптимизации в управлении
Задача многокритериальной оптимизации в общем виде не имеет быстрых и эффективных алгоритмов ее точного решения. Мы можем использовать лишь приближенные алгоритмы, которые дают нам приближенные решения.
В настоящее время принято производить многокритериальную оптимизацию функций Ф ()
и ^(х) на основе множества Парето. Однако такой подход имеет ряд серьезных недостатков.
1) необходимость построения множества Парето. В условиях динамичной среды данное множество с течением времени постоянно изменяется в зависимости от состояния среды и состояния других ИМО группы. Поэтому необходимо постоянно обновлять множество Парето или, что еще хуже, перестраивать;
2) число возможных решений далеко не всегда конечно. Это приводит к невозможности построения множества Парето;
3) множество Парето может быть очень велико. Это приводит к необходимости его сужения, обычно на основе априорной информации об относительной важности критериев.
Однако полностью уйти от задачи многокритериальной оптимизации мы не можем. Единственный выход в таких условиях представляется в ограничении множеств действий, выполняемых отдельным ИМО. Такое ограничение приводит к легко вычисляемому функционалу Ф (), что значительно упрощает его оптимизацию. Такого же эффекта можно добиться и для функционала у(х), если ограничить число возможных сделок между ИМО.
Такие ограничения приводят как к упрощению самой задачи управления, так и к неизбежному сужению круга задач решаемых отдельным ИМО. Это приводит нас к «роевым» алгоритмам управления. Поведение ИМО в «рое» носит вероятностный характер. Такой подход позволяет находить вероятностные, приближенные решения оптимизации функции Ф() и ^(х) при сравнительно небольшой трудоемкости оптимизации.
Заключение
Задача группового управления неизбежно сводится к задаче многокритериальной оптимизации. Разработка эффективных алгоритмов оптимизации позволит сделать большой скачок вперед в плане группового управления ИМО. Сейчас же приходится умышленно ограничивать области поиска решений, ограничивая тем самым функциональные возможности самих ИМО. Исследования и научные наработки в этой области достаточно интересно и заманчиво распространить и на решение других научно-технических проблем. Так, например, разработчики сложных наукоемких систем (например, радиоэлектронных средств (РЭС) в процессе проектирования предлагают также рассматривать их отдельные элементы, узлы, подсистемы как интеллектуальные мобильные объекты ИМО. Их взаимодействие и учет взаимного влияния параметров в процессе динамического системного проектирования - задача не менее сложная и в то же время по своим подходам к их решению очень схожая.
Библиографический список
1. Маслобоев, А. В. Системный анализ проблемы информационной поддержки сетецентрического управления региональной безопасностью / А. В. Маслобоев, В. А. Путилов // Труды Кольского научного центра РАН. - 2015. - № 29. - С. 10-32.
2. Гришко, А. К. Анализ применения методов и положений теории статистических решений и теории векторного синтеза для задач структурно-параметрической оптимизации / А. К. Гришко // Надежность и качество сложных систем. - 2016. - № 4 (16). - С. 26-34. DOI: 10.21685/2307-4205-2016-4-4.
3. Generalized structural models of complex distributed objects / M. Yu. Mikheev, T. V. Zhashkova,
A. B. Shcherban, A. K. Grishko, I. M. Rybakov // 2016 IEEE East-West Design & Test Symposium (EWDTS). - Yerevan, Armenia, 2016. - P. 1-4. DOI: 10.1109/EWDTS.2016.7807742.
4. Гришко, А. К. Динамический анализ и синтез оптимальной системы управления радиоэлектронными средствами / А. К. Гришко // XXI век: итоги прошлого и проблемы настоящего плюс. - 2015. -№ 4 (26). - С. 141-147.
5. Маслобоев, А. В. Разработка и реализация механизмов управления информационной безопасностью мобильных агентов в распределенных мультиагентных информационных системах / А. В. Маслобоев,
B. А. Путилов // Вестник Мурманского государственного технического университета. - 2010. - Т. 13, № 4-2. - С. 1015-1032.
6. Гришко, А. К. Оптимальное управление параметрами системы радиоэлектронных средств на основе анализа динамики состояний в условиях конфликта / А. К. Гришко // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2016. - № 2 (38). - С. 102-111. DOI: 10.21685/20723059-2016-2-9.
7. Гришко, А. К. Анализ надежности сложной системы на основе динамики вероятности отказов подсистем и девиации параметров / А. К. Гришко // XXI век: итоги прошлого и проблемы настоящего плюс. -2016. - № 6 (34). - С. 116-121.
8. Маслобоев, А. В. Система информационно-аналитической поддержки сетецентрического управления региональной безопасностью / А. В. Маслобоев // Информационные ресурсы России. - 2016. -№ 3 (151). - С. 25-31.
9. Гришко, А. К. Алгоритм оптимального управления в сложных технических системах с учетом ограничений / А. К. Гришко // Модели, системы, сети в экономике, технике, природе и обществе. - 2017. -№ 1 (21). - C. 117-123
10. Гришко, А. К. Выбор оптимальной стратегии управления надежностью и риском на этапах жизненного цикла сложной системы / А. К. Гришко // Надежность и качество сложных систем. - 2017. - № 2 (18). -
C. 26-31. DOI: 10.21685/2307-4205-2017-2-4.
11. Гришко, А. К. Многокритериальная оптимизация структуры радиоэлектронной системы в условиях неопределенности / А. К. Гришко, И. И. Кочегаров, Н. В. Горячев // Международная конференция по мягким вычисления и измерениям. - 2017. - Т. 1. - С. 317-320.
12. Grishko, A. Adaptive Control of Functional Elements of Complex Radio Electronic Systems / A. Grishko, N. Goryachev, N. Yurkov // International Journal of Applied Engineering Research. - 2015. - Vol. 10, № 23. -P. 43842-43845.
13. Grishko, A. Parameter control of radio-electronic systems based of analysis of information conflict / A. Grishko // 2016 13 th International Scientific-Technical Conference on Actual Problems of Electronics Instrument Engineering (APEIE). - Novosibirsk, Russia, 2016. - Vol. 02. - P. 107-111. DOI: 10.1109/APEIE.2016.7806423.
14. Management of Structural Components Complex Electronic Systems on the Basis of Adaptive Model / A. Grishko, N. Goryachev, I. Kochegarov, S.Brostilov, N. Yurkov // 2016 13th International Conference on Modern Problems of Radio Engineering, Telecommunications, and Computer Science (TCSET). - Lviv-Slavsko, Ukraine, 2016. - P. 214-218. DOI: 10.1109/TCSET.2016.7452017.
15. Grishko, A. Dynamic Analysis and Optimization of Parameter Control in Radio Systems in Conditions of Interference / A. Grishko, N. Goryachev, I. Kochegarov, N. Yurkov // 2016 International Siberian Conference on Control and Communications (SIBCON). - Moscow, Russia, 2016. - P. 1-4. DOI: 10.1109/SIBCON.2016.7491674.
16. Grishko, A. Reliability Analysis of Complex Systems Based on the Probability Dynamics of Subsystem Failures and Deviation of Parameters / A. Grishko, N. Yurkov, N. Goryachev // 2017 14th International Conference The Experience of Designing and Application of CAD Systems in Microelectronics (CADSM). - Poly-ana, Svalyava, (Zakarpattya), Ukraine, 2017. - P. 179-182. DOI: 10.1109/CADSM.2017.7916109.
17. Grishko, A. K. Multi-criteria Optimization of the Structure of Radio-electronic System in Indeterminate Conditions / A. K. Grishko, I. I. Kochegarov, N. V. Goryachev // 2017 ХХ IEEE International Conference on Soft Computing and Measurements (SCM). - Saint Petersburg, Russia, 2017. - P. 210-212. DOI: 10.1109/SCM.2017.7970540.
18. Grishko, A. K. Multiple factor critera of controlling the network structure of radio monitoring in partial uncertainty conditions / A. K. Grishko, I. I. Kochegarov, V. A. Trusov // 2017 XX IEEE International Conference on Soft Computing and Measurements (SCM). - Saint Petersburg, Russia, 2017. - P. 207-209. DOI: 10.1109/SCM.2017.7970539.
Гришко Алексей Константинович
кандидат технических наук, доцент, кафедра конструирования и производства радиоаппаратуры, Пензенский государственный университет (440026, Россия, г. Пенза, ул. Красная, 40) E-mail: [email protected]
Лысенко Алексей Владимирович
кандидат технических наук, доцент, кафедра конструирования и производства радиоаппаратуры,
Пензенский государственный университет (440026, Россия, г. Пенза, ул. Красная, 40) E-mail: [email protected]
Кочегаров Игорь Иванович
кандидат технических наук, доцент, кафедра конструирования и производства радиоаппаратуры,
Пензенский государственный университет (440026, Россия, г. Пенза, ул. Красная, 40) E-mail: [email protected]
Аннотация. Актуальность и цели. Интеллектуальные системы находят широкое применение в различных областях деятельности и относятся к технологиям двойного назначения. Перед интеллектуальными объектами, наделенными мобильностью, ставятся задачи, которые не могут быть решены одним отдельно взятым из них. Кроме того, среда, в которой они выполняют свою задачу, динамично развивается, и принципы централизованного управления становятся неэффективными. Организация взаимодействия или формирование коалиций между исполнителями для достижения общей цели является актуальной задачей. Целью данной статьи является анализ проблем, с которыми сталкиваются проектировщики систем группового управления и разработка логико-математического аппарата описания процесса организации группового взаимодействия интеллектуальных объектов и систем внутри группы. Материалы и методы. Для оптимизации решения задачи управления предлагается метод мультиа-гентного управления. Результаты. Получен логико-математический аппарат, описывающий процесс организации группового взаимодействия интеллектуальных объектов и систем внутри группы, суть которого заключается в том, что каждый объект группы самостоятельно определяет свои очередные действия на достижение коллективной цели. Выводы. Разработанную методику предлагается применять для выбора оптимальной стратегии управления сложных пространственно-распределенных систем, когда децентрализация управления и формирование коалиций между агентами системы обеспечивает минимальные общие затраты материальных ресурсов и времени.
Ключевые слова: мультиагентное управление, интеллектуальный мобильный объект, система, оптимизация.
Grishko Aleksey Konstantinovich
candidate of technical sciences, associate professor,
sub-department of radio equipment design
and production,
Penza State University
(440026, 40 Krasnaya street, Penza, Russia)
Lysenko Aleksey Vladimirovich
candidate of technical sciences, associate professor,
sub-department of radio equipment design
and production,
Penza State University
(440026, 40 Krasnaya street, Penza, Russia)
Kochegarov Igor Ivanovich
candidate of technical sciences, associate professor,
sub-department of radio equipment design
and production,
Penza State University
(440026, 40 Krasnaya street, Penza, Russia)
Abstract. Background. Intelligent systems find wide application in various fields, and relate to dual-use technologies. Before intelligent objects, endowed with mobility and the challenges that cannot be solved by one of them. In addition, the environment in which they perform their task is dynamic and the principles of centralized control become ineffective. Organization of interaction or the formation of coalitions between workers to achieve a common goal is an important task. The purpose of this article is to analyze the problems faced by designers of systems for group management and development of logical-mathematical apparatus describing the process of group interaction. Materials and methods. For optimizing the solutions of control problems we propose a method of multi-agent control. Results. Obtained logical-mathematical apparatus describing the process of group interaction of intelligent objects and systems within the group, the essence of which is that each group object determines its next action to achieve collective goals. Conclusions. The developed methodology is proposed to apply to select the optimal strategy for the control of complex spatially distributed systems where decentralization of government, and the formation of coalitions between agents of the system provides a minimum total cost of material resources and time.
Key words: multi-agent control, intelligent mobile object, system, optimization.
УДК 621.8 Гришко, А. К.
Логико-математические принципы мультиагентного управления интеллектуальными мобильными объектами и системами в динамической среде / А. К. Гришко, А. В. Лысенко, И. И. Кочегаров // Надежность и качество сложных систем. - 2017. - № 4 (20). - С. 35-41. DOI 10.21685/2307-4205-2017-4-5.