Планирование действий смешанных робототехнических группировок в условиях «балансирования на грани»
В.В. Баранюк, Д.В. Миняйло, О.С. Смирнова
Аннотация - В статье рассматриваются вопросы стабилизации внутреннего состояния многоагентной системы за счет применения принципа гомеостатического управления. Вводится понятие «балансирование на грани» в смешанных робототехнических группировках, характеризующее состояние системы в неопределенных условиях и требующее ее стабилизации. Рассматривается планирование действий смешанных робототехнических группировок в условиях «балансирования на грани» на примере группы беспилотных летательных аппаратов, основными задачами которой является мониторинг местности при проведении поисковых мероприятий для координации действий наземных групп в условиях чрезвычайной ситуации.
Ключевые слова - смешанные робототехнические группировки; многоагентные системы; стабилизация состояния системы; гомеостатическая система управления; балансирование на грани.
В настоящее время беспилотные летательные аппараты (БПЛА) получили широкое распространение, как в гражданских, так и в военных целях. Благодаря новейшим достижениям в области электроники, вычислительной техники, средств связи и систем управления перспективы областей применения БПЛА заметно расширились: мониторинг территории для поиска очагов возгорания, картографирование местности, поиск людей и т.п. Меньшая стоимость производства и отсутствие риска для жизни пилота даёт БПЛА большие преимущества по сравнению с пилотируемыми летательными аппаратами. Реализация группового управления БПЛА существенно повышает эффективность выполнения поставленного им задания [1].
Статья получена 05.12.2016 г.
Исследование выполнено федеральным государственным бюджетным образовательным учреждением высшего образования «Московский технологический университет» (МИРЭА) за счет гранта Российского фонда фундаментальных исследований (проект № 16-29-04326).
К.т.н., с.н.с., В.В. Баранюк, МИРЭА (e-mail: [email protected]).
Д.В. Миняйло, МИРЭА (e-mail: [email protected]).
О.С. Смирнова, МИРЭА (e-mail: [email protected]).
Системы группового управления подразделяются на централизованные, имеющие единый центр управления и планирования, и на децентрализованные [2]. Децентрализованное управление предполагает отсутствие некоего командного центра, на котором производится основная масса вычислений. Как следствие, каждый агент такой системы является абсолютно самостоятельной сущностью, действующей на основании заложенной программы и поступающей информации от окружающей среды и соседних агентов. На практике децентрализованное управление реализуется следующим образом: аппараты с заранее заложенной в них программой и оснащённые всеми необходимыми сенсорами, датчиками и устройствами для осуществления связи друг с другом, запускаются в зону выполнения миссии. Во время миссии группа агентов действует автономно. Входной информацией для агента является информация, получаемая им со своих сенсоров и от агентов-соседей. Используя её, каждый агент при помощи заложенной программы принимает решения о дальнейших действиях.
Основным достоинством децентрализованной системы управления является отказоустойчивость - при выходе из строя одного или нескольких элементов система сохраняет работоспособность. При этом в рамках данной стратегии управления на каждого члена группировки возлагается большой функционал, во многом дублирующийся при решении задач оценки общей обстановки и планирования действий, необходимых для достижения общих целей [3].
Для решения задач децентрализованного управления многоагентной системой используются
интеллектуальные системы (ИС), способные принимать решения в постоянно меняющихся, нечетких, иногда противоречивых условиях. С точки зрения стратегий приспособления многоагентной системы к изменяющимся условиям можно выделить следующие основные направления:
1) стабилизацию внутреннего состояния каждого агента системы;
2) стабилизацию внутреннего состояния самой многоагентной системы, т.е. компенсирование совокупности внешних изменений по отношению к каждому агенту;
3) стабилизация системы по отношению к внешним изменениям.
Исходя из этого в рамках функционирования многоагентной системы на примере группы БПЛА необходимо учитывать, что:
- изменение внутреннего состояния каждого агента системы необходимо каким-либо образом компенсировать с целью сохранения себя и способности осуществлять свое предназначение (например, использование дополнительных источников питания при отказе основного);
- изменение внутреннего состояния самой многоагентной системы, т.е. внешних изменений по отношению к каждому агенту, необходимо компенсировать перераспределением задач (например, в случае повреждения одного агента необходимо перераспределить часть его функций на другого агента с целью снижения нагрузки на первого);
- изменение внешних условий необходимо компенсировать соответствующими согласованными действиями агентов (например, при возникновении погодных условий, при которых невозможен полет, приземлиться в безопасном месте, а после стабилизации летных условий продолжить выполнение задания).
При решении задачи стабилизации внутреннего состояния многоагентной системы особый интерес представляют гомеостатические системы управления, как особый вид адаптивного управления. В функциональном отношении такие системы отличаются способностью поддержания гомеостаза - состояния системы, при котором поддерживается динамическое постоянство важных функций и параметров системы при различных изменениях внутренней и внешней среды. Высокие возможности приспособления
гомеостатических систем достигаются за счет воплощенного в них управления противоречиями между целями агентов системы.
В таких системах управления жизненно важные параметры и функции объектов поддерживаются в допустимых пределах [4]. Использование противоречий для поддержания динамического постоянства процесса является особенностью гомеостатических систем. Т.е. основной задачей гомеостаза является не допустить гибель системы путем компенсирования «противовесами», объединенными между собой определенным образом. В частности, любое критическое отклонение показателей системы БПЛА делает невозможным дальнейшее функционирование по установленным критериям, так как возникает противоречие между существующими и необходимыми возможностями системы управления. Необходимо либо компенсировать отклонение, либо принять решение по самоликвидации. Противоречие в гомеостатических системах - это характеристика различия и противоположности целей подсистем, вызывающих конкурентную борьбу между ними с соответствующими негативными последствиями для этих подсистем («плата» за противоречие), и позитивного эффекта для всей системы (в виде повышения качества управления и устойчивости системы) [5]. В качестве примера можно привести: снижение высоты, которое по «базовым» условиям является опасным и крайне нежелательным,
может быть применено в целях сохранения БПЛА. Такая ситуация может считаться «неопределенной», поскольку у системы не было заранее прописанного алгоритма действия на подобный случай, но учитывая информацию, полученную от соседних объектов и собственное состояние, система может принять решение, которое будет противоречить некоторым прописанным действиям, в результате чего сохранит стабильность всей системы в целом [6].
Выделяют два механизма принятия решения в условиях неопределенности: рефлексивный и нерефлексивный. В информационных системах в основном используется рефлексивный способ. Он заключается в анализе изменений и выработке решений на коррекцию информационного пространства в системе. При таком способе управление осуществляется за счет дополнительного контура, т.е. дополнительной обратной рекурсивной цепи. В результате образуется структура с двумя и более иерархически связанными дополнительными адаптивными подсистемами. Добавление адаптивных подсистем к основному контуру управления позволяет распознавать все более сложные ситуации с изменяющимися свойствами. Для поддержания гомеостаза можно создать множество и множество множеств адаптивных подсистем вокруг основного контура управления. Тогда образуется устойчивая целостность, способная поддерживать постоянство процессов в объекте управления при существенных изменениях внешней среды. Система находится в состоянии равновесия, если при отсутствии воздействия на систему возмущающих факторов ошибка регулирования (разность между заданным и фактическим состоянием системы) стремится к нулю. Под устойчивостью будем понимать способность динамической системы возвращаться в равновесное состояние после окончания действия возмущения, нарушившего это равновесие [7].
Любая система может прийти к состоянию неопределенности и риска, т.е. вероятности потерь, возможности недостижения цели, отклонению от нормы, «балансированию на грани» между множеством противоречивых условий, ни одно из которых нельзя игнорировать.
Под термином «балансирование на грани» будем понимать сохранение состояния квазиустойчивости системы в определенный момент времени при отклонении состояния системы к тем или иным границам ее устойчивости, посредством принятия решений распределенным интеллектом в критической обстановке (поведение в ситуациях, требующих определения лидерства в группе, самопожертвования и т.д.).
Рассмотрим подход к планированию действий смешанных робототехнических группировок в условиях «балансирования на грани» на примере группы БПЛА, основными задачами которой является мониторинг местности, в том числе в труднодоступных районах, при проведении поисковых мероприятий для координации действий наземных групп в условиях чрезвычайной
ситуации, например, возгорание на большой территории.
Каждый БПЛА имеет свою зону видимости, радиус действия и спектр задач. Будем считать, что группа БПЛА состоит из 4 агентов, осуществляющих движение к целевой точке, не выходя за границы действия радиосвязи друг между другом (рисунок 1).
Рисунок 1 - Распределение БПЛА для выполнения поставленных задач
Для выполнения поставленной перед группой БПЛА цели, каждый агент должен выполнить свое задание. Рассмотрим ситуацию, когда задачи между агентами распределены следующим образом:
- агент №1 - сбор и передача информации для комплексной оценки опасностей и угроз дистанционного радиационного/химического мониторинга;
- агент №2 - сбор и передача общей фотоинформации и видеоинформации с большой высоты;
- агент №3 - сбор и передача общей фотоинформации и видеоинформации с большой высоты;
- агент №4 - сбор и передача детальной фотоинформации на низких высотах для поиска людей.
Рассмотрим ситуацию, когда состояние системы агента №4 приблизилось к границам устойчивости. Будем считать, что система отправила сообщение об отказе бортовой системы управления (вычислитель, доплеровский измеритель скорости и угла сноса, радиовысотомер малых высот) БПЛА, следствием чего будет невыполнение полетного задания (отклонение от заданного путевого угла, нарушение пространственно-временного прохождения промежуточных пунктов маршрута, отклонение от заданной высоты полета и т.п.) и посадка БПЛА в нерасчетном районе, что может привести к частичному (или полному) разрушению БПЛА. В такой ситуации агент должен самостоятельно принять решение о дальнейших действиях. Приоритетным фактором будет задача сохранения целостности оставшейся группы и достижения ими главной цели. В условиях «балансирования на грани», когда система еще может функционировать, но ее состояние крайне ненадежно и непредсказуемо, решение
может быть принято с помощью гомеостатических систем управления. Таким образом, возникает управляемое противоречие между целями управления контуров нижнего уровня (базовыми условиями которых является прохождение заданного маршрута, сбор и передача информации, возвращение на базу) для обеспечения сохранения системы и безопасности соседних агентов за счет экстренной посадки и перераспределения своих подзадач на других агентов группы.
При распределении задач важно сохранить радиус действия группы до потери агента, а также не допустить, чтобы дополнительные задачи помешали выполнению собственных задач агента.
Распределение происходит следующим образом (рисунок 2):
- сбор информации на низких высотах для поиска людей являлся приоритетным, агент №2 берет на себя задание вышедшего из строя агента №4 путем снижения высоты;
- задачу по выполнение съемки с большой высоты берет на себя агент №3.
Рисунок 2 - Перераспределение БПЛА
В результате такого перераспределения увеличится время на выполнение задачи агентом №3, поскольку увеличится обследуемая территория, но поставленная цель мониторинга местности при проведении поисковых мероприятий для координации действий наземных групп в условиях возгорания на большой территории будет достигнута.
Заключение
Применение принципов гомеостатических систем управления при децентрализованном управлении БПЛА позволяет в условиях «балансирования на грани» привести внутреннее состояние системы обратно в состояние равновесия за счет компенсирования появившихся изменений и управления противоречиями между целями агентов системы.
БИБЛИОГРАФИЯ
[1] Дьяченко Александр Александрович Задача формирования строя в группе БПЛА // Известия ЮФУ. Технические науки. 2012. №3. URL: http://cyberleninka.ru/article/n/zadacha-formirovaniya-stroya-v-gruppe-bpla (дата обращения: 25.11.2016).
[2] Сигов А.С., Нечаев В.В., Баранюк В.В., Смирнова О.С. Подходы к формированию единого информационно-управляющего поля смешанных робототехнических группировок. Международная научно-практическая конференция «Конвергентные когнитивно-информационные технологии». МГУ, 26.11.2016 г.
[3] Морозова Н. С. Децентрализованное управление движением строя роботов при динамически изменяющихся условиях // Искусственный интеллект и принятие решений. 2015. № 1. С. 65-74.
[4] Сазонов В.Ф. Гомеостатические константы // Кинезиолог, 2009-2016: URL: http://kineziolog.su/content/gomeostaticheskie-konstanty (дата обращения: 25.11.2016).
[5] Степанов А.М. Основы Медицинской Гомеостатики (Лекции по теории и практике биоинформационных коррекций). // Москва: 1993-222 с.
[6] Бутенко Дмитрий Валентинович, Албегов Евгений Владимирович, Терновой Илья Сергеевич Нейронная сеть на основе гомеостатических механизмов управления // ИВД. 2013. №3 (26). URL: http://cyberleninka.ru/article/n/neyronnaya-set-na-osnove-gomeostaticheskihmehamzmov-upravleniya (дата обращения: 25.11.2016).
[7] Курейчик В. В., Курейчик В. М. Использование принципов гомеостатики при управлении в интеллектуальных системах // Известия ЮФУ. Технические науки. 2002. №3. URL: http://cyberleninka.ru/article/n/ispolzovanie-printsipov-gomeostatiki-pri-upravlenii-v-intellektualnyh-sistemah (дата обращения: 25.11.2016).
Planning brinksmanship behavioral patterns for heterogeneous robot squads
V.V. Baranjuk, D.V. Minyailo, O.S. Smirnova
Abstract - This article discusses the achieving of equilibrium for multi-agent systems by application of homeostatic control principle. The term «brinksmanship» is introduced here in attribution to heterogeneous squads of robots, describing current system state under fuzzy conditions which require its stabilization. The sample case illustrates planning actions for heterogeneous squads of robots. The primary task of this squad is real-time emergency area surveillance and ground patrols coordination.
Keywords - heterogeneous robot squads; multi-agent systems; system state stabilization; homeostatic control system; brinksmanship.