Иерархическое планирование действий разнородной группы автономных мобильных роботов

Бычков И. В.; Давыдов А. В.; Кензин М. Ю.; Нагул Н. В.

УДК 519.71 DOI 10.24412/2413-7383-2024-2-4-20

И.В. Бычков, А. В. Давыдов, М. Ю. Кензин, Н. В. Нагул Институт динамики систем и теории управления СО РАН им. В.М. Матросова Россия, 664033, г. Иркутск, ул. Лермонтова, 134

ИЕРАРХИЧЕСКОЕ ПЛАНИРОВАНИЕ ДЕЙСТВИЙ РАЗНОРОДНОЙ ГРУППЫ АВТОНОМНЫХ МОБИЛЬНЫХ РОБОТОВ

I. V. Bychkov, A. V. Davydov, M. Yu. Kenzin, N. V. Nagul 1Matrosov Institute for System Dynamics and Control Theory Russia, 664033, Irkutsk, Lermontov str., 134

HIERARCHICAL PLANNING OF ACTIONS

OF A HETEROGENEOUS GROUP OF AUTONOMOUS

MOBILE ROBOTS

I. В. Бичков, А. В. Давидов, М. Ю. КензЫ, Н. В. Нагул 11нститут динамки систем та теори управлшня СО РАН iм. В.М. Матросова Роая, 664033, м. 1ркутськ, вул. Лермонтова, 134

16РАРХ1ЧНЕ ПЛАНУВАННЯ Д1Й Р1ЗНОР1ДНО1 ГРУПИ АВТОНОМНИХ МОБ1ЛЬНИХ РОБОТ1В

В статье представлены общие черты многоуровневого подхода к планированию миссии групп автономных мобильных роботов. Подход совмещает в себе верхнеуровневое планирование на основе эволюционных алгоритмов и логический уровень, опирающийся на формализацию логических дискретно-событийных систем в оригинальном исчислении позитивно-образованных формул. Областью применения разрабатываемого подхода являются системы управления техническими системами, прежде всего, робототехническими комплексами. Ключевые слова: позитивно-образованная формула,

автоматическое доказательство теорем, прувер, дискретно-событийная система, задача планирования рабочих смен, эволюционные алгоритмы, эвристики

The article presents the general features of a multi-level approach to mission planning for groups of autonomous mobile robots. The approach combines top-level planning based on evolutionary algorithms and a logical level based on the formalization of logical discrete-event systems in the original calculus of positively formed formulas. The area of application of the developed approach is control systems for technical systems, primarily robotic complexes.

Key words: positively-constructed formula, automatic theorem proving, prover, discrete event system, work shift scheduling problem, evolutionary algorithms, heuristics.

У статп наведено загальн риси багаторiвневого пщходу до планування м1сп груп автономних мобтьних робо^в. Пщхщ поеднуе в собi верхньорiвневе планування на основi еволюцшних алгоритмiв та лопчний рiвень, що спираеться на формалiзацiю лопчних дискретно-подшних систем в оригшальному обчисленш позитивно-освiчених формул. Областю застосування пщходу, що розробляеться, е системи управлшня техшчними системами, насамперед, робото-техычними комплексами.

Ключовi слова: позитивно-утворена формула, автоматичний доказ теорем, прувер, дискретно-под1ева система, задача планування робочих зм1н, еволюцмш алгоритми, евристики

Введение

Технологический скачок последних десятилетий в области робототехники стимулировал новые тенденции в развитии автономных мобильных систем, крупнейшей из которых является объединение нескольких, зачастую разнородных транспортных средств для коллективного выполнения общей задачи. Применение группы автономных мобильных роботов (АМР) требует решения ряда новых комплексных задач, так как качество работы группы в динамичной среде в большей степени зависит от эффективности схем внутригруппового взаимодействия, чем от надежности отдельных членов команды. В работе предлагается иерархический подход к организации системы динамического управления разнородной группой АМР, нацеленный на решение некоторых проблем и задач групповой координации.

В общем случае миссия группы АМР заключается в том, чтобы роботы выполнили некоторый набор заданий в пределах обозначенной области в соответствии с текущими эксплуатационными требованиями [1]. Эта проблема распределения задач и ресурсов в ее простейшей постановке может быть математически сформулирована в терминах задачи о назначениях, а в более общем случае - задачи маршрутизации транспорта. Как и любая модель реального мира, такая постановка с достаточной степенью детализации будет включать сложный набор взаимосвязанных ограничений различной природы, что делает практически невозможным ее решение в явном виде и за разумное время [2]. Это приводит к необходимости применения иерархического подхода, когда ряд ограничений выносится на более высокий уровень, чтобы обеспечить их априорное удовлетворение ценой некоторых потерь в общей эффективности конечного решения [3].

Обзор робототехнической литературы [4] показывает, что в качестве общегрупповых ограничений, работа с которыми требует особого подхода, могут быть выделены коммуникационные [5-7] и топливные (энергетические) [8], [9] ограничения. Несмотря на огромное количество различных подходов к решению каждого из этих двух ограничений, в литературе почти не встречается работ, в которой они использовались бы одновременно и применялись к функционально гетерогенной группе роботов. Подход, способный решать эту задачу, должен сочетать в себе ключевые особенности обеих областей, чтобы гибко и интеллектуально управлять событиями, связанными с энергетическими и коммуникационными потребностями группы. В этом смысле управление временем становится фундаментальным требованием для успешного выполнения сложной робототехнической миссии [10].

Для символьной обработки данных, поступающих в систему или генерируемых ею, и формирования на их основе событий, вызывающих смену режимов функционирования группы АМР, предлагается использовать логический вывод в исчислении позитивно-образованных формул (ПОФ). Автоматическое доказательство теорем (АДТ) является активно развивающейся областью искусственного интеллекта, основанной на методах математической логики, что делает его наиболее формализованным направлением дедуктивного построения и автоматизированного вывода. Современной областью применения АДТ, среди прочего, является робототехника, где оно помогает в основном при планировании [11] и принятии решений [12]. Например, в [13] для планирования и управления роем в робототехнике используется язык PDDL, основанный на классическом ATP в стиле STRIPS.

Исчисление ПОФ является полным методом для АДТ с функциональными символами [14-16], и его основные приложения лежат в области управления динамическими и интеллектуальными системами, включая ориентацию телескопов [17],

управление лифтами, преследование движущихся целей [18], достижимость целевого множества [19] и др. Благодаря своим особенностям, исчисление ПОФ позволяет совмещать автоматический поиск логических выводов со специальными эвристиками, настраиваемыми для решаемой задачи. В задачах группового управления роботами с помощью метода опровержения ПОФ, например, могут исследоваться свойства безопасности и живучести в рамках автоматической проверки допустимости стратегии переключения режимов функционирования группы.

В статье будут предложен эволюционный подход к высокоуровневому планированию динамических миссий на основе событий и возможное применение АДТ в исчислении ПОФ на разных уровнях управления группой АМР при выполнении поставленных задач.

Схема групповой координации

Основная идея работы в контексте планирования групповых миссий -предложить универсальную, многофункциональную, гибкую и масштабируемую структуру системы управления, которая скорее будет опираться на ряд жестких ограничений и требований, свойственных большинству долгосрочных динамических миссий, чем на какие-либо конкретные задачи и типы действующих роботов.

Природа этих ограничений и формирует основную концепцию подхода: разбить миссию на последовательность рабочих периодов, на каждом из которых группа будет функционировать в неизменном составе, а все перестановки в составе будут осуществляться во время заранее запланированных сборов группы в конце каждого рабочего периода (рис. 1). Проведение таких сборов с требуемой периодичностью обеспечит регулярную коммуникацию внутри группы, а вставка дополнительных внеочередных сборов позволит своевременно отправлять нуждающихся роботов на подзарядку и принимать их обратно.

Г1ериод#1 Псрнод#2 Период#3 Период #4 Период#5 Период #6 Период #7 ]]ериод#8

Начало МИССИИ - t

Робот #1 на подзарядке РоЙот #1 на

Робот #2 на подзарядке |

Робот #3 на подзарядке

□ - групповое рандеву, проводимое с целью ротации состава группы для осуществления подзарядок

Q — групповое рандеву, проводимое исключительно с целью поддержания регулярности сеансов связи

Рисунок 1 - Схема организации работы группы на основе рабочих периодов

и групповых сборов

Применение такого подхода позволит разгрузить основной планировщик действий группы, который обычно отвечает за вычислительно трудоемкие задачи распределения заданий и составления маршрутов, передав некоторые из его наиболее жестких ограничений на решение задачи планирования на более высоком уровне управления.

В качестве еще одного важного уровня иерархической системы группового управления должен быть выделен обработчик событий, отвечающий за переключение режимов функционирования АМР на основе возникновения как запланированных, так и непрогнозируемых событий. Эффективная реализация такого логического обработчика событий позволит группе корректно реагировать на любые динамические изменения состояния как внешней среды, так и самих членов группы. Таким

образом, предлагаемый иерархический подход к организации групповой работы и соответствующая ей система группового управления могут быть представлены в виде следующей блок-схемы (рис. 2):

Рисунок 2 - Схема системы группового управления АМР в динамических условиях

Планировщик рабочих периодов

Задача планировщика на верхнем уровне - обеспечить эффективную ротацию группы на протяжении всей миссии в динамических условиях и с учетом требований к регулярности связи путем построения эффективного расписания рабочих периодов. Для построения такого расписания планировщик должен распределить во времени последовательность групповых сборов и поставить каждой из них в соответствие событие, связанное с подзарядкой АМР или проведением сеанса связи. При этом необходимо учитывать количество доступных систем подзарядки и их мощность.

Пусть для выполнения миссии длительностью Т (горизонт планирования) имеется группа из п АМР, различающихся по крейсерской скорости vb емкости батарей Ь, и набору установленного оборудования (манипуляторы, датчики и др.)

(«■^j Е {ОД},j = l,...rl, i = l,...,n. Подзарядка батарей AMP производится со

скоростью c на зарядной станции, оснащенной w зарядными доками и расположенной на расстоянии d от области группового сбора. Скорость зарядки c означает, что АМР заряжается в с раз быстрее, чем разряжается.

Обозначим за Qt = (ttlJ ti2) период подзарядки /-го робота как временной отрезок между групповым сбором, на которой АМР покидает группу для пополнения запаса энергии, и сбором, когда он возвращается обратно в группу. Аналогичным образом, интервал между двумя последовательными периодами подзарядки АМР будем называть его рабочей сменой. Ставится задача поиска наиболее эффективного сочетания допустимых рабочих смен для всей группы действующих роботов на период Т:

* = {Qii-Qv.....QzvQn.....Q^Qnz.....Qwl

Каждый раз, когда какой-либо робот должен покинуть группу для подзарядки или вернуться в нее после, он инициирует проведение группового сбора. Проведение сбора, в свою очередь, означает переход на следующий рабочий период, где группа будет выполнять задачи в неизменном составе. Требование к периодичности связи накладывает дополнительное ограничение P на максимальную длительность каждого рабочего периода. Для удовлетворения этого ограничения без инициации избыточно частых перезарядок АМР, допускается проведение сборов только с целью коммуникационного обмена без изменения состава действующей группы (рис. 1).

Расписание рабочих смен группы S считается допустимым, если оно обеспечивает своевременную подзарядку всех роботов с учетом количества доступных док-станций:

Vt 6 [0,Г] \{Q Е 5: t Ё Q}\ < w, i = 1, ...,п,

Б

t Ё Q

■ = С

Здесь последние два уравнения определяют динамику изменения уровня заряда аккумуляторов (£) каждого робота во времени (рис. 3). В работе применяется абстрактная линейная модель энергопотребления, но в дальнейшем планируется переход к применению более продвинутых и реалистичных моделей [20].

Рисунок 3 - Расписание периодов подзарядки группы из четырех разнородных АМР

и соответствующий ему график прогноза энергетических ресурсов каждого робота

Эффективность расписания S определяется как совокупная эффективность работы всех подгрупп АМР, действующих на различных рабочих периодах. В отрыве от конкретной задачи, решаемой на среднем уровне, эффективность подгруппы может быть оценена через потенциальную работоспособность подгруппы, определяемую ее количественным и качественным составом. При условии, что максимальная эффективность достигается, когда в действующую группу входят все n роботов (ни один АМР не находится на подзарядке), задача заключается в минимизации временных и ресурсных потерь, вызванных как периодическими уходами АМР из группы на подзарядку, так и необходимостью регулярных групповых сборов, поскольку их проведение также отвлекает всех роботов от выполнения текущих задач.

Таким образом, групповое расписание должно отвечать следующему перечню критериев, где первый является критерием допустимости расписания, а остальные три - критериями его эффективности:

1. Своевременная подзарядка для всех роботов в группе;

2. Минимизация количество недоступных АМР на каждом рабочем периоде;

3. Запрет на одновременную подзарядку всех носителей каждого вида бортового оборудования (если их больше одного);

4. Минимальное количество необязательных (излишних) групповых сборов.

Рассматриваемая задача по своей сути является оригинальной вариацией известного класса задач комбинаторной оптимизации, объединяющего в себе множество родственных постановок, связанных с планированием расписания смен рабочего персонала (shift-, workforce-, employee-, personnel-, staff-scheduling) [21]. Суть задач этого класса состоит в том, чтобы выбрать набор сотрудников из имеющегося списка кандидатов и составить для каждого из них график смен таким образом, чтобы в пределах горизонта планирования покрыть потребности в рабочей силе с наименьшими затратами. При этом должны быть соблюдены требования к графику работы каждого сотрудника, такие как продолжительность смен, выходные дни и др. В этих задачах требования к закрытию всех потребностей обычно являются жесткими (обязательными к исполнению), а ограничения на формирование рабочей нагрузки сотрудников - мягкими, которые могут быть нарушены [22].

Сформулированная выше задача планирования может быть рассмотрена как обратная задача планирования рабочих смен, в которой состав сотрудников уже сформирован, ограничения на их рабочую нагрузку являются жесткими, а в качестве критерия выступает качество конечного покрытия потребностей (максимальная работоспособность действующей группы в каждый момент времени). Среди других особенностей предложенной модели - многопрофильные работники и повышенные требования к гибкости расписания, обусловленные динамическим характером задачи, что ведет к отказу от необходимости формирования решений в циклическом виде [23].

Алгоритм планирования рабочих периодов

Несмотря на большое разнообразие существующих подходов к задачам составления расписания смен в различных вариациях, эволюционные алгоритмы (ЭА) на протяжении уже многих лет остаются одним из наиболее популярных выборов. ЭА сочетают в себе высокую гибкость и масштабируемость с широкими возможностями по гибридизации оптимизационной схемы с другими проблемно-ориентированными процедурами и эвристиками [24]. Структура ЭА допускает раздельное управление исследованием и разработкой пространства поиска, чтобы фокусировать поиск на границе области допустимости, где для задач с плохой окрестностной структурой зачастую находятся наиболее качественные решения [25]. Естественный параллелизм ЭА позволяет ускорять формирование планов за счет распределения вычислений внутри группы взаимодействующих АМР, а популяция имеющихся кандидатов в решения выступает в качестве своеобразной структуры памяти, способствующей более быстрой корректировке планов в случае неожиданного изменения условий [26].

Исходя из вышесказанного, для решения поставленной задачи предлагается проблемно-ориентированная модификация эволюционных алгоритмов, обогащенная несколькими специализированными эвристиками и операторами улучшения.

В качестве хромосомы здесь выступает векторное представление решения в

виде расписания S, а целевая штрафная функция имеет следующий вид:

,

где V (5) определяет степень нарушения ограничения на допустимость решения, a f(S') оценивает отклонение работоспособности группы от максимально возможной. Функция

оценивает общую нехватку энергии АМР на реализацию расписания S по принципу «time-warp», разработанному для задач маршрутизации с временными окнами [27]. Цель использования этой функции - исследовать более широкое разнообразие структурно различных решений, разрешив добавлять в популяцию невыполнимые расписания.

Функция f(S), в свою очередь, также является линейной сверткой из двух штрафных функций /(5) = ¡i - fE (5) -+- fa (5), где первая функция оценивает потери коллективной работоспособности в связи с уходом АМР на перезарядку, а вторая -потери, связанные с проведением групповых сборов (jt - весовой коэффициент).

Большинство современных метаэвристических алгоритмов используют специально разработанные конструктивные эвристики для создания качественной начальной популяции решений [28]. Общее качество популяции определяется через три ее свойства: общее разнообразие, большой охват пространства поиска, наличие нескольких допустимых решений. Поэтому для первого шага ЭА были разработаны три различных конструктивных эвристики (рис. 4), одновременное использование которых позволяет алгоритму хорошо работать при различных комбинациях условий и ограничений задачи:

1. Первая эвристика (рис. 4a) генерирует непрерывную последовательность рабочих периодов, на каждом из которых группу покидает ровно один случайный AMP. Конечные расписания здесь зачастую являются недопустимыми, но всегда дают низкое значение штрафной функции fE (5);

2. Вторая эвристика (рис. 4Ь) гарантирует формирование допустимых решений (К (5) = 0) за счет следования двум правилам: ни одна рабочая смена АМР не длится дольше, чем емкость батареи робота; продолжительность периодов подзарядки АМР всегда превышает время его полной зарядки. Ограничение на количество зарядных доков в данном случае не учитывается.

3. Последняя эвристика (рис. 4c) направлена на генерацию разнообразных расписаний с малым количеством рабочих периодов (низким значением f: \S j). Для этого сначала формируется последовательность максимально продолжительных рабочих периодов с учетом ограничения P, которые затем заполняются рабочими сменами АМР с учетом их энергетической потребности и количество док-станций w.

- Период подзарядки AMP |- Групповой сбор Рисунок 4 - Пример трех начальных решений различного типа для группы из 4 АМР

Для воспроизводства новых решений используется стандартная трехступенчатая схема отбора, скрещивания и мутации. Для отбора используется классическая схема дуэльного турнира, дающая больше шансов получить потомство разным по качеству решениям (особенно недопустимым).

Для получения решений-потомков применяется один из двух конкурирующих операторов скрещивания: классический одноточечный кроссовер либо однородное (uniform) скрещивание, для каждого АМР выбирающее расписание целиком от одного из решений-родителей. Затем применяется многорежимная мутация, состоящая из шести различных операторов, незначительно изменяющих текущее расписание.

В случае, если эволюционный процесс замедляется, полученные решения проходят через процедуру локального поиска по чередующимся окрестностям (VNS). Для этого были разработаны четыре оператора, нацеленных на устранение тех проблемных ситуаций, которые трудно исправить с помощью скрещивания и мутации.

Конечные решения-потомки подвергаются процедуре по восстановлению допустимости путем вставки пустых (без изменения состава группы) групповых сборов в середину тех рабочих периодов, длительностью которых превышает P.

Для формирования нового поколения решений применяется правило элитизма и модель островов (параллельных популяций). Процедура устранения решений-клонов используется дополнительно для поддержания разнообразия популяции.

Вычислительные эксперименты

Разработанная модель задачи планирования и алгоритм для ее решения были программно реализованы на языке C++ в системе моделирования «AUV Multiobjective Mission Planner» для проведения серии вычислительных экспериментов. С этой целью были разработаны два набора тестовых примеров: первый набор «test-A» построен вручную таким образом, чтобы априори знать глобальный оптимум, а набор «test-B» состоит из случайно сгенерированных комплексных задач большой размерности.

Для построения набора «test-A» был использован стандартный подход поиска циклического решения. Согласно этому подходу, строится кратчайший оптимальный подцикл подзарядки для всех АМР, который затем повторяется для заполнения всего расписания [29]. Рисунок 5 наглядно иллюстрирует типовой пример из «test-А», где п = 4, w = 1, с = п — 1 =3, все АМР функционально идентичны. Очевидное оптимальное решение здесь основано на цикле (рис. 5a). Несмотря на кажущуюся простоту этого решения и множество глобальных оптимумов (порядок подзарядки может меняться), его практически невозможно найти подходами, основанными на исследовании пространства поиска, в следствие плохой окрестностной структуры, когда одни хорошие решения не находятся в окрестности с других. Другими словами, такие циклические решения являются слишком жесткими, так как любое самое незначительное его изменение сразу приводит к потере свойства допустимости [23]. Это означает, что вероятность получения таких решений путем применения генетических операторов или процедур локального поиска к другим допустимым решениям крайне мала. При этом стоит учитывать, что такие циклические решения могут быть легко построены только для самых простых примеров, а задача их генерации в общем случае, особенно для больших разнородных групп агентов, является открытой задачей [22].

Рисунок 5 - Сравнение оптимального и приближенного решения тестового примера

Эволюционный алгоритм в таком случае в первую очередь начинает искать допустимые решения, а затем стремится повысить их эффективность (рис. 5b), по возможности уменьшая количество одновременных подзарядок нескольких АМР, а также минимизируя количество групповых сборов. Более короткие рабочие периоды в этом случае делают решение более гибким, позволяя осуществлять оптимизацию расписаний путем изменения длительности рабочих периодов и изменения их порядка.

На задачах из набора «test-B» подход тестировался на скорость и способность строить качественные решения в целом для задач большой размерности (п е [6,30], . -= - требующих планирования до 50 рабочих периодов. Здесь алгоритм продемонстрировал хорошую масштабируемость и способность поддерживать общее количество смен при увеличении размера флота и усложнении ограничений. Он способен генерировать эффективные расписания разнородной группы из нескольких десятков АМР за несколько минут фоновых вычислений. При необходимости осуществления долгосрочного планирования для больших разнородных групп целесообразно ограничивать горизонт планирования некоторым среднесрочным окном, которое будет смещается по мере выполнения миссии, чтобы избежать перегрузки вычислений.

Б

Логический уровень системы управления

Уровень обработчика событий, отвечающий за переключение режимов функционирования АМР на основе возникающих событий, может быть реализован на основе одного из существующих формализмов логических дискретно-событийных систем (ДСС) [30]. Самыми известными из таких формализмов являются конечный автомат, а также близкая к нему по своей сути машина конечных состояний. Логическая ДСС в этом случае рассматривается как пятерка Q — S, qQrQm), где Q -множество состояний <7; Z - множество событий; S: Z X Q -*■ Q - функция переходов; qQ 6 Q - начальное состояние; Qm (- Q - множество выделенных (маркированных) состояний. Множество Qm маркированных состояний используется для описания завершенных системой задач, например, миссии группы АМР или цепочки переключений режимов функционирования отдельного робота. Множество последовательностей событий образует формальный язык, описывающий функционирование системы на символьном уровне, а утверждения о свойствах этого языка могут быть получены в результате АДТ при соответствующей их формализации, например, как теоремы исчисления ПОФ. В частности, АДТ в исчислении ПОФ предложено использовать для анализа логических ДСС и синтеза супервизорного управления в рамках теории супервизорного управления [31].

Язык ПОФ представляет собой первопорядковый логический язык, состоящий из формул, построенных из атомарных с помощью связок V, &, кванторов V и 3, констант true и false. В общем виде ПОФ состоит из базы фактов и так называемых вопросов к базе, ответами на которые являются подстановки известных фактов вместо переменных вопроса. Консеквент вопроса, на который нашелся ответ, попадает в базу с соответствующей подстановкой. В результате построения вывода ПОФ как некоторой теоремы, в базе накапливаются факты, представляющие собой, например, план действий или, как в случае с ДСС, последовательность событий, возможных или произошедших в системе.

Для удобства чтения мы будем представлять ПОФ в виде дерева, узлами которого являются ти'повые кванторы. Относительно частей ПОФ будет использоваться соответствующая терминология: узел, корень, лист, ветвь. Например, ПОФ

РхЛ'^З {*У,ЗДЭА4}},ЭА5 {VyJ*}}

представляется в виде дерева следующим образом:

(

v<

VB,

ЗА3-^В3

.ЗА,

КДА. - V

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

У*В 4

В формуле Р = формулы = I = 1,тг, назы-

ваются базовыми подформулами Р, Б; называются базами фактов, или просто базами, (?; ■ называются подформулами-вопросами, а корни подформул-вопросов - вопросами к

базам В,, I = 1, п. Вопрос вида (без каких-либо потомков) называется целевым вопросом. Подробное описание исчисления ПОФ можно найти в [15].

Логическая ДСС автоматного типа § может быть реализована с помощью ПОФ Тд на рис. 6. База Т^ представляет собой множество В^ = {£.(£, ч'в), ¿'"(е, чГо),

о--',^)}, содержащее атомы, описывающие переходы между состояниями в том числе маркированные, и атомы, которые будут использоваться

для построения генерируемых языков, 1,] £ {1,...,«}, п - конечное число. Предикат ¿(^,5) обозначает «5 - это текущая последовательность событий, приведшая систему в состояние Я», а предикат £рп(г,5) обозначает «5 - это текущая последовательность событий, приведшая систему в состояние 5, и 5 - маркированная строка». Первые аргументы этих атомов накапливают строки языков £(£) и сгенерированного и маркированного автоматом соответственно.

В зависимости от выбранного на текущем шаге вопроса, использование правила вывода со исчисления ПОФ влечет генерацию в базе нового факта [.(х, ¡7) или Ьт(з, ц), при этом литера 5 есть слово языка или ¿рп(£), соответственно.

TG = 1ВГ

Рисунок 6 - Общая форма ПОФ-представления конечного автомата как логической ДСС

Особенностью предлагаемого подхода является возможность дополнительной обработки и контроля событий на основе данных об окружающей среде в режиме реального времени во время вывода. За это отвечают специальные логические правила, представленные в ПОФ в виде вопросов обработки событий. В результате ответа на них запускаются подвыводы, в которых поступающие данные служат параметрами, используемыми в расчетах или в других процессах принятия решений.

ПОФ в задаче перемещения блока

Рассмотрим задачу о перемещении объекта, которая может возникнуть в локальной области, куда была направлена часть группы АМР согласно расписанию верхнего уровня. Пусть в области, называемой далее сценой, находятся три робота, два блока и целевая область, в которую необходимо передвигать блоки (рис. 7). Будем полагать, что только два робота, действуя слаженно, могут сдвинуть блок, поэтому сначала робот должен найти другого робота для формирования пары, а затем толкать блок в целевую область. Для упрощения планирования сцена разделена на ячейки для отслеживания координат передвигаемых объектов. Рассматриваемая задача может быть описана набором конечных автоматов, каждый из которых фиксирует один из аспектов действий роботов. Один из этих автоматов представлен на рис. 7 и описывает смену основных режимов функционирования АМР.

Target area

A

>

Bi

B2

mv st

st ■

% N pil

St

I pu\

pu ro

i,1

0 1

3 4

6 7

Рисунок 7 - Конечный автомат Qbiock? описывающий смену режимов AMP в задаче перемещения блоков

В основанном на ПОФ подходе условия срабатывания переходов в 5ыоск формализуются в виде ПОФ, эквивалентных, в общем случае, нехорновским формулам логики предикатов первого порядка, что выходит за рамки формализации, доступной, например, в широко известном языке логического программирования Пролог. Такая ПОФ состоит из базы, которая содержит факты о начальном положении объектов на сцене, а также вопросов-правил, отвечающих за распределение целей для группы роботов, передвижения роботов к целям и перемещению блоков к целевой области. Для формализации будут использоваться следующие предикаты: Я(х,у) - "х - это робот, направленный в сторону у Е {N, E,S, wy\ B(r) - "х - это блок, который нужно переместить", W(x) - "х - это ширина сцены", И(х) - "х - это высота сцены",

Pos(x.,y,z) - "х - это робот или блок, расположенный в координатах (v,z)", Арр(х, и, v) - "х - робот, назначенный для выполнения задания по перемещению в координатах (it, и)",

Free(x,y) - "координаты (х,у) свободны для перемещения туда робота", Ready (х) - "х готов переместить блок", Моие(х) - " х перемещает блок",

BlockMoved(x,y) - "х это блок с номером у который уже был перемещен", с (х,у) - "вспомогательный вычисляемый предикат, который замещается логической константой true если х меньше или равен у, и константой false в обратном случае, мы будем использовать обычную инфиксную его форму", = (х, у) Ф (х,у) - то же самое, что и выше, в отношении равенства и неравенства, iiist(x,y,™, и) - функциональный символ, необходимый для оценки расстояния между ячейками с координатами (х, у) и (it, v).

Предикат FreeQ также будет считаться вычисляемым для удобства чтения и будет обозначаться символом #. Символ * рядом с предикатом указывает на то, что этот предикат будет удален из базы после успешного ответа, это подход к моделированию устаревания фактов с течением времени. База фактов содержит атомы, описывающие исходную сцену (рис. 7):

ЗД (r±,N),R (г2, Е), ДОэ,5), ВОД В(Ь2ХPos(rlr 1,8),Pos(r2,7,7),Pos(r3, 7,2),

Pos^blt 6,5),Pos(b2,2,3), tf (10),W(8)

В процессе поиска вывода в базу будут добавляться факты, отражающие последовательные изменения состояния системы. Например, в состоянии (режиме) при построении вывода в опровергнутых базах будут накапливаться факты, отражающие последовательные изменения состояния сцены, откуда можно извлечь минимальный план движения АМР. За остановку поиска вывода отвечает целевой вопрос-правило, сравнивающий координаты целевой области с текущими координатами блоков. Существенно, что в ходе вывода используются вспомогательные вопросы обработки событий. Первый вопрос в ПОФ на рис. 8 представляет собой общую форму вопроса, служащего для генерации событий, вызывающих переходы между состояниями.

■■рЧ _ =| п т* (а)-ЗЕ (а)

Рисунок 8 - ПОФ, содержащая предикат Т 5 обработки события

Покажем ПОФ, используемые в предикате Г^для организации подвывода, проверяющего возникновение события "го" для перехода AMP в режим вращения "Rotate" (рис. 9).

5 5 1 ^tos.q^q'Lts.qlE'iraWte.r.q':

')-3L(s

Рисунок 9 - ПОФ, содержащая предикат обработки события для перехода "го"

Прежде всего, АМР необходимо повернуться, если расстояние между следующей позицией робота и текущей позицией цели меньше, чем начальная позиция робота:

1. Vr,xryru, vR*(r,N\Pos(r,x,y\Free#(x,y + 1), App(r,u, v), dist(x,y,u, p) < dist(x,y l,u, v) { 3 Д(г, £)

2. Vr, x,y,u, vR*{r,E^,Pos{r,x,y),Free#{x + l,y), App(r,u, v), dist{x,y,u,v) < dist(x + 1 ,y,u,v) {3 Ji(r,5)

3. Vr,x,y,u, vR*(r,S),Pos(r,x,y),Free#(x,y — l),j4pp(r,w, r), dist(x,y,u, p) < dist(x,y — 1,11,1?) { 3 Jt(Y, W )

4. Vr,x,y,u, vR*{r,W^,Pos{r,x,y), Free4{x — l,y),App(r,u, v), dist{x,y,u,v) < dist(x — 1 ,y,u, u) {3 Ji(r,JV)

При этом специальная группа правил задает эвристику для сокращения пространства поиска вывода при проверке расстояния между текущим положением робота и назначенной целью:

el. Vr,x,y,u, vR(t,N},Pqs*(r,x,y},Free*(x,y + l),App(r,u, v), dist(x,y,u,v) > dist{x,y -f 1, u, v) { 3 Pos(r,x,y 1)

e2. ~ifr,x,y,u, vR(r, E),Pos*(r,x,y),Free'i (x -f 1 ,y),App(r,u, v), dist(x,y,u, p) > dist(x -f l,y, u, v) { 3 Pos(r,je -f l,y)

e3. Vr,jc,y,w, 17#(г,5),,Ро5*(г,:1,у), Free4 (xry — 1), Лрр(г,«, г), dist{x, у, и, v) > dist(x,y — 1 ,u,v) { 3 Pos(r,x,y — 1)

e4. Vr,jc,y,w, vR(r, W}, Pas* {r,x,y)f Free4 {x — l,y),App(r,u, v), dist(x,y,u,v) > iil5t(:r— l,y, ii, 1?) {3 Pos(r,x — 1, y)

Если робот находится рядом с блоком и готов к его перемещению, то ему необходимо повернуться на север:

Vr,х,у,d R*(r,d),Pas(r1x,y — 1),Лрр*(г,1,у) { 3 Я(г,Л/}, Jieaiiy(r)

Для проверки достижения второго пункта назначения зададим также два правила: необходимо повернуть в нужном направлении, если в базе присутствует предикат BlockMoved{b,ri)\

1 .Vr,b,n,x,v BlockMoved(b,ri), Pos(b,x,v'),App* (r,x — l,y) { 3 Readv(r),R (r,E) 2. Vr, b,n,x,y BlockMoved(b,n), Pos(b,x,v~),App* (r,x + 3,y) {3 Ready(r'),R(r,W~)

Для ATP на основе ПОФ-исчисления разработан прувер Bootfrost, который специализируется на выводе ПОФ без неограниченных переменных (https://github. com/sni gavik/ bootfrost). Прувер был протестирован на всемирно известной библиотеке задач для

тестирования пруверов TPTP. Ни одна из задач, не имевших решения, не была решена, что считается основным критерием надежности любого прувера на крупнейших соревнованиях пруверов CADE ATP System Competition (https://tptp.org/CASC/). В системе управления, в подсистеме символьной обработки, система логического вывода представляется параллельным потоком с высшим приоритетом. Поток реализует прувер Bootfrost и обеспечивает переключение алгоритмов ситуационного уровня («задач») в соответствии с полученными результатами.

Выводы

В работе предложен иерархический подход для динамического управления разнородной группой АМР в задачах групповой координации в условиях жестких коммуникационных и энергетических ограничений. Предлагаемая схема имеет трехуровневую структуру, где верхний уровень отвечает за планирование рабочих периодов группы, сеансов групповой связи и расписания подзарядки роботов, средний уровень обеспечивает управление АМР при выполнении текущих задач, а нижний уровень служит для обработки динамических событий и связанного с ними переключения режимов функционирования. Такая декомпозиция на три уровня позволяет разгрузить общую проблему распределения заданий и ресурсов в группе, выделив наиболее жесткие ограничения в отдельную проблему управления временем.

Представленная в работе задача планирования высокого уровня заключается в построении группового расписания, обеспечивающего эффективный порядок подзарядок и требуемую периодичность связи. Задача формулируется в терминах задач планирования рабочих смен, а для ее решения разработана гибридная модификация эволюционных алгоритмов.

На уровне логической обработки данных используется метод автоматического доказательства теорем в исчислении ПОФ, разработанного для управления динамическими интеллектуальными системами. Наглядное представление ПОФ, интуитивно понятная формализация задач, а также ряд важных особенностей исчисления делают его эффективным инструментом интеллектуализации систем управления АМР. Представлен пример применения логического вывода для генерации событий смены режимов функционирования АМР. Специальные логические правила, представленные в ПОФ в виде вопросов обработки событий, запускают подвыводы, в которых поступающие данные служат параметрами, используемыми в расчетах и других процессах принятия решений. Особенности исчисления, связанные с высокоуровневой обработкой событий и возможностью накопления знаний, будут полезны в задачах, возникающих в реальных системах, функционирующих в заранее неизвестных средах. Строгое формальное обоснование полученных в результате логического вывода результатов гарантирует корректность принимаемых решений.

Дальнейшие исследования будут направлены на решение задач управления для децентрализованных и распределенных систем, а также на внедрение представленного в статье подхода в современные робототехнические комплексы.

Список литературы

1. Badreldin M, Hussein A and Khamis A. A comparative study between optimization and market-based approaches to multi-robot task allocation // Advances in Artificial Intelligence. 2013. 2013(256524).

2. Vidal T, Crainic TG, Gendreau M et al. Heuristics for multi-attribute vehicle routing problems: A survey and synthesis // European Journal of Operations Research. 2012. Vol 231. P. 1-21.

3. Gini M. Multi-robot allocation of tasks with temporal and ordering constraints // Proceedings of 31st AAAI Conference on Artificial Intelligence, AAAI 2017. 2017. P. 4863-4869.

4. Nunes E, Manner M, Mitiche H et al. A taxonomy for task allocation problems with temporal and ordering constraints // Robotics and Autonomous Systems Special Issue on New Research Frontiers for Intelligent Autonomous Systems. 2017. Vol. 90. P. 55-70.

5. Stephan J, Fink J, Kumar V et al. Concurrent control of mobility and communication in multirobot systems // IEEE Transactions on Robotics. 2017. Vol. 33(5). P. 1248-1254.

6. Varadharajan V, St-Onge D, Adams B et al. Swarm relays: distributed self-healing ground-and-air connectivity chains // IEEE Robotics and Automation Letters. 2020.

7. Kantaros Y, Guo M and Zavlanos M. Temporal logic task planning and intermittent connectivity control of mobile robot networks // IEEE Transactions on Automatic Control. 2019. Vol. 64(10). P. 4105-4120.

8. Asghari M and Mirzapour Al-e-hashem SMJ. Green vehicle routing problem: A state-of-the-art review // International Journal of Production Economics. 2021. Vol. 231: 107899.

9. Zou B, Xu X, Gong Y et al. Evaluating battery charging and swapping strategies in a robotic mobile fulfillment system // European Journal of Operation Research. 2018. Vol. 267(2). P. 733-753.

10. MahmoudZadeh S, Powers DMW, Sammut K et al. Hybrid motion planning task allocation model for AUV's safe maneuvering in a realistic ocean environment // Journal of Intelligent & Robotic Systems. 2019. Vol. 94(1). P. 265-282.

11. Karpas, E.; Magazzeni, D. Automated planning for robotics. Annual Review of Control, Robotics, and Autonomous Systems 2020, 3, 417-439.

12. Zombori, Z.; Urban, J.; Brown, C.E. Prolog technology reinforcement learning prover. In Proceedings of the International Joint Conference on Automated Reasoning. Springer, 2020, pp. 489-507.

13. Schader, M.; Luke, S. Planner-Guided Robot Swarms. In Proceedings of the International Conference on Practical Applications of Agents and Multi-Agent Systems. Springer, 2020, pp. 224-237.

14. Vassilyev S.N. Machine Synthesis of Mathematical Theorems // The Journal of Logic programming. 1990. Vol. 9, No. 2-3, P. 235-266.

15. Васильев С.Н. Интеллектное управление динамическими системами / С.Н. Васильев, А.К. Жерлов, Е.А. Федунов, Б.Е. Федосов. - М.: Физико-математическая литература, 2000. - 352c.

16. Davydov A.V., Larionov A.A., Cherkashin E.A. On the calculus of positively constructed formulas for automated theorem proving // Automatic Control and Computer Sciences (AC\&CS). 2011. Vol. 45, No. 7, P. 402-407.

17. Cherkashin, E.A.; Postoenko, A.; Vassilyev, S.N.; Zherlov, A. New Logics for Intelligent Control. In Proceedings of the Proceedings of the Twelfth International Florida Artificial Intelligence Research Society Conference, May 1-5, 1999, Orlando, Florida, USA; Kumar, A.N.; Russell, I., Eds. AAAI Press, 1999, pp. 257-261.

18. Vassilyev S., Galyaev A. Logical-optimization approach to pursuit problems for a group of targets. Dokl. Math. 2017, 95.

19. Vassilyev S., Ponomarev G. Automation methods for logical derivation and their application in the control of dynamic and intelligent systems. Proc. Steklov Inst. Math. 2012, 276, 161 -179.pas, E.; Magazzeni, D. Automated planning for robotics. Annual Review of Control, Robotics, and Autonomous Systems 2020, 3, 417-439.

20. Schacht-Rodriguez R, Ponsart J.-C., Garcia-Beltran C.D. and Astorga-Zaragoza C.M. Prognosis & Health Management for the prediction of UAV flight endurance // IFAC-PapersOnLine. 2018. Vol. 51(24). P. 983-990.

21. Van den Bergh J, Beliën J, De Bruecker P et al. Personnel scheduling: A literature review // European Journal of Operational Research. 2013. Vol. 226(3). P. 367-385.

22. Rocha M. The staff scheduling problem: a general model and applications // Master thesis: Faculdade de Engenharia da Universidade do Porto. 2013.

23. Chan P, Weil G. Cyclical Staff Scheduling Using Constraint Logic Programming // Lecture Notes in Computer Science. 2000. Vol. 2079. P. 159-175.

24. Amjad MK, Butt SI, Kousar R et al. Recent research trends in genetic algorithm based flexible job shop scheduling problems // Mathematical Problems in Engineering. 2018. Vol. 2018(5). P. 1-32.

25. Vidal T, Crainic TG, Gendreau M et al. A hybrid genetic algorithm for multidepot and periodic vehicle routing problems // Operations Research. 2012 Vol. 60(3). P. 611-624.

26. Laporte G, Ropke S, Vidal T. Chapter 4: Heuristics for the Vehicle Routing Problem // Vehicle Routing. 2014. P. 87-116.

27. Nagata Y, Braysy O, Dullaert W. A penalty-based edge assembly memetic algorithm for the vehicle routing problem with time windows // Computers & Operations Research. 2010. Vol. 37(4). P. 724-737.

28. Semanco P and Modrak V. A comparison of constructive heuristics with the objective of minimizing makespan in the flow-shop scheduling problem // Acta Polytechnica Hungarica. 2012. Vol. 9. P. 177-190.

29. Laporte G. The art and science of designing rotating schedules // European Journal of Operational Research. 1999. Vol. 50. P. 1011-1017.

30. Cassandras C.G., Lafortune S. Introduction to Discrete Event Systems. Springer Cham, 2021.

31. Давыдов А. В. О применении исчисления позитивно-образованных формул для исследования управляемых дискретно-событийных систем / А. В. Давыдов, А. А. Ларионов, Н. В. Нагул. Модел. и анализ информ. систем. 2024. № 1, Т. 31. С. 54-77.

References

1. Badreldin M, Hussein A and Khamis A. A comparative study between optimization and market-based approaches to multi-robot task allocation // Advances in Artificial Intelligence. 2013. 2013(256524).

2. Vidal T, Crainic TG, Gendreau M et al. Heuristics for multi-attribute vehicle routing problems: A survey and synthesis // European Journal of Operations Research. 2012. Vol 231. P. 1-21.

3. Gini M. Multi-robot allocation of tasks with temporal and ordering constraints // Proceedings of 31st AAAI Conference on Artificial Intelligence, AAAI 2017. 2017. P. 4863--4869.