СОБЫТИЙНЫЙ ПОДХОД К МНОГОРЕЖИМНОМУ УПРАВЛЕНИЮ ГРУППИРОВКОЙ ПОДВОДНЫХ РОБОТОВ В ОБСЛЕДОВАТЕЛЬСКОЙ МИССИИ

Бычков Игорь Вячеславович; Давыдов Артем Васильевич; Нагул Надежда Владимировна; Ульянов Сергей Александрович

Вычислительные технологии

Том 23, № 2, 2018

Событийный подход к многорежимному управлению группировкой подводных роботов в обследовательской миссии

И. В. Бычков, А. В. Давыдов, Н.В. Нагул, С. А. Ульянов* Институт динамики систем и теории управления им. В.М. Матросова СО РАН, Иркутск, Россия *Контактный e-mail: sau@icc.ru

Предложен подход к построению двухуровневой системы управления группировкой автономных подводных роботов (АПР) при обследовании придонной области. Для реализации элементарных поведений (режимов функционирования) группы на нижнем уровне предложены алгоритм отслеживания траектории, основанный на концепции виртуальной цели, и децентрализованный алгоритм управления формациями, базирующий на схеме лидер — ведомый. Синтез регуляторов, обеспечивающих требуемое поведение системы в различных режимах, выполнен с использованием векторных функций Ляпунова с учетом дискретности по времени и погрешностей измерений, неопределенности параметров модели АПР, а также ограничений на ресурсы управления. Для построения верхнего уровня управления, ответственного за переключение между режимами, используется теория супервизорного управления дискретно-событийными системами. Приведены результаты численных расчетов, демонстрирующих работоспособность предложенного подхода.

Ключевые слова: подводный аппарат, управление формацией, векторная функция Ляпунова, дискретно-событийная система.

Введение

В настоящее время автономные подводные роботы (АПР) становятся основным средством для выполнения различных подводных работ, включая мониторинг подводной среды, картографирование рельефа дна, обследовательские миссии и др. Применение скоординированных групп АПР может значительно сократить длительность выполнения подводных работ, а также повысить функциональную надежность и робастность системы по отношению к непредвиденным событиям. Вместе с тем поведение группы по сравнению с одиночным АПР гораздо более сложное, оно может включать значительное число элементарных моделей поведения или режимов функционирования.

Традиционными в подводной робототехнике являются миссии по обследованию (сканированию) подводной области, при которых группа перемещается на заданной глубине по сгенерированным специальным образом траекториям, покрывающим исследуемую область, удерживая заданную геометрическую конфигурацию (формацию) во время

рабочих ходов и избегая столкновений с препятствиями. Для таких миссий характерны следующие режимы: сканирование, сбор формации, обход препятствий. Первый режим предполагает движение в отсутствие препятствий с как можно более точным сохранением строя. Режим сбора формации включается, когда роботы находятся на значительном расстоянии друг от друга и требуется привести их в положения, допустимые режимом точного сканирования. Такие ситуации могут возникать в начале выполнения обследовательской миссии, а также после завершения маневров по обходу препятствий или выполнения программных разворотов по достижении границы исследуемой области, которые сопровождаются изменением структуры формации. Активация режима обхода препятствий происходит при обнаружении их по ходу движения. Первые два режима определяют коллективное поведение группы и инициируются лидером группировки, в то время как режим обхода препятствий включается независимо каждым АПР группы.

При реализации элементарных поведений АПР в обследовательской миссии решаются три основные задачи: генерации траектории движения робота [1], включая ее коррекцию в режиме реального времени [2]; отслеживания траектории [3, 4]; управления формацией [5, 6]. В данной работе на основе нелинейной модели АПР разработан алгоритм отслеживания траектории, основанный на концепции виртуальной цели [3], и децентрализованный алгоритм управления формацией, использующий схему лидер — ведомый [7, 8]. Синтез регуляторов выполнен с использованием вычислительной технологии для анализа и синтеза нелинейных систем управления, основанной на идеях редукции [9, 10] и сублинейных векторных функций Ляпунова [11]. Эта технология в отличие от большинства техник, используемых в упомянутых выше работах, позволяет учитывать дискретный по времени характер и погрешности измерений, неопределенности параметров модели АПР, ограничения на ресурсы управления. Предложенные алгоритмы используются для формирования элементарных поведений группы и составляют основу нижнего уровня гибридной системы управления.

В то время как непрерывная динамика АПР-лидера и ведомых определяет режимы их движения, переключение между различными режимами функционирования может описываться в терминах дискретно-событийной модели. В широко используемых дискретно-событийных системах (ДСС) эволюция состояний рассматривается как следствие возникновения последовательностей некоторых событий. Теория супервизорного управления (ТСУ), разработанная в 1980-х гг. для управления поведением ДСС, сегодня становится мощным инструментом во многих реальных приложениях, включая робототехнику. Последние применения в этой области включают управление одиночными роботами [12, 13], группами роботов [14, 15] и их формациями [16], роями роботов [17, 18] и др. Однако в большинстве перечисленных работ используются простейшие супервизоры, построенные на основе автоматной модели управляемой системы путем исключения из нее нежелательных переходов.

Популярный способ проектирования супервизорного управления состоит в построении автоматов для активации и деактивации элементарных поведений, построении параллельной композиции этих автоматов и анализе состояний результирующего автомата, которые представляют все возможные комбинации элементарных поведений. Переходы, приводящие к нежелательным сочетаниям, должны быть запрещены супервизором. Будучи достаточно эффективным, этот подход лишь частично использует результаты ТСУ, затрагивающие в первую очередь формальные языки, описывающие поведение системы и ограничения на него. Важные свойства ДСС, такие как управ-

ляемость языка спецификации и неблокируемость супервизора, обычно не обсуждаются, а сами спецификации зачастую не определены явно. Мы предлагаем дискретно-событийную модель переключения режимов работы АПР-лидера как реакцию на изменения среды, предыдущие и текущие режимы и строим супервизор, обеспечивающий выполнение языковых спецификаций на движение формации АПР.

В статье синтезированы регуляторы, составляющие основу нижнего уровня управления, приведены алгоритмы верхнего уровня управления, основанные на ДСС, и представлены результаты численного моделирования разработанной гибридной двухуровневой системы управления.

1. Алгоритмы управления нижнего уровня 1.1. Модель АПР

Для построения алгоритмов управления нижнего уровня применим заимствованную из [3] модель АПР, описывающую его движение на плоскости с использованием глобальной {U} и связанной [В} систем координат (рис. 1):

X = U COs(vpB) — V sin(^B), у = U sin(^B)+ V COs(vpB), Фв = Г, ^

Т = muù + du, 0 = mv v + mur ur + dv, Q = mr r + dr,

где x, y — координаты центра массы АПР; гфв — угол рысканья; u и v — поперечная и продольная скорости аппарата соответственно; г — скорость рысканья;

mv

тг

т,,

m — Хй, du = —Хиии2 — Xvvv2, m — Y,b, dv = —Yv uv — Y^vlvl, Iz — Nj., dr — Nv uv — Nvivi — Nr ur

m — Yr.

т — масса АПР; 1Х — момент инерции относительно вертикальной оси аппарата; , У^}, — классические производные гидродинамических коэффициентов; Т, 0 — управляющие сила и момент.

1.2. Отслеживание траектории

Решение задачи отслеживания траектории базируется на концепции виртуальной цели. Определим цель как материальную точку Р, движущуюся вдоль отслеживаемого пути. Пусть с точкой Р связана подвижная система координат Френе — Серре {F} (рис. 1), одна ось которой совпадает с направлением вектора скорости цели, а вторая — перпендикулярна первой. Тогда, как показано в [3], движение АПР в подвижной системе координат {F} описывается уравнениями

¿1 = vt cosф - sa + фрУ1, Ух = vt sinф - фрSi, ф = г + ¡3 - фр, (2)

где Si, у1 — координаты АПР в подвижной системе координат {F}; sa — криволинейная координата точки Р, определяющая ее положение на кривой; ft = arctan(f/w) — угол скольжения; vt = (и2 + v2)1/2 — модуль вектора скорости АПР; фр — угол ориентации подвижной системы координат {F} относительно глобальной {U} (фр = cc(sa)sa),

Рис. 1. Системы координат

сс — кривизна пути, ф = фв + Р — фр. Будем предполагать, что виртуальная цель движется вдоль траектории с постоянной скоростью Ud и имеется ограничение на кривизну пути | сс| < сс.

Задача отслеживания траектории формулируется следующим образом: определить законы управления для силы Т и момента Q, обеспечивающие асимптотическое стремление к нулю переменных у\, si и ф при t ^ то.

Для решения поставленной задачи предложен цифровой закон управления

Т (t) = Т + Т8, Q (t) = Qc + Qs, teTk = [tk, tk+i),

Т = du, Qc = dr + mr (cc sa + ccsa — ¡3), (3)

Ts = sat(kisik + k2AUik, Ts), Gs = sat(k3yik + к±фк + к5АГк, Qs),

где tk = kh, к = 0,1, 2 ..., h — шаг управления; Тс, Qc — слагаемые полного управления, призванные компенсировать возмущения du, dr в уравнениях соответственно для и иг системы (1), а также слагаемые Р и фр = сс(sa)sa, входящие в правую часть последнего

уравнения системы (2); ¡3 — оценка ускорения ¡, вычисляемая на основе динамической модели АПР (подробности см. в [3]); Ts, Qs — стабилизирующие слагаемые управления, обеспечивающие решение задачи слежения, Тs, Qs — ресурсы управления по силе и моменту, выделенные на решение основной задачи; sik, yik, фк, AUk, Ark — оценки переменных si, yi, ф, Аи = и — Ud, Ar = r + Р — фр, вычисляемые в дискретные моменты времени tk; sat(<r, a) = sign(a) min(|<r|, a) — функции типа "насыщение"; ki — коэффициенты обратных связей, подлежащие отысканию (i = 1, 5).

1.3. Управление формацией

Используемый в режимах сканирования и сбора группы алгоритм управления формацией основан на схеме лидер — ведомый, при которой задача ведомых роботов состоит в удерживании желаемого положения относительно своих лидеров. Будем предпола-

гать, что каждый ведомый имеет ровно одного лидера, т. е. граф связи имеет структуру дерева, и существует АПР, называемый лидером формации, который не является ведомым ни для какого другого АПР и задает движение группы в целом.

Пусть АПР группы оснащены датчиками, способными измерять дистанцию до лидера s = \/(xi — Xf )2 + (yi — yf )2 и угол пеленга 9 = фWf — arctan ——— (фщ — фв + 0).

Xf — Xi

Здесь нижний индекс I ( /) указывает на принадлежность соответствующих переменных лидеру (ведомому). Динамика пары лидер — ведомый в терминах этих переменных описывается следующими уравнениями:

s = va cos^wi — фwf + 9) — vtf cos 9, s9 = sTf + Vtf sin^ — vti sin(фwl — фwf + 0).

Пусть s = s* и 9 = 9* соответствуют желаемому положению ведомого АПР относительно своего лидера. Для стабилизации этого положения используется цифровой закон управления

Т (t) = Та + du, Q (t) = gs + dr, teTk,

_ s _ (4)

Т = sat(klAsk + k2Zk, Ts), Qs = sat^Aák + k4Zk + k5A9k + k6zk, Qs),

где оценки ASk и A9k отклонений As = s — s* и A9 = 9 — 9* (по дистанции и углу соответственно) вычисляются в моменты времени k с использованием дискретных фильтров

ASk = (^k-i,v — S*), A 9 k = (9k-i,v — o*).

V=1 V=1

Здесь Sk-i,v — s(tk-i,u) + s(tk-i,v) и 6?k-i, ^ — 0(tk-\,v) + 9(tk-\,v) — измерения дистанции и угла пеленга в моменты tk-i,l = tk-i + ти, 0 < ти < h, v = 1, р (р — глубина памяти); s и 9 — ограниченные ошибки измерений; \v ,\ev — параметры фильтров. Для улучшения качества управления в обратной связи также используются оценки Zk, zf скоростей A s, A 9, вычисляемые с помощью дискретных наблюдателей

м

Zk+i = ^2 (¿bu — S*) + bZk, Zq = z(to) = 0,

= É al (9k,v — 9*) + be zk, 4 = z$ (to) = 0.

1.4. Обход препятствий

Будем полагать, что АПР на основе данных измерений, снимаемых с акустических дальномеров, может генерировать траектории, обеспечивающие безопасный обход препятствий, обнаруживаемых в процессе сканирования. В данной работе задача онлайн-генерации траектории движения АПР в неструктурированной среде не рассматривается. Некоторые возможные подходы к ее решению представлены в [2, 19]. При сделанном выше предположении задача обхода препятствий для лидера группировки решается с использованием алгоритма отслеживания траектории (3). Лидер активирует режим обхода в случае приближения к ближайшему из препятствий на заданное расстояние,

а по завершении обходных маневров и возвращении на текущий галс переключает его на режим сбора формации, о чем оповещает другие аппараты группы. При этом с целью уменьшения затрачиваемой энергии возможны изменения структуры формации, ответственным за которые является лидер группы.

Ведомые АПР в отсутствие препятствий движутся заданным строем, который обеспечивается децентрализованным законом управления (4). Однако при наличии препятствий удовлетворить всем ограничениям, обусловленным структурой формации, не всегда представляется возможным, поэтому при обходе препятствий от ведомых АПР целесообразно требовать лишь удерживать заданное расстояние до своего лидера. Алгоритм управления, реализующий такое поведение ведомых, имеет вид (3), где стабилизирующая составляющая полного управления Т3 определяется как

Т8 = ва^ кхЗхк + к2Айк + ктАвк, Т8). 1.5. Синтез регуляторов

В представленных цифровых алгоритмах управления нижнего уровня синтез параметров выполнен с использованием вычислительной технологии для анализа и синтеза нелинейных систем управления на основе сублинейных векторных функций Ляпунова (ВФЛ), которая для цифровых систем управления получила развитие в [11, 20]. При построении регуляторов для режимов, связанных с отслеживанием траектории, синтез проводился из условия минимума критерия

= У1 + ,

где у1, 51 — вычисляемые с использованием ВФЛ оценки установившихся значений Итsu.plу1 (¿')| и Итsu.pl51(^/)| переменных у1 и ^ соответственно; а — весовой коэффициент. В свою очередь, для управления формацией в режиме сканирования, предполагающего как можно более точное удерживание заданной геометрической конфигурации, параметры управления ведомыми вычислялись таким образом, чтобы формация была робастно диссипативна [21, 22] и достигался минимум критерия

^ГШ = || сс!_(А^ + агАвг)||,

где N — число ведомых в формации; Авг, Авг — вычисляемые на основе ВФЛ оценки установившихся ошибок стабилизации положения -го ведомого относительно своего лидера. И, наконец, в случае сбора формации при синтезе требовалось, чтобы начальные отклонения по дистанции и углу пеленга за заданное время были уменьшены до значений, лежащих в допустимом множестве режима точной стабилизации. В этом случае желаемая динамика формации определяется динамическим свойством практической устойчивости [21, 22].

2. Алгоритмы управления верхнего уровня 2.1. Дискретно-событийные системы

На верхнем уровне управления будем рассматривать систему как дискретно-событийную, т. е. описывать ее функционирование последовательностями событий, или словами

некоторого формального языка. Пусть Q = (Q, S,8, q0,Qm) — дискретно-событийная система, представленная генератором формального языка [23]. Здесь Q — множество состояний q; S — множество событий; 8: S х Q ^ Q — функция переходов; q0 G Q — начальное состояние; Qm С Q — множество маркированных состояний. В отличие от конечного автомата, распознающего формальный язык, т. е. определяющего, принадлежит ли слово этому языку, генератор порождает слова некоторого языка. Как обычно, пусть S* означает множество всех строк над алфавитом S, включая пустую строку е. Префиксное замыкание L — это множество всех строк, являющихся префиксами слов из L, т.е. L = {s|s G S* и 3t G S* : s •t G L}. Символ • означает конкатенацию строк и часто опускается. Язык L замкнут, если L = L. Для любого генератора Q L(Q) замкнут.

Язык, порождаемый Q, — это язык L(Q) = {w : w G S* и 8(w, q0) определено}, тогда как язык, маркированный Q, определяется как Lm(Q) = {w : w G L(Q) и 8(w, q0) G Qm}. Маркированные слова могут соответствовать завершенным системой задачам, например определенным последовательностям событий, которые АПР должен осуществить для исследования заданной цели.

В настоящей статье предполагается, что Q полностью наблюдаема, хотя ТСУ для частично наблюдаемых ДСС — интересная и сложная теория, необходимая в реальных приложениях. Частичное наблюдение в ДСС для задач группового управления АПР будет рассмотрено в последующих работах.

2.2. Понятие управляемой ДСС

Теория супервизорного управления предполагает, что возникновение некоторых событий 0 может быть предотвращено, а соответствующее средство управления представлено супервизором [23]. Пусть Ес — множество управляемых событий, Еадс = Е \ Ес, Ес П Еадс = 0. Супервизор переключает схемы управления таким образом, что управляемая ДСС достигает цели управления, описываемой некоторым регулярным языком К, называемым спецификацией на поведение ДСС. Формально супервизор — это пара 3 = (5, ф), где £ = (X, Е,^,х0, Хт) — детерминированный автомат с входным алфавитом Е. £ понимается как система, управляемая извне последовательностью символов событий (словами), порожденными 0 (т. е. словами из Ь(@)), в то время как ф : X ^ Г — функция, которая отображает состояния супервизора х в схемы управления 7 С 2Е. Если Б находится в состоянии х и а С ф(х), то а разрешено, в то время как если а С Ф(х), то а отключено (его возникновение запрещено).

Заметим, что в отличие от ДСС-моделей с форсируемыми событиями разрешенные события не обязательно должны произойти. Очевидно, что ф является отображением, реализующим обратную связь. Так как неуправляемые события не могут быть отключены, требуется, чтобы Еис С 7 = ф(х). Функция 8 доопределяется до функции 8С: Г х Е х Q ^ Q, учитывающей схемы управления

^ (^ q) = ) ^(а, У), если 8(а, д) определено и а С 7;

{

Построим функцию £ х 8с : S х X х Q ^ X х Q, где

(С х àc){(J,x, q) = (£((т,x), 8c(ф(x),a, q))

определено тогда и только тогда, когда 8(а, q) определено, а С ф(х), и £(а, х) определено. Обозначим !<3) язык, сгенерированный поведением замкнутой системы (объект

управления — супервизор): L(J ¡Q) = {w : w Е X* и (£ х 5c)(w,xq , qQ) определено}. Пусть Lm(J¡Q) означает язык, маркированный супервизором: Lm(J¡Q) = {w : w Е L(J¡Q) и (£ х óc)(w,xq, qQ) Е Xm х Qm}. Основная цель супервизорного управления — построить такой супервизор, что Lm( J¡Q) = К. Для решения этой задачи существенно понятие управляемого языка.

Определение 1. [23] Язык К управляем (относительно L(Q) и Xuc), если

KXuc П L(Q) С К.

При интерпретации К как допустимого поведения системы он является управляемым, если возникновение любого неуправляемого события после префикса слова из К приводит к слову из К, т. е. также допустимо. Проверка управляемости — это необходимая стадия построения супервизора. Для этого строится произведение Н х G, где Н — распознаватель языка спецификации. Затем для всех (qH, qG) Е QhxG проверяется включение Е(qc) П Euc С Е(qH, qc), где Е(q) означает множество событий, возможных в состоянии .

Определение 2. Язык К является Lm(Q)-замкнутым, если К = К П Lm(Q) [23].

Определение 3. Супервизор J называется неблокирующим, если Lm(J¡Q) = L(J¡Q) [23].

Критерий существования супервизора определяется следующим образом: для существования неблокирующего супервизора J, такого что для заданного языка К С L(Q) выполнено К = Lm(J¡Q), необходимо и достаточно, чтобы К был управляем и Lm(Q)-замкнутым относительно L(Q).

2.3. Дискретно-событийная модель для управления формацией АПР

Для увеличения ширины охватываемой полосы сканирования и улучшения маневренности группы для обследовательских миссий рационально использовать линейные формации, где преследователь сдвинут назад относительно своего лидера вдоль направления движения. По соображениям эффективности для лидера группы также разумно предусмотреть возможность смены своей позиции в формации в процессе выполнения миссии, тем самым различая два типа формаций: с ведомыми слева относительно лидера (левая формация) и c ведомыми справа (правая формация).

Для применения ТСУ для управления формацией АПР сначала построим генератор, описывающий переключение режимов функционирования лидера. Пусть множество состояний генератора лидера задано как Qi = {PFR (движение в правой формации), PFL (движение в левой формацмии), OA (режим обхода препятствий), W (ожидание), S (всплытие), PC (вычисление пути), G (режим сбора формации)}, qQ>i = Qm>i = G, множество событий лидера Xi = {MFR (сформировать правую формацию), MFL (сформировать левую формацию), OD (обнаружено препятствие), ROA (обход препятствия справа), LOA (обход препятствия слева), FSD (обнаружено свободное пространство), BR (достигнута граница), FL (ведомый потерян), FF (ведомый найден), ML/MR (послать сообщение образовать левую/правую формацию), timeout, ожидание }. Функция 5 задана согласно рис. 2.

Положим X,uc = {OD, BR, FSD, FF}. Модель не претендует на полноту, но отражает ключевые аспекты функционирования АПР как лидера в сканирующей миссии.

Рис. 2. Генератор для лидера Qi

Заметим, что рассмотрение FL как управляемого события позволяет управлять аспектами поведения лидера относительно ведомого. Будучи разрешенным, это событие заставляет АПР-лидера ждать отставших ведомых и в случае их отсутствия в течение определенного периода времени (событие timeout) всплыть. Это может быть важно для того, чтобы указать человеку-оператору, где могут быть обнаружены потерянные ведомые. Поскольку разрешенные события не обязательно должны возникнуть, разрешение управляемых LOA и ROA не влечет их одновременного возникновения. Предполагается, что выбор между LOA и ROA происходит на борту АПР согласно обнаруженным препятствиям, поскольку супервизор является только средством ограничения функционирования системы в соответствии с заданными ограничениями.

Пусть спецификация на действия АПР-лидера задана языком K¡ = L(H¡), где H¡ — автомат, представленный на рис. 3. Эта спецификация предполагает, что группа АПР начинает сканирующую миссию в левой формации и после достижения границы сканируемой области меняет формацию на правую. Кроме того, обходя препятствие слева (справа), двигаясь в левой (правой) формации, формацию не меняют. Но при обходе препятствия слева (справа), двигаясь в правой (левой) формации, необходимо не только

Рис. 3. Автомат H¡ спецификации на поведение лидера

изменить формацию, но и вычислить новый путь, а также собрать ведомых для образования новой формации. Спецификация не предполагает ожидания в режиме сбора формации и запрещает ожидание потерянных АПР. Поскольку событие РЬ управляемо, это не влияет на управляемость К\, что легко проверяется. Состояния Н1 имеют имена, сходные с именами состояний исключительно для удобства, поскольку в общем случае никакого совпадения этих имен может не быть. К может представляться автоматом с произвольными именами состояний, так как нас интересует порождаемый им язык, а не способ, которым последний порождается. Маркировкой состояний С1 и С2 достигается Ьт(Я)-замкнутость К.

На рис. 4 представлен автомат супервизора = (Бг, фг), обеспечивающего ЬМ/01) = К и построенного с помощью свободно распространяемого программного обеспечения для решения различных задач теории супервизорного управления

Таблица 1. Отображение Ф1 : Х\ ^ Г

XI е Х1 МРЬ МРК РЬ wa.it КОА ЬОА мь мк

1 1 0 0 0 — — — —

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2 — — — — — — — —

3 0 0 0 — 1 1 0 0

4 0 1 0 0 — — — —

5 — — 0 — — — — —

6 — — 0 — — — — —

7 0 0 0 — 1 1 0 0

8 — — — — — — — —

9 1 0 0 — 0 0 0 0

10 0 0 0 — 0 0 0 1

11 — — 0 — — — — —

12 — — 0 — — — — —

13 0 0 0 — 0 0 1 0

14 0 1 0 — 0 0 0 0

DESUMA2 [24]. Отображение Ф1 представлено в табл. 1, где разрешению события соответствует значение 1, в то время как запрещению события соответствует значение 0. Прочерки означают, что не имеет значения, будет событие разрешено или запрещено. Неуправляемые события не включены в таблицу, поскольку они всегда разрешены. Событие timeout также не включено, поскольку FL никогда не разрешено и система никогда не достигает состояния W.

Для построения ДСС, описывающей основные аспекты поведения ведомого, используем традиционный модульный подход. Автомат, представленный на рис. 5, описывает базовые действия ведомого, в то время как автомат на рис. 6 служит для индикации наличия связи с лидером и перехода в режим всплытия при ее отсутствии в заданный промежуток времени.

Здесь Qf 1 = {KRF (сохранение правой формации), KLF (сохранение левой формации), OA (обход препятствия), G (сбор формации)}; Qf2 = {L (рабочий режим), W (ожидание), S (всплытие)}; Ef1 = {MFL/MFR (двигаться в левой/правой формации), OD (обнаружено препятствие), FSD (обнаружено свободное пространство), FSDL/FSDR (обнаружено свободное пространство при движении в левой/правой формации), ML/MR (получен приказ сформировать левую/правую формацию), timeout}; Е/2 = {LL (лидер потерян), LF (лидер найден), timeout}.

Генератор для АПР-ведомого строится как параллельная (синхронная) композиция Qf = Qf 1 || Qf2 модулей Qf 1, Qf2, имеет множество состояний мощности 1| х |Q/2| и множество событий Е/ = Е/ 1UE/2. Заметим, что лидер и ведомый имеют общие события MFR, MFL, ML и MR, и этот факт будет использован в дальнейшей работе для построения децентрализованного супервизора. Еf,uc = {OD, ML, MR}. Мы не приводим автомат для Qf, поскольку он строится стандартным образом (см., например, [25]).

Зададим спецификацию на поведение ведомого с помощью автомата Hf на рис. 7. Она предполагает запрет попыток смены формации при потере лидера, запрет всплытия во время обхода препятствия, даже если лидер потерян (следует закончить обход, после которого лидер может быть обнаружен), запрет на переход в режим сбора при наличии связи с лидером, даже если формация оказалась нарушенной при обходе препятствия, а также исключает любые действия во время всплытия.

Рис. 5. Базовое поведение ведомого Qf 1

Рис. 6. Связь с лидером Qf2

Рис. 7. Спецификация на поведение ведомого

Рис. 8. Автомат Sf супервизора для L(Qf) и Кт

Таблица 2. Отображение <fif : Xf ^ Tf

xf ^ xf MFL MFR timeout FSDL FSDR FSD

1 1 1 — — — —

2 — 1 — — — —

3 1 — — — — —

4 1 1 1 — — —

5 — 0 0 — — —

6 — — — 1 1 0

7 0 — 0 — — —

8 0 0 — — — —

9 — — 0 1 1 1

Несложно проверить, что язык спецификации, заданный таким образом, неуправляем, т.е. не выполнено условие L(Hf)Еу,ис П L(Qf) С L(Hf) : неуправляемое событие OD ведет из состояний (KRF,S), (KLF,S) в запрещенное спецификацией состояние (OA,S), а неуправляемые события ML, MR ведут из этих же состояний в состояние (G,S), откуда, в свою очередь, OD приводит в (OA,S). Таким образом, спецификация, заданная языком L(Hf), не может быть удовлетворена, т.е. не существует обеспечивающего ее супервизора. Однако может быть построен супервизор, обеспечивающий максимальный управляемый подъязык Kmax С L(Hf): среди других действий будут запрещены переходы по событию timeout в состояния (KRF, S) и (KLF, S). Автомат супервизора и соответствующее отображение представлены на рис. 8 и в табл. 2.

3. Численные расчеты и моделирование

Численные расчеты проведены для группы однотипных крупногабаритных АПР массой m ~ 2200 кг. Параметры модели АПР взяты из [3]. В левой (правой) формации для каждого ведомого принималось 5* = 11.66м, 9* = -1.03рад (s* = 11.66м, 9* = 1.03рад). При синтезе регуляторов и численном моделировании гибридной системы также принималось: h = 0.2с (общий для всех АПР и всех режимов шаг управления), Ts = 320 Н

-20 0 20 40 60 80 100 120 140

у, м

Рис. 9. Траектории АПР в обследовательской миссии

и @3 = 160 Н • м (управляющие сила и момент, выделенные на решение основной задачи текущего режима ), сс = 0.12 (ограничение на кривизну траектории).

На рис. 9 представлены полученные моделированием траектории движения АПР группы в следующем сценарии. Аппараты начинают движение вдоль текущего галса в левой формации (АиУ0 — лидер для ЛИУ1, а АиУ1 — лидер для АиУ2), и в момент обнаружения препятствия по ходу движения аппараты асинхронно переключаются на режим обхода препятствий. После завершения обходного маневра и возвращения на траекторию сканирования по команде лидера группа перестраивается в правую формацию (включается режим сбора формации) для продолжения сканирования. По достижении границы сканируемой области АПР совершают разворот с перестроением формации и выходят на следующий галс. В квадратных скобках на рис. 9 приводятся режимы функционирования группы в пяти различных моментах времени. Результаты моделирования показали приемлемое качество построенной гибридной системы управления.

Заключение

Основное внимание в этой статье уделено непрерывной динамике АПР, в то время как высокоуровневое управление на основе обработки событий представлено простейшей дискретно-событийной моделью, не учитывающей возможности ненаблюдаемости части событий (как правило, это события, связанные с отказами системы), модульного построения спецификаций и возможного в этой связи построения супервизоров на основе принципов модульности или агрегирования. С помощью такого подхода, в первую очередь, будет исследован случай, когда робот совмещает функции лидера и ведомого. Для дальнейшего исследования оставлен вопрос построения децентрализованного супервизора, использующего, при наличии определенной связи между АПР группы, решения локальных супервизоров для формирования глобального управления. Также не затронут вопрос редукции построенных супервизоров, имеющих, как правило, значительную размерность, но поддающихся редуцированию за счет исключения переходов, предопределенных управляемой системой. Для гарантирования сохранения свойств построенных супервизоров при их редукции будут использоваться результаты из [26].

В исследовательских и других сложных миссиях АПР зачастую возникают ситуации, когда необходимо выбирать одно действие из нескольких возможных. Например, при обнаружении препятствий АПР должен определить лучший способ его обхода. В общем случае такие задачи не лежат в области супервизорного управления ДСС, поэтому система управления должна иметь подсистему, отвечающую за принятие стратегических решений и планирование действий на основе знаний о подводной обстановке и состоянии АПР. В будущих исследованиях планируется использовать оригинальное исчисление позитивно-образованных формул и основанный на нем метод автоматического доказательства теорем [27] для представления этих знаний и их обработки. Кроме того, хотя алгоритмы ТСУ гарантируют, что построенное управление обладает необходимыми свойствами и поэтому не требует верификации, построение спецификаций представляет собой творческий процесс, а результат может содержать неточности и противоречия. Для гарантирования достоверности спецификаций также будет использовано исчисление позитивно-образованных формул.

Благодарности. Работа выполнена при финансовой поддержке РНФ (проект № 1611-00053).

Список литературы / References

[1] Petres, C., Pailhas, Y., Patron, P. et al. Path planning for autonomous underwater vehicles // IEEE Transactions on Robotics. 2007. Vol. 23, No. 2. P. 331-341.

[2] Bagnitckii, A., Inzartsev, A., Pavin, A. Planning and correction of the AUV coverage path in real time // Proc. IEEE Underwater Technology Conf. 21-24 Feb., Busan, South Korea. N.Y.: IEEE, 2017. P. 1-6.

[3] Lapierre, L., Soetanto, D. Nonlinear path-following control of an AUV // Ocean Eng. 2007. Vol. 34, No. 11. P. 1734-1744.

[4] Kim, D.W. Tracking of REMUS autonomous underwater vehicles with actuator saturations // Automatica. 2015. Vol. 58. P. 15-21.

[5] Li, X., Zhu, D., Qiun, Y. A survey on formation control algorithms for multi-AUV system // Unmanned Systems. 2014. Vol. 2, No. 4. P. 351-359.

[6] Das, B., Subudhi, B., Pati, B.B. Cooperative formation control of autonomous underwater vehicles: An overview // Intern. J. of Automat. and Comput. 2016. Vol. 13, No. 3. P. 199-225.

[7] Cui, R., Ge, S.S., How, B.V.E., Choo, Y.S. Leader-follower formation control of underactuated autonomous underwater vehicles // Ocean Eng. 2010. Vol. 37. P. 1491-1502.

[8] Millan, P., Orihuela, L., Jurado, I., Rubio, F.R. Formation control of autonomous underwater vehicles subject to communication delays // IEEE Transactions on Control Systems Technology. 2014. Vol. 22, No. 2. P. 770-777.

[9] Васильев С.Н. Метод редукции и качественный анализ динамических систем: I // Изв. РАН. ТиСУ. 2006. № 1. С. 21-29.

Vassilyev, S.N. Method of reduction and qualitative analysis of dynamic systems: I // J. of Computer and Sys. Sci. Intern. 2006. Vol. 45, No. 1. P. 17-25.

[10] Васильев С.Н. Метод редукции и качественный анализ динамических систем: II // Изв. РАН. ТиСУ. 2006. Т. 45, № 2. С. 5-17.

Vassilyev, S.N. Method of reduction and qualitative analysis of dynamic systems: II // J. of Computer and Sys. Sci. Intern. 2006. Vol. 45, No. 2. P. 167-179.

[11] Бычков И.В., Воронов В.А., Дружинин Э.И. и др. Синтез комбинированной системы прецизионной стабилизации обсерватории "Спектр УФ": II // Космические исследования. 2014. Т. 52, №. 2. С. 153-161.

Bychkov, I.V., Voronov, V.A., Druzhinin, E.I. et al. Synthesis of a combined system for precise stabilization of the Spektr-UF observatory: II // Cosmic Res. 2014. Vol. 52, No. 2. P. 145-152.

[12] Jayasiri, A., Mann, G.K., Gosine, R.G. Behavior coordination of mobile robotics using supervisory control of fuzzy discrete event systems // IEEE Transactions on Systems, Man, and Cybernetics, Pt B (Cybernetics). 2011. Vol. 41, No. 5. P. 1224-238.

[13] Torrico, R.C., Andre, B.L., Watanabe, A.T.Y. Modeling and supervisory control of mobile robots: A case of a sumo robot // IFAC-Papers OnLine. 2016. Vol. 49, No. 32. P. 240-245.

[14] Dai, X., Jiang, L., Zhao, Y. Cooperative exploration based on supervisory control of multirobot systems // Applied Intelligence. 2016. Vol. 45, No. 1. P. 18-29.

[15] Tsalatsanis, A., Yalcin, A., Valavanis, K.P. Dynamic task allocation in cooperative robot teams // Robotica. 2012. Vol. 30, No. 5. P. 721-730.

[16] Gamage, G.W., Mann, G.K.I., Gosine, R.G. Discrete event systems based formation control framework to coordinate multiple nonholonomic mobile robots // Proc. of the 2009 IEEE RSJ Intern. Conf. on Intelligent Robots and Systems, IROS 09, St. Louis, MO, USA, 2009. P. 4831-4836.

[17] Lopes, Y.K., Trenkwalder, S.M., Leal, A.B., Dodd, T.J., Grob, R. Supervisory control theory applied to swarm robotics // Swarm Intelligence. 2016. Vol. 10, No. 1. P. 65-97.

[18] Mendiburu, F.J., Morais, M.R.A., Lima, A.M.N. Behavior coordination in multi-robot systems // IEEE Intern. Conf. on Automatica (ICA-ACCA). Oct. 2016, Curico, Chile. N.Y.: IEEE, 2016. P. 19-21.

[19] Galceran, E., Campos, R., Palomeras, N., Carreras, M., Ridao, P. Coverage path planning with realtime replanning for inspection of 3D underwater structures // IEEE Intern. Conf. on Robotics and Automation (ICRA). 2014. 31 May - 7 June 2014, Hong Kong, China. N.Y.: IEEE, 2014. P. 6586-6591.

[20] Козлов Р.И., Козлова О.Р. Исследование устойчивости нелинейных непрерывно-дискретных моделей экономической динамики методом ВФЛ. I // Изв. РАН. Теория и системы управления. 2009. № 2. С. 104-113.

Kozlov, R.I., Kozlova, O.R. Investigation of stability of nonlinear continuous-discrete models of economic dynamics using vector Lyapunov function. I // J. of Comput. and Sys. Sci. Intern. 2009. Vol. 48, No. 2. P. 262-271.

[21] Васильев С.Н., Козлов Р.И., Ульянов С.А. Анализ координатных и других преобразований моделей динамических систем методом редукции // Тр. ИММ УрО РАН. 2009. Т. 15, № 3. С. 38-55.

Vasiliev, S.N., Kozlov, R.I., Yl'aynov, S.A. Analysis of coordinate and other transformations of models of dynamical systems by the reduction method // Proc. of the Steklov Institute of Mathematics. 2010. Vol. 268, Suppl. 1. P. 264-282.

[22] Васильев С.Н., Козлов Р.И., Ульянов С.А. Устойчивость многорежимных формаций // Докл. Академии наук. 2014. Т. 455, № 3. С. 269-274.

Vasiliev, S.N., Kozlov, R.I., Yl'aynov, S.A. Multimode formation stability // Doklady Mathematics. 2014. Vol. 89, No. 2. P. 257-262.

[23] Ramadge, P.J., Wonham, W.M. Supervisory control of class of discrete event processes // SIAM J. Control and Optimisation. 1987. Vol. 25, No. 1. P. 206-230.

[24] Software tool for building, analyzing controlling models of Discrete Event Systems (DES) as finite-state automata. Available at: https://wiki.eecs.umich.edu/desuma/index.php/DESUMA (accessed 10.09.2017).

[25] Cassandras, C.G., Lafortune, S. Introduction to discrete event systems. N.Y.: Springer, 2008. 800 p.

[26] Nagul, N.V. Generating conditions for preserving the properties of controlled discrete event systems // Autom Remote Control. 2016. Vol. 77(4). P. 672-686.

[27] Larionov, A., Davydov, A., Cherkashin, E. The calculus of positively constructed formulas, its features, strategies and implementation // Proc. of 36th Intern. Convention on Inform. and Commun. Technology, Electronics and Microelectronics (MIPRO), May 2013, Opatija, Croatia. N.Y.: IEEE, 2013. P. 1023-1028.

Поступила в редакцию 19 сентября 2017 г.

Event-based approach to multimode control of multi-AUV systems in a surveillance mission

Bychkov, Igor V., Davydov, Artem V., Nagul, Nadezhda V., Ul'yanov, Sergey A.*

Matrosov Institute for System Dynamics and Control Theory, SB RAS, Irkutsk, 664033, Russia

* Corresponding author: Ul'yanov, Sergey A., e-mail: sau@icc.ru

The aim of the work is to develop a new approach, which includes a combination of original methods and algorithms, to build a multilevel control system for a group of autonomous underwater vehicles (AUV), which ensures non-stop performance of a complex mission to survey the near-bottom region.

We propose a methodology, in which, considering the mission and the specific features of the underwater environment, a complex behavior of the group is divided into a set of elementary behaviors (operation modes), for which the following problems should be solved: path-following problem, formation control problem and the problem of cooperative avoidance of obstacles. Switching between modes occurs according to events that occur as a result of changing the model of the external environment and the current state of the group, and are implemented by the subsystem (DES). Low-level controllers tracking the required elementary behaviors of the group are designed with the help of the vector Lyapunov function technique which accounts sampled-data implementation of the exploited control schemes, measurement errors, uncertainties of AUV model's parameters, and constraints on control actions. To construct a distributed DES-based upper-level controller we employ the theory of supervised control of DES.

Some results of numerical computations and simulations for a group of identical large-sized AUVs are presented to demonstrate the operability of the proposed approach. Event-based cooperative control systems designed by the approach provide the level of intellectuality and sustainability of the group required to perform complex non-stop missions in real underwater conditions.

Keywords: underwater vehicle, formation control, vector Lyapunov function, discrete-event system.

Acknowledgements. This research was partly supported by RSF (grant No. 16-1100053).

Received 19 September 2017

СОБЫТИЙНЫЙ ПОДХОД К МНОГОРЕЖИМНОМУ УПРАВЛЕНИЮ ГРУППИРОВКОЙ ПОДВОДНЫХ РОБОТОВ В ОБСЛЕДОВАТЕЛЬСКОЙ МИССИИ Текст научной статьи по специальности «Математика»

Event-based approach to multimode control of multi-AUV systems in a surveillance mission

Текст научной работы на тему «СОБЫТИЙНЫЙ ПОДХОД К МНОГОРЕЖИМНОМУ УПРАВЛЕНИЮ ГРУППИРОВКОЙ ПОДВОДНЫХ РОБОТОВ В ОБСЛЕДОВАТЕЛЬСКОЙ МИССИИ»