Научная статья на тему 'Управление движением строя для мультиагентной системы, моделирующей автономных роботов'

Управление движением строя для мультиагентной системы, моделирующей автономных роботов Текст научной статьи по специальности «Математика»

CC BY
126
26
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МУЛЬТИАГЕНТНАЯ СИСТЕМА / MULTI-AGENT SYSTEM / ФОРМИРОВАНИЕ СТРОЯ / ДВИЖЕНИЕ СТРОЕМ / МОБИЛЬНЫЕ РОБОТЫ / MOBILE ROBOTS / ВИРТУАЛЬНЫЙ ЛИДЕР / VIRTUAL LEADERS / FORMATION CONTROL / FORMATION MOVEMENT

Аннотация научной статьи по математике, автор научной работы — Морозова Н.С.

В статье рассматривается задача по управлению движением строя определенной геометрической формы, состоящего из агентов, моделирующих автономных роботов. В статье предложен подход, основанный на виртуальных лидерах, который обеспечивает автоматическое изменение формы строя в ходе выполнения миссии в случае утраты связи или установления связи с очередным агентом, полную взаимозаменяемость агентов, помехоустойчивость. Основные представленные результаты это правила управления по скорости и по ускорению, итоги анализа разработанного на их основе алгоритма управления и компьютерного моделирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Formation control for multi-agent system, which models a group of autonomous robots

The control problem of maintaining formation with specific geometric structure for a group of agents, which represent autonomous robots, is considered in this article. The suggested method provides possibility to automatically change the formation structure during the mission in case any of the agents is damaged of a new agent is joining the group, the agents are fully interchangeable, the method is robust to measurement noises. The main provided results are the following: the control rule applied on both velocity and acceleration control level, the control algorithm based on suggested rules and the results of computer modelling.

Текст научной работы на тему «Управление движением строя для мультиагентной системы, моделирующей автономных роботов»

УДК 519.007.5

H. С. Морозова1

УПРАВЛЕНИЕ ДВИЖЕНИЕМ СТРОЯ ДЛЯ МУЛЬТИАГЕНТНОЙ СИСТЕМЫ, МОДЕЛИРУЮЩЕЙ АВТОНОМНЫХ РОБОТОВ

В статье рассматривается задача по управлению движением строя определенной геометрической формы, состоящего из агентов, моделирующих автономных роботов. В статье предложен подход, основанный на виртуальных лидерах, который обеспечивает автоматическое изменение формы строя в ходе выполнения миссии в случае утраты связи или установления связи с очередным агентом, полную взаимозаменяемость агентов, помехоустойчивость. Основные представленные результаты — это правила управления по скорости и по ускорению, итоги анализа разработанного на их основе алгоритма управления и компьютерного моделирования.

Ключевые слова: мультиагентная система, формирование строя, движение строем, мобильные роботы, виртуальный лидер.

I. Введение. В статье рассматривается задача формирования строя и его сохранения в процессе движения для группы агентов, моделирующих мобильных роботов. Для равномерного покрытия области, поддержания устойчивой связи друг с другом и избежания столкновений роботы должны при движении соблюдать заранее заданную геометрическую структуру строя (определенное расположение агентов относительно друг друга или относительно их центра масс, образующее геометрическую фигуру, например квадрат с заданной длиной стороны). Существуют и другие постановки задачи, в которых не требуется соблюдения заранее заданного относительного расположения агентов, например движение группы агентов внутри виртуального эллипсоидального контейнера при условии нестолкновения ее элементов. Решению задачи управления группой агентов в данной постановке посвящен цикл работ А. Б. Куржанского [1]. Роботы автономны и при помощи сенсоров могут получать только локальную информацию (в пределах действия сенсоров). Для управления агентами используется децентрализованное управление (единый управляющий центр отсутствует). Задача управления строем (formation control problem) имеет широкое

1 Факультет ВМК МГУ, асп., e-mail: natalia.s.morozovaQgmail.com

12 ВМУ, вычислительная математика и кибернетика, № 4

практическое применение в робототехнике для мобильных наземных роботов, подводных автономных аппаратов, беспилотных летательных аппаратов. Существующие на данный момент работы по управлению строем можно разделить условно по трем направлениям: задание желаемых расстояний между агентами с использованием теории жесткости графов [2, 3], использование консенсуса с фиксированной матрицей целевого относительного сдвига агентов [4, 5], задание виртуальных структур (причем зачастую положение структуры рассчитывается вне мультиагентной системы), каждый агент преследует фиксированную точку виртуальной структуры [6, 7]. Главные проблемы существующих подходов к решению задачи управления движения строем — трудности при возникновении внештатных ситуаций и при возникновении ошибок измерений. Данная работа отличается от существующих в части постановки задачи (в частности способом задания приемлемой точности соблюдения строя, введением понятия "своего" набора лидеров для каждого агента), в части реализации (оригинальные правила для самостоятельного расчета каждым агентом "своего" набора виртуальных лидеров и приоритетов лидеров), а также в части полученных результатов (динамически изменяющееся, а не фиксированное положение агента в структуре строя, адаптация к изменению количества агентов в группе, в том числе при внештатных ситуациях и ошибках измерений).

2. Постановка задачи.

Основные определения. Пусть W — ограниченное открытое связное подмножество Ж2 (все выкладки приводятся, не ограничивая общности, для случая W С К2). Введем в W неподвижную прямоугольную систему координат (СК) OXY. Допустим, что Т* G W — текущая целевая точка (метод легко обобщается на случай существования упорядоченного конечного набора целевых точек Ъ е- IV. где i = 1,... ,h).

Обозначим через Ai,..., Ап голономных агентов, моделирующих роботов, которые имеют в момент времени t координаты pi(t),... ,pn(t) соответственно. Агенты считаются материальными точками, начальные позиции п агентов — Pi(¿о), • • • ,Pn(ta) — задаются произвольно и заранее неизвестны.

Пусть г — радиус слышимости агентов: агенты i и j могут обмениваться информацией напрямую, если ||pi ^ Pj || ^ г. Если агенты г и j не находятся в прямой слышимости, они также могут обмениваться информацией опосредованно через других агентов, находящихся в прямой слышимости, например если ||p¿ — Pk|| ^ г и \\рк — p:¡\\ ^ г, то передача информации между г ш j возможна. Назовем возможность передачи информации о своем местоположении между агентами отношением слышимости. Отношение слышимости обладает свойством транзитивности. Под группой связности будем понимать группу агентов, в которой каждый агент находится в отношении слышимости с любым другим, Np = Ai i,..., Ац, — рассматриваемая группа связности размера к.

Пусть At — временной промежуток, требующийся для реализации агентами одного цикла управления: снятие показаний сенсоров, вычисление с использованием полученной от сенсоров информации и передвижение в соответствии с выполненными вычислениями, V^ax — максимальная скорость агентов.

Во всей статье, кроме пп. 5 и 6, рассматривается управление по скорости, характеризуемое уравнением Pi(t) = где щ — управление для г-го агента. В п. 6 исследуется управление

по ускорению, характеризуемое уравнением (t) = щ (t).

Геометрическая структура строя. Под целевой геометрической структурой (ЦГС) F^ понимается совокупность к точек с координатами, заданными в произвольной системе координат, масштаб которой совпадает с масштабом СК OXY; F^ = задается для каждого к от 1 до п (для всех допустимых размеров групп связности) таким образом, чтобы для каждого фиксированного к центр масс системы точек F^ был строго в центре системы координат, в которой задается ЦГС (рис. 1, а). Таким образом, имеем F\ = {F^}, F^ € R2 при к = 1; F2 = {F2\ F2}, F2\ FÍ € R2 при к 2: F„ {Fn\ ..., F£}, F¿ G R2 для всех j при к = п.

Целевые геометрические структуры задаются единым образом для всех агентов перед началом выполнения миссии и отражают желаемое взаимное расположение агентов относительно друг друга или их центра масс, которое должно быть достигнуто при определенном размере группы связности. В литературе такой способ задания иногда именуется виртуальной формацией (virtual formation). На основании знания ЦГС каждый агент может по определенному правилу рассчитать положение виртуальных лидеров в СК OXY.

а

о-

о

-е-

о

-е-

о

б о с о

X о

о о

о У

о

о

6

Рис. 1. Среда моделирования: а пример задания ЦГС для групп из 10 агентов, б моделирование на плоскости движения 10 агентов к целевой точке: при помощи виртуальных лидеров: агенты изображены закрашенными окружностями меньшего радиуса, виртуальные: лидеры незакрашенными окружностями большего радиуса. центр масс агентов Аеш соединен линией с целевой точкой (точка с крестиком)

Виртуальные лидеры. Виртуальный лидер это точка, принадлежащая IV, с координатами, заданными в СК ОХУ. Под набором виртуальных лидеров агента А^ понимается набор из к точек в IV, координаты которых рассчитаны этим агентом. Предполагается, что каждый агент, зная число агентов к в группе связности, рассчитает самостоятельно координаты к виртуальных лидеров. Каждому агенту А^ и ЦГС из к точек ..., будет соответствовать набор из к лидеров {Ь\ ..., ¿}: (^;.4г) <-» Ь!к Ь3к1 € Ж2. Таким образом, Ь3к1 это ]-ж виртуальный лидер из набора виртуальных лидеров, который был рассчитан агентом ц нижний индекс к показывает текущую размерность группы связности и соответственно текущее количество лидеров в наборе ¿-го агента. Правило расчета положения виртуальных лидеров описывается в п. 3.

Предположения и ограничения. В данной статье задача рассматривается в среде без препятствий, случай присутствия ошибок измерения разобран отдельно в п. 6. Предполагается, что обмен информацией между агентами и смена скорости происходят мгновенно (пренебрегаем временем перехода из одного скоростного режима в другой). Учтем два ограничения: скорость не может превышать Т'шах и кусочно-постоянная ограниченная функция. Ограниченное быстро-

действие систем управления моделируется изменением значений ||?/з(£)|| через равные промежутки времени в моменты I = д = 0,1,....

Агенту Аг в момент времени £ доступна следующая информация: ■ ■ ■ ,Рк(текущие ко-

ординаты всех агентов из группы связности, которой принадлежит А^; ,..., Еп ЦГС для групп связности всевозможных размеров; Т* положение целевой точки; Ат(£) текущий размер группы связности.

Формализация постановки зада,ни. Обозначим Асш центр масс агентов из рассматриваемой

группы связности, т.е. Асш(1) = — £).

К

Миссия для агентов А\,...,Ап считается выполненной, если в некоторый момент времени V < ос выполнены следующие условия:

• условие достижения целевой точки ||.4СШ(£') — Т*|| ^

• начиная с определенного момента £* < для каждого агента А^ существует виртуальный лидер Ьк ^ который находится в ¿-окрестности А* и 5 ^ (это условие соблюдения заданной структуры строя).

Лидер Ьк 1 это один из набора к лидеров {Ь\ ..., агента А^. Зависимость ^ = _]('!,, I) подчеркивает то, что для каждого агента г существует "свой" лидер с индексом из его набора лидеров и что может изменяться по мере движения.

13 ВМУ, вычислительная математика и кибернетика, № 4

3. Правило управления. Пусть угол между направлением АстТ* и осью ОУ будет харак-

(АстТ*) тг

теризоваться углом р = аг^ап —— — —.

)х £

Правило расчета положения виртуальных лидеров. Для расчета Ь3к ^ предлагается выполнить ортогональные преобразования над координатами что повлечет за собой изоморфность виртуальной структуры и структуры, которую образуют виртуальные лидеры для каждого агента. Обозначим матрицу поворота на угол ¡3 как Яр. Пусть Ь3к ^ = + Ви) + Аст — правило расчета положения ^'-го виртуального лидера для г-го агента в СК О XV на основании координат точек ЦГС, над точками которой выполнен параллельный перенос на управляющий параметр вектор !)„. поворот на угол /3 и параллельный перенос на радиус-вектор центра масс агентов из группы связности Нр (рис. 1, б). Управляющий параметр /)„ необходим для того, чтобы не сложилось такой ситуации, когда координаты агента становятся равными координатам виртуального лидера и происходит прекращение движения прежде, чем целевая точка будет достигнута группой.

При изложенном способе расчета положения виртуальных лидеров в условиях отсутствия ошибок измерений расположение виртуальных лидеров для любых двух агентов А^ и А^ из одной группы связности будет одинаковым. При наличии ошибок измерения набор лидеров для каждого агента "индивидуален" и не обязательно совпадает с набором другого агента, данный случай рассмотрен в п. 6.

Итоговое правило управления имеет следующий вид:

Рг||

< к

= ^ " Ч» = ЫН + А») + Лш.

3 = 1

В правило управления введены коэффициенты приоритета виртуальных лидеров сц (см. следую-

\ , , Кпах

щии пункт далее), нормировочный коэффициент для учета ограничения скорости и пони-

Рг||

жающий коэффициент ^ € (0;1], отличный от единицы, если в 5-окрестности (8 ^ УтахА1) г-го агента находится некоторый виртуальный лидер Ь3к1 (будем говорить в подобных ситуациях, что

лидер находится в прямом преследовании агентом). В этом случае = \\Ь3к1 — Рг||/^тах — это понижение скорости необходимо, чтобы агент не оказался впереди лидера.

Определение значений коэффициентов приоритета виртуальных лидеров для агента. Коэффициенты-приоритеты виртуальных лидеров для агента сц (г — номер агента, а, ] — номер лидера) определяют матрицу С С Ж/гх/г, их предлагается выбирать следующим образом:

{О, Ь3к 1 в прямом преследовании агентом А^ I ф г, О, агент ближайший для Ь'к I ф 1 иначе.

Коэффициент единица получает либо только первый из лидеров, не находящихся в прямом преследовании, к которому агент А^ является ближайшим из всех агентов, либо все лидеры, не находящиеся в прямом преследовании, для которых агент А^ не является ближайшим агентом. Алгоритм управления был улучшен следующими эвристиками:

• если Аг — ближайший агент к лидеру Ь3к ^ то сц должен быть равен 1, а коэффициенты этого же лидера для других агентов (су, I ф г) должны быть равны нулю для того, чтобы данный лидер оказывался в прямом преследовании ближайшим к нему агентом. Причем если Ь3к 1 — не находящийся в прямом преследовании лидер, то при вычислении ближайшего к нему агента следует исключить из рассмотрения агентов, которые уже прямо преследуют других лидеров;

• если несколько лидеров находятся на одинаковом расстоянии от агента, то агент должен брать в расчет только одного из них и проигнорировать остальных (соответствующие коэффициенты су = 0).

Вычисление С подобным образом зависит от порядка вычисления и описывается в виде алгоритма.

4. Формальное обоснование. Пусть количество агентов в группе связности к = const, 1)„ — фиксированный параметр управления, характеризующий сдвиг виртуальных лидеров относительно агентов, /)„ = (Dx,Dy)T € Ж2. Пусть U — j-й виртуальный лидер из числа рассчитанных агентом. Индекс к опущен, индекс г также можно опустить, так как наборы виртуальных лидеров, рассчитанные агентами г' и г" из одной группы связности, идентичны (в отсутствие помех и ошибок измерений); Аст центр масс агентов группы связности, Аст = (Ах, АУ)Т еЖ2.

Теорема. Пусть 1)„ = (0,Dy)T, где 0 < Dy ^ VmaxAt и для каждого агента At из группы связности Np (|iVp| = к) в некоторый момент времени t* нашелся единственный виртуальный лидер lJ\ находящийся в прямом преследовании (||L^(t*) — Pi(t*)|| ^ VmaxAt). Пусть имеет место взаимно однозначное соответствие т.е. агенту с номером i соответствует "свой" виртуальный лидер с номером ji и обратно, каждому виртуальному лидеру соответствует единственный агент. Тогда при предложенном правиле управления:

1) найдется такой момент i! ^ t*, t' < оо, начиная с которого будет выполнено условие достижения группой целевой точки

\\Т*^Аст\\ < VmaxAt, t^t'; (1)

2) при t ^ t* для каждого агента г будет выполнено условие соблюдения строя

IILji -р<|| < VmaxAt; e = ^ IIPi ~ Lji + RpDu|| = 0,

AteN„

ip

где е — ошибка соблюдения строя.

Доказательство. Сначала докажем первое утверждение теоремы. Рассмотрим вспомогательную векторную функцию /(¿) = Pi(t) —при Для нее /(¿) = — Поскольку в момент I* лидер находится в прямом преследовании агентом А^, то сц = 0 для всех ] ф ^^ и правило управления имеет вид р^ = — р^. Тогда /(¿) = 0, так как р^?) = 0, а значит, = Рг{Ь) = Pi(t)■ Следовательно, поскольку = 0, то и при Ь* + 8Ь {8Ь — малое приращение) также верно, что \\piit* + Л) — + Л)|| ^ Таким образом, после момента I* расстояние между каждым агентом и лидером, находящимся в прямом преследовании данным агентом, не будет превышать УтахА1, что обеспечит преемственность прямого преследования данного лидера для агента (коэффициент приоритета данного лидера будет равен 1, а коэффициенты всех прочих лидеров будут равны 0 для данного агента).

Введем функцию = Т* — Аст(£) — вектор от целевой точки Т* до центра масс группы Аст. Тогда = — Аст(£). По причине преемственности прямого преследования лидеров при £ ^ Ь* с учетом значений с^, ,1 = 1,... ,к,ш нормировочных коэффициентов уравнение движения агента А^ принимает вид р^ = ^ р%. Тогда для системы из к агентов для получим

рг = + 1>и) + 1 - Р1, Р1(Г) = р\,

.............................. (2)

Рк = + 1 Ей " Рк, РкЮ = р*к.

1=1

После сложения первых к уравнений системы (2) и некоторых преобразований получим

к , к

= + kD 1=1 \=1

к

По построению ^^F^ = 0, следовательно, Ácm = Н >•/.)„. А поскольку F(t) = —Ácm, то р=i

F(t) = -Н >,!)„. По определению угол ¡3 является углом между АстТ* и OY. Рассматривая проекцию />' >,!)„ на вектор АстТ*, равную \\R¡3DU\\ cosa, где а — угол между АстТ* и />' >•/.)„. равный

углу между ОУ и вектором /)„. можно увидеть связь между управляющим параметром /)„ и характером продвижения к целевой точке. При /),. = 0, Иу > 0 движение к цели происходит по кратчайшему пути вдоль луча Аст(1*)Т* (проекция максимальна), а функция расстояния до цели ||-Р(£)||

монотонно убывает ^в случае, когда Бу > 0, а Бх = 0, ^ = ' Поэтому начиная

с некоторого момента времени неравенство (1) будет выполнено.

1

Поскольку ||рг|| < Fmax, то ||Аст|| = -

^ Vmax. Отсюда \\RßDu\\ ^ Vmax, следовательно,

Pi

г

II-СиII ^ Vmax, так как H-Rßll = 1. При /).,. = 0 это приводит к ограничению на параметр управления Dy ^ Vmax ■

Теперь докажем второе утверждение теоремы. Выполнение условия соблюдения строя ||LJi(i) — Pi(t)II ^ VmaxAt при t ^ t* для каждого агента i было показано при доказательстве первого утверждения. Заметим: не только из того, что агент Aj находится в прямом преследовании своего виртуального лидера LP* следует pi = LP* — pi, но верно и обратное: из правила управления вида pi = — р^ следует неравенство \\pi(t) — || ^ Vmax при всех t > t*, так как

IIPi(t) — = ||—^ ^max- Таким образом, данные понятия эквивалентны.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Пусть 6i(t) = pi(t) — LJi(i) + Rß(t)Du. Докажем, что Це^Ц = 0. Поскольку при t ^ t* для всех агентов выполняется неравенство —pi\\ ^ VmaxAt, то правило управления г-м агентом при t ^ t* будет иметь вид pi = Rß{F:>i + /.)„) + Acm — pi. Рассмотрим 6i(t) при t ^ t*. После некоторых преобразований получим

ei(t) = -Pi{t) + RßDu = -pi(t) + Äcm(t). Продифференцируем обе части правила управления г-м агентом:

jtPi(t) = Jt(Rß(Fh + Du) + Л„„ - Pi(t)).

Тогда 0 = Acm(t) — pi(t) в силу того, что при t ^ t* Rß = const и движение центра масс происходит по направлению />' >•/.)„ = Rß{ß), где Dy > 0, т.е. вдоль Acm(t*)T*. Следователь-

к

но, 6i(t) = ~Pi(t) + Äcm(t) = 0 при t ^ t*, а значит, и е = ^ Це^Ц = 0 при t ^ t*. Теорема

г= 1

полностью доказана.

Следствие 1. После первичного формирования строя в момент времени t* при Du = (0 ,Dy)T агенты далее движутся так, что их центр масс движется вдоль вектора Acm(t*)T*.

Следствие 2. Движение агентов к целевой точке происходит по эллипсоидальной кривой при /).,. ф 0 и в направлении от целевой точки при Dy < 0. При Dy > VmaxAt ошибка строя превышает допустимые значения, так как агенты не успевают оказаться на расстоянии VmaxAt от виртуального лидера. В случае, когда 1)„ = (0, 0)т, движение прекращается после того, как строй впервые будет сформирован.

Найденные аналитически зависимости полностью подтверждаются моделированием.

Утверждение. Пусть /).,. = 0, Dy ^ VmaxAt и расстояние между каждыми двумя точками ЦГС не менее величины 2VmaxAt и не более г. Пусть в момент времени t — 0 агенты A4, г = 1 образуют группу связности Np, |iVp| = к, и имеют координаты

Рг{0) = Pia- Тогда в некоторый момент t* > 0 для каждого агента A4 найдется единственный виртуальный лидер lJ\ находящийся в прямом преследовании только агентом At {т.е. \\L3*(t*) — Pi(t*)К ^ VmaxAt), и имеет место взаимно однозначное соответствие

Формальное доказательство этого утверждения осложнено тем, что значения коэффициентов Cij зависят от порядка расчетов. Однако правила расчета коэффициентов и эвристики подобраны специально для обеспечения решения задачи эффективного распределения агентов и лидеров в прямом преследовании. Поскольку для каждого фиксированного лидера V множество {dij*,... ,dkj*}, где dij* = \\U — pi||, конечно и ограниченно, то в данном множестве обязательно найдется хотя бы один элемент, реализующий минимальное расстояние до лидера. Если этот агент

единственный, то в процессе своего движения с максимальной скоростью в кратчайшем направлении к лидеру он продолжит быть ближайшим из всех остальных агентов к данному лидеру в силу правил расчета сц, описанных в п. 3. С момента начала прямого преследования агентом лидер, находящийся в прямом преследовании, будет игнорироваться прочими агентами. Если же минимум достигается на нескольких агентах, то такие ситуации разрешаются применением эвристических правил, описанных в п. 3. Моделирование подтверждает, что приведенное выше утверждение выполняется.

5. Переход к управлению по ускорению. Управление по скорости накладывает определенные ограничения и на практике применяется лишь для ограниченного класса робототехнических систем, поэтому крайне важно убедиться, что полученное правило управления может быть адаптировано для роботов, управляемых по ускорению.

Ограничения и допустимый класс управлений. Помимо ограничений на скорость необходимо учесть ограничение на максимальное ускорение: ||p¿|| ^ атах. Таким образом, имеет место ограничение на управление ||«¿|| ^ атах, ограничение на максимальную скорость может быть реализовано

. min{||F¿||,Fmax} •

аппаратно и смоделировано следующим образом: pt = -——-V¿, V¿ = щ. Целесообразно

11 'i 11

рассматривать класс ограничений amax < Vmax/At, так как в прочих случаях изменение скорости происходит достаточно быстро, что может быть смоделировано управлением по скорости. По аналогии с управлением по скорости рассмотрим случай, когда — кусочно-постоянная функция и управление по ускорению щ соответственно также должно быть кусочно-постоянной функцией. При этом скорость Pi(t) становится непрерывной функцией от времени.

Трансформация правила управления. Сохраним все выработанные принципы управления и модифицируем правило управления с учетом наложенных ограничений. В случае управления по ускорению модель фактически учитывает инерцию объекта при измерении скорости (в уравнении в неявном виде присутствует мера инерции — масса, в данном случае равная условной единице) и описывается уравнениями

Pi(to) = Pío-i Рг(*о) = (О, 0)т; к

®i = Yl Cij(4,i - Р»), Lí,i = ЫЧ + Du) + 4m. j=l

6. Реализация алгоритмов управления и моделирование с учетом ошибки измерений. Моделирование подтвердило выведенную формально взаимосвязь управляющего параметра 1)„ и эффективности управления (более подробно данный вопрос рассмотрен в работе [8]), а также показало работоспособность обоих методов, в том числе при наличии ошибок измерений. Кроме того, метод корректно обрабатывает ситуации изменения количества агентов (внештатные ситуации на практике) в ходе выполнения миссии (более подробно данный вопрос рассмотрен в работе [9]). Для исследования того, насколько точно агенты соблюдают заданную структуру строя, введем метрику для измерения ошибки строя, полагая е = тах {ттЦр^ — Ь3к ¿||}, где

!■{.> = щч +

Пусть результатами измерения положения агентов-соседей и собственного положения для агента Аг являютсяр1 ¿(¿) = Рг(£)+аг,г(£), I = 1, ■ ■ ■ ,п. Здесь аг^(^) — вектор из Ж2, компоненты которого являются случайными величинами с непрерывным равномерным распределением, принимающими значения из интервала [—В, В]. Таким образом, в данном случае координаты центра масс группы связности и виртуальных лидеров, рассчитанные разными агентами, могут не совпадать между собой из-за введенной ошибки.

Для иллюстрации работы метода зафиксируем число агентов п = 8 и их начальное положение, зададим /)„ = (0,0.05), Т^х = 0.05 и проанализируем работу алгоритма при управлении по скорости и по ускорению (атах = О.бТ^пах) при разных значениях В (см. графики на рис. 2, 3).

min{\\Vi ,Fmax}

Рг = —га—

• _ minja тах;

Уг = —м—

а

200

160

120

80

40

о

Уо о

о^ег' X ---"х~~> -- X < X Х--' -----

0,15 0,12

0,09

0,06

0,03

X X____- с

X /

X с о

/) / X

/ с

0,05 0,10 0,15 0,20 0,25 0,30 Границы величины ошибки измерения

0,05 0,10 0,15 0,20 0,25 0,30 Границы величины ошибки измерения

х Управление по ускорению о Управление по скорости

Рис. 2. Результаты моделирования: а медиана ошибки строя при разных граничных значениях ошибки измерения В, величина медианы ошибки строя приведена в масштабных единицах СК ОХУ; б число шагов до достижения целевой точки при разных граничных значениях

ошибки измерения В

0,35

0,30

0,25

0,20

0,15

0,10

0,05

, в ■О В = 0, А В = 0 01 (управлеш [управление 01 (управленъ [управление 1е по ускорен ю ускорению] 1е по скорость ю скорости) лю)

ЩтО. л Ь М : А." V в = о, о в = о 1)

и Ц 1

Ь

V \ 1

V ^ Д ¿-о Ч

о.

10

20

30

60

70

40 50

Номер шага

Рис. 3. Динамика ошибки строя по шагам алгоритма при управлении по скорости и по ускорению для разных граничных значений ошибки измерения В

80

По графикам видно, что на точность поддержания заданной структуры строя и скорость дости-

В В

жения текущей целевой точки напрямую влияет соотношение —-—. При —-— ^ 1 ошибка

измерений вносит лишь некоторые колебания текущей структуры строя в пределах допустимой

В

ошибки строя. При -— >> 1 ошибка

строя начинает превышать V^ax^^ ^ движение к цели

происходит медленнее, так как агенты заняты непрерывным формированием строя из-за перестроений.

Моделирование также позволило выявить повышение ошибки строя вблизи целевой точки

В

(рис. 3). Всплеск ошибки перед достижением целевой точки почти не заметен при -— -С 1,

^max Aí

В

повышается вместе с ростом —-— и становится особенно заметным (многократно превышаВ

ющим допустимую погрешность) при —-— ^ 1. Для объяснения этого всплеска рассмотрим

»max"f

двух агентов, i' и i", в двух ситуациях (t = t1) и (t = í2). Первая ситуация: агенты на расстоянии D(ti) FmaxAt от T*, A'cm(ti) и A"m(í2) — координаты центра масс группы связности, рассчитанные каждым из агентов соответственно. Вторая ситуация: агенты на расстоянии D(i2) = FmaxAt от Т*, координаты центра масс AJ.m(í2) и A"m(í2) соответственно. При этом пусть в обеих ситуациях расстояние между А'сш и одинаково. Очевидно, что угол между A'cm(ti)T* и A"m(ti)T* будет меньше, чем угол между A'cm(t2)T* и A"m(í2)T*. Чем ближе агенты к целевой точке, тем больше разнится целевое направление движения с точки зрения разных агентов, а следовательно, и координаты виртуальных лидеров, построенных разными агентами, что вызывает всплеск ошибки строя. При этом данный всплеск наблюдается как при управлении по скорости, так и при управлении по ускорению.

В ходе моделирования удалось установить, что алгоритм обладает существенным запасом устойчивости к ошибкам измерения, что является его существенным преимуществом при применении на практике. К недостаткам предложенного правила управления можно отнести активное использование свойства транзитивности отношения слышимости (без учета на ограничения канала связи).

СПИСОК ЛИТЕРАТУРЫ

1. КуржанскийА.Б. О задаче группового управления в условиях препятствий // Труды Ин-та матем. и мех. УрО РАН. 2014. 20. № 3. С. 166-179.

2. Eren T., Belhumeur Р., Anderson В. et al. A framework for maintaining formation based on rigidity // Proc. of the 15th IFAC World Congress. Vol. 15. Barcelona: International Federation of Automatic Control, 2002. P. 1306-1306.

3. Eren T., Morse A. S., Belhumeur P.N. Closing ranks in vehicle formations based on rigidity//Proc. IEEE Conf. Decision and Control. Vol. 3. Las Vegas: IEEE, 2002. P. 2959-2964.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. Olfari-Saber R., Fax J. A., Murray R. M. Consensus and cooperation in networked multi-agent systems // Proc. IEEE. 2007. 95. N 1. P. 215-233.

5. Wang J., Nian X., Wang H. Consensus and formation control of discrete-time multi-agent systems // J. Cent. South Univ. Tech. 2011. 18. N 4. P. 1161-1168.

6. Lewis M. A., Tan K. High precision formation control of mobile robots using virtual structures // Autonomous Robots. 1997. 4. N 4. P. 387-403.

7. Lalish E., Morgansen K., Tsukamaki T. Formation tracking control using virtual structures and deconfliction // Proc. of the 2006 45th IEEE Conference on Decision and Control. San Diego: IEEE, 2006. P. 5699-5705.

8. Морозова H. С. Формирование строя и движение строем для мультиагентной системы с динамическим выбором структуры строя и положения агента в строю // Труды XII Всероссийского совещания по проблемам управления "ВСПУ-2014". М.: ИПУ им. В. А. Трапезникова РАН, 2014. С. 3822-3833.

9. Морозова Н. С. Виртуальные формации и виртуальные лидеры в задаче о движении строем группы роботов // Вестн. Санкт-Петербургского ун-та. Сер. 10. Прикл. матем. Информатика. Процессы управления. 2015. № 1. С. 135-149.

Поступила в редакцию 20.02.15

FORMATION CONTROL FOR MULTI-AGENT SYSTEM, WHICH MODELS A GROUP OF AUTONOMOUS ROBOTS

Morozova N. S.

The control problem of maintaining formation with specific geometric structure for a group of agents, which represent autonomous robots, is considered in this article. The suggested method provides possibility to automatically change the formation structure during the mission in case any of the agents is damaged of a new agent is joining the group, the agents are fully interchangeable, the method is robust to measurement noises. The main provided results are the following: the control rule applied on both velocity and acceleration control level, the control algorithm based on suggested rules and the results of computer modelling.

Keywords: multi-agent system, formation control, formation movement, mobile robots, virtual leaders.

i Надоели баннеры? Вы всегда можете отключить рекламу.