Научная статья на тему 'Методы коррекции инерциальных оценок координат при управлении группой подвижных объектов'

Методы коррекции инерциальных оценок координат при управлении группой подвижных объектов Текст научной статьи по специальности «Физика»

CC BY
243
46
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МУЛЬТИАГЕНТНАЯ СИСТЕМА / КОРРЕКЦИЯ КООРДИНАТ / ЦЕНТРАЛИЗОВАННЫЙ НАБЛЮДАТЕЛЬ / РАСПРЕДЕЛЁННЫЙ НАБЛЮДАТЕЛЬ / УПРАВЛЕНИЕ / ОПОРНЫЙ ОБЪЕКТ / MULTI-AGENT SYSTEM / COORDINATE CORRECTION / CENTRALIZED OBSERVER / DISTRIBUTED OBSERVER / CONTROL / VIRTUAL OBJECT

Аннотация научной статьи по физике, автор научной работы — Белов Роман Валерьевич, Казанин Дмитрий Константинович, Огородников Кирилл Олегович

Описывается модель группы подвижных объектов (мультиагентная система). Каждый объект (агент) является материальной точкой на плоскости. Реализуется управление этой системой. Рассматриваются методы коррекции оценок координат.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по физике , автор научной работы — Белов Роман Валерьевич, Казанин Дмитрий Константинович, Огородников Кирилл Олегович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Methods to correct inertial coordinate estimates in mobile group control

We study the group of mobile objects as a multi-agent system where each object (an agent) is modeled with a material point on the plane. We develop the control for this system and suggest the method to correct coordinate estimates.

Текст научной работы на тему «Методы коррекции инерциальных оценок координат при управлении группой подвижных объектов»

УДК 007.52 ББК 32.817

МЕТОДЫ КОРРЕКЦИИ ИНЕРЦИАЛЬНЫХ ОЦЕНОК КООРДИНАТ ПРИ УПРАВЛЕНИИ ГРУППОЙ ПОДВИЖНЫХ ОБЪЕКТОВ

Белов Р. В.1

(ОАО АНПП «Темп-Авиа», Арзамас) Казанин Д. К.2, Огородников К. О.3

(ОАО АНПП «Темп-Авиа», Арзамасский политехнический институт (филиал НГТУ),

Арзамас)

Описывается модель группы подвижных объектов (мультиа-гентная система). Каждый объект (агент) является материальной точкой на плоскости. Реализуется управление этой системой. Рассматриваются методы коррекции оценок координат.

Ключевые слова: мультиагентная система, коррекция координат, централизованный наблюдатель, распределённый наблюдатель, управление, опорный объект.

1. Введение

Задачи управления мультиагентными системами (МАС) [1, 4] являются предметом обширных исследований последние несколько лет. Такие системы имеют широкий спектр применения, включая моделирование окружающей среды, наблюдение и спасательные операции в военных и гражданских целях, мони-

1 Роман Валерьевич Белов, инженер-математик.

2 Дмитрий Константинович Казанин, инженер-математик, аспирант (ту^1епо 7@rambler.ru).

3 Кирилл Олегович Огородников, техник, студент.

торинг лесов и сельскохозяйственных угодий, приложения здравоохранения, совместная обработка информации и т.д.

В последние годы использование теории графов позволило достичь ряда результатов, получивших применение в вопросах передачи данных между агентами для координации МАС. Основанные на теории графов стратегии информационного консенсуса для управления МАС широко рассматриваются в [2, 9]. Децентрализованный [3, 7] информационный консенсус требует только локального обмена данными между агентами. Основная идея такого типа консенсуса заключается в том, что каждый агент обновляет своё информационное состояние на основе информационных состояний его локальных соседей, и таким образом информационное состояние всей системы сходится к общему согласованному значению. Задачи консенсуса также решаются при управлении формациями [6, 8]. Однако динамика каждого агента зависит от неопределенностей связей МАС. Достоверность информации растёт с увеличением времени взаимодействия агентов, но уменьшается в зависимости от зашумлённости информации. Эта проблема может быть решена путём разработки схемы информационного консенсуса на основе фильтра Калмана [5, 10] для динамической МАС.

Отслеживание опорного объекта является одной из важных проблем при управлении МАС. Алгоритмы, рассматриваемые в данной статье, учитывают шум измерителя каждого отдельного агента в сети. Эта работа мотивируется необходимостью разработки эффективного фильтра Калмана в задачах консенсуса, который будет включать шумы каждого измерителя и обеспечит более точную оценку вектора состояния целевого агента (опорного объекта). Фильтр Калмана применяется для решения такого рода проблем, поскольку он может работать с измерениями, которые наблюдаются в течение долгого времени и содержат шумы (случайные вариации) и другие неточности. В связи с вышесказанным является актуальной задача построения распределённой вычислительной системы, обеспечивающей формирование качественной и достоверной информации о взаимном положении агентов, а также её использование при управлении строем.

Модель группы подвижных объектов рассматривается как мультиагентная система на плоскости. Отдельные объекты (агенты) рассматриваются как материальные точки. Ставится задача оценить возможность формирования строя, рассматриваемого как упорядоченное состояние мультиагентной системы, по различной первичной информации.

Строем считается такое состояние системы, при котором минимизируются невязки координат каждого объекта с заданными для каждого момента времени координатами (опорный объект), а дальности между любыми парами объектов не меньше заданного значения: (1) |x(. (n) - x (n)\ ^ min,

(2)

где n - номер итерации; i = 1, ..., m, агентов; m - число агентов в МАС; v( x)(n)'

> D„

m, j Ф i - номера

X (n) =

X (n)

v( y)(n) У(n)

- вектор состояния /-го объекта на п-й итерации (включает в себя проекции координат и скорости объекта);

X (n) =

v

X (n) v(y)(n)

y (n)

- вектор состояния опорного объекта на п-й итерации; Дшп - заданное минимальное значение дальности между агентами.

Предполагается, что агенты обмениваются между собой информацией о дальностях до других агентов и о собственных координатах и скоростях. Для оценки координат вектора состояния по дальностям и скоростям рассматриваются градиентный

2

1

метод с фиксированным шагом, а также централизованный и распределённый наблюдатели, использующие фильтр Калмана. Управление каждым объектом мультиагентной системы реализуется относительно некоторого опорного (виртуального) объекта с соблюдением ограничения минимальной дальности между агентами.

2. Модель объекта в централизованной системе

Модель объекта характеризуется уравнением состояния в виде (3):

(3) X (п +1) =

1 0 0 0' 'АТ 0'

АТ 1 0 0 0 0

х, (п) +

0 0 1 0 0 АТ

0 0 АТ 1 0 0

и, (п),

ции; ui (п) =

управляющее воздействие, представля-

где х (п +1) - вектор состояния /-го объекта на (п + 1)-й итера-

~и (х)(п) ' и (у)(п)

ющее собой ускорение объекта; АТ - период дискретизации.

Вектор измерения ^ включает в себя измерения радиальной дальности между объектами и проекции скорости (4): V(х{ (п) - х (п))2 + (у{ (п) - У1 (п))2

(4) (п) =

д/(х{ (п) - хз (п))2 + (у{ (п) - у 3 (п))

л/^спь^сп^сУдпкУлп?

х)(п) V (у)(п)

где 7 (п) - выход модели, за счет которого проводится коррекция объекта на п-й итерации; ^ - шум измерения - нормально

+ Лг ,

2

распределенная величина с параметрами N(0, а), где а = 100 м для дальностей и а = 3 м/с для скоростей /-го объекта.

3. Модель распределенной системы

Взаимодействие объектов в группе предполагает возможность отправки каждым объектом сообщения, содержащего любую известную ему информацию. Остальные объекты могут принять отправленное сообщение с заданной вероятностью и временной задержкой. Принимающий объект получает вместе с ним оценку дальности до отправившего сообщение объекта.

Структура сети связи задается полносвязным графом (что не является необходимым условием) (см. рис. 1), т.е. каждый объект может принять сообщение, отправленное любым другим объектом.

Рис. 1. Структура МАС

(5)

(6) (7)

Модель объекта остается такой же, как и в централизованном случае, за исключением количества измеряемых дальностей и временной задержки.

4. Управление объектами и формирование строя

На рис. 2 и рис. 3, приведенных ниже, показаны траектории и мгновенные позиции объектов, полученные с помощью алгоритма формирования строя (5)-(7).

ип(х) (п) = к • (хг (п) - х(п)) + к2 • (у(х) (п) - V(х) (п)), ип(у) (п) = к, • (у, (п) - у(п)) + к2 • Vу) (п) - V(у) (п)), и4,(х)(п) = п (х)(п) •((втш - Б, (п))+к2 •V, (п)), ий(у)(п) = п(у)(п) •((ВтШ - Б, (п))+к2 • V, (п)), и (х) (п) = -(ип (х) (п) + ий (х) (п)), и (у (п) = -(ип (у ) (п) + ийу) (п)), где к\ = 1, кг = 5 - коэффициенты ПД-регулятора; ип(х (п)

управляющее воздействие для минимизации невяз-

un(y) (n)

ки координат; Dji (n) = (Xj (n) - xt (n))2 + (yj (n) - yt (n))2

эасстояние между j и i объектами на n-й итерации; , , Xi (n) - Xt (n)

n ^ )(n) =

Di

y3 (n) - y t (n) D„

нормы невязок траекторных коорди-

; Vjt(n) = (y(x) (n) -v(x) (n))-nf (n) + (y(y)(n) -v(y) (n))-n f (n)

нат;

модуль вектора рассогласования скоростей;

ud ( x)(n) ud (y ) (n)

управ-

ляющее воздействие для ограничения минимального расстояния, на которое могут сблизиться] и / объекты.

Алгоритм (5) минимизирует невязку координат каждого объекта с опорным объектом с помощью линейного ПД-регулятора. При этом сближение объектов ограничено и управляется отдельным для каждой пары объектов ПД-регулятором (при условии, что Ву < Вшт) (6). Минимальное расстояние Вшт, на которое объекты могут сблизиться, задается постоянным.

На рис. 4 показано минимальное расстояние между объектами в каждый момент моделирования. Время моделирования -300 с. Шаг моделирования - 0,01 с.

Рис. 2. Траектории управляемых объектов и опорного объекта

Рис. 3. Траектории управляемых объектов и опорного объекта

2000 1900 В- 1800

и 1600

0

И

^

| 1500

в и

1 1400

1300 1200

т. я альное расстояние ---■'

0

50

100

150 ремя, с

200

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

250

300

Рис. 4. Минимальное расстояние между объектами

5. Коррекция инерциальных оценок координат по дальностям между объектами в группе

В данной работе рассматривается задача построения распределённой вычислительной системы, обеспечивающей формирование качественной и достоверной информации о взаимном положении агентов, а также её использование при управлении строем. Для обеспечения качественной и достоверной информации о взаимном положении агентов были рассмотрены и численно промоделированы несколько алгоритмов коррекции.

Инерциальные оценки формировались по уравнениям объекта, используя известные управляющие воздействия. Начальное состояние каждого объекта формировалось с неопределенностями.

5.1. ГРАДИЕНТНЫЙ МЕТОД С ФИКСИРОВАННЫМ ШАГОМ

Метод осуществляет итеративную минимизацию невязки по дальностям. Каждый объект минимизирует невязки только по дальностям до себя и корректирует только свои координаты (см. рис. 5). Получение дальностей происходит путем постоянной рассылки сообщений от соседних объектов.

В процессе работы распределенной версии у каждого объекта накапливается своя очередь сообщений, которую он, по мере возможности, должен обработать.

Рис. 5. Корректировка координат объекта

Хког = Хпког + ГеС1

где ё - норма исходного объекта; хког - корректированный вектор координат исходного объекта; Ук - корректированный

вектор скоростей исходного объекта; хпког =

Хпког У пког

вектор

координат исходного объекта; Упког =

/ х)

пког

/ у)

пког

вектор скоро-

стей исходного объекта; Г - вектор направления единичной длины от исходного до соседнего объекта; е - невязка по дальностям; С1 = -0,1; С2 = -0,01 - весовые коэффициенты.

На рис. 6 показано функционирование только для пары объектов. Корректировка остальных пар объектов происходит аналогично.

Рис. 6. Градиентный метод с фиксированным шагом

ког пког 2

Предлагаемый градиентный метод определяет координаты с точностью до преобразований поворота и переноса. Истинные траектории заданы с помощью алгоритма управления строем (5)-(7) и вычисляются согласно выражению (3).

Минимальное расстояние, на которое могут приблизиться объекты, было задано равным 2000 м. Время моделирования -100 с. Шаг моделирования - 0,001 с.

5.2. ЦЕНТРАЛИЗОВАННЫЙ НАБЛЮДАТЕЛЬ, ИСПОЛЬЗУЮЩИЙ ФИЛЬТР КАЛМАНА

В данном варианте, используя модели каждого из объектов, записывается модель всей системы, а по ней строится наблюдатель, основанный на фильтре Калмана.

Предлагаемый метод находит координаты с точностью до преобразований, сохраняющих расстояния. Если траектории объектов таковы, что относительные координаты (и дальности) значительно изменяются в процессе наблюдения, то неопределенность по повороту может быть устранена.

Для проверки неопредёленности по повороту управление формируется следующим образом:

к • х,(и)

(9) й™ =

ХП . х« + у« . у«

где к = -105 - весовой коэффициент.

Фильтр Калмана использует следующие матрицы преобразования:

(10) А =

А 0 0 ■ 0

0 А 0 ■ 0

0 0 А ■ 0

0 0 0 ■ ■ А

где А =

1 0 0 0

АТ 1 0 0

0 0 1 0

0 0 АТ 1

А - матрица перехода между состояниями (динамическая модель системы); АТ - период дискретизации.

Р 0 0 ■■■ 0

0 Р 0 ■■■ 0

(11) Р = 0 0 Р ■.. 0

0 0 0 ■ Р

'а 0 0 0 "

0 а( )0 0

где Р = а

0 0 0

0 0 0 а(>)

Р - матрица ковариации вектора состояния; а(ух) = а(ХУ) = 302, а(х) = а(у) = (3е + 3)2 - начальные неопределенности по скоростям и координатам соответственно.

(12) б =

" 1 0 0 0 ■■ • 0"

0 0 0 0 ■ • 0

0 0 1 0 ■ • 0

0 0 0 0 ■ • 0

0 0 0 0 ■ • 0

где Q - ковариация шума процесса.

(13)

С =

8(2, - ^ п ^ - и 0 8(гм -^ п 8(гм - О

8 х

8 7

- ^ л ^ -

0

8 7

8х 0

8 7 0

-2из) г, -+3)

8 7

0

0

0

0

0

0

0

0

0

0 0

8(гп - -1)

8 7

где С - матрица измерений, отображающая отношение измерений и состояний.

Матрица С строится следующим образом:

- каждый объект имеет ровно 4 ячейки в каждой строке;

- каждая строка матрицы - два отдельно рассмотренных объекта;

- в последующих строках не могут рассматриваться те пары объектов, которые рассмотрены ранее.

(14) Я =

А

о о

о

о о

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

д о о д

о о

о

д

где Я - ковариация шума измерения; А и Бг - параметры, определяющие погрешности измерений.

В данном случае погрешности имеют нормальные распределения с нулевыми математическими ожиданиями и средне-квадратическими отклонениями ^/Д и д/Д". Число элементов

Б и Бг в матрице определяется количеством ребер неориентированного графа моделируемой системы.

о

о

о

о

о

о

о

о

о

о

о

о

Величина Я как ошибка измерения может быть определена испытанием измерительных приборов и определением погрешности их измерения.

Для реализации фильтра Калмана были использованы следующие уравнения:

(15)

Рп\п-\ - АпРп_\ | п_\Ап + Qn - предсказание ошибки ковариации,

п | п - 1 указывает на переход от (п - 1)-й итерации к п-й итерации;

(16) Кп - Рп\п_\С1(СпРп\п_\С1 + К )_\ - выЧисление коэффициентов усиления;

(17) Рп\ п - Рп\п_\ _ КпСпРп\п_\ - обновление ошибки ковариации.

На рис. 7 видно, что неопределенность по повороту отсутствует. Время моделирования - 250 с. Шаг моделирования - 1 с.

к ю

Щ^1

--- - = ~ 1

......^

€ые траектории а

-Истиш --Оценк

1 1

-5

-4

-3 -2

к, м

-1

х 10

Рис. 7. Централизованный наблюдатель, использующий фильтр Калмана

5.3. РАСПРЕДЕЛЕННЫЙ НАБЛЮДАТЕЛЬ, ИСПОЛЬЗУЮЩИЙ ФИЛЬТР КАЛМАНА

Другим способом решения поставленной задачи может быть использование распределённой вычислительной системы, построенной с использованием группы наблюдателей.

В вектор состояния записываются только координаты одного объекта. Имеются отдельные наблюдатели для каждого из объектов. Данный метод должен обеспечивать большую скорость сходимости, чем градиентный метод. Неопределенность по повороту устраняется введением искусственных колебаний, при этом изменяется минимальная дальность между объектами.

Для построения фильтра Калмана используются следующие матрицы линеаризованной модели объекта:

" 1 0 0 0" "АТ 0 "

АТ 1 0 0 0 0

А = , в =

0 0 1 0 0 АТ

0 0 АТ 1 0 0

(18)

С =

5(22 " 21) п 5(22 " 21)

5(2з - 21)

5(- 21)

5(2з - 21)

5(- 2 )

1 0

5х 0 0

0 1

0 0

Отправка сообщений объектам проводится случайным образом, интервал времени между двумя рассылками составляет 5-25 итераций (в зависимости от сформированной случайной величины).

На рис. 8 и рис. 9 показаны истинные траектории и их оценки. При ^ = 250 с происходит смена направления движения

0

0

0

0

0

опорного объекта (скорости по осям х и у меняются с 200 м/с и 100 м/с на -300 м/с и 20 м/с соответственно). При I = 100 с управление начинает замыкаться по координатам оценок объектов (при / < 100 с ускорение задавалось с помощью истинных координат).

На рис. 10 показано минимальное расстояние между объектами в каждый момент моделирования. Время моделирования -500 с. Шаг моделирования - 0,01 с.

Для получения оценки скорости сходимости в рамках принятой модели с неидеальными измерениями необходимы дополнительные теоретические результаты и дополнительное моделирование, которые планируется провести на дальнейших этапах исследования.

ж

3.5

2.5

1.5

0.5

х 10

-0.5

-3

! ! _ _ _ .

'¿ШаУ'Р

---- -Истинные траектории --Оценка

-2

-1

х 10

Рис. 8. Распределенный наблюдатель, использующий фильтр Калмана

Рис. 9. Распределенный наблюдатель, использующий фильтр Калмана

Рис. 10. Минимальное расстояние между объектами

6. Выводы

1. Исходя из полученных в результате моделирования графиков, наблюдается возможность формирования строя группы объектов по измерениям дальностей между объектами и скорости их движения. При этом показана возможность компенсации ошибок задания местоположения и скорости.

2. Наблюдаемость по повороту при коррекции по дальностям достигается только при относительном движении объектов группы. Это может потребовать постоянного преобразования строя и означать невозможность удержания неизменной формации длительное время.

3. Все рассмотренные методы используют одну идею линейного рекуррентного наблюдателя, а отличаются лишь оптимальностью коэффициентов обратной связи и возможностью

децентрализованной работы.

Литература

1. CHUNG S.J., SLOTINE J.J. Cooperative Robot Control and Concurrent Synchronization of Lagrangian Systems // IEEE transactions on Robotics. - 2009. - Vol. 25, №3. - P. 686-700.

2. FAX J., MURRAY M R. Information Flow and Cooperative Control of Vehicle Formations // IEEE Transactions on Automatic Control. - 2004. - Vol. 49, №9. - P. 1465-1476.

3. GENE MB., ANANYEV S., CARPENTER JR. Decentralized Control of Satellite Clusters Under Limited Communication // AIAA, Journal of Guidance,Control and Dynamics. - 2006. -Vol. 29, №1. - P. 134-145.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. OLFATI-SABER R., MURRAY R. Distributed Cooperative Control of Multiple Vehicle Formations Using Structural Potential Functions // 15th IFAC World Congress, Kidlington, Oxford, U.K. - 2002. - P. 346-352.

5. OLFATI-SABER R. Distributed Kalman Filtering and Sensor Fusion in Sensor Networks // Networked embedded sensing and control, Springer Berlin Heidelberg. - 2006. - P. 157-167.

6. OLFATI-SABER R. Flocking for Multi-Agent Dynamic Systems: Algorithms and Theory // IEEE Transactions on Automatic Control. - 2005. - P. 401-420.

7. REN W., BEARD R.W. A Decentralized Scheme for Spacecraft Formation Flying via the Virtual Structure Approach // Proc. American Control Conference, Evanston, IL. - 2003. -P.1746-1751.

8. VEERMAN J.J.P., LAFFERRIERE G., CAUGHMAN J.S., WILLIAMS A. Flocks and formations // Journal of Statistical Physics. - 2005. - Vol. 121, Issue 5-6. - P. 901-936.

9. REN W., BEARD W., ATKINS E.M. Information Consensus in Multivehicle Cooperative Control // IEEE Control Systems Magazine. - 2007, April. - Vol. 27, №2. - P. 71-82.

10. REN W., BEARD R.W., KINGSTON D.B. Multi-Agent Kalman Consensus with Relative uncertainty // American Control Conference. - 2005, June., Vol. 3. - P. 1865-1870.

METHODS TO CORRECT INERTIAL COORDINATE ESTIMATES IN MOBILE GROUP CONTROL

Roman Belov, «Temp-Avia», Arzamas, engineer-mathematician. Dmitriy Kazanin, «Temp-Avia», Arzamas Polytechnical institute, Arzamas, engineer-mathematician, post-graduate student (mysterio7@rambler.ru).

Kirill Ogorodnikov, «Temp-Avia», Arzamas Polytechnical institute, Arzamas, technik, student.

Abstract: We study the group of mobile objects as a multi-agent system where each object (an agent) is modeled with a material point on the plane. We develop the control for this system and suggest the method to correct coordinate estimates.

Keywords: multi-agent system, coordinate correction, centralized observer, distributed observer, control, virtual object.

Статья представлена к публикации членом редакционной коллегии П.Ю. Чеботарёвым

Поступила в редакцию 10.04.2014.

Опубликована 31.01.2015.

i Надоели баннеры? Вы всегда можете отключить рекламу.