Научная статья на тему 'Рандомизация в контуре управления легкого БПЛА при полете в условиях неизвестных измененийнаправления ветра'

Рандомизация в контуре управления легкого БПЛА при полете в условиях неизвестных измененийнаправления ветра Текст научной статьи по специальности «Математика»

CC BY
341
99
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАНДОМИЗИРОВАННЫЕ АЛГОРИТМЫ / АЛГОРИТМЫ ОПТИМИЗАЦИИ / БЕСПИЛОТНЫЕ ЛЕТАТЕЛЬНЫЕ АППАРАТЫ / АЛГОРИТМЫ ФИЛЬТРАЦИИ / СИСТЕМА НАВИГАЦИИ / RANDOMIZED CONTROL / WIND DIRECTION / UNMANNED AERIAL VEHICLE / SMALL UAV / OPTIMIZATION / UNKNOWN ARBITRARY NOISE

Аннотация научной статьи по математике, автор научной работы — Амелин Константин Сергеевич

Рассматривается возможность применения рандомизированных алгоритмов в контуре управления легкого беспилотного летательного аппарата (БПЛА) для оптимизации его полета в плоскости в условиях неизвестных изменений направления ветра. Описывается архитектура легкого БПЛА, в котором основным датчиком ориентирования в геодезической системе координат является навигационная система с модулем ГЛОНАСС/GPS. Показания с ГЛОНАСС/GPS приемника поступают в систему набором данных в дискретные моменты времени. Предполагается, что на динамику полета БПЛА оказывает неконтролируемое влияние ветер, а наблюдения производятся с неизвестными, но ограниченными ошибками в системе навигации. Предлагается рандомизированный алгоритм, отфильтровывающий такие почти произвольные ошибки в наблюдении. Работоспособность нового алгоритма при нерегулярных помехах в наблюдениях иллюстрируется примерами имитационного моделирования в сравнении с традиционными подходами.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Амелин Константин Сергеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Randomization in control loop for small UAV Fly optimization under unknown changes of wind direction

The possibilities to add randomization in control loop for optimizing the trajectory of the UAV horizontal flying under unknown changes of wind direction are considered. A small UAV which is equipped only with the GPS module for navigation are suggested. Only the positions data obtained iteratively at discrete time instants can be used. The user has to be able to add test perturbations through the input channel. The assumptions about the noise are reduced to minimum. It can virtually be arbitrary but independent to test perturbations. Simulation of theoretical results are given. The operability of the new algorithm under irregular noises in observations in comparison with traditional approaches is illustrated. For practical usage a small autonomic unmanned planner with an autopilot and additional microcomputer on the board are designed. The effective interoperability processes between autopilot and a microcomputer based on SIP are organized. The connection between microcomputer and the ground base station or between microcomputer and the other UAVs by Wi-Fi or Internet connection is established.

Текст научной работы на тему «Рандомизация в контуре управления легкого БПЛА при полете в условиях неизвестных измененийнаправления ветра»

2013 ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА Сер. 10 Вып. 2

ИНФОРМАТИКА

УДК 62-50 К. С. Амелин

РАНДОМИЗАЦИЯ В КОНТУРЕ УПРАВЛЕНИЯ ЛЕГКОГО БПЛА ПРИ ПОЛЕТЕ В УСЛОВИЯХ НЕИЗВЕСТНЫХ ИЗМЕНЕНИЙ НАПРАВЛЕНИЯ ВЕТРА*)

1. Введение. В последнее время для исследования и мониторинга территорий все чаще применяются легкие беспилотные летательные аппараты (БПЛА). При этом качество выполнения задач в значительной степени зависит от точности позиционирования и соблюдения заданной траектории движения. Развитие навигационных сетей ГЛОНАСС/GPS существенно упрощает решение задач позиционирования при использовании показаний датчиков ГЛОНАСС/GPS в комбинации с инерциальной системой. Такая комбинация используется в больших и дорогостоящих БПЛА (до 6 м в размахе и до 600 кг весом). При этом применяются массивные инерциальные системы навигации с гироскопами, магнитометрами, акселерометрами и различными сложными измерительными приборами, с помощью которых удается существенно снизить уровни погрешностей измерений при полете и обеспечить достаточно точное позиционирование. Технологический прогресс, миниатюризация исполнительных устройств, рост их доступности и расширение функциональных возможностей позволяют начать эффективно использовать легкие БПЛА для исследований и мониторинга территорий. Сравнительно малые размеры и легкий вес являются, с одной стороны, основой «дешевизны» соответствующих технических решений, но, с другой - не позволяют внедрять мощные инерциальные навигационные системы, ограничивая применения инерциальной системы только для поддержания «текущего» равновесия. Для позиционирования таких объектов принимаются во внимание в основном показания датчиков ГЛОНАСС/GPS, которые поступают в дискретные моменты времени и часто включают в себя систематические погрешности. Задача предсказания значений случайного процесса, порождаемого белым шумом, пропущенным через линейный фильтр, - наиболее типичная для калмановской фильтрации, которая базируется на работах Р. Е. Калмана и Р. С. Бью-си [1]. Наряду со статистическими развиваются и минимаксные постановки задач, в которых предполагается, что неопределенности только ограниченны в каком-либо смысле, в остальном они могут быть произвольными. В таких постановках при априорно

Амелин Константин Сергеевич — младший научный сотрудник, Санкт-Петербургский государственный университет; e-mail: konstantinamelin@gmail.com.

*) Работа выполнена в рамках исследований в СПбГУ по теме № 6.38.71.2011 «Изучение свойств и возможностей применения рандомизированных алгоритмов кластеризации, оптимизации и оценивания» и при финансовой поддержке Федеральной целевой программы «Кадры» (госконтракт №16.740.11.0042).

© К. С. Амелин, 2013

известном уровне возмущений обычно удовлетворяются получением предсказаний в виде множеств, у которых размеры стабилизируются с течением времени [2-10]. При этом фактически не рассматриваются возможности получения обоснованных точечных оценок. Дальнейшее практическое использование оценок-множеств ведет к сложным задачам робастной устойчивости [11].

Недостаточное разнообразие входных данных усложняет задачу идентификации. Для системы управления возможность сделать особый управляющий (испытывающий, тестирующий, зондирующий) сигнал во входном канале может значительно облегчить проблему реконструкции неизвестных параметров. Например, если гармонический сигнал поступает на вход стационарного линейного объекта, то выход объекта также будет гармоническим сигналом после переходного процесса (предполагается, что нет помех). Амплитуда этого сигнала пропорциональна значению передаточной функции объекта в точке, которая соответствует частоте входного гармонического сигнала. Варьируя частоту, можно восстановить всю передаточную функцию объекта. Точно также серия одиночных импульсов во входном канале позволяет восстановить импульсную функцию объекта [12]. Кроме того, специальные рандомизированные тестовые сигналы во входном канале дают возможность определить параметры объекта управления, когда рассматривается модель объекта с почти произвольными аддитивными помехами. Процедура, предложенная в [13, 14], работает для любых помех и не требует априорных знаний об их характеристиках. Помехи могут быть не случайными либо типа белого или коррелированного шума с нулевым средним или со смещением, отношение сигнал/шум может быть высоким или низким. Восстановление неизвестных значений параметров обеспечивается свойствами рандомизированных тестовых сигналов, которые добавляются в контуре управления к собственным сигналам адаптивного управления, поступающим от обратной связи. Такой подход был предложен А. А. Фельдбаумом в своей концепции дуального управления [15]: «...управляющие воздействия должны быть в известной мере изучающими, но в известной мере направляющими».

Рассмотрим дискретный динамический объект управления (ОУ), описываемый авторегрессионным уравнением скользящего среднего с аддитивными помехами (ARMAX model)

Помеха V описывает все другие источники, кроме щ, которые вызывают изменения в у, г-1 - оператор задержки: г-1 щ = Щ-1, полиномы Л* (Л) и В* (Л) имеют вид

A* (z-1 )yt = B* (z-1 )ut + vt

(1)

со скалярными входами ut и выходами yt, как на рис. 1.

Щ -►

Рис. 1. Уравнение ОУ

A* (Л) = 1 + а*1' Л + ••• + a*na) Лп", B* (Л) = b(*l) Л1 + b(*l+1) Л1+1 + ■■■ + b*nb) Лп",

где натуральные числа па,п - порядки модели по выходу и входу (управлению); l -задержка в управлении, 1 < l < nb, т = a^^, Ь*\Ь^^^ - вектор коэффи-

циентов уравнения - параметры объекта, часть из которых неизвестна. (Здесь и далее верхние индексы в скобках будут использоваться как номера коэффициентов.)

Требуется определить с заданной вероятностью, выбираемой пользователем, области достоверности для неизвестных коэффициентов объекта (1) по наблюдениям выходов {yt} на конечном интервале времени t = 1, 2,...,N и известных входов (управлений) {ut}, которые можно выбирать. Причем области достоверности должны быть построены без каких-либо априорных знаний об уровне, распределении или корреляции помех.

Стандартным подходом к получению доверительных областей является применение асимптотической теории идентификации систем (см., например, [14, 16]). Хотя эти результаты были успешно использованы во многих приложениях, асимптотические оценки гарантируют что-либо только тогда, когда объем данных N стремится к бесконечности. Если число точек данных измерений конечно, асимптотическая теория может привести к ошибочным результатам даже для больших наборов данных. Еще один способ - Set Membership Identification (идентификация множества принадлежности) -предполагает известную границу для всех компонентов системы, которые не описываются G*(z-1). Благодаря этому гарантированная область параметров определяется как набор значений, которые не нарушают априорных границ [2, 3, 11, 17]. В работах О. Н. Граничина [18-21] в случаях оценки неизвестных параметров при произвольных внешних помехах (неизвестных, но ограниченных) предложено применять рандомизацию в алгоритме идентификации, что позволило получить гарантированные асимптотические доверительные области малой размерности. Эти результаты были использованы в случаях с изменяющимися во времени параметрами [22, 23]. При этом информация о возможных амплитудах шума принимается во внимание только для оценки скорости сходимости, такие данные не учитываются в алгоритме идентификации. В работах [24, 25] описана процедура для получения строго гарантированных неасимптотических доверительных областей для неизвестных параметров линейного динамического объекта управления, подверженного произвольному шуму (поведение которого возмущается произвольным шумом), которая состоит из простых этапов проектирования входов, а затем алгоритма «исключение областей знакодоминирующих корреляций» (LSCR, Leave-out Sign-dominant Correlation Regions), активно продвигаемой в современных работах Марко Кампи с соавторами [26]. Но постановка задачи идентификации в контексте адаптивного управления при почти произвольных помехах имеет существенные трудности для непосредственного применения метода LSCR. В частности, в статье [26] (см. замечание 3 на с. 2711) предлагается использовать метод LSCR в системах с обратной связью, который применим только для выбранного априори постоянного закона управления. На практике, естественно, выдвигается требование о стабилизируемости обратной связи. И если оно нарушается, то при существенном росте выходных и управляющих переменных линейная модель невалидна, с практической точки зрения, и доверительные области, полученные по такому алгоритму идентификации, могут не иметь непосредственного отношения к исходной постановке. Прямое распространение метода из [26] на случай регуляторов с подстраиваемыми коэффициентами приводит к нарушению одного из основных условий применимости метода LSCR (см. пример в [25]).

Основным вкладом этой статьи является решение практической задачи оптимизации полета легкого БПЛА на основе теоретических результатов, полученных в [23, 25].

Настоящая статья организована следующим образом: в начале формулируются

кратко основные результаты из [23, 25], в которых при произвольных внешних помехах предлагается для оценивания неизвестных параметров ОУ по конечному числу наблюдений добавлять рандомизацию к используемой стратегии управления и обосновываются свойства рандомизированного алгоритма фильтрации. В п. 4 рассматривается упрощенная модель движения БПЛА в плоскости под воздействием ветра с постоянной скоростью, но с переменным направлением. Предлагается решение задачи о выборе управляющих воздействий для оптимизации маршрута движения в условиях, когда данные о местоположении БПЛА поступают в дискретные моменты времени и зашумлены. В п. 5 сделаны основные выводы и описаны технические характеристики небольшого БПЛА, на котором планируется проведение испытаний теоретических результатов.

2. Рандомизация в стратегии управления. Рассматриваемая далее процедура идентификации параметров ОУ основана на перепараметризации математической модели объекта управления. Вместо исходных параметров объекта - его коэффициентов (как в [26]) - удобно использовать некоторые другие параметры, находящиеся с исходными во взаимно однозначном соответствии. Такая перепараметризация приводит к записи объекта управления в виде модели скользящего среднего, что позволяет для построения областей достоверности обоснованно воспользоваться процедурой ЬБСИ и в тех случаях, когда в канале обратной связи применяется адаптивный алгоритм.

Пусть в ^ на + нь — I +1 - положительное целое число (обычно равное количеству неизвестных параметров объекта (1)) и N = в ■ К ■ с некоторыми положительными целыми числами К и Nд. Выберем последовательность независимых случайных величин, симметрично распределенных вокруг нуля, (рандомизированное пробное возмущение) До, ..., АКМл-1:

Е{Ап} = Е{Дп} = 0, Е{Дп} = а|, Е(Д^} < М4,

и будем добавлять их значения во входной канал с коэффициентами усиления вк, к € [1..К] один раз в каждый из в последовательных моментов времени (в начале каждого временного интервала [(вкн — 1..вкн + в — I — 1)], где н € [1.^д]) с целью «обогащения» разнообразия наблюдений.

Более точно, будем строить управление {у^}^—1 по правилу

= I вп^л Дп + и.5п-1, г = 0, Зп г [мЯп+г-1, г € [1..в — 1] или г € [—в + 1.. — 1],

где н € [1..KN^], и «собственно» управление {определяется регулируемым законом обратной связи

Щ = Ыг(уг,Уг-1,...,Щ-1,...), Ь > 0, и_к = 0, к> 0.

Тип и характеристики обратной связи зависят от конкретных практических задач. В частности, можно использовать тривиальный закон «собственной» обратной связи: пь = 0, Ь = 0,1,...^ — I.

Основные предположения и перепараметризация передаточной функции.

А1. Пользователь может выбрать Дп, и этот выбор не влияет на внешние шумы у8п,..., г>8(п+1)_1. (В математическом смысле Дп не зависит от {«¿}^£™1+1) 1.)

Обратим внимание, что нет никаких предположений о шумах ví, не предполагаются какие-либо знания о верхних пределах их амплитуд, никакие предположения о нулевом среднем или об автокорреляционных свойствах, если они являются случайными.

Для моментов времени вп, п = 0,..., — 1, можно обозначить Vsn = vsn + (1 — Л*(г-1))уэп + (В*(г-1) — Ь*1 г-1)иэп и переписать уравнение (1) в виде

уэп

Апв*1] + е*1 ип-1

где е*1 = Ь*1\ Это уравнение показывает прямую связь между наблюдением уэп и тестовом сигналом Дп, который не зависит от «нового» шума у8п.

Точно также перепишем уравнение (1) для остальных моментов времени вп+г—1, г € [2..в], п € [1..КМ& — 1], последовательно исключая из левой части уравнения переменные уэп+г-1,... ,уэп с помощью того же уравнения (1) для более ранних моментов времени:

г-1

Дпе*г) + е* 3)и эп- I+3 + ч)эп+-1,

з=о

(2)

где е* 3), ] € [0..г — 1], - соответствующие коэффициенты при оставшихся в правой части слагаемых с и8п-1+з.

В [13, 14] авторы предлагают формировать новые параметры как в-вектор е* коэффициентов ек, полученных в (2), и дают условия обратимости такой процедуры перепараметризации.

Следующая формула сразу следует из приведенного выше определения е* = А-1В, где в х в матрица А и в-вектор В:

( ь*) N

1 0 .. .0 0

1 .. .0 0

А = а*2 0*1 .. .0 0

0

-,(па )

В

1

и(пЬ)

0

Рассмотрим условия существования соответствующей обратной функции.

А2. Пусть в - целое положительное число такое, что набор неизвестных параметров объекта однозначно определяется по некоторой функции т(е) из полученного выше вектора е*.

По лемме 5.5.1 на с. 224 из [27] (или 2.2 на с. 117 из [14]) предположение А2 выполнено для в = па + пь — I + 1, если порядки объекта па, пь известны и удовлетворяется следующее предположение

А3. Многочлены гпаЛ*(г-1) и гпьВ*(г-1) взаимно просты.

В [14, 27] приведен также алгоритм для вычисления обратной функции т(е).

На практике, как правило, только часть параметров объекта неизвестна. Иногда неизвестные параметры соответствуют низким степеням г-1, которые меньше, чем некоторые па и пь соответственно. В таком случае можно выбрать в = па +пь — I + 1, что значительно меньше, чем па + пь — I + 1. Более того, «новый» шум Vsn+k-l в (2) может быть разделен на две части: неизмеримую у8п+к-1 и измеримую фвп+к-1. Последняя определяется наблюдаемыми входами и выходами с известными коэффициентами (см. пример 1).

Пример 1. Рассмотрим объект второго порядка

Уг + а^Ру— + Уг-2 = ЪРиг-1 + 1.6и_2 + V (3)

с неизвестными коэффициентами а!1 и ъ11} = 0. Обозначим

^ = (а^1))

вектор коэффициентов уравнения объекта. Пусть в = 2 и вектор «новых» параметров

6(1)

в! = '1.6 — £)€ м2.

В этом случае обратная функция т (в) есть

/ 1.б-е(2) \

тт = ( да ) ■

Уравнения (2) имеют форму

У2п = вп^Мл Дпв!Х) + в11}и2п-1 + 'Ф2п + «2п, У2п+1 = вп^Мл Дп в1 + в1и 2п-1 + в.^п + ф2п+1 + «2п+1,

где Ф2п+г = 1.бУ2п-2+г — У2п-2+г, г = 0, 1, «2п = «2п — а!^У2п-Ь «2п+1 = «2п+1 + а!1)(а!1)У2п-1 + У2п—2 — 1.бУ2п-2 — «2п).

Процедура построения доверительных областей при конечном числе наблюдений. Для конечного числа наблюдений можно использовать такую процедуру:

1. Для каждого к € [1..К] рассмотрим конечный промежуток времени [к'в..к'в + вЖд — 1], где к' = (к — 1)Жд.

2. Используя данные наблюдений, для н € [1..Жд], г € [1..в] запишем предсказатели как функции от в

г-1

Ук'*+*п+г-1(в) = вкДк'+пв(г) + ^ в{г-^] Ук'^п+г-— . (4)

¿=0

3. Рассчитаем ошибки прогноза

ег(в) = Уг — Уг(в), Ь € [к'в..к'в + вЖд — 1].

4. В соответствии с данными наблюдений для н € [1..Жд], г € [1..в] сформируем набор из вЖд функций от в

/к' в+вп+г— 1 (в) = Д к' +п^к' в+вп+г — 1 (в).

5. Выберем положительное число М > 2в и построим М различных двоичных стохастических строк (из нулей и единиц) (¿1,..., ): Н0}г = 0, г € [1..Ж], а все

остальные элементы Ь^® принимают значения нуль или один с равной вероятностью Вычислим

№д-1

Ок,] (Я) = • 1к'в+пв+г-1(0), г е [1..в].

п=0

6. Выберем д из интервала [1; М/2в]. Для г е [1..«] построим области ©к такие, что по крайней мере д из функций д(в) строго больше, чем 0, и не менее д строго меньше, чем 0. Доверительное множество определим по формуле

© к = п© к!]. (5)

к ®=1

Замечание 1. Описанная выше процедура аналогична предложенной в [26], но имеет два существенных отличия от нее. Во-первых, доверительное множество © рассматривается в пространстве состояний Мя вместо Мпа+пь, а доверительные области © « г е [1.«], являются подмножествами М® вместо ©() С Мп»+пь. Во-вторых, рандомизированное пробное возмущение включают через входной канал только один раз за каждые в моментов времени, а не постоянно, как в [26]. Увеличивая интервал в, можно уменьшить нежелательное «раскачивающее» воздействие на систему управления, давая ей возможность успеть «успокоиться».

Замечание 2. Если можно разделить «новый» шум Ук' в+вп+®-1 в (2) на две части: Ък'8+зп+к-1 и фк'я+яп+к-1, среди которых первая является неизмеримой, а вторая определяется наблюдаемыми входами и выходами с известными коэффициентами, то в описанной выше процедуре можно использовать более точные предсказатели вместо (4)

®-1

Ук'я+яп+г-1(в) = вк Лк' +пв(г) + ^^ в(® йк'а+ап+г-1-] + Фк'я+яп+г-1.

3=0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Вероятность того, что в.к принадлежит каждому из ©к®1, г е [1..в], дается в следующей теореме.

Теорема 1. Пусть выполнено условие А1. Рассмотрим г е [1..в] и предположим, что РгоЬ(дк3 (в*) = 0) = 0.

Тогда

РтоЪ{в* е ©(к)} = 1 - 2д/М, (6)

где ©к\д и М из шагов 5 и 6 описанной выше процедуры.

Доказательство теоремы приведено в [25].

Следующий результат непосредственно вытекает из теоремы 1.

Следствие. В условиях теоремы 1

РгоЪ{в* е ©} > 1 - 2вд/М, (7)

где © взято из (5).

Заметим, как отмечается в [26], что значение вероятности в (6) является точным,

а не нижним пределом. Неравенство в (7) получается из-за того, что события {6* Е ©}, г Е [1..5], могут перекрываться.

Из сказанного выше легко вывести теорему.

Теорема 2. Пусть выполнены условия Л1-Л2 и предположим, что РгоЬ(д^З (6*) =

0) = 0. Тогда множество т(©) является доверительным множеством для неизвестных параметров объекта (1) с уровнем достоверности не менее 1 — 2зд/М.

Пример 2. Вернемся к объекту управления (3) при N = 960 и неизвестных двух параметрах а* и Ь* .

Определим функции / (6):

¡2к> +2п (6) = Ак> +п (У2к +2п — вк Ак +п 6(1) — 6(1) Й2к' +2п-1 — Ф2к' +2п ), П = 0,...,Nд — 1,

/2к/ +2п+1 (6) = Ак/ +п (У2к/ +2п+1 — Рк Ак/ +п б(2) — б(2) и2к/ +2п-1 — б(1) и2к/ +2п — ф2к/ +2п+1). Выберем М = 480 и q = 6 и подсчитаем эмпирические корреляции

479

з6) =

д^з(6) = ^з2к/+2п+г • ¡2к/+2П+—1 (6), г = 1,..., 479.

п=0

Для г = 1, 2 строим области ©(г), которые включают только такие значения 6, что не менее шести функций д^З(6), ] = 1,... ,479, строго больше нуля и не менее шести из тех же функций строго меньше нуля.

По теореме 2 вектор истинных параметров с вероятностью более чем на 95% = 1 — 2 • 2 • 6/480 принадлежит доверительному множеству т(©) = т(©(1) П ©(2)).

-5 -4 -3 -2 -1 0 а

а*

Рис. 2. Доверительное множество т(О)

На рис. 2 показаны регионы т(©), т(©(1)) и т(©(2)), полученные при моделировании

(1) (1)

с истинными значениями а* = —2 и Ь* =1 и такими же характеристиками шума и стабилизирующей обратной связи, как и в предварительном примере в п. 2 из [25]: V -случайная одинаково распределенная последовательность нормально распределенного шума со средним 0.5 и дисперсией 0.1 (шум со смещением).

3. Рандомизированный алгоритм предсказания (фильтрации) случайного процесса, наблюдаемого на фоне почти произвольных помех. Рассмотрим

следующую постановку задачи: наблюдается скалярный сигнал, удовлетворяющий уравнению

yt = fj9t + vt, (8)

представляющий собой преобразованный векторный процесс {9t}, 9t G Rs, и помеху наблюдения {vt}. Здесь ft - r-мерный вектор, известный в момент времени t. Векторный процесс {9t} порождается устойчивым линейным фильтром

9m =A0t + wt+1, (9)

в котором А - известная матрица: || А || = \JЛтах(ААт) ^ 1, а {wt} - реализация последовательности центрированных независимых случайных величин. Здесь и далее || • || - норма, Amax(-) и Amjn(-) - максимальное и минимальное собственные значения матрицы A.

Обычно считают, что в модели наблюдений векторы {ft} задаются детерминированной последовательностью. Предположим, что последовательность векторов {ft} случайная и выполнены следующие условия.

B1. Входы {ft}t^i представляют собой последовательность независимых одинаково распределенных случайных векторов с ограниченными известными математическими ожиданиями: || Eft || ^ Mv < ж, yt векторы ft не зависят от случайных величин {wi,..., wt} и {vi,. . . ,vt}, если vi,... ,vt - случайные. Случайные векторы

At = ft - Eft

имеют симметричные функции распределения P(-) с матрицами ковариаций, удовлетворяющими условиям

EAtAT = B > 0, || B || < а\ < ж и ограниченными четвертым статистическим моментом

E || At ||4 = M4 < ж.

Здесь и далее: B > 0 означает, что B - положительно-определенная матрица.

B2. У t — случайные векторы wt+i, независимые и центрированные (E{wt+i} = 0), удовлетворяющие условию

EwtwJ < Qw < а^I < ж.

B3. Последовательность помех наблюдения {vt}t-^i представляет собой либо значения детерминированной неизвестной ограниченной функции \vt\ ^ Cv, t = 1, 2,..., либо У t - реализацию случайных векторов, которые независимы с At и ограничены в среднеквадратическом смысле:

Ev\ < Cl < ж.

Задача фильтрации с прогнозом на один шаг состоит в нахождении оценки 9t+i значения процесса {9t} в момент времени t + 1 по наблюдениям yk, fk, к ^ t. Качество фильтрации определяется средней величиной квадрата невязки

E || 9t+i — 9t+i ||2 .

При сделанном предположении процесс (8) измерения процесса вг является фактически рандомизированным, так как искомый сигнал «взвешивается» со случайно выбираемым набором коэффициентов которые в текущий момент известны.

В [23] для решения поставленной задачи предложен рандомизированный алгоритм построения очередной оценки:

вг+1 = квг - аАГД^Твг - Уг), Дг = - Ефг, (10)

где 4 = 0,1,..., а > 0 - размер шага и Г - положительно-определенная симметричная матрица, свойства оценок которого формулируются следующей теоремой.

Теорема 3. Пусть последовательности {уг} ,{иг} ,{вг} и {шг} связаны уравнениями (8) и (9), а > 0, Г - положительно-определенная матрица и в0 - произвольный неслучайный вектор из Мя.

Если выполнены предположения В1—В3, тогда для ошибок предсказания оценок {0г}, генерируемых по алгоритму (10), для любого р > 0 и достаточно малого а такого, что

ф(а, р) = { 1 - 2аЛт;п(ВГ) + «2 || Г ||2 (М44 + (М^ + -^ТгЩ)) || А ||2 < 1, выполняются неравенства

рмд Й „2 ^ га1+а2(1+М^р)\\ АГ||2Тг[В]С,2 , ,, . 2

Ь || 6»4+1 - 0г+1 II < -:-77-г--Ь Ф{а, р) Ь \\ в0 - 00 || . (11)

1 - Ф(а,Р)

Алгоритм (10) называем рандомизированным, так как текущее измерение выполняется с рандомизированным входом (набором весов) и изменение текущей оценки происходит в выбираемом случайно (рандомизируемом) направлении АГДг.

Заметим, что полученная в теореме 3 оценка является точной в том смысле, что при замене в условиях неравенств на равенства выражение (11) в типичных случаях также превращается в равенство.

Второе слагаемое в правой части неравенства (11) показывает вклад неопределенности о начальных данных и экспоненциально стремится к нулю с течением времени.

Интересно проанализировать первое слагаемое. Обычно в предположениях ограниченности помех при решении задач минимаксной фильтрации удовлетворяются результатами, точность которых пропорциональна характерным размерам множества неопределенности. Из формулы (11) следует неожиданное новое свойство рандомизированного алгоритма (точнее, алгоритма с рандомизированным процессом измерений и изменяющим текущую оценку в выбираемом случайном направлении). При малом уровне неконтролируемого изменения исследуемого процесса (малом а^) за счет выбора меньшего параметра шага алгоритма а возможно достижение малой среднеквадратичной невязки по сравнению с уровнем помех наблюдения С.

4. Добавление рандомизации в управление легкого БПЛА при неизвестных изменениях направления ветра. Рассмотрим упрощенную модель полета БПЛА. Будем считать, что он летит в плоскости со скоростью а и подвержен в направлении в действию внешних возмущений (ветра) с постоянной скоростью Ь. Показания с ГЛОНАСС^РБ приемника поступают в систему набором данных с интервалом времени 6, т. е. в момент времени = То + ^ поступают пары чисел (ж(,г/4), которые являются измерением текущей позиции (хг,уг) с некоторой ошибкой (вттХг,еттУг).

Для управления БПЛА, т. е. формирования последовательности управляющих воздействий на исполнительные механизмы {г^}, необходимо по наблюдениям {(а^,^)} оценить (определить) неизвестный параметр О* Е М при отсутствии каких-либо ограничений на последовательность помех }.

Более точно, пусть задана точка направления на цель (А, В). В каждый момент времени Т мобильный объект находится в точке X,Уг). Будем считать, что рулями высоты, направления и элеронами возможно изменение курса движения объекта и и удержание его постоянным в течение такта времени от Т до Т^+1. На этом интервале времени движению объекта в направлении курса и мешает ветер с постоянной средней величиной скорости Ь и углом О±+1 (рис. 3). При условии постоянного направления

Рис. 3. Направление на цель, курс, смещение от ветра

ветра 0 = 0t серия последовательных измерений позволит его точно оценить для использования в качестве поправки к выбору курса, исходя из желательности выполнения соотношения

a sin u — b sin 0 = 0, (12)

при котором объект движется из точки (xt ,yt) прямо по направлению к точке (A,B), т. е. точка (xt+1,yt+1) лежит на прямой, соединяющей (xt ,yt) и (A,B). Из соотношения (12) легко выводится формула

и = arcsin ^-siné^ . (13)

C практической точки зрения, актуальным является случай, когда a ^ b. Например, в случае планера, рассмотренного в [28], крейсерская скорость a ~ 20 м/с, а диапазон скоростей ветра, при которых планер обычно используется, от 0 до 7 м/с, причем обычно 2-3 м/с. В этом случае

sin u ~ u,

и для оптимального угла курса справедливо соотношение

и = ^sin 0 = U(6).

В случае переменного ветра предположим, что изменение угла направления ветра случайное:

0t+i = 0t + wt+i,

где {wt} - независимые, центрированные и одинаково распределенные случайные величины

Е{тг} = 0, Е{т2} = а^ < ж, Е{т^,Wj} = 0, если г =

Для оптимизации движения к конечной точке требуется в момент времени Тг по последовательности наблюдений и последовательности выбранных ранее курсов иI, г = 0,...,4 - 1, предложить алгоритм для оценивания вг+1, минимизирующий среднеквадратическое отклонение:

Е

Построение алгоритма оценивания. В работах [21, 23, 29-32] предложено несколько подходов к формированию рандомизированного алгоритма предсказания значений случайного процесса при наблюдениях с почти произвольными помехами. Применим похожую рандомизированную методику для оценки влияний на отклонение легкого мобильного объекта от курса и сравним результаты с алгоритмами без рандомизации, основанными на традиционном фильтре Калмана [33].

Для оценивания возникающих в бортовой системе навигации ошибок, кроме данных ГЛОНАСС/СРЯ, используются возможности инерциальной системы. На каждой итерации выбирается курс иг и нулевое значение для гироскопа устанавливается в этом направлении. При «сносе» объекта с выбранного направления на отрезке [Тг,Тг+1 ] инерциальная система «подстраивает» управляющие механизмы таким образом, чтобы по возможности скомпенсировать его влияние. Но все равно в конце отрезка [Тг,Тг+1 ], получив новые данные от ГЛОНАСС/СРЯ и уточнив направление на цель, устанавливается угол невязки £ с выбранным ранее направлением. В результате гироскоп «подстраивается» заново, а величина этого угла поворота принимается как «невязка» для уточнения текущей оценки вг+1 (рис. 4).

А, В

Рис. 4- Ошибка в выборе направления на цель

Заметим, что если постоянно (на всем интервале {Tt,Tt+\}) «подкручивается» курс в зависимости от отклонения траектории от заданной гироскопом, то не совсем корректно говорить, что 0t - это угол направления ветра. Точнее 0t есть угол корректирующего воздействия, определяемого ветром.

За счет поступающих наблюдений (xtiVt) от ГЛОНАСС/GPS системы в силу несложных преобразований и того, что Xt+i,yt+i,Xt,yt ~ неточные значения, выводим уравнение связи для значений невязки в отклонении от курса

et = a sin ut — b sin 0t + vt.

Если считать, что a ^ b, и использовать такие курсы движения, когда sin ut & ut, то для модели наблюдений получаем формулу

Ek = aut - b sin вг + vt,

которая «подсказывает» следующий вид рандомизированного алгоритма:

1. Выбрать последовательность Дп независимых, одинаково распределенных случайных величин, равных ±/3 с одинаковой вероятностью называемых, как и ранее, пробным рандомизированным возмущением.

2. Управления ut формировать по правилу

ut = Ut-i + Дг,

вг+1 = dt - aДtEt, (14)

щ = | sinft+1,

в котором Uo = 0, во = 0, а, ß > 0 - некоторые постоянные. Алгоритм предсказаний Bt+i совпадает с рандомизированным алгоритмом (10) с A = Г = 1, а для формирования управлений ut, фактически, предлагается использовать стратегию (2) с s = l = Na = 1 и Ut(■) = U(0t+1).

Результаты имитационного моделирования. Для проверки работоспособности алгоритма (14) было проведено имитационное моделирование по сравнению его качества управления с использованием оценок, доставляемых по фильтру Калмана

ut = ut-1,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Bt+i = dt - KtEt, (15)

щ = \ sinft+1,

v 1t-\ Pt-i7t-i , 64

Kt = 1000 , -' 7t = 7t-1 - 16 .-+ T' T° = 0'

з Ь it-Wt-i T+Tt-iVt-i л

и по алгоритму LMS (упрощенному фильтру Калмана [6])

ut = ut-i,

Bt+i = dt -aEt, (16)

щ = | sinft+1.

При компьютерном моделировании измерения проводились с интервалом времени S = 2 с, исходя из среднего времени задержки обновления данных модуля ГЛО-HACC/GPS; процесс 0t наблюдался на интервале времени от 1 до 250; aw = 8/л/З. Координаты полета xo = 0,yo = 0,A = 5000, B = 5000. Начальный угол действия ветра во = 3° относительно начального курса полета. Были выбраны коэффициенты а = 0.1, ß = 0.01. Для трех разных помех на рис. 5-7 показано сравнительное поведение траекторий, соответствующих использованию трех разных алгоритмов.

Известно, что фильтр Калмана (15) дает оптимальные оценки в случае гауссовых независимых помех в наблюдении, метод (16) достаточно эффективен при центрированных независимых помехах. Поэтому при центрированных случайных помехах поведение оценок, генерируемых по алгоритмам (15), (16), хорошее, несмотря на высокий уровень помех наблюдения (рис. 5). В ситуациях с постоянной неизвестной помехой или при нулевой в среднем, но недостаточно «разнообразной», средние значения ошибок алгоритмов (15) и (16) соизмеримы с квадратом уровня помехи (рис. 6, 7).

Рис. 5. Траектории при белошумных помехах vt = 5 • (rand() • 4 — 2)

Рис. 6. Траектории при помехах vt =0.1 • sin (t) +19 • sign(50 — t mod100)

В то же время средний уровень отклонения объекта от оптимальной траектории при рандомизированном алгоритме (14) во всех ситуациях примерно одинаковый. Приведем итоговые результаты по среднему отклонению от оптимальной траектории. Среднее отклонение от оптимальной траектории (в м):

Помехи (1) (2) (3)

vt = 5 • (rand () -4 - 2) 25.58 17.08 17.43

vt =0, 1 • sin (t) +19 • sign(50 - t mod100) 51.60 178.65 243.28

vt = 20 30.90 247.90 302.02

5000 h

4000 -

3000 -

2000 -

1000 -

0

0

1000

2000

3000

4000

5000

- Оптимальный маршрут ■ Фильтр Калмана

Рандомизированный алгоритм ■ Упрощенный фильтр Калмана

Рис. 7. Траектории при постоянной помехе vt = 20

5. Заключение. В статье представлена рандомизированная процедура оценивания угла действия ветра на БПЛА, применимая на навигационной системе легкого БПЛА. С теоретической точки зрения, наиболее примечательной особенностью такой процедуры является то, что она работает без каких-либо существенных предположений о помехах. Это очень важно и с практической точки зрения, так как в реальных приложениях трудно получить априорные знания о характеристиках помех. Проведено сравнение рандомизированного алгоритма с наиболее часто используемыми в навигационных системах алгоритмами на основе фильтра Калмана. Показано, что при «небелошумной» неизвестной помехе в измерениях оценки, построенные с помощью рандомизированного алгоритма, более точные.

В будущих планах - применение рандомизированной процедуры фильтрации в навигационной системе легкого БПЛА для проекта «Мультиагентное управление группой легких БПЛА» [28, 34]. Разработанный для этого проекта БПЛА построен на основе модели планера «Paprica», длина - 1.2 м, размах крыла -2 м, максимальный полетный вес - 2.1 кг (входит 600 г полезной нагрузки), скорость полета - от 40-120 км/ч и дальность полета - до 50 км. Для построения системы управления используется трехуровневая архитектура, в которой добавляется дополнительный микрокомпьютер помимо стандартного автопилота. На нижнем уровне используется автопилот фирмы «Papparazzi». Автопилот - набор устройств с микроконтроллером с системой реального времени. Основная задача автопилота состоит в управлении исполнительными механизмами (сервоприводами, мотоустановкой, дополнительным оборудованием), основываясь на заданной ему программе полета и информации с датчиков (инерциальной системы, инфракрасных датчиков, датчиков давления, скорости и т. п.). На среднем уровне управления находится бортовой микрокомпьютер размером 17 мм х 58 мм х 4,2 мм, который работает под управлением операционной системы Linux и построен на основе процессора ARM Cortex-A8 с тактовой частотой 600 МГц, имеет 256 Mb памяти RAM и 256 Mb встроенной памяти NAND Flash. Бортовой микрокомпьютер - головное устройство бортовой системы управления БПЛА. Его основная цель - выполнить поставленную объекту задачу с наименьшими затратами времени и ресурсов. Связь

между микрокомпьютерами БПЛA осуществляется за счет встроенного радиоприемника с частотой 2.4 Гц и протоколом общения S02.ll n (Wi-Fi), в котором применяется технология, связывающая два ближайших канала в один. Таким образом, микрокомпьютеры в мобильных объектах могут одновременно принимать и отправлять информацию друг другу. Связь с базовой станцией осуществляется за счет отдельного радиоканала или через GPRS по GSM модему [28]. GSM модем легко интегрируется с микрокомпьютером, но для передачи данных пакеты необходимо сжимать. Взлет БПЛA осуществляется с руки или катапульты. Посадка, для которой не потребуется большая площадка, осуществляется пилотом, который перехватывает управление в зоне его видимости. Одна из основных задач при разработке системы управления легкими БПЛA - построение алгоритмов оптимизации их полета. Для увеличения продолжительности полетов, накопления энергии и увеличения дальности полета используются восходящие воздушные потоки (термические потоки, термики), образующиеся в нижних слоях атмосферы за счет срыва теплого воздуха с поверхности земли при ее нагреве под воздействием солнечных лучей. Применение рандомизированных алгоритмов для оценивания центров термиков предложено в [35].

Литература

1. Калман Р. Е., Бьюси Р. С. Новые результаты в линейной фильтрации и теории предсказания // Труды Амер. об-ва инженеров-механиков. Техническая механика. 1961. Т. 83. Сер. Д. № 1. С. 123—141.

2. Bai E. W., Nagpal K. M., Tempo R. Bounded-error parameter estimation: Noise models and recursive algorithms // Automatica. 1996. Vol. 32. P. 985-999.

3. Garulli A., Giarre L., Zappa G. Identification of approximated Hammerstein models in a worst-case setting // IEEE Trans. Autom. Control. Dec. 2ÜÜ2. Vol. 47, N 7. P. 2Ü46-2Ü5Ü.

4. Polyak B. T., Topunov M. V. Suppression of bounded exogenous disturbances: output feedback // Autom. and Remote Control. 2ÜÜ8. Vol. 69, N 5. P. 8Ü1-818.

5. Куржанский А. Б. Управление и наблюдения в условиях неопределенности. M.: Наука, 1977. 392 c.

6. Фомин В. H. Рекуррентное оценивание и адаптивная фильтрация. M.: Наука, 1984. 288 с.

7. Черноусько Ф. Л. Оценивание фазового состояния динамических систем: метод эллипсоидов. M.: Наука, 1988. 319 с.

8. Kibzun A. I., Kan Yu. S. Stochastic Programming Problems with Probability and Quantile Functions. Chichester: Wiley, 1996. 316 с.

9. Панков А. Р., Семенихин К. В. Mинимаксная идентификация обобщенной неопределенно-стохастической линейной модели // Автоматика и телемеханика. 1998. № 11. C. 158-171.

1Ü. Степанов О. А., Осипов А. В., Васильев В. H. Открытые мультиагентные системы для оперативной обработки информации в процессах принятия решений // Автометрия. 2ÜÜ2. № 6. С. 45-61.

11. Поляк Б. Т., Щербаков П. С. Робастная устойчивость и управление. M.: Наука, 2ÜÜ2. 3Ü3 с.

12. Александров А. Г., Орлов Ю. Ф. Конечно-частотная идентификация: динамический алгоритм // Проблемы управления. 2ÜÜ9. № 4. С. 2-8.

13. Граничин О. H., Фомин В. H. Адаптивное управление с использованием пробных сигналов // Автоматика и телемеханика. 1986. № 2. C. 1ÜÜ-112.

14. Граничин О. H., Поляк Б. Т. Рандомизированные алгоритмы оценивания и оптимизации при почти произвольных помехах. M.: Наука, 2ÜÜ3. 293 с.

15. Фельдбаум А. А. О проблемах дуального управления // Mетоды оптимизации автоматических систем: сб. статей [Посвящается памяти доктора техн. наук, лауреата Государственной премии, проф. А. А. Фельдбаума]; под ред. Я. З. Ципкина. M.: Наука, 1972. C. 89-1Ü8.

16. Ljung L. System Identification: Theory for the User. 2nd ed. New York: Prentice Hall, 1999. 6Ü9 р.

17. Соколов В. Ф. Оценка качества робастной системы управления при неизвестных верхних границах возмущений и помехи измерений // Автоматика и телемеханика. 2Ü1Ü. № 9. C. 3-18.

18. Граничин О. H. Алгоритм стохастической аппроксимации с возмущением на входе для идентификации статического нестационарного дискретного объекта // Вестн. Ленингр. ун-та. Cер. 1: Me-тематика, механика, астрономия. 1988. Вып. 3 (№ 15). C. 92-93.

19. Граничин О. H. Об одной стохастической рекуррентной процедуре при зависимых помехах

в наблюдении, использующей на входе пробные возмущения // Вестн. Ленингр. ун-та. Сер. 1: Математика, механика, астрономия. 1989. Вып. 4 (№ 1). С. 19—21.

20. Granichin O. N. Unknown function minimum point estimation under dependent noise // Problems of Information Transmission. 1992. Vol. 28, N 2. P. 16-20.

21. Granichin O. N. Linear regression and filtering under nonstandard assumptions (Arbitrary noise) // IEEE Trans. on Automat. Contr. 2004. Vol. 49, N 10. P. 1830-1835.

22. Granichin O., Vakhitov A., Vlasov V. Adaptive control of SISO plant with time-varying coefficients based on random test perturbation // Proc. of the American Control Conference (ACC-2010). June 30-Ju-ly 02. 2010. Baltimore, MD, USA, 2010. P. 4004-4009.

23. Амелин К. С., Граничин О. Н. Возможности рандомизации в алгоритмах предсказания кал-мановского типа при произвольных внешних помехах в наблюдении // Гироскопия и навигация. 2011. № 2(73). С. 38-50.

24. Граничин О. Н. Неасимптотическое доверительное множество для параметров линейного объекта управления при почти произвольных помехах // Автоматика и телемеханика. 2012. № 1. C. 24-35.

25. Amelin K., Granichin O. Randomized controls for linear plants and confidence regions for parameters under external arbitrary noise // Proc. of the 2012 American Control Conference. Montreal, Canada, 2012. P. 851-856.

26. Campi M. C., Weyer E. Non-asymptotic confidence sets for the parameters of linear transfer functions // IEEE Trans. Automat. Control. 2010. Vol. 55, N 12. P. 2708-2720.

27. Фомин В. Н. Методы управления линейными дискретными объектами. Л.: Изд-во Ленингр. ун-та, 1985. 336 c.

28. Амелин К. С. Легкий беспилотный летательный аппарат для автономной группы // Стохастическая оптимизация в информатике. 2010. Т. 6. С. 117-126.

29. Вахитов А. Т., Граничин О. Н., Гуревич Л. С. Алгоритм стохастической аппроксимации с пробным возмущением на входе в нестационарной задаче оптимизации // Автоматика и телемеханика. 2009. № 11. C. 70-79.

30. Granichin O., Gurevich L., Vakhitov A. Discrete-time minimum tracking based on stochastic approximation algorithm with randomized differences // Proc. of the Combined 48th IEEE Conference on Decision and Control (CDC-48) and 28th Chinese Control Conference. December 16-18. Shanghai, P.R. China, 2009. P. 5763-5767.

31. Граничин О. Н. Оценивание параметров линейной регрессии при произвольных помехах // Автоматика и телемеханика. 2002. № 1. C. 30-41.

32. Граничин О. Н. Неминимаксная фильтрация при неизвестных ограниченных помехах в наблюдениях // Автоматика и телемеханика. 2002. № 9. C. 125-133.

33. Levy L. J. The Kalman filter: navigation's integration workhorse // GPS World. 1997. Vol. 8, N 9. P. 65-71.

34. Амелин К.С. Технология программирования легкого БПЛА для мобильной автономной группы // Стохастическая оптимизация в информатике. 2011. Т. 7. С. 93-115.

35. Antal С., Granichin O., Levi S. Adaptive autonomous soaring of multiple UAVs using simultaneous perturbation stochastic approximation // IEEE Conference on Decision and Control (CDC-09). Atlanta, USA, 2010. P. 3656-3661.

Статья рекомендована к печати проф. Л. А. Петросяном. Статья поступила в редакцию 20 декабря 2012 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.