Научная статья на тему 'Линейные оптимальные алгоритмы в задачах оценивания с нелинейными измерениями. Связь с алгоритмами калмановского типа'

Линейные оптимальные алгоритмы в задачах оценивания с нелинейными измерениями. Связь с алгоритмами калмановского типа Текст научной статьи по специальности «Математика»

CC BY
400
82
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЛИНЕЙНЫЙ ОПТИМАЛЬНЫЙ АЛГОРИТМ / АЛГОРИТМ КАЛМАНОВСКОГО ТИПА / СОПОСТАВЛЕНИЕ / НАВИГАЦИОННЫЕ ПРИЛОЖЕНИЯ

Аннотация научной статьи по математике, автор научной работы — Степанов О. А., Торопов А. Б.

Применительно к простейшей задаче оценивания с нелинейными измерениями обсуждаются особенности линейного оптимального алгоритма и на этой основе анализируется его связь с алгоритмами калмановского типа, включая получивший в последнее время широкое применение так называемый UKF алгоритм.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Степанов О. А., Торопов А. Б.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

LINEAR OPTIMAL ALGORITHMS FOR ESTIMATION PROBLEMS WITH NONLINEAR MEASUREMENTS. RELATION WITH KALMAN - TYPE ALGORITHMS

Features of linear optimal algorithms (LOA) for estimation problems with nonlinear measurements are investigated. The relation of the LOA with Kalman type algorithm, such as Iterated Kalman Filter, Unscented Kalman Filter and Linear Regression Kalman Filter are discussed.

Текст научной работы на тему «Линейные оптимальные алгоритмы в задачах оценивания с нелинейными измерениями. Связь с алгоритмами калмановского типа»

3. Микромеханические гироскопы: конструкции, характеристики, технологии, пути развития / Северов Л.А. [и др.] // Известия вузов, Приборостроение, т.41, №1-2, 1998. С.57-73.

4. Информационные характеристики вибрационного микромеханического гироскопа / Северов Л.А. [и др.] // Гироскопия и Навигация. №1.2003. С.76-82.

5. Распопов В.Я. Микромеханические приборы: учебное пособие. Тула: Изд-во ТулГу, 2002. 392с.

S.D. Evstafyev, O.I. Rakityansky, L.A. Severov, A.A. Semenov CALIBRATION OF INFORMATION CHARACTERISTICSMMG LL-TYPE Methods of control and calibration of information characteristics of a micromechan-ical gyroscope designed by Gyrooptika (St. Petersburg, Russia) are considered.

Key words: micromechanical gyroscope, large-scale factor, pass-band, drift.

Получено 08.09.2012

УДК 621.391.172

О.А. Степанов, д-р техн. наук, нач. отдела, (812) 499-82-53, [email protected]

(Россия, Санкт-Петербург, ОАО «Концерн «ЦНИИ «Электроприбор»), А.Б. Торопов, науч. сотрудник, (812) 499-78-90, toropov [email protected] (Россия, Санкт-Петербург, ОАО «Концерн «ЦНИИ «Электроприбор»)

ЛИНЕЙНЫЕ ОПТИМАЛЬНЫЕ АЛГОРИТМЫ В ЗАДАЧАХ ОЦЕНИВАНИЯ С НЕЛИНЕЙНЫМИ ИЗМЕРЕНИЯМИ. СВЯЗЬ С АЛГОРИТМАМИ КАЛМАНОВСКОГО ТИПА

Применительно к простейшей задаче оценивания с нелинейными измерениями обсуждаются особенности линейного оптимального алгоритма и на этой основе анализируется его связь с алгоритмами калмановского типа, включая получивший в последнее время широкое применение так называемый иК¥ алгоритм.

Ключевые слова: линейный оптимальный алгоритм, алгоритм калмановского типа, сопоставление, навигационные приложения.

Работа проводилась при поддержке гранта РФФИ 11-08-00372-а.

Введение

При обработке навигационной информации нередко возникает потребность решения задач оценивания с использованием нелинейных измерений. При их решении применяется аппарат теории оптимальной фильтрации [1], [2], в соответствии с которой оптимальная в среднеквадратическом смысле оценка представляет собой условное математическое ожидание, соответствующее апостериорной плотности для

вектора оцениваемых параметров. Алгоритм вычисления оптимальной оценки, как правило, носит нелинейный характер, поэтому такой алгоритм получил название нелинейного оптимального алгоритма (НОА). Для получения оценки в нелинейных задачах разрабатываются упрощенные субоптимальные алгоритмы. В качестве одного из них может выступать так называемый линейный оптимальный алгоритм (ЛОА), особенность которого заключается в том, что минимизация среднеквадратического критерия осуществляется в классе линейных относительно измерений оценок [3],

[4]. Взаимосвязь и отличия такого алгоритма и НОА исследованы в работе

[5]. Анализ литературы показывает, что в последнее время широкое распространение получил ряд новых субоптимальных алгоритмов калманов-ского типа (КТ), в частности, так называемый UKF (Unscented Kalman Filter) алгоритм, регрессионные фильтры Калмана и т.д. [6-9]. Обычно при анализе их эффективности сопоставление проводят с другими субоптимальными алгоритмами, имеющими такую же структуру. В частности, нередко обсуждаются преимущества UKF алгоритмов по сравнению с различными модификациями фильтров КТ, основанных на линеаризации. Однако в тени остается вопрос о связи таких алгоритмов с ЛОА. С учетом сказанного в предлагаемой работе исследуются особенности ЛОА и на этой основе, с одной стороны, устанавливается взаимосвязь с алгоритмами КТ, что позволяет более объективно оценить их достоинства и недостатки, с другой - обсуждаются возможные модификации ЛОА, направленные на получение точностей, близких к потенциальной и обеспечиваемой при использовании НОА.

Постановка задачи

Рассмотрим следующую задачу: оценить n -мерный случайный век-

Т т

тор x = [xi ... xn] по m -мерным измерениям y = [y1 ... ym] ,

y = s(x) + v, (I)

T

в которых s(x) = [si (x) ... sm (x)] - известная m -мерная нелинейная

т

вектор функция векторного аргумента, v = [vi ... vm ] - случайный вектор ошибок измерения. Выбор такой задачи обоснован, с одной стороны, тем, что с ее решением нередко приходится сталкиваться при обработке навигационной информации [1], [2], [10], а с другой - тем фактом, что при оценивании вектора постоянных параметров проще выявить особенности обсуждаемых алгоритмов, не вдаваясь в тонкости, связанные с изменчивостью этих параметров. Считая известной совместную функцию плотности распределения вероятности f (x, v) для векторов x и v, можно сформулировать задачу нахождения оптимальной в среднеквадратическом смысле оценки (оценки с минимальной дисперсией) xopt(у), минимизирующей критерий

J = M x y [(x - x°pt (y)) Г (x - x°pt (y))], (2)

где M - знак математического ожидания, а индексы снизу указывают на случайные векторы, которым оно соответствует.

Известно, что оценка X°pt(y) представляет собой математическое ожидание апостериорной плотности для искомого вектора x, нахождение которого, как отмечалось во введении, определяет НОА и для нелинейного случая является нетривиальной задачей [1]. Один из вариантов упрощения задачи основан на использовании линейных алгоритмов, имеющих структуру

xц (y) = Kц (y - yц ), (3)

где индекс ц фиксирует правила вычисления входящих в это выражение

неизвестных x^, yц, Kц для конкретного алгоритма. Для ЛОА ( ц = lin )

соответствующие ему xlin , ylin K lin выбираются такими, чтобы обеспечить минимальное значение критерия (2) в классе алгоритмов вида (3). Идея построения ЛОА достаточно проста и она основана на использовании известного соотношения, определяющего линейную регрессию одного вектора x по фиксированному значению другого вектора y, которая вычисляется с помощью соотношения (3) при x= x, yllin = y , Kllin = PxyP"1 [10]. Таким образом, для получения ЛОА достаточно

знать математические ожидания x и y составного вектора, включающего x и y, и матрицу ковариаций этого вектора, задаваемую матрицами кова-

риаций Px, Py и матрицей взаимной ковариации Pxy. Заметим, что в гаус-

совской линейной задаче (при s(x) = Нх) ЛОА совпадает с НОА, т.е.

x(y) = xxlln(y), которая может быть вычислена с помощью фильтра Кал-мана (ФК). Для решения прикладных задач предложен ряд субоптимальных алгоритмов, имеющих вид (3), при этом структура (3) совпадет со структурой ФК, поэтому будем, как это и принято в литературе, называть их алгоритмами КТ. Обычно при анализе эффективности предлагаемых алгоритмов КТ проводят их сопоставление с другими субоптимальными алгоритмами, имеющими такую же структуру.

Цель же предлагаемой работы заключается в выявлении особенностей ЛОА (в том числе и с учетом его отличий от НОА) и проведении на этой основе сопоставления с алгоритмами КТ и обсуждении их достоинств и недостатков.

Для сопоставления в ходе анализа предполагается вычисление безусловных дисперсий, соответствующих рассматриваемым алгоритмам и определяемым как

Df = MXj,y {x - if (y))2 }, i = Ш, (4)"

где индекс f обозначает используемый алгоритм: f = opt - НОА, f = lin -

ЛОА, f = sub - субоптимальный алгоритм, if (y ) - оценка i-го элемента

оцениваемого вектора.

Помимо самой оценки в исследуемых алгоритмах вырабатывается соответствующая расчетная характеристика точности в виде текущей расчетной матрицы ковариаций Pf(y). С целью проверки адекватности P f (y ) помимо (4) осуществляют вычисление

Df = My bf (у)} i = ^, (5)

где pf (y) - диагональные элементы матрицы Pf (y ).

Расчетная характеристика будет считаться адекватной при

Df« Df. (6)

Для нахождения (4), (5) традиционно используется метод статистических испытаний [1], а для вычисления необходимых при этом оптимальной оценки и матрицы ковариаций - методы, описанные в [1], [2].

Обсудим более подробно ЛОА и проанализируем его особенности.

Линейный оптимальный алгоритм и его особенности

Будем далее полагать, что известны математические ожидания и матрицы ковариаций для вектора оцениваемых параметров x, Px и ошибок измерения v, Pv, для простоты считая v =0. Известно, что при сделанных предположениях входящие в (2) параметры xlin, ylin, Klin , соответствующие ЛОА, в рассматриваемой задаче определяются с помощью следующих соотношений [3-5], [10]:

ylin = У = Mx {s(x)}, x/in = x, (7)

Klin = PxyPy-1 , (8)

в которых

Ру = Мх К*(х) - у)(8(х) - у)т }+ Ру, (9)

Рху = Мх {х - х)(8(х) - у)т }. (10)

Располагая (7), (9), (10), нетрудно найти действительную матрицу ковариаций ошибок оценивания для ЛОА:

РМ = Мх |х - хМ )(х - хЙП )т }= Рх - РхуРу 1Рух , (11)

которая и используется как расчетная характеристика точности. Отметим следующие особенности ЛОА:

1. Расчетная и действительная матрица ковариаций в ЛОА между

собой совпадают, что следует из (11), т.е. ЛОА обеспечивает выработку адекватной характеристики точности.

2. Для исходных нелинейных измерений (1) ЛОА совпадает с НОА для следующих «эквивалентных» линейных измерений:

y = у + Hlin (x - x) + + v, (12)

где Hlin = PyxPx-1, а vad - независимый от x и v центрированный гауссов-ский случайный вектор, с матрицей ковариаций Pad , определяемой как

Pad = Mx j(s(x) - У)(S(X) - у)т }- PxyPx-1Pyx . (13)

Таким образом, можно отметить, что при построении ЛОА исходная нелинейная функция заменяется линейной s(x)« у + Hlln (x - x), а для учета такой замены вводится дополнительная методическая ошибка v ad с указанными свойствами.

3. Параметры, определяющие «эквивалентные» линейные измерения, обеспечивают минимизацию критерия

J(x ,у, H) = Mx j[s(x) - H(x - X) - уf [s(x) - H(x - X) - у]}. (14)

4. Для реализации ЛОА необходимо уметь вычислять вектор

у = Mx {s(x)}=J s(x) f (x)dx (15)

и матрицы

Ix = J s(x)s X(x)f (x)dx, /2 = J xs ^x) f (x)dx, (16) где f (x) - функция плотности распределения вероятности для вектора x, а пределы интегрирования предполагаются бесконечными.

Рассмотрим поясняющий пример. Пусть требуется оценить частоту х гармонического сигнала по измерениям

yi = sin( xtj) + Vj, i = 1.m . где tj - дискретные моменты времени. Предположим, что х - равномерно

распределенная случайная величина ( f (х) = (xmax - xmn )-1 = C) с математическим ожиданием х и дисперсией а2, а ошибки измерения v j - центрированные случайные величины, распределенные по гауссовскому закону с одинаковыми дисперсиями r2.

В этой задаче s(x) = [sin( xt!),sin( xt2),....,sin( xtm )]f и для реализации ЛОА необходимо вычислять интегралы вида

xmax xmax xmax

yi = C Jsin(tjx)dx; /\(i,j) = C Jsin(tjx)sin(tjx)dx; /2(1) = C Jxsin(tjx)dx,

xmin xmin xmin

где /1(i, j) - элементы матрицы /1; /2(i) - элементы вектора - строки /2,

176

] = 1.т . Заметим, что в рассматриваемом примере эти интегралы могут быть вычислены аналитически. В частности, для у' и (/) они будут иметь вид

C 1 c

У = -—(со^'хтах )- С04хтт )), /2(/') = 2 -—(§1П (2?/Хтах )- !>т (2?/хтт )).

Ц 2

В общем же случае нахождение интегралов (15), (16) осуществляется численно. Для этого, в частности, может быть использован метод Монте-Карло, применение которого, например, для вектора у сведется к вычислению

1 N т у * - X 8(х(/)), Я /=1

где х(/), - полученные путем моделирования реализации вектора х с плотностью распределения ((х) [1]. Перейдем далее к сопоставлению ЛОА и алгоритмов КТ.

Взаимосвязь ЛОА и алгоритмов калмановского типа

Следуя работе [7], выделим три группы алгоритмов КТ, с которыми и сопоставим ЛОА.

Первая группа алгоритмов основана на приближенном представлении нелинейной функции з(х). Среди алгоритмов такого типа наибольшее распространение получили линеаризованный и итерационный фильтры Калмана (ИФК). Все они опираются на представлении нелинейной функции з(х) с помощью ее разложения в ряд Тэйлора в виде

8(х) * 8(хл) + Нл(х - хл), где Н

г л

л -

гл

йх

Т

. л

х - точка линеаризации.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

х=х

Полагая справедливым такое представление, оценку вычисляют с исполь-

ФК _

зованием алгоритма ФК в виде (3), в котором полагают ц = ФК, х = х,

У

ФК /- л ч ^ ^ т» ФК т^ ФК

= э(х ). Матрицы Р и К , рассчитываются согласно стандарт-

ным формулам ФК, совпадающим с (8)-(11) при учете линеаризованного представления.

В линеаризованном алгоритме точка линеаризации фиксирована, а в итерационном - измерения обрабатываются несколько раз [10]. При этом каждый раз точка линеаризации изменяется с учетом оценок, полученных на очередной итерации. Существенно при этом, что в последнем случае алгоритм становится уже нелинейным. В рассмотренном примере (рис.1) для линеаризованного алгоритма, как нетрудно убедиться,

17

tl cos(хл 11),¿2 хлt2),...., ¿т хл ¿т)

Н

ФК

Р

хУ

= а 2 (Н ФК [

Ру = ИФКа2 (иФК [ + г2 Е

-ФК

т х т, у

Етхт - единичная матрица размерности

Т

, а расчетная дисперсия

л-1

sin(х х , sin(х 1т)

ФК 2 2

определяется соотношением Р =а 0 г

т

2 , 2 ^ ^2 2 л.

г 0 X ^ со§ х

г =1

Для итерационного алгоритма хл = X^, у = 0,1,2,..., х(0) = х и

.(0) _

и

л

йЦх)

йх

Т

на каждой итерации.

х=х

\iter

Очевидно, что модель измерений для этих алгоритмов может быть записана в виде, аналогичном (12), т.е.

у = ул = 8(хл) + ИФК(х - хл) + Vл + V, где Vл - ошибка, вызванная заменой нелинейной функции на линейную.

а

б

Рис. 1. Линейное описание (2) нелинейной функция (1) в ЛОА (а) и линейные описания (3,4) той же функции (1)

в алгоритмах КТ для разных хл (б)

При реализации таких алгоритмов составляющей ошибкой Vе, как правило, пренебрегают, что и порождает причины, по которым вырабатываемая в алгоритме расчетная матрица ковариаций может отличаться от ее действительного значения.

Таким образом, можно выделить следующие особенности алгоритмов такого типа по сравнению с ЛОА:

- параметры линейного описания находятся путем вычисления производных, с помощью которых удается передать лишь локальное поведение нелинейной функции, в отличие от ЛОА, в котором линейное описание выбирается исходя из условия минимизации критерия (14) рис.1.

178

- как правило, в алгоритмах, основанных на линеаризации, факт наличия дополнительной ошибки не учитывается, что приводит к неадекватности вырабатываемых в них характеристик точности в виде расчетных дисперсий, т.е. к невыполнению (6).

Среди фильтров, основанных на приближенном описании функции з(х), можно отметить также и фильтры второго порядка, в которых учитывается второе слагаемое в разложении Тэйлора [1]. Однако в этом случае алгоритм вычисления оценки существенно усложняется и такие алгоритмы не получили сколько-нибудь широкого практического применения [1].

Для рассмотренного выше примера в табл.1 представлены результа-

ц _ ) и расчетной (~ц _

ты расчета действительной (ац = уDц ) и расчетной (ац = уDц ) средне-

квадратических ошибок (СКО) при времени наблюдения T* = 2 с с шагом 0.2 с ( m = 10), r = 1 рад/с для двух значений априорной СКО для искомого параметра: а0 = 1 рад/с и а0 = 0.3 рад/с, x = 2л. Расчеты приведены для НОА ( ц = opt ), ЛОА ( ц = lin ), линеаризованного ( ц = ФК) и итерационного ( ц = iter ) алгоритмов. Число итераций у при моделировании не превышало 10.

Расчетные и действительные СКО ~ц, ац вычислялись с использованием метода статистических испытаний по формулам

И2=1 My(j)) И2 = 1 sXo)-xj

I Рц[у(j ), К [ = ± I к7 ) - хц(г

Lj=1 Lj=1

где x(j ) - реализация оцениваемой величины, моделируемая в соответст-

вии с заданным законом распределения ((х); у(/) - реализация вектора измерений, / = 1.Ь, Ь > 1000; хц(у(/)), Рц(у(/)) - оценка и расчетная дисперсия ошибки оценивания, вырабатываемая в ц алгоритме.

Таблица 1

Значения / ~ц в задаче оценивания частоты

а0 ц = ФК ц = iter ц = lin ц = opt

1 рад/с 0,7/0,3 0,6/0,3 0,6/0,6 0,5/0,5

0,3 рад/с 0,2/0,2 0,2/0,2 0,2/0,2 0,2/0.2

Анализ результатов позволяет сделать следующие выводы. Как и ожидалось, для ЛОА расчетные и действительные значения СКО между собой совпадают при любом значении а о. При этом

а1т < аор:. Проигрыш обусловлен, с одной стороны, заменой нелинейной

179

функции линейной, а другой - наличием дополнительных ошибок, обусловленных такой заменой.

Расчетные характеристики уФК и aiter, вырабатываемые в линеаризованном и итерационном алгоритмах, в общем случае не согласованы со ФК iter

значениями а , а , характеризующими действительную точность. Согласованность наблюдается лишь при малом значении а о, когда нелинейный характер задачи практически не проявляется. В этих условиях точность обоих алгоритмов обычно совпадает с точностью НОА.

Вторая группа алгоритмов КТ основана на методе статистической линеаризации, предложенном для решения задач оценивания еще в 70-е годы прошлого века [11]. В соответствии с этим методом линейное представление отыскивается исходя из минимизации критерия (14), что и объединяет его с ЛОА. Применительно к рассмотренному примеру (см. рис. 1,а) этот критерий сведется к виду

(y \ m xmax / y Y2

y, y, H )= С^ J (sin(tix)- hi (x - y)- yi ) dx,

i=1 x ■

где ~, И' - элементы векторов у и Н.

Однако в алгоритмах, предложенных в указанных работах, не учитывался факт наличия дополнительной ошибки, обусловленной заменой нелинейной функцией ее линейным аналогом. Ясно, что пренебрежение указанной ошибкой существенно снижает эффективность алгоритма фильтрации. Учет дополнительной ошибки осуществляется в более поздних алгоритмах, рассмотренных в [9]. Их особенность заключается в том, что параметры линейной аппроксимации и матрицы ковариаций дополнительной ошибки вычисляются с использованием специальной вычислительной процедуры, основанной на формировании набора выборочных

реализаций у ^ и х^. Такие алгоритмы названы линейными регрессионными фильтрами Калмана. Можно заметить, что, по сути, эти алгоритмы совпадают с ЛОА, если при вычислении (7)-(10) ориентироваться на применение метода Монте-Карло. Следует, однако, отметить, что при построении ЛОА его параметры получались путем непосредственной минимизации критерия (2) в классе линейных оценок (3), а линейное представление использовано только в методических целях, позволяющих, в том числе, установить его связь с другими алгоритмами КТ.

Еще один класс алгоритмов КТ основан на методах приближенного вычисления двух первых моментов функции плотности распределения, для вектора, подверженного нелинейному преобразованию. Поскольку именно эти моменты используются и при реализации ЛОА, алгоритмы такого типа фактически представляют собой приближенные реализации ЛОА. Наибольшее распространение среди них получили алгоритмы, основанные на

так называемом Unscented (и) - преобразовании [12]. Учитывая, что в русскоязычной литературе особенности алгоритмов, основанных на и - преобразовании, практически не рассматриваются, обсудим их более подробно в следующем разделе.

и-преобразование и его особенности при использовании в ЛОА

Предположим, что имеется вектор х с математическим ожиданием х и матрицей ковариаций Рх. При использовании и-преобразования первый и второй моменты другого т -мерного вектора g, связанного с х зависимостью g = у(х) (где у(х) - нелинейная т -мерная функция), вычисляются следующим образом:

I«= т ^(хк), (17)

к=0

Р§ - ри = т (у(Хк ) - 1и К^(хк ) - 1и 1. (18)

к=0

где Жк, Хк - веса и специальным образом выбранные векторы, определяющие так называемые сигма-точки пространства состояния, удовлетворяющие условиям

2п 2п Т 2п

X =ТЖкХк, Рх =ТЖк (Хк - х Ххк - х)1, ТЖк = 1. (19)

к=0 к=0 к=0

Количество сигма-точек Хк выбирается равным 2п+1, где п - размерность вектора х , а их расположение формируется симметрично относительно х, например, с использованием соотношений [14]

Х0 = х, Хк = х ±[л/(п + К )Рх ] к, к = 1.2п.

Здесь [Дп + К )Рх ] к - к -й столбец матрицы ^(п + К )Рх , которая

может быть найдена, например, путем использования формул факторизации Холецкого. Соответствующие сигма-точкам веса определяются в виде:

К 1 _

Ж0 =-, Жк =-, к = 1.2п.

п + К 2п + 2 К

В этих соотношениях К - коэффициент, выбираемый, вообще говоря, из эвристических соображений, в частности, для гауссовского распределения К принимается равным 3 - п [14].

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Предположим, что в качестве у(х) выступает функция з(х) из примера, рассмотренного в предыдущем разделе, т.е.

I = [вт(х^),вт(х^2),....,в1п(хХт)]1. Поскольку п=1, в этом случае имеем всего три сигма-точки в одномерном пространстве, а соответствующие им веса будут задаваться в виде

X0 = x X1,2 = x ±V1 + KG0 :

K 1

W0 =-, W1 = W2

1 + K 1 " 2 + 2K Используя (17), (18) можем найти два момента для вектора g.

В частности, для компонент вектора gU получим

gU =-K- sin( tjX) + [sin (ti (x w 1 + KGü ))+ sin (ti (x -V1 + KGü ))],

1 + K 2 + 2 K

где i = .

Обсудим некоторые особенности U-преобразования. Предположим, что x - случайная величина с математическим ожиданием x = Mx {x} и

дисперсией gQ = Mx {x - x )2 } и в результате ее преобразования с использованием нелинейной функции формируется новая случайная величина g = у(x). Разложим в ряд Тэйлора функцию у(x) и запишем следующее выражение для математического ожидания g в окрестности точки x:

g = Mx {g }=v(x )+У (x )Mx }+ Qy" (x )Mx {~2}+...

+ 1y(l) (x )Mx }+... где ~ = x - x. Аналогичным образом поступим с gU, т.е.

(20)

2 2 12 g - gU =£wtv(x) + V(x)YWkXk + -QV"(x)XWkXk2 +...

k=0 k=0 ^ k=0

2

(21)

1 2

+V) (X )£ ж, Х +...,

1! к=0

где Хк = Хк _ X. В силу свойств весов и сигма-точек (19), получаем

¿Ж = 1, Мх {х}= 0 = ¿ГШ, Мх X2 }= £ ЖкХк2 = °о . (22)

к=0 к=0 к=0

Отсюда с очевидностью следует, что первые три члена рядов (20) и (21) совпадают. Именно поэтому принято считать, что и-преобразование позволяет определить математическое ожидание вектора, сформированного с использованием нелинейной функции, с точностью до учета членов третьего порядка малости при разложении этой функции в ряд Тейлора.

Можно показать, что аналогичные утверждения справедливы и для второго момента, а также и в векторном случае [13].

Т I т т\

Если g = г =(х , у ) - составной вектор, включающий оцениваемый вектор и вектор измерений, то формулы (17), (18) позволяют найти первые два момента этого вектора, т.е. моменты, необходимые для реализации ЛОА (7)-(10). Алгоритм, использующий и-преобразование

для нахождения моментов y, Pxy, Py с последующим применением выражений типа (7) для вычисления линейных оценок, был назван -Unscented Kalman Filter" (UKF) [14]. Иногда его также называют Sigma Point Kalman Filter [15].

При рассмотрении особенностей алгоритма UKF нередко основное внимание уделяется преимуществам по сравнению с обобщенным ФК и его модификациями [12], [14]. В частности, отмечается, что такой алгоритм обеспечивает более высокую точность и проще в вычислительном отношении, поскольку при его реализации не требуется нахождения производных функции s(x). Для целей настоящей работы важно еще раз подчеркнуть, что, алгоритм UKF направлен на вычисление двух моментов т 1т т\

вектора g = z =lx , y I и таким образом он является приближенной реализацией ЛОА. Однако в упомянутых выше работах, а также в трудах, посвященных использованию аналогичных приближенных процедур (например, используемых в так называемых DDF, CDF, QKF CKF алгоритмах [16-18]), не уделяется должного внимания вопросу о возможных потерях в точности по сравнению с ЛОА. Не затаривается и проблема адекватности вырабатываемой характеристики точности. Проиллюстрируем важность этих вопросов на следующем методическом примере.

Предположим, что функция s(x) в выражении (1) может быть представлена в виде s( х) = g (х)1 mx1, где х - скалярная центрированная гаус-совская величина, а функция g(х) - такая, что g(х) = g(0) = 0 и g(-х) = -g(х). Здесь и далее Imxm - матрица, составленная из единиц, размерности m x m. Найдем первые два момента составного вектора

т х y

z

ошибки:

И

и соответствующую матрицу ковариаций для методической

y = J g^f (хУх1 mxb Py = J(g(х) - У)2 /(хУх1 mxm + Pv

Рху = |х8(х)/(х№х11хт , = |(8(х) - ,У)21(х¥х1 тхт - \Ку^у ).

а0

Поскольку сигма-точки и соответствующие им веса в данном случае определятся в виде

Х0 = 0, Х1,2 =^л/3^0, ^0 = 2/3, Ц\ = ^2 = 1/6, то, полагая К = 3 - п и применяя и - преобразование, нетрудно получить

Уи = 0, Рху = ^ 8 ^0 )11хт,

Руи = 1 [8(^0 )]21 тхт + Ру ,

183

Р

и

ad

ё (

(л/зо,) 2 [ яхт

1 Г 1

а2 1л/э

а ё

1хт

л/3

О ё'

(л/З^ )[

1хт

= 0.

з

К примеру, при ё(х) = ах + Ьх , где а, Ь - известные константы, будем иметь

У = 0 , рху =СТ^ (а + 3Ьа^ ^¡хт , Ру =(а+ 15Ь0 + 6аЬа0 ^тхт + Р,

г Ни

2 2 6 н"и = (а + 3Ьа())11хт , Pаd = 6Ь ао1 тхт ■

Применяя Ц-преобразование, можем записать

и - Р ри

ху - рху> РУ

Уи - У, РХУ - Рху, РУ7 = (а2а2 + 9Ь2а6 + 6аЬа0)[тхт + Р.

V ■

Т

1

Нетрудно заметить, что Р^ = 0, иными словами в этом примере расчетное значение матрицы ковариаций для методической ошибки равно нулю, что на самом деле не соответствует действительности и приведет к появлению дополнительной ошибки при решении задачи оценивания и неадекватности вырабатываемой характеристики точности.

Таким образом, можно выделить следующие особенности алгоритма Ц^:

- простота реализации по сравнению с ЛОА и алгоритмами КТ;

- не требуется вычисления производных и обеспечивается более адекватное описание нелинейного функции с помощью линейного аналога, по сравнению с алгоритмами КТ, основанными на разложение в ряд Тейлора;

- несмотря на то, что предусматривается учет наличия дополнительных ошибок, возникающих при использовании линейного описания, в общем случае не обеспечивается адекватность вырабатываемых расчетных характеристик точности.

Анализ исследуемых алгоритмов на примере нелинейной навигационной задачи

Проанализируем эффективность применения исследуемых алгоритмов на примере задачи определения координат места по информации о дальностях до точечных ориентиров (ТО) с известными координатами. В целях упрощения ограничимся ее рассмотрением для плоскости в предположении, что используется лишь два ТО. Идея определения местоположения по дальностям до ТО основана на отыскании точки пересечении изолиний положения (рис. 2) [10]. В этом случае задача может быть сформулирована следующим образом.

180

Требуется оценить центрированный случайный вектор

у

х = [х\ ] , компоненты которого представляют собой координаты на плоскости по 2т -мерным измерениям, которые имеют вид

у\ = (х) + у?=]1 - х* ^ + (х2 ~ х\ )2 + (23)

где / = 1 .т, ' К00РДинать1 точечных ориентиров, к-1,2, х^ ,х2 -

неизвестные координаты объекта, \\ - независимые между собой центрированные ошибки измерения с одинаковой дисперсией г2.

Использование такой задачи в качестве примера, помимо ее практической значимости, обусловлено еще и следующим обстоятельством. Дело в том, что в зависимости от соотношения величины а о, определяющей уровень априорной неопределенности знания каждой координаты, и значений дальностей до ТО, эту задачу можно трактовать как задачу с несущественными (ао значительно меньше дальностей до ТО - рис. 2,а), либо с существенными нелинейностями (ао соизмерима с дальностями до ТО - рис. 2,6). В первом случае апостериорная плотность одноэкстремаль-на, а во втором - это свойство нарушается.

Вид изолиний

х10

Вид апостериорной плотности

область априорной неопределенности

Вид изолиний

х 10

о

4000

4000

Вид апостериорной плотности

Рис. 2. К определению несущественных (а) и существенных нелинейностей (б) в задаче определения координат по измеренным дальностям до ТО

185

При проведении моделирования будем полагать заданными: гаус-совский закон распределения х и V; координаты ТО х1 = [р, 0]^,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

х2 = [0, р]^ , р = 3000 м; значения ао= 300 м и 1400 м и г = 0.01р; т =5; количество итераций при реализации ИФК у = 10; число реализаций при вычислении безусловных дисперсий £=1000; число реализаций при вычислении моментов в ЛОА N =10000.

Полученные результаты представлены в табл. 2 для одной компоненты вектора состояния, для второй компоненты они имеют аналогичный вид.

Таблица 2

Значения ац / а ц в задаче определения координат по измерениям (23)

ц = ФК ц = Нет ц = ¡¡п ц = и ц п Оч.

а0 =1400 м 610/13 300/40 495/495 533/383 280/280

а0 =300 м 29/13 13/13 25/25 25/25 13/13

Выводы, которые следуют из представленных результатов, полностью согласуются с теми, которые были получены в предыдущем простейшем примере:

- ЛОА вырабатывает адекватную характеристику, однако потери в точности по сравнению с НОА могут быть значительными, особенно в задачах с существенными нелинейностями.

- Расчетные характеристики с~ФК, а^ег, вырабатываемые в линеаризованном и итерационном алгоритмах, в общем случае не согласованы с действительной СКО, но при малом значении а 0 такое согласование у итерационного алгоритма имеет место, и его точность выше точности ЛОА и совпадает с точностью НОА. Таким образом, при малом уровне априорной неопределенности ЛОА проигрывает по точности не только НОА, но и по итерационному алгоритму КТ. Этот проигрыш объясняется нелинейным характером итерационного алгоритма. Основным недостатком алгоритмов, основанных на приближенном описании нелинейной функции э(х), является тот факт, что в них не учитывается наличие дополнительной ошибки, возникающей при замене нелинейной функции ее линейным описанием. Достоинство ИФК заключается в обеспечении, в ряде случаев, точности, близкой к точности НОА для задач с несущественными нели-нейностями, что является следствием его нелинейного характера.

- Применение алгоритма ЦК1 (ц = и ) позволяет существенно снизить объем вычислений и не требует нахождения производных, однако достигаемая при этом точность в общем случае ниже точности ЛОА,

186

и в ряде случаев вырабатываемая в них расчетная характеристика точности не адекватно отражает действительный уровень ошибок оценивания. Это объясняется приближенным характером процедуры нахождения моментов плотности распределения при использовании Ц-преобразования.

На основе проведенного сопоставления ЛОА с алгоритмами КТ могут быть предложены модификации ЛОА, позволяющие в ряде случаев получать точности, близкие к потенциальной и обеспечиваемой при использовании НОА. В частности, можно показать, что модификация ЛОА, основанная на комбинированном использовании ЛОА и итерационного алгоритма, позволяет в ряде случаев приблизиться к точности НОА [19]. В такой модификации предполагается двухэтапная процедура, при этом на первом этапе используется ЛОА, а затем ИФК. Также заслуживают внимания итерационный ЛОА [20] или итерационный Ц^ [21], [22]. Их суть заключается в итерационной процедуре использования ЛОА или ЦК1 и учете информации об оценке и расчетной матрице ковариаций с предыдущей итерации. Этот прием позволяет приблизиться к точности НОА [20]. Основой для повышения эффективности в таких алгоритмах служит тот факт, что в ЛОА обеспечивается выработка адекватной характеристики точности. Однако нередко в задачах с существенными нелинейностями указанные модификации не приводят к должному эффекту, и точность ЛОА ниже точности НОА.

Таким образом, можно констатировать, что в общем случае в задачах с существенными нелинейностями использование алгоритмов КТ, включая ЦКБ и ЛОА, не обеспечивает достижения точности, близкой к потенциальной и достигаемой с помощью НОА.

Заключение

На примере простейшей нелинейной задачи оценивания исследованы особенности линейного оптимального алгоритма, и на этой основе, с одной стороны, проанализирована взаимосвязь с алгоритмами КТ, включая алгоритм ЦКР, а с другой - их достоинства и недостатки. Показаны ограниченные возможности ЛОА в задачах с существенными нелинейностями, обсуждены возможные пути повышения эффективности его работы.

Заметим, что детального рассмотрения заслуживает вопрос сопоставления вычислительной сложности алгоритмов, в т.ч. сложности реализации самого ЛОА. Этот вопрос здесь не затрагивался, во-первых, в связи с тем, что цель работы заключалась в выявлении принципиальных отличий, обсуждаемых алгоритмов, не связанные с проблемой их реализации, а, во-вторых, по причине ограниченного объема статьи. По этой же причине не рассматривался очень важный вопрос о рекуррентных процедурах и возможности обобщения полученных выводов на случай оценивания изменяющихся во времени последовательностей. Перечисленные вопросы являются предметом отдельного обсуждения.

187

Список литературы

1. Степанов О.А. Применение теории нелинейной фильтрации в задачах обработки навигационной информации. СПб: ГНЦ РФ ЦНИИ "Электроприбор", 1998 г, 369с.

2. Bergman, N. Recursive Bayesian estimation. Navigation and Tracking Applications. Linkoping Studies in Science and Technology. Dissertations, 579. Dept. Elect. Eng., Linkoping Univ., SE-581-83 Linkoping, Sweden, 1999.

3. Степанов О.А. Линейный оптимальный алгоритм в нелинейных задачах обработки навигационной информации // Гироскопия и навигация, 2006, №4, СПб: ГНЦ РФ ЦНИИ "Электроприбор". С. 11-21.

4. Li X. R., Zhu Y., Wang J., and Han C. Optimal Linear Estimation Fusion—Part I: Unified Fusion Rules. IEEE Transactions on Information Theory, Vol. 49, No. 9, 2003, pp. 2192-2208.

5. Степанов О.А., Торопов А.Б. Сравнительное исследование линейного и нелинейного оптимальных алгоритмов оценивания в задачах обработки навигационной информации // Гироскопия и навигация. № 3 (70). 2010. С. 24-36.

6. Daum F. Nonlinear Filters: Beyond the Kalman Filter. //IEEE Aerospace and Electronic Systems. Tutorials, Vol. 20(8), 2005, pp. 57-71.

7. Li X. R. and V.P. Jilkov. A survey of Maneuvering Target Tracking: Approximation Techniques for Nonlinear Filtering. Proc. 2004 SPIE Conference on Signal and Data Processing of Small Targets, San Diego, 2004, pp 537-535

8. Chen Z. Bayesian Filtering: From Kalman Filters to Particle Filters, and Beyond. p.69. Cвободный доступ: citeseerx.ist.psu.edu. Последнее обращение: 30.06.2010.

9. Lefebvre, T., H. Bruyninckx and J. De Schutter. Nonlinear Kalman Filtering for Force-Controlled Robot Tasks. Springer, Berlin, 2005.

10. Степанов О.А. Основы теории оценивания с приложениями к задачам обработки навигационной информации. СПб: ГНЦ РФ ЦНИИ "Электроприбор", 2010. с. 496.

11. Gelb A. Applied Optimal Estimation. England, the M.I.T. Press,

1974.

12. Juiler S. J. and J. K. Uhlmann. Unscented Filtering and Nonlinear Estimation.// Proc. IEEE, Vol. 92(3), 2004, pp 401-422.

13. Van der Merwe, R. and E. A. Wan. The Unscented Kalman Filter. In: Kalman Filtering and Neural Networks (Haykin S.), 2001, pp 221-268, John Wiley & Sons. Inc.

14. Juiler S. J. and J. K. Uhlmann. Simon J., H.F. Durrant-Whyte. A new Approach for Filtering Nonlinear Systems. // In Proceedings of American Control Conference, Seattle, Washington, 1995, 1628-1632.

15. Wendel J., Metzger J., Moenikes R., Maier A., Trommer G.F. A Per-fomance Comparison of Tightly Coupled GPS/INS Navigation Systems based on Extended and Sigma Point Kalman Filters. Navigation: Journal of the Institute of Navigation USA, Spring 2006, vol. 53, № 1, p. 21-31.

16. N0rgaard M., Poulsen N. K and Ravn O. Advances in Deriva-tive_Free State Estimation for Nonlinear Systems. Technical report IMM-REP-1998-15, Technical University of Denmark, 2800 Lyngby, Denmark, 2000.

17. Arasaratnam I. and S. Haykin. Cubature Kalman filters, IEEE Trans. Automatic Control, pp. 1254-1269, June 2009.

18. Arasaratnam I., Haykin S., Elliott R. J. Discrete-Time Nonlinear Filtering Algorithms Using Gauss-Hermite Quadrature.//Proceedings of the IEEE, Vol. 95, No. 5, May 2007, p. 953-977.

19. Торопов А.Б. Решение задачи корреляционно-экстремальной навигации на основе комбинированного использования линейного оптимального и итерационного алгоритмов. Материалы IX КМУ "Навигация и управление движением", СПб: ГНЦ РФ ЦНИИ "Электроприбор", 2007. С. 235-242.

20. Степанов О.А., Торопов А.Б., Королева Ю.В. Сопоставление субоптимальных алгоритмов калмановского типа в нелинейных навигационных задачах. //Труды VI Российской научно-технической конференции "Современное состояние и проблемы навигации и океанографии", СПб: ГУНИО, 2007. С. 55-63.

21. Грачев А.Н., Шурыгин С.В. Методика синтеза итерационных алгоритмов совместного оценивания параметров и состояния линейных дискретных систем // Труды VII Международной конференции «Идентификация систем и задачи управления», Москва, ИПУ им. Трапезникова РАН, 2008.

22. Zhan R. and Wan J. Iterated Unscented Kalman Filter for Passive Target Tracking\\ IEEE Transactions on Aerospace and Electronic Systems. Vol.43, N 3, July 2007, pp. 1155 - 1163.

О.Л.&ерапоу, A.B. Toropov

LINEAR OPTIMAL ALGORITHMS FOR ESTIMATION PROBLEMS WITH NONLINEAR MEASUREMENTS. RELATION WITH KALMAN-TYPE ALGORITHMS.

Features of linear optimal algorithms (LOA) - for estimation problems with nonlinear measurements are investigated. The relation of the LOA with Kalman-type algorithm, such as Iterated Kalman Filter, Unscented Kalman Filter and Linear Regression Kalman Filter are discussed.

Key words: Kalman filters, navigation, liner optimal algorithm, Kalman-type algorithm.

Получено 08.09.2012

i Надоели баннеры? Вы всегда можете отключить рекламу.