Научная статья на тему 'Решение задачи нелинейной параметрической идентификации стохастических объектов с использованием критерия минимума вероятности ошибки оценивания'

Решение задачи нелинейной параметрической идентификации стохастических объектов с использованием критерия минимума вероятности ошибки оценивания Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
165
31
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПАРАМЕТРИЧЕСКАЯ ИДЕНТИФИКАЦИЯ / PARAMETRICAL IDENTIFICATION / ОШИБКА ОЦЕНИВАНИЯ / ESTIMATION ERROR / МИНИМУМ КРИТЕРИЯ / A MINIMUM OF CRITERION / ФИЛЬТР КАЛМАНА / KALMAN FILTER

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Соколов Сергей Викторович, Кучеренко Павел Александрович

Рассматривается проблема нелинейной параметрической идентификации стохастических объектов. Предлагается метод решения задачи идентификации параметра дискретного наблюдателя с использованием критерия минимума вероятности ошибки оценивания. Для иллюстрации эффективности предлагаемого подхода рассматривается численный пример.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Соколов Сергей Викторович, Кучеренко Павел Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Solution of the Problem of Nonlinear Parametrical Identification of Stochastic Objects Based on the Minimum Criterion of the Estimation Error Probability

The nonlinear stochastic parametrical identification problem is considered. The method of the decision of identification parameter problem of the discrete observer with use of estimation error probability minimum criterion is offered. For an illustration of efficiency of the offered approach the numerical example is considered.

Текст научной работы на тему «Решение задачи нелинейной параметрической идентификации стохастических объектов с использованием критерия минимума вероятности ошибки оценивания»

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И СИСТЕМЫ

УДК 519.248: 681.5.001.3

С. В. Соколов, П. А. Кучеренко

РЕШЕНИЕ ЗАДАЧИ НЕЛИНЕЙНОЙ ПАРАМЕТРИЧЕСКОЙ ИДЕНТИФИКАЦИИ СТОХАСТИЧЕСКИХ ОБЪЕКТОВ С ИСПОЛЬЗОВАНИЕМ КРИТЕРИЯ МИНИМУМА ВЕРОЯТНОСТИ

ОШИБКИ ОЦЕНИВАНИЯ

Рассматривается проблема нелинейной параметрической идентификации стохастических объектов. Предлагается метод решения задачи идентификации параметра дискретного наблюдателя с использованием критерия минимума вероятности ошибки оценивания. Для иллюстрации эффективности предлагаемого подхода рассматривается численный пример.

Ключевые слова: параметрическая идентификация, ошибка оценивания, минимум критерия, фильтр Калмана.

Введение. Расширение области практического использования методов и алгоритмов стохастической параметрической идентификации обусловливает устойчивый рост интереса к развитию теории идентификации и разработке новых подходов к решению существующих в данной сфере проблем. Как показывает анализ публикаций, большинство работ посвящено вопросам, связанным с идентификацией параметров модели наблюдаемого стохастического объекта, в то время как вопросы, касающиеся определения параметров измерителя (наблюдателя) вектора состояния объекта, остаются практически не освещенными [1—9]. При этом задачи подобного рода часто возникают в различных областях телекоммуникации и связи, радионавигации, метрологии и др. К числу наиболее распространенных можно отнести задачи определения характеристик тракта передачи (времени распространения сигналов, параметров самой среды передачи и др.), а также определения коэффициентов усиления аппаратуры приемника.

В настоящей статье предлагается метод решения задачи параметрической идентификации, позволяющий, во-первых, освободиться от присущих известным методам ограничений (таких, как линейность модели измерителя относительно параметров, необходимость нормального вида распределения аддитивных шумов объекта и помех наблюдаемых сигналов и пр.), а во-вторых, повысить потенциальную точность процедуры идентификации за счет использования обобщенного вероятностного критерия, зависящего в общем случае нелинейно от апостериорной плотности распределения вероятности вектора состояния.

Следует отметить при этом, что вопросы идентификации по критериям, основанным на минимизации среднеквадратического отклонения ошибки оценивания, рассматривались ранее в работах [3—6]. Однако эти критерии в силу неравенства Чебышева являются (как это будет видно из последующих рассуждений) лишь частными случаями обобщенного нелинейного критерия, составляющего основу предлагаемого в настоящей статье подхода.

Для упрощения изложения остановимся подробнее на скалярных уравнениях, определяющих нелинейную модель наблюдаемого объекта и структуру его измерителя.

Постановка задачи параметрической идентификации. Пусть дискретный объект задан нелинейным разностным уравнением

Xk = f(Xk-1) + n, X1 = X(1h (!)

где n — возмущающее воздействие (шум) с известной функцией плотности распределения вероятности q(n); Xk — переменная состояния объекта в k-й момент времени; f — известная нелинейная функция, Xi — значение переменной состояния объекта в начальный момент времени.

Наблюдение за переменными состояния в дискретном времени осуществляется измерителем, описываемым также нелинейным (как относительно параметра наблюдателя, так и относительно переменной состояния объекта) уравнением следующего вида:

zk = X(c, xk ) + w, (2)

где Zk — дискретный отсчет сигнала измерителя; c — искомый параметр измерителя; w — шум измерителя с известной функцией плотности распределения вероятности g(w) ; х — известная нелинейная функция наблюдения.

При этом отметим, что идентифицируемость параметров измерителя обеспечивается [10] единственностью апостериорной плотности распределения вероятности (АПРВ) вектора состояния наблюдаемого объекта, содержащей максимально полную информацию о совокупности переменных его состояния и параметрах измерителя.

Для упрощения совокупности дискретных отсчетов сигнала измерителя z{, i=1... k, обо-k

значим через Z1 .

В рассматриваемом общем нелинейном стохастическом случае задача идентификации неизвестного параметра c может быть сформулирована как задача нахождения его значения, доставляющего оптимум некоторому обобщенному вероятностному критерию J, зависящему от АПРВ вектора состояния. В качестве условия оптимизации (минимизации) критерия J используем далее условие минимума апостериорной плотности распределения вероятности текущей ошибки оценивания о переменных состояния объекта на выбранном интервале ее предельно допустимого изменения — от amin до omax, т.е.

Omax

min J = min [ p(ok | z^ )dOk,

c c J

°min

где Ok = Xk - Xk — текущая ошибка оценивания, Xk — текущая оценка переменной состояния объекта; p(ok | z\) — АПРВ ошибки оценивания.

Учитывая линейную зависимость значений ошибки Ok и переменной состояния Xk, выразим АПРВ ошибки оценивания p(ok | z1) через АПРВ переменной состояния p(Xk | zf) (выражение для которой будет получено ниже):

p(ok | z1k ) = P(ok + Xk | z1k ).

В этом случае минимизация критерия может быть представлена следующим образом:

max max

min J = min J p(ak | )dak = min J p(ak + xk | z1 )dok . (3)

c С

В результате поставленная задача сводится к нахождению АПРВ р(о^ + Хск 1) и последующему определению значения искомого параметра из условия минимума критериального выражения в формуле (3).

Синтез алгоритма нелинейной параметрической идентификации. Для определения

АПРВ р(ок + сск | 2^ ) предварительно используем выражение для АПРВ р(хк | 2^ ) с последующей соответствующей заменой переменных.

Известно [11], что АПРВ информационного параметра х для к-го момента времени определяется выражением

р k 1

J p(xk-1 1 zi - )p(xk 1 xk-i)dxk-ip(zk 1 xk)

P(Xk I zik ) = ^---, (4)

h

где

Ь =|| Р(Хк-1 1 21к 1)Р(хк 1 хк—\)&к-1 Р(2к 1 хк №к •

—го —го

Условная плотность вероятности р(хк | хк—1) в формуле (4) может быть определена из уравнения (1) при известном виде плотности распределения вероятности значений шума п (в предположении их взаимной статистической независимости):

р(хк 1 хк—1) = Ч(хк — /(хк—1)) .

Аналогичным образом из уравнения (2) можно определить и входящую в формулу (4) функцию правдоподобия:

р(2к 1 хк ) = 8(2к —X(c, хк )).

Так как АПРВ р(хк—1 | 2^—1) в равенстве (4) является известной функцией, рекуррентный алгоритм определения АПРВ переменной состояния для к-го момента времени при нали-

к

чии дискретных отсчетов сигнала 21 принимает следующий вид:

J p(xk-i 1 zik 1)^(xk - f (xk-i))dxk-1 g(zk -X(c, xk ))

h\c)

p(XkIzk ) = ---, (5)

где

h*(c) = J J p(xk-1 1 z1k 1qxk - f (xk-1))dxk-1 g(zk -x(C xk ))dxk •

-ro -ro

Произведя соответствующую замену переменных в уравнении (5) и обозначив критериальное выражение через q(c), задачу поиска минимума критерия (3) можно представить в следующем виде:

min J = min q(c), (6)

где

тах

О(с) = | р(рк + Хк | % ок =

°тт

(да Л

| р( Хк-1 1 -1)^ ((Ок + Хк ) - / ( Хк-х))^к-1 g( ^к "Х(С, ^к + Хк ))

И (с)

Здесь важно отметить, что в общем случае решения поставленной задачи оценка переменной состояния Хк, входящая в формулу (6), представляет собой некоторый функционал (оператор) Ь от апостериорной плотности распределения вероятности переменной состояния, т.е. Хк = Ь(р(Хк | )), и, следовательно, в силу выражения (1) является нелинейной функцией от искомого параметра с: Хк = и (с).

Тогда критериальное выражение в уравнении (6) окончательно можно представить в следующем обобщенном виде:

( да л

тах

О(с) = |

| р( Хк-1 | гк-1)^ ( + и (с )) - / (Хк-1) ))-1 g (к - х(с, Ок + и (с)))

-да_

и*(с)

йок. (7)

Идентификация параметра, удовлетворяющего условию минимума критерия (6), предполагает минимизацию полученного критериального выражения (7). Для этой цели в зависимости от конкретного вида получаемой функции О(с) можно использовать известные и широко применяемые методы оптимизации: градиентный, метод Ньютона, метод сопряженных направлений, различные прямые методы и др. Выбор метода определяется особенностями наблюдаемого объекта и его измерителя.

Многомерный метод нелинейной параметрической идентификации. Минимизацию критерия (6) можно легко обобщить для многомерного случая, когда уравнения объекта и наблюдателя описываются следующими векторными уравнениями:

хк = /(хк-1) + п; 2к =х(с хк)+,

где Хк и Хк-1 — и-мерные векторы переменных состояния в к-й и (к -1)-й моменты времени (шаги) соответственно; г к — да-мерный вектор сигналов измерителя; п — и-мерный вектор шума с известной и-мерной функцией плотности распределения вероятности ^(п); С — вектор (или матрица) параметров наблюдателя; w — да-мерный вектор шума с известной да-мерной функцией плотности распределения вероятности g.

Поскольку методика синтеза алгоритмов, соответствующих многомерному случаю, является полностью аналогичной изложенной выше для скалярного случая, приведем окончательную форму критериального выражения для рассматриваемого векторного случая:

~ тах ~ тах

п(С) = | ... | р(ок + Хк | 21кк =

сг

О

О

о

О

тах " тах 1

I ... | р(хк—1 | г\ 1)^((о к + х к) — /(х к—1))^х к—18 (г к — Х(С, О к + хк))

—го —го

Л*(С)

ёОг. ;

И*(С) = 1 ... 1 1 ... 1 р(хк—1 | г} 1)^((ок + хк) — /(хк—1)МХк—18(гк — х(сОк + хк))

—го —го

у—го —го

где хк — вектор оценок переменных состояния; г1 — совокупность векторов сигналов г1, /=1...к; о к — вектор ошибки оценивания.

Эффективность использования предложенного подхода проиллюстрируем на следующем примере.

Пример. Рассмотрим стохастический дискретный объект, заданный нелинейным разностным уравнением

хк = 3 хк—1 — (хк—1)2 + п, х1 = 1 (8) где п — белый гауссов шум с дисперсией Дп = 0,02 и нулевым средним.

Наблюдение за переменными состояния объекта осуществляется измерителем, описываемым следующим нелинейным уравнением:

2к = с(2хк — 0,5(хк )2) + н, (9)

где с — искомый параметр наблюдателя (для рассматриваемого примера выберем исходное значение этого параметра с = 1,5 ); н — белый гауссов шум с нулевым средним и дисперсией Д = 0,25.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Определение оценок произведем с использованием рекуррентного алгоритма калманов-ской фильтрации. Линеаризованные уравнения (8) и (9) принимают при этом следующий вид:

хк = 4хк—1 + вк + п, х1 =1; 2к = с(Екхк + рк)+н,

22 где Ак = 3 — 2х}—1, Вк = (х.к—1) , Ек = 2 — хк—1, Р} = 0,5(хк—1) — коэффициенты, полученные

в результате линеаризации функций /(х}—1) и х(с, х} ) в окрестностях оценок переменной

состояния объекта для (к -1)-го шага.

Для определения текущего значения оценки переменной состояния объекта использовался оптимальный фильтр Калмана [11], который в рассматриваемом случае определяется как

хк = и (с) = А}хк—1 + Вк + Кк (2} — с(Ек (А}хк—1 + Вк) + Р})), х = 0,5 ;

К} = сДн, Кк =

,2 л

-1

у Кк—1 + Дп у

К = 0,5.

Критериальное выражение О(с) на к-м шаге алгоритма для данного примера примет

вид

шах шах

^(с) = 1 р(стк + хк | 21к Мстк = 1

р( хк _1|-к-)," 2 Д

,2 Л

2Д-<хк2Д

И (с)

йак , (10)

т = стк + хк— 3хк—1 + (хк—1)2, и = 2к— с(2(стк + хк) — 0,5(стк + хк)2).

а

АПРВ для первой итерации алгоритма выберем нормальной с дисперсией £>0 = 0,5 и

нулевым математическим ожиданием. При этом отклонение среднего значения апостериорной плотности от начального значения переменной состояния не оказывает в дальнейшем существенного влияния на качество процедуры идентификации.

На рис. 1 представлен полученный в результате моделирования график входящей в формулу (10) АПРВ текущей ошибки оценивания для к-го шага алгоритма (£=50), которая, являясь функцией текущей ошибки а к, зависит также и от значений искомого параметра с :

(р(0£ + хк | ) = р(ок + и (с) | ) = V (с, ок)).

, о.е.

к

40 20 0

Рис. 1

Определение интегралов в выражении (10) производилось численно с использованием квадратурных формул с шагом а = 0,03 . Бесконечные пределы интегрирования по переменной состояния х были заменены на конечные значения, удовлетворяющие точностным требованиям к алгоритму оценки ( хтщ = 0, хтах = 4).

На рис. 2 приведен график зависимости функции критериального выражения о(с) от искомого параметра при к=50. Границы интервала интегрирования по текущей ошибке оценивания также выбирались исходя из требований, обеспечивающих необходимую точность алгоритма оценки (ат^ = -1,5, отах = 0,2).

О(с), о.е!

0,4

0,3

0,2

I Л

П 11

1 I

V

I 'I

41 и

0

1

3

4 с, о.е.

2

Рис. 2.

Как показали результаты моделирования, вид приведенной на рис. 2 зависимости является характерным для критериальных выражений, получаемых на различных итерациях алгоритма (7).

Здесь важно отметить, что, являясь многоэкстремальными, критериальные выражения на различных шагах алгоритма (см. рис. 2) принимают наименьшие значения при с = 2.

Для минимизации функции критериального выражения на очередном шаге алгоритма, т.е. для однозначного определения численного значения текущей оценки искомого параметра, целесообразно, задав некоторый интервал возможных значений параметра с (в рассмотренном примере 0 < с < 5 ), применить один из методов прямой минимизации. В данном случае использовался модифицированный симплексный метод прямой минимизации Нелдера — Мида — метод Бокса, обладающий достаточной вычислительной эффективностью и удобной программной реализацией [12].

Результаты компьютерного моделирования процедуры нелинейной параметрической идентификации показали, что если количество дискретных значений сигнала измерителя больше 250, то отклонение оценки параметра наблюдателя от его истинного значения с = 2 не превышает 9,7 %.

Таким образом, результаты проведенных исследований подтверждают принципиальную возможность эффективной реализации метода нелинейной параметрической идентификации с использованием критерия минимума АПРВ текущей ошибки оценивания. При этом важно отметить, что упомянутые выше методы параметрической идентификации [3—6] в изложенной постановке рассмотренную задачу решить не позволяют.

Заключение. Полученное выражение (7) определяет самый общий вид алгоритма нелинейной параметрической идентификации, обладающего рядом принципиально новых свойств. К их числу следует отнести:

— более высокий по сравнению с традиционными методами уровень потенциальной точности процесса идентификации благодаря использованию обобщенных вероятностных критериев, зависящих в общем случае нелинейно от апостериорной плотности распределения вероятности вектора состояния объекта;

— инвариантность к виду плотности распределения вероятности шума как объекта, так и измерителя;

— возможность применения метода для нелинейных объектов и наблюдателей, в том числе, при нелинейной зависимости функции наблюдения от искомого параметра.

Таким образом, предложенный метод нелинейной параметрической идентификации на основе обобщенных вероятностных критериев может быть весьма эффективно использован в различных областях связи, управления, метрологии и т.п.

список литературы

1. Гроп Д. Методы идентификации систем. М.: Мир, 1979.

2. Льюнг Л. Идентификация систем. Теория для пользователя. М.: Наука, 1991.

3. Эйкхофф П. Основы идентификации систем управления. М.: Мир, 1975.

4. Сейдж Э., Мелса Дж. Идентификация систем управления. М.: Мир, 1974.

5. Пугачев В. С., Казаков И. Е., Евланов Л. Г. Основы статистической теории автоматических систем. М.: Машиностроение, 1974.

6. Пащенко Ф. Ф. Введение в состоятельные методы моделирования систем. Идентификация нелинейных систем. М.: Финансы и статистика, 2007.

7. Петров Б. Н., Уланов Г. М., Гольденблат И. И., Ульянов С. В. Теория моделей в процессах управления. М.: Наука, 1978.

8. Справочник по теории автоматического управления / Под ред. А. А. Красовского. М.: Наука, 1987.

9. Штейнберг Ш. Е. Идентификация в системах управления. М.: Энергоатмоиздат, 1987.

10. Пугачев В. С., Синицын И. Н. Стохастические дифференциальные системы. М.: Наука, 1985.

11. Тихонов В. И., Харисов В. Н. Статистический анализ и синтез радиотехнических устройств и систем. М.: Радио и связь, 1991.

12. Банди Б. Методы оптимизации: Вводный курс. М.: Радио и связь, 1988. Сергей Викторович Соколов

Павел Александрович Кучеренко —

Рекомендована кафедрой автоматики и телемеханики на ж.-д. транспорте

Сведения об авторах д-р техн. наук, профессор; Ростовский государственный университет путей сообщения, кафедра автоматики и телемеханики на ж.-д. транспорте, Ростов-на-Дону

аспирант; Ростовский государственный университет путей сообщения, кафедра автоматики и телемеханики на ж.-д. транспорте, Ростов-на-Дону; E-mail: [email protected]

Поступила в редакцию 21.05.08 г.

УДК 004.627

Ю. В. Лужков

МЕТОД АДАПТИВНОГО СКАЛЯРНОГО КВАНТОВАНИЯ В СХЕМАХ НЕОБРАТИМОГО СЖАТИЯ ИЗОБРАЖЕНИЙ

Рассматривается проблема адаптивной генерации матриц квантования. Для схем сжатия изображений с потерей качества, использующих спектральные преобразования, предложен способ адаптивного скалярного квантования спектральных коэффициентов на основе весового критерия и рассмотрены способы определения этого критерия.

Ключевые слова: сжатие изображений, адаптивное квантование, весовой критерий, JPEG.

Введение. В настоящее время одним из распространенных форматов сжатия изображений с потерей качества является JPEG (Joint Photographic Experts Group) [1]. Разработаны и другие схемы сжатия (см., например, работы [2, 3]), эффективность которых существенно превосходит алгоритмы на основе дискретных спектральных преобразований. Однако вследствие широкой распространенности последних перед исследователями встает следующий вопрос: возможно ли модифицировать существующую схему компрессии таким образом, чтобы повысить степень сжатия, не меняя при этом алгоритм декомпрессии? Решение этой задачи позволит вносить изменения в существующие программы-компрессоры, не заботясь о наличии у пользователей специального (модифицированного) программного обеспечения для декомпрессии изображений.

В применяемых алгоритмах сжатия используются некоторые параметры по умолчанию. Например, в формате JPEG к таким параметрам относятся матрицы квантования и таблицы Хаффмана: они сохраняются в заголовке сжатого файла, и формат допускает самостоятельное определение пользователем их значений, что является одним из путей повышения степени компрессии. Так, известны несколько подходов к составлению матриц квантования в формате JPEG (например, [4, 5]), которые, однако, не являются универсальными и требуют сравнительно большого объема вычислений.

В настоящей статье рассматривается обобщенный подход к адаптивному скалярному квантованию коэффициентов спектра, предлагаемый способ прост в реализации и может быть применен, в частности, для формата JPEG.

i Надоели баннеры? Вы всегда можете отключить рекламу.