Научная статья на тему 'Критерии идентификации и методы помехоустойчивого оценивания'

Критерии идентификации и методы помехоустойчивого оценивания Текст научной статьи по специальности «Математика»

CC BY
110
35
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Грицюк Вера Ильинична

Рассматриваются условия, накладываемые на критериальную функцию и обеспечивающие асимптотический выбор модели при стремлении числа наблюдаемых данных к бесконечности, а также состоятельность методов параметрической идентификации. Приводится функция влияния. Исследуются помехоустойчивые оценки и предлагается модифицированный итерационный метод Гаусса - Ньютона для получения М - оценок.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The identification criterions and robust estimation methods

The conditions applied a criterion function essential for convergence of the estimates and consistency of the parameter identification methods are considered. The introduction of the robust norms is investigated and iterative method applied for stable estimation is given.

Текст научной работы на тему «Критерии идентификации и методы помехоустойчивого оценивания»

УДК 619.6

КРИТЕРИИ ИДЕНТИФИКАЦИИ И МЕТОДЫ ПОМЕХОУСТОЙЧИВОГО ОЦЕНИВАНИЯ

ГРИЦЮК В.И.

Рассматриваются условия, накладываемые на критериальную функцию и обеспечивающие асимптотический выбор модели при стремлении числа наблюдаемых данных к бесконечности, а также состоятельность методов параметрической идентификации. Приводится функция влияния. Исследуются помехоустойчивые оценки и предлагается модифицированный итерационный метод Гаусса - Ньютона для получения М - оценок.

Проблема определения моделей динамических сто -хастических систем широко изучается в настоящее время.

Процедура идентификации основана на трех вещах: данные, набор моделей и критерии. Идентификация —выбор той модели из набора моделей, которая описывает данные в соответствии с критерием наилучшим образом.

Предположим, что измеряемые данные генерированы динамической, стохастической, дискретной во времени системой, которая обозначена S. Выход системы во времени t обозначен y(t), р-мерный столбцовый вектор. Обозначим:

yl =(y(t),... ,у(0)),

т.е. сбор данных начинается при t=0.

Подобным образом обозначим ввод данных при времени t - u(t) и ut — вектор предшествующих входов. Пусть система S может быть описана как

У(t)=fs(t,yt-1,ut~1)+v(t);

y(0)=v(0), (1)

где fS (-,-,■) — детерминированная функция; {v(t)} — стохастический процесс, такой что

E[v(t) /v t-1]=0, (2)

здесь v t-1= v(t-1),... v(0).

Когда ищется модель системы, пользователь наиболее часто определяет основные характеристики и сложность проектируемой модели априори, до обращения к численной процедуре. Так определяется набор моделей, в котором должна быть выбрана действительная модель. Существует ряд различных соображений, влияющих на выбор модели. Предполагаемое использование модели, приемлемая степень сложности, априорные знания о системе являются важными примерами таких влияний. Выбор набора моделей не может быть сделан полностью априорно. В зависимости от результатов идентификации в рамках данного набора мы можем испытать другой набор различных характеристик (нелинейные модели вместо линейных) или различной сложности (т.е. более высокого порядка модели). Такой интерактивный выбор набора моделей является фактически фундаментальной особенностью процедуры идентификации.

РИ, 2000, № 4

Предположим, что члены набора М параметризованы конечномерным (n @ -мерным) вектором параметров © , который изменяется в наборе D м . Набор DM — компактный поднабор Rn0 . Данную модель обозначим M(©). Отсюда

M = {М(©)|©є Dм}. (3)

Модель M(©) понимается как правило для вычисления следующего выхода y(t), основанного на наблюдаемых выходах и входах ко времени t -1, которые будут обозначены yO_1,uO_1. Правило дается детерминированной функцией g м (©; t, y0_1, u 0_1). Чтобы определить член модельного набора M, который лучше описывает измеряемые входо-выходные данные y, u, естественно сравнить истинный выход y(t) с ожидаемым в соответствии с моделью M(©) и измеряемыми данными yt_1,ut_1:

y(t) - g м (©; t,yt_1 У-1) = E(t, ©). (4)

Эта разница является ошибкой предсказания во времени t для модели M(©) [1,2]. Рассмотрим функцию l(-,v) из Rх Rn0 хRp в пространство симметрических r/r матриц и сформируем матрицу

©N(©;yN,uN_1) = — £i(t,©,e(t,©)). (5)

N t=i

Наилучшая модель выбирается минимизацией скалярной функцией Qn над ©єDm . Обозначим эту функцию как h(-), полученный критерий Vn :

VN(©;yN,uN-1) = h(QN(©;yN,uN“1). (6)

Обозначим критерий как к . Элемент ©, который минимизирует VN(©;yN,uN_1) , обозначен ©n (S, M, K, X, ю). Он , очевидно, зависит от системы экспериментальных условий, реализации случайных процессов v(-),w(-), набора моделей и критерия оптимизации. Модель, выбранная во времени N-M(© n) . Критериальные функции l(t, ©; є) могут быть подвержены следующим условиям регулярности:

, © є Dm , для всех t,

д

—l(t, ©; є)

оє

< с|є| , © Є Dm , дЛя всех t-условие С1. Типичный выбор в применениях

l(t, ©, є) = |є|2, l(t, ©, є) = 1/ 2(є T Л@ є)+

+ 1/2(logdet Л@),

(h(Q)=Q) или l(t, ©, є) = єєT, ( h(Q) = det Q).

— l(t, ©, є)

Эти критерии квадратичны по є. Чаще всего в реальных применениях используется l(t, ©, є), который возрастает более медленно, чем квадратично по є , т.е. принять

l(t, ©, є) =а(|є|2), (7)

где a(t) — возрастающая функция такая, что a(t) /1 ^ 0 при t ^ да . Это делает критерий робастным против плохих измерений и соответствует

37

предположениям, что вероятность выбросов выше, чем при распределении Гаусса.

Для функции l(t, ©, є) нужно ввести некоторые соотношения, необходимые для доказательства сходимости оценок и состоятельности метода параметрической идентификации, включающие распределения ошибок предсказания.

Приведем два условия на критериальную функцию h(-).

C2. Функция h(-) непрерывна, и если А и B симметричные, положительно полуопределенные матрицы, то h(A)^ h(B) »trA ^ trB .

C3. Функция h( •) непрерывна и

trA ^ 0 ^ h(A + A) ^ h(A)

для некоторой строго положительно определенной матрицы Л.

Условие C2 более сильное, чем C3. Функция h(A) = trA удовлетворяет и C2, и C3, тогда как h(A) = det A удовлетворяет C3, но не C2.

Основной целью введения робастной нормы является ограничение влияния одиночных наблюдений на получающуюся оценку. Изменение оценки при удалении некоторого наблюдения для оценки по методу наименьших квадратов можно выразить следующим образом:

©N - ©N>t = R“1(N)9(t)[y(t) - ©V(t)J = R71(N) x

X9(t)

y(t) -©N9(t) ,

(8)

где © n — оценка по полной выборке, а © Nt -оценка по выборке без наблюдения (y(t), <p(t));

R(N) = ЕфООфT(k), k=1

Rt(N) = R(N) -9(t)9T(t). (9)

Таким образом, влияние наблюдения (y(t), <p(t)) можно оценить величиной

R71(N)9(t)8(t, ©n) . (10)

При обобщении на произвольные нормы и модельные структуры влияние измерения в момент t можно приблизительно оценить величиной

S(t)=© N)i'(B(t, © n)) , (и)

где Rt(N) =ЕФ(к,©n)l"(e(k,©— MT(k,©n) . (12)

к=1 к * t

Если рассматривать робастные нормы 1, то можно поставить вопрос о минимизации величины

max tS(t) I. ^гласно классификации Хубера [3,4],

существует три вида помехоустойчивых оценок: L-, M- и R- оценки. L - оценки строятся на основе линейных комбинаций порядковых статистик, R-оценки — на основе ранговых статистик. Для решения задач обработки данных в основном рассматриваются M-оценки. Соответствующая M-оценка определяется из условия поиска такой нормы 1, которая минимизирует наибольшую ве-

38

личину нормирующей дисперсии в некотором классе плотностей вероятностей:

lopt = minimaxk(l,f). (13)

В случае линейной регрессии минимизируется

N T

выражение Е l(y(t) -ф (t)©) , где l(-) - некоторая t=1

функция, часто задаваемая выпуклой. Для того чтобы выполнялось свойство инвариантности масштаба, необходимо минимизировать выражение

Е l{(y(t) -ф T(t)©)/s} , (14)

t=1

где s- некоторая мера рассеяния остаточных разно-

T

стей (y(t) -ф 1 (t)©) .

Мера s также должна быть получена помехоустойчивым методом. Функции Г(-) можно разбить на два класса: монотонные и немонотонные. Монотонная функция 1, предложенная Хубером, имеет следующий вид:

l'(x)

x, |x| < a;

a sign(x),|x| > a.

(15)

Примером немонотонной функции 1 служит функция, введенная Хампелем.

Для минимизации выражения (14) можно применить итерационный метод решения, такой как метод Гаусса-Ньютона. Пусть ©(k) - произвольная точка итерационной последовательности, а остаточная разность rt(k) = y(t) -9T(t)©(k). Приравнивание производной (14) нулю и линеаризация выражения в окрестности точки ©(k) дает

£ф(С (l'rt(k)/s) -r(rt(k)/s^T(t)(©(k+1) -©(k))/s = 0 . t=1 L J

(16)

Решение уравнения (16) относительно

(© (k+1) _©(k)) дает

©(k +1) -©(k) = M_1 £ l?(r^k) / s^(t). (17)

t=1

Для увеличения устойчивости матрицу М предлагается вычислять в следующем виде:

N

M = Х r(rt(k)/s)9(t)9T(t)/s + 5I, (18)

t=1

где 5 — некоторое малое положительное число.

Приближенная выборочная ковариация задается формулой

- 1 N 2 -і N T _i

cov(©) = ——- 2 l'2(rt/s)M !(EФ(t)Ф1(t))M 1 .

N - t=1 t=1

Мера рассеяния s остаточных разностей выбирается часто кратной интерквартильной широте или некоторой другой ранговой статистике от набора остаточных разностей. Наиболее часто при вычислении M-оценок за меру рассеяния принимают медиану абсолютных отклонений - MAD - оценку, которая определяется как

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

РИ, 2000, № 4

s = med|rt(©)|/0,6745 (19)

на каждом шаге итераций.

Литература: 1.Ljung L. On consistency and identiability / / Mathematical Programming Study, 1976. N 5, P. 169-190. 2. Caines P.E. Predictio error identification methods for stationary stochastic process // IEEE Trans. Automat. Contr., 1976. Vol. AC-21. P. 500-506. 3. Holland P.W., Welsch R. E. Robust regression using interactively reweghted

УДК 519.21

СТАБИЛИЗАЦИЯ И ФОКУСИРОВКА СЛУЧАЙНЫХ БЛУЖДАНИЙ НА ГРАФАХ

РОДЗИНСКИЙА.А., РОМАНЕНКО Б. А, СИДОРОВ М.В, МИРОШНИЧЕНКО А.В.

Рассматриваются процессы случайных блужданий на графах с изменяющимся числом состояний; графах, имеющих зоны Саргасса; многослойных графах. Проводится анализ сходимости вероятностей состояний и анализ изменения величины ст для различных типов задания схем случайных блужданий на графе.

При рассмотрении многих процессов в науке и технике в настоящее время часто используют подход, основанный на теории марковских процессов. В ряде случаев решение задачи удается получить, рассматривая соответствующим образом выбранные случайные блуждания.

1. Случайные блуждания на графах, представляющих собой дерево

Опишем процесс случайных блужданий на графе, представляющем собой дерево. Будем считать, что ребра графа имеют целочисленные длины, вообще говоря, различные. Будем использовать такую нумерацию, при которой координатой состояния является одно число. В этом случае естественно нумеровать состояния, начиная от вершины дерева, и делать это так, чтобы координаты состояний не убывали по мере их удаления от него. Случайные блуждания происходят по этим точкам и они рассматриваются как состояния определяемого нами процесса. Схему случайного блуждания выберем следующим образом. Пусть каждая из вершин ветви дерева является точкой сброса для любого из состояний этой ветви, а корень дерева—точкой сброса для любого состояния графа. Тогда из любого состояния графа возможен либо переход в следующее состояние, либо с ненулевой вероятностью переход (сброс) в одну из точек сброса, лежащую на пути от корня дерева к этому состоянию. К рассмотрению подобных схем блужданий часто приводят задачи теории надежности, радиобиологии, а также задачи теории нейронных сетей.

2. Случайные блуждания на графах с изменяющимся числом состояний

При рассмотрении ряда прикладных задач мы приходим к таким системам, эволюция которых может быть описана с помощью случайного блуж-

least squares //Commun. Statist., 1977. Vol.A6. P. 813-828. 4. Polyak B.T., Tsypkin Ya.Z. Robust identification// Automatica. 1980. Vol 16. P. 53-63.

Поступила в редколлегию30.11.2000

Рецензент:д-р техн.наук, проф. Шабанов-Кушнаренко С.Ю.

Грицюк Вера Ильинична, канд. техн. наук, докторант ХТУРЭ. Научные интересы: стохастические системы управления. Хобби: музыка, литература. Адрес: Украина, 61166, пр. Ленина, 14, тел. 40-93-06.

дания на графе с изменяющимся числом состояний. В [1, 2] рассмотрены дискретные и непрерывные марковские процессы с изменяющимся числом состояний.

При изучении процессов с изменяющимся числом состояний прежде всего возникает задача об их согласовании. Она состоит в следующем. Пусть на временных промежутках [s0, s1 - S], [sj +5, s2], 5 > 0 заданы инфинитезимальные матрицы A^t), Л2(t), определяющие процессы пДі), П2(t) с числом состояний nj и п2. Пусть, для определенности, п2 - п1 = 1. Тогда следует определить инфинитезимальную матрицу Л12(t) (матрицу согласования),

непрерывную на [s1 - 5, s1 + S] и удовлетворяющую условиям

Aj^Sj -5) = Aj(sj -8), ЛіДsj +S) = A2(sj +8), * (1) 2 так, чтобы возникающий при этом на [s0, s2 ] процесс n(t) являлся естественным продолжением процесса пі(0, 1 є k si -8], на отрезок [s1 +8, s2 ], на котором n(t) = П2 (t). На [s1 - 8, s1 + s] процесс n(t) определяется матрицей A12(t). В [1] рассмотрено несколько случаев построения матрицы согласования.

При рассмотрении экономических процессов эту матрицу можно искать, исходя из ограничений, позволяющих минимизировать некоторые суммарные затраты, максимизировать прибыль или обеспечить преимущественное развитие выделенных групп предприятий и пр.

При рассмотрении физических задач эволюция матрицы Л12 (t) обычно определяется процессом поглощения (или выделения) энергии. Мерой таких энергозатрат является некоторый функционал, зависящий от Л12. Если, например, этот функционал имеет вид (Л12 /, /), то отыскание Л12 сводится к решению следующей вариационной задачи. Требуется найти инфинитезимальную матрицу Л12 порядка (п1 +1 х (п1 +1, удовлетворяющую условиям (1) и условию

sj+5

j (Л12 №0 (s0 > 4 P(s0 > 4Vs = min .

sj-5

Рассмотрим задачу о фокусировке процессов с изменяющимся числом состояний. Пусть n(t), t > 0 — процесс с изменяющимся числом состояний, такой, что на каждом из непересекающихся отрезков

РИ, 2000, № 4

39

i Надоели баннеры? Вы всегда можете отключить рекламу.