Анализ погрешности прогноза при выборе порядка модели

Грицюк Вера Ильинична

где R(t/5e), е= 1, L — значение показателя надежности КТС АСУВ при условии, что была реализована стратегия технического обслуживания 5е; L—количество возможных стратегий технического обслуживания; D — множество возможных стратегий технического обслуживания КТС.

Реализация стратегии 5е технического обслуживания КТС ИУС сопряжена с некоторыми потерями, задаваемыми функционалом потерь W(5e). Необходимо выбрать такую стратегию, которая минимизирует математическое ожидание функционала потерь.

Таким образом, в рамках решения задачи управления эффективностью ИУС на этапе эксплуатации необходимо: обосновать и выбрать базовый показатель надежности КТС ИУС; разработать методику оценки надежности КТС системы с использованием полученного показателя; разработать методику выбора стратегии технического обслуживания КТС ИУС. При этом в качестве показателя надежности КТС ИУС необходимо использовать обобщенный коэффициент оперативной готовности [3].

УДК 519.6 '

АНАЛИЗ ПОГРЕШНОСТИ ПРОГНОЗА ПРИ ВЫБОРЕ ПОРЯДКА МОДЕЛИ

ГРИЦЮК в. и

Исследуется оценка качества решения при восстановлении зависимости по наблюдениям, содержащим случайную ошибку. Предлагаются алгоритмы, дающие малый риск при прогнозе.

С целью решить одну из основных задач обработки наблюдений прогноза новых наблюдений выбирается модель. Параметры, определяющие модель, выбираются так, чтобы получить хорошее приближение имеющихся наблюдений. Необходимость в проверке качества решения возникает при исследовании статистической модели в результате отсутствия информации, позволяющей сделать обоснованный выбор модели, найти оптимальный алгоритм вычисления ее параметров.

Прогноз Yw (w-целевая выборка) может не совпадать с действительным наблюдаемым значением Yw. Главная причина несовпадения: наличие шума— случайных искажений результатов наблюдений, неполнота описания условий наблюдения, неудачный выбор алгоритма прогноза.

Для вычисления погрешности линейных алгоритмов, допускающих либо линеаризацию, либо приближение с помощью конечных приращений, достаточно знать или восстановить шум — погрешность исходных наблюдений. В ряде случаев для этого восстанавливают исходную модель и генерируют множество псевдовыборок, похожих на множество действительных выборок. Применяя к каждой из них тот же алгоритм обработки данных, который использовался для получения решения на опорной выборке, можно найти интересующие характеристики ошибок. Наиболее приемлемо представляет псев-

Литература: 1. Г0СТ24.003-84. Автоматизированные системы управления. Термины и определения. М.: Издательство стандартов, 1985. 14 с. 2. Эффективность технических систем /Под ред. И.А. Ушакова. М.: Машиностроение, 1988. 328 с. 3. Самсонкин А.Н. Определение обобщенного коэффициента оперативной готовности сложных человеко-машинных систем//Інформаційно-керуючі системи на залізничному транспорті. 1996. № 5. С.59-61.

Поступила в редколлегию 12.06.99 Рецензент: д-р физ.-мат. наук, проф. Мазманишвили А.С.

Самсонкин Александр Николаевич, доцент кафедры вычислительной техники радиотехнических систем ХИЛ ВВС. Научные интересы: управление эксплуатацией ИУС. Адрес: Украина, 61007, Харьков, ул. Мира, 4, кв. 52, тел.30-82-18.

Чайников Сергей Иванович, канд. техн. наук, старший научный сотрудник, доцент кафедры системотехники ХТУРЭ. Научные интересы: системный анализ и проектирование ИУС. Адрес: Украина, 61110, Харьков, 2-й пер. Дружбы, 7, тел. 40-93-06.

довыборки восстановленная по данной выборке статистическая модель. Этот метод анализа качества интересующей нас статистики можно рассматривать как параметрическую версию “ bootstrap” [1].

Для решения поставленной задачи находят распределение погрешности R n (V, F) — отклонения статистики от оцениваемой величины и характеристики погрешности — первые моменты. Если вектор параметров а для выборки V объема n из совокупности с распределением F(a) неизвестен, то находим оценку а по опорной выборке V и исследуем распределение

случайной величины Rn (V, F(a)), используя распределение F(a) для генерирования псевдовыборки V. Для непрерывных F и состоятельной оценки a параметра а распределение Rn(V,F(a)) сходится к распределению Rn (V,F). Используя псевдовыборки V, можно оценить смещение оценки и построить более точную оценку.

Данные оценки применяются для оценки прогноза при использовании сложных алгоритмов восстановления (например, для выбора порядка модели).

Исследуем модель

Y = Xmgm + Xrgr + Є , (1)

где Є — npx1 вектор ошибок измерений отклика имеет нормальное распределение с нулевым математическим ожиданием и матрицей ковариаций ст 21 np ; матрица Xm составлена из столбцов, включаемых в модель, а Xr — из остальных r =N-m столбцов; gm

и gr — соответствующие этому разбиению регрессионные коэффициенты; n — число наблюдений. Если оценивать качество найденного решения величиной среднеквадратичных потерь при прогнозе новых значений отклика в точках обучающей выборки, то

J Ср (m) = n-1E||Xg + ц- Xmgm||2 , (2)

РИ, 1999, № 2

59

где q — новые значения остатков, независящие от е,

но с тем же распределением; gm — оценки коэффициентов для неполной модели, включающей только

m переменных. Так как параметры g и а2 неизвестны, эмпирический риск

J эмп (m) = n ^|Xg + e - Xmg„

= П“ЦТ-Xmg^i2.

2

(3)

Очевидно, оценки (3) в среднем меньше истинного риска (2). Для устранения смещения воспользуемся изложенным приёмом. Рассмотрим модель вида (1) с параметрами:

Л Л 2

(g, ст Ip) с числом наблюдений n,

2

где g — оценки параметров полной модели, а ст — средний остаточный квадрат для этой модели;

ст2 = RSS / n(p - N), здесь

RSS = YTY -Y g,TW-TU. i=l

gi = (W.TW) ■1WiTUi,

(4)

W. — матрица размера pxm; U. — pxl вектор.

Данная оценка основана на гипотезе адекватности алгоритма на опорной выборке.

Для линейного адекватного алгоритма эта оценка несмещенная. Для линейного неадекватного алгоритма оценка ст2 смещена и всегда завышена. Если поиск лучшего набора переменных основывается на выборочных данных, то традиционные оценки качества решения оказываются смещенными. Если опре-

делить J ср (m) и EJ эмп (m) и подставить полученные

2

выражения в аддитивную оценку или ст в дисперсионную оценку, получив мультипликативную оценку [2], ист2 вычислить по (4), то все оценки совпадут. Аддитивная оценка в случае, когда ст2 известно и либо алгоритм адекватен, либо прогноз производится

в точках обучающей выборки (Xv = X w), является несмещенной оценкой риска. Мультипликативная оценка — несмещенная для линейного адекватного алгоритма. Дисперсионная оценка оказывается точной при известном ст2 для адекватного линейного алгоритма.

Рассмотрим выбор порядка модели для случая, когда исследуется средняя интегральная ошибка прогноза

Lm = E||F(x) _ Fm(x)||2 .

, N 2

При неизвестных ст2 , Рm = X (g.)2 , где g -

i=m+1

оценка вектора параметров для полной модели, 22

используя є П для оценки Ее П , где є П — n-я

невязка измерений, и выражение (4), получаем

е[є T Є J = Lm +<T2p . (5)

И критерий принимает вид

m = argminLm

1<m<m '

Таким образом, применение при выборе порядка модели предложенных оценок качества решения позволяет строить алгоритмы, дающие малый риск при прогнозе.

Литература: 1.Efron B. Bootstrap methods: Another look at the jackknife. Ann. Statist.,1979. Vol. 6. Р. 1-26. 2. Линекер И.Ш., Трунов В. Г. Сравнение критериев эффективности обучения при восстановлении зависимости по эмпирическим данным. Модели. Алгоритмы. Принятие решений. М.: Наука, 1979. 126 с.

Поступила в редколлегию 10.06.99 Рецензент: д-р техн. наук Авраменко В.П.

Грицюк Вера Ильинична, канд. техн. наук, докторант ХТУРЭ. Научные интересы: стохастические системы управления. Хобби: музыка, литература. Адрес: Украина, 61726, Харьков, пр. Ленина, 14, тел. 40-93-06.

УДК 62.50

ФОРМИРОВАНИЕ АЛГОРИТМОВ ИДЕНТИФИКАЦИИ СТОХАСТИЧЕСКИХ ОБЪЕКТОВ С ВЫСОКОЙ СКОРОСТЬЮ СХОДИМОСТИ

ПЕРВУХИНА Е.Л.______________________

Идентификация стохастических объектов рассматривается как задача стохастической оптимизации. Исследуется подход к ее решению, основанный на методах и принципах информационной теории идентификации. Предлагается новый метод выбора матрицы весовых коэффициентов для формирования алгоритмов стохастической оптимизации с высокой скоростью сходимости.

Повышенный интерес исследователей к современным методам анализа, позволяющим сопоставить между собой различные варианты моделей систем и объектов и выделить наилучший из них, объясняет постановку задачи идентификации стохастических объектов для оценки и оптимизации функций многих переменных со случайными ошибками. При такой формулировке идентификация объекта сводится к подбору параметров его модели на основе наблюдаемых входных и выходных величин в целях достижения экстремума некоторого критерия, характеризующего качество идентификации.

В настоящее время существует большое количество работ, посвященных вопросам теории идентификации стохастических объектов, оценке значений функций и производных от них, а также прикладным проблемам, что делает невозможным полное освещение состояния вопроса и тем более составление достаточно представительного обзора литературных источников.

60

РИ, 1999, № 2

Анализ погрешности прогноза при выборе порядка модели Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Грицюк Вера Ильинична

Похожие темы научных работ по математике , автор научной работы — Грицюк Вера Ильинична

The analysis of forecast error at choosing of model order

Текст научной работы на тему «Анализ погрешности прогноза при выборе порядка модели»