Научная статья на тему 'Анализ погрешности прогноза при выборе порядка модели'

Анализ погрешности прогноза при выборе порядка модели Текст научной статьи по специальности «Математика»

CC BY
95
20
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Грицюк Вера Ильинична

Исследуется оценка качества решения при восстановлении зависимости по наблюдениям, содержащим случайную ошибку. Предлагаются алгоритмы, дающие малый риск при прогнозе.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The analysis of forecast error at choosing of model order

The errors of forecast at use of difficult algorithms of restoration of dependence are mvestigated. The algorithms of choosmg of model wTh use of considered methods of quahty valuation of derisin are offerred.

Текст научной работы на тему «Анализ погрешности прогноза при выборе порядка модели»

где R(t/5e), е= 1, L — значение показателя надежности КТС АСУВ при условии, что была реализована стратегия технического обслуживания 5е; L—количество возможных стратегий технического обслуживания; D — множество возможных стратегий технического обслуживания КТС.

Реализация стратегии 5е технического обслуживания КТС ИУС сопряжена с некоторыми потерями, задаваемыми функционалом потерь W(5e). Необходимо выбрать такую стратегию, которая минимизирует математическое ожидание функционала потерь.

Таким образом, в рамках решения задачи управления эффективностью ИУС на этапе эксплуатации необходимо: обосновать и выбрать базовый показатель надежности КТС ИУС; разработать методику оценки надежности КТС системы с использованием полученного показателя; разработать методику выбора стратегии технического обслуживания КТС ИУС. При этом в качестве показателя надежности КТС ИУС необходимо использовать обобщенный коэффициент оперативной готовности [3].

УДК 519.6 '

АНАЛИЗ ПОГРЕШНОСТИ ПРОГНОЗА ПРИ ВЫБОРЕ ПОРЯДКА МОДЕЛИ

ГРИЦЮК в. и

Исследуется оценка качества решения при восстановлении зависимости по наблюдениям, содержащим случайную ошибку. Предлагаются алгоритмы, дающие малый риск при прогнозе.

С целью решить одну из основных задач обработки наблюдений прогноза новых наблюдений выбирается модель. Параметры, определяющие модель, выбираются так, чтобы получить хорошее приближение имеющихся наблюдений. Необходимость в проверке качества решения возникает при исследовании статистической модели в результате отсутствия информации, позволяющей сделать обоснованный выбор модели, найти оптимальный алгоритм вычисления ее параметров.

Прогноз Yw (w-целевая выборка) может не совпадать с действительным наблюдаемым значением Yw. Главная причина несовпадения: наличие шума— случайных искажений результатов наблюдений, неполнота описания условий наблюдения, неудачный выбор алгоритма прогноза.

Для вычисления погрешности линейных алгоритмов, допускающих либо линеаризацию, либо приближение с помощью конечных приращений, достаточно знать или восстановить шум — погрешность исходных наблюдений. В ряде случаев для этого восстанавливают исходную модель и генерируют множество псевдовыборок, похожих на множество действительных выборок. Применяя к каждой из них тот же алгоритм обработки данных, который использовался для получения решения на опорной выборке, можно найти интересующие характеристики ошибок. Наиболее приемлемо представляет псев-

Литература: 1. Г0СТ24.003-84. Автоматизированные системы управления. Термины и определения. М.: Издательство стандартов, 1985. 14 с. 2. Эффективность технических систем /Под ред. И.А. Ушакова. М.: Машиностроение, 1988. 328 с. 3. Самсонкин А.Н. Определение обобщенного коэффициента оперативной готовности сложных человеко-машинных систем//Інформаційно-керуючі системи на залізничному транспорті. 1996. № 5. С.59-61.

Поступила в редколлегию 12.06.99 Рецензент: д-р физ.-мат. наук, проф. Мазманишвили А.С.

Самсонкин Александр Николаевич, доцент кафедры вычислительной техники радиотехнических систем ХИЛ ВВС. Научные интересы: управление эксплуатацией ИУС. Адрес: Украина, 61007, Харьков, ул. Мира, 4, кв. 52, тел.30-82-18.

Чайников Сергей Иванович, канд. техн. наук, старший научный сотрудник, доцент кафедры системотехники ХТУРЭ. Научные интересы: системный анализ и проектирование ИУС. Адрес: Украина, 61110, Харьков, 2-й пер. Дружбы, 7, тел. 40-93-06.

довыборки восстановленная по данной выборке статистическая модель. Этот метод анализа качества интересующей нас статистики можно рассматривать как параметрическую версию “ bootstrap” [1].

Для решения поставленной задачи находят распределение погрешности R n (V, F) — отклонения статистики от оцениваемой величины и характеристики погрешности — первые моменты. Если вектор параметров а для выборки V объема n из совокупности с распределением F(a) неизвестен, то находим оценку а по опорной выборке V и исследуем распределение

случайной величины Rn (V, F(a)), используя распределение F(a) для генерирования псевдовыборки V. Для непрерывных F и состоятельной оценки a параметра а распределение Rn(V,F(a)) сходится к распределению Rn (V,F). Используя псевдовыборки V, можно оценить смещение оценки и построить более точную оценку.

Данные оценки применяются для оценки прогноза при использовании сложных алгоритмов восстановления (например, для выбора порядка модели).

Исследуем модель

Y = Xmgm + Xrgr + Є , (1)

где Є — npx1 вектор ошибок измерений отклика имеет нормальное распределение с нулевым математическим ожиданием и матрицей ковариаций ст 21 np ; матрица Xm составлена из столбцов, включаемых в модель, а Xr — из остальных r =N-m столбцов; gm

и gr — соответствующие этому разбиению регрессионные коэффициенты; n — число наблюдений. Если оценивать качество найденного решения величиной среднеквадратичных потерь при прогнозе новых значений отклика в точках обучающей выборки, то

J Ср (m) = n-1E||Xg + ц- Xmgm||2 , (2)

РИ, 1999, № 2

59

где q — новые значения остатков, независящие от е,

но с тем же распределением; gm — оценки коэффициентов для неполной модели, включающей только

m переменных. Так как параметры g и а2 неизвестны, эмпирический риск

J эмп (m) = n ^|Xg + e - Xmg„

= П“ЦТ-Xmg^i2.

2

(3)

Очевидно, оценки (3) в среднем меньше истинного риска (2). Для устранения смещения воспользуемся изложенным приёмом. Рассмотрим модель вида (1) с параметрами:

Л Л 2

(g, ст Ip) с числом наблюдений n,

2

где g — оценки параметров полной модели, а ст — средний остаточный квадрат для этой модели;

ст2 = RSS / n(p - N), здесь

RSS = YTY -Y g,TW-TU. i=l

gi = (W.TW) ■1WiTUi,

(4)

W. — матрица размера pxm; U. — pxl вектор.

Данная оценка основана на гипотезе адекватности алгоритма на опорной выборке.

Для линейного адекватного алгоритма эта оценка несмещенная. Для линейного неадекватного алгоритма оценка ст2 смещена и всегда завышена. Если поиск лучшего набора переменных основывается на выборочных данных, то традиционные оценки качества решения оказываются смещенными. Если опре-

делить J ср (m) и EJ эмп (m) и подставить полученные

2

выражения в аддитивную оценку или ст в дисперсионную оценку, получив мультипликативную оценку [2], ист2 вычислить по (4), то все оценки совпадут. Аддитивная оценка в случае, когда ст2 известно и либо алгоритм адекватен, либо прогноз производится

в точках обучающей выборки (Xv = X w), является несмещенной оценкой риска. Мультипликативная оценка — несмещенная для линейного адекватного алгоритма. Дисперсионная оценка оказывается точной при известном ст2 для адекватного линейного алгоритма.

Рассмотрим выбор порядка модели для случая, когда исследуется средняя интегральная ошибка прогноза

Lm = E||F(x) _ Fm(x)||2 .

, N 2

При неизвестных ст2 , Рm = X (g.)2 , где g -

i=m+1

оценка вектора параметров для полной модели, 22

используя є П для оценки Ее П , где є П — n-я

невязка измерений, и выражение (4), получаем

е[є T Є J = Lm +<T2p . (5)

И критерий принимает вид

m = argminLm

1<m<m '

Таким образом, применение при выборе порядка модели предложенных оценок качества решения позволяет строить алгоритмы, дающие малый риск при прогнозе.

Литература: 1.Efron B. Bootstrap methods: Another look at the jackknife. Ann. Statist.,1979. Vol. 6. Р. 1-26. 2. Линекер И.Ш., Трунов В. Г. Сравнение критериев эффективности обучения при восстановлении зависимости по эмпирическим данным. Модели. Алгоритмы. Принятие решений. М.: Наука, 1979. 126 с.

Поступила в редколлегию 10.06.99 Рецензент: д-р техн. наук Авраменко В.П.

Грицюк Вера Ильинична, канд. техн. наук, докторант ХТУРЭ. Научные интересы: стохастические системы управления. Хобби: музыка, литература. Адрес: Украина, 61726, Харьков, пр. Ленина, 14, тел. 40-93-06.

УДК 62.50

ФОРМИРОВАНИЕ АЛГОРИТМОВ ИДЕНТИФИКАЦИИ СТОХАСТИЧЕСКИХ ОБЪЕКТОВ С ВЫСОКОЙ СКОРОСТЬЮ СХОДИМОСТИ

ПЕРВУХИНА Е.Л.______________________

Идентификация стохастических объектов рассматривается как задача стохастической оптимизации. Исследуется подход к ее решению, основанный на методах и принципах информационной теории идентификации. Предлагается новый метод выбора матрицы весовых коэффициентов для формирования алгоритмов стохастической оптимизации с высокой скоростью сходимости.

Повышенный интерес исследователей к современным методам анализа, позволяющим сопоставить между собой различные варианты моделей систем и объектов и выделить наилучший из них, объясняет постановку задачи идентификации стохастических объектов для оценки и оптимизации функций многих переменных со случайными ошибками. При такой формулировке идентификация объекта сводится к подбору параметров его модели на основе наблюдаемых входных и выходных величин в целях достижения экстремума некоторого критерия, характеризующего качество идентификации.

В настоящее время существует большое количество работ, посвященных вопросам теории идентификации стохастических объектов, оценке значений функций и производных от них, а также прикладным проблемам, что делает невозможным полное освещение состояния вопроса и тем более составление достаточно представительного обзора литературных источников.

60

РИ, 1999, № 2

i Надоели баннеры? Вы всегда можете отключить рекламу.