УДК 519.6 ББК 22.19 Б 94
Бучацкая В.В.
Кандидат технических наук, доцент кафедры прикладной математики и информационных технологий факультета математики и компьютерных наук Адыгейского государственного университета, тел. (8772) 59-37-32, e-mail: [email protected]
Методика определения интервальных оценок при прогнозировании методами экстраполяции
(Рецензирована)
Аннотация
Определение доверительных интервалов прогноза является одной из основных задач, возникающих при экстраполяции. На основе сведений из литературных источников установлена связь между величиной доверительного интервала и длиной временного ряда, а также периодом упреждения прогноза. Проанализированы результаты расчета величины доверительного интервала для заданного временного ряда.
Ключевые слова: метод прогнозирования, экстраполяция, тренд, период упреждения, средняя квадратическая ошибка.
Buchatskaya V.V.
Candidate of Technical Sciences, Associate Professor of the Department of Applied Mathematics and Information Technology, Faculty of Mathematics and Computer Science, Adyghe State University, ph.
(8772) 59-37-32, e-mail: [email protected]
Technique to define the interval estimates when forecasting by extrapolation methods
Abstract
Definition of confidential intervals of a forecast is one of the main objectives arising at extrapolation. On the basis of data from literature sources a connection is established between the size of a confidential interval and the length of a temporary row, as well as the period of anticipation of a forecast. Results of calculation of the size of a confidential interval for the set temporary row are analyzed.
Keywords: forecasting method, extrapolation, trend, anticipation period, average quadratic error.
Базовые алгоритмы экстраполяция дают точечную прогностическую оценку. Однако, точное совпадение фактических данных и прогностических точечных оценок, полученных с их помощью, является маловероятным. Следовательно, такой оценки недостаточно и необходимо получение интервальной оценки. В этом случае прогноз, охватывая некоторый интервал значений прогнозируемой переменной, является более надежным. Определение доверительных интервалов прогноза является одной из основных задач, возникающих при экстраполяции. Это связано с тем, что расхождение между прогнозным и фактическим значениями имеет следующие источники [1]:
1) выбор формы кривой, характеризующий тренд, содержит элемент субъективизма, основан на опыте работы системного аналитика с методами прогнозирования, при этом с уверенностью нельзя утверждать, что выбранная форма кривой является единственно возможной или наилучшей для экстраполяции в данных конкретных условиях;
2) оценивание параметров кривых (тренда) производится на основе ограниченной совокупности наблюдений, каждое из которых содержит случайную компоненту; в силу этого параметрам кривой, а следовательно, и ее положению в пространстве свойственна некоторая неопределенность;
3) тренд характеризует некоторый средний уровень ряда на каждый момент времени; отдельные наблюдения, как правило, отклонялись от него в прошлом; логично ожидать, что подобного рода отклонения будут происходить и в будущем.
Погрешность, связанная со вторым и третьим источником, может быть отражена в виде доверительного интервала прогноза при принятии некоторых допущений о свойстве ряда. С помощью такого интервала точечный экстраполяционный прогноз преобразуется в интервальный.
В основу расчета доверительного интервала прогноза может быть положен измеритель колеблемости ряда наблюдаемых значений признака. Чем выше эта колеблемость, тем менее определено положение тренда в пространстве «уровень - время» и тем шире должен быть интервал для вариантов прогноза при одной и той же степени доверия. Следовательно, вопрос о доверительном интервале прогноза следует начать с рассмотрения измерителя колеблемости. Обычно такой измеритель определяют в виде среднего квадратического отклонения (стандартного отклонения) фактических наблюдений от расчетных, полученных при выравнивании динамического ряда.
В общем виде доверительный интервал для тренда определяется по формуле
где Яу - средняя квадратическая ошибка тренда; уг - расчетное значение уг; га - значение г - статистики Стьюдента.
Если г=г+Ь, то формула (1) определит значение доверительного интервала для тренда, продленного на Ь единиц времени.
Известно, что доверительный интервал определяется по формуле ([1, с. 164]):
Значение К зависит только от продолжительности наблюдения и периода упреждения. При увеличении продолжительности наблюдения (п) значения К уменьшаются, наоборот, с ростом величины Ь они растут.
В практике встречаются случаи, когда для экстраполяции можно применить несколько типов кривых [2]. В [1, с. 172, 174] получены выражения для доверительных интервалов прогноза полиномов 1, 2 и 3 степени, а также для уравнения экспоненты и логарифмической параболы (табл. 1).
Как видно из приведенных формул при одной и той же величине яу доверительный интервал прогноза тем шире, чем выше степень полинома, характеризующего тренд. Это объясняется тем, что дисперсия уравнения тренда определяется как взвешенная сумма дисперсий соответствующих параметров уравнений. Если тренд лучше описывается кривой более высокого порядка, то соответственно квадратическая ошибка Яу будет ниже и, следовательно, доверительный интервал уже, чем, например, при линейном тренде.
На рисунке 1 приведены диаграммы, характеризующие зависимость величины К от п при условии, что Ь= 1, Ь=5, Ь=7, Ь= 10. При увеличении продолжительности наблюдения (п) значения К и К уменьшаются, наоборот, с ростом величины Ь они растут.
Зависимость К от Ь для п=5, п= 10, п= 15 и п=20 показана на рисунке 2. Как видно из приведенных графиков, влияние периода упреждения неодинаково для различных
([1, с. 162]):
(1)
где К =гаК.
значений п: чем больше длительность наблюдения, тем меньшее влияние она оказывает на период упреждения. Характер влияния изменится в том случае, когда Ь определяется как относительная величина от п.
Отметим, что п влияет на величину доверительного интервала не только через К. Значение статистики *а при фиксированном значении вероятности определяется, как известно, числом степеней свободы. Последнее же зависит от п.
Таблица 1
Расчетные формы доверительных интервалов различных моделей
Тип модели Доверительный интервал
Линей- ная у * * £ ч: 1 1 12 1 + + ^ 2 п I*
Полином 2-го порядка ^К *= 1 | 1 *2 , I *4 “(2Ь *2 ) + п*Ь I‘2 Ь пЬ*4-(IГ)
Полином 3-го порядка ^К *= + 1 л + I'*-(21 г)Ч + п*Ь + (1-21*4)+(1,2)
I *1 Ь п1 *4-(1,212 IГI-(1, 4 I2
Экспо- нента ат 1о§(1о§ у+ь ±$УК*), где эуК* = 1 1 12 1 + + ^ 2 п I *
Лога- рифми- ческая парабола
аш^(1^ у*+ь ± яуК*), где яуК* = 1 + 1 * 2 +1 *4 -(2! *2) *Ь+п*Ь I >21 «I *4-(I г )2
—Ь—\_=7
Рис. 1. Зависимость К от числа наблюдений п Рис. 2. Зависимость К от продолжительности
периода упреждения Ь
Определим доверительный интервал для прогнозирования показателя, используемого при оценке эффективности деятельности органов местного самоуправления городских округов и муниципальных районов (Краснодарский край). Данные использованы из ежегодного статистического сборника 2010-2011 гг. [3].
Исследуем результаты прогнозирования значений ряда, состоящего из 12 значений (п=12). Построим следующие трендовые модели прогнозирования: линейную, полином 2-й степени, полином 3-й степени (табл. 2) [4].
Как видно из таблицы 3, для полинома 2-й степени доверительный интервал оказался почти неизменным. Минимальная величина доверительного интервала получена для линейного тренда. Для полиномов 1-й и 3-й степени с ростом периода упреждения отношение ширины доверительного интервала к расчетному уровню возрастает, хотя и незначительно. Это объясняется тем, что ряд возрастающий и по мере роста £ числитель и знаменатель увеличиваются равномерно. Кроме того, в исследуемом ряду отсутствуют аномальные выбросы. В том случае, когда в результате расчетов доверительный интервал оказывается достаточно широким, его можно сократить, уменьшив доверительную вероятность получаемых оценок.
Таблица 2
Модели прогнозирования
№ п/п Обозначение Описание модели Параметры модели
1. LR(1) Линейная Ut = a0 + a1t a0= 17,435; a;=0,7453
2. LR(2) Полином 2-й степени Ut = a0 + ait + a2t2 ao= 17,452; ai=0,738; a2=0,0006
3. LR(3) Полином 3-й степени Ut = ao + ait + a2t2 + a3t3 ao= 17,452; ai=0,738; a2=0,0006
По изложенным ранее формулам из таблицы 1 рассчитаем доверительные интервалы этих моделей (табл. 3).
Таблица 3
Результаты расчета доверительных интервалов (доверительная вероятность 90%)
L=1 <N II L cn II L L=4
№ п/п Мо- дель y t Довери- тельный интервал У t Довери- тельный интервал y t Довери- тельный интервал У, Довери- тельный интервал
1. LR(1) 26,485 У t ± 1,15 27,24 Уt ± 1,3 27,994 У t ± 1,46 28,748 У t ± 1,62
2. LR(2) 26,399 yt ± 3,33 27,174 Уt ± 3,32 27,901 Уt ± 3,32 28,657 Уt ± 3,32
3. LR(3) 25,948 Уt ± 4,02 25,895 Уt ± 4,13 25,468 Уt ± 4,41 24,617 Уt ± 4,03
Примечания:
1. Четыркин Е.М. Статистические методы прогнозирования. 2-е изд., перераб. и доп. М.: Статистика, 1977. 199 с.
2. Симанков В.С., Бучацкая В.В. Выбор методов прогнозирования при исследовании сложных систем // Вестник Адыгейского государственного университета. Сер. Естественно-математические и технические науки. 2012. Вып. 2 (101). С. 114-119. ИИЬ: Шр://уе81;тк. adygnet.ru
References:
1. Chetyrkin E.M. Statistical methods of forecasting. 2nd ed., revised and enlarged. M.: Statistics, 1977. 199 pp.
2. Simankov V.S., Buchatskaya V.V. Choice of methods of forecasting in researches of complicated systems // The Bulletin of the Adyghe State University. Series Natural-Mathematical and Technical Sciences. 2012. Iss. 2 (101). P. 114-119. URL: http://vestnik.adygnet.ru
3. Территориальный орган федеральной
службы государственной статистики по Краснодарскому краю. ИКЬ:
http://www.krsdstat.ru/munstat/default.aspx
4. Бучацкая В.В. Сравнительный анализ некоторых моделей прогнозирования временных рядов // Актуальные проблемы прикладной математики, информатики и механики: материалы междунар. конф. Воронеж, 2012. С. 8-10.
3. Territorial body of the Federal Service of State statistics of Krasnodar region. URL: http://www.krsdstat.ru/munstat/default.aspx
4. Buchatskaya V.V. Comparative analysis of some models of forecasting of time series // Actual problems of applied mathematics, informatics and mechanics: materials of international conference. Voronezh, 2012. P. 8-10.