Научная статья на тему 'Использование трендово-факторной модели для повышения точно-сти прогноза'

Использование трендово-факторной модели для повышения точно-сти прогноза Текст научной статьи по специальности «Математика»

CC BY
138
61
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
ВРЕМЕННЫЕ РЯДЫ / TIME SERIES / ТРЕНД / TREND / МНОЖЕСТВЕННАЯ РЕГРЕССИЯ / MULTIPLE REGRESSION / БЛОЧНЫЕ МАТРИЦЫ / BLOCK MATRIX / ДИСПЕРСИЯ ОСТАТКОВ / THE VARIANCE OF RESIDUALS

Аннотация научной статьи по математике, автор научной работы — Орлова Ирина Владленовна, Турундаевский Виктор Борисович

В статье предложен метод повышения точности трендово-факторной модели в предположении, что приращение эндогенной переменной зависит не только от времени, но и от отклонений от своих трендов экзогенных переменных, доказаны соответствующие формулы, отражающие структуру дисперсии остатков трендово-факторной модели.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Орлова Ирина Владленовна, Турундаевский Виктор Борисович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

USE OF THE TREND-FACTOR MODEL TO IMPROVE THE ACCURACY FORECASTS

In this paper we propose a method to improve the accuracy of the trend-factor model on the assumption that the increase in endogenous variable-screens depend not only on time but also deviations from their trend of exogenous variables, proved by the corresponding formulas that reflect the structure of the dispersion, these remnants of the trend-factor model.

Текст научной работы на тему «Использование трендово-факторной модели для повышения точно-сти прогноза»

ИСПОЛЬЗОВАНИЕ ТРЕНДОВО-ФАКТОРНОЙ МОДЕЛИ ДЛЯ ПОВЫШЕНИЯ ТОЧНО-СТИ ПРОГНОЗА

УДК 330.43

Ирина Владленовна Орлова,

к.э.н., профессор, профессор каф. Системного анализа и моделирования экономических процессов Финансового университета при Правительстве РФ Тел.: (499) 277-21-44 Эл. почта: IVOrlova@fa.ru

Виктор Борисович Турундаевский,

к.э.н., доцент, профессор каф. Прикладной математики Московского государственного университета экономики, статистики и информатики (МЭСИ) Тел.: (495) 442-60-98 Эл. почта: vik_turund@mail.ru

В статье предложен метод повышения точности трендово-факторной модели в предположении, что приращение эндогенной переменной зависит не только от времени, но и от отклонений от своих трендов экзогенных переменных, доказаны соответствующие формулы, отражающие структуру дисперсии остатков трендово-факторной модели.

Ключевые слова: временные ряды, тренд, множественная регрессия, блочные матрицы, дисперсия остатков

Irina V. Orlova,

PhD, Professor, Dept. System analysis and modeling of economic processes of the Financial University under the Government of the Russian Federation Tel.: (499) 277-21-44 E-mail: IVOrlova@fa.ru

Viktor B. Turundaevsky,

PhD, Associate Professor, Dept. Applied Mathematics, Moscow State University of Economics, Statistics and Informatics (MESI)

Tel.: (495) 442-60-98 E-mail: vik_turund@mail.ru

USE OF THE TREND-FACTOR MODEL TO IMPROVE THE ACCURACY FORECASTS

In this paper we propose a method to improve the accuracy of the trend-factor model on the assumption that the increase in endogenous variable-screens depend not only on time but also deviations from their trend of exogenous variables, proved by the corresponding formulas that reflect the structure of the dispersion, these remnants of the trend-factor model.

Keywords: time series, trend, multiple regression, block matrix, the variance of residuals

1. В работе получена оценка доверительного интервала при прогнозировании временных рядов по многофакторной регрессионной модели при высокой степени коррелированности определяющих переменных.

Прогнозирование временных рядов у(А) обычно проводится по одномерной модели, поскольку определяющие переменные как и результирующая переменная у(А) обычно растут с увеличением А, в результате чего коэффициенты корреляции между ними становятся высокими, а в этом случае, как известно, определить степень влияния каждого из показателей х() на у(А) с помощью МНК (метода наименьших квадратов) невозможно. Быстрый рост ошибки прогноза в одномерных регрессионных моделях существенно ограничивает возможности этого метода. Имея временные ряды зависимой переменной у(А) и экзогенных переменных х(), можно добиться значительного сокращения доверительного интервала прогноза, если рассматривать многофакторные регрессионные модели финансово-экономических показателейу(А), построенные по отклонениям экзогенных переменных х() от своих трендов.

2. Регрессионная трендово-факторная модель имеет вид

у(() = № + 7А() + ...+ упйхп({) + е(Г), (1)

где у() - фактические уровни временного ряда,

у(?) - расчетные значения уровней временного ряда, йх^А) = х() - х(() - отклонения х() от тренда,

- случайная величина, имеющая нормальное распределение с нулевым средним и не зависящая от А.

Будем считать, что йх^) не зависят от А. Соотношение (1) отражает гипотезу, что отклонения у(А) от тренда у(А) объясняются с точностью до е(() отклонениями х() от своих трендов Х(). _

Отклонения йх() можно определить с помощью МНК (] = 1, п).

Пусть тренд у(() = у_2{2 + + у0 является квадратичной параболой с неизвестными коэффициентами. Тогда уравнение (1) можно записать в виде

у(А) = у_А + у_х1 + у0 + у1йх1(А) + ...+ упйхп({) + е(Г). (2)

Коэффициенты уравнения (2) будем оценивать методом наименьших квадратов.

Для прогнозирования у(А) воспользуемся уравнением (2). Значения отклонений йх(А) для периода упреждения, как правило, неизвестны. В этом случае, считая йх() реализациями случайных величин с нулевым средним, получаем

М(у(т = у_2?ь + У-А + Уо, (3)

где ^ = ^ + Ь - время прогноза.

Как видим, прогнозируемое значение у(^) равно прогнозу по тренду, однако, ошибка прогноза за счет включения в модель переменных йх() будет меньше, чем при прогнозировании по одномерному временному ряду.

3. Ниже будет дана количественная оценка повышения точности прогноза.

При оценке погрешности прогноза по одномерному временному ряду доверительный интервал прогноза равен [1]

л ± а >

где Га - а - процентная точка распределения Стьюдента. Дисперсия ошибок прогноза Бр состоит из двух слагаемых:

К = Щ+й,

где 5]1 - дисперсия отклонений от тренда ] (г) = у (г)- у (г), 52 - дисперсия ошибки тренда у (г).

Величина 5- вычисляется по формуле [1] = 5] • г[ -(т' • Т)-1 •

где

Т =

( 1 г г2 > 1 1*1 1*1

\1 )

г'ь =(1 Ч г! )•

5 ^ = ^ • г, х ' • (т;'• тх)-1 • г,

где

Т =

1 г1 г2 йх1(г1)йх2(г1)...йхп(г1) 1 г2 г2 йх1(г2)йх 2(г2)...йхп(г2)

\1 гы г2ы йхх(гы)йх2(гы)...йхп(гм)

чх =(1 ч г! йх1 (^) ...¿хп (^)) Введем обозначения

/йх1(г1) йх2(г1) ...йхп(г1) ^ ! йх1(г2) йх2(г2) ...йхп(г2)

й;(г„) йх2(г^) ...йхп(гн)

й ь = (йх1(гь) йх2(гь) ...йхп(г,)) Ниже будет показано, что

5р = 52£1(р(гь) +1).

(13)

(4)

(5)

Так как 5] < 5]1, то дисперсия ошибки прогноза (12) будет меньше дисперсии ошибки прогноза (13). 4. Докажем соотношение (10). В соответствии с (5) и (8) запишем матрицу Тх в виде блочной матрицы Тх = (Т, В).

Тогда матрица (Т' • Тх) примет вид

( Т Т, Т В

т'-Тг =1

х х \ ВТ, ВВ

Если у(,) прогнозировать по уравнению (2), то ошибка прогноза вычисляется аналогично. Дисперсия ошибки прогноза равна 5р = 52-~ + 5] при этом 5] будет дисперсией отклонений у(,) от уравнения регрессии (2)

(е(Г) = у(0 - Я0 - У&М + ...+ упйхпШ величина вычисляется по формуле

Обратная матрица (т х' • Тх) равна [2]

(Т Т \

(т' т )-1 = 1'

т т

\± 21> 22 У

где

(6)

(7)

ти = (Т 'ту1 - (Т 'Т У'т В( В 'Т (Т 'ту'т 'В - Б В)- В' Т (Т Т)-

Т21 = (В' Т (Т 'Т У'т В) - В В)-1 В' Т (Т 'ту1

Т12 = (Т В( В 'В)-1 В' Т - Т 'Т) "ХТ В( В В)-1

Т22 = (В 'В)-1 - (В 'В)-1 В' Т (Т В( В 'В)-1 В' Т - Т 'ту'т В( В 'В)-1

Обозначим через Ух1Т матрицу ковариаций векторов йх = (йх1,...,йхп) и 7 = (1,г,г2), V , = — ВТ че-

х,г N

рез ух>, - матрицу коэффициентов регрессии й^ по Ухг = (ТТ)- ТВ через Я, - ковариационную матрицу

вектора г = (1,г,г2), Яг = — ТТ через Ях - ковариацион-

N

ную матрицу вектора йх, Ях = — ВВ через ух, - матрицу

N _1

у% г = (ВВ)'1 ВТ• Тогда матрица (тх' • Тх)

примет вид

(8)

(9)

(Т-Тх) = N

(К-1 -К,, (К,,гх, - Ях)-1К,1, (К,1г1,х - ^ У1/,,.л - Кх У Кг, К1 - Г,,х (К^х - К У г',х

« 5] • г• (Т • Т)-1 • гь + 5] • й ь • (В' • В)-1 • йь. (10)

Рассмотрим соотношение (10). Согласно предположению йх^) не зависят от ,(у = 1, п), следовательно, в формуле (10) от , зависит лишь первое слагаемое, т.е. можно представить в виде « 5] (у(гь) + а),

где а = 7ь (В 'В)-1 йь, (11)

ср(гь) = г ь (ТТ)-1 г, - монотонно возрастающая функция 4.

Дисперсия ошибки прогноза примет вид 32р = 5](<р(гь) + а) + 5] = 5] () + а + 1). (12)

Дисперсию ошибки прогноза по одномерному временному ряду, используя обозначения (11), можно записать в виде

Цустъ А = (^гГ^ - Ях)Так как матрица (тх' • Тх) симметрична, то х - Я, )-1 = А' .

Тогда матрицу (тх • Тх) можно записать в виде

• Т I 1 = 1 N

( Я-1 -ух г А А'

Я- - Гг ,хА'

Согласно предположению, й^) не зависят от ,, поэтому матрица коэффициентов ковариации Ух,, ~ 0 и матрицы коэффициентов регрессии ух,, ~ 0, у,х ~ 0 и, следовательно, А ~ 0. В результате

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(тх • Тх )

1 ^ ]_ ~ N

(Я-1 0 0 Я-

//-^'ТЧ-1

(Т'ТУ1 0 0 (ВВ)-1

(14)

Подставляя (14) в (6), получаем искомое соотношение (10):

5^ = 5](гь , йь)

- ' - . ((Т 'ту1

0

0 (ВВ)-

(гь , йь) =

= 5] гь (Т ТУ1 гь + 5] йь (В В)-1 йь.

5. Пример.

На основе статистических данных за 16 месяцев, приведенных в табл. 1, построить прогноз объема реализации продукции одного из продуктов фирмы на два месяца вперед.

Таблица 1

Время (мес.) 1 2 3 4 5 6 7 8

Объем реализации (тыс. руб.) 121 137 148 191 274 370 432 445

Индекс потребительских расходов (%) 100 98,4 101,2 103,5 104,1 107 107,4 108,5

Время (мес.) 9 10 11 12 13 14 15 16

Объем реализации (тыс. руб.) 432 367 321 307 254 228 176 134

Индекс потребительских расходов (%) 108 109 110,1 110,7 110,3 112 112,3 112,9

Рис. 1. Временной ряд «Объем реализации» содержит тренд - полином второго порядка

Используя надстройку MS Excel Анализ данных [4], мы получим не только трендовую модель y (t ) = -27,623 + 94,367? - 5,384, c высоким коэффициентом детерминации (0,855), но и стандартную ошибку S] равную 46,849 (Рис. 3).

ВЫВОД ИТОГОВ_

Регрессионная статистика Множественный R 0,925 R-квадрат Нормированный R-квадрат Стандартная ошибка Наблюдения

0,855 0,833

46,849

16

Дисперсионный анализ

Решение.

Проверим наличие тренда в исходных временных рядах с помощью Мастера диаграмм [3] в MS Excel (Рис. 1 и Рис. 2).

df SS MS F Значимость F

Регрессия 2 168323,881 84161,940 38,345 3,53008E-06

Остаток 13 28533,057 2194,851

Итого 15 196856,938

Коэффициенты Стандартная ошибка t-статис- P-Зна-тика чение

Y-пересечение -27,623 40,038 -0,690 0,502

t 94,367 10,840 8,705 0,000

tA2 -5,384 0,620 -8,686 0,000

Рис. 3. Фрагмент протокола регрессионного анализа построения трендовой модели У

Вычислим (Их, = х, х, г = 1,2,...и - отклонения от тренда для фактора «Индекс потребительских расходов» (Рис. 4).

Остатки -0,41 -2,92 -1,03 0,36 0,05 2,04 1,53 1,72

0,61 0,6 0,59 0,28 -1,03 -0,44 -0,85 -1,16

Рис. 4. Остатки - отклонения от линейного тренда для фактора «Индекс потребительских расходов»

Построим регрессионную трендово-факторную модель, добавив к исходным данным ряд остатков (рис. 5).

ВЫВОД ИТОГОВ_

Регрессионная статистика

Множественный R 0,944 R-квадрат 0,891 Нормированный R-квадрат 0,864 Стандартная ошибка 42,239 Наблюдения_16

Коэффициенты Стандартная ошибка

Y- пересечение 37,928 48,778

t 72,516 14,666

tA2 -4,099 0,852

Остатки 26,362 13,193

Рис. 2. Временной ряд «Индекс потребительских расходов» содержит тренд - полином первого порядка

Рис. 5. Фрагмент протокола регрессионного анализа построения трендово-факторной модели

Сравнивая стандартные ошибки двух моделей 46,849 (Рис. 3) и 42,239 (Рис. 5), мы видим, что стандартная ошибка трендово-факторной модели уменьшилась в этом примере на 9,8%.

Литература

1. Айвазян С. А., Мхитарян В. С. Прикладная статистика и основы эконометрики. М.: ЮНИТИ, 1998.

2. Гантмахер Ф. Р. Теория матриц - 5-е изд. - М.: Физматлит, 2004.

3. Орлова И.В., Турундаевский В.Б. Некоторые особенности, возникающие при изучении нелинейной регрессии с использованием Excel и других программ. / Экономика, статистика и информатика. Вестник УМО. 2014. № 1. С. 158-161

4. Орлова И.В., Половников В.А. Экономико-математические методы и модели: компьютерное мо-

делирование: учеб. пособие. - 3-е изд., перераб. и доп. - М.: Вузовский учебник: ИНФРА-М, 2011. -389 с.

References

1. Ayvazian S.A., Mkhitaryan V.S. Applied Statistics and Econometrics fundamentals. M.: UNITY, 1998.

2. Gantmakher F.R. Matrix theory - 5 th ed. - M .: Fiz-matlit, 2004.

3. Orlova I.V., Turundaevsky VB. Some features, fuss-tic in the study of non-linear regression using excel and other programs. / Ekonomika, statistika i informatika. Vest-neyk UMO. 2014. № 1. S. 158-161

4. Orlova I.V., Polovnikov V.A. Economic-mathematical methods and models: computer simulation: Proc. allowance. - 3rd ed., Rev. and add. - M.: INFRA-M, 2011. - 389 p.

i Надоели баннеры? Вы всегда можете отключить рекламу.