14
-Economy and Business-
СТАТИСТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ЗАВИСИМОСТИ КУРСА ДОЛЛАРА К
РУБЛЮ ОТ ЦЕНЫ НА НЕФТЬ
М.П. Базилевский, канд. техн. наук, доцент Г.Д. Гефан, канд. физ.-мат. наук, доцент
Иркутский государственный университет путей сообщения (Россия, г. Иркутск)
Аннотация. Статья посвящена анализу зависимости курса доллара США по отношению к рублю от цены на нефть марки Brent. Построена модель парной линейной регрессии, в которой обнаружено нарушение предпосылки об отсутствии автокорреляции ошибок регрессии. Рассмотрены два способа устранения этой проблемы: с помощью процедуры Кокрана-Оркатта и с помощью введения дополнительных лаговых переменных. В результате получена адекватная регрессионная модель с лаговыми переменными.
Ключевые слова: временной ряд, регрессионная модель, метод наименьших квадратов, автокорреляция ошибок регрессии, коэффициент авторегрессии, процедура Кокрана-Оркатта.
Введение. Тот факт, что текущая стоимость американской валюты по отношению к рублю зависит от цены на нефть, никем не подвергается сомнению. В экспорте России нефть и продукты ее переработки составляют львиную долю. Прибыль от этого бизнеса поступает в бюджет, соблюдение которого самым непосредственным образом влияет на состояние экономики, а значит, и курс национальной валюты.
В настоящей работе, сделана попытка построения регрессионной модели курса
доллара к рублю в зависимости от цены на нефть. Особое внимание уделено проблеме автокорреляции ошибок регрессии при использовании данных временных рядов.
1. Моделирование зависимости курса доллара по отношению к рублю от цены на нефть обычным методом наименьших квадратов (МНК).
На рис. 1 показана сравнительная динамика курса доллара (к рублю) и цены на нефть за 9,5 месяцев 2015 года [1, 2].
Рис. 1. Динамика курса доллара ЦБ РФ и цен на нефть марки Brent с 1 января 2015 г. по 16 октября 2015 г.
Journal of Economy and Business, vol.9
-Economy and Business-
15
Вполне очевидно, что за исключением непродолжительного промежутка времени с конца января по начало марта, колебания курса доллара были более или менее противоположны колебаниям цены на нефть. Это даёт основания предположить наличие высокой отрицательной корреляции между данными величинами. Действительно, как показывают расчёты, коэффициент корреляции составляет R = —0.8.
Соответствующее уравнение парной линейной регрессии имеет вид
yx = 100.17— 0.772 x, (1)
(3.55) (2.01) (0.035)
что может интерпретироваться следующим образом: с ростом цены 1 барреля нефти X на 1 доллар курс доллара к рублю у снижается на 77.2 копейки (в среднем). Под уравнением регрессии записаны мелким шрифтом: стандартная ошибка оценки у (слева) и стандартные отклонения соответствующих коэффициентов регрессии (справа). Коэффициент детерминации модели R = 0.64 . Средняя ошибка аппроксимации составляет 4.38%.
E =1Z
ni=1
yi — Ух
yi
х 100%
(2)
2. Исследование модели на наличие автокорреляции ошибок.
Одной из основных предпосылок МНК в регрессионном анализе является некоррелированность ошибок разных наблюдений:
M(sisj) = 0 при i ф j,
где S - ошибки регрессии, а M - символ математического ожидания. Если это свойство не выполняется, то принято говорить об автокорреляции ошибок. На практике этот эффект проявляется через поведение остатков регрессии
ei = У( — Ух, 1 =1 n (У, и Ух - это наблюдавшиеся и рассчитанные значения объясняемой переменной, n - объем выборки), поэтому его несколько неточно называют автокорреляцией остатков.
Последствия автокорреляции остатков регрессии:
а) оценки параметров регрессии, полученные обычным МНК, можно интерпретировать и использовать, хотя они и неэффективны (их дисперсии не являются наименьшими в классе всех линейных несмещённых оценок);
б) стандартные ошибки оценок параметров регрессии несостоятельны, поэтому с помощью них нельзя строить доверительные интервалы для неизвестных параметров или проверять гипотезы о значимости коэффициентов по t-критерию Стью-дента.
Автокорреляция ошибок регрессии чаще всего связана с использованием данных временных рядов. Поэтому при построении регрессионных моделей по временным рядам важно уметь исследовать полученную регрессию на наличие автокорреляции ошибок и грамотно бороться с этим явлением.
Для графического обнаружения автокорреляции сначала оценивается модель по МНК (это сделано в предыдущем пункте), а затем строится график в осях et—1 и et, где индекс t обозначает текущее, а (t — 1) - предыдущее наблюдение. Если зависимости между остатками нет, то облако получающихся точек должно быть похоже на круг. Если автокорреляция положительная, то облако вытянуто из первой четверти в третью, а если отрицательная, то облако вытянуто из второй четверти в четвертую. В нашем случае налицо положительная автокорреляция (рис. 2).
Journal of Economy and Business, vol.9
16
-Economy and Business-
10
-15 J
Рис. 2. Облако ошибок, свидетельствующее о наличии положительной автокорреляции
Для численной оценки автокорреляции необходимо сделать некоторые предположения о её характере. Пусть ошибки регрессии отдельных наблюдений подчинены соотношению
st =pst _ , t = 2,3,..., n (3)
(dt - независимые нормально распределённые случайные величины с нулевым математическим ожиданием и одной и той же дисперсией). В этом случае говорят, что имеет место авторегрессионный процесс 1-го порядка. Величина р (|р| < 1)
называется коэффициентом авторегрессии. При отсутствии автокорреляции ошибки регрессии отдельных наблюдений не коррелированны. Очевидно, что в этом случае р = 0 . Если рф 0, то ошибка t-го наблюдения зависит от ошибки предыдущего, (t - 1)-го наблюдения, причём при р > 0 автокорреляция положительна, а при р < 0 - отрицательна. Процесс имеет 1-ый порядок, поскольку «запаздывание» равно единице.
Конечно, ошибки регрессии St нам не известны, и непосредственно проверить их корреляцию невозможно. Однако по данным наблюдений можно оценить регрес-
сию, рассчитать её остатки и дать оценку автокорреляции.
et = yt _ a * xt _ b
*
Оценкой коэффициента авторегрессии служит выражение:
n n
р =1 et _iet /1 e2_i.
t=2 t=2
Известно также, что оценка коэффициента автокорреляции совпадает с оценкой
коэффициента авторегрессии, т.е. * * rauto = р [3,4]-
Для рассматриваемой нами модели
* * rauto = р
0.917. Для проверки значи-
мости коэффициента автокорреляции используется статистика Дарбина-Уотсона
d = 2(1 _ rauto), которая меньше 2 при
положительной автокорреляции, больше 2 при отрицательной автокорреляции и равна 2 в отсутствие автокорреляции. В рассматриваемом примере для уравнения с одной объясняющей переменной при n = 237 и уровне значимости гипотезы
0.05 d _ статистика должна принимать значение менее 1.65, чтобы можно было принять гипотезу о наличии положительной автокорреляции [3]. В нашем случае
Journal of Economy and Business, vol.9
-Economy and Business-
17
d = 0.17, и данная гипотеза, безусловно, должна быть принята.
Вывод о наличии автокорреляции ошибок регрессии, как уже сказано выше, ставит под сомнение качество оценивания коэффициентов регрессии обычным МНК.
3. Попытка устранения автокорреляции с помощью процедуры Кокрана-Оркатта.
Безусловно, лучше всего бороться с автокорреляцией, устраняя её причины. Это означает, что нужно вводить дополнительные переменные в регрессионную модель. Принципиально иной подход состоит в применении формальных процедур, призванных уменьшить погрешность, вносимую автокорреляцией. Рассмотрим одну из идей такого рода.
Предположим, что истинная модель регрессии имеет вид:
Уг = axt + b + st, (4)
причём ошибки st подчинены авторегрессионному процессу 1-го порядка (3). Допустим также, что величина коэффициента авторегрессии р нам точно известна. Требуется перейти к такой регрессионной модели, которая позволяла бы оценить параметры регрессии без влияния автокорреляции.
Возьмём уравнения, соответствующие двум соседним наблюдениям:
Уг _i = axt _! + b + St _i,
Уг = axt + b + ps t _1 + d •
Умножим первое уравнение на р и вычтем из второго:
Уг _ РУг_1 = a(X _ Pxt_1) + b(1 _Рр + d
Обозначим
vt = У1 _РУt_l, ut = X _PXt_ 1, c = b(1 _Р). (5) Регрессионная модель принимает вид
vt = aut + c + dt, t = 2,3, •••, n,
свободный от проблемы автокорреляции, поскольку величины
dt, t = 2,3, •••, n, по нашему предположению не коррелированны. Найдя выборочное уравнение регрессии, мы можем получить новые оценки параметров a и b = c /(1 _ p).
Применив описанный метод к нашей модели и перейдя к новым переменным u и V (5) в предположении, что p = 0^917, мы действительно получили модель со слабой автокорреляцией (для новых переменных rauto = 0206 ). Пересчёт коэффициентов регрессии у по X приводит к уравнению:
ух = 65^88 _ 0Л10х, (6)
кардинально отличающемуся от уравнения (1). Можно предположить, что такой результат вызван использованием оценочного значения р на основе регрессии, полученной по обычному МНК. Более точно значение р может быть получено так называемым методом Кокрана-Оркатта: в ходе итераций на каждом шаге после уточнения оценки р оцениваются остатки «новой» регрессии, находится новая оценка р и т.д. [3]. Однако обращение к эконометрическому пакету Gretl, в котором реализован данный метод, показывает, что первоначальная оценка р в ходе итераций приближается к единице, а регрессия У по X ещё более ослабевает, так что функция У x фактически заменяется средним значением у :
yx = 61.877 _ 0.015x. (7)
Такая модель утрачивает исследовательское и прогностическое значение.
Столь обескураживающий результат можно объяснить двумя причинами:
(1) неверным является исходное предположение об авторегрессионном процессе 1-го порядка (3);
(2) при р, близком к 1, переход к новым переменным (5) приводит к резкому росту оценки коэффициента b и вынужденному падению оценки коэффициента a для уравнения (7).
Располагая определённым опытом работы с различными наборами данных, мы склоняемся ко второй причине, имеющей чисто вычислительный характер.
Journal of Economy and Business, vol.9
18
-Economy and Business-
4. Устранение автокорреляции с помощью введения лаговых переменных
В результате исследования было замечено, что остатки модели (1) et очень тесно коррелируют (R = 0.854) с переменной zt = xt • yt. Таким образом,
et ~ xt • yt, следовательно,
et_i ~ xt_i • yt_i. Мы предполагаем, что в модели парной линейной регрессии ошибки St подчинены процессу авторегрессии 1-го порядка (3), тогда
yt = axt + b + pst _i + щ.
Заменим в этом выражении ошибки в момент времени (t _ 1) на произведение
xt _1 • yt _1:
yt = axt + b + cxt _iyt _i + Щ. (8)
Оценив неизвестные параметры уравнения (8), получим:
yt = 65.528_ 0.955xt + 0.0144xt_ • yt_,.(9) (1.696) (1.564) (0.019) (0.0005)
Для модели (9) коэффициент детерми-2
нации R = 0.918, коэффициент авторегрессии р = 0.0419, статистика Дарбина-
Уотсона DW = 1.914. Как видно, удалось существенно повысить качество регрессии и практически устранить автокорреляцию ошибок. График наблюдаемых и расчетных значений для модели (9) представлен на рис. 3.
сг от сг or от сг о сг о1' сг
Рис. 3. График наблюдаемых и расчетных значений курса доллара США
Однако присутствие в модели регрессора xt затрудняет практическое использование модели, поскольку информация о текущей цене на нефть появляется практически одновременно с информацией о текущем курсе доллара. Поэтому в уравнении (8) регрессор xt был заменен на xt_1 (предыдущее по времени значение цены на нефть). Оцененное уравнение для этого случая имеет вид:
Journal of Economy and Business, vol.9
yt = 60.635_ 1.016x_ + 0.0169xt_1 • yt_i. (10)
(1.123) (1.024) (0.013) (0.0004)
Для модели (10) коэффициент детерми-2
нации R = 0.964, коэффициент авторегрессии р = 0.279, статистика Дарбина-
Уотсона DW = 1.439. Таким образом, качество модели (10) оказалось еще выше, чем у модели (9). При этом несколько усилился эффект автокорреляции ошибок регрессии.
-Economy and Business-
19
Заключение
1. Оценена модель парной линейной регрессии зависимости курса доллара у от цен на нефть X, в которой графически и аналитически была выявлена автокорреляция ошибок.
2. Реализация процедуры Кокрана-Оркатта не привела к созданию адекватной модели. Поэтому было принято решение бороться с автокорреляцией с помощью введения лаговых переменных.
3. Использование в модели регрессора xt_i • yt_i (t — 1- предыдущий момент
времени) позволило существенно повысить качество регрессии и практически устранить автокорреляцию ошибок.
4. Для долгосрочного прогнозирования курса доллара можно использовать модель (1), которая опирается на прогноз цен на нефть. Для краткосрочного прогнозирования следует использовать модель (10), которая опирается на предыдущие по времени значения курса доллара и цены на нефть.
Библиографический список
1. Интернет-журнал Metrinfo.ru [Электронный ресурс]. Режим доступа: http://www.kurs.metrinfo.ru/kurs/.
2. Финансовый портал Ru.Investing [Электронный ресурс]. Режим доступа: http://ru.investing.com/commodities/brent-oil-historical-data.
3. Доугерти К. Введение в эконометрику. - М.: ИНФРА-М, 2009. - 465 c.
4. Гефан Г.Д. Эконометрика. - Иркутск: ИрГУПС, 2005. - 84 с.
STATISTICAL MODELING OF THE DEPENDING DOLLAR AGAINST THE RUBLE
ON OIL PRICES
MP Bazilevsky, candidate of technical sciences, associate professor GD Gefan, candidate of physical and mathematical sciences, associate professor Irkutsk state university of railway engineering (Russia, Irkutsk)
Abstract. This article analyzes the dependence of the US dollar against the ruble on the price of oil brand Brent. A simple linear regression model, in which an irregularity preconditions for autocorrelation regression errors, was created. Two methods resolve this issue: using the Cochrane-Orcutt procedure and by introducing additional lagged variables. As a result, adequate regression model with lagged variables was created.
Keywords: time series, regression model, least squares method, autocorrelation of errors regression, coefficient autoregression, procedure Cochran-Orcutt.
Journal of Economy and Business, vol.9