Научная статья на тему 'Проблема автокорреляции остатков регрессии на примере моделирования грузооборота железнодорожного транспорта по данным временных рядов'

Проблема автокорреляции остатков регрессии на примере моделирования грузооборота железнодорожного транспорта по данным временных рядов Текст научной статьи по специальности «Математика»

CC BY
675
55
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВРЕМЕННЫЕ РЯДЫ / РЕГРЕССИОННЫЙ АНАЛИЗ / АВТОКОРРЕЛЯЦИЯ ОШИБОК РЕГРЕССИИ / ГРУЗООБОРОТ ЖЕЛЕЗНОДОРОЖНОГО ТРАНСПОРТА / ВАЛОВОЙ ВНУТРЕННИЙ ПРОДУКТ / TIME SERIES / REGRESSION ANALYSIS / AUTOCORRELATION IN REGRESSION RESIDUALS / RAIL FREIGHT / GROSS DOMESTIC PRODUCT

Аннотация научной статьи по математике, автор научной работы — Базилевский Михаил Павлович, Гефан Григорий Давыдович

Основной целью статьи является демонстрация проблемы автокорреляции ошибок регрессии, которая почти всегда возникает при работе с данными временных рядов, но обычно игнорируется. Анализ проводится на примере моделирования зависимости грузооборота железнодорожного транспорта РФ от валового внутреннего продукта (ВВП) в долларовом выражении. Рассматривается подавление влияния автокорреляции методом Кокрана Оркатта и другие подходы к решению проблемы: введение фиктивной переменной, переход к нелинейной зависимости. Метод Кокрана Оркатта обосновывается теоретически и экспериментально. Переход к этому методу имеет смысл тогда, когда выполняется условие авторегрессионного процесса для ошибок регрессии. В этом случае оценки коэффициентов регрессии, получаемые обычным методом наименьших квадратов, являются неэффективными. Использование данных по ВВП не в долларовом, а в рублёвом выражении (в постоянных ценах) приводит к модели высокого качества, в которой автокорреляция ошибок регрессии практически отсутствует.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Базилевский Михаил Павлович, Гефан Григорий Давыдович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE PROBLEM OF AUTOCORRELATION IN REGRESSION RESIDUALS BY EXAMPLE OF MODELING RAIL FREIGHT BASED ON TIME SERIES DATA

The main purpose of this article is to demonstrate the problem of autocorrelation in regression residuals, which almost always occurs with time series data, but, is usually ignored. The analysis by example of modeling dependence of rail freight in Russian Federation on gross domestic product (GDP) in dollar is performed. We consider the effect of suppression of autocorrelation by Cochran Orcutt method and other approaches to this problem: introduction of a dummy variable, transition to a non-linear dependence. Cochran Orcutt method is proved theoretically and experimentally. The transition to this method is useful when condition of autoregressive process for the regression errors is performed. In this case, the estimated regression coefficients obtained by ordinary method of least squares are ineffective. Using the data on GDP not in US dollar, but in ruble terms (at constant prices) leads to a model of high quality in which the autocorrelation in regression errors is practically absent.

Текст научной работы на тему «Проблема автокорреляции остатков регрессии на примере моделирования грузооборота железнодорожного транспорта по данным временных рядов»

Транспорт

воляет реализовать на основе предлагаемого метода не только диагностические, но и прогностические алгоритмы, что особенно актуально при прогнозном планировании объёмов ТО и Р локомотивов.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Адлер. Ю.П. Статистическое оценивание / пер. с нем. В.Н. Варыгина. М. : Статистика, 1976. 598 с.

2. Повышение эффективности работы тепловозов средствами бортовых систем диагностики : дис. канд. тех. наук / М.Ш. Валиев. Санкт-Петербург, 2011. 161 с.

3. Вентцель Е.С. Теория вероятностей. М. : Наука, 1969. 576 с.

4. Автоматизированная система управления надёжностью локомотивов (АСУНТ). Концеп-

ция ТМХ-Сервис / К. В. Липа и др. М. : ТМХ-Сервис, 2012. 160 с.

5. Липа К.В. Мониторинг технического состояния локомотивов по данным бортовых микропроцессорных систем управления / К. В. Липа и др. М. : ТМХ-Сервис, 2013. 156 с. Лакин И.К. А.А. Аболмасов, А.В. Скребков Модуль статистики ЕСМТ. Алгоритмы функционирования. Технические требования. М. : ТМХ-Сервис, 2014. 41 с.

Мельников В.А., Аболмасов А.А. Автоматизированное рабочее место диагностирования тепловоза по данным бортовой микропроцессорной системы управления // Перспективы развития сервисного обслуживания локомотивов : материалы I междунар. науч.-практ. конф. 2014. 222 с.

6.

7.

УДК 519.862.6 Базилевский Михаил Павлович,

к. т. н., доцент,

Иркутский государственный университет путей сообщения

Гефан Григорий Давидович, к. ф.-м. н., доцент,

Иркутский государственный университет путей сообщения,

тел. 8(3952) 638-354

ПРОБЛЕМА АВТОКОРРЕЛЯЦИИ ОСТАТКОВ РЕГРЕССИИ НА ПРИМЕРЕ МОДЕЛИРОВАНИЯ ГРУЗООБОРОТА ЖЕЛЕЗНОДОРОЖНОГО ТРАНСПОРТА ПО ДАННЫМ ВРЕМЕННЫХ РЯДОВ

M. P. Bazilevskii, G. D. Gefan

THE PROBLEM OF AUTOCORRELATION IN REGRESSION RESIDUALS BY EXAMPLE OF MODELING RAIL FREIGHT BASED ON TIME SERIES DATA

Аннотация. Основной целью статьи является демонстрация проблемы автокорреляции ошибок регрессии, которая почти всегда возникает при работе с данными временных рядов, но обычно игнорируется. Анализ проводится на примере моделирования зависимости грузооборота железнодорожного транспорта РФ от валового внутреннего продукта (ВВП) в долларовом выражении. Рассматривается подавление влияния автокорреляции методом Кокрана - Оркатта и другие подходы к решению проблемы: введение фиктивной переменной, переход к нелинейной зависимости. Метод Кокрана -Оркатта обосновывается теоретически и экспериментально. Переход к этому методу имеет смысл тогда, когда выполняется условие авторегрессионного процесса для ошибок регрессии. В этом случае оценки коэффициентов регрессии, получаемые обычным методом наименьших квадратов, являются неэффективными. Использование данных по ВВП не в долларовом, а в рублёвом выражении (в постоянных ценах) приводит к модели высокого качества, в которой автокорреляция ошибок регрессии практически отсутствует.

Ключевые слова: временные ряды, регрессионный анализ, автокорреляция ошибок регрессии, грузооборот железнодорожного транспорта, валовой внутренний продукт.

Abstract. The main purpose of this article is to demonstrate the problem of autocorrelation in regression residuals, which almost always occurs with time series data, but, is usually ignored. The analysis by example of modeling dependence of rail freight in Russian Federation on gross domestic product (GDP) in dollar is performed. We consider the effect of suppression of autocorrelation by Cochran - Orcutt method and other approaches to this problem: introduction of a dummy variable, transition to a non-linear dependence. Cochran - Orcutt method is proved theoretically and experimentally. The transition to this method is useful when condition of autoregressive process for the regression errors is performed. In this case, the estimated regression coefficients obtained by ordinary method of least squares are ineffective. Using the data on GDP not in US dollar, but in ruble terms (at constant prices) leads to a model of high quality in which the autocorrelation in regression errors is practically absent.

Keywords: time series, regression analysis, autocorrelation in regression residuals, rail freight, gross domestic product.

Введение

Автокорреляция ошибок регрессии - это корреляция между случайными ошибками регрессии в разных наблюдениях, т. е. нарушение одной из предпосылок метода наименьших квадратов (МНК):

М(г1г]) = 0 при г ф ],

где 8 — ошибки регрессии, а М — символ математического ожидания. На практике автокорреляция ошибок проявляется через поведение остатков регрессии е = у - ух , г = 1, п (уг и ух — это

наблюдавшиеся и рассчитанные значения объясняемой переменной); поэтому её несколько неточно называют автокорреляцией остатков.

Наличие автокорреляции остатков регрессии приводит к тому, что оценки параметров регрессии, полученные обычным МНК, становятся неэффективными (их дисперсии не являются наименьшими в классе всех линейных несмещённых оценок). Их можно интерпретировать и использовать, но по ним нельзя строить доверительные интервалы или проверять гипотезы.

В настоящей статье проблема автокорреляции ошибок регрессии анализируется на примере построения модели грузооборота железнодорожного транспорта по данным временных рядов. Подчеркнём, что в отличие от работы [1] здесь не ставилась задача создания многофакторной регрессионной модели с как можно более высоким коэффициентом детерминации. Основной целью являлась демонстрация важной проблемы автокорреляции, которая почти всегда возникает при работе с данными временных рядов, но обычно игнорируется. Рассматривается подавление влияния автокорреляции методом Кокрана - Оркатта и другие подходы к решению проблемы. 1. Моделирование зависимости грузооборота железнодорожного транспорта России от валового внутреннего продукта обычным МНК В табл. 1 демонстрируется динамика двух показателей: валового внутреннего продукта (в ценах 1990 года) и грузооборота железнодорожного транспорта России в 1990-2013 годах [2, 3].

Вполне очевидно, что колебания грузооборота железнодорожного транспорта были весьма схожи с колебаниями ВВП (падение до 1998 года и рост в последующий период). Это даёт основания предположить наличие высокой положительной корреляции между данными величинами. Действительно, как показывают расчёты, коэффициент корреляции составляет Я = 0,91.

Т а б л и ц а 1 Динамика ВВП и грузооборота железнодорожного транспорта России

Год ВВП России Грузооборот же-

(млрд. долл., в ценах 1990 г.) лезнодорожного транспорта России (млрд т км)

1990 570,4 2523,0

1991 541,9 2325,9

1992 463,3 1967,1

1993 423,0 1607,7

1994 369,3 1195,5

1995 354,1 1213,7

1996 341,3 1131,3

1997 346,1 1100,3

1998 327,6 1019,5

1999 348,4 1204,5

2000 383,4 1373,0

2001 402,9 1433,6

2002 422,0 1508,8

2003 452,8 1669,0

2004 485,3 1802,0

2005 516,2 1858,0

2006 558,3 1951,0

2007 606,0 2090,0

2008 637,8 2116,2

2009 587,9 1865,3

2010 614,4 2011,3

2011 640,6 2127,8

2012 662,6 2222,4

2013 671,3 2196,2

Соответствующее уравнение парной линейной регрессии имеет вид

ух = 47,28 + 3,443 х , (1)

(187,01) (167,83) (0,334)

что может интерпретироваться следующим образом: с ростом ВВП х на 1 млрд долларов грузооборот у повышается в среднем на 3,443 млрд. т км. Под уравнением регрессии записаны мелким шрифтом: стандартная ошибка оценки у

(слева) и стандартные отклонения соответствующих коэффициентов регрессии (справа). Следует заметить, что свободный член уравнения (1) является незначимым. Коэффициент

детерминации модели Я2 = 0,828. Средняя ошибка аппроксимации

Транспорт

Е = -

У1 - Ух

У

х 100 %

(2)

составляет 7,17 %.

2. Исследование модели на наличие

автокорреляции ошибок регрессии

Для графического обнаружения автокорреляции сначала оценивается модель по МНК (это сделано в предыдущем пункте), а затем строится график в осях ^-1 и , где индекс , обозначает текущее, а (, -1) - предыдущее наблюдение. Если зависимости между остатками нет, то облако получающихся точек должно быть похоже на круг. Если автокорреляция положительная, то облако вытянуто из первой четверти в третью, а если отрицательная, то из второй четверти в четвертую. В нашем случае налицо положительная автокорреляция (рис. 1). Однако необходимо отметить, что создаётся она в большой степени результатами самых первых наблюдений (1990-1993). Соответствующие точки на графике подписаны.

ошибки предыдущего, ^ - 1)-го наблюдения, причём при р > 0 автокорреляция положительна, а при р < 0 — отрицательна.

Конечно, ошибки регрессии £( нам неизвестны, и непосредственно проверить их корреляцию невозможно. Однако по данным наблюдений можно оценить регрессию, рассчитать её остатки

= У, - а*х - Ъ*

и дать оценку автокорреляции.

Оценкой коэффициента авторегрессии служит выражение [4]

Р =

п , П

Xе-1е,' X(

-300

Рис. 1. Облако ошибок регрессии

Для численной оценки автокорреляции необходимо сделать некоторые предположения о её характере. Пусть ошибки регрессии отдельных наблюдений подчинены соотношению

8,=ре,_1+'л,, , = 2,3,..., п (3) (ц — независимые нормально распределённые случайные величины с нулевым математическим ожиданием и одной и той же дисперсией). В этом случае говорят, что имеет место авторегрессионный процесс 1-го порядка. Величина р (|р| < 1)

называется коэффициентом авторегрессии. При отсутствии автокорреляции ошибки регрессии отдельных наблюдений не коррелированы, р = 0 . Если р Ф 0, то ошибка ^го наблюдения зависит от

,= 2 ,= 2

Известно также, что оценка коэффициента автокорреляции совпадает с оценкой коэффициента

* *

авторегрессии, т. е. тШо = р [5].

Для рассматриваемой нами модели гаию = р = 0,726. Для проверки значимости коэффициента автокорреляции используется статистика Дарбина - Уотсона d = 2(1 - га*11о), которая

меньше 2 при положительной автокорреляции, больше 2 при отрицательной автокорреляции и равна 2 в отсутствие автокорреляции. В рассматриваемом примере для уравнения с одной объясняющей переменной при числе наблюдений п = 24 и уровне значимости гипотезы 0,05 d - статистика должна принимать значение менее 1,27, чтобы можно было принять гипотезу о наличии положительной автокорреляции [5]. В нашем случае d = 0,548, и данная гипотеза, безусловно, должна быть принята.

Вывод о наличии автокорреляции ошибок регрессии, как уже сказано выше, ставит под сомнение качество оценивания коэффициентов регрессии обычным МНК.

3. Подавление автокорреляции путём изменения спецификации модели Безусловно, лучше всего бороться с автокорреляцией, устраняя её причины. Это означает, что нужно вводить дополнительные переменные в регрессионную модель. Учитывая, что автокорреляция ошибок в основном создаётся первыми наблюдениями временного ряда, введём фиктивную переменную

Г1, для 1990,1991 и 1992 г.

7 Чп (4)

[ 0, для других лет.

Тогда вместо уравнения (1) можно получить:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

УХ2 = 69,74+ 3,274х + 482,9 г (5)

(88,98) (79,90) (0,160) (55,33)

1

п

п

1=1

2

, -1

Качество модели существенно возросло: увеличились /-статистики коэффициентов (хотя свободный член остался незначимым); коэффициент детерминации достиг значения

2 -»—г

Я = 0,962. При этом новым оценкам можно вполне доверять: оценка коэффициента авторегрессии составила р = 0,369, статистика

Дарбина - Уотсона ё = 1,262, т. е. автокорреляция ошибок минимальна или вообще отсутствует. Причина этого ясна: значительная часть автокорреляции ошибок аккумулировалась в дополнительном слагаемом модели (5), содержащем фиктивную переменную г. Средняя ошибка аппроксимации (2) для данной модели составляет 4,47 %.

Однако, говоря откровенно, модель (5) интересна лишь с точки зрения анализа причин автокорреляции, а её прогностическое значение невелико: ввести фиктивную переменную для описания некоторого «аномального периода» развития процесса можно лишь постфактум. Тем не менее данный опыт иллюстрирует те пути, которые могут приводить к снижению автокорреляции остатков и повышению качества модели регрессии.

Другим способом является переход к нелинейной модели. Задание аппроксимирующей функции в виде полинома 2-го порядка даёт следующую оценку уравнения регрессии:

" (6)

ух

(147,47)

= - 2702,76+15,170 х - 0,012 х

(737,22) (3,104) (0,003)

Все коэффициенты регрессии значимы, Я2 = 0,899, Е = 5,17 % .

4. Метод Кокрана - Оркатта

Принципиально иной подход состоит в применении формальных процедур, призванных уменьшить погрешность, вносимую автокорреляцией. Рассмотрим одну из идей такого рода [5].

Предположим, что истинная модель регрессии имеет вид

у, = ах( + Ь + 8,, (7)

причём ошибки 8 подчинены авторегрессионному процессу 1-го порядка (3). Допустим также, что величина коэффициента авторегрессии р нам точно известна. Требуется перейти к такой регрессионной модели, которая позволяла бы оценить параметры регрессии без влияния автокорреляции.

Возьмём уравнения, соответствующие двум соседним наблюдениям:

у-1 = ах- + Ь + 8-^

у, = ах, + Ь + Р8М +л,.

Т а б л и ц а 2 Оценивание коэффициентов уравнения регрессии при наличии автокорреляции ошибок (результаты эксперимента по мето-_ду Монте-Карло)

а Ь

Истинные значения 0,5 1

Средние значения МНК-оценок 0,504 0,975

Средние квадратические отклонения МНК-оценок 0,013 0,092

Средние значения скорректированных оценок 0,502 0,982

Средние квадратические отклонения скорректированных оценок 0,004 0,078

Умножим первое уравнение на р и вычтем из второго:

у, - ру,-1 = а(х - Рх,-1) + Ь(1 - Р) + Л,.

Обозначим

= у, -ру,-^

Щ = х - рх*_1, (8)

с = Ь (1 -р). Регрессионная модель принимает вид

V = ащ + с + ^, , = 2, 3,..., п, свободный от проблемы автокорреляции, поскольку величины ^, , = 2, 3,..., п, по нашему

предположению не коррелированы. Найдя выборочное уравнение регрессии, мы можем получить новые оценки параметров а и Ь = с /(1 -р) .

Обосновать действенность подобных модифицированных методов, призванных заменить классический МНК из-за нарушения условий Гаусса - Маркова, можно либо чисто теоретически (что сделано выше), либо эмпирически, но не с помощью реальных данных, а с помощью модельных экспериментов по методу Монте-Карло [5]. С этой целью мы смоделировали поведение некоторой величины временным рядом

у = ах + Ь + 8 (а = 0,5, Ь = 1), задавая в качестве х значения случайной величины, равномерно распределённой между 0 и 10, и считая, что ошибка регрессии 8 подчинена авторегрессионному процессу 1-го порядка (3). Коэффициент авторегрессии р полагался равным 0,8, а

% задавались как независимые случайные величины с нулевым математическим ожиданием и дисперсией, равной 1/12. В каждой реализации

Транспорт

был получен временной ряд для t = 1, 200 , и по нему вычислены обычные МНК-оценки коэффициентов а и Ь , а также оценки, скорректированные с помощью перехода к новым переменным (8) по заданному значению р . Затем по 20 реализациям получены средние значения оценок коэффициентов и соответствующие средние квадратические отклонения (двумя названными методами). Результаты показаны в табл. 2.

Таким образом, оба метода дают неплохую точность оценивания (следует подчеркнуть, что это относится к усреднённым результатам, тогда как в отдельных реализациях оценки могут существенно различаться). При этом скорректированные оценки (особенно коэффициента а) имеют существенно меньшую дисперсию, что свидетельствует о неэффективности оценок параметров регрессии обычным МНК при наличии автокорреляции ошибок.

Вернёмся к исходной модели грузооборота с одной объясняющей переменной, для которой было получено выборочное уравнение регрессии (1)

и оценка коэффициента регрессии р = 0,726. Применив описанный метод к нашей модели и перейдя к новым переменным и и V (8) в предположении, что истинное значение коэффициента авторегрессии р совпадает с полученной оценкой, мы действительно получили модель со слабой автокорреляцией (для новых переменных *

гаию = 0,264). Пересчёт коэффициентов регрессии у по х приводит к уравнению

у =-152,02 + 3,643х .

(9)

Более точно значение р может быть получено так называемым методом Кокрана - Оркатта: в ходе итераций на каждом шаге после уточнения оценки р оцениваются остатки «новой» регрессии, находится новая оценка р и т. д. [5]. Такая процедура реализована в пакете Gretl. Обращение к ней дало следующий результат:

у =-451,12 + 4,071х . (10)

При этом значение коэффициента авторегрессии оказалось равным р = 0,843.

Рис. 2. Моделирование зависимости грузооборота железнодорожного транспорта от ВВП РФ

по данным 1990-2013 гг.

5. Анализ результатов

Т а б л и ц а 3 ВВП РФ в рублёвом выражении

в 1998-20] 14 гг.

Год ВВП в текущих ценах, млрд руб. ВВП в ценах 2008 г., млрд руб.

1998 2629,6 21190,2

1999 4823,2 22536,0

2000 7305,6 24799,9

2001 8943,6 26062,5

2002 10830,5 27312,3

2003 13208,2 29304,9

2004 17027,2 31407,8

2005 21609,8 33410,5

2006 26917,2 36134,6

2007 33247,5 39218,7

2008 41276,8 41276,8

2009 38807,2 38048,6

2010 46308,5 39762,2

2011 55967,2 41457,8

2012 62218,4 42882,1

2013 66755,3 43447,6

2014 71406,4 43722,7

На рис. 2 представлено сравнение результатов различных подходов к созданию регрессионной модели по данным рядов динамики при наличии автокорреляции ошибок регрессии. Автокорреляция в данном случае создаётся, главным образом, результатами первых по времени наблюдений (1990-1992). Наиболее высокое качество аппроксимации обеспечивает модель (5) с фиктивной переменной, отвечающей за «аномальный период» 1990-1992 гг., не вписывающийся в линейную модель регрессии с одной объясняющей переменной. Однако, как сказано выше, модель (5) «объясняет» старые наблюдения, но не позволяет прогнозировать результаты новых.

Если оставаться в рамках линейной модели с одной объясняющей переменной, то главным вопросом будет вопрос о том, какому из двух методов отдать предпочтение:

— обычному методу МНК, который даёт оценку (1);

— методу Кокрана - Оркатта, который учитывает наличие автокорреляции остатков и даёт оценку (10).

Рис. 2 показывает, что результаты применения этих двух методов довольно сильно различаются. Первый метод лучше согласуется с данными периода 1994-2006 гг., второй - с данными последующих лет. Поэтому, хотя обычный МНК даёт в силу своего устройства наилучшее качество регрессии, его прогностические качества могут оказаться хуже, чем у конкурирующего с ним метода Кокрана - Оркатта. Последний метод, как теоретически и эмпирически показано в пункте 4, обеспечивает меньшую дисперсию оценок коэффициентов регрессии.

Разумеется, переход к методу Кокрана - Ор-катта имеет смысл лишь тогда, когда верным является базовое предположение об авторегрессионном процессе 1-го порядка (3).

Прогностические качества полученных моделей можно проверить на данных 2014 года. ВВП составил 675,3 млрд долларов в ценах 1990 года, грузооборот железнодорожного транспорта по сравнению с 2013 годом вырос до 2298 млрд т км. При этом предсказание по модели (10) оказывается более точным: 2282 млрд т км (ошибка прогноза всего лишь 0,7 % против 2,3 % для модели (1)).

Иначе обстоит дело, если брать ВВП не в долларовом, а в рублевом выражении.

В табл. 3 приведены данные с сайта Федеральной службы государственной статистики [6]. Уравнение регрессии, полученное по данным 1998-2013 гг. обычным МНК, имеет вид y = 30.61+ 0.050х,

(187.01) (104.02) (0.003)

что интерпретируется как рост грузооборота y на

0.05.млрд т км при росте ВВП х на 1 млрд рублей (в ценах 2008 года). Модель имеет очень высокий

2

коэффициент детерминации R = 0,951 , средняя ошибка аппроксимации составляет 4,00 %. На 2014 год эта модель предсказывает значение грузооборота 2212,71 млрд т км (ошибка прогноза -

3,71 %). При этом практически отсутствует авто*

корреляция ошибок регрессии (р = 0.042). БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Носков С.И., Оленцевич В.А. Регрессионная многофакторная модель динамики грузооборота // Информационные технологии и проблемы математического моделирования сложных систем. Иркутск : Изд-во ИрГУПС, 2015. Вып. 13. С. 66-69.

2. Институт экономики и права Ивана Кушнира : сайт. URL: http://www.be5.biz/ makroekonomika/

Транспорт

gdp/gdp_russia.html#main (дата обращения 4. 19.12.2015).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3. Хусаинов Ф.И. Реформа железнодорожной 5. отрасли: проблемы незавершённой либерализации [Электронный ресурс] : аналити- 6. ческий доклад 2014 // Высшая школа экономика : сайт. URL: https://www.hse.ru/data/ 2014/12/12/1104741805/husainov_doklad_hse .pdf. (дата обращения 17.01.16).

Гефан Г.Д. Эконометрика. Иркутск : ИрГУПС, 2005.84 с.

Доугерти К. Введение в эконометрику. М. : ИНФРА-М, 2009. 465 с.

Федеральная служба государственной статистики [Электронный ресурс] : сайт URL: http://www.gks.ru/ (дата обращения 17.01.16).

УДК 519.6:311 Каргапольцев Сергей Константинович,

д. т. н., профессор, проректор по науке, Иркутский государственный университет путей сообщения,

e-mail: kck@irgups.ru Даваадорж Батбаатар,

аспирант,

Иркутский государственный университет путей сообщения,

e-mail: dbbaatar@yahoo.com

СТАТИСТИЧЕСКИЙ АНАЛИЗ БОКОВОГО ИЗНОСА РЕЛЬСОВ ПО РЕЗУЛЬТАТАМ МОНИТОРИНГА ПУТИ

S. K. Kargapoltcev, D. Batbaatar

STATISTICAL ANALYSIS OF LATERAL WEAR OF RAIL BASED ON THE PATH MONITORING RESULTS

Аннотация. Осуществлен статистический анализ значений мониторинга пути, включающих максимальный и средний боковой износ рельсов на участках кривых Улан-Баторской железной дороги. Анализ проведен по значениям, полученным на семи участках пути с кривизной 300-310 метров в 2015 году совмещенным вагоном «Вектор» фирмы «Твема». Проведен регрессионно-корреляционный анализ между парами значений, содержащих максимальный и средний боковой износ рельсов, показана их высокая коррелированность. С учетом важности предпосылки регрессионного анализа, используемого при создании прогнозных моделей по остаточному ресурсу рельсов, проверена гипотеза о том, что выборочные значения получены из генеральной совокупности с функцией нормального распределения. В качестве критериев согласия обоснованы статистики Колмогорова и Шапиро - Уилка. Гипотеза о нормальном распределении подтвердилась по обоим критериям при уровне значимости 0,05.

Ключевые слова: боковой износ рельсов, статистический анализ, железнодорожный транспорт, мониторинг пути.

Abstract. The article carried out a statistical analysis of the values of the path monitoring, including the maximum and the average lateral wear of rail on the portion of the railway curves in Ulan-bator. Analysis is rarried out on the values, which were obtained in the seven sections with curvature of 300-310 meters in 2015 by combined carriage "Vector" of company "Tvema". The regression-correlation analysis between pairs of values, containing the maximum and the average lateral wear of rail, was conducted. It shows that they are highly correlated. Given the importance ofpreconditions for regression analysis used to create predictive models of a residual resource of rails, the hypothesis is tested that the sample values are obtained from the general population with a normal distribution function. As criteria for approval Kolmogorov and Shapiro-Wilk statistics were substantiated. The hypothesis of normal distribution was confirmed by both criteria at a significance level of 0.05.

Keywords: lateral wear of rail, statistical analysis, rail transport, path monitoring.

Введение

Эффективность перевозочного процесса на железнодорожном транспорте тесно связана с повышением эксплуатационной надежности основных элементов верхнего строения пути и подвижного состава. Это связано с тем, что железнодорожный транспорт является важнейшей инфраструктурной системой, определяющей развитие экономики страны. Для обеспечения безопасности движения и повышения рентабельности перевозок необходимо максимально исключить внезапные отказы в виде опасных изломов рельсов и колес,

повысить износоустойчивость контактирующих поверхностей.

Одним из способов повышения срока службы рельсов, направленных на внедрение обслуживания и ремонта пути по техническому состоянию, является мониторинг состояния пути. Целью мониторинга верхнего строения пути является сбор, накопление, обработка диагностической информации и оценка на ее основе технического состояния компонентов пути, включая рельсы.

Для сбора диагностической информации рельсового хозяйства используются различные технические средства, например совмещенный

i Надоели баннеры? Вы всегда можете отключить рекламу.