Научная статья на тему 'Применение методов математической статистики в исследовании критериев эффективности использования вагонного парка железных дорог'

Применение методов математической статистики в исследовании критериев эффективности использования вагонного парка железных дорог Текст научной статьи по специальности «Экономика и бизнес»

CC BY
199
31
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Вестник университета
ВАК
Область наук
Ключевые слова
ВАГОННЫЙ ПАРК / КЛАСТЕРНЫЙ АНАЛИЗ / РЕГРЕССИОННЫЙ АНАЛИЗ

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Королевская Валентина Ивановна, Крамаренко Инна Владимировна

В работе представлено исследование эксплуатации вагонного парка железных дорог России с помощью корреляционно-регрессионного анализа и сформирована наиболее устойчивая модель влияния эффективности работы вагонного парка на грузообо-рот.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Применение методов математической статистики в исследовании критериев эффективности использования вагонного парка железных дорог»

симальный размеры арендования, предъявляемые арендатору требования, которые позволят произвести объективный отбор и предоставить землю предприимчивым хозяйственникам. Одновременно в законе не оговариваются форма проведения конкурса и критерии, согласно которым будет определен победитель, который будет регламентировать арендные отношения, устанавливать механизмы сдачи земли в аренду.

На нынешнем этапе развития сельского хозяйства РА особое значение приобретает управление рисками, направленными на минимизацию потерь хозяйствующих субъектов и обеспечение получения ожидаемого дохода. По приблизительным оценкам вследствие стихийных бедствий (град, холод, ветры, засуха, оползни и др.) годовая потеря ожидаемой валовой продукции отрасли в среднем составляет 15-20 %. В рыночных условиях необходимо предоставление хозяйствующим субъектам возможностей управлять рисками рассматривать как функцию государственного регулирования.

Библиографический список

1. Аймен А.Т. Зарубежный опыт обеспечения конкурентоспособности крестьянских хозяйств [Электронный ресурс]. - Режим доступа: www.rusnauka.com/7nmw.../

2. Агаджанян О. Государство и экономика / О. Агаджанян. - Ереван: Экономист, 2004.

3. Губин Е.П. Государственное регулирование рыночной экономики и предпринимательства. - М.: Юристъ, 2005.

4. Ефимова Е. А. Мировой опыт социального регулирования в системе налогообложения аграрного сектора экономики // КубГАУ. 2011. - № 74(10).

5. Назаренко В.И. Аграрная политика Европейского союза. - М.: Маркет ДС Корпорэйшн, 2004.

6. Конотопов М.В. Экономическая история мира / М.В. Конотопов. - Т. 5. - М.: КноРУС, 2008.

7. Нещадин А. Опыт государственного регулирования и поддержки сельского хозяйства за рубежом / А. Нещадин. - Р/нД, 2008.

8. Серова Е.В. Аграрная экономика / Е.В. Серова. - М., 1999.

9. Программа «Государственное содействие сельскохозяйственным землепользователям»: Материалы министерства сельского хозяйства РА. - Ереван, 2011.

В. И. Королевская И.В. Крамаренко

ПРИМЕНЕНИЕ МЕТОДОВ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ В ИССЛЕДОВАНИИ КРИТЕРИЕВ ЭФФЕКТИВНОСТИ ИСПОЛЬЗОВАНИЯ ВАГОННОГО ПАРКА ЖЕЛЕЗНЫХ ДОРОГ

Аннотация: В работе представлено исследование эксплуатации вагонного парка железных дорог России с помощью корреляционно-регрессионного анализа и сформирована наиболее устойчивая модель влияния эффективности работы вагонного парка на грузооборот.

Ключевые слова: вагонный парк, кластерный анализ, регрессионный анализ.

В новых условиях работы железных дорог, когда перевозчик стал фактически владельцем лишь инфраструктуры, передав инвентарный парк в управление ДЗО и частным компаниям, остро встал вопрос об оценке использования вагонного парка, создании системы

© Королевская В.И., Крамаренко И.В., 2013

оценочных показателей его работы и об учете влияния различных факторов, формирующих результат работы. Необходимо было решить, какие оценочные показатели сохранили свое назначение, какие трансформировались и нужна ли принципиально новая система оценок. В целом, несмотря на значительные изменения в условиях работы, многие показатели эксплуатации не только сохранили свое назначение, но и оказались особенно востребованы.

Показатель «среднее время оборота вагона» является основным универсальным показателем использования подвижного состава. В новых условиях он стал также и основным показателем использования инфраструктуры. Это стало особенно важно, так как инфраструктура и подвижной состав стали принадлежать различным собственникам. Другие показатели, такие как «среднесуточная производительность грузового вагона», «процент порожнего пробега к общему», «средний простой вагона на одной технической станции», «среднее время простоя вагона под одной грузовой операцией» и другие, отражают лишь одну какую-либо сторону эксплуатационной работы, но не обладают признаками универсальности.

Среднесуточная производительность вагона имеет линейную зависимость с показателем грузооборота, т.е. заранее можно предположить мультиколлинеарность аргумента и функции. Кроме этого, именно этот показатель влияет на доходность вагонного парка. С точки зрения частных владельцев производительность вагона может считаться приоритетной оценкой. Однако это только на первый взгляд. Доходность вагона начнет неизбежно падать в случае увеличения среднего оборота вагона. Из приведенной формулы (1) следует, что производительность вагона тем больше, чем меньше оборот, поэтому владелец парка должен стремиться к сокращению оборота вагона. Показатель производительности вагона (Пв) может быть рассчитан через частные показатели следующим образом:

РдинРгр

Пв =-,

Ов

где Рдин. - динамическая нагрузка груженого вагона; Р1р - груженый рейс вагона, км; Ов -среднее время оборота вагона, сутки.

Другими важными показателями, влияющими как на оборот вагона, так и на его производительность являются показатели, отражающие время нахождения в порожнем пробеге, простои на одной технической станции и под одной грузовой операцией. Показатель порожнего пробега (в процентах к общему) также как и оборот вагона, отражает работу, как подвижного состава, так и инфраструктуры. Сейчас этот показатель находится под контролем в системе управления вагонным парком. Показатель время простоя вагона на одной технической станции отражает затраты времени на технический осмотр, техническое обслуживание и подготовку подвижного состава в рейс. Показатель среднего времени вагона на одну грузовую операцию связан в основном с погрузкой и выгрузкой со склада. Таким образом, первый показатель обусловлен технологическими процессами, на которые руководство станции может оказывать непосредственное воздействие. Во втором случае на время под грузовой операцией значительное влияние оказывает коммерческий фактор перевозки и другие, независимые от перевозчика структуры. Вследствие этого для эксплуатационной модели предпочтительнее выбрать показатель «среднее время простоя на одной технической станции».

При формировании системы факторов для использования регрессионного анализа необходимо иметь в виду, что сложной системе, которая описывается большим количеством параметров присуще свойство гетеростазиса, т.е. исследование предполагает выделение признаков более и менее существенных. Это можно сделать с помощью корреляционно-регрессионного анализа, который является наиболее обоснованным и разработанным при ис-

следовании работы хозяйственных субъектов и выработке комплексных методологических решений. Он позволяет нейтрализовать фактор неопределенности и дать объективную характеристику взаимозависимостям между факторами.

Линейная зависимость результативного признака У от факторных признаков-регрессоров — Х4 изучается по статистическим данным 17 железных дорог России за десять лет в период с 2002 по 2011 гг. Исходная выборка состоит из 169 наблюдений (в 2011 году нет данных по Сахалинской железной дороге). При этом У представляет грузооборот, млн. ткм; Х]_- среднее время оборота вагона, сут.; Х2- среднесуточная производительность вагона, ткм- нетто; Х3- процент порожнего пробега к общему, %; Х4 - простои вагонов на одной технической станции, часов. Описательные статистики по исследуемым переменным приведены в табл. 1.

Таблица 1

Описательная статистика исследуемых показателей

Показатель Хх х2 Хя х4 У

Среднее значение 4,153 9391 39,91 6,58 115329

Стандартное отклонение 2,15 4173 4,23 3,04 60760

Минимум 2,16 1671 24,5 2,48 600

Максимум 9,211 20088 50,6 19,2 286410

Большие значения стандартных отклонений, представленных в таблице, можно объяснить двумя факторами: высокой степенью неоднородности данных и наличием изменений основных тенденций развития в последние два года (2010 и 2011 гг.). Динамика исследуемых показателей в целом по сети за десять лет представлена на рис. 1.

Степень тесноты связи оценивается с помощью коэффициента парной корреляции Пирсона по формуле:

I (X-Х)(у -у) , (2)

Гvv

I (X - X г I (У - У г

где гХУ— значение коэффициента парной корреляции Пирсона. Р-уа1ыв — определяет значимость коэффициента корреляции.

Расчетные значения показателей парной корреляции по всей совокупности данных представлены в табл. 2.

Таблица 2

Парные коэффициенты корреляции

У Х1 х2 Хя Х4

ГХУ -0,4419 0,5806 0,2341 -0,4736

N (Число наблюдений) (169) (169) (169) (169)

Р-уа1ие 0,0674 0,0000 0,0033 0,0000

Значения Р-уа1ыв близкие к нулю свидетельствуют о значимости коэффициентов корреляции с вероятностью не менее 99 %. Р-\а1ыв — величина, применяемая при статистической проверке гипотез, представляет собой вероятность того, что значение проверочной статистики используемого критерия (в данном случае 1-статистики Стьюдента), вычисленное по выборке, превысит установленное ^-значение. Иначе говоря, ^-значение — это наименьшее значение уровня значимости (т.е. вероятности отказа от справедливой гипотезы), для которого

вычисленная проверочная статистика ведет к отказу от нулевой гипотезы. Теснота связи всех показателей представлена в корреляционной матрице (см. табл.3).

2500000 2000000 1500000 1000000 .500000

2127212

20L130B 1565305 ^----

fifi

2002 2009*

Динамика грузооборота

Динамика процента порожнего пробега

Динамика среднего времени оборота вагонов

Динамика среднесуточной производительности вагонов

Динамика простоя вагонов на одной технической станции

Рис. 1. Изменение показателей использования вагонного парка в целом по сети в 2002-2011 гг.

Таблица 3

Матрица коэффициентов парной корреляции

Y Xi X2 X3 X4

Y 1

Xi -0,4419 1

Х2 0,5806 -0,4404 1

X3 -0,0206 0,4324 -0,2818 1

X4 -0,5760 0,5448 -0,8350 0,4763 1

Данные таблицы свидетельствуют о наибольшем влиянии на величину грузооборота показателя производительности вагона (Х2), простоя на одной технической станции (Х4) и обратной связи влияния оборота вагона (Х1). Более детальный корреляционный анализ позволяет оценить не только степень тесноты парных зависимостей, но и направление и

форму этой зависимости по всей совокупности данных. Графики разброса наблюдений представлены на рис. 2-5.

Рис. 2. График разброса значений грузооборота (У) и среднего времени оборота вагона (Хх).

^ 1У =-0,4419

Рис. 4. График разброса значений грузооборота (У) и процента порожнего пробега (Х3).

гх зу =-0,0206

Рис. 3. График разброса значений грузооборота (У) и среднесуточной производительности вагона (Х2) Гх 2¥ =+0,5806

Рис. 5. График разброса значений грузооборота (У) и процента простоя на одной технической станции (Х4) гх 4У =-0,5760

Анализ графиков позволяет утверждать о достоверности прямых и обратных связей, представленных в корреляционной матрице. Однако форма связи не везде линейная. Так, зависимость между грузооборотом У и производительностью вагона Х2 предполагает, согласно рис. 3, линейную зависимость, но зависимости между У и средним временем оборота вагона Хх, а также между У и простоями на одной технической станции Х4 имеют не линейную, а гиперболическую зависимость. В отношении влияния порожнего пробега на грузооборот график разброса наблюдений не позволяет сделать однозначный вывод относительно направления взаимосвязи. В проведенной работе для целей построения регрессионных моделей, определения состава независимых переменных и исключения эффекта мультиколлине-арности переменных был также проведен анализ разброса наблюдений между парными зависимостями (в данной статье они не приводятся). Была выявлена возможная мультиколлине-арность между показателями грузооборота и производительностью вагона Х2, а также между производительностью и простоями на одной технической станции.

Дальнейшие шаги по формированию модели контроля за эффективностью использования вагонного парка предполагают группировку по результативному признаку. Наиболее эффективно для этих целей использовать кластерный анализ («кластер» - пучок, блок, пакет). Кластеризация предполагает группировку объектов на основе близости их свойств: каждый кластер состоит из схожих объектов, но объекты разных кластеров существенно отли-

чаются. Наибольшее распространение получил алгоритм кластерного анализа, использующий для группировки метод средних. Один из них, метод К-средних предусматривает предварительное определение числа кластеров. В каждом кластере, выделенные признаки имеют свои центры (центроиды). Разные алгоритмы метода К-средних отличаются и способом выбора начальных центров предполагаемых кластеров. Можно выделить следующие основные этапы метода: выбираются или назначаются к наблюдений, которые будут первичными центрами кластеров; после назначения всех наблюдений отдельным кластерам производится замена первичных кластерных центров на кластерные средние.

В данной задаче определение числа кластеров проводится по показателю грузооборота (У). Предварительно на основании грузооборота можно выделить четыре группы железных дорог с разным уровнем грузооборота: «низкий» уровень грузооборота (Калининградская, Сахалинская железные дороги); «промежуточный» уровень (Северо-Кавказская, Приволжская, Юго-Восточная, Красноярская); «<средний» уровень (Московская, Октябрьская, Северная, Куйбышевская, Восточно-Сибирская, Дальневосточная); «(высокий» уровень (Горь-ковская, Свердловская, Южно-Уральская, Западно-Сибирская, Забайкальская).

Проводя кластерный анализ необходимо решить, как можно сгруппировать имеющиеся железные дороги, если в качестве классификаторов будут выступать все имеющиеся переменные. Применяя метод К-средних, пользуются исходным предположением о четырех однородных группах. В качестве меры близости кластеров необходимо использовать квадрат евклидова расстояния, представленный формулой:

Я(х, у) = 2 - У,- )2

Результаты кластерного анализа сведены в табл. 4, а центроиды представлены на рис. 6.

Таблица 4

Результаты разбиения данных на кластеры

Номер кластера Названия дорог, входящих в кластер Центроиды

X! Х2 Хя Х4 У

1 Октябрьская Северо-Кавказская Дальневосточная 5,8 6621 41,7 8,5 116 042

2 Калининградская 4,9 2049 47 14 63 812

3 Московская Юго-Восточная Приволжская Красноярская Восточно-Сибирская Сахалинская 3 8732 35 6 70 433

4 Горьковская Северная Куйбышевская Свердловская Южно-Уральская Западно-Сибирская Забайкальская 3,6 12 661 40 4,5 159 536

«л ™-^- ЗООСО --

- Ч-__-—¡л-

■.-.«гг" з -,-«гг:: ,2 -.- ■гт:: ■ -.-лггг: —ф— С: г- - :: а: л -л 1.глгт::: 2 Ял лгтср .2 ■Ъ'лггср " Е|л. 1 -Ч ^Р^ Сс =г - г Г|Т : ч - жч - л: шс : |Т сг ■ -с гт» и — - л

А"

/ \

/ \ / \

: \

¿С \

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

\

\ /

—Ч"

'лг:: 1 I Егсг= - :: --с эс эс --.'( ли■ >_ 3 н.гли'+. 2 ч.г*ГГЕ: " 'глгтг:-¡^^"Тсссгел 1- л с д^ А тск-м 1=*: А сан -.яя

......

*

\ /

\ /

■ /л ■ ■ с ■ ■ гт

Рис. 6. Центроиды кластеров по изучаемым переменным

Таблица 5

Характеристики кластеров

Номер кластера (Число дорог, вошедших в кластер) Характеристика кластера

1(к=3) В данном кластере оказались дороги с большим средним временем оборота вагона и высоким значением грузооборота - кластер с промежуточными характеристиками

2(к=1) Кластер с наихудшими значениями исследуемых характеристик

3 (к= 6) В данном кластере оказались дороги со средними значениями характеристик по всем исследуемым показателям

4(к=7) Кластер с наилучшими значениями исследуемых характеристик

После выделения кластеров строится модель множественной регрессии сначала по всей совокупности, а затем и по кластерам. Оценка качества моделей осуществлялась по следующим показателям:

1. стандартная ошибка модели: 5= —-—— ; (3)

-у-)2

Ы-т- -1

■У)2

2. коэффициент детерминации: Я2 = —— ; (4)

О2 о2

3. расчетное значение критерия Фишера: Рр = —■-; (5)

г г г г т ы-т-1 4 '

где: т - число параметров модели, без учета константы; М- число наблюдений.

С| = -и(Я-у)2; (6)

Q2 = -¥=lÍУt-УtУ; (7)

4. критерий Дарбина-Уотсона

ОШ = ^Ц-*-:1* ; (8)

—С=1 "с

Характеристики качества регрессионных моделей по всей совокупности данных

Таблица 6

Регрессионная модель (спецификация модели) Характеристики качества модели

в стандартная ошибка И2 коэффициент детерминации А расч расчетное значение Р критерия DW (критерий Дарбина-Уотсона)

У = 18292,1х Х1 + 3,20538хХ2 + 2610,04хХ3 - 14402,4х Х4 40912 54,6 51,64 1,36202 (присутствует автокорреляция в остатках)

У = 13962,0х Х1 + 10,0329хХ2 -909,199хХ3 46105 87,69 394,41 1,6769 (присутствует автокорреляция в остатках)

У = 8529,25хХ1 + 8,71599хХ2 46588 87,36 577,2 1,7099 (отсутствует автокорреляция в остатках)

Как следует из таблицы 8, наилучшими информационными характеристиками обладает двухфакторная модель, где в качестве независимых переменных выступают: среднее время оборота вагона и среднесуточная производительность вагона. Однако данная модель имеет ряд нарушений спецификации:

1. Наличие мультиколлинеарности факторов Х1 и Х2;

2. Различие знаков (поскольку ранее была выявлена обратная связь между переменными У и Х1).

Необходимо выбрать наиболее значимый фактор из всех представленных. Таким фактором является среднее время оборота вагона. Затем формируются однофакторные регрессионные модели зависимости грузооборота от средней оборачиваемости вагона в целом по всей совокупности данных и по кластерам. Общий вид модели выбран в соответствии с выявленной зависимостью с помощью корреляционного анализа. Это модель гиперболы:

Результаты идентификации альтернативных моделей и их основные характеристики качества приведены в таблице 7.

Таблица 7

Сопоставление результатов оценки информационной пригодности моделей построенных по всей совокупности данных и по кластерам

Модель (спецификация модели) N - число наблюдений Информационные характеристики качества модели

s стандартная ошибка R2 коэффициент детерминации F А расч Расчетное значение F критерия

Г = 343381(Х^-) Вся выборка (N=169) 44 081,7 62,6 57,04

Г = 410387(Х1) Кластер 1 (N=53) 47611 81 224,14

Кластер 2 (N=13) Построение модели не имеет смысла

Г = 150647^) Кластер 3 (N=28) 27 970 77,89 137,3

Г = 463942(Х1-) Кластер 4 (N=75) 41365 91,98 377,55

На основании проведенного исследования, можно сделать следующее заключение:

1. Низкие значения критерия Фишера и коэффициента детерминации при построении модели по всей совокупности данных свидетельствует о невысоком качестве модели.

2. При построении моделей по отдельным кластерам видно значительное улучшение оценочных характеристик.

Таким образом, можно сделать выводы: во-первых, о целесообразности построения факторных регрессионных моделей по кластерам; во-вторых, о надежности показателя среднее время оборота вагона в статистических исследованиях.

Библиографический список

1. Меркушев В.В. Многомерные статистические методы: учеб.-метод. пособие / В.В. Меркушев. -Ч. 4. Кластерный анализ. - Великий Новгород: ИПЦ НовГУ им. Ярослава Мудрого, 2005.

2. [Электронный ресурс]. - Режим доступа: http://www.basegroup.ru/glossary

С. В. Милославская А.Б. Мыскина

ПЕРСПЕКТИВЫ РАЗВИТИЯ ТРАНСПОРТНОЙ СИСТЕМЫ

ЕВРОПЕЙСКОГО СОЮЗА

Аннотация: автомобильные перевозки занимают лидирующие позиции как в общем грузообороте, так и пассажирообороте всех видов транспорта Европейского союза (ЕС).

© Милославская С.В., Мыскина А.Б., 2013

i Надоели баннеры? Вы всегда можете отключить рекламу.