Научная статья на тему 'Статистические характеристики информационных потоков прибытия составов поездов на станцию Челябинск-Главный'

Статистические характеристики информационных потоков прибытия составов поездов на станцию Челябинск-Главный Текст научной статьи по специальности «Науки о Земле и смежные экологические науки»

CC BY
185
42
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СТАТИСТИЧЕСКИЙ АНАЛИЗ / ПЕРЕВОЗОЧНЫЙ ПРОЦЕСС / ВРЕМЯ ПРИБЫТИЯ / ЧЕЛОВЕЧЕСКИЙ ФАКТОР / ПРОГНОЗИРОВАТЬ / РАСПРЕДЕЛЕНИЕ ПУАССОНА / POISSON''S DISTRIBUTION / STATISTIC ANALYSIS / RAILWAY TRAFFIC / ARRIVAL TIME / HUMAN FACTOR / TO PREDICT

Аннотация научной статьи по наукам о Земле и смежным экологическим наукам, автор научной работы — Жабреев Вячеслав Сергеевич, Игнатов Вячеслав Евгеньевич

Представлены результаты статистического анализа разности между зарегистрированным и фактическим временами прибытия состава поезда на сортировочную станцию Челябинск-Главный, распределенные по закону Пуассона. Включение статистических методов в процесс принятия решений по поездообразованию позволит повысить достоверность прогноза в заданном интервале путем минимизации влияния человеческого фактора.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по наукам о Земле и смежным экологическим наукам , автор научной работы — Жабреев Вячеслав Сергеевич, Игнатов Вячеслав Евгеньевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Statistical characteristics of information flows of train arrivals to the Chelyabinsk Major railroad yard

The findings of the statistic analysis differences between the registered and existent arrival times of the train set on the major railway yard Chelyabinsk, classified according to Poisson's law, are presented in the article. The interconnection of the statistic methods in the process of taking decisions on the train formation will allow to enlarge the reliability of prediction in the specified interval by means of minimizing the human factor's influence.

Текст научной работы на тему «Статистические характеристики информационных потоков прибытия составов поездов на станцию Челябинск-Главный»

УДК 637.125

СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ИНФОРМАЦИОННЫХ ПОТОКОВ ПРИБЫТИЯ СОСТАВОВ ПОЕЗДОВ НА СТАНЦИЮ ЧЕЛЯБИНСК-ГЛАВНЫЙ

В.С. Жабреев, В.Е. Игнатов

STATISTICAL CHARACTERISTICS OF INFORMATION FLOWS OF TRAIN ARRIVALS TO THE CHELYABINSK MAJOR RAILROAD YARD

V.S. Zhabreev, V.E. Ignatov

Представлены результаты статистического анализа разности между зарегистрированным и фактическим временами прибытия состава поезда на сортировочную станцию Челябинск-Главный, распределенные по закону Пуассона. Включение статистических методов в процесс принятия решений по поездообразованию позволит повысить достоверность прогноза в заданном интервале путем минимизации влияния человеческого фактора.

Ключевые слова: статистический анализ, перевозочный процесс, время прибытия, человеческий фактор, прогнозировать, распределение Пуассона.

The findings of the statistic analysis differences between the registered and existent arrival times of the train set on the major railway yard Chelyabinsk, classified according to Poisson's law, are presented in the article. The interconnection of the statistic methods in the process of taking decisions on the train formation will allow to enlarge the reliability of prediction in the specified interval by means of minimizing the human factor's influence.

Keywords: statistic analysis, railway traffic, arrival time, human factor, to predict, Poisson's distribution.

Введение

Одной из актуальных задач, стоящих перед Южно-Уральской железной дорогой является сокращение непроизводительных потерь на сортировочных станциях. Южно-Уральская железная дорога - филиал ОАО «РЖД» сегодня обеспечивает перевозку грузов как внутри, так и вне Российской Федерации (Республика Казахстан). К перевозочному процессу возрастают требования по обеспечению качественной услугой клиентов компании [1]. Движение информационных сообщений между системами обладает в некоторых случаях большой инерционностью, и некорректный ввод информации сотрудниками в систему приводит к значительным искажениям результатов прогнозирования.

Жабреев Вячеслав Сергеевич - д-р техн. наук, профессор, заслуженный работник Высшей школы, зав. кафедрой «Вычислительная техника», ЧИПС-УрГУПС; 7ИаЪг@гашЪ1ег. ги

Игнатов Вячеслав Евгеньевич - аспирант УрГУПС кафедры «Вычислительная техника», ЧИПС; ignatov-ve@ mail.ru

Точное время прибытия поезда на станцию определяет дежурный по станции с соответствующим вводом (регистрации) информации в Гид «Урал-ВНИИЖТ». При этом существенную роль играет человеческий фактор в прогнозировании времени прибытия. Это влияет на качество прогноза работы станции, так как из-за отклонений информация становится недостоверной и теряет свою актуальность. Чем шире интервал прогнозирования, тем больше отклонения.

При использовании статистического анализа для составления прогноза оперативные работники станции получают данные, составляющие существенную компоненту системы поддержки принятия стратегических решений, что позволит прогнозировать работу сортировочной станции в заданном доверительном интервале [2].

Zhabreev Vyacheslav Sergeevich - doctor of engineering, professor, Honored Worker of university, The Head of Department of “Computer technology” CHIRT-USURT; zhabr@rambler.ru

Ignatov Vyacheslav Evgenjevich - Postgraduate student USURT of “Computer technology” CHIRT; ignatov-ve@ mail.ru

Статистический анализ

Для статистической обработки информационных потоков поступающих составов поездов выбраны данные о поступивших поездах на станцию Челябинск-Главный за 7 суток. Выборка произведена на станции Челябинск-Главный с помощью существующей автоматизированной системы АСУСТ. Данные о времени прибытия содержат два времени прибытия составов поездов на станцию: первое время - время, которое введено в Гид «Урал-ВНИИЖТ» дежурным по станции - зарегистрированное время, и второе время - фактическое время прибытия состава на станцию.

На рис. 1 представлена гистограмма соотношения частоты от интервалов разности во времени прибытия составов на станцию.

1. Математическое ожидание

У481ж

М(х) = 1 = 6,75 минут на состав. (1)

2. Дисперсия

Й81 М[\Х-М(х)\ 2] гг^ , 2

И(Х) = —---------------- = 55,77 (минут) на

состав. (2)

3. Среднеквадратическое отклонение составляет

5 = уЩх) = 7,47 минут на состав. (3)

Эти величины характеризуют отклонение времени в поступлении составов поездов, зарегистрированного дежурным по станции в Гид «Урал-ВНИИЖТ», и фактического, зарегистрированного в АСУ СТ. Отклонения влияют на достоверность составления прогноза поездообразования внеклассной сортировочной станции Челябинск-Главный. В статье приводятся средние показатели времени, взятые за 7 суток в период с 1 по 8 ноября 2011 г. Все данные содержатся в анализе работы сортировочной станции в период с 1 по 10 ноября 2011 г.

Следовательно, необходимо осуществлять прогноз поездообразования с применением статистических методов.

Вероятность разности между зарегистрированным и фактическим временем прибытия состава поезда в интервале [0; 10] мин по распределению Пуассона равна сумме вероятностей соответствующих значений либо площади фигуры, расположенной в данном интервале:

т10]= Й°„Р; = 0,98. (5)

Вероятность разности между зарегистрированным и фактическим временем прибытия состава поезда в интервале [0; 10] мин по экспериментальным данным

Р[0,10] = Т^=0Рп = 0,75, (6)

где Рп - вероятность прибытия состава поезда в интервале разности времени п по экспериментальным данным.

Из анализа гистограммы на рис. 1 следует, что разница между зарегистрированным и фактическим временем поступления поездов на станцию Челябинск-Главный характеризуется распределением Пуассона (рис. 2).

Расхождение теоретических и экспериментальных вероятностей прибытия состава поезда в доверительном интервале [0; 10] мин связано с тем, что распределение Пуассона «содержится» в более узких рамках по времени обработки состава, а экспериментальные данные распределены по всем значениям.

Проверим предположение о распределении Пуассона в доверительном интервале с соответствующей вероятностью с помощью теоремы Пирсона.

Для статистического анализа информационных потоков прибытия составов поездов на станцию Челябинск-Главный интервалы разности между зарегистрированным и фактическим временем

0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0

;

г •

1 «

1 А

т ,1 \

1 •

••

0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 38 44 57

Рис. 1. Гистограмма интервалов разности времени прибытия составов поездов

0,2 0,18 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0

/

1 1

/ \ А

/ 1 \ 1

I • 1

А 4 V Л

А г > ¡д

• 1 к

4 Л- 1:-: Рлсп Я»

0 2 4 6 8 • - 10 12 14 16 истограм,ма — ^ т т т ▼ 20 22 ределени< 24 П V д с 26 28 30 сонл 38 44 57

Рис. 2. Гистограмма плотности распределения

Таблица 1

i 0 1 2 3 4 5 6 7 8 9 10 11 12

п 19 32 28 51 73 43 34 28 21 17 16 12 9

i 13 14 15 16 17 18 19 20 21 22 23 24

п 7 2 2 5 2 1 1 2 4 3 1 2

i 25 26 27 28 29 30 31-33 34-38 39-40 41-44 45-54 55-57

п 2 1 2 3 3 2 1 1 1 1 2 1

Таблица 2

i 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

п 19 32 28 51 73 43 34 28 21 17 16 12 9 9 9 8 8 6 6 6

прибытия поездов на сортировочную станцию разбили на 38 промежутков времени, в каждом из которых регистрировалась разность зарегистрированного и фактического времени прибытия состава поездов на станцию.

Результаты приведены в табл. 1, где наблюдаемые частоты ni - число промежутков из 38 интервалов, в которых было зарегистрировано соответствующее число i 0 = 0,1, ..., 57) составов поездов, прибывших на станцию, с разницей между зарегистрированным и фактическим временем прибытия п,-.

На уровне значимости а = 0,05 необходимо проверить гипотезу о том, что случайная величина Х - число прибывших составов поездов на сортировочную станцию во временной промежуток длительностью Дт - разность между зарегистрированным и фактическим прибытием составов поездов на станцию - подчиняется распределению Пуассона:

Р(Х = 1) = Р1=±е-а, (7)

где i = 0, 1, ..., 57.

Поскольку значение ni в некоторых столбцах исходной таблицы меньше 5, то объединим их с предыдущими столбцами и получим табл. 2 для расчетов.

Число интервалов i при разбиении отрезка обычно определяют по формуле Старджесса [3]:

¿ = 1 + 3,321пп, (8)

где п - число составов поездов, прибывших на станцию в среднем за сутки в период с 01.11.2011 г. по 08.11.2011 г.: I * 22 интервала, что практически совпадает с количеством интервалов на практике (в результате преобразований получено 20 интервалов времени).

Используя данные таблицы, вычислим значение оценки неизвестного параметра а распределения Пуассона (а^ = х, где х - выборочное среднее):

х = ^Т,1=о Щ, (9)

где п - число составов поездов, прибывших на станцию в среднем за сутки в период с 01.11.2011 г. по 08.11.2011 г. (п = 436).

х =-----= 6,18 = а„. (10)

436 4 ’

Заменим в гипотетическом распределении Пуассона = ^-е_а неизвестный параметр а значением его оценки а^,, вычисленным по экспериментальной выборке, = 6,18.

Таким образом, проверке подлежит гипотеза Н0:

против альтернативы Н1: р1 Ф р?е, г = 0, 1, 19 на

уровне значимости а = 0,05. Заметим, что проверяемая гипотеза Н0 - сложная, так как распределение содержит неизвестный параметр а, значение которого заменено значением его оценки а[3].

В табл. 3 приведен расчет величины

у2 _ V19 (п1~пР<1е)2 (12)

Ае — 2-ц=0 „,»0 . (12)

Заметим, что при расчете «теоретических» вероятностей в случае целочисленного распределения для крайних значений выборки следует крайние интервалы считать полубесконечными. В интервале г > 13 значения и вычисления соответст-

венно необходимо отбросить, так как данные интервалы содержат мало случаев. Таким образом, табл. 3 преобразуется в табл. 4 значений, которые стоит учитывать.

В методе хи-квадрат для случая сложной гипотезы статистикой критерия служит Х2к_1_г [3], где I - число параметров, оцениваемых по выборке; к - максимальное значение числа г, зарегистрированное в данном эксперименте (аналог числа интервалов разбиения, используемого в методе хи-квадрат при проверке гипотезы о непрерывном распределении); в данном случае к = 37.

Учтем, что 17 последних столбцов исходной таблицы были объединены в несколько, поэтому к* = к - 17 = 20, а также то, что в неизвестное зна-

Таблица 3

г Пг г п Р?е пр?е (.Ъ - пр°)2 пр°е

0 19 0 0,002070 0,995876 325,4909

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 32 32 0,012795 6,154512 108,5365

2 28 56 0,039537 19,01744 2,121377

3 51 153 0,081447 39,17593 3,568736

4 73 292 0,125835 60,52682 2,570436

5 43 215 0,155533 74,81115 3,381679

6 34 204 0,160199 77,05548 3,007207

7 28 196 0,141432 68,02898 3,92558

8 21 168 0,109257 52,55239 3,157336

9 17 153 0,075023 36,08597 2,523656

10 17 170 0,046364 22,30113 1,260115

11 12 132 0,026048 12,52918 0,02235

12 9 108 0,013415 6,452528 1,005747

13 9 117 0,006377 3,067433 11,47388

14 9 126 0,002815 1,354052 43,17448

15 8 120 0,001160 0,55787 99,28002

16 8 128 0,000448 0,215477 281,2308

17 6 102 0,000163 0,078332 447,659

18 6 108 0,000056 0,026894 1326,611

19 6 114 0,000018 0,008748 4103,398

436 2694 1,0 436,0 ^1=6773,399

Таблица 4

г Пг г Пг Р1 прЪ (Щ - пр°е)2 пр?„

2 28 56 0,039537 19,01744 2,121377

3 51 153 0,081447 39,17593 3,568736

4 73 292 0,125835 60,52682 2,570436

5 43 215 0,155533 74,81115 3,381679

6 34 204 0,160199 77,05548 3,007207

7 28 196 0,141432 68,02898 3,92558

8 21 168 0,109257 52,55239 3,157336

9 17 153 0,075023 36,08597 2,523656

10 17 170 0,046364 22,30113 1,260115

11 12 132 0,026048 12,52918 0,02235

12 9 108 0,013415 6,452528 1,005747

333 1847 1,0 468,5 *1=26,54422

А / \

* * 1 ' \ т

/ Л »

✓ Т » / V *

/ / ч * •- * *•*. ■ ^ ••

1 3 4 5 6 7 8 9 10 И 12

— •—Гистограмма -4- Распределение хи-квадрат

Рис. 3. Гистограмма и функция хи-квадрат в отрезке [2; 12]

чение параметра распределения а было заменено значением его оценки , поэтому число степеней свободы равно окончательно к* - I - 1 = 19.

Квантиль порядка 0,95 распределения X2 с числом степеней свободы, равным 19,

*2кр _*219; О,95_ 30,1435. (13)

Поскольку Х2е _ 26,54422 < 30,1435 _ Х2кр, нет оснований для отклонения гипотезы Н0.

Таким образом, гипотеза Н0 о том, что случайная величина - количество составов поездов, прибывших на сортировочную станцию Челя-бинск-Главный с разницей зарегистрированного и фактического времени прибытия на станцию за промежуток времени Дт, подчиняется распределению Пуассона с параметром, равным _ 6,18, не противоречит результатам наблюдений и может быть принята на уровне значимости а = 0,05 на отрезке [2; 12].

На рис. 3 представлены гистограмма и функция хи-квадрат на отрезке разности между зарегистрированным и фактическим временем прибытия [2; 12] мин.

В результате аппроксимации и проверке гипотезы о распределении Пуассона разности во времени прибытия составов поездов на станцию между зарегистрированным и фактическим установлено, что подчиняется распределению Пуассона с параметром, равным _ 6,18, не противоречит результатам наблюдений и может быть использовано с доверительной вероятностью 0,95 на отрезке [2; 12]. Следовательно, при регистрации сообщения о прибытии поезда на станцию дежурным

по станции в Гид «Урал-ВНИИЖТ», разность между прогнозируемым и фактическим временем прибытия составов поездов на станцию будет в пределах [2; 12] мин в 95 % случаев.

Заключение

Использование статистического анализа в качестве вспомогательного инструмента для составления прогноза поездообразования на сортировочной станции Челябинск-Главный и в принятии решений позволит повысить достоверность прогноза в заданном интервале времени путем минимизации влияния человеческого фактора. Разность между зарегистрированным и фактическим временем прибытия состава поезда характеризуется законом Пуассона в пределах отрезка [2; 12] мин с доверительной вероятностью 0,95.

Литература

1. Правительство Российской Федерации. Постановление. Стратегия развития железнодорожного транспорта до 2030 года № 877-р от 17.06.2008 г.

2. Исходные данные для статистического анализа и прогнозирования / С.А. Айвазян, О.Я. Бал-кинд, Т.Д. Баснина и др.; под ред. Г.Б. Клейнера. -Ы1р://м^^.аир.ги/Ъоок$/т71/рп11_1.кт (дата обращения 20.10.2011).

3. Положинцев, Б.И. Теория вероятностей и математическая статистика. Введение в математическую статистику: учеб. пособие / Б.И. Положинцев. - СПб.: Изд-во Политехн. ун-та, 2010. - 95 с.

Поступила в редакцию 12 декабря 2011 г

i Надоели баннеры? Вы всегда можете отключить рекламу.