УДК 621.395.7
А. В. Солуянов, Ю. В. Юркин
Петербургский государственный университет путей сообщения
Императора Александра I
МОДЕЛЬ ОРГАНИЗАЦИИ СПРАВОЧНО-ИНФОРМАЦИОННОЙ СИСТЕМЫ ЖЕЛЕЗНОДОРОЖНОГО ТРАНСПОРТА
Рассматриваются проблемы построения справочно-информационной системы на железнодорожном транспорте. Дан анализ поступающей на обслуживание нагрузки. Показана сезонная зависимость количества вызовов. Предложены двухуровневая модель обслуживания заявок и аналитические выражения, позволяющие вычислить вероятность потери вызова на каждом этапе обслуживания и вероятность ожидания. Кроме того, предложен алгоритм составления расписания рабочих смен операторов справочноинформационной системы в зависимости от сезонной составляющей в характере колебаний нагрузки, поступающей на обслуживание.
справочно-информационная система, нагрузка, сезонная составляющая, тренд, сглаживание временных рядов.
Введение
При создании Единого информационно-сервисного центра ОАО «РЖД» представляется актуальной разработка алгоритма функционирования и математической модели справочно-информационной системы железнодорожного транспорта. Такая система заменит множество разбросанных по стране справочных центров. Это позволит оптимизировать организацию информационной поддержки клиентов (в частности, пассажиров), снизить вероятность потерь вызовов, поступающих операторам на обслуживание, сократить эксплуатационные расходы по обеспечению функционирования справочноинформационной системы. Организация работы справочно-информационной системы ОАО «РЖД» имеет свою специфику, так как потребность в предоставляемых ею услугах непосредственно связана с объемом перевозок грузов и пассажиров. В свою очередь, эти перевозки обладают выраженной сезонной зависимостью.
Сформулируем задачи исследования:
• проанализировать состав железнодорожных справочно-информационных служб;
61
• измерить трафик (количество вызовов), поступающий в справочный центр в течение многомесячного периода для выявления сезонной зависимости;
• построить прогнозную модель изменения трафика на основании этих данных;
• разработать модель функционирования и математическую модель справочно-информационной системы ОАО «РЖД» с учетом выявленных особенностей работы справочных служб;
• разработать имитационную модель справочно-информационной системы с целью проведения серии численных экспериментов для проверки корректности допущений, принятых в математической модели;
• разработать алгоритм составления графика рабочих смен операторов справочно-информационной системы ОАО «РЖД» на основании прогнозируемых данных о поступающем трафике.
1 Состав справочно-информационных служб
Имеется множество справочных служб железнодорожного транспорта, которые необходимо свести в Единую справочно-информационную систему. Перечислим те, которые функционируют в г. Санкт-Петербурге:
• горячая линия и бесплатная справочная служба по пригородным перевозкам;
• горячая линия и платная круглосуточная справка Санкт-Петербургского железнодорожного агентства;
• городское агентство по заказу билетов;
• справочная служба о номерах телефонов сети общетехнологической связи Октябрьской железной дороги;
• горячая линия и телефон доверия Северо-Западной региональной дирекции железнодорожных вокзалов;
• справочная служба вокзалов г. Санкт-Петербурга.
Этот список свидетельствует о большом количестве разрозненных справочных служб на железнодорожном транспорте. По нему можно судить об основных типах вопросов клиентов. Как видим, службы не универсальны и неудобны. Похожее положение и в остальных филиалах ОАО «РЖД».
2 Измерение и анализ трафика, поступающего на обслуживание
Трафик вызовов, поступающих операторам справочных служб железнодорожного транспорта, измеряли в течение 12 месяцев на одной из цифро-
62
вых коммутационных станций Октябрьской железной дороги в соответствии с рекомендациями МСЭ-Т, т. е. по рабочим дням с 8 до 17 ч. Каждые 15 мин показания счётчиков, подсчитывающих время занятия абонентской линии и количество входящих и исходящих вызовов для каждого абонента, записывали в LOG-файл и обнуляли. В результате были получены данные о суммарном времени всех разговоров конкретного абонента за любые 15 минут рабочего дня.
Результаты обрабатывали следующим образом: усредняли данные по первому часу (9:00-10:00) в течение всей рабочей недели, затем по второму часу (9:15-10:15) и т. д. до конца рабочего дня. В качестве нагрузки в час наибольшей нагрузки (ЧНН) брали максимальное значение из всех средних арифметических. Таким образом, местоположение ЧНН на шкале времени было определено с точностью до 15 мин. Полученные результаты позволили сделать следующие выводы:
• интенсивность нагрузки на операторов справочных служб во многом зависит от сезонного фактора. С ноября по март интенсивность удельной нагрузки на одного оператора в ЧНН (усреднена по пяти дням каждого месяца) колебалась в пределах 0,35-0,4 Эрл, затем этот показатель увеличивался: в апреле - до 0,6 Эрл; в мае - июне - 0,7 Эрл; в июле - 0,75 Эрл; в августе -0,7 Эрл; в сентябре - 0,65 Эрл. Причина такого явления - возрастание пассажиропотока в весенне-летний период;
• ЧНН всегда отмечался в первой половине дня;
• трафик колеблется по дням недели: во вторник, среду и четверг в осенне-зимний период интенсивность удельной нагрузки, приходящейся на одного оператора, ниже, чем в понедельник и пятницу. Особенно резкий рост трафика наблюдается в пятницу - до 0,7-0,75 Эрл (характерно для октября). Однако в ноябре и декабре не отмечалось столь резких колебаний: 0,4-0,6 Эрл в течение всей недели;
• особые условия складываются с мая по сентябрь: в этот период колебания значений удельного трафика по дням недели очень незначительны и сосредоточены вокруг высоких величин (0,7-0,75 Эрл, в отдельные дни -до 0,8 Эрл).
3 Прогнозная модель изменения трафика
Как уже сказано, анализ трафика выявил ярко выраженную сезонность изменений. Если применить один из методов прогнозирования к полученному эмпирическим путем временному ряду (в нашем случае - к данным об интенсивности нагрузки), то в результате можно разработать алгоритм определения требуемых ресурсов (операторов справочных служб), которые непосредственно связаны с численными значениями этого временного ряда.
63
Суть метода состоит в том, что исходный ряд x (t) сглаживается с некоторым экспоненциальным весом, в результате образуется новый временной ряд S (t) (c меньшим уровнем шума), поведение которого можно прогнозировать.
Простое экспоненциальное сглаживание задаётся формулой
S (t) = а • x(t) • S (t -1),
где а - некоторый фиксированный параметр, 0 < а < 1.
В общей модели можно учесть сезонный фактор и тренд - линейный, экспоненциальный, демпфированный. Для этого в модели кроме параметра а необходимо определить параметры 5, е и ф.
В аддитивных моделях прогноз строится по формуле
Forecast (t) = S (t) +1(t - lag), где I - сглаженный сезонный фактор:
I(t) = I(t - lag) + 5(1 - a) • e(t),
где e (t) - разность между наблюдаемым рядом и прогнозом в момент времени t; lag - сезонный период.
Параметры е и ф являются параметрами сглаживания тренда. Параметр е используется в моделях с линейным и экспоненциальным трендом и в моделях с демпфированным трендом в рядах без сезонной составляющей. Параметр 5 - сезонный сглаживающий. Параметр ф используется в моделях с демпфированным трендом.
Вначале необходимо определить сезонный период (lag). Для этого следует выяснить период гармонической составляющей, имеющей наибольшую мощность во временном ряду, отражающем изменение обслуженной нагрузки. Выполним процедуру спектрального анализа (применим процедуру разложения в ряд Фурье) и построим график спектральной плотности (будем считать, что ряд стационарен) (рис. 1).
Из графика на рис. 1 видно, что в точке 7 значение спектральной плотности имеет максимальную величину. Это значит, что имеется цикл с периодом 7 дней (lag = 7), поэтому целесообразно строить прогноз на 7 дней: в рамках этого интервала прогноз будет наиболее точен.
Далее следует определить тип сезонного компонента и тренда. Примем, что ряд имеет аддитивную сезонную составляющую, т. е. сезонные флуктуации не зависят от времени. Примем также, что тренд является экспоненциальным. График сглаженного временного ряда, отражающего изменения обслуженной удельной нагрузки (Y) в ЧНН, прогноз ряда на 7 дней и остатки (разность между сглаженным и не сглаженным рядом) приведены на рис. 2.
64
Рис. 2. Экспоненциально сглаженный ряд
Из графика видно, что все периоды имеют похожую структуру. На рис. 3 показана произвольно выбранная часть сглаженного временного ряда. Очевидна идентичность характера изменения Y в течение каждого периода (7 дней).
Провалы наблюдаются в субботу и воскресенье, в понедельник -всплеск, во вторник - спад, в среду и четверг - новый всплеск, в пятницу начинается снижение нагрузки.
65
Чтобы выделить сезонную составляющую временного ряда, проведём процедуру сезонной декомпозиции (метод Census I).
Сезонный компонент временного ряда представлен на рис. 4.
Рис. 4. Сезонный компонент
Сглаженный тренд-цикл за вычетом тренд-циклической и случайной составляющих представлен на рис. 5.
Из графика видно, что Y имеет максимальное значение в июне. На данном отрезке времени тренд имеет тенденцию к снижению с наступлением осени, поскольку потребность в услуге, предоставляемой справочными службами (информации о движении пригородных поездов), снижается в осеннезимний период.
66
Рис. 5. Сглаженный тренд-цикл
Сделаем прогноз на определённый временной интервал и сравним полученные данные с измеренными. Имеется информация о нагрузке за период с 1.06.2010 г. по 20.10.2010 г. Прогнозирование выполняется на отрезок времени, равный семи дням (14.10.2010-20.10.2010) на основе данных за период 1.06.2010-13.10.2010 с помощью экспоненциального сглаживания и прогнозирования.
На рис. 6 показаны прогнозируемый и измеренный ряды. Как видно из графика, экспоненциальное сглаживание, являясь простым в применении методом, даёт довольно точный результат на промежутке времени, сопоставимом с периодом цикла сезонной составляющей.
67
Прогнозирование Ya и выявление закономерностей в поведении кривых, описывающих зависимость этих величин от времени, позволяет своевременно и обоснованно подстраивать систему обработки вызовов к изменяющимся внешним факторам, что сказывается на качестве обслуживания абонентов и рациональности использования трудовых ресурсов. В рассматриваемом случае со справочной службой, предоставляющей информацию о пригородных перевозках с вокзалов Санкт-Петербурга, такими ресурсами могут выступать операторы. Прогнозирование позволяет составлять их рабочие графики таким образом, чтобы заранее учесть возможное повышение спроса на услуги справочной службы в зависимости от времени года либо дня недели или, наоборот, сократить эксплуатационные расходы во время спада объёма перевозок.
4 Алгоритм функционирования
Единой справочно-информационной системы
Как отмечалось выше, есть необходимость свести большое количество разрозненных справочных служб железнодорожного транспорта в Единую справочно-информационную систему. Рассмотрим целесообразную структуру такой системы и алгоритм ее функционирования.
Учитывая административно-географические особенности построения ОАО «РЖД», предлагается двухуровневая модель распределенной Единой справочно-информационной системы (рис. 7). Первый уровень обслуживания клиентов располагается в регионах железной дороги (на рис. 7 таких регионов n), второй - в Управлении железной дороги. Модель Единой справочноинформационной системы работает следующим образом.
Поступающая заявка потока с параметром X. направляется на первый уровень. Если есть свободный оператор, она обслуживается на этом уровне. Если все операторы первого уровня заняты, заявка направляется на ожидание в буфер бесконечной емкости. Она может покинуть буфер, не дождавшись обслуживания, и затем с некоторой вероятностью повторно поступить на обслуживание оператором этого уровня (абонент совершает повторный вызов). Если на первом уровне заявка удовлетворяется, то она покидает систему, если нет, то оператор этого уровня принимает решение о перенаправлении заявки на второй уровень системы. При наличии хотя бы одного свободного оператора на втором уровне заявка поступает на обслуживание. Если свободных операторов на втором уровне в данный момент нет, то заявка направляется на ожидание в буфер, который может покинуть, не дождавшись обслуживания. В последнем случае заявка считается потерянной.
68
Xii
A12
Xin
Рис. 7. Двухуровневая модель Единой справочной системы
5 Математическая модель системы
Наиболее сложной для анализа частью алгоритма функционирования модели справочно-информационной системы (п. 4) является первый уровень обслуживания, так как абонент, заявка которого покидает буфер, не дождавшись обслуживания, может совершить повторную попытку установить соединение с оператором этого уровня.
Для построения математической модели первого уровня системы рассмотрим функциональную схему уровня (рис. 8).
В систему массового обслуживания (СМО) M/M/m/w/t^Jf°° поступает пуассоновский поток первого рода (простейший) с параметром X. Если в полнодоступном пучке емкостью m имеется хотя бы одна свободная линия, вызов поступает на обслуживание к оператору и сразу обслуживается. Вызов, поступивший в момент отсутствия свободных линий в пучке, попадает в буфер (дисциплина выбора заявки из очереди - FIFO). Время нахождения вызова в буфере ограничено экспоненциально со средним значением t . Та-
69
Рис. 8. СМО с нетерпеливыми абонентами и повторными вызовами
ким образом, учитывается фактор нетерпеливости абонентов при ожидании обслуживания их вызовов. Вызовы, которые не обслуживаются по причине ограничения времени ожидания, являются источниками повторных вызовов. От каждого такого источника поступают повторные вызовы, образующие простейший поток с параметром р. Если в течение заданного времени источник не производит повторного вызова, то рассматриваемый вызов теряется окончательно. Это время примем распределённым по показательному закону с параметром у.
Примем следующие обозначения: j - общее количество мест, занятых в системе; к - количество источников повторных вызовов; т - количество обслуживающих устройств (операторов).
Вероятность поступления за время т точно одного первичного вызова составляет Хт + о (т), т ^ 0; аналогично этому вероятность поступления за время т точно одного повторного вызова при к источниках повторных вызовов равна крт + о (т), т ^ 0. Вероятность окончания за время т ожидания обслуживания одной из j - m заявок (нетерпеливость абонента) есть (j - т)ат + + о (т), т ^ 0. Аналогично этому вероятность окончания обслуживания одной из т заявок равна т^т + о (т), т ^ 0. Вероятность прекращения одним из к источников повторных вызовов попыток добиться обслуживания составляет кут + о (т), т ^ 0.
Пусть система в произвольный момент (t + т) должна находиться в состоянии (j, к), в котором в системе j заявок находятся на обслуживании и в буфере. Обозначим через Pjk (t + т) и Pjk (t) вероятности того, что система в моменты, соответственно, (t + т) и t находится в состоянии (j, к). Для значений j = 0, 1.. .го; к = 0, 1.. .го система к моменту (t + т) может перейти в со-
70
стояние (j, k) за время (t, t + т), t ^ 0, с конечным значением вероятности из нижеследующих состояний системы в момент t.
При 0 < j < m -1
1) система в момент t находится в состоянии (j - 1, k), за время т в систему поступает первичный вызов. Вероятность такого события
Pi, j k(t+t)i;
2) система в момент t находится в состоянии (j - 1, k + 1), за время т от одного из (k + 1) источников повторных вызовов поступает вызов. Вероятность этого события
Pj k(t+т)2 = Pj-1, k+1(t )(k+1)pt+о(т);
3) система в момент t находится в состоянии (j, k + 1), за время т один из (k + 1) источников повторных вызовов покидает систему, не добившись обслуживания вызова (абонент отказывается от дальнейших попыток установить соединение). Вероятность такого события
Pj ,k(t+т)з = Pj, k+1(t )(k+1) yt+о(т);
4) система в момент t находится в состоянии (j + 1, k), за время т один из вызовов будет обслужен. Вероятность этого события
Pj ,k(t + т)4 = Pj+1, k(t)(j +1)вт + о(т);
5) система в момент t находится в состоянии (j, k), за время т в происходит изменения состояния системы, т. е. за время т не поступает ни одного первичного и ни одного повторного вызова, ни одно обслуживающее устройство не освобождается и ни один из k источников повторных вызовов не покидает систему. Вероятность такого события
Pj,k(t + т)5 = Pj, k(t)[1 - - kPT - kYT -./PT] + о(т).
При m < j <ro
1) система в момент t находится в состоянии (j - 1, k), за время т в систему поступает первичный вызов. Вероятность события
Pj ,k(t+т)б = Pj-1, k(t )^т+о(т);
71
2) система в момент t находится в состоянии (j - 1, к + 1), за время т одного из (к + 1) источников повторных вызовов поступает повторный вызов. Вероятность такого события
Pj л(t+т)7 = Pj-1, к+i(t )(к+1)рт+С(т);
3) система в момент t находится в состоянии (j, к + 1), за время т один из (к + 1) источников повторных вызовов покидает систему, не добившись второго этапа обслуживания вызова. Вероятность этого
Pj к(t + т)8 = Pj, к+1(t )(к +1) yt + о(т);
4) система в момент t находится в состоянии (j + 1, к - 1), за время т один из вызовов, находящихся в буфере, покидает очередь, не дождавшись обслуживания. Вероятность такого события
Pj к(t+т)9 = Pj+1, к-1(t)(j -т+1)ат+С(т);
5) система в момент t находится в состоянии (j + 1, к), за время т один из вызовов будет обслужен. Вероятность этого события
Pj к(t+т)ю = Pj+1, к(t )тРт+С(т);
6) система в момент t находится в состоянии (j, к), за время т не происходит изменения состояния системы, т. е. за время т не поступает ни одного первичного и ни одного повторного вызова, ни одно обслуживающее устройство не освобождается и ни один из к источников повторных вызовов не покидает систему. Вероятность такого события
Pjk(t + т)11 = Pj к(t)[1 -Хт- крт - кут - (j - т)ат - твт] + о(т).
Вероятности Pj к связаны системой уравнений статистического равновесия.
Данная система позволяет получить следующие выражения для нахождения вероятностей потери заявки. Вероятность потери вызова на первом уровне обслуживания системы (см. рис. 7)
P = (1 - H)(Ia- та + т$-Х) (1)
РПСХ = H Х , (1)
где Рпот - вероятность потери заявки на первом уровне обслуживания; H -вероятность настойчивости абонентов; I - среднее количество мест, занятых
72
в буфере системы; а - параметр потока заявок, покидающих очередь из-за нетерпеливости абонентов; в - параметр потока обслуженных вызовов.
Вероятность потери вызова на втором уровне обслуживания системы (см. рис. 7):
Y
V+r
P = P + P =■
V !П r=,(V + PT)
I
Y&
к=0 л
■ +
+
YV (V !)-11j ={Yj [П ^(V + ivT )]-1}
(2)
+
vT I 'jJ{YV++ [V !П ЦУ + ivT )J1}
YZV.0<Yk (к !)-1} + YI k.1(Yk [V !П "jV + ivT )]-1}'
Вероятность ожидания на втором уровне обслуживания:
Рож =
ож
a
0 при r = 0
V
V!
a
m V
v a a r
1 m=0 m+vr1 m=i n m=1(v+xp)
при r = 1
a
П!
mV m
y-^v a a y-^r a
/—im=0 m! у! ^~‘ m=1 t—f m
■ +
n m=1(v+#)
r
V+r-1
+ I
к=V+1
v !П k=V (v + *P)
m V
V a a r
-1 m=0 i + т/ч
a
V
m=0 m! V !^ m=1 П m=1(V + xp)
при r > 1.
(3)
В выражениях (2) и (3) P - общая вероятность потери вызова; Рг - вероятность потери вызова вследствие занятости всех мест в буфере; Pv - вероятность потери вызова вследствие ограниченности времени ожидания; P - вероятность ожидания; r - ёмкость буфера; v - интенсивность ожидания (v = 1/^ож, где tom - среднее время ожидания в буфере); Y - поступающая нагрузка, Эрл; V - количество обслуживающих устройств.
73
6 Имитационная модель справочно-информационной системы
Имитационная модель была разработана с помощью пакета AnyLogic для определения погрешности, вносимой в математическую модель тем допущением, что время обслуживания распределено по показательному закону. Исследования показывают, что закон распределения времени обслуживания отличается от показательного. На рис. 9 приведена гистограмма, отражающая плотность распределения времени обслуживания вызовов, полученная эмпирическим путём.
Рис. 9. Плотность распределения времени обслуживания вызовов
На гистограмму наложен график плотности вероятности логнормального распределения
f (x) =<
1
(ln x-,u)2/2o2
, x > 0
0, x < 0
с параметрами о = 0,68; g = 3,64.
Во всех случаях величины, полученные с помощью аналитических выражений, попадали в доверительные интервалы, построенные на основе результатов имитационного моделирования, что свидетельствует о корректности полученных выражений и обоснованности принятых допущений.
74
7 Алгоритм составления графика рабочих смен операторов
Предложен алгоритм составления расписания рабочих смен операторов справочной системы (рис. 10).
Алгоритм работает следующим образом
Шаг 1. Собираются данные о входящем потоке вызовов.
Шаг 2. Определяется параметр показательного распределения интервалов между поступающими вызовами.
Шаг 3. Определяется среднее время обслуживания вызовов.
Шаг 4. Определяется среднее время ожидания.
Шаг 5. Задаётся вероятность потери вызова (качество обслуживания).
Шаг 6. Определяется настойчивость абонентов (вероятность совершения повторного вызова).
Шаг 7. Определяется период прогнозирования на основе анализа временного ряда, характеризующего изменение поступающей нагрузки.
Шаг 8. Выполняется прогноз на один шаг.
Шаг 9. В зависимости от рассматриваемого уровня обслуживания заявок в системе используется формула (1) для первого уровня или (2) - для второго уровня.
Шаг 10. Если прогноз построен не на весь требуемый период, вернуться к шагу 8. В противном случае алгоритм завершён.
Заключение
Таким образом, в процессе исследований получены следующие результаты:
• измерена и проанализирована интенсивность нагрузки на справочную службу. Установлено, что характер изменения нагрузки имеет сезонную зависимость (в течение дня, недели, месяца);
• сделаны прогноз изменения поступающих вызовов и сравнение прогнозируемых и измеренных данных;
• разработана и предложена двухуровневая модель справочно-информационной системы;
• предложена функциональная и математическая модели справочноинформационной системы с нетерпеливыми абонентами и повторными вызовами, где на вход поступает простейший поток вызовов;
• получены аналитические выражения, позволяющие определить вероятность потери вызова на первом и втором этапах обслуживания и вероятность ожидания на втором этапе;
75
Рис. 10. Алгоритм составления расписания рабочих смен операторов справочной системы
76
• с помощью имитационного моделирования показана корректность допущений, принятых в математической модели;
• построен алгоритм составления рабочих смен операторов на основе прогнозирования нагрузки.
Библиографический список
1. Прогнозирование в системе Statistica в среде Windows : учеб. пособие / В. П. Боровиков, Г. И. Ивченко. - Москва : Финансы и статистика, 1999. - 384 с.
2. Математические методы построения прогнозов / А. А. Грешилов, В. А. Стакун,
A. А. Стакун. - Москва : Радио и связь, 1997. - 112 с.
3. Бизнес-прогнозирование / Д. Э. Ханк, Д. У. Уичерн, А. Дж. Райтс. - Москва : Издат. дом «Вильямс», 2003. - 656 с.
4. Теория массового обслуживания : учеб. пособие для вузов / Г. И. Ивченко,
B. А. Каштанов, И. Н. Коваленко. - Москва : Высш. шк., 1982. - 256 с.
© Солуянов А. В., Юркин Ю. В., 2014
77