Актуальна ли в России проблема поиска маршрутов на пассажирском транспорте?
В. М. ВИШНЕВСКИЙ, докт. техн. наук, профессор, академик МАИ, Р. В. ЖЕЛЕЗОВ, канд. техн. наук
В настоящее время во всем мире активно внедряются информационные системы на пассажирском транспорте. Например, в Европе уже более десяти лет работает система ИАРАБ [1], которая обслуживает железные дороги некоторых европейских стран. В то же время в России информационных систем такого уровня не существует.
На железнодорожном транспорте в постсоветском пространстве около тридцати лет работает система «Экспресс» [2], но в ней задача поиска маршрута с пересадками до сих пор не решена. Кассирам приходится самостоятельно подбирать пункты пересадки, а покупка билетов на сложный маршрут требует много времени.
Бывают также случаи, когда беспересадочный маршрут оказывается не оптимальным. Например, на запрос Санкт-Петербург — Ульяновск система «Экспресс» предлагает поезд № 347, который идет 39 часов. В то же время поездка из Санкт-Петербурга в Ульяновск с пересадкой в Москве займет всего 27 часов с учетом времени на пересадку.
Наиболее развитой в этом плане является система «Сирена» на воздушном транспорте, которая позволяет находить маршруты с пересадкой. Это неудивительно, так как количество аэропортов в сотни раз меньше количества железнодорожных станций. Для поиска маршрутов с пересадками на наземном транспорте необходимо решить чрезвычайно сложную задачу оптимизации на огромном графе (только в России железнодорожных станций более двадцати тысяч).
Что касается автобусного сообщения, то в этой сфере не только не существует единой базы данных расписаний, но и уровень информатизации весьма низок. Интересно, что Москва здесь вовсе не флагман, а скорее аутсайдер. Например, на сайте автовокзала Барнаула [www.avtovokzal.ru] реализован удобный интерфейс, через который можно легко получить необходимую информацию о рейсах и да-
же купить билет на автобус. В то же время у крупнейшего автомобильного перевозчика ГУП «Мострансавто», обслуживающего Московскую область, сайт [www.mostransavto.ru] оставляет желать лучшего. А в целом Россия отстает даже от ближайшего соседа Украины, где за последние годы внедрена единая информационная система на автовокзалах и начались продажи автобусных билетов через Интернет.
Еще более важная и сложная задача — это поиск интермодального маршрута, объединяющего разные виды транспорта (поезда, самолеты, автобусы).
Необходимо разобраться, чем обусловлена разница в развитии информационных систем на пассажирском транспорте Европы и России. Во-первых, плотность транспортной сети в Европе значительно выше, что связано с высокой плотностью населения. В связи с этим даже поездка на небольшие расстояния требует пересадки. Во-вторых, транспортная система Российской Федерации является одной из крупнейших в мире, и разработка единой информационной системы затруднена как с технической, так и с организационной точки зрения. Протяженность только железных дорог составляет около 90 000 км. Еще одна особенность — это топология транспортной сети России. По сравнению с Европой железнодорожная сеть в России распределена очень неравномерно и сильно централизована относительно Москвы. Эта гиперцентрализация особым образом отражается на организации пассажирского сообщения и оказывает влияние на выбор оптимальных маршрутов проезда для пассажира. Из
Москвы можно уехать/улететь без пересадок практически в любую точку России.
В свете существующих различий между транспортными системами России и европейских стран возникает вопрос: а нужна ли вообще в России система такого класса? Ведь всегда можно отправить пассажира в Москву, откуда есть прямое сообщение.
Актуальность задачи поиска маршрутов с пересадкой определяется отношением числа поездок с пересадкой к общему числу поездок. Нами с теоретической точки зрения был изучен вопрос, какой процент пассажиров России использует пересадку в пути следования. При расчете вероятности поездки из одного города в другой учитывались актуальные данные о расписании движения транспорта (поездов и самолетов) и фактической численности населения городов России, расстояние между городами, а также исторические особенности миграции населения. В анализе рассматривались только междугородние, межрегиональные рейсы, но не локальные рейсы (городской, пригородный, внутрирайонный транспорт). Это обусловлено тем, что локальный транспорт не имеет решающего значения при планировании дальних поездок. Интенсивность его движения обычно на порядок выше, а стоимость билетов на порядок ниже, чем на межрегиональных рейсах. Кроме того, не использовалась информация о движении автобусов, поскольку не существует источника, из которого можно было бы получить соответствующие централизованные данные. В связи с последним обстоятельством теоретическая вероятность пересадок оказывается несколько завышенной. С другой стороны, были рассмотрены только маршруты по России, в то время как поездки в другие страны потребуют большего числа пересадок.
Итак, сформулируем формальное условие задачи. Пусть Г — множество городов, А е Г — город отправления,
В е Г — город прибытия, Я — множество рейсов транспорта,
ЯиЬе Я'
{1, если существует прямой рейс г е ЯшЬ между Ли В О, если НЕ существует прямой рейс г е между А и В
Пусть P (Л, Б) — это доля поездок из А в B от общего числа поездок, совершаемых пассажирами. Введем В(сИ81апсв) — убывающую функцию от расстояния, которая служит для корректировки вероятностей с учетом удаленности А от Б. То есть, если Щ$Шпсе(А Б) < иШапсв(А, С) то вероятность поездки из города А в город Б выше, чем в город С при прочих равных условиях. Коэффициенты функции В подобраны эмпирически,
D(dist) =
12000 -dist(A,B) 12000
При данных коэффициентах получается, что вероятность поездки на расстояние 2000 км в 10 раз выше, чем на расстояние 11 000 км.
Общая доля поездок с пересадкой определяется выражением:
р = X Е р(А>в)" Р(А> в> К™ь) • 0(сИ,^апсе(А, В)) • Н(А, В)
Вероятность поездки из города А в город Б определяется как вероятность нахождения пассажира в городе А, умноженная на условную вероятность, что пассажиру необходимо ехать в город Б. Вероятность нахождения пассажира в городе А определяется отношением населения города А к суммарному населению пространства Г. Условная вероятность поездки в город Б определяется отношением населения города Б к суммарному населению Г. Второе утверждение следует из первого. Для примера, вероятность поездки в город с населением 100 тысяч человек в 10 раз больше вероятности поездки в город с населением 10 тысяч человек. Итого, получаем:
Р(А,В) =
Population(A) Population(B) Population(r) Population(T)
Для учета особенности исторической миграции населения введена поправочная функция H(A, B). Традиционно люди переезжали жить из провинции в города, и таким образом росла доля городского населения. При этом устанавливалась связь между транспортным центром и окружающими населенными пунктами. В то же время, связь между небольшими населенными пунктами разных регионов обычно имеет случайный характер. Вероятность поездки пассажира между двумя провинциальными и удаленными друг от друга населенными пунктами существенно ниже, чем между крупными городами. Для учета этой особенности предложена функция
Population (А) + Population (В) > 100 000 , Population (А) + Population (В) < 100 000
Н(А,В) = \ 1'Р' [0.2, J
Такой подход не лишен недостатков, так как в общем случае распределение гораздо сложнее. Вероятность поездки из города А в город Б зависит от множества других факторов (социальных, географических, сезонных), учет которых не представляется возможным. В то же время предполагается, что данные поправки допустимы и позволяют получить более точное решение.
Необходимо также оговорить, что далее в расчетах рассматриваются только населенные пункты с населением более 10 тыс. человек, а это охватывает только 70% населения России. Но, как было сказано выше, в данной работе не рассматривается пригородное сообщение. Предполагается, что неучтенное население проживает в окрестностях исследуемых городов. Это не справедливо для слабозаселенных тер-
риторий, и полученное в экспериментах значение для доли пересадочных поездок оказывается несколько заниженным.
Для расчета использовались актуальные данные о расписаниях транспорта из информационной системы «Маршруты» и данные о населении городов, взятые из открытых источников. База данных системы «Маршруты» содержит расписания всех поездов из системы «Экспресс» и самолетов из системы «Сирена». В общей сложности было проанализировано более 8 тысяч рейсов поездов и более 13 тысяч авиарейсов.
Необходимо отметить, что рассматривались только города, в которых существует железнодорожное или воздушное сообщение, что обусловлено отсутствием централизованных данных о расписаниях автомобильного транспорта.
Таблица 1
Численность населения и число городов
Численность населения Число городов
10 тыс. — 100 тыс. 469
100 тыс. — 1 млн 153
1 млн. — 10 млн 10
>10 млн 1
Для получения оценок было проведено несколько серий вычислительных экспериментов:
1. Из Москвы до городов с населением > 10 тыс.;
2. Между административными центрами России;
3. Между всеми городами России с населением > 10 тыс.;
Для каждой комбинации А, Б в каждой из серий вычислялось значение В для двух случаев (с гибкой датой, со строгой датой). Гибкая дата подразумевает, что удовлетворяет любая дата поездки. Строгая дата означает, что важна поездка в определенную дату
В итоге были получены следующие результаты. Доля поездок с пересадкой для пассажиров, отправляющихся из Москвы в города с населением более 10 тыс. человек, составляет 7%. Получается, что для Москвы данная проблема не очень актуальна. А вот доля пассажиров, которые проезжают с пересадками между городами по всей России составляет 49%. То есть почти половина междугородних пассажиров используют пересадку в пути следования!
Полученные результаты согласуются со статистическими данными по пользовательским запросам, обработанным интернет-сервером системы «Маршруты». На данный момент около 20% запросов, обрабатываемых сервером — это маршруты с пересадками. Это объяснимо, так как половина интернет-пользователей России — жители Москвы. Если учесть тот факт, что уровень проникновения Интернета в регионы еще достаточно низок, то статистика интернет-сервера подтверждает результаты теоретических вычислений. К 2020 году, согласно прогнозам, Интернет будет доступен большинству населения России, и тогда половину запросов к системе «Маршруты» будут составлять запросы на маршруты с пересадками.
Архитектура и принципы работы автоматизированной информационной системы «Маршруты»
Система «Маршруты», с использованием которой были сделаны приведенные вычисления, позволяет искать оптимальные маршруты с пересадками на разных видах транспорта. Она представляет собой целый комплекс программ и баз данных, которые обеспечивают ее работу [3]. Система предоставляет следующие виды справочной информации:
Таблица 2
Отношение числа поездок с пересадкой к общему числу поездок
Серия Размер (Г) Объем статистики Строгая дата Гибкая дата
N2 79 79 9.9% 7.3%
N3 79 3486 31.7% 25.2%
N4 481 115440 54.9% 49.2%
• Поиск пунктов пересадки, когда беспересадочный проезд невозможен;
• Подбор оптимальной даты поездки с учетом графиков движения;
• поиск маршрутов с пересадкой по различным критериям (время в пути, стоимость);
• Поиск маршрута «самолеты + поезда дальнего следования + пригородные поезда»;
• Поиск маршрутов проезда более чем с одной пересадкой;
• Учет фактов пересечения государственной границы и информирование пассажира о требуемых для поездки документах;
• Отображение расписаний для разных часовых поясов;
• Предоставление информации о расписании движения по станции;
• Отображение найденных маршрутов на интерактивной карте Google;
• Построение интерактивной схемы беспересадочных маршрутов для любой станции.
Пример, демонстрирующий работу разработанной системы, приведен на рис. 1.
Формирование справочного запроса к системе начинается с указания параметров (пункты отправления и назначения, виды транспорта, дата поездки и др.). После того как пользователь задал параметры запроса и нажал кнопку «Искать», программный объект, содержащий все настройки, передается в модуль поиска пути. На первом шаге алгоритм пытается отыскать беспересадочный маршрут между заданными пунктами. Если прямой маршрут не найден, то используется оригинальный алгоритм поиска пути с пересадками.
Для обеспечения работы системы был разработан программный комплекс, который включает следующие компоненты:
• Специализированная база данных геоинформации и расписаний транспорта;
• Средства подготовки и импорта географических данных в систему;
• Модуль ядра. Реализация алгоритмов поиска маршрута на транспорте;
• Службы интеграции с другими информационными системами, функционирующие в режиме online;
• Интернет-портал доступа к системе;
• Средства мониторинга работы системы.
Перейдем к вопросу о способе реализации системы. Специализированная база данных содержит таблицы с данными и реализацию некоторых базовых алгоритмов поиска. Алгоритмы запрограммированы в виде хранимых процедур на внутреннем языке базы данных. В силу математической сложности задачи и необходимости находить маршруты в реальном времени в БД организованы специальные методы оптимизации, позволяющие ускорить нахождение решения.
Рис. 2. Архитектура системы «Маршруты!
Подготовка географических данных для системы проводится с помощью разработанных программ, которые сохраняют результаты в файлы формата XML. Для каждого региона может быть создан отдельный XML-файл, где указано расположение местных транспортных узлов. Это позволяет по частям описать все фрагменты железнодорожной сети. После того как географические данные подготовлены в промежуточном формате, они загружаются в систему с помощью программы импорта. Программа импорта анализирует промежуточные данные, а затем вносит изменения в основную базу данных системы. Процесс импорта состоит из нескольких шагов: считывание данных из файла, их анализ, устранение неоднозначностей, формирование объектной структуры, сохранение данных. Текущая база данных построена из большого числа фрагментов и образует граф из тридцати тысяч вершин. В нее вошло большинство железнодорожных станций, вокзалов, платформ на терри-
Маршрут проезда Калининград - Новороссийск на 26 сентября
Рис. 1. Результат поиска маршрута Калининград—Новороссийск
ЛОГИСТИКА •
Рис. 3. Схема автобусного сообщения г. Владивосток
тории Российской Федерации, ближнего и дальнего зарубежья, автовокзалы некоторых регионов и аэропорты стран СНГ. В процессе импорта расписаний из внешних систем БД специальным образом обновляется, расписания сохраняются в оптимизированном внутреннем формате.
В силу сложности задачи даже использования оптимизации на уровне базы данных оказывается недостаточно для быстрого нахождения решения. Почти всегда количество найденных маршрутов оказывается чрезмерно большим. Поэтому в отдельном модуле поиска реализованы эвристические методы, которые сокращают область поиска, учитывают специфические параметры и выбирают оптимальные маршруты по заданным критериям.
После того как найдены несколько лучших маршрутов, необходимо проверить их актуальность во внешних автоматизированных системах. Это необходимо, так как на рейс может не быть свободных мест или он был отменен. Поскольку отклик от внешних систем обычно требует много времени, то проверка маршрута реализована асинхронно. Пользователю сразу отображаются найденные маршруты, а после получения точных данных о стоимости и наличии мест, они подгружаются в справку. В целях ускорения сначала производится поиск данных в кэше выполненных запросов. В кэш попадают результаты предыдущих запросов к внешним системам, которые сохраняются там некоторое время. Если данные не найдены в кэше, подсистема отправляет запрос во внешние автоматизированные системы.
Внедрение разработанной системы позволит резко повысить качество информационного обслуживания пассажиров и оптимизировать пассажиропотоки. Полномасштабное внедрение единой справочной системы — сложная задача как в техническом, так и в организационном плане. Кроме того, несмотря на очевидную актуальность системы, на пути ее внедрения встает резонный вопрос о финансировании этого социально значимого проекта.
Интерес к системе «Маршруты» уже проявило руководство ОАО «РЖД». На сайте компании началась опытная эксплуатация системы, и пассажиры могут находить маршруты с пересадками на дальних поездах. В настоящее время «РЖД» проводит информатизацию пригородных перевозок по всей России. В планах компании — объединить в системе «Маршруты» информа-
цию о дальних и пригородных пассажирских перевозках.
Отношение бизнес-собщества к системе неоднозначно. С одной стороны, проект интересен инвесторам, с другой, их пугают организационные риски, связанные с актуализацией информации о расписаниях. Данные о расписаниях обычно находятся под контролем полугосударственных предприятий транспорта, которые с трудом принимают инновационные технологии. И в то время, как в Европе транспортные компании платят деньги, чтобы опубликовать свои маршруты в информационных системах, в России происходит с точностью наоборот. Некоторые автотранспортные компании на просьбу предоставить данные о расписании своих пассажирских рейсов сразу спрашивают: «А сколько вы нам за это заплатите?» — хотя очевидно, что размещение информации о рейсах — это реклама для перевозчика. Так, на авиационном сообщении, где существует конкуренция, открытый доступ к расписаниям является хорошим тоном. «Аэрофлот» в открытом доступе предоставляет подробную информацию, как бесплатно получить доступ к актуальным расписаниям авиакомпании и разместить их на любом сайте. В то же время у региональных автобусных перевозчиков конкуренции практически нет, поэтому и нет стимула для повышения качества обслуживания пассажиров. Например, на предложение подключить некую автобусную компанию к
информационной системе мы получили ответ: «Зачем нам это нужно? Если пассажирам нужно будет ехать, они все самостоятельно выяснят».
Решением данной проблемы мог бы стать закон, обязывающий крупнейшие предприятия на транспорте публиковать в Интернете расписания в стандартизованном формате.
В последнее время выражение «интермодальные перевозки» стало очень модным, а руководство страны говорит о поддержке инноваций. Информационная система «Маршруты» — это эффективное средство для реального развития интермодальных перевозок. Но без помощи Министерства Транспорта создать всеобъемлющую информационную систему на российских просторах вряд ли получится. А ведь интеграция разных видов транспорта и внедрение системы «Маршруты» могло бы стать «инновацией номер один» на пассажирском транспорте России.
Литература
1. A timetable information system by HaCon Ingenieurgesellschaft mbH, Hannover, Germany. — www.hacon.de/hafas.
2. Железов Р. В. Новые технологии справоч-но-информационного обслуживания пассажиров // Железнодорожный транспорт. — 2008. — № 8. — С. 34-36.
3. Вишневский В. М., Железов Р. В. Принципы построения и реализация автоматизированной информационно-справочной системы поиска оптимальных путей проезда на пассажирском транспорте // Проблемы Управления. — 2009. — № 1. — С. 33-37.