Научная статья на тему 'О МЕТОДЕ СБОРА И ОБРАБОТКИ ДАННЫХ О ПАССАЖИРОПОТОКАХ ГОРОДСКОГО ОБЩЕСТВЕННОГО ТРАНСПОРТА'

О МЕТОДЕ СБОРА И ОБРАБОТКИ ДАННЫХ О ПАССАЖИРОПОТОКАХ ГОРОДСКОГО ОБЩЕСТВЕННОГО ТРАНСПОРТА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
221
46
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОБРАБОТКА ДАННЫХ / МЕТОДЫ СБОРА ДАННЫХ / МОДЕЛИРОВАНИЕ ДАННЫХ О ТРАНСПОРТНЫХ КОРРЕСПОНДЕНЦИЯХ / ПАТТЕРНЫ ТРАНСПОРТНОГО ПОВЕДЕНИЯ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Огар Татьяна Петровна

Предложен метод сбора и обработки данных о пассажиропотоках в системе городского пассажирского общественного транспорта, позволяющий подготовить репрезентативную выборку данных для проведения моделирования транспортных процессов пассажирского общественного транспорта и получения адекватных результатов моделирования корреспонденций пассажиропотоков различных категорий (рабочие, студенты, школьники и пенсионеры). Рассмотрен пример применения метода при проведении моделирования работы системы городского пассажирского транспорта г. Волгоград. Коэффициент корреляции между результатами моделирования и отчетными данными равен 0,97, что позволяет сделать заключение о приемлемой адекватности предлагаемого метода.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Огар Татьяна Петровна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ABOUT THE METHOD OF COLLECTING AND PROCESSING PASSENGER TRAFFIC DATA OF URBAN PUBLIC TRANSPORT

A method of collecting and processing data on passenger traffic in the urban passenger public transport system is proposed. The method allows to prepare a representative sample of data for modeling passenger public transport processes and obtaining adequate results of modeling passenger traffic correspondence of various categories (workers, students, schoolchildren and pensioners). An example of the application of the method in modeling the operation of the urban passenger transport system in Volgograd is considered. The correlation coefficient between the simulation results and the reporting data is 0.97, which allows us to conclude that the proposed method is acceptable.

Текст научной работы на тему «О МЕТОДЕ СБОРА И ОБРАБОТКИ ДАННЫХ О ПАССАЖИРОПОТОКАХ ГОРОДСКОГО ОБЩЕСТВЕННОГО ТРАНСПОРТА»

УДК 004.02

DOI: 10.24412/2071-6168-2023-1-375-379

О МЕТОДЕ СБОРА И ОБРАБОТКИ ДАННЫХ О ПАССАЖИРОПОТОКАХ ГОРОДСКОГО

ОБЩЕСТВЕННОГО ТРАНСПОРТА

Т.П. Огар

Предложен метод сбора и обработки данных о пассажиропотоках в системе городского пассажирского общественного транспорта, позволяющий подготовить репрезентативную выборку данных для проведения моделирования транспортных процессов пассажирского общественного транспорта и получения адекватных результатов моделирования корреспонденций пассажиропотоков различных категорий (рабочие, студенты, школьники и пенсионеры). Рассмотрен пример применения метода при проведении моделирования работы системы городского пассажирского транспорта г. Волгоград. Коэффициент корреляции между результатами моделирования и отчетными данными равен 0,97, что позволяет сделать заключение о приемлемой адекватности предлагаемого метода.

Ключевые слова: обработка данных, методы сбора данных, моделирование данных о транспортных корреспонденциях, паттерны транспортного поведения.

Для решения задач управления общественным транспортом на современном этапе используются средства компьютерного моделирования, которые позволяют имитировать движения пассажиропотоков общественного транспорта. Проведение имитационного моделирования работы системы городского пассажирского общественного транспорта (далее - СГПОТ) сопряжено с рядом проблем, связанных с получением и обработкой исходных данных: разнородность, большой объем, наличие пропусков. Подобные проблемы связаны с отсутствием единого механизма обследования пассажиропотоков для различных городов, имеющих различия в инфраструктуре и способах организации СГПОТ.

Среди общепризнанных методов обследования пассажиропотоков [1,2] собрать полную картину данных возможно только при проведении систематического сплошного талонного обследования. Талонный метод предполагает расположение лиц, участвующих в исследовании непосредственно в транспортных средствах и заполнении данных о каждой корреспонденции пассажиров (начальная и конечная остановки, время входа и выхода). Данная процедура требует больших финансовых и трудовых затрат, поэтому применяется крайне редко для исследований в области транспортного обслуживания населения.

Автором статьи предлагается метод сбора и обработки данных о пассажиропотоках в системе городского пассажирского транспорта, который позволит подготовить репрезентативную выборку данных для проведения моделирования транспортных процессов пассажирского общественного транспорта и получения адекватных результатов моделирования корреспонденций пассажиропотоков различных категорий (рабочие, студенты, школьники и пенсионеры).

Суть предлагаемого метода состоит в выполнении следующих шагов:

- обработка статистических данных транспортных предприятий;

- визуальный анализ карты местности;

- построение изохронограммы города;

- сбор данных о предпочтительных корреспонденциях по районам для пассажиров.

Источниками данных выступают: статистическая информация о работе пассажирских транспортных компаний (далее - ПТК), картографические данные из открытых источников, результаты работы экспертной группы, непосредственно, сами пассажиры СГПОТ.

Обязательными требованиями к исходным данным являются:

- наличие полных данных о: маршрутной карте всех видов общественного транспорта, карте остановочных пунктов;

- статистическая информация о работе ПТК (в том числе и финансовая) должна содержать данные, как минимум, за три года;

- объем данных не может быть меньше расчетного значения для каждой конкретной СГПОТ (формулы 1,6);

- данные о перемещении пассажиров могут быть получены любым из методов обследования пассажиропотоков [1,2], но при наличии в СГПОТ специализированных технических средств (фиксаторы количества входящих пассажиров, смарт-карты и пр.), предпочтение отдается автоматизированным методам.

Далее рассмотрим каждый из шагов метода более подробно.

Шаг 1. Обработка статистических данных ПТК. На данном шаге составляется выборка данных ПТК о: подвижном составе, обслуживаемых маршрутах, динамике перевозки пассажиров, финансовых затратах и выручке.

Минимальный объем выборки Уп, обеспечивающий достаточную репрезентативность определяется по формуле (1):

К = (1)

где к2 - ошибка репрезентативности выборки; и(1 — и) - степень вариации распределения; Д - предельная допустимая ошибка репрезентативности выборки.

Шаг 2. Визуальный анализ карты местности. Данный шаг метода предполагает расчет плотности распределения населения города и выставление экспертных оценок привлекательности остановок общественного транспорта для пассажиров.

Для расчета количества жителей, являющихся потенциальными пассажирами каждого остановочного пункта предварительно карта города разбивается на тайлы одинакового размера в координатной системе иТМ. Далее на основе открытых данных о жилых постройках населенного пункта (площадь, адрес, количество этажей) и собранных рабочей группой данных о типах жилых построек (в зависимости от числа квартир) вычисляется количество жителей каждого тайла. Подробнее алгоритм расчета представлен в работе [3].

Оценка плотности населения, проживающего рядом с каждой остановкой города определяется по формуле (2):

= 7Гшi, (2)

где P_ta.il - количество жителей тайла; Ns_ta.il - количество остановок в пределах выбранного тайла.

При выполнении визуального анализа карты местности каждой остановке выставляется оценка привлекательности для пассажиров. Для этого по методу экспертных оценок Дельфи каждый эксперт / определяет баллы привлекательности всех объектов ИоЬ^, расположенных в пределах остановки] (до 300 м), руководствуясь значимостью объекта в пределах тайла и всего города. На основе выставленных оценок вычисляется среднее значение привлекательности остановки по формуле (3):

= %Ъ]=0*ОЧ (3)

' поЬ;

где поЬ] - количество объектов, расположенных вблизи остановки.

По каждой j-й остановке определяется средний балл привлекательности среди оценок, выставленных экспертами по формуле (4):

упе

и = (4)

1 пе

где пе — общее число экспертов. Границы баллов привлекательности остановок находятся в пределах от 0 до 1000 (с шагом 50).

Особенностью проведения экспертного анализа является учет наборов паттернов транспортного поведения пассажиров (далее - НПТПП). Экспертные оценки выставляются в соответствии с заранее обозначенными НПТПП для рассматриваемого населенного пункта. Примерами НПТПП могут служить особенности корреспонденций пассажиропотоков в разные сезоны года, при проведении городских мероприятий и пр.

Далее все остановки маршрутной сети СГПОТ ранжируются и классифицируются по пяти категориям в зависимости от рассчитанной средней оценки привлекательности. Для каждой категории привлекательности задана вероятность генерации остановки назначения, входящей в нее (табл. 1).

Таблица1

Категории привлекательности остановок

Категория остановок Граница привлекательности Вероятность выбора

1 100 0,01

2 250 0,1

3 400 0,3

4 600 0,4

5 1000 0,5

Данное распределение вероятностей используется в модели данных о транспортных корре-спонденциях пассажиров между остановками городского наземного общественного транспорта, предложенной автором [4].

Шаг 3. Построение изохронограммы города. Изохронограмма представляет собой совокупность всех изохрон [5], построенных от объектов городской инфраструктуры по маршрутной карте сети городского пассажирского общественного транспорта. Для составления изохрон используется метод поиска в ширину. Вершины графа соответствуют остановочным пунктам СГПОТ и основным объектам инфраструктуры [6], дуги графа соответствуют маршрутам транспортной сети. Вес каждой дуги равен времени, затрачиваемому на перемещение между вершинами. Время пешеходного пути между объектами инфраструктуры и остановками общественного транспорта и среднее время перемещения транспорт-

ных средств по участкам маршрутов вычисляется на основе открытых данных о скорости передвижения на выбранных фрагментах карты города. Каждая изохрона ограничена интервалом времени 15/30 минут. При этом, временные затраты пассажира на перемещение из точки А в точку Б складываются из ряда показателей по формуле (5):

Т = Ьс + 1ш + 1а + Ь1, (5)

где - время подхода пассажира к остановке; - время ожидания транспортного средства; - время перемещения транспортного средства от остановки отправления А до остановки прибытия Б; - время пешеходного пути до пункта назначения.

Изохронограмма города позволяет выявить «узкие» места транспортной сети, в которых пассажиры не могут достичь значимых объектов городской инфраструктуры (крупных торговых центров/ больниц/ учебных заведений и т.п.). Устранить подобные отклонения можно, минимизируя один или несколько описанных в формуле (5) показателей временных затрат.

Шаг 4. Сбор данных о предпочтительных корреспонденциях по районам для пассажиров. Данный шаг можно осуществить с помощью различных методов обследования пассажиропотока (в зависимости от технического оснащения сети городского пассажирского общественного транспорта):

- Анкетирование жителей по вопросам пользования общественным транспортом;

- Автоматизированные методы;

- Натурное наблюдение.

При сборе данных необходимо разделять их в зависимости от категории граждан: работающее население, студенты, школьники, пенсионеры, безработные граждане. Подобное разбиение необходимо для выявления паттернов транспортного поведения пассажиров, существующих в исследуемом городе. Для обеспечения репрезентативности объем выборки данных по каждой категории не должен быть меньше А1 (6):

ТЦ=1А1= 1,20£?=1Лг Рп1 , (6)

где А1 - общее количество пассажиров, необходимое для обследования транспортной подвижности 1-й категории граждан; - общая численность 1-й категории граждан; Рп1 - доля выборочного анализа 1-й категории граждан (от ); п - число категорий граждан, подлежащих анализу; 1,20 - 20%-процентный резерв исследуемых пассажиров [7].

При сборе данных о предпочтительных корреспонденциях формируемая выборка должна содержать информацию о: районе отправления и назначения, используемом виде транспорта, примерном времени, в которое совершаются поездки.

По результатам обработки данных рассмотренного шага составляются матрицы коэффициентов корреспонденций пассажиропотоков по районам города. Для каждой категории пассажиров строится 3 матрицы в зависимости от интервалов рабочего дня tpг (7) сети общественного транспорта (утро/день/вечер):

^ =

£й0;10:59 11:00; 15:59 16:00;^

(7)

где - начальный час работы сети общественного транспорта; С/у - час окончания работы сети общественного транспорта.

Полученные матрицы позволяют рассчитать корреспонденции пассажиров между остановками общественного транспорта с соблюдением баланса передвижений пассажиров между районами исследуемого города.

Результатом работы предложенного метода будет являться неструктурированная база данных, содержащая информацию о пассажиропотоках и других элементах СГПОТ, необходимую для проведения моделирования работы системы в рассматриваемом городе. Также с помощью данного метода формируются матрицы коэффициентов корреспонденций, отражающие основные НПТПП различных категорий пассажиров. Данные матрицы необходимы для генерации остановок назначения пассажиров в модели [4].

Рассмотрим пример матрицы коэффициентов корреспонденций пассажиров для г. Волгоград. По результатам обследования пассажиропотоков выявлены однотипные паттерны транспортного поведения пассажиров категорий «работающее население» и «студенты» для утреннего периода рабочего дня (06:00 - 11:00). Преимущественно корреспонденции обеих категорий направлены в центральный район (район №8). Корреспонденции горожан от остановок центрального района направлены в 50% случаев к остановкам того же района. Распределение коэффициентов корреспонденций пассажиропотоков между административными районами города для данного примера представлено в табл. 2:

Данные, полученные в ходе применения метода сбора и обработки данных о пассажиропотоках СГПОТ г. Волгограда, использованы в качестве исходных для модели данных о транспортных корре-спонденциях (далее - Модели), подробно описанной в [4]. На рисунке представлено распределение кор-

респонденций жителей по районам г. Волгоград, полученное в результате работы Модели. Рассмотрены корреспонденции категорий пассажиров «работающее население» и «студенты» в пределах интервала рабочего дня ¿р0 (с 06:00 до 10:59).

Таблица 2

Пример матрицы коэффициентов корреспонденций пассажиропотоков

для укрупненной категории пассажиров «Рабочие и студенты»_

Номера районов Район 1 Район 2 Район 3 Район 4 Район 5 Район 6 Район 7 Район 8

Район 1 0,2 0,08 0,08 0,08 0,08 0,08 0,08 0,32

Район 2 0,08 0,2 0,08 0,08 0,08 0,08 0,08 0,32

Район 3 0,08 0,08 0,2 0,08 0,08 0,08 0,08 0,32

Район 4 0,08 0,08 0,08 0,2 0,08 0,08 0,08 0,32

Район 5 0,08 0,08 0,08 0,08 0,2 0,08 0,08 0,32

Район 6 0,08 0,08 0,08 0,08 0,08 0,2 0,08 0,32

Район 7 0,08 0,08 0,08 0,08 0,08 0,08 0,2 0,32

Район 8 0,07 0,07 0,07 0,07 0,07 0,07 0,07 0,51

O.OS

■ Район! ■ Район 2 ■ Район 3 ■ Район 4

■ Район S ■ Район 6 ■ Район 7 Районе

Распределение корреспонденций пассажиров категорий «работающее население» и «студенты»

Суммарное число корреспонденций, рассчитанное с помощью данной модели, отличается на 2,2% от отчетных данных, полученных в ходе выполнения хоздоговорных работ, выполненных по заказу администрации и транспортных предприятий города в 2017-2018 гг.

Проверка результатов моделирования транспортных корреспонденций с учетом паттернов транспортного поведения пассажиров подробнее описана в [4]. Коэффициент корреляции между данными, полученными при проведении моделирования и данными обследования пассажиропотока г. Волгограда, равен 0,97, что позволяет сделать заключение о приемлемой адекватности предлагаемого метода.

Предлагаемый автором метод сбора и обработки данных о пассажиропотоках позволяет оценить особенности транспортного поведения пассажиров СГПОТ с разных сторон и получить данные для разработки модели данных о транспортных корреспонденциях, учитывающей различия в перемещениях пассажиропотоков различных категорий [4]. Данный метод позволяет выявить паттерны транспортного поведения пассажиров, присущие рассматриваемому городу, что дает возможность создания универсальной модели данных о транспортных корреспонденциях пассажиров различных городов, независимо от особенностей инфраструктуры. При проведении моделирования требуется изменение входных параметров, полученных в результате работы метода, без внесения корректировок в саму модель.

В дальнейшем планируется усовершенствовать предлагаемый метод сбора и обработки данных о пассажиропотоках СГПОТ за счет классификации корреспонденций пассажиров по целям поездки в различные суточные интервалы.

Список литературы

1. Палант А.Ю. Обзор методов обследования пассажиропотоков // БИ. 2014. №11. [Электронный ресурс] URL: https://cvberleninka.rUarticle/n/obzor-metodov-obsledovamva-passazMropotokov (дата обращения: 30.03.2022).

2. Денисов М.В. Обследование транспортного и пассажирского потоков // Известия Тульского государственного университета. Технические науки. 2011. Вып. 3. С. 509-516. EDN PVJTZF.

3. Analysis of the Reachability of Stops in the Route Network of Urban Passenger Transport / T.P. Ogar, E.G. Krushel, I.V. Stepanchenko [et al.] // Society 5.0: Human-Centered Society Challenges and Solutions. - Cham : Springer, 2022. P. 287-299. DOI 10.1007/978-3-030-95112-2_24. EDN SWSUKQ.

4. Krushel E., Stepanchenko I., Panfilov A., Lyutaya t. Detection of the patterns in the daily route choices of the urban social transport system clients based on the decoupling of passengers' preferences between the levels of uncertainty // Communications in Computer and Information Science, 2019. Vol. 1083. P. 175-188. DOI 10.1007/978-3-030-29743-5_14.

5. Ван Хунбо, Ли Пэнфэй, Сюэ Юаньюань, Коровкин Максим Васильевич Построение маршрута с помощью улучшенного метода изохрон при минимизации времени плавания и с учетом прогноза погоды // Вестник СПбГУ. Серия 10. Прикладная математика. Информатика. Процессы управления. 2017. №3.

6. Пышный В.А. Моделирование загрузки транспортной сети // Известия Тульского государственного университета. Технические науки. 2012. Вып. 2. С. 457-473. EDN PSWIMJ.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7. Михайлов А.Ю., Тарханова Н.В., Яценко С.А. Методические рекомендации по проведению обследования транспортной подвижности льготных категорий населения анкетным методом // Вестник ИрГТУ. 2013. №12 (83). [Электронный ресурс] URL: https://cYberleninka.ru/artirie/n/metodicheskie-rekomendatsii-po-provedemYu-obsledovamYa-transportnoY-podvizhnosti-lgotaYh-kategoriY-naseleniYa-anketrnm-metodom (дата обращения: 10.10.2022).

Огар Татьяна Петровна, старший преподаватель, ogar@kti.ru, Россия, Камышин, Камышин-ский технологический институт (филиал) Волгоградского государственного технического университета,

Научный руководитель: Степанченко Илья Викторович, д-р техн. наук, доцент, директор, stilvi@mail.ru, Россия, Камышин, Камышинский технологический институт (филиал) Волгоградского государственного технического университета

ABOUT THE METHOD OF COLLECTING AND PROCESSING PASSENGER TRAFFIC DATA OF URBAN

PUBLIC TRANSPORT

T.P. Ogar

A method of collecting and processing data on passenger traffic in the urban passenger public transport system is proposed. The method allows to prepare a representative sample of data for modeling passenger public transport processes and obtaining adequate results of modeling passenger traffic correspondence of various categories (workers, students, schoolchildren and pensioners). An example of the application of the method in modeling the operation of the urban passenger transport system in Volgograd is considered. The correlation coefficient between the simulation results and the reporting data is 0.97, which allows us to conclude that the proposed method is acceptable.

Key words: data processing, data collection methods, modeling of transport correspondence data, patterns of transport behavior.

Ogar Tatyana Petrovna, senior lecturer, ogar@kti.ru, Russia, Kamyshin, Kamyshin Technological Institute (branch of) Volgograd State Technical University,

Stepanchenko Ilya Victorovich, doctor of technical sciences, docent, director, stilvi@mail.ru, Russia, Kamyshin, Kamyshin Technological Institute (branch of) Volgograd State Technical University

УДК 336.71:004.056

DOI: 10.24412/2071-6168-2023-1-379-387

МЕТОД ПРОГНОЗИРОВАНИЯ ДИНАМИКИ РАСПРОСТРАНЕНИЯ ДЕСТРУКТИВНОЙ ИНФОРМАЦИИ В СОЦИАЛЬНЫХ ИНТЕРНЕТ-СЕРВИСАХ НА ОСНОВЕ КОНТЕНТ-АНАЛИЗА

В.В. Тельбух, А.В. Десятых, И.И. Захарчук, В.А. Пирухин

Предложен метод прогнозирования динамики распространения информации и запросов на него по данным контент-анализа сообщений в социальных Интернет-сервисах. Применение метрики самоподобия позволило выявить постоянную составляющую контент-функции и установить ее природу. Внедрение метода в систему обеспечения информационной безопасности Российской Федерации позволит повысить эффективность системы управления и принятия решений в аспекте выработки необходимых механизмов информационных противодействий.

Ключевые слова: социальный Интернет-сервис, акторы сети, контент-анализ, деструктивное информационное воздействие, показатель Херста, информационная безопасность, прогнозирование, синергетическое управление.

Актуальность. В настоящее время социальные Интернет-ресурсы (СИР) используются населением не только для обмена информацией, но и в качестве источника информации о различных событиях, возникающих в обществе и государстве [1, 2]. Более 80% населения Российской Федерации (РФ)

i Надоели баннеры? Вы всегда можете отключить рекламу.