Автоматизация процесса инженерного анализа данных систем
городского транспорта
С.А. Яркое Тюменский индустриальный университет
Аннотация: В статье рассмотрена автоматизация процесса инженерного анализа данных систем городского транспорта с использованием свободно распространяемого инструментального средства машинного обучения КММЕ. Разработан реальный пример алгоритма первичной автоматизированной обработки данных о транзакциях пассажиров общественного транспорта. Результаты могут быть преобразованы в аналитический отчет. Преимуществом предлагаемого решения является то, что оно может быть реализовано предприятиями городского транспорта без программного кода и дополнительных затрат. Ключевые слова: система городского транспорта, KNIME, анализ данных, транзакции, пассажир, автоматизация процесса исследования.
Автоматизация анализа данных - актуальная научно-практическая задача для разных отраслей [1, 2]. В работе рассматривается автоматизация инженерного анализа с использованием свободно распространяемого инструментального средства машинного обучения КЖМЕ [3, 4] на примере исследования данных систем городского транспорта.
Цель исследования - использование инструментального средства машинного обучения К№МЕ для автоматизации инженерного анализа данных на примере исследования данных систем городского транспорта.
Объект исследования - данные системы городского транспорта.
Предмет исследования - транзакции оплаты за проезд пассажиров в общественном транспорте.
Гипотеза исследования - с помощью инструментального средства машинного обучения КЖМЕ, исследуя данные транзакций оплаты за проезд пассажиров в общественном транспорте, можно определить временные интервалы с наименьшими и наибольшими пассажиропотоками на маршрутах, а также долю пассажиров, пользующихся общественным транспортом несколько раз в сутки.
В работе анализируются данные транзакций за оплату проезда в городском автобусном транспорте, что является частью инженерного анализа, который осуществляется инженером по транспорту. Транзакции фиксируются автоматизированной системой оплаты проезда за поездку в городском автобусном транспорте. Так, например, в небольшом городе с численностью населения около 100 тыс. чел. за сутки количество транзакций по транспортному предприятию измеряется десятками тысяч (в среднем 55 тысяч транзакций в сутки), эти данные в полной мере можно считать большими данными. На объем перевозимых пассажиров влияет большое количество факторов [5, 6].
По обработанным данным при составлении или корректировке графиков и расписания движения автобусов можно определить время для обеда экипажа автобуса (водителя и кондуктора): когда пассажиропоток максимальный «часы пик» - должно быть максимальное количество автобусов на маршруте, а когда пассажиропотоки минимальны -организуются обеды экипажей автобусов, а также техническое обслуживание и ремонт техники.
При подтверждении гипотезы и реализации расчетов с помощью инструментального средства машинного обучения К№МЕ результаты работы послужат материалом для совершенствования инженерного анализа применительно к сфере городского транспорта. Автоматизация повышает эффективность деятельности предприятия [7]
Благодаря машинному обучению, анализ данных систем городского транспорта может быть существенно упрощен. Так, вместо изнурительных ежедневных расчетов и подготовки отчетов для принятия решений о планировании работы, возможно использовать инструментальное средство машинного обучения, например, KNIME [8 - 10]. Таким образом, в программу закладывается алгоритм самостоятельного нахождения
инженерных решений путём комплексного использования статистических данных, на основе которых делаются прогнозы, основной инженерной задачей в данном случае является - задача выявления аномалий. Например, выявление пиковых и минимальных нагрузок на систему городского транспорта.
Имея информацию о том, в какой период времени будут пиковые нагрузки на систему городского транспорта, возможно более рационально планировать работу городских маршрутных автобусов, например, принять решение, как задействовать подвижной состав, работающий на маршруте, когда планировать техническое обслуживание и ремонт подвижного состава. В качестве исходных данных используются файлы суточных транзакций xlsx, которые в процессе анализа больших данных по разработанному алгоритму преобразуются в итоговый отчет pdf. Итоговый отчет содержит графические изображения пиковых нагрузок (максимальное количество транзакций в час, которое равняется количеству перевозимых пассажиров) и другую информацию. Данные отчета являются прогнозом на будущий период работы системы городского транспорта.
Процесс получения данных происходит следующим образом: на остановочном пункте пассажир заходит в салон автобуса, а во время движения автобуса до следующей автобусной остановки кондуктор обилечивает пассажира посредством использования кассового терминала, обслуживаемого подрядчиком. Обилечивание происходит по следующим возможным вариантам: наличный способ оплаты, оплата по банковской карте (которая привязана к транспортной карте), оплата по транспортной карте, оплата по льготной транспортной карте, оплата по транспортной карте пенсионера. За сутки количество транзакций по транспортному предприятию измеряется десятками тысяч.
М Инженерный вестник Дона, №11 (2021) ivdon.ru/ru/magazine/arcliive/nl 1у2021/7298
Для удобства обработки исходных данных, в KNIME были введены
условные обозначения данных, пример представлен на рис.1.
Preview File Content Preview with current settings
Q The suggested column types are based on the first 10000 rows only. See 'Advanced Settings' tab.
Rom ID ИГ» Q] Nrout m rout Hflte Q ь ПН ® card ш-
RowO 03,03,2020 10:00:00 3 3 - Гостиный дом — ДОЗ 377 34 ПРОЕЗД ЛЬГОТНИК ?
Rowl ОЗ.. 03.2020 10:00:01 4 4 - Больничный компле... 305 14 ПРОЕЗД НАЛИЧНЫЕ 22
Row2 03.03.2020 10:00:01 4 4 - Больничный компле... 473 14 ПРОЕЗД НАЛИЧНЫЕ 22
Row3 03,03,2020 10:00:01 1 1 - гост, «Нефтехимик.,. 397 14 ПРОЕЗД НАЛИЧНЫЕ 22
Row4 03,03,2020 10:00:02 3 3 - Гостиный дом — ДОЗ 396 34 ПРОЕЗД льготник ?
Row 5 03,03,2020 10:00:04 8 8А -7А икр, (32А дом) .,, 466 14 ПРОЕЗД НАЛИЧНЫЕ 22
Row6 03,03,2020 10:00:04 9 9 - Кремль — гост, «Не,,. 395 34 ПРОЕЗД ЛЬГОТНИК ?
Row7 03,03,2020 10:00:05 1 1 - гост, «Нефтехимик.,. 905 34 ПРОЕЗД ПЕНСИОНЕР ?
RowS 03.03.2020 10:00:06 3 3 - Гостиный дом — ДОЗ 458 34 ПРОЕЗД ПЕНСИОНЕР ?
Row9 03.03.2020 10:00:06 a 8К - 7А икр. (32А дом) ... 958 14 ПРОЕЗД НАЛИЧНЫЕ 22
Row 10 03,03,2020 10:00:08 9 9 - Кремль — гост, «Не,,. 375 34 ПРОЕЗД ПЕНСИОНЕР ?
Row 11 03,03,2020 10:00:11 4 4 - Больничный компле,,. 305 14 ПРОЕЗД НАЛИЧНЫЕ 22
Row 12 03,03,2020 10:00:11 1 1 - гост, «Нефтехимик.,. 323 14 ПРОЕЗД НАЛИЧНЫЕ 22
Row 13 03,03,2020 10:00:12 3 3 - Гостиный дом — ДОЗ 901 34 ПРОЕЗД ЛЬГОТНИК ?
Row 14 03,03,2020 10:00:13 8 8К - 7А икр, (32А дом) .,, 958 34 ПРОЕЗД ПЕНСИОНЕР ?
< >
Рис. 1. - Работа с узлом "Excel Reader" в KNIME
Й Инженерный вестник Дона, №11 (2021) ivdon.ru/ru/magazine/arcliive/nl 1у2021/7298
Алгоритм автоматизированной подготовки данных будет выглядеть
следующим образом (рис.2):
Рис. 2. - Пример алгоритма рабочего процесса обработки данных в К№МЕ
В качестве вывода следует отметить, что итоговый отчёт по проанализированным данным может содержать:
- графические изображения пиковых нагрузок (максимальное количество транзакций в час, которое равняется количеству перевозимых пассажиров) по одному автобусу выбранного маршрута;
- графические изображения пиковых нагрузок (максимальное количество транзакций в час, которое равняется количеству перевозимых пассажиров) по всем автобусам маршрута;
- заключение о прогнозе пиковых нагрузок на систему городского транспорта и предлагаемые инженерные решения для любого маршрута;
- количество пассажиров (оплачивающих проезд самостоятельно), пользующихся городским общественным транспортом два и более раз в сутки;
- другую информацию (при необходимости).
Литература
1. Заруцкий С.А., Власенко Е.А. Автоматизация анализа данных экспериментальных исследований // Инженерный вестник Дона, 2018, № 1. URL: ivdon.ru/ru/magazine/archive/n1y2018/4753.
2. Ярков С. А. Методические основы для автоматизации рабочего места инженера по транспорту в условиях севера // Инженерный вестник Дона,
2019, №9. URL: ivdon.ru/ru/magazine/archive/N9y2019/6169.
3. Сардарова М.Д. Обзор аналитической платформы KNIME // Молодежный научно-технический вестник, 2015, №6. С.15.
4. Груданов, Н.А. Обзор инструментальных средств для анализа данных // Colloquium-journal. 2020. № 16-1(68). С. 35-41.
5. Петров, А.И. Особенности функционирования городского общественного транспорта в переменных условиях внешней среды. Тюмень: Тюменский индустриальный университет, 2016. 176 с.
6. Свистунова, В.А. Формирование объемов перевозок городским пассажирским общественным транспортом под влиянием условий внешней среды // Международная научно-практическая конференция студентов, аспирантов и молодых учёных «Проблемы функционирования систем транспорта». Тюмень: Тюменский индустриальный университет, 2016. С. 317-320.
7. Иванов, П.А. Автоматизация предприятия с помощью базы данных // Международная научно-практическая конференция «Современная научная мысль». Чебоксары: НЧУ ДПО "Экспертно-методический центр", 2017. - С. 157-166.
8. Lumley J.A., Wilkin T., Hirst M., Sharman G., Cobas C., Goebel M. A KNIME workflow for automated structure verification // SLAS Discovery.
2020. Т. 25. № 8. pp. 950-956.
9. Виноградов, В. И., Раскатов И.А. Построение моделей анализа данных средствами среды Knime // Международная конференция по вычислительной механике и современным прикладным программным системам. Алушта: Московский авиационный институт (национальный исследовательский университет), 2019. С. 139-140.
10. Гурьева Т. Н. Возможности аналитической платформы KNIME // Международная научно-практическая конференция «Государство и бизнес. Современные тенденции и проблемы развития экономики». Санкт-Петербург: Северо-Западный институт управления - филиал РАНХиГС, 2021. С. 191-199.
References
1. Zarutskiy S.A., Vlasenko E.A. Inzhenernyj vestnik Dona, 2018, № 1. URL: ivdon.ru/ru/magazine/archive/n1y2018/4753.
2. Iarkov S.A. Inzhenernyj vestnik Dona, 2019, №9. URL: ivdon.ru/ru/magazine/archive/N9y2019/6169.
3. Sardarova M.D. Molodezhnyy nauchno-tekhnicheskiy vestnik, 2015, №6.
P.15.
4. Grudanov, N.A. Colloquium-journal. 2020. № 16-1(68). pp. 35-41.
5. Petrov, A.I. Osobennosti funktsionirovaniya gorodskogo obshchestvennogo transporta v peremennykh usloviyakh vneshney sredy [Features of the functioning of urban public transport in variable environmental conditions]. Tyumen: Industrial University of Tyumen, 2016. 176 p.
6. Svistunova, V.A. Mezhdunarodnaya nauchno-prakticheskaya konferentsiya studentov, aspirantov i molodykh uchenykh «Problemy funktsionirovaniya sistem transporta» (Proc. International scientific and practical conference of students, postgraduates and young scientists "Problems of functioning of transport systems"). Tyumen, 2016. pp. 317-320.
7. Ivanov, P.A. Mezhdunarodnaya nauchno-prakticheskaya konferentsiya «Sovremennaya nauchnaya mysl'» (Proc. International Scientific and Practical Conference "Modern Scientific Thought"). Cheboksary, 2017. - pp. 157-166.
8. Lumley J.A., Wilkin T., Hirst M., Sharman G., Cobas C., Goebel M. SLAS Discovery. 2020. T. 25. № 8. pp. 950-956.
9. Vinogradov, V. I., Raskatov I.A. Mezhdunarodnaya konferentsiya po vychislitel'noy mekhanike i sovremennym prikladnym programmnym sistemam (Proc. International Conference on Computational Mechanics and Modern Applied Software Systems.). Alushta, 2019. pp. 139-140.
10. Gur'eva T. N. Mezhdunarodnaya nauchno-prakticheskaya konferentsiya «Gosudarstvo i biznes. Sovremennye tendentsii i problemy razvitiya ekonomiki» (Proc. International Scientific and Practical conference "State and Business. Current trends and problems of economic development"). Sankt-Peterburg, 2021. pp. 191-199.