Научная статья
УДК 519.23 + 656.7
DOI 10.35266/1999-7604-2023 -1 -36-42
РАЗРАБОТКА РЕГРЕССИОННОЙ МОДЕЛИ ПАССАЖИРООБОРОТА ВОЗДУШНОГО ТРАНСПОРТА РОССИЙСКОЙ ФЕДЕРАЦИИ ДВУМЯ АЛЬТЕРНАТИВНЫМИ МЕТОДАМИ
Сергей Иванович Носков1, Юрий Александрович Бычков Карина Сергеевна Перфильева 3
12 3 Иркутский государственный университет путей сообщения, Иркутск, Россия
1 [email protected], https://orcid.org/0000-0003-4097-2720
2 [email protected] в, https://orcid.org/0000-0002-7243-8445
Аннотация. Описана математическая модель регрессионного типа пассажирооборота воздушного транспорта Российской Федерации. В качестве независимых переменных используются: средняя стоимость полета в салоне экономического класса самолета в расчете на 1 000 км, среднемесячная номинальная начисленная заработная плата работников по полному кругу организаций, средний тариф на проезд в плацкартном вагоне скорого нефирменного поезда дальнего следования в расчете на 100 км пути, численность трудоспособного населения. Идентификация параметров модели производится с помощью двух альтернативных методов регрессионного анализа - смешанного оценивания и максимальной согласованности между расчетными и фактическими значениями выходной переменной. Построенные варианты модели вполне соответствуют содержательному смыслу входящих в их состав независимых переменных и обладают высокой точностью. Выбор одной из них для решения стоящих перед исследователем задач должен определяться их характером, а именно, либо стремлением минимизировать расхождения между прогнозными и реальными значениями пассажирооборота в будущем периоде, либо желанием с возможно большей точностью выявить будущие тенденции в динамике этого показателя.
Ключевые слова: регрессионный анализ, метод смешанного оценивания, непрерывная форма метода максимальной согласованности, авиационные перевозки
Для цитирования: Носков С. И., Бычков Ю. А., Перфильева К. С. Разработка регрессионной модели пассажирооборота воздушного транспорта Российской Федерации двумя альтернативными методами //Вестник кибернетики. 2023. Т. 22, № 1. С. 36-42. DOI 10.35266/1999-7604-2023-1-36-42.
Original article
DEVELOPING A REGRESSION MODEL OF AIR TRANSPORT PASSENGER TURNOVER IN THE RUSSIAN FEDERATION WITH TWO ALTERNATIVE METHODS
Sergey I. Noskov1, Yuri A. Bychkov Karina S. Perfilyeva 3
12 3 Irkutsk State Transport University, Irkutsk, Russia
1 [email protected], https://orcid.org/0000-0003-4097-2720
2 [email protected] B, https://orcid.org/0000-0002-7243-8445
Abstract. The article describes a regressive mathematical model of passenger turnover in the air transport of the Russian Federation. The following are used as independent variables: the average flight cost in the economy class of an aircraft per 1,000 km, the average monthly nominal accrued wages of employees in a full range of organizations, the average fare for travel in a second-class carriage of an express unbranded long-distance train per 100 km of track, the working population. Model parameters are identified using two
alternative methods of regression analysis: mixed estimation and maximum consistency between the calculated and actual values of the output variable. The constructed versions of the model fully correspond to the content meaning of the independent variables included in their composition and have high accuracy. To solve the problems, the researcher should select one of them according to their features, namely, either the tendency to minimize the disrepancies between the predicted and actual values of passenger traffic in the future or the desire to identify future trends in the indicator's dynamics, possibly, with the greater accuracy.
Keywords: regression analysis, mixed estimation method, continuous form of the maximum consistency method, air transportation
For citation: Noskov S. I., Bychkov Yu. A., Perfilyeva K. S. Developing a Regression Model of Air Transport Passenger Turnover in the Russian Federation with Two Alternative Methods. Proceedings in Cybernetics. 2023. Vol. 22, No. 1. P. 36-42. DOI 10.35266/1999-7604-2023-1-36-42.
ВВЕДЕНИЕ
В современной России весьма велика роль транспорта во всех направлениях его функционирования, включая перевозку пассажиров. Комплексному анализу этого аспекта математическими методами посвящено значительное количество исследований. Так, цель работы [1] состоит в создании математической многокритериальной модели пассажирских перевозок, ее программной реализации и проведении практических расчетов по оптимизации выбора эффективного транспорта для определенного региона транспортной сети. В работах [2, 3] значительное внимание уделяется применению математических методов для моделирования пассажиропотоков. В статье [4] с помощью средств моделирования решена техническая задача определения частоты и формы колебаний кузова, которые оказывают негативное воздействие на организм человека.
При перевозке пассажиров особенно велико значение авиационного транспорта. Именно он обеспечивает более половины пассажиро-оборота в стране [5]. Современная ситуация на рынке отечественных авиаперевозок определяется максимально интенсивным влиянием факторов, формирующихся в большей степени под воздействием внешних обстоятельств. Данной проблематике также уделяется большое внимание. Так, работы [6-9] посвящены построению эконометрических моделей для описания зависимости между объемами пассажирских авиаперевозок в РФ и такими существенными факторами, как население городов и расстояний между ними, взаимосвязи выручки и пассажиропотока. В результате проведенного авторами анализа установ-
лено, что объем пассажирских перевозок не описывается классической гравитационной моделью, а расстояния между городами не влияют на объем перевозок. Также научный интерес вызывают работы [10-11].
МАТЕРИАЛЫ И МЕТОДЫ
Поставим задачу моделирования пассажи-рооборота воздушного транспорта Российской Федерации в зависимости от совокупности влияющих на него факторов. Введем следующие обозначения:
у - пассажирооборот воздушного транспорта, млрд пасс.-км.;
Х1 - средняя стоимость полета в салоне экономического класса самолета в расчете на 1 000 км пути, руб.;
X2 - среднемесячная номинальная начисленная заработная плата работников по полному кругу организаций, руб. ;
xз - средний тариф на проезд в плацкартном вагоне скорого нефирменного поезда дальнего следования в расчете на 100 км пути, руб.;
X4 - численность трудоспособного населения, млн чел.
Приведем краткое обоснование набора независимых переменных. Показатель средней стоимости полета в салоне экономического класса самолета оказывает существенное отрицательное влияние на динамику пассажи-рооборота воздушного транспорта. Действительно, рост цен на авиабилеты неизбежно приводит к выбору потенциальными пассажирами поездок на альтернативных по отношению к воздушным видам транспорта, возможно, более дешевых. Среднемесячная
номинальная начисленная заработная плата работников по полному кругу организаций, напротив, на динамику зависимой переменной влияет положительно, поскольку с увеличением доходов возрастает спрос на более быстрый и комфортный вид транспорта. Включение в модель независимой переменной хэ объясняется тем обстоятельством, что далеко не во всех городах России есть аэропорты. Часть населения, в том числе сельского, вынуждена добираться до близлежащего аэропорта на железнодорожном транспорте. Прямое влияние численности трудоспособного населения в стране на пас-сажирооборот воздушного транспорта не требует развернутых пояснений.
Модель будем строить в форме линейного регрессионного уравнения (модели) со свободным членом [12]:
Ук = ао + ЕГ=1 +£к' к =1 П С1)
где у - зависимая, а х/ - /-я независимая переменные, а - /-й подлежащий оцениванию параметр, Ек - ошибки аппроксимации, к -
номер наблюдения, п - число наблюдений (длина выборки).
В качестве информационной базы модели используем данные официальной статистики за 2002-2019 гг. [13], приведенные в табл.
Таблица
данные
t У X1 X2 X3 X4
2002 64,70 2 244,16 4 360 38,43 88,94
2003 71,10 2 695,73 5 499 41,10 89,85
2004 83,00 2 922,86 6 740 43,93 90,10
2005 85,80 3 507,76 8 555 50,29 90,16
2006 93,90 3 998,90 10 634 56,07 90,06
2007 111,00 4 492,63 13 593 64,03 89,75
2008 122,60 5 890,42 17 290 76,57 89,34
2009 112,50 6 619,40 18 638 90,96 87,98
2010 147,10 6 651,53 20 952 101,13 87,85
2011 166,80 4 181,41 23 369 103,00 87,06
2012 195,80 4 681,25 26 629 110,99 86,14
2013 225,20 4 695,30 29 792 135,99 85,16
2014 241,40 4 774,78 32 495 154,99 85,42
2015 226,80 5 446,44 34 030 170,62 84,20
2016 215,60 5 384,34 36 709 161,77 83,22
2017 259,40 5 158,16 39 167 173,75 82,26
2018 286,90 5 150,01 43 724 169,11 81,36
2019 323,00 5 638,98 47 867 181,86 82,68
Примечание: составлено по [13].
Таким образом, в модели (1) т = 4, п = 18.
Идентификацию параметров а(. , 2 = 0, т
будем производить с помощью метода смешанного оценивания (МСО) [14] и непрерывной формы метода максимальной согласованности (ММС). Рассмотрим их краткое описание.
МСО объединяет в себе некоторые важные свойства методов наименьших модулей (МНМ) и антиробастного оценивания (МАО), а именно их реакцию на выбросы - наблюдения, не согласующиеся с выборкой в целом. Первый их, по существу, игнорирует, второй, напротив,
к ним тяготеет. При этом вся выборка с номерами наблюдений из множества N = {1, 2, ... , п} разбивается на два непересекающиеся подмножества N1 и N2:
N = N^N^N^^=0.
При этом на множестве номеров наблюдений N1 МСО «работает» как МНМ, а на N2 -как МАО.
Существуют различные способы такого разбиения, один из которых основан на исполь-
зовании так называемого критерия смещения, что позволяет добиться определенной представительности множеств N1 и N2 по отношению к проявлению свойств МНМ и МАО.
Формально реализация МСО приводит к решению следующей задачи линейного программирования (ЛП):
ао Г=1 ах + щ - и = Ук,к е
ик + ик - г < 0, к е N, ик > 0, и > 0, к = 1, п,
X кеЩ (ик + ик )/ - + г ^
где ^ - мощность множества N1.
Суть ММС заключается в максимизации согласованности в поведении расчетных ук
и фактических yk значений выходной переменной или, другими словами, в возможно более полном отражении в модели тенденций в функционировании объекта исследования, проявляемых на предыстории (здесь ук =
= а0 + X¡ml аг). Поясним суть такой согласованности на примере. Пусть для произвольных номеров наблюдений ^ и h обрабатываемой выборки справедливо неравенство:
а0 + ЕГ=1 аХ + ик - Ч, к =1,п (4)
ЕГ=1а (х«- х„) + к > 0>к = 1п -15 = к +1 п (5)
щ > 0, ^ > 0, к = 1, и, ^ > 0, к = 1, п -1,. - к+1, п. (6)
Здесь г е (0,1] - заранее назначенное число, устанавливающее сравнительный приоритет (компромисс) в целевой функции (3) между функцией потерь, соответствующей МНМ и уровнем рассогласованности между расчетными и фактическими значениями зависимой
переменной. Числа юь, к = 1, п -1, - = к +1, п в ограничениях (5) задаются по правилу:
1 Ук - У. > 0 -1, Ук - Уs < 0
0, Ук - У. = 0.
Неизвестные переменные ад и vk в задаче ЛП представляют собой положительные и отрицательные части ошибок аппроксимации Ек:
ик 1
Ук - а0 - X аХ' Ук > а0 +X ах
г=1
г=1
0, в противном случае,
(У. - Ук)(Я - Я) < 0.
Это означает, что на паре номеров наблюдений (^ h) модель (1) плохо «объясняет» исследуемый процесс (т. е. поведение фактических и расчетных значений выходной переменной не согласовано на этой паре), что не может быть компенсировано малостью величин | еж и | ек |.
ММС разработан для дискретной и непрерывной форм такой согласованности. Непрерывная форма ММС заключается в решении задачи оптимизации [12]:
*=Х к-1 X
=к+11
•Ш1П,
(2)
7 П Ук - У |, (кк - У.ХА - У ) < 0 где ^ = 1 п
[ 0, в противном случае. Задача (2) сводится к следующей задаче линейного программирования (ЛП):
гХП=1 (ик + V) +(1-гЕ-1 ХП=кЛ- ^ Ш1П' (з)
а0 +Х аЛ - Ук, Ук < а0 +Х аЛ
г=1 г=1
0, в противном случае.
При этом UkVk = 0 для всех k.
РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ
Построим линейную регрессионную модель пассажирооборота воздушного транспорта России с указанными выше независимыми переменными методом смешанного оценивания, используя специализированное программное обеспечение [15]:
у = -177,579 - 0,008x1 + 0,007x2 -
- 0,021x3 + 2,669x4, (7)
Е = 3,81 %.
Здесь Е - средняя относительная ошибка аппроксимации, рассчитываемая по формуле:
Е = 100 % Xп ¿—¡к=1
У к - Ук
Ук
/ п.
Ю- =1
Использование программного комплекса [16] реализации непрерывной формы метода максимальной согласованности привело к построению следующей модели пассажирооборота:
у = -960,896 - 0,014X1 + 0,007X2 +
+ 0,535хз + 11,23X4, (8)
Е = 5,08 %.
Проведем краткий анализ моделей (7) и (8). Прежде всего следует отметить совпадение в них знаков оценок параметров и их соответствие содержательному смыслу независимых переменных. При этом, разумеется, свободный член никакой смысловой нагрузки не несет и выполняет сглаживающую функцию, препятствуя принудительному прохождению гиперплоскости регрессии через начало координат. Обе модели достаточно точно описывают исследуемый объект, на что указывают низкие значения ошибок аппроксимации (рис.). Обращает на себя внимание следующее обстоя-
тельство. Если коэффициенты при переменных Х1, Х2 и хз в моделях (7) и (8) достаточно близки, то значимость переменной Х4 в модели (8) более чем в три раза выше, чем в модели (7). Следовательно, именно таким образом достигается большая согласованность расчетных и фактических значений зависимой переменной.
Поскольку, как правило, регрессионные модели чаще всего применяются при прогнозировании будущего состояния объекта, возникает вопрос о том, какую из них - (7) или (8), -предпочесть в каждом конкретном случае. Ответ на него может быть следующим. Если исследователь стремится минимизировать расхождения между прогнозными и реальными значениями пассажирооборота, то предпочтение следует отдать модели (7). Если же главным при прогнозировании является с возможно большей точностью выявить будущие тенденции в динамике этого показателя, то лучше воспользоваться моделью (8).
350 300 250 200 150 100 50
0 -
2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019
^^—Фактические значения Расчетные значения (МСО) Расчетные значения (ММС)
Рисунок. Фактические и расчетные значения зависимой переменной
Примечание: составлено авторами.
ЗАКЛЮЧЕНИЕ
В работе сформулирована задача моделирования пассажирооборота воздушного транспорта Российской Федерации в зависимости от совокупности влияющих на него факторов с помощью двух альтернативных методов регрессионного анализа - смешанного оценивания параметров и максимальной согласо-
ванности между расчетными и фактическими значениями выходной переменной. Построенные варианты модели вполне соответствуют содержательному смыслу входящих в их состав независимых переменных и обладают высокой точностью. Выбор одной из них для решения стоящих перед исследователем задач должен определяться их характером.
Список источников
1. Прытов А. А. Моделирование и оптимизация пассажирских перевозок в условиях неопределенности // Инновации в гражданской авиации. 2017. Т. 2, № 1. С. 57-63.
2. Антонова В. М., Гречишкина Н. А., Кузнецов Н. А. Анализ результатов моделирования пассажиропотока станции метро в программе AnyLogic // Теория и методы обработки информации. 2018. № 1. С. 35-39.
3. Данилов А. И., Чижиков В. П. Определение количества людей на станциях метрополитена методом моделирования пассажиропотоков // Метро и тоннели. 2022. № 2. С. 28-30.
4. Лукашова Е. В., Лукашов Н. А. Оценка качества перевозок пассажиров с использованием методов математического моделирования // Управление качеством на этапах жизненного цикла технических и технологических систем : сб. науч. тр. 3-й Всерос. науч.-технич. конф., Курск, 28 мая 2021 г. Курск : Юго-Запад. гос. ун-т, 2021. С. 224-226.
5. Транспорт в России // Федеральная служба государственной статистики. URL: https://ros stat.gov.ru/folder/210/document/13229 (дата обращения: 15.02.2023).
6. Варюхина Е. В., Клочков В. В. Экономические механизмы управления безопасностью полетов и авиационной техники // Управление развитием крупномасштабных систем (MLSD'2011) : материалы пятой междунар. конф. Москва, 3-5 октября 2011 г. М. : Ин-т проблем управления им. В. А. Трапезникова РАН, 2011. С. 155-157.
7. Денежкина К. Л., Радковская Е. В. Перспективы восстановления работы аэропортов // Перспективы науки. 2022. № 7. С. 40-44.
8. Рязанов В. А. Пассажиропоток аэропортов России как индикатор социально-экономической динамики регионов страны // Региональные исследования. 2013. № 4. С. 74-79.
9. Мартыненко А. В., Фарносова Я. А., Шеры-шова А. Е. Математическое моделирование пассажирских авиаперевозок // Инновационный транспорт. 2016. № 4. С. 9-14.
10. Банщикова А. А., Базилевский М. П., Тихомиров В. А. Прогнозирование объема пропуска перевозимых на нетяговом подвижном составе крупнотоннажных контейнеров в экспортно -импортном сообщении в направлении РФ -КНР // Современные технологии. Системный анализ. Моделирование. 2017. № 2. С. 185-190.
11. Базилевский М. П., Гефан Г. Д. Проблема автокорреляции остатков регрессии на примере моделирования грузооборота железнодорожного транспорта по данным временных рядов // Современные технологии. Системный анализ. Моделирование. 2016. № 1. С. 141-147.
12. Носков С. И., Бычков Ю. А. Модификация непрерывной формы метода максимальной согласованности при построении линейной регрессии //
References
1. Prytov A. A. Simulation and Optimization of Passenger Transportation in a Context of Uncertainty. Innovation in Civil Aviation. 2017. Vol. 2, No. 1. P. 57-63. (In Russian).
2. Antonova V. M., Grechishkina N. A., Kuznetsov N. A. Analysis of the Modelling Results for Passenger Traffic at an Underground Station Using AnyLogic. Information Processes. 2018. No. 1. P. 35-39. (In Russian).
3. Danilov A. I., Chizhikov V. P. Opredelenie kolich-estva liudei na stantsiiakh metropolitena metodom modelirovaniia passazhiropotokov. Metro i tonneli. 2022. No. 2. P. 28-30. (In Russian).
4. Lukashova E. V., Lukashov N. A. Otsenka kachestva perevozok passazhirov s ispolzovaniem metodov matematicheskogo modelirovaniia. Upravlenie kachestvom na etapakh zhiznennogo tsikla tekhnich-eskikh i tekhnologicheskikh sistem : Proceedings of the 3rd All-Russian Scientific and Engineering Conference, Kursk, May 28, 2021. Kursk : Southwest State University, 2021. P. 224-226. (In Russian).
5. Transport v Rossii. Federal State Statistics Service. URL: https://rosstat.gov.ru/folder/210/document/13229 (accessed: 15.02.2023). (In Russian).
6. Varyukhina E. V., Klochkov V. V. Ekonomicheskie mekhanizmy upravleniia bezopasnostiu poletov i avi-atsionnoi tekhniki. Management of Large-Scale Systems Development (MLSD'2011) : Proceedings of the Fifth International Conference, Moscow, October 3-5, 2011. Moscow : V. A. Trapeznikov Institute of Control Sciences of the Russian Academy of Sciences, 2011. P. 155-157. (In Russian).
7. Denezhkina K. L., Radkovskaya E. V. Perspektivy vosstanovleiia raboty aeroportov. Science Prospects. 2022. No. 7. P. 40-44. (In Russian).
8. Ryazanov V. A. Passenger Air Traffic of Russian Regional Airports as an Indicator of Regional SocioEconomic Dynamics. Regionalnye issledovaniia. 2013. No. 4. P. 74-79. (In Russian).
9. Martynenko A. V., Farnosova Ya. A., Sheryshova A. E. Mathematic Modeling of Passenger Air Transport Innovative Transport. Innotrans. 2016. No. 4. P. 9-14. (In Russian).
10. Banshchikova A. A., Bazilevsky M. P., Tikho-mirov V. A. The Forecasting of Pass Volume of Large Containers Carried on Non-Tractive Rolling Stock in the Export-Import Communication in Towards from Russian Federation to China. Modern Technologies. System Analysis. Modeling. 2017. No. 2. P. 185-190. (In Russian).
11. Bazilevsky M. P., Gefan G. D. The Problem of Autocorrelation in Regression Residuals by Example of Modeling Rail Freight Based on Time Series Data. Modern Technologies. System Analysis. Modeling. 2016. No. 1. P. 141-147. (In Russian).
12. Noskov S. I., Bychkov Yu. A. Modification of the Continuous Form of the Maximum Consistency Method in Constructing Linear Regression. News of the Tula State University. Technical Sciences. 2022.
Известия Тульского государственного университета. Технические науки. 2022. № 5. С. 88-94. DOI 10.24412/2071-6168-2022-5-88-95.
13. Федеральная служба государственной статистики. URL: https://rosstat.gov.ru (дата обращения: 15.02.2023).
14. Носков С. И. О методе смешанного оценивания параметров линейной регрессии // Информационные технологии и математическое моделирование в управлении сложными системами. 2019. № 1. С. 41-45.
15. Носков С. И., Перфильева К. С. Программа оценки точности прогноза по регрессионной модели при использовании четырех альтернативных методов идентификации ее параметров. Свидетельство о гос. регистрации программы для ЭВМ № RU 2022618046 от 28.04.2022. Заявка № 2022616576 от 12.04.2022 ; заявитель ФГБОУ ВО «Иркутский государственный университет путей сообщения».
16. Носков С. И., Бычков Ю. А. Программа оптимизации непрерывного критерия согласованности поведения при построении регрессионных моделей. Свидетельство о гос. регистрации программы для ЭВМ № RU 2022618082 от 28.04.2022. Заявка № 2022617381 от 19.04.2022 ; заявитель ФГБОУ ВО «Иркутский государственный университет путей сообщения».
No. 5. P. 88-94. DOI 10.24412/2071-6168-2022-588-95. (In Russian).
13. Federal State Statistics Service. URL: https://ros stat.gov.ru (accessed: 15.02.2023). (In Russian).
14. Noskov S. I. About the Method of Mixed Estimation of Parameters of Linear Regression. Information Technology and Mathematical Modeling in the Management of Complex Systems. 2019. No. 1. P. 41-45. (In Russian).
15. Noskov S. I., Perfilyeva K. S. The Program for Assessing the Accuracy of the Forecast for the Regression Model Using four Alternative Methods for Identifying Its Parameters. Certificate of State Registration of the Computer Program No. 2022618046 Russian Federation of April 28, 2022. Claim No. 2022616576 of April 12, 2022 ; Applicant Irkutsk State Transport University. (In Russian).
16. Noskov S. I., Bychkov Yu. A. The Program for Optimizing the Continuous Criterion for the Consistency of Behavior in the Construction of Regression Models : Certificate of State Registration of the Computer Program No. 2022618082 Russian Federation of April 28, 2022. Claim No. 2022617381 of April 19, 2022 ; Applicant Irkutsk State Transport University. (In Russian).
Информация об авторах
С. И. Носков - доктор технических наук, профессор. Ю. А. Бычков - аспирант. К. С. Перфильева - аспирант.
Information about the authors
S. I. Noskov - Doctor of Sciences (Engineering), Professor. Yu. A. Bychkov - Postgraduate. K. S. Perfilyeva - Postgraduate.