Научная статья на тему 'МОДЕЛИРОВАНИЕ ОБЪЕМА ПОГРУЗКИ НА ЖЕЛЕЗНОДОРОЖНОМ ТРАНСПОРТЕ МЕТОДОМ СМЕШАННОГО ОЦЕНИВАНИЯ'

МОДЕЛИРОВАНИЕ ОБЪЕМА ПОГРУЗКИ НА ЖЕЛЕЗНОДОРОЖНОМ ТРАНСПОРТЕ МЕТОДОМ СМЕШАННОГО ОЦЕНИВАНИЯ Текст научной статьи по специальности «Математика»

CC BY
46
9
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЛИНЕЙНАЯ РЕГРЕССИЯ / МЕТОД СМЕШАННОГО ОЦЕНИВАНИЯ / МЕТОД НАИМЕНЬШИХ КВАДРАТОВ / МЕТОД НАИМЕНЬШИХ МОДУЛЕЙ / АНТИРОБАСТНОЕ ОЦЕНИВАНИЕ / ПРОГРАММНЫЙ КОМПЛЕКС / КРИТЕРИЙ СМЕЩЕНИЯ

Аннотация научной статьи по математике, автор научной работы — Носков Сергей Иванович, Перфильева Карина Сергеевна

В работе поставлена задача выявления закономерности влияния важнейших сырьевых показателей - добычи угля в Российской Федерации и вывозки древесины, а также парка груженых вагонов на ключевой результирующий фактор деятельности железнодорожного транспорта - объем погрузки основных видов грузов. С помощью метода наименьших квадратов построена связывающая эти факторы регрессионная модель, обладающая высокими значениями критериев адекватности. Поскольку анализ исходной информации показал, что в ней имеют место аномальные наблюдения, не согласующиеся с выборкой в целом, эта модель скорректирована с помощью метода смешанного оценивания. Этот метод совмещает в себе свойства методов наименьших модулей и антиробастного оценивания, каждый из которых «работает» на «своей» подвыборки данных. При этом было произведено 3432разбиения исходной выборки на подвыборки с целью построения модели с максимальным значением критерия смещения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICA TION OF THE MIXED ESTIMA TION METHOD IN MODELING THE LOADING VOL UME IN RAIL WA Y TRANSPORT

The article studies the properties of the method of mixed estimation of parameters of regression equations on the example of modeling the volume of loading of the main types of cargo of railway transport of the Russian Federation. The search for the vector of regression parameters using the mixed estimation method is carried out by minimizing the sum of different loss functions for different parts of the sample. The method of splitting the subsample 152 into parts for the method of mixed estimation of the parameters of regression equations is based on the algorithm invented by the authors, based on the estimation of the bias criterion.

Текст научной работы на тему «МОДЕЛИРОВАНИЕ ОБЪЕМА ПОГРУЗКИ НА ЖЕЛЕЗНОДОРОЖНОМ ТРАНСПОРТЕ МЕТОДОМ СМЕШАННОГО ОЦЕНИВАНИЯ»

THE CONCEPT OF MAINTENANCE OF OPERATIONAL SUITABILITY OF SPECIAL CONSTRUCTIONS ^ IN THE CONDITIONS OF EMERGENCY LOADINGS

AND AFFECTINGS

D.P. Mandritsa, D.A. Avsjukevich

Technical conditions of special constructions in conditions and after emergency loadings and affectings are observed, new definition of operational suitability of bearing structures is offered. For maintenance of reliability and non-failure operation of special constructions in the conditions of emergency loadings and affectings the concept of maintenance of operational suitability of special constructions taking into account problems to destination is offered, to an admissibility of faults (destructions) and restoration possibility in various service conditions.

Key words: a technical condition, operational suitability, emergency conditions, a bearing structure.

Mandritsa Dmitry Petrovich, candidate of technical sciences, senior lecturer, man-driza66amail.ru, Russia, St.-Petersburg, Military-space academy of a name of A.F. Mozhajskogo,

Avsjukevich Dmitry Alekseevich, doctor of technical sciences, professor, mandri-za66@mail.ru, Russia, St.-Petersburg, Military-space academy of a name of A.F. Mozhajskogo

УДК 519.862

МОДЕЛИРОВАНИЕ ОБЪЕМА ПОГРУЗКИ НА ЖЕЛЕЗНОДОРОЖНОМ ТРАНСПОРТЕ МЕТОДОМ СМЕШАННОГО ОЦЕНИВАНИЯ

С.И. Носков, К.С. Перфильева

В работе поставлена задача выявления закономерности влияния важнейших сырьевых показателей - добычи угля в Российской Федерации и вывозки древесины, а также парка груженых вагонов на ключевой результирующий фактор деятельности железнодорожного транспорта - объем погрузки основных видов грузов. С помощью метода наименьших квадратов построена связывающая эти факторы регрессионная модель, обладающая высокими значениями критериев адекватности. Поскольку анализ исходной информации показал, что в ней имеют место аномальные наблюдения, не согласующиеся с выборкой в целом, эта модель скорректирована с помощью метода смешанного оценивания. Этот метод совмещает в себе свойства методов наименьших модулей и антиробастного оценивания, каждый из которых «работает» на «своей» подвыборки данных. При этом было произведено 3432 разбиения исходной выборки на подвыборки с целью построения модели с максимальным значением критерия смещения.

Ключевые слова: линейная регрессия, метод смешанного оценивания, метод наименьших квадратов, метод наименьших модулей, антиробастное оценивание, программный комплекс, критерий смещения.

Регрессионный анализ является признанным и эффективным инструментом исследования закономерностей функционирования железнодорожного транспорта. Так, в работе [1] рассматривается применение комбинации тренд-сезонных моделей и

148

моделей класса АШМА к краткосрочному прогнозированию величины пассажиропотока пригородного железнодорожного сообщения. Итоговая модель позволяет использовать полученные величины прогноза в расчете комплексных оптимизационных моделей оценки потребности в подвижном составе и провозных емкостях. В [2] приводится линеаризованная пространственно-двумерная модель транспорта многокомпонентных наносов, сформированных под воздействием течений и волн в прибрежной зоне. С помощью модели решаются задачи мониторинга и прогнозирования процессов, происходящих в прибрежной зоне водоема. В [3] описываются процессы, протекающие в транспортных системах, и расчетные модели для их оптимизации. Показано, что наряду с классическими структурированными моделями для описания рынка транспортных услуг необходимо привлечение слабоструктурированных моделей, исследуемых по технологии «черного ящика». В работе [4] предлагается модель, обеспечивающая формирование исходных данных для комплексной оценки устойчивости функционирования телекоммуникационной сети железнодорожного транспорта, работающей в условиях кибервоздействия нарушителя на ее сетевые элементы. Статья [5] посвящена проблеме прогнозирования по регрессионным моделям с детерминированными и стохастическими переменными. Предложен новый способ получения точечных прогнозов по регрессии Деминга, предполагающий решение задачи выбора такого соотношения дисперсий ошибок переменных, которое минимизирует среднюю абсолютную ошибку прогноза на экзаменующей выборке. Этот способ применен для точечного прогнозирования грузооборота железнодорожного транспорта. Наконец, в [6] представлена нелинейная динамическая открытая регрессионная модель эксплуатационных показателей железнодорожного транспорта, построенная на информационной базе Красноярской дороги и представляющая собой рекурсивную систему из тринадцати уравнений. Модель предназначена для проведения кратко- и среднесрочных дескриптивных прогнозных расчетов.

Постановка задачи. В настоящей работе поставлена задача выявления закономерности влияния важнейших сырьевых показателей - добычи угля в Российской Федерации и вывозки древесины, а также парка груженых вагонов на ключевой результирующий фактор деятельности железнодорожного транспорта - объем погрузки основных видов грузов.

Введем в рассмотрение переменные:

у -объем погрузки основных видов грузов на железнодорожном транспорте, тыс. тонн;

Х- добыча топливно-энергетических полезных ископаемых (уголь), мил. тонн;

3

х2 -вывозка древесины, млн. плотн.м ;

х3- рабочий парк груженых железнодорожных вагонов (в среднем в сутки),

тыс. шт.

Статистическая информация для них за период с 2005 по 2018 годы [7] представлена в табл.1.

Таблица 1

Статистическая информация__

Год У Х1 Х2 Х3

2005 1273056.00 299 270 113.2

2006 1311068.99 310 276 117.6

2007 1344239.00 314 289 134.2

2008 1303740.00 329 287 108.2

2009 1108159.00 301 221 97.1

2010 1205769.00 322 328 117

2011 1241541.00 336 393 123

2012 1271855.00 357 393 122

2013 1226932.00 353 386 120

2014 1226932.00 357 420 123

Окончание табл.1

1 2 3 4 5

2015 1217948.60 372 388 127

2016 1226951.09 386 389 137

2017 1266482.09 410 417 140

2018 1291504.70 439 461 149

Необходимо построить регрессионное уравнение (модель), связывающее зависимую (выходную) переменную у с независимыми (входными) факторами х1,х2,х3 с учетом фактора времени 1;, где 1 -номер года (1= 5 для 2005 г.).

Построим вначале это уравнение, используя обычный метод наименьших квадратов (МНК) [8]:

у=391776-32287.21 +1996.59х1+420.7х2+2082.47хз, (1)

Я= 0.88, Б=16.44, Е=2.9. Здесь Я - критерий множественной детерминации, Б - критерий Фишера, Е - средняя относительная ошибка аппроксимации, выраженная в процентах. Отметим, что приведенные значения критериев адекватности указывают на приемлемое качество модели (1). Вместе с тем, первичный анализ данных, представленных в табл.1 показывает, что они содержат явные выбросы (в частности, 2009 и 2013 годы). Поэтому эффективным представляется применить к этим данным метод смешанного оценивания (МСО) [9, 10].

Применение метода смешанного оценивания. Идея этого метода состоит в поиске вектора параметров линейной регрессии с помощью минимизации суммы разных функций потерь на двух участках выборки - на одном с функцией, соответствующей методу наименьших модулей (МНМ), а на другом - методу антиробастного оценивания(МАО) [11-14].Пусть задана исходная выборка с номерами наблюдений из множества N={1,2,...^) каким-либо образом разделена на подвыборки N1 и N2 так, что №=N7 N1, N1 и N2= N N1 П N2= 0. При этом | №|=[п/2], где [а] - целая часть числа а.

Обозначим через аМСО (N1, N2) вектор оценок параметров линейного уравнения регрессии, полученный методом смешанного оценивания для случая, когда на подвы-борке N1 «работает» МНМ, а на подвыборке N2 - МАО. Для каждой пары (N1, N2) вычисляются два вектора оценок - аМСО (№,N2) и аМСО (N2, N1). После этого значение критерия смещения Псм(№ N2) для этой пары подвыборок рассчитывается по формуле:

п„(к, N2» =1X" I 1*100%

Очевидно, что Псм(№, N2) = Псм(№, N1).

Отметим, что следует рассмотреть все возможные подвыборки. Число таких разбиений исходной выборки на подвыборки составляет

Сп[п/2]. В результате исследователю предлагается остановить свой выбор на том разбиении, у которого значение критерия смещения будет максимальным. Чем больше значение Псм, тем наименее стабильны оценки параметров на различных участках выборки.

Для рассматриваемой в настоящей работе проблемы число всех возможных разбиений выборки на подвыборки составляет С147=3432. Приведем по пять результатов с наибольшими и наименьшими значениями критерия смещения (табл. 2 и 3).

Таким образом, в результате применения МСО была построена модель с наибольшим значением критерия смещения:

у= 673764.58-27064.4И+ 781.85х1 + 644.99х2+3164.38х3 , (2)

псм =57.91, Е=1.29.

Для модели (2) характерна существенно большая значимость показателей х2 и х3, чем в модели (1). Вместе с тем, сильно снизился вклад в ее правую часть фактора х1. Вскрытие этих обстоятельств является прямым следствием проявления позитивных качеств МСО, сочетающего в себе свойства МНМ и МАО.

150

Таблица 2

Результаты с наибольшими значениями критерия смещения

Номер Вид уравнения Е ^см N1 N2

1 у= 673764.58-27064.411+ +781.85х1+ 644.99х2+3164.38хэ 1.29 57.91 [1, 4, 6, 7, 9, 12, 13] [2, 3, 5, 8, 10, 11, 14]

2 у=664828.37-21157.161+683.56х1+ +365.35 х2+ 3694.50хэ 1.43 57.88 [1, 2, 4, 6, 7, 8, 11] [3, 5, 9, 10, 12, 13, 14]

3 у= 655870.23 - 29237.29 1+920.46х1+ 681.46х2+3004.0хэ 1.33 56.46 [1, 4, 6, 7, 11, 12, 13] [2, 3, 5, 8, 9, 10, 14]

4 у=661773.3-28470.191+ 1048.5х1+665.25386х2+ +3130.55хэ 1.31 56.03 [1, 4, 6, 7, 9, 11, 13] [2, 3, 5, 8, 10, 12, 14]

5 у=645641.24-26004.441+ +1982.09х1+505.615х2+ +2916.12хэ 1.29 55.08 [1, 4, 6, 7, 8, 9, 10] [2, 3, 5, 11, 12, 13, 14]

Таблица 3

Результаты с наименьшими значениями критерия смещения

Номер Вид уравнения Е ,ссм N1 N2

1 у=548619.63-31736.341+ +2040.75х1+451.11х2+ +1644.27хэ 1.23 3.24 [1, 3, 4, 5, 6, 7, 14] [2, 8, 9, 10, 11, 12, 13]

2 у=569971.05-32991.331+ +2017.02х1+536.16х2+ +1411.1 хэ 1.31 4.98 [1, 6, 9, 10, 11, 12, 13] [2, 3, 4, 5, 7, 8, 14]

3 у=568311.95--32989.7341+2011.17х:+ +541.25х2+1408.9хв 1.32 5.03 [1, 8, 9, 10, 11, 12, 13] [2, 3, 4, 5, 6, 7, 14]

4 у=555613.84-34111.071+ +2094.66х1+533.09х2+ +1413.14хв 1.33 5.06 [1, 6, 8, 9, 10, 11, 13] [2, 3, 4, 5, 7, 12, 14]

5 У=575351.98--31388.3671+1982.0954 х: + +486.3278х2+1456.5157хв 1.26 5.17 [1, 6, 8, 10, 11, 12, 13] [2, 3, 4, 5, 7, 9, 14]

Заключение. В работе поставлена задача выявления закономерности влияния важнейших сырьевых показателей - добычи угля и вывозки древесины в Российской Федерации, а также парка груженых вагонов на ключевой результирующий фактор деятельности железнодорожного транспорта - объем погрузки основных видов грузов. С помощью метода наименьших квадратов построена связывающая эти факторы регрессионная модель, обладающая высокими значениями критериев адекватности. Поскольку анализ исходной информации показал, что в ней имеют место аномальные наблюдения, не согласующиеся с выборкой в целом, эта модель скорректирована с помощью метода смешанного оценивания. При этом было произведено 3432 разбиений исходной выборки на подвыборки с целью построения модели с максимальным значением критерия смещения.

Список литературы

1. Карпеченкова О.Н., Романков В.В. Анализ устойчивости моделей математических моделей железнодорожного транспорта с применением индексно-дивергентного метода // Проблемы управления безопасностью сложных систем. 2013. С. 473-475.

2. Сухинов А.И. Сидорякина В.В. Математическая нелинейная про-странствен-но-двумерная модель транспорта многокомпонентных наносов в мелководных водоемах и ее линеаризация // Вестник Таганрогского государственного педагогического института. 2018. №2. С. 242-245.

3. Алферов А.Е., Карасева Е.В. Оптимизационные модели в эконо-мике транспорта // Наука и инновации в XXI веке: актуальные вопросы, открытия и достижения. 2017. С. 80-82.

4. Бекбаев Г.А., Привалов А.А., Ачкасов Н.Б., Кравцов А.О. Модель процесса "ddos''-атаки на телекоммуникационную сеть железнодорожного транспорта // Известия Петербургского университета путей сообщения. 2017. №3. С. 420-426.

5. Базилевский М.П. Прогнозирование грузооборота железнодорожного транспорта по регрессионным моделям с детерминированными и стохастическими объясняющими переменными // Научные ведомости белгородского государственного университета. Серия: экономика. Информатика. 2019. №1. С. 117-129.

6. Носков С.И., Врублевский И.П. Регрессионная модель динамики эксплуатационных показателей функционирования железнодорожного транспорта // Современные технологии. Системный анализ. Моделирование. 2016. № 2 (50). С. 192-197.

7. Официальный сайт Федеральной службы государственной статистики [Электронный ресурс] URL: https://www.gks.ru (дата обращения: 10.01.2021).

8. Дрейпер Н., Смит Г. Прикладной регрессионный анализ. М.: Финансы и статистика. 1981. Т. 1. 366 с.

9. Носков С.И. О методе смешанного оценивания параметров линейной регрессии // Информационные технологии и математическое моделирование в управлении сложными системами. 2019. №1. С. 14-20.

10. Носков С.И., Перфильева К.С. Эмпирический анализ некоторых свойств метода смешанного оценивания параметров линейного регрессионного уравнения // Наука и бизнес. 2020. №6. С.62-66.

11. Носков С.И. Метод антиробастного оценивания параметров линейной регрессии: число максимальных по модулю ошибок аппроксимации // Южно-Сибирский научный вестник. 2020. № 1 (29). С. 51-54.

12. Носков С.И., Базилевский М.П. Построение регрессионных моделей с использованием аппарата линейно-булевого программирования. Иркутск: ИрГУПС. 2018. 176 с.

13. Базилевский М.П., Носков С.И. Формализация задачи построения линейно-мультипликативной регрессии в виде задачи частично-булевого линейного программирования // Современные технологии. Системный анализ. Моделирование. 2017. №3. С. 101-105.

14. Головченко В.Б., Носков С.И. Оценивание параметров эконо-метрической модели по статистической и экспертной информации // Авто-матика и телемеханика. 1991. № 4. С. 123-132.

Сергей Иванович Носков, д-р техн. наук, профессор, sergey. noskov. 5 7@,mail. ru, Россия, Иркутск, Иркутский государственный университет путей сообщения,

Перфильева Карина Сергеевна, аспирант, 552649-171233@mail.ru, Россия, Иркутск, Иркутский государственный университет путей сообщения

APPLICA TION OF THE MIXED ESTIMA TION METHOD IN MODELING THE LOADING

VOLUME IN RAILWAY TRANSPORT

S.I. Noskov, K.S. Perfilieva

The article studies the properties of the method of mixed estimation ofparameters of regression equations on the example of modeling the volume of loading of the main types of cargo of railway transport of the Russian Federation. The search for the vector of regression parameters using the mixed estimation method is carried out by minimizing the sum of different loss functions for different parts of the sample. The method of splitting the subsample

152

into parts for the method of mixed estimation of the parameters of regression equations is based on the algorithm invented by the authors, based on the estimation of the bias criterion.

Key words: Linear regression, mixed estimation method, least squares method, least modulus method, anti-robust estimation, program complex, bias criterion.

Noskov Sergey Ivanovich, doctor of technical sciences, professor, sergey. noskov. 5 7@,mail. ru, Russia, Irkutsk, Irkutsk state University of railway transport,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Perfileva Karina Sergeevna, postgraduate, 552649-171233@mail.ru, Russia, Irkutsk, Irkutsk state University of railway transport

УДК 621.317.39

ГРУППИРОВАНИЕ ВОЗДУШНЫХ ЦЕЛЕЙ НА ОСНОВЕ САМООРГАНИЗУЮЩЕЙСЯ НЕЙРОННОЙ СЕТИ КОХОНЕНА

Н.С. Акиншин, А.О. Жуков, А.В. Петешов

Рассмотрена задача группирования воздушных целей с помощью самоорганизующейся сети Кохонена, представляющей собой двухслойную нейронную сеть прямого распространения сигнала. Приведен пример группирования воздушных целей на основе нейронной сети с добавлением параметра постоянной величины. Показано, что предельная дальность сближения двух групп воздушных целей общепринятой нейронной сети Кохонена значительно превышает предельную дальность ее модификации, причем эта разница нарастает с ростом числа воздушных целей в группе.

Ключевые слова: нейронная сеть, группировка объектов, обучение сети.

Выделение плотных групп воздушных целей и дальнейшее их сопровождение проводится по данным обзорных РЛС [1]. На первом этапе наблюдения воздушных целей на плоскости, например, в результате первого цикла сканирования воздушного пространства наблюдаемых отметок на индикаторе кругового обзора, группирование может выполняться оператором наблюдения. Однако, в условиях дефицита времени, когда оператор не справляется с поставленной задачей даже при небольшом числе целей в группе, используются методы и алгоритмы автоматического группирования, в основу которых положены признаки взаимодействия воздушных целей, объединяющие их в группу. К признакам взаимодействия относятся геометрическая близость объектов в пространстве, близость их скоростей и направления их полета, определенное взаимное положение воздушных целей друг относительно друга.

Группирование по признакам взаимодействия можно рассматривать как разбиение множества всех описаний воздушных целей на классы (группы), воспринимаемые как компактные скопления объектов. Тогда задача автоматического группирования воздушных целей с позиций классификации заключается в следующем [2, 3].

Пусть в воздушном пространстве наблюдаются воздушные цели

I = {I;}, ; = 1,...,N,

и для каждой цели при помощи обзорной РЛС в течение одного цикла сканирования получены измерения

и; = (u;1,..., и;М X где М - число параметров, характеризующих воздушную цель.

i Надоели баннеры? Вы всегда можете отключить рекламу.