УДК 004.852
ПРИМЕНЕНИЕ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ВЫЯВЛЕНИЯ ПОТЕНЦИАЛЬНЫХ КЛИЕНТОВ АВИАКОМПАНИИ
Горбань Максим Игоревич1 Научный руководитель - Л. А. Казаковцев
1 Красноярский государственный аграрный университет Российская Федерация, 660049, г. Красноярск, пр.Мира, 90 2Сибирский государственный университет науки и технологий имени академика М.Ф.Решетнева Российская Федерация, 660037, г. Красноярск, пр.Красноярский рабочий, 31
E-mail: jjstil.7@mail.ru
В данной работе рассмотрены алгоритмы машинного обучения для решения задач в гражданской авиации. Продемонстрирована эффективность этих алгоритмов для таких задач.
Ключевые слова: Scikit-learn, алгоритмы машинного обучения, программирование на Python.
APPLICATION OF MACHINE LEARNING ALGORITHMS TO IDENTIFY POTENTIAL
CUSTOMERS OF THE AIRLINE
Gorban Maxim Igorevich1 Scientific supervisor - L. A. Kazaktsev2
Krasnoyarsk state agrarian university 90, Mira prospect, Krasnoyarsk, 660049, Russian Federation 2Reshetnev University 31 Krasnoyarskiy Rabochiy av., Krasnoysrsk 660037, Russian Federation
E-mail: jjstil.7@mail.ru
This paper discussed machine learning algorithms for solving problems in civil aviation. The effectiveness of these algorithms for such tasks is demonstrated.
Key words: Scikit-learn, machine learning algorithms, Python programming.
Введение. В настоящей работе рассмотрен вопрос применимости алгоритмов машинного обучения с учителем к задачам в гражданской авиации. Таковой задачей могут быть задачи прогнозирования потенциальных клиентов авиакомпаний. Для получения данных используется макрос, созданный на VBA MS Excel [1]. Чтобы построить модель машинного обучения, задействуется язык программирования Python, в частности библиотеку Scikit-learn [2] [3] [4] [5].
Предположим у нас есть некоторый набор данных по которому мы должны буем предсказать человека, который может воспользоваться услугами авиакомпании. В таблице 1 показан пример данных.
Секция «Математические методы моделирования, управления и анализа данных»
Таблица 1
Исходный набор данных___
City Residence Age Field Job Gender City Arrival Month Cost Ticket Buy Ticket
Krasnoyarsk 55 Marketing Female Vladivostok Jul 21615 no
Zelenogorsk 28 Jurispruden ce Female Anapa Mar 11798 no
Minusinsk 59 Accounting & Finance Male Vladivostok Apr 24963 yes
В эти данных содержится информация о городе отправления, возрасте, сфере деятельности, поле, городе прибытия, месяце, стоимости авиабилета, покупке авиабилета. Предварительно я структурирую данные для более удобного представления. Есть несколько алгоритмов которые будут задействованы для реализации:
1. Логистическая регрессия;
2. Линейный метод опорных векторов;
3. Деревья решений;
4. Случайный лес;
5. Градиентный бустинг деревьев регрессии;
6. Ядерный метод опорных векторов;
7. Нейронные сети прямого распространения. После этого можно будет начать построение модели.
Первым этапом необходимо разделить данные на обучающие и тестовые иногда в отношении 75% на 25%, а иногда в отношении 80% на 20%.
Вторым этапом загрузим необходимые библиотеки Python и «насытим» нашу модель данными с помощью метода fit.
Поле посмотрим, как справилась модель на обучающем наборе и на тестовом. Результат логической регрессии на рис. 1.
Логическая регрессия
Правильность на обучающем наборе: Э.635 Правильность на тестовом наборе: S.6SS Рис. 1. Результат логической регрессии
Результат случайного леса на рис. 2.
Случайные деревья
Правильность на обучающем наборе: 1.000 Правильность на тестовом наборе: Э.61Б Рис. 2. Результат случайного леса
В больше чем половине случаев модель уверена в своих предсказаниях. Эти алгоритмы показали свою эффективность и применимость в подобных задачах регрессионного характера. Применение настолько малой группы показателей достаточно для предсказания.
Библиографические ссылки
1. Кудрявцев Н.Г., Кудин Д. В., Беликова М. Ю. Программирование на VBA MS Excel: учебное пособие / Н. Г. Кудрявцев, Д. В. Кудин, М. Ю. Беликова - Горно-Алтайск: РИО ГАГУ, 2015. - 116 с.
2. The Python Wiki. [Электронный ресурс] - Режим доступа - URL: https://wiki.python.org/moin/ (дата обращения: 4.04.2022)
3. Златопольский, Д. М. Основы программирования на языке Python. - М.: ДМК Пресс, 2017. - 284 с.: ил. - ISBN 978-5-97060-552-3.
4. Scikit-learn: Machine Learning in Python , Pedregosa et al. , JMLR 12, pp. 2825-2830, 2011. - Режим доступа - URL: https://jmlr.csail.mit.edu/papers/v12/pedregosa11a.html (дата обращения: 05.04.2022)
5. Мюллер А. Введение в машинное обучение с помощью Python : руководство для специалистов по работе с данными / Андреас Мюллер, Сара Гвидо. - Москва [и др.] : Диалектика, 2019. - 472, [1] с.: ил. - ISBN 978-5-9908910-8-1.
© Горбань М. И., 2022