Научная статья на тему 'ПРИМЕНЕНИЕ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ВЫЯВЛЕНИЯ ПОТЕНЦИАЛЬНЫХ КЛИЕНТОВ АВИАКОМПАНИИ'

ПРИМЕНЕНИЕ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ВЫЯВЛЕНИЯ ПОТЕНЦИАЛЬНЫХ КЛИЕНТОВ АВИАКОМПАНИИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
6
1
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
Scikit-learn / алгоритмы машинного обучения / программирование на Python / Scikit-learn / machine learning algorithms / Python programming

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Горбань Максим Игоревич, Л.А. Казаковцев

В данной работе рассмотрены алгоритмы машинного обучения для решения задач в гражданской авиации. Продемонстрирована эффективность этих алгоритмов для таких задач.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Горбань Максим Игоревич, Л.А. Казаковцев

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF MACHINE LEARNING ALGORITHMS TO IDENTIFY POTENTIAL CUSTOMERS OF THE AIRLINE

This paper discussed machine learning algorithms for solving problems in civil aviation. The effectiveness of these algorithms for such tasks is demonstrated.

Текст научной работы на тему «ПРИМЕНЕНИЕ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ВЫЯВЛЕНИЯ ПОТЕНЦИАЛЬНЫХ КЛИЕНТОВ АВИАКОМПАНИИ»

УДК 004.852

ПРИМЕНЕНИЕ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ВЫЯВЛЕНИЯ ПОТЕНЦИАЛЬНЫХ КЛИЕНТОВ АВИАКОМПАНИИ

Горбань Максим Игоревич1 Научный руководитель - Л. А. Казаковцев

1 Красноярский государственный аграрный университет Российская Федерация, 660049, г. Красноярск, пр.Мира, 90 2Сибирский государственный университет науки и технологий имени академика М.Ф.Решетнева Российская Федерация, 660037, г. Красноярск, пр.Красноярский рабочий, 31

E-mail: jjstil.7@mail.ru

В данной работе рассмотрены алгоритмы машинного обучения для решения задач в гражданской авиации. Продемонстрирована эффективность этих алгоритмов для таких задач.

Ключевые слова: Scikit-learn, алгоритмы машинного обучения, программирование на Python.

APPLICATION OF MACHINE LEARNING ALGORITHMS TO IDENTIFY POTENTIAL

CUSTOMERS OF THE AIRLINE

Gorban Maxim Igorevich1 Scientific supervisor - L. A. Kazaktsev2

Krasnoyarsk state agrarian university 90, Mira prospect, Krasnoyarsk, 660049, Russian Federation 2Reshetnev University 31 Krasnoyarskiy Rabochiy av., Krasnoysrsk 660037, Russian Federation

E-mail: jjstil.7@mail.ru

This paper discussed machine learning algorithms for solving problems in civil aviation. The effectiveness of these algorithms for such tasks is demonstrated.

Key words: Scikit-learn, machine learning algorithms, Python programming.

Введение. В настоящей работе рассмотрен вопрос применимости алгоритмов машинного обучения с учителем к задачам в гражданской авиации. Таковой задачей могут быть задачи прогнозирования потенциальных клиентов авиакомпаний. Для получения данных используется макрос, созданный на VBA MS Excel [1]. Чтобы построить модель машинного обучения, задействуется язык программирования Python, в частности библиотеку Scikit-learn [2] [3] [4] [5].

Предположим у нас есть некоторый набор данных по которому мы должны буем предсказать человека, который может воспользоваться услугами авиакомпании. В таблице 1 показан пример данных.

Секция «Математические методы моделирования, управления и анализа данных»

Таблица 1

Исходный набор данных___

City Residence Age Field Job Gender City Arrival Month Cost Ticket Buy Ticket

Krasnoyarsk 55 Marketing Female Vladivostok Jul 21615 no

Zelenogorsk 28 Jurispruden ce Female Anapa Mar 11798 no

Minusinsk 59 Accounting & Finance Male Vladivostok Apr 24963 yes

В эти данных содержится информация о городе отправления, возрасте, сфере деятельности, поле, городе прибытия, месяце, стоимости авиабилета, покупке авиабилета. Предварительно я структурирую данные для более удобного представления. Есть несколько алгоритмов которые будут задействованы для реализации:

1. Логистическая регрессия;

2. Линейный метод опорных векторов;

3. Деревья решений;

4. Случайный лес;

5. Градиентный бустинг деревьев регрессии;

6. Ядерный метод опорных векторов;

7. Нейронные сети прямого распространения. После этого можно будет начать построение модели.

Первым этапом необходимо разделить данные на обучающие и тестовые иногда в отношении 75% на 25%, а иногда в отношении 80% на 20%.

Вторым этапом загрузим необходимые библиотеки Python и «насытим» нашу модель данными с помощью метода fit.

Поле посмотрим, как справилась модель на обучающем наборе и на тестовом. Результат логической регрессии на рис. 1.

Логическая регрессия

Правильность на обучающем наборе: Э.635 Правильность на тестовом наборе: S.6SS Рис. 1. Результат логической регрессии

Результат случайного леса на рис. 2.

Случайные деревья

Правильность на обучающем наборе: 1.000 Правильность на тестовом наборе: Э.61Б Рис. 2. Результат случайного леса

В больше чем половине случаев модель уверена в своих предсказаниях. Эти алгоритмы показали свою эффективность и применимость в подобных задачах регрессионного характера. Применение настолько малой группы показателей достаточно для предсказания.

Библиографические ссылки

1. Кудрявцев Н.Г., Кудин Д. В., Беликова М. Ю. Программирование на VBA MS Excel: учебное пособие / Н. Г. Кудрявцев, Д. В. Кудин, М. Ю. Беликова - Горно-Алтайск: РИО ГАГУ, 2015. - 116 с.

2. The Python Wiki. [Электронный ресурс] - Режим доступа - URL: https://wiki.python.org/moin/ (дата обращения: 4.04.2022)

3. Златопольский, Д. М. Основы программирования на языке Python. - М.: ДМК Пресс, 2017. - 284 с.: ил. - ISBN 978-5-97060-552-3.

4. Scikit-learn: Machine Learning in Python , Pedregosa et al. , JMLR 12, pp. 2825-2830, 2011. - Режим доступа - URL: https://jmlr.csail.mit.edu/papers/v12/pedregosa11a.html (дата обращения: 05.04.2022)

5. Мюллер А. Введение в машинное обучение с помощью Python : руководство для специалистов по работе с данными / Андреас Мюллер, Сара Гвидо. - Москва [и др.] : Диалектика, 2019. - 472, [1] с.: ил. - ISBN 978-5-9908910-8-1.

© Горбань М. И., 2022

i Надоели баннеры? Вы всегда можете отключить рекламу.