Научная статья на тему 'ОБЗОР АЛГОРИТМОВ МОДЕЛИ ПРОГНОЗИРОВАНИЯ КАДРОВОГО СОСТАВА В СИСТЕМЕ УПРАВЛЕНИЯ ПРЕДПРИЯТИЕМ'

ОБЗОР АЛГОРИТМОВ МОДЕЛИ ПРОГНОЗИРОВАНИЯ КАДРОВОГО СОСТАВА В СИСТЕМЕ УПРАВЛЕНИЯ ПРЕДПРИЯТИЕМ Текст научной статьи по специальности «Экономика и бизнес»

CC BY
7
2
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
анализ данных / машинное обучение / система управления предприятием / data analysis / machine learning / enterprise management system

Аннотация научной статьи по экономике и бизнесу, автор научной работы — С.О. Саранцев, Е.Л. Вайтекунене

Статья посвящена проведению сравнительного анализа классификационных алгоритмов для прогнозирования оттока кадрового состава в системе управления предприятием.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — С.О. Саранцев, Е.Л. Вайтекунене

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

REVIEW OF ALGORITHMS OF THE PERSONNEL FORECASTING MODEL IN THE ENTERPRISE MANAGEMENT SYSTEM

A comparative analysis of classification algorithms for predicting the outflow of personnel in the enterprise management system is carried out.

Текст научной работы на тему «ОБЗОР АЛГОРИТМОВ МОДЕЛИ ПРОГНОЗИРОВАНИЯ КАДРОВОГО СОСТАВА В СИСТЕМЕ УПРАВЛЕНИЯ ПРЕДПРИЯТИЕМ»

УДК 004.7

ОБЗОР АЛГОРИТМОВ МОДЕЛИ ПРОГНОЗИРОВАНИЯ КАДРОВОГО СОСТАВА В СИСТЕМЕ УПРАВЛЕНИЯ ПРЕДПРИЯТИЕМ

С.О. Саранцев, Е.Л. Вайтекунене

Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail: saranceff@gmail.com

Статья посвящена проведению сравнительного анализа классификационных алгоритмов для прогнозирования оттока кадрового состава в системе управления предприятием

Ключевые слова: анализ данных, машинное обучение, система управления предприятием

REVIEW OF ALGORITHMS OF THE PERSONNEL FORECASTING MODEL IN THE ENTERPRISE MANAGEMENT SYSTEM

S.O. Sarantsev, E.L. Vaitekunene

Reshetnev Siberian State University of Science and Technology 31, Krasnoyarskii rabochii prospekt, Krasnoyarsk, 660037, Russian Federation *E-mail: saranceff@gmail.com

A comparative analysis of classification algorithms for predicting the outflow of personnel in the enterprise management system is carried out.

Keywords: data analysis, machine learning, enterprise management system

Решение задачи предсказывания вероятности оттока кадров очень актуальна, поскольку замена сотрудника в организации обходиться компании дороже, чем удержание старого сотрудника.

Текучесть кадров (также известная как «отток сотрудников») является дорогостоящей проблемой для компаний. Истинная стоимость замены сотрудника часто может быть довольно большой.

Компании, как правило, платят около одной пятой заработной платы работника, чтобы заменить этого работника, и стоимость может значительно возрасти, если заменить руководителей или наиболее высококвалифицированных работников. Решение-разработка обучаемых алгоритмов для предсказывания вероятности своевременного ухода сотрудника, где алгоритм проанализировав все характеристики сотрудника сможет оценить и предсказать вероятность ухода [2].

Перед тем как начать прогнозирования оттока кадров, применялся статический анализ данных для выявления и подтверждение гипотез о том, как меняется поведенческое действие у сотрудника. В ходе выполнения статического анализ данных были определенны какие причины негативно влияют на отток кадров т.е. если сотрудник холост, то он более склонен к уходу из компании, а также смена руководства положительно влияет на уход сотрудника и т.п. Набор данных имеет дисбаланс классов, т.е. у нас положительных классов больше, чем негативных, то это может повлиять на обучении некоторых наших алгоритмов, для борьбы с этой проблемой использовалось техника сэмплирования - алгоритм SMOTE, данный алгоритм создает искусственную выборку максимально похожую на наши данные, тем

Секция «Информационно-экономические системы»

самым выравнивается дисбаланс классов. Для построения моделей использовались такие алгоритмы как случайный лес, дерево принятия решений, логистическая регрессия, метод машинно-опорных векторов, наивный байесовский классификатор, метод к-ближайших соседей, а также градиентный бустинг.[3]

К данным о сотрудниках HR-отдела был применен весь цикл обработки данных от очистки до кодирования категориальных признаков, а также были построены модели машинного обучения и были получены предсказания, для оценки качества алгоритмов будет использована roc auc - это метрика качества которая показывает площадь под кривой отношения истинно положительно предсказанного класса к ложно-положительному классу, accuracy - это метрика качества, которая показывают долю верных ответов предсказанной модели, а также построим матрицу ошибок - это показатель успешности классификации [1]. Качества алгоритмов классификации на таблице 1.

Таблица 1

Качество алгоритмов классификации

ROC AUC ROC AUC accuracy

алгоритмы mean std mean accuracy std

Логистическая регрессия 80.78 8.26 74.68 3.87

Градиентный бустинг 80.08 6.06 86.12 3.25

Случайный лес 78.16 6.56 85.11 2.63

Метод машинно-опорных векторов 77.90 7.50 84.67 4.07

Наивный байесовский

классификатор 73.81 8.18 65.34 3.12

Дерево принятия решений 61.52 6.10 77.05 3.93

Метод к-ближайших соседей 67.71 5.52 83.84 3.01

Наилучшей моделью оказалась логистическая регрессия конкретно для этого набора данных, теперь посмотрим на ее матрицу ошибок. Матрица ошибок для логистической регрессии на рисунке 1.

Confusion matrix Predicted label

~3 +J

£

37 22

О 1

Рис. 1. Матрица ошибок для логистической регрессии

В ходе построение классификационных моделей для набора данных ЯК-отдела можно утвердить, что конкретно для этого набора данных наилучшим алгоритмом классификации

является логистическая регрессия, поскольку ее качества классфикации составляет 80.78, но также количество ложно-отрицательных предсказаний составляет 5, а для ложно-положительных предсказаний 37. Но что немало важно знать, что точность разных алгоритмов могут отличаться к определенному набору данных, поскольку это все зависит от качества обработки этих данных [4].

Библиографические ссылки

1. Экономико-математические методы анализа деятельности предприятий АПК; Саратов, 2019 г.; Текст: электронный - URL: https://www.elibrary.ru/item.asp?id=35391639

2. Рефлексия в машинном обучении на примере обучения деревьев решений; Бородин И.Д.; Московский Государственный технический университет им. Н.Э. Баумана.; Текст: электронный - URL: https://www.elibrary.ru/item.asp?id=29656142

3. Основы алгоритмов машинного обучения-обучения без учителя. Галимов Р.Г.; Уральский государственный экономический университет.; Текст: электронный - URL: https://www.elibrary.ru/item.asp?id=30574809

4. Введение в анализ данных. Учебник и практикум; Миркин Борис Григорьевич; С. 125132. Текст: электронный - URL: https://www.beesona.ru/books/180018/

© Саранцев С.О., Вайтекунене Е.Л., 2022

i Надоели баннеры? Вы всегда можете отключить рекламу.