Научная статья на тему 'Использование бинарной регрессии для оценки кандидатов при приеме на работу'

Использование бинарной регрессии для оценки кандидатов при приеме на работу Текст научной статьи по специальности «Экономика и бизнес»

CC BY
334
120
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОДБОР ПЕРСОНАЛА / БИНАРНАЯ РЕГРЕССИЯ / ПРОБИТ-МОДЕЛЬ / RECRUITMENT / BINARY REGRESSION / PROBIT-MODEL

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Зинченко А. А.

В статье исследована возможность оценки кандидатов на вакантные должности с использова нием бинарной регрессии. Ценность результатов обусловлена отсутствием на практике каких-либо средств автоматизации принятия решений в данной сфере. Цель исследования показать наличие статистической зависимости между информацией, указанной в резюме работника, и результатом прохождения испытательного срока. В качестве исследуемых данных были взяты резюме соискателей, рекомендованных несколькими кадро выми агентствами, в том числе резюме принятых на работу и резюме не прошедших испытательный срок.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The paper shows the possibility of the efficient evaluation of candidates for positions with the help of the binary-regression. The absence of expertise in using math methods by personnel departments makes recruitment process modeling inefficient, so the results obtained via binary-regression is of great importance. The purpose of the research is to show the relationship between the data in CVs and the fact of passing the probation period by employees. The author had at his disposal data of candidates’ CVs provided by several HR-agencies to their clients. Some of employees had passed the probation, some of them had not passed

Текст научной работы на тему «Использование бинарной регрессии для оценки кандидатов при приеме на работу»

социум

УДК 005.51

использование бинарной регрессии для оценки кандидатов при приеме на работу

Аннотация. В статье исследована возможность оценки кандидатов на вакантные должности с использованием бинарной регрессии. Ценность результатов обусловлена отсутствием на практике каких-либо средств автоматизации принятия решений в данной сфере. Цель исследования - показать наличие статистической зависимости между информацией, указанной в резюме работника, и результатом прохождения испытательного срока. В качестве исследуемых данных были взяты резюме соискателей, рекомендованных несколькими кадровыми агентствами, в том числе резюме принятых на работу и резюме не прошедших испытательный срок.

Ключевые слова: подбор персонала; бинарная регрессия; пробит-модель.

Abstract. The paper shows the possibility of the efficient evaluation of candidates for positions with the help of the binary-regression. The absence of expertise in using math methods by personnel departments makes recruitment process modeling inefficient, so the results obtained via binary-regression is of great importance. The purpose of the research is to show the relationship between the data in CVs and the fact of passing the probation period by employees. The author had at his disposal data of candidates' CVs provided by several HR-agencies to their clients. Some of employees had passed the probation, some of them had not passed.

Keywords: recruitment$ binary regression$ probit-model.

Зинченко А.А.,

аспирант кафедры «Прикладная математика» Финансового университета Н a_zinchenko@List.ru

Успешная работа любой организации в первую очередь будет зависеть от подбора и расстановки кадров этой организации. Поиск кандидатов на вакантные должности, проведение собеседований и оценка профессионализма потенциальных работников - трудоемкий процесс, требующий создания на предприятии отдельного департамента, занимающегося данным вопросом. Однако не всякий бизнес может позволить себе содержать штатное кадровое подразделение, при этом потребность в квалифицированном подборе кадров не исчезает.

Данная потребность привела к созданию кадровых агентств, предоставляющих услуги подбора и оценки персонала за деньги. При этом услуги, предоставляемые кадровым агентством, не ограничиваются только подбором постоянного персонала (Permanent Placement). Сегодня активно развиваются такие бизнес-направления рекрутинга, как Staff Leasing (сотрудник работает на

клиента, но юридически обслуживается кадровым агентством), Temporary Placement (временное предоставление работников) и др.

Поиском и проведением собеседований занимается HR- (Human Resources) отдел самой компании. Для поиска кандидатов сотрудникам отдела предоставлена полная свобода. Интересно отметить, что, в отличие от других офисов, которые стараются перекрывать сотрудникам доступ к социальным сетям на рабочих местах, в кадровом агентстве этот доступ может быть открыт по совершенно объективной причине - социальные сети предоставляют огромные возможности по поиску работников, сбору информации, проведению опросов. На плечи работников HR-отдела ложится решение сразу двух задач: с одной стороны, они должны прекрасно ориентироваться в потребностях клиента, с другой стороны, обладать достаточным профессионализмом, чтобы оценить потенциального работника.

Работа в сфере HR требует всесторонних знаний, но каким бы широким ни был кругозор человека, фактор субъективности полностью исключить не удастся. Стоит ли говорить, что каждый «плохой» работник, предложенный рекрутинговым агентством и впоследствии уволенный клиентом, будет стоить агентству не только репутации. Контракт вполне может предполагать наличие штрафа за «плохой подбор». Для того чтобы повысить

Научный руководитель: Саркисян Р.А., доктор физико-математических наук, профессор.

использование бинарной регрессии для оценки кандидатов при приеме на работу

обоснованность принятия решений в процессе подбора персонала, автор предлагает использовать модели бинарного выбора.

Такие модели нашли применение в различных областях науки - социологии, физике, биологии. В эконометрике, например, модели бинарного выбора используются для определения вероятности дефолта, в банковском деле - для принятия решений о выдаче кредита (кредитный скоринг) и т.д.

Бинарная регрессия представляет собой зависимость эндогенной переменной, принимающей всего два значения - 0 и 1, от набора факторов. Обычная линейная регрессия для таких переменных неприменима, так как она допускает и отрицательные значения, и значения выше 1. Поэтому обычно используются некоторые интегральные функции распределения. Чаще всего используются функции нормального распределения (пробит), логистического распределения (логит) и распределения Гомперца (гомпит). От выбора функции распределения напрямую зависит соответствие реальным данным прогнозов, полученных с помощью модели [1].

Предполагая, что зависимая переменная, которая представляет собой возможность или невозможность взять на работу кандидата (или в случае с рекрутинго-вым агентством - рекомендовать его клиенту), принимает только два значения, вероятность того, что она примет соответствующее значение, можно выразить как функцию некоторых факторов:

Prob (Y = 1| x ) = F (xrß), Prob (Y = 0| x) = 1 - F (xrß).

Набор параметров отражает влияние изменения каждого фактора на конечную вероятность. Задача состоит в том, чтобы подобрать адекватную функцию в правой части уравнения. Естественно предположить следующие условия:

lim Prob (Y = 1\x ) = 1,

Um Prob (Y = 1|x) = 0.

ь (аа)=П (^Р)]* 0 " р (*ТР)Г •

I=1

Задача поиска максимума функции правдоподобия равносильна задаче поиска нуля градиента gmdLф).

Особенность применения бинарной регрессии для оценки работника заключается в необходимости дать количественную интерпретацию качественным переменным: образование, пол, навыки и др. Опыт работы может включать в себя также и оценку самих организаций, в которых работал кандидат, оценку должностей, которые он занимал, и т.д.

Для оценки статистической значимости группы рег-рессоров модели используется так называемая статистика отношения правдоподобия, рассчитываемая по формуле:

= 2х(1/и„ - 1пи„) ,

где LfUllULnu¡¡ - значения логарифмической функции правдоподобия для оцененной модели, включающей все регрессоры, и для модели, состоящей из одной константы. Значение LR должно превышать критическое значение Хи-квадрат, с количеством степеней свободы, равным количеству факторов в модели.

Другим показателем качества модели является псевдокоэффициент детерминации. Существует несколько методик его расчета, в данной статье будет рассмотрен коэффициент детерминации МакФаддена, который рассчитывается по формуле [2]:

Lf,

R

'pseudo

= 1 -

full

L

'null

Оценка параметров осуществляется методом максимального правдоподобия. Каждое наблюдение является схемой Бернулли, поэтому функция правдоподобия предстает в виде:

С помощью псевдокоэффициента детерминации также можно оценивать необходимость включения каждого регрессора в модель. Для этого регрессоры последовательно включаются в модель, и отслеживается изменение. Отметим, что коэффициент детерминации МакФаддена не имеет абсолютной интерпретации как классический. С его помощью мы можем лишь сравнивать различные спецификации модели.

Итак, приступим к построению модели. В данной статье в качестве функции выбрана функция нормального распределения (пробит):

Prob ( = yv...Yn = yn X) = П[1" F (^ГР>- Prob (Y = l\x) =

yt =0 yt =i cw 2-nj-x

(x

dx.

Функцию правдоподобия для п наблюдений можно В качестве факторов выбраны следующие данные переписать в виде кандидата:

социум

1) пол;

2) возраст;

3) наличие высшего образования;

4) профиль;

5) стаж работы (лет);

6) количество организаций, в которых работал;

7) перечисленные обязанности (количество);

8) знание английского языка;

9) другие иностранные языки, указанные в резюме;

10) уровень знания компьютера (3-балльная шкала: 0 - не указан; l - знание ms office; 2 - знание специализированных пакетов анализа; 3 - навыки программирования;

11) уровень запрашиваемой заработной платы («О», если не указан).

Данные для статистики были взяты из резюме работников, которых кадровое агентство рекомендовало клиентам. Бинарная зависимая переменная принимает значение «l» в том случае, если человек продолжил работу в организации по истечении испытательного срока, «О» - в противоположном случае. Выбор в пользу этих факторов был сделан на основании расчета статистики LR и анализа изменений R2pseudo для различных спецификаций. Исключение любого из параметров модели приведет к ухудшению ее качества.

Для оценки параметров модели, а также для расчета отношения правдоподобия и псевдокоэффициента детерминации автором была написана программа в системе компьютерной алгебры Maple. Несмотря на то что существуют программные пакеты, в которых пробит-модель уже реализована, программный код данных пакетов является закрытым, что уменьшает доверие к результатам вычислений. Другим аргументом в пользу пакета Maple является возможность проводить символьные вычисления, что крайне удобно для нахождения гессиана функции правдоподобия, необходимого при реализации многомерного метода Ньютона для поиска экстремума функции.

Оцененная модель имеет вид:

Prob {Y = 1|x) = F( -7,193 + 0,768 * Gen + + 0,0502* Age + 3,870* Edu - 1,051Prof + + 0,219* Exp - 0,296* Orgs - 0,001* Dut + + 4,140* Eng + 0,687* Lng + 0,360* Comp + + 0,0000062* Wage)

R 2

pseudo

= 0,42

Гистограмма предсказанных вероятностей

Значение LR статистики показывает, что все параметры являются значимыми. Поскольку функция распределения всегда является монотонно возрастающей, по знаку параметра можно судить о том, какой вклад, отрицательный или положительный, он вносит в конечную вероятность. В нашем случае поскольку значения всех факторов являются неотрицательными, можно утверждать, что знак коэффициента перед ним можно интерпретировать буквально. Так, например, знание иностранных языков оказывает положительное влияние на конечную вероятность, что вполне очевидно. Столь же понятно и отрицательное влияние количества организаций, в которых работал кандидат. Уже на стадии обработки данных для статистики автор заметил тот факт, что люди, которые уволились в течение испытательного срока, могли сменить множество организаций за два-три года. Прошедшие испытательный срок, напротив, предпочитали не менять столь часто место работы.

На рисунке представлена гистограмма предсказанных вероятностей, которая указывает на то, что большинство из них близки либо к 0, либо к 1. Это означает, что модель редко дает «неуверенную» оценку кандидатам.

В заключение хочется отметить, что рекрутинговые агентства пока не используют на практике математические модели. По мнению автора, применение результатов, описанных в данной статье, могло бы повысить эффективность работы кадровых агентств.

Литература

LR = 23,33 >Х2 (11) = = 19,68; при уровне значимости 95%

1. Давнис В.В. Эконометрика сложных экономических процессов: Компьютерный Практикум. Воронеж, 2004.

2. Greene W.H. Econometric Analysis, 2003.

3. Мхитарян В.С., Архипова М.Ю., Сиротин В.П. Эконометрика. Учебно-методический комплекс. М., 2008.

i Надоели баннеры? Вы всегда можете отключить рекламу.