Экономический журнал ВШЭ. 2018. Т. 22. № 4. С. 531-562. HSE Economic Journal, 2018, vol. 22, no 4, pp. 531-562.
Поиск работы в России: модель разделенной совокупности
Баталова Е.В., Фурманов К.К.
Выделение ищущих работу из состава незанятых и формирование выборки для эмпирического анализа поиска - проблема, которая регулярно ставилась в исследованиях поиска работы в России и почти каждым автором решалась по-своему. Можно выделить два основных подхода к формированию выборки: первый - ограничиваться зарегистрированными безработными, второй - опираться на данные опросов, в ходе которых респонденты сами указывают, ищут ли работу и готовы ли приступить к ней при получении подходящего предложения. В настоящем исследовании приводятся результаты оценивания модели поиска, в которой определяется и продолжительность поиска, и само решение искать работу или нет, которое может не совпадать с наблюдаемым ответом респондента. Оценивание проводится по данным Российского мониторинга экономики и здоровья (РМЭЗ) за 20002014 гг. Согласно полученным оценкам, большинство незанятых в трудоспособном возрасте могут рассматриваться как ищущие работу. Полученные результаты не только позволяют по-новому взглянуть на экономическую активность незанятых, но и свидетельствуют о возможности существенного расширения информационной базы в эмпирических исследованиях поиска работы.
Ключевые слова: поиск работы; безработица; рабочая сила; модель разделенной совокупности.
DOI: 10.17323/1813-8691-2018-22-4-531-562
Баталова Екатерина Владимировна - выпускница бакалавриата факультета компьютерных наук Национального исследовательского университета «Высшая школа экономики». E-mail: [email protected]
Фурманов Кирилл Константинович - к.э.н, доцент Департамента прикладной экономики Национального исследовательского университета «Высшая школа экономики». E-mail: [email protected]
Статья поступила: 07.07.2018/Статья принята: 22.10.2018.
1. Введение
Моделирование поиска работы - задача, хорошо знакомая специалистам по экономике труда. Основной поток исследований в этой области можно разделить на три ветви. В первую входят работы теоретического характера, в них рассматривается ищущий работу экономический агент, который в ходе поиска получает предложения о работе и решает, соглашаться ли ему с ними, - среди основополагающих можно выделить статьи [Mortensen, 1970; Gronau, 1971]. Вторая ветвь состоит из эмпирических исследований, в которых упор делается на продолжительность поиска и факторы, определяющие вероятность нахождения работы, - часто внимание уделяется связи между длительностью поиска и величиной пособия по безработице. В формировании этой ветви определяющую роль сыграли статьи [Nickell, 1979; Lancaster, 1979], дающие ответы на основные методические вопросы: как увязать объясняющие переменные с длительностью безработицы при построении эконометрической модели, как учесть ненаблюдаемые различия между индивидами. Третья ветвь объединяет эмпирические работы другого толка, где в центре внимания оказываются методы поиска работы (обращение к друзьям, в службы занятости и прочее) и сравнение их эффективности. Можно указать на статьи [Hilaski, 1971; Reid, 1972] как на примеры ранних работ такого рода.
Настоящее исследование ближе всего ко второй ветви, однако в фокусе оказывается не столько продолжительность поиска и ее ковариаты, сколько вопрос, как отделять ищущих работу от прочих. Распространены два подхода: первый - проводить анализ по данным о зарегистрированных безработных, второй - опираться на опросы, в которых респонденты сами описывают свое положение на рынке труда, отвечая на ряд вопросов («Желаете ли вы найти работу?», «Обращались ли вы в поисках работы куда-либо в течение последнего месяца?» и т.п.). При этом исследователи обычно соглашаются с тем, что зарегистрированные безработные составляют отдельную группу людей, которую не стоит отождествлять с общей совокупностью безработных. Что касается выявления ищущих по ответам на вопросы о поиске работы, есть опасность столкнуться с неадекватными ответами. Респондент может отвечать, что ищет работу, в действительности не занимаясь поиском, и наоборот - человек, утверждающий, что не желает найти работу, может соглашаться с поступающими (возможно, без его активного участия) предложениями о трудоустройстве.
В данной статье вместо однозначного отнесения респондентов к ищущим работу или экономически неактивным предпринята попытка разделения совокупности незанятых на два латентных класса: класс перманентно незанятых и класс тех, кто может как оставаться без работы, так и трудоустроиться. При этом вероятность принадлежности индивида к тому или иному классу определяется не по ответам на вопросы о поиске работы, а по ответам на те вопросы, которые позволяют отследить переходы из незанятого состояния в занятость. Такой подход известен в экономике в основном по работе [Schmidt, Witte, 1989], хотя поиск первоисточника может увести как минимум к середине ХХ в.
Основной вопрос, на который настоящее исследование призвано ответить, можно сформулировать так: каковы оценки доли ищущих работу среди незанятого населения России, если оценивание проводить, опираясь не на заявляемую респондентами активность поиска, а на сведения о переходах опрашиваемых из незанятого состояния в занятое? Чтобы получить ответ, используется эконометрическая модель поиска, параметры
который представляют и отдельный интерес, так как отражают связь продолжительности поиска с индивидуальными характеристиками, а исследование этой связи - одно из типичных приложений эконометрики к рынку труда.
2. Обзор литературы 2.1. Модель разделенной совокупности и ее приложения
Ключевой работой, благодаря которой модели разделенной совокупности вошли в инструментарий исследователя в области общественных наук, можно назвать статью [Schmidt, Witte, 1989], посвященную моделированию рецидивизма с позиций анализа дожития (survival analysis). Анализируя время между освобождением заключенного и его последующим заключением в тюрьму, авторы обращают внимание на то, что значительная часть заключенных в тюрьму не возвращаются. Чтобы учесть это, Шмидт и Витте разделяют всех освобожденных на два класса, которые условно можно назвать «рецидивистами» и «исправившимися». Первые в течение конечного времени возвращаются в тюрьму, в то время как для вторых вероятность возвращения в любые сроки равна нулю. Разделение это ненаблюдаемо, вероятность принадлежности к тому или иному классу в модели фигурирует как неизвестный и оцениваемый параметр. С тех пор термин «модель разделенной совокупности» (split population model) закрепился именно за моделями дожития, допускающими существование латентного класса объектов с нулевой вероятностью наступления изучаемого события.
Шмидт и Витте выступили именно популяризаторами, не претендуя на первенство. До них аналогичный подход к анализу рецидивизма был использован в работе [Maitz, McCleary, 1977], а в медицине модели такого рода использовались за несколько десятилетий [Boag, 1949]. В теории случайных процессов известны модели «кочевые - оседлые» (mover-stayer models) - обобщение марковских цепей, учитывающее ненаблюдаемую разнородность в виде класса объектов с нулевой вероятностью перехода из одного состояния в другое («оседлые») и класса «кочевых» с положительной вероятностью перехода1. Пример раннего использования процессов «кочевые - оседлые» - статья [Blumen et al., 1955], посвященная межотраслевой мобильности труда.
Дальнейшее применение модели разделенной совокупности нашли в разных областях. Сами Шмидт и Витте в заключении своей статьи указывают на возможные приложения для анализа финансовых рисков, такие приложения действительно имеют место - например, в статьях [Румянцева, Фурманов, 2016; Liu, Sing, 2018] при моделировании ипотечных дефолтов делается разделение кредитов на абсолютно надежные и те, которые подвержены риску дефолта.
Еще одним активным популяризатором стал Кацуо Ямагучи, автор ряда статей по применениям методов анализа дожития в общественных науках. В работе [Yamaguchi,
1 Далее по тексту термины «модель разделенной совокупности» и «модель "кочевые - оседлые"» используются как синонимы, несмотря на некоторые различия в их исходных формулировках. Это делается для удобства: удобно иметь названия латентных классов, на которые разделяется анализируемая совокупность объектов, а слова «кочевые» и «оседлые» хорошо характеризуют эти классы.
1998] исследуется вступление женщин в повторный брак, при этом к «оседлым» относятся женщины, не выходящие замуж повторно. Статья [Yamaguchi, 2003] носит, в основном, «технический» характер, но содержит пример применения моделей разделенной совокупности для анализа данных о переездах, при этом термин «оседлые» используется буквально - для обозначения тех, кто не переезжает с места на место.
Особый интерес представляют приложения моделей разделенной совокупности к анализу поиска работы. В основном, разделение на «кочевых» и «оседлых» используется, чтобы учесть возможность непрекращающейся безработицы. Фоули [Foley, 1997a], анализируя продолжительности безработицы в России по данным Российского мониторинга экономики и здоровья (РМЭЗ) 1992-1994 гг., получает оценку доли индивидов с нулевой вероятностью выхода в занятость, равную 8%. В последовавшей работе [Фурманов, 2009], использующей данные РМЭЗ за 2000-2005 гг., дается оценка в 4%, так что оба автора сходятся в том, что подавляющее большинство безработных относятся к «кочевым». Впрочем, в статье [Foley, 1997a] указывается на высокую долю респондентов с нулевой вероятностью выхода из состава рабочей силы (37%), но теоретически эти индивиды рано или поздно получают работу. Они «оседлые» лишь в том смысле, что не прекращают поиск. Аналогичное исследование по данным Португалии [Addison, Portugal, 2003] дает схожие оценки доли «оседлых» безработных среди тех, кто не получает пособие по безработице. Среди получающих пособие эта доля много выше: 37% индивидов с нулевой вероятностью трудоустройства. При анализе выхода из состава рабочей силы столь существенных различий нет: доля невыходящих оценивается в 29% среди получателей пособия и в 23% среди неполучающих.
В статье [Swaim, Podgursky, 1994] изучается поиск работы среди уволенных женщин по американским данным DWS (Displaced Worker Survey). В отличие от исследований, указанных в предыдущем абзаце, здесь авторы применяют модель разделенной совокупности ко всем уволенным, не пытаясь отделить безработных от неактивных по каким-либо явным признакам. Свэйм и Подгурски отмечают, что роль объясняющих переменных (в основном это индивидуальные характеристики) в уравнении для вероятности трудоустройства и в уравнении для участия в поиске качественно различается. Например, величина заработка на последней работе оказывается важным фактором в уравнении участия, но почти не имеет значения в уравнении вероятности выхода для ищущих. Отсюда делается вывод, что модель разделенной совокупности качественно лучше модели без разделения. Заметим, что здесь не идет речи о сравнении модели разделенной совокупности с подходом, при котором ищущие отделяются от неактивных по явным признакам. Полученные оценки говорят только против объединения всех уволенных в одну совокупность.
2.2. Безработица и экономическая неактивность
Различия между безработными и экономически неактивными довольно мало изучены. Кларк и Саммерс [Clark, Summers, 1979], рассмотрев данные текущих обследований населения США за 1969, 1974 и 1975 гг., обратили внимание на высокие вероятности переходов между безработицей и экономической неактивностью и непоследовательность в ответах респондентов (повторные опросы, проводившиеся всего через неделю после первоначальных, показали, что более 10% незанятых респондентов сменили статус либо
с безработного на неактивный, либо наоборот). Один из выводов статьи был сформулирован так: «many of those classified as not in the labor force are functionally indistinguishable from unemployed» (p. 31). Авторы указали, что, возможно, полезнее было бы различать незанятых по времени, прошедшему с момента увольнения с последней работы, так как с течением времени вероятность трудоустройства значительно падает.
Выводы Кларка и Саммерса были оспорены в работе [Flinn, Heckman, 1983], авторы которой подошли к проблеме с математической строгостью и обнаружили статистически значимые различия функций риска для выхода в занятость из безработицы и неактивности, так что вероятность нахождения работы оказалась выше среди безработных. Исследование опиралось на небольшую выборку из 122 юношей, но последующая работа [Ehrenberg, Smith, 1994] подтвердила выводы Флинна и Хекмана по обширной выборке текущего обследования населения США 1988 г. Впрочем, в статье [Gonul, 1992] приводятся свидетельства того, что различие между двумя видами незанятости значимо для женщин, но не для мужчин, что, с одной стороны, согласуется со здравым смыслом (мужчины реже берут на себя традиционную женскую роль домохозяйки), а с другой - противоречит результатам Флинна и Хекмана, полученным по выборке именно из юношей.
В целом, вряд ли можно говорить о каком-либо существенном продвижении в исследовании различий между безработными и не входящими в рабочую силу после работы Флинна и Хекмана. Возможно, как указывается в статье [Goldsmith et al., 1995], причина низкого интереса к этой теме в том, что различие между двумя состояниями сводится к вероятности трудоустройства - очень узкой проблеме. В работе [Goldsmith et al., 1995] осуществлена попытка сравнения психологического состояния (точнее, локуса контроля) безработных и экономически неактивных. Полученные результаты говорят скорее о неразличимости двух видов незанятости, хотя приводятся и некоторые свидетельства того, что для женщин различие между безработицей и неактивностью все же существует.
Из последующих работ сосредоточимся на тех, что посвящены поиску работы в России, так как именно здесь вопрос о границах безработицы поднимался постоянно и разными исследователями решался по-разному. Не стоял этот вопрос разве что перед теми авторами, которые либо занимались зарегистрированной безработицей [Ниворожкина и др., 2001; Nivorozhkin, 2006; Денисова и др., 2003], либо подходили к проблеме с макроэкономических позиций [Коровкин, 2001] - в силу специфики используемых данных и решаемых задач. Информационной базой для остальных исследований были данные РМЭЗ, включающие сведения и о занятых, и о незанятых индивидах (включая неактивных), так что при составлении анализируемой выборки каждый автор мог использовать свои критерии. Сочетание охвата выборки с панельной структурой данных, позволяющей отслеживать изменение статуса респондентов, сделало РМЭЗ практически незаменимым источником.
Исследования [Foley, 1997a, b] опираются на «самоопределение» безработицы: к безработным относились те, кто на вопрос «скажите, какой ответ лучше всего описывает ваше основное занятие в настоящее время» выбирал вариант «временно не работаю, ищу работу». Проверяя возможность слияния безработных и неактивных в одну категорию, автор приходит к выводу, что эти состояния различны. Вероятность перехода в занятость из безработицы в течение года составляет 52%, а извне рабочей силы - лишь 8,7%, хотя различия между этими категориями Фоули практически не рассматривает.
Гораздо больше внимания границам безработицы уделяется в последующей статье [Grogan, van den Berg, 2001]. Выявляя детерминанты длительности безработицы, авторы создают четыре подвыборки, по которым оценивается модель длительности.
1) Выборка «ILO» включает тех, кто удовлетворяет критериям МОТ (за исключением, возможно, требования готовности приступить к работе - вопросники РМЭЗ в 1990-е годы просто не содержали нужного вопроса).
2) Выборка «no job» расширяла предыдущую за счет включения респондентов, которые не занимались активным поиском работы, но указывали, что хотели бы ее найти.
3) В выборке «no work» добавлялись респонденты, имеющие работу, но находящиеся в неоплачиваемом отпуске.
4) Выборка «no pay» - самая широкая, включающая и тех, кто работал, но не получал заработную плату.
Гроган и ван ден Берг допускали даже использование данных о занятых индивидах при моделировании безработицы. В качестве бесспорных детерминант длительности безработицы авторы указывали те, связь с которыми оказывалась значимой в каждой выборке. Оценки, полученные по разным выборкам, оказались в основном схожими, статистической проверки значимости различий авторы не проводили.
Работа [Карцева, 2002] посвящена связи продолжительности безработицы и уровня образования и, в целом, следует статье [Grogan, van den Berg, 2001], но анализирует данные за более продолжительный временной период и не использует выборки «no work» и «no pay», так что граница безработицы с занятостью здесь не оспаривается, как и в дальнейших исследованиях других авторов. Полученные для «ILO» и «no job» оценки модели длительности схожи на качественном уровне, статистической проверки значимости различий также не проводилось.
Исследование [Фурманов, Шелковникова, 2014] ставит в центр внимания не сходства, а различия между разными группами незанятых, выделяемыми на основании определения МОТ с постепенным ослаблением критериев отбора.
1) Выборка «МОТ» включала безработных, удовлетворяющих критериям МОТ. В статье анализируется период 2000-2008 гг., в котором вопросники уже включали вопрос о готовности приступить к работе.
2) В выборку «ищущие» добавлялись те, кто не готов приступить к работе немедленно.
3) В выборку «желающие» добавлялись те, кто не искал работу, но высказывал желание иметь ее.
4) Выборка «незанятые» содержала всех, у кого не было работы.
Можно заметить, что «ищущие» и «желающие» соответствуют выборкам «ILO» и «no job» в статьях Гроган и ван ден Берга и Карцевой. Проведенный анализ не обнаружил значимых различий в модели поиска работы между первыми двумя выборками. Переход от «ищущих» к «желающим» приводил к значимому изменению оценок для мужчин, для женщин значимость была «пограничной» (уровень 10%) и касалась только связи вероятности трудоустройства с типом населенного пункта. Разница между «желающими» и «незанятыми» признавалась значимой на всех традиционно используемых уровнях значимости.
Все исследования продолжительности безработицы и поиска работы по данным РМЭЗ объединяет то, что решение о включении респондента в состав выборки ищущих работу делается на основании ответов респондента о том, занимается ли он поиском.
В настоящей статье представлена попытка иначе подойти к проблеме, представив ищущих работу как ненаблюдаемый класс в составе незанятых, вероятность принадлежности к которому определяется не по заявлениям о поиске и готовности работать, а по ответам респондентов о перемене статуса занятости. Это близко к идее ранее рассмотренной статьи [Swaim, Podgursky, 1994], однако ее авторы не ставили задачу анализа доли ищущих, выявляемой по модели разделенной совокупности, и не сравнивали эту долю с уровнем экономической активности, рассчитываемой по методологии МОТ.
3. Данные и методология 3.1. Составление выборки
Настоящее исследование опирается на данные РМЭЗ2 за 2000-2014 гг. Это данные панельного обследования нескольких тысяч домохозяйств в различных регионах России, полученные в результате опросов, проводившихся в конце каждого года. В анализируемую подвыборку включались только незанятые индивиды от 18 лет, верхняя возрастная планка для мужчин была установлена на уровне 59 лет, для женщин - на уровне 54 лет. Конечно, респонденты не остаются незанятыми в течение всего рассматриваемого периода, но при моделировании поиска работы используются наблюдения, сделанные в те моменты, когда респондент не имел работы или другого доходного занятия. Как только респондент находил работу, он выпадал из рассмотрения - возможно, с последующим возвращением в выборку после увольнения. Если в анализируемом периоде возраст респондента превышал верхнюю возрастную планку, то учитывались те наблюдения, в которых индивид удовлетворял установленному возрастному критерию, а последующие наблюдения исключались. Точно так же, если респонденту в 2000 г. еще не исполнилось 18 лет, то данные о нем учитывались лишь с момента наступления совершеннолетия. Наблюдения за занятыми индивидами использовались только для установления факта трудоустройства.
Индивид, не занятый в момент t, считался нашедшим работу к моменту следующего опроса t +1, если он либо имел работу или другое доходное занятие в момент t +1, либо на вопрос о дате увольнения с последней работы отвечал, что уволился после момента t, т.е. за прошедший год он успел найти работу и потерять.
Анализировались четыре выборки:
> мужчины, 2000-2008 гг.;
> женщины, 2000-2008 гг.;
> мужчины, 2009-2014 гг.;
> женщины, 2009-2014 гг.
Разделение на два временных периода было проведено по двум причинам. Во-первых, экономический спад 2008-2009 гг. мог привести к структурным сдвигам в модели поиска. Во-вторых, период с 2000 г. по 2008 г. - последний, по которому существуют эконо-метрические оценки - во всяком случае, среди работ, рассмотренных в обзоре литературы.
Данные последнего года каждой выборки использовались только чтобы определить, нашел ли респондент работу в период с момента предыдущего опроса.
2 С 2010 г. официальное название сменилось на РМЭЗ НИУ ВШЭ.
3.2. Модели поиска работы
Чтобы описать вероятность выхода в занятость, использовалась модель, предполагающая разделение всех ищущих на два ненаблюдаемых класса, в дальнейшем называемых «класс кочевых» и «класс оседлых».
«Кочевые» (movers) - та часть незанятых, которые имеют положительную вероятность трудоустройства, т.е. в каком-то смысле могут рассматриваться как потенциальный трудовой ресурс.
В классе «оседлых» (stayers) вероятность трудоустройства равна нулю - это перманентно незанятые.
Предполагается, что в течение анализируемого периода времени индивиды не переходят из класса в класс. Принадлежность к тому или иному классу установить не всегда возможно - нашедший работу индивид определенно относится к «кочевым», но не нашедший может принадлежать к любому классу. Зато можно попытаться оценить доли «кочевых» и «оседлых» во всей совокупности незанятых - это и есть основная цель настоящего исследования.
Для описания вероятности нахождения работы среди «кочевых» используется простейшая модель поиска работы, описанная, например, в работе [Kiefer, 1988]. В этой модели ищущий индивид сталкивается с пуассоновским потоком предложений о работе. При поступлении предложения индивид решает, соглашаться ему или продолжать поиск. Если предложения отличаются друг от друга лишь величиной предлагаемой заработной платы, а предлагаемые зарплаты независимы и одинаково распределены, то оптимальная стратегия индивида - соглашаться с предложениями заработной платы выше определенного порога. При этом поток приемлемых для индивида предложений также оказывается пуассоновским. Собственно, этот вывод - единственное из теоретической модели поиска, что важно для настоящего исследования. Оно опирается на предпосылку о пуас-соновском потоке приемлемых предложений. В эмпирической литературе, посвященной длительности безработицы, эта предпосылка часто ослабляется - допускается, что интенсивность потока приемлемых предложений меняется за время поиска (например, падает, если человек отчаивается в способности найти работу, или растет, потому что человек постепенно снижает требования). Для корректного построения модели с непуассоновским потоком предложений нужно учитывать момент начала поиска, но он во многих наблюдениях неизвестен. Наблюдения, в которых отсутствуют данные об увольнении с последнего места работы, составляют более трети выборки, их удаление неверно было бы списать на случайные пропуски в данных - это означало бы, в частности, исключение из анализа впервые выходящей на рынок труда молодежи.
Обозначим интенсивность потока приемлемых предложений через X, т.е. X - среднее число приемлемых предложений за год. Тогда вероятность того, что в течение года не поступит ни одного приемлемого предложения равна exp(-X), а вероятность поступления хотя бы одного такого предложения (и, соответственно, трудоустройства) составит 1 - exp(-X).
Теперь учтем наличие класса «оседлых», которые либо не занимаются поиском работы, либо считают любые поступающие предложения неприемлемыми. Обозначим вероятность принадлежности отдельного индивида к этому классу через 1 -5, так что 5 -
вероятность принадлежности к «кочевым». Тогда случайно отобранный незанятый индивид находит работу в течение года с вероятностью 5(1 — exp(—X)).
В настоящем исследовании используются несколько эконометрических моделей, по-разному задающих параметры 5 и X .
Модель 1 - без объясняющих переменных. Предполагается, что 5 и X одинаковы для всех индивидов и неизменны во времени.
Модель 2 - обычная модель пуассоновского потока без класса «оседлых» (5 = 1), в которой интенсивность потока для индивида i в году t определяется вектором-строкой объясняющих переменных x't и вектором коэффициентов в : Xit = exp (x'tP). Благодаря такой спецификации потенцированные коэффициенты равны отношениям риска (hazard ratios): увеличение отдельной переменной из вектора xjt, при прочих равных условиях, соответствует увеличению интенсивности потока в exp (в) раз, где в- коэффициент при этой переменной. Модель 2 аналогична той, что использовалась в работе [Фурманов, Шелковникова, 2014] и приведена в настоящей статье для сопоставления.
Модель 3 - модель, в которой вероятность принадлежности к «кочевым» одинакова для всех индивидов во все моменты времени, а интенсивность потока приемлемых предложений задается так же, как в модели 2.
Модель 4 - расширенная версия модели 3, где вероятность принадлежности к «оседлым» связывается с вектором переменных zj и коэффициентами у моделью логит:
5i = exp (z'y)/(l + exp (z'y)), так что 5i /(1 — 5i) = exp (z'y). Благодаря такой спецификации потенцированные коэффициенты равны отношениям шансов (odds ratios): увеличение отдельной переменной из вектора zi , при прочих равных условиях, соответствует увеличению шансов3 принадлежности к классу «кочевых» в exp (■) раз, где у}- - коэффициент при этой переменной.
Векторы коэффициентов в и у оценивались методом максимального правдоподобия (см. подраздел 3.4)
Модель 4 схожа с широко применяемой моделью Хекмана - по сути, это система из двух уравнений. Одно из них - уравнение участия в поиске, определяющее вероятность быть «кочевым» или «оседлым», другое - уравнение интенсивности потока предложений, задающее вероятность трудоустройства и, соответственно, длительность поиска работы. Модели 3 и 1 являются частными случаями модели 4, в которых одно или оба уравнения сводятся к минимуму.
3 Шансами (odds) события называют отношение вероятности наступления события к вероятности того, что событие не произойдет. Величина 5, / (1 — 5,) — шансы принадлежности к «кочевым» (отношение вероятности принадлежности к «кочевым» к вероятности принадлежности к «оседлым»).
3.3. Объясняющие переменные
Объясняющие переменные для интенсивности потока предложений строились на основании следующих признаков индивида и места его проживания.
Возраст. Выделялись четыре возрастных категории: от 18 до 24 лет, от 25 до 34 лет, от 35 до 49 лет, от 50 лет до пенсионного возраста. При оценивании категория «от 35 до 49 лет» считалась базовой, для остальных возрастных категорий в модель были включены дамми-переменные.
Далее после названия статистического признака перечисляются выделяемые категории.
Семейное положение: «не состоит в браке», «состоит в незарегистрированном браке», «состоит в зарегистрированном браке».
Образование: «нет среднего образования», «среднее», «среднее специальное», «высшее».
Обучение на дневном отделении - отдельная переменная, принимающая значение единица для тех, кто на вопрос об основном занятии ответил, что обучается на дневном отделении учебного заведения, и ноль - для остальных. Заметим, что индивид мог быть студентом, но не указывать это как свое основное занятие - в этом случае он не отличался по наблюдаемым характеристикам от тех, кто не обучается на дневном отделении.
Опыт работы: единица - есть какой-либо опыт работы, ноль - нет.
Плохое здоровье: единица, если незанятый респондент в качестве ответа на вопрос о своем основном занятии указывал такой вариант: «не работаю по состоянию здоровья, инвалид», ноль - иначе.
Получение пенсии: единица - получает, ноль - нет. При интерпретации важно учитывать, что в выборку не включались респонденты, достигшие пенсионного возраста (60 лет для мужчин и 55 для женщин), так что здесь речь идет о «досрочных» пенсиях.
Тип поселения: «Москва и Санкт-Петербург», «областной центр (кроме Москвы и СПб)», «город», «поселок городского типа», «село».
Уровень безработицы в регионе - единственный некатегориальный признак, брался из данных обследования населения по проблемам занятости, публикуемых Росстатом.
Кроме того, вектор х' включал дамми-переменные для учета временного эффекта.
Так как принадлежность к классу «кочевых» или «оседлых» в рассматриваемой модели неизменна во времени, то вероятность 5г- увязывалась с неизменчивыми характеристиками - признаками региона, к которым относились тип поселения и средний уровень безработицы в регионе за рассматриваемый период - т.е. при анализе данных 20002008 гг. брался средний уровень безработицы именно за эти годы, и он отличался от среднего уровня в 2009-2014 гг.
Описательная статистика анализируемых выборок приведена в Приложении 1.
3.4. Составление функции правдоподобия
Рассмотрим построение функции правдоподобия для модели 4 из подраздела 3.2, так как остальные используемые модели разделенной совокупности - ее частные случаи.
Пусть Уи - случайная величина, отражающая результат поиска работы индивидом ; в году t, а у и - ее наблюдаемое значение (единица, если индивид нашел работу или доходное занятие, ноль - иначе). Если бы принадлежность индивида к классам «кочевых» или «оседлых» была известна, то вероятности выхода в занятость задавались бы так:
Р (( = 1; 4 ,Р) = 1 - ехр ( ) = 1 - ехр (-ехр (-х'Р)), /е М; Р (( = 1;x;t,в) = 0, ; е 5.
Здесь М - множество «кочевых», а 5 - множество «оседлых».
Вероятность произвольного значения у и можно записать следующим образом:
(1) Р (( = уи;х',Р) = (1 - ехр (-ехр ((Р))) (ехр (-ехр (х,/е М;
(2) Р (( = у и;x;t,Р) = 1 - у и, ;е 5.
Вклад всех наблюдений за индивидом ; в функцию правдоподобия (обозначим его Ц) отражает вероятность получить набор значений у;1,...у ;Т , соответствующих результатам попыток трудоустройства в каждом из рассматриваемых временных периодов (Т; -число лет наблюдения за индивидом в анализируемой выборке). При известной принадлежности к «кочевым» или «оседлым» этот вклад рассчитывается как произведение вероятностей, задаваемых формулами (1) и (2):
Т
; \у» I / / /Г.\\\1-у и
Ц(у,т;x'l,...,х;т;Р) = П( -ехр(-ехр(4Р))) (ехр(-ехр(4Р))) уй,г'е М;
t=1
Т
Ц; ((1 — угТ!; 4 — хТ ;Р) = П(1 - у« ),; е 5
t=1
В действительности нам неизвестно, к какому классу принадлежит индивид, так что вклад наблюдений за отдельным индивидом рассчитывается с учетом вероятности его принадлежности к «кочевым» 8; = ехр(г'у)/(1 + ехр(г'у)) или «оседлым»
1 -8,.=1/(1 + ехр ('у)):
Ц ( 1,...,ущ;х'1,...,хТ;Р;<;у)= ^^
X
П(1 - ехр (-ехр Кр))) (р (-ехр (4Р)))1
t=1
Индекс t отражает не «абсолютное» время, а номер наблюдения за отдельным индивидом. Так, если для индивида с номером 1 известны значения всех участвующих в
модели переменных для 2000, 2001 и 2007 годов, то эти три года будут соответствовать значениям t = 1,2,3.
Перемножая вклады наблюдений за всеми индивидами в выборке и логарифмируя это произведение, получаем логарифмическую функцию правдоподобия, максимизация которой дает нам оценки коэффициентов в и у:
1П Ь (ц,..., , хц,..., хМГы ,Р, 21,---, , У) =
N
= Е1п Ь (Уг^-^ Угт,; х1 . . . , хТ; Р; у)
^ тах.
г_ 1 Р,у
Здесь N - число индивидов в выборке.
Максимизация проводилась алгоритмом Берндта - Халла - Халла - Хаусмана (ВННН), реализованном в пакете MaxLik для языка R.
4. Результаты оценивания 4.1. Характеристики качества подгонки и значимости моделей
Оценки параметров моделей 1-4, рассмотренных в предыдущем разделе, представлены в Приложении 2 наряду со значениями логарифма правдоподобия и критерия Акаике (А1С). Все модели с объясняющими переменными оказались значимы в целом - р-значе-ния практически неотличны от нуля. Качество подгонки, измеренное критерием Акаике, последовательно возрастает от модели 1 к модели 4 (значение критерия падает). Это верно для каждой из четырех рассматриваемых выборок.
Критерий Акаике накладывает относительно небольшой штраф на число параметров, и само по себе меньшее значение А1С не стоит рассматривать как существенное доказательство превосходства модели. Велика вероятность, что при добавлении лишних параметров критерий будет показывать улучшение качества подгонки. Традиционно используемые критерии проверки гипотез более требовательны (при обычных уровнях значимости), поэтому в дополнение к А1С использовался тест отношения правдоподобия. Результаты его применения приведены в табл. 1. Здесь и далее используются обозначения М1-М4 для моделей 1-4.
Таблица 1.
Статистики отношения правдоподобия и р-значения (в скобках) для сравнения моделей 1-4
Сравниваемые 2000-2008 гг. 2009-2014 гг.
модели мужчины женщины мужчины женщины
М1-М2 630,1 (0,0000) 436,0 (0,0000) 707,3 (0,0000) 296,4 (0,0000)
М2-М3 138,3 (0,0000) 80,6 (0,0000) 66,2 (0,0000) 99,8 (0,0000)
М3-М4 33,7 (0,0000) 69,1 (0,0000) 41,1 (0,0000) 15,2 (0,0095)
При каждом сравнении более сложная модель оказывалась значимо лучше простой. Наименее значимым улучшением оказалось добавление объясняющих переменных в классифицирующее уравнение при оценивании по женской выборке 2009-2014 гг., но и в этом случае p-значение меньше традиционных уровней значимости.
Строго говоря, критерий отношения правдоподобия неприменим для сравнения М2 и М3, потому что проверяемая гипотеза (5 = 1) соответствует границе допустимых значений параметра 5 - доли «кочевых». В этом случае нет оснований считать, что распределение статистики отношения правдоподобия соответствует обычно используемому распределению хи-квадрат, и это затрудняет сопоставление модели разделенной совокупности с обычной моделью без разделения на классы. Можно разве что повторить сделанное в аналогичной ситуации утверждение Шмидта и Витте: наблюдаемое отношение правдоподобия настолько велико, что представляется убедительным доводом в пользу разделения [Schmidt, Witte, 1989]. Отметим также, что наблюдаемые при переходе от M2 к M3 изменения критерия Акаике принято рассматривать как весьма значительные (см. [Hilbe, 2009]), хотя и сам Хилбе отмечает, что указанные им правила сравнения моделей по AIC не имеют строгого обоснования.
Подытоживая сравнение качества подгонки, можно сделать следующее утверждение. Все дополнения к обычной cloglog-модели - и разделение на два класса, и увязывание принадлежности к классам с характеристиками места проживания - оказываются статистически значимыми. Это не обязательно означает, что более сложная модель окажется более полезной. Возможно, практически более привлекательными окажутся М1 и М3, позволяющие одним числом (долей «кочевых») охарактеризовать активность поиска работы среди незанятого населения, в то время как более полная модель, где доля «кочевых» меняется от поселения к поселению, не обладает той экономичностью, которая нужна для получения интерпретируемых результатов.
4.2. Оценки уравнения вероятности трудоустройства
Выявление детерминант продолжительности поиска не является основной задачей настоящего исследования, соответствующие оценки будут освещены кратко. Намного детальнее этот вопрос рассмотрен в предыдущих исследованиях по российским данным, выполненных разными авторами. Обзор этих исследований приведен в подразделе 2.2, так что интересующийся читатель без труда найдет более полную информацию о длительности поиска работы в России и ее ковариатах.
Ниже приведены только основные результаты, касающиеся уравнения вероятности трудоустройства, наиболее интересные с позиций настоящего исследования.
> Оценки коэффициентов в моделях 2-4 схожи. Таким образом, учет разделенной совокупности не дает существенно новых сведений о ковариатах продолжительности поиска и представляет интерес только для определения доли участвующих в поиске. Этот вывод не претендует на общность и касается конкретно тех моделей и данных, которые рассматриваются в этой статье. Единственное существенное различие между моделью 4, с одной стороны, и моделями 2 и 3, с другой стороны, заключается в коэффициентах при переменных, отражающих региональные характеристики, которые в М4 оказываются ближе к нулю. Это важный момент, так как именно включение характеристик места жительства в уравнение участия отличает М4 от других моделей. Можно сказать, что допол-
нительные параметры «берут на себя» учет различий между типами поселения, которые проявляются не только в вероятности трудоустройства, но и в уровне активности поиска. Учет индивидуальных характеристик в уравнении участия, возможно, позволил бы пересмотреть и оценки, касающиеся ковариат продолжительности поиска, но это связано с качественным усложнением модели.
> Включенные в модель индивидуальные признаки значимы во всех выборках, хотя незначимыми оказываются различия между отдельными категориями одного и того же признака (например, между образовательными категориями «среднее общее» и «нет среднего образования»). Характеристики места проживания отражают значимые различия для мужчин, но для женщин их значимость зависит от модели и временного периода.
> Оценки, полученные по данным 2000-2008 гг., похожи на те, что приведены в работе [Фурманов, Шелковникова, 2014], опирающейся на данные того же периода. Новый результат касается получения пенсии и плохого здоровья как важных индикаторов низкой вероятности трудоустройства - впрочем, это не противоречит результатам указанной статьи, так как в ней соответствующие переменные просто не включались в оцениваемые уравнения.
На качественном уровне связь вероятности трудоустройства с объясняющими переменными не изменилась после 2008 г. Единственное заметное различие касается роли типа поселения. Оценки по данным 2000-2008 гг. свидетельствуют, что вероятность найти работу для жителей поселков городского типа была заметно меньшей, чем для жителей других поселений. Судя по результатам, полученным по выборке 2009-2014 гг., различия между городами и ПГТ уменьшились, а наиболее длительным стал поиск работы в селе.
4.3. Оценки уравнения участия в поиске
Наиболее удобны для осмысления оценки модели без объясняющих переменных (М1). Два оцениваемых параметра позволяют рассчитать доли «кочевых» и «оседлых» среди незанятых и вероятность нахождения работы для «кочевых». Результаты этих расчетов приведены в табл. 2.
Таблица 2.
Участие в поиске и вероятность трудоустройства согласно М1
2000- -2008 гг. 2009 -2014 гг.
мужчины женщины мужчины женщины
Доля ищущих работу среди незанятых, % 81,1 79,0 68,8 67,0
Вероятность трудоустройства в течение года для ищущих, % 47,1 42,0 50,1 43,9
Таблица 2 подталкивает к двум выводам. Во-первых, большинство незанятых могут рассматриваться как ищущие работу. Во-вторых, доля ищущих в период 2009-2014 гг. ниже, чем в 2000-2008 гг. Второй вывод требует осторожности: период с 2009 г. по 2014 г.
охватывает пять лет, а предыдущий период - восемь лет. Кажущееся падение доли ищущих может быть связано с сокращением времени наблюдения. Согласно сделанным предпосылкам, к «оседлым» относятся те, кто никогда не выходит на работу, а принадлежность к «оседлым» определяется раз и навсегда - естественно, что при увеличении временного периода оценка доли «оседлых» падает по двум причинам. Первая - неактивные в какой-то момент индивиды могут приступить к поиску работы в течение рассматриваемого периода. Вторая - существование «почти оседлых», т.е. тех, для кого вероятность трудоустройства положительна, но близка к нулю. На длительном промежутке времени эти люди устраиваются на работу, так что модель, предполагающая наличие всего двух классов незанятых, в каком-то смысле вынуждена относить их к «кочевым». Тогда оценка доли ищущих должна расти при увеличении продолжительности наблюдения, а оценка вероятности трудоустройства - падать, что согласуется с табл. 2.
При использовании слишком короткого временного периода возникает другая проблема. Для периодов безработицы и незанятости характерна так называемая отрицательная временная зависимость (negative duration dependence): вероятность трудоустройства падает с течением времени, так что среди недавно уволенных индивидов многие быстро находят работу, а среди тех, кто сидит без работы год и больше, случаи выхода в занятость редки. Таким образом, если человек в течение года не нашел работу, то в следующем году найдет ее с еще меньшей вероятностью - в результате, доля наблюдений за идущими подряд неудачными попытками трудоустройства выше, чем при отсутствии временной зависимости. Модель реагирует на это завышением доли «оседлых». По сути, это тоже проблема «почти оседлых»: к какому классу относить застойных безработных?
Из приведенных соображений следует не то, что модель необходимо усложнять, но то, что к полученным оценкам следует подходить с рассудительностью. На всякий случай авторы повторили расчеты по двухлетним периодам - меньше, чем за два наблюдаемых периода оценки модели разделенной совокупности получить просто невозможно. Рассчитанные доли «кочевых» колебались в зависимости от периода от 50 до 66% для мужчин и от 49 до 68% для женщин, что все же намного больше доли безработных в составе незанятых по данным Росстата (примерно 20% для мужчин и 10% для женщин).
Включение в уравнение поиска объясняющих переменных приводит к заметному росту оцененной по М3 доли ищущих (в 2000-2008 гг. мужчины - 89,4%, женщины -89,5%; в 2009-2014 гг. мужчины - 86,8%, женщины - 78,7%). Происходит это потому, что учет индивидуальных характеристик позволяет выделить слои «почти оседлых». Люди, имеющие наблюдаемые признаки, свидетельствующие о низкой вероятности трудоустройства, «вписываются» в уравнение поиска и относятся к «кочевым».
В возможности разделить ищущих на множество групп с разной интенсивностью поиска кроется и недостаток модели М3. С содержательной точки зрения человек с близкой к нулю вероятностью трудоустройства практически не отличается от человека с нулевой вероятностью, однако формально первый не может быть отнесен к «оседлым». В результате, получив оценку доли ищущих в 90%, исследователь должен понимать, что в эти 90% входят и те, для кого шансы найти работу весьма малы. В модели с объясняющими переменными отличие ищущих от неактивных может заключаться не столько в разной вероятности трудоустройства, сколько в разных «моделях», описывающих эту вероятность (слово «модель» в этом предложении приходится применять в двух разных смыслах). Чтобы прояснить предыдущую формулировку, можно предложить такое истолкова-
ние: 90% индивидов в выборке вписываются в зависимость, задаваемую уравнением вероятности трудоустройства, а учет остальных 10% требует дополнительного параметра -доли «оседлых».
Предположительно, доля ищущих, оцененная по М1, полезнее для человека, желающего получить представление об обороте рабочей силы, а оценка по М3 интереснее для эконометриста, в центре внимания которого статистическая связь трудоустройства с набором объясняющих переменных. Для такого исследователя приведенные выше данные по М3 означают, что подавляющая часть незанятых при эконометрическом анализе может рассматриваться как ищущие работу. При сокращении анализируемого периода оценка доли ищущих также снижается, но этому не будет уделяться особого внимания -за исключением ранних статей [Foley, 1997a; Grogan, van den Berg, 2001], исследования поиска работы по данным РМЭЗ проводились по данным, полученным за периоды от пяти до восьми лет.
Модель 4 не дает единой оценки доли ищущих, зато позволяет рассчитать разные доли в разных поселениях. Представление о связи этой доли с типом поселения и средним уровнем безработицы в регионе дает табл. 3. В ней приведены рассчитанные доли ищущих работу для некоторых регионов и типов поселения, представленных в данных РМЭЗ. Из всех регионов для этого примера были отобраны четыре: Москва (самый низкий уровень безработицы), Тверская область и Краснодарский край (уровень безработицы, близкий к среднему) и Кабардино-Балкария (самый высокий уровень безработицы). Приведенные оценки условны, так как участвующие в модели переменные, конечно, не описывают всех различий между поселениями - точные расчеты для регионов вряд ли можно осуществить по данным РМЭЗ.
Таблица 3.
Рассчитанные по М4 доли ищущих работу для некоторых типов поселения, %
Регион Тип поселения Доля ищущих работу среди незанятых
2000-2008 гг. 2009-2014 гг.
мужчины женщины мужчины женщины
Москва Москва и СПб 87 96 98 76
Тверская область Город 95 97 90 88
Тверская область Село 89 88 79 69
Краснодарский край Областной центр (Краснодар) 94 91 94 83
Краснодарский край Село 87 82 78 69
Кабардино-Балкария ПГТ 64 65 86 70
Кабардино-Балкария Село 69 44 55 61
Доля «кочевых» для периода 2009-2014 гг. оказалась в большинстве случаев (но не везде) снова ниже, чем для 2000-2008 гг. По вышеприведенным соображениям это не должно рассматриваться как свидетельство падения экономической активности - оценки, полученные для периодов разной длины, напрямую несопоставимы. Рассчитанная доля в 44% для женщин в селах Кабардино-Балкарии - единственный случай, когда модель оценивает долю «кочевых» ниже доли «оседлых».
Повторим, что рассчитанные различия доли ищущих между регионами не стоит рассматривать как надежные результаты. Таблица 3 служит двум целям. Во-первых, это пример того, что можно получить, используя рассмотренную модель. Во-вторых, они свидетельствуют, что основной вывод, полученный по М3, не меняется при учете различий между поселениями в вероятности участия в поиске.
5. Выводы
Все приведенные в статье расчеты свидетельствуют, что более половины незанятого населения России от 18 лет до пенсионного возраста могут рассматриваться как ищущие работу, а точнее - как способные к переходу в занятость. Перейдем к самому важному и попробуем сформулировать, что этот результат означает и чего он не означает.
Согласно официальной статистике, доля экономически активных среди незанятых в период с 2000 г. по 2014 г. колебалась около отметки 20% для мужчин и 10% для женщин, так что есть расхождение в несколько раз между уровнем экономической активности, рассчитанным по методологии МОТ и оцененным как доля ищущих в модели разделенной совокупности. Приведенные в статье оценки никак не перечеркивают цифр Росстата, а только дополняют их. Различия между безработными и неактивными в методологии МОТ меньше, чем между «кочевыми» и «оседлыми» в модели. Несмотря на принятое название, неактивные, или не входящие в рабочую силу, могут переходить в занятое состояние, как и безработные, пусть и с меньшей вероятностью. Для модельных «оседлых» выход в занятость закрыт.
Недостаток «официального» разделения незанятых в том, что между значительными массами безработных и экономически неактивных нет ясной границы - утверждение, уже приведенное здесь при рассмотрении статьи [Clark, Summers, 1979], актуально и сейчас. Недостаток модельного деления, наоборот, в этой «ясной границе», благодаря которой любой, кто хоть при каких-то условиях может устроиться на работу, рассматривается как ищущий. Проблема в том, что деление всех незанятых на два класса в любом случае условно, а более сложное деление может оказаться трудноосмыслимым и бесполезным. В настоящий момент авторы работают над проблемой выявления экономической активности с использованием более гибкой методологии, допускающей различия в интенсивности поиска среди ищущих, но оценок, опровергающих приведенные в настоящей статье результаты, пока не получено.
Если с точки зрения изучения трудовой мобильности в целом полученные оценки -лишь возможное представление о динамике незанятых, польза которого может быть оспорена, то с точки зрения регрессионного и, в особенности, эконометрического анализа эти оценки имеют большее значение. Полученные по моделям с объясняющими переменными оценки доли ищущих, равные 80-90%, говорят о том, что при построении модели поиска работы имеет смысл существенно расширять информационную базу, не огра-
ничиваясь только безработными. Сама по себе идея не нова - например, в работе [Карцева, 2002] ослабление критериев МОТ позволило увеличить выборку в два раза, не приведя при этом к существенному изменению оценок регрессии, что свидетельствовало бы о разнородности выборки. Однако модель разделенной совокупности позволяет использовать данные о всех незанятых, еще увеличивая объем выборки и при этом получая дополнительную информацию - оценки уравнения участия в поиске.
В идеале эконометрическая модель должна служить мостом между теорией поиска работы и располагаемыми данными, и здесь можно обратить внимание на то, что теоретические модели не привязаны к определению безработицы, в них решение об участии в поиске - вопрос соотношения ненаблюдаемых издержек поиска и ожидаемой выгоды. Привязка этого решения к определению МОТ - решение естественное, но все же произвольное, и разделение незанятых на «кочевых» и «оседлых» представляется разумной альтернативой.
В заключение укажем на два недостатка проведенного исследования, которые авторам кажутся наиболее существенными. Во-первых, оценка доли «кочевых» увеличивается с продолжительностью анализируемого периода - это естественно, но все же удобнее было бы иметь более устойчивую характеристику уровня экономической активности. Во всяком случае даже расчеты по данным самых коротких, двухлетних, периодов говорят о высокой доле потенциально занятых. Во-вторых, модель разделенной совокупности в том виде, в котором она использована здесь, не позволяет включить в уравнение участия переменные, изменяющиеся во времени, - это могло бы привести к пересмотру тех параметров, что отражают связь вероятности трудоустройства с личными характеристиками. Эта связь не ставится в центр внимания в настоящей статье, но несомненно представляет интерес.
Приложение 1
Таблица П1.1.
Описательная статистика, %
Признак 2000- -2008 2009- -2014
мужчины женщины мужчины женщины
Найдена работа в течение года 34 30 31 26
Возраст, лет
18-24 33 36 33 36
25-34 19 24 16 25
35-49 29 27 26 26
от 50 лет до пенсионного возраста 19 13 25 13
Семейное положение
не состоит в браке 49 38 50 40
зарегистрированный брак 40 49 38 45
незарегистрированный брак 11 13 12 15
Образование
нет среднего образования 20 14 25 18
среднее общее 51 47 50 47
среднее специальное 20 29 15 22
высшее 9 10 10 13
Обучение на дневном отделении 19 19 19 21
Получение пенсии 19 14 22 12
Плохое здоровье 9 6 9 5
Наличие опыта работы 74 69 71 65
Тип поселения
Москва и Санкт-Петербург 9 11 9 11
областной центр 23 25 25 26
город 21 23 20 22
ПГТ 10 8 9 7
село 36 33 37 34
Уровень безработицы в регионе: 9,28 8,94 6,78 6,56
среднее (стандартное отклонение) (5,13) (4,87) (2,83) (2,80)
Всего наблюдений, ед. 7512 9079 6720 7896
Всего индивидов, ед. 3195 3646 3366 3871
Примечание. В таблице приведено распределение признаков по наблюдениям, не по индивидам.
Приложение 2
Таблица П2.1.
Оценки коэффициентов моделей 1-4 по выборке мужчин, 2000-2008 гг.
Переменная М1 М2 М3 М4
Уравнение вероятности трудоустройства (cloglog)
Свободный член -0,45 -0,62 -0,30 -0,38
(0,02) (0,13) (0,14) (0,14)
Возраст
(базовая категория - 25-34), лет
18-24 0,36*** 0,28*** 0,26***
(0,07) (0,07) (0,07)
35-49 -0,51*** -0,47*** -0,48***
(0,06) (0,06) (0,06)
50-59 -1,08*** 1 11*** -1,11***
(0,08) (0,08) (0,08)
Семейное положение (базовая
категория - не состоит в браке)
зарегистрированный брак 0,41*** 0,46*** 0,44***
(0,06) (0,05) (0,05)
незарегистрированный брак 0,20*** 0,15** 0,15**
(0,07) (0,07) (0,07)
Образование (базовая категория -
нет среднего образования)
среднее общее 0,10* 0,08 0,08
(0,06) (0,06) (0,06)
среднее специальное 0,10 0,08 0,08
(0,07) (0,07) (0,07)
высшее 0,30*** 0,22*** 0,26***
(0,08) (0,09) (0,09)
Обучающийся на дневном -0,48*** -0,53*** -0,54***
отделении (0,07) (0,07) (0,07)
Пенсионер -0,70*** -0,74*** -0,77***
(0,08) (0,08) (0,08)
Плохое здоровье -0,62*** -0,64*** -0,65***
(0,12) (0,12) (0,12)
Наличие опыта работы 0,57*** 0,49*** 0,46***
(0,06) (0,07) (0,07)
Окончание табл. П2.1.
Переменная М1 М2 М3 М4
Тип поселения (базовая категория - село)
Москва и Санкт-Петербург 0,00 (0,09) 0,02 (0,09) 0,12 (0,09)
областной центр 0,49*** (0,06) 0,45*** (0,06) 0,35*** (0,06)
город 0,33*** (0,06) 0,29*** (0,06) 0,21*** (0,06)
ПГТ -0,17** (0,08) -0,17** (0,08) -0,11* (0,09)
Уровень безработицы в регионе -0,06*** (0,01) -0,06*** (0,01) -0,04*** (0,01)
Временной эффект Нет Есть Есть Есть
Уравнение участия в поиске [!одк]
Свободный член 1,46 (0,07) 2,14 (0,12) 2,69 (0,31)
Тип поселения (базовая категория - село)
Москва и Санкт-Петербург -0,62 (0,42)
областной центр 0,97** (0,39)
город 0,75** (0,35)
ПГТ 0,19 (0,30)
Средний уровень безработицы в регионе -0,09*** (0,02)
1п L -4614,6 -4299,5 -4230,4 -4213,5
А1С 9233,2 8649,0 8512,7 8489,1
Примечания. Здесь и последующих таблицах под коэффициентами в скобках приведены стандартные ошибки, звездочками отмечена значимость оценок (кроме свободных членов уравнений): * - значимость на уровне 10%, ** - 5%, *** - 1%.
Таблица П2.2.
Оценки коэффициентов моделей 1-4 по выборке женщин,
2000-2008 гг.
Переменная М1 М2 М3 М4
Уравнение вероятности трудоустройства (cloglog)
Свободный член -0,61 -0,94 -0,68 -0,88
(0,02) (0,13) (0,13) (0,14)
Возраст
(базовая категория - 25-34), лет
18-24 0,37*** 0,29*** 0,27***
(0,06) (0,06) (0,06)
35-49 -0,29*** -0,23*** -0,23***
(0,06) (0,05) (0,05)
50-59 -0,73*** 0 71*** -0,71***
(0,09) (0,09) (0,09)
Семейное положение (базовая
категория - не состоит в браке)
зарегистрированный брак -0,33*** -0,32*** -0,33***
(0,05) (0,05) (0,05)
незарегистрированный брак -0,18*** -0 19*** -0,21***
(0,06) (0,06) (0,06)
Образование (базовая категория -
нет среднего образования)
среднее общее 0,01 -0,02 0,01
(0,06) (0,06) (0,06)
среднее специальное 0,18*** 0,14** 0,15**
(0,07) (0,07) (0,07)
высшее 0,36*** 0,31*** 0,30***
(0,08) (0,08) (0,08)
Обучающийся на дневном -0,43*** -0,44*** -0,46***
отделении (0,07) (0,07) (0,07)
Пенсионерка -0,60*** -0,62*** -0,65***
(0,09) (0,09) (0,09)
Плохое здоровье -0,80*** 0 81*** -0,81***
(0,15) (0,15) (0,15)
Наличие опыта работы 0,62*** 0,58*** 0,52***
(0,05) (0,06) (0,06)
Окончание табл. П2.2.
Переменная М1 М2 М3 М4
Тип поселения (базовая категория - село)
Москва и Санкт-Петербург -0,07 (0,08) -0,13 (0,09) -0,10 (0,10)
областной центр 0,41*** (0,05) 0,40*** (0,05) 0,25*** (0,06)
город 0,29*** (0,06) 0,24*** (0,06) 0,03 (0,07)
ПГТ -0,06 (0,09) -0,07 (0,09) -0,25** (0,10)
Уровень безработицы в регионе -0,04*** (0,01) -0,04*** (0,01) 0,00 (0,01)
Временной эффект Нет Есть Есть Есть
Уравнение участия в поиске Родк]
Свободный член 1,33 (0,07) 2,14 (0,13) 2,87 (0,32)
Тип поселения (базовая категория - село)
Москва и Санкт-Петербург 0,48 (0,84)
областной центр 0,80*** (0,29)
город 1,44*** (0,45)
ПГТ 0,88** (0,39)
Средний уровень безработицы в регионе -0,15*** (0,02)
1п L -5335,9 -5117,9 -5077,6 -5043,0
А1С 10675,7 10285,7 10207,2 10148,0
Таблица П2.3.
Оценки коэффициентов моделей 1-4 по выборке мужчин, 2009-2014 гг.
Переменная М1 М2 М3 М4
Уравнение вероятности трудоустройства [с1од1од]
Свободный член -0,36 -0,87 -0,62 -0,74
(0,03) (0,16) (0,17) (0,19)
Возраст
(базовая категория - 25-34), лет
18-24 0,56*** 0,53*** 0,52***
(0,08) (0,08) (0,08)
35-49 -0,39*** -0,30*** -0,29***
(0,07) (0,07) (0,07)
50-59 -0,90*** -0 89*** -0,87***
(0,08) (0,08) (0,08)
Семейное положение (базовая
категория - не состоит в браке)
зарегистрированный брак 0,52*** 0,59*** 0,58***
(0,06) (0,07) (0,07)
незарегистрированный брак 0,47*** 0,52*** 0,47***
(0,07) (0,08) (0,08)
Образование (базовая категория -
нет среднего образования)
среднее общее -0,00 -0,00 0,03
(0,06) (0,06) (0,06)
среднее специальное 0,18** 0,17** 0,18**
(0,07) (0,08) (0,08)
высшее 0,17** 0,16* 0,20**
(0,08) (0,09) (0,09)
Обучающийся на дневном -0,55 -0,58*** -0,61***
отделении (0,08) (0,08) (0,08)
Пенсионер -1,06*** -114*** 117***
(0,09) (0,09) (0,09)
Плохое здоровье -0,61*** -0,64*** -0,65***
(0,14) (0,14) (0,14)
Наличие опыта работы 0,70*** 0,68*** 0,63***
(0,07) (0,07) (0,07)
Окончание табл. П2.3.
Переменная М1 М2 М3 М4
Тип поселения (базовая категория - село)
Москва и Санкт-Петербург 0,08 (0,11) -0,02 (0,11) -0,17 (0,13)
областной центр 0,46*** (0,06) 0,42*** (0,07) 0,13 (0,08)
город 0,53*** (0,07) 0,53*** (0,07) 0,30*** (0,09)
ПГТ 0,26*** (0,09) 0,28*** (0,10) -0,09 (0,12)
Уровень безработицы в регионе -0,09*** (0,01) -0 09*** (0,01) -0,05*** (0,01)
Временной эффект Нет Есть Есть Есть
Уравнение участия в поиске [!одк]
Свободный член 0,79 (0,06) 1,89 (0,14) 2,62 (0,43)
Тип поселения (базовая категория - село)
Москва и Санкт-Петербург 1,57 (1,71)
областной центр 1,41 *** (0,41)
город 0,86** (0,35)
ПГТ 1,62*** (0,54)
Средний уровень безработицы в регионе -0,21*** (0,05)
1п L -3949,1 -3595,5 -3562,4 -3541,8
А1С 7902,2 7234,9 7170,7 7139,6
Таблица П2.4.
Оценки коэффициентов моделей 1-4 по выборке женщин,
2009-2014 гг.
Переменная М1 М2 М3 М4
Уравнение вероятности трудоустройства [ЫодЬд]
Свободный член -0,54 -1,27 -0,74 -0,72
(0,03) (0,17) (0,18) (0,21)
Возраст
(базовая категория - 25-34), лет
18-24 0,26*** 0,13* 0,15*
(0,07) (0,08) (0,08)
35-49 -0,21*** -0,16** -0,15**
(0,06) (0,07) (0,07)
50-59 -0,55*** -0,55*** -0,52***
(0,09) (0,10) (0,10)
Семейное положение (базовая
категория - не состоит в браке)
зарегистрированный брак -0,33*** -0,31*** -0,33***
(0,06) (0,06) (0,06)
незарегистрированный брак 0,03 0,06 0,04
(0,07) (0,07) (0,07)
Образование (базовая категория -
нет среднего образования)
среднее общее -0,09 -0,10 -0,11
(0,07) (0,07) (0,07)
среднее специальное -0,03 -0,07 -0,08
(0,07) (0,08) (0,08)
высшее 0,27*** 0,27*** 0,25***
(0,08) (0,09) (0,09)
Обучающийся на дневном -0,14* -0,21** -0,24***
отделении (0,08) (0,08) (0,09)
Пенсионерка -0,52*** -0,56*** -0,58***
(0,10) (0,10) (0,10)
Плохое здоровье -0,84*** -0,87*** -0,88***
(0,18) (0,18) (0,18)
Наличие опыта работы 0,78*** 0,72*** 0,70***
(0,06) (0,07) (0,07)
Окончание табл. П2.4.
Переменная М1 М2 М3 М4
Тип поселения (базовая категория - село)
Москва и Санкт-Петербург 0,12 (0,10) 0,09 (0,12) 0,06 (0,16)
областной центр 0,38*** (0,06) 0,41*** (0,07) 0,17* (0,10)
город 0,42*** (0,06) 0,39*** (0,07) 0,09 (0,10)
ПГТ 0,29*** (0,10) 0,39*** (0,11) 0,23 (0,15)
Уровень безработицы в регионе -0,04*** (0,01) -0,05*** (0,01) -0,03* (0,08)
Временной эффект Нет Есть Есть Есть
Уравнение участия в поиске [!одк]
Свободный член 0,71 (0,06) 1,31 (0,10) 1,26 (0,39)
Тип поселения (базовая категория - село)
Москва и Санкт-Петербург -0,01 (0,40)
областной центр 0,75*** (0,25)
город 1,13*** (0,35)
ПГТ 0,40 (0,33)
Средний уровень безработицы в регионе -0,07 (0,05)
1п L -4404,1 -4255,9 -4206,1 -4198,5
А1С 8812,3 8555,9 8458,1 8452,9
* * *
СПИСОК ЛИТЕРА ТУРЫ
Денисова И.А., Донецкий А.М., Колесникова О.А., Федченко А.А., Лядова Н.И. Длительное пребывание в регистре безработных: уровень образования, неудачное стечение обстоятельств или что-то еще? // Социальная политика: реалии XXI века. Вып. 1. М.: Сигналъ, 2003. С. 73-102.
Карцева М.А. Влияние образования на вероятность нахождения работы в России: Препринт РЭШ. BSP/2002/058R. 2002.
Коровкин А.Г. Динамика занятости и рынка труда. Вопросы макроэкономического анализа и прогнозирования. М.: МАКС Пресс, 2001.
Ниворожкина Л.И., Ниворожкин Е.М., Шухмин А.Г. Моделирование поведения населения на рынке труда крупного города: продолжительность регистрируемой безработицы // Научный доклад РПЭИ № 01-08. 2001.
Румянцева Е.В., Фурманов К.К. Моделирование времени жизни ипотечного кредита // Прикладная эконометрика. 2016. 41(1). С. 123-143.
Фурманов К.К. Моделирование длительности безработицы по данным Российского мониторинга экономики и здоровья // Экономический журнал ВШЭ. 2009. Т. 13. № 3. С. 403-427.
Фурманов К.К., Шелковникова И.А. Безработные и экономически неактивные: в чем различия? Моделирование вероятности трудоустройства // Прикладная эконометрика. 2014. 35(3). С. 86-106.
Addison J.T., Portugal P. Unemployment Duration: Competing and Defective Risks // The Journal of Human Resources. 2003. 38(1). Р. 156-191.
Boag J.W. Maximum Likelihood Estimates for the Proportion of Patients Cured by Cancer Therapy // Journal of the Royal Statistical Society. Series B (Methodological). 1949. 11(1). Р. 15-53.
Blumen I.M., Kogan M., McCarthy P.J. The Industrial Mobility of Labor As a Probability Process. Ithaca: Cornell University Press, 1955.
Clark K.B., Summers L.H. Labor Market Dynamics and Unemployment: A Reconsideration // Brookings Papers on Economic Activity. 1979. 1. Р. 13-72.
Ehrenberg R., Smith R. Modern Labor Economics. New York: Harper-Collins, 1994.
Foley M.C. Determinants of Unemployment Duration in Russia: Yale University, Economic Growth Center. Center Discussion Paper № 779. 1997a.
Foley M.C. Labor Market Dynamics in Russia: Yale University, Economic Growth Center. Center Discussion Paper № 780. 1997b.
Flinn C.J., Heckman J.J. Are Unemployed and Out of the Labor Force Behaviorally Distinct Labor Force States? // Journal of Labor Economics. 1983. 1. P. 28-42.
Goldsmith A.H., VeumJ.R., DarityJr.W. Are Unemployed and Out of the Labor Force Distinct States?: A Psychological Approach // Journal of Economic Psychology. 1995. 16. Р. 275-295.
Gonul F. New Evidence on whether Unemployment and Out of the Labor Force are Distinct States // Journal of Human Resources. 1992. 27. Р. 329-361.
Grogan L., van den Berg G.J. The Duration of Unemployment in Russia // Journal of Population Economics. 2001. 14(3). Р. 549-568.
Gronau R. Information and Frictional Unemployment // American Economic Review. 1971. 61(3). Р. 290-301.
Hilaski H.J. How Poverty Area Residents Look for Work // Monthly Labor Review. 1971. 94(3). Р. 41-45.
Hilbe J.M. Logistic Regression Models. CRC Press, 2009.
Lancaster T. Econometric Methods for the Duration of Unemployment // Econometrica. 1979. 47(4). Р. 939-956.
Liu B., Sing T.F. «Cure» Effects and Mortgage Default: A Split Population Survival Time Model // The Journal of Real Estate Finance and Economics. 2018. 56(2). P. 217-251.
Maltz M.D., McCleary R. The Mathematics of Behavioral Change: Recidivism and Construct Validity // Evaluation Quarterly. 1977. 1. P. 421-438.
Mortensen D. Job Search, The Duration of Unemployment, and the Phillips Curve // American Economic Review. 1970. 60(5). P. 847-862.
Nickell S. Estimating the Probability of Leaving Unemployment // Econometrica. 1979. 47(5). P. 1249-1266.
Nivorozhkin A. New Estimates of the Risk and Duration of Registered Unemployment in Urban Russia // International Journal of Manpower. 2006. 27(3). P. 274-289.
Reid G.L. Job Search and Effectiveness of Job-Finding Methods // Industrial and Labor Relations Review. 1972. 25(4). P. 479-495.
Schmidt P., Witte A.D. Predicting Criminal Recidivism Using 'Split Population' Survival Time Models // Journal of Econometrics. 1989. 40(1). P. 141-159.
Swaim P., Podgursky M. Female Labor Supply Following Displacement: A Split-Population Model of Labor Force Participation and Job Search // Journal of Labor Economics. 1994. 12(4). P. 640-656.
Yamaguchi K. Mover-Stayer Models For Analyzing Event Nonoccurence and Event Timing with Time-Dependent Covariates: An Application to an Analysis of Remarriage // Sociological Methodology. 1998. 28. P. 327-61.
Yamaguchi K. Accelerated Failure-Time Mover-Stayer Regression Models for the Analysis of LastEpisode Data // Sociological Methodology. 2003. 33(1). P. 81-110.
Job Search in Russia: A Split-Population Model
Ekaterina Batalova1, Kirill Furmanov2
1 National Research University Higher School of Economics, 20, Myasnitskaya st., Moscow, 101000, Russian Federation.
E-mail: [email protected]
2 National Research University Higher School of Economics, 20, Myasnitskaya st., Moscow, 101000, Russian Federation.
E-mail: [email protected]
Studies on job search in Russia regularly raise the problem of separating seekers from non-seekers and forming a sample for empirical analysis of job search. Different researchers provide different solutions to the problem, but there are two main approaches to constructing a sample. The first one is to use data only on registered unemployment, the second approach is to use data from surveys that include questions on whether a respondent is searching for job and is ready to start working after receiving an acceptable offer. This paper provides estimates of an empirical job search model that explains both decision whether to seek a job or not and a probability of a successful search. That decision is unobservable and may not coincide with answers that individuals give during the survey. The model is estimated using data from Russian Longitudinal Monitoring Survey (RLMS-HSE) for the 2000-2014 period. According to obtained estimates, most of the non-employed may be considered as job seekers. The results not only provide a new insight into economic activity of non-employed but also show a possibility to significantly enhance information base for empirical studies on job search.
Key words: job search; unemployment; labor force; split-population model. JEL Classification: J64, C41.
* * *
References
Denisova I.A., Doneckiy A.M., Kolesnikova O.A., Fedchenko A.A., Lyadova N.I. (2003) Dlitel'noe prebyvanie v registre bezrabotnyh: uroven' obrazovaniya, neudachnoe stechenie obstoyatel'stv ili chto-to eschyo? [Long Periods of Registered Unemployment: Education, Bad Luck or Something Else?] Social Policy: Realities of XXI Century. Iss. 1. Moscow: Signal, pp. 73-102.
Kartseva M.A. (2002) Vliyanie obrazovaniya na veroyatnost' nahozhdeniya raboty v Rossii [Effect of Education on Probability of Finding a Job in Russia]. NES Working Paper. BSP/2002/058R.
Korovkin A.G. (2001) Dinamika zanyatosti i rynka truda. Voprosy makroekonomicheskogo analiza i prognozirovaniya [Labor Market and Employment Dynamics. Issues of Macroeconomic Analysis and Forecasting]. Moscow: MAKS Press.
Nivorozhkina L.I., Nivorozhkin E.M., Shuhmin A.G. (2001) Modelirovanie povedeniya naseleniya na rynke truda krupnogo goroda: prodolzhitel'nost' registriruemoy bezraboticy [Modeling the Population Behavior on the Labor Market of a Large City: The Duration of Registered Unemployment]. EERC Report no 01-08.
Rumyantseva E.V., Furmanov K.K. (2016) Modelirovanie vremeni zhizni ipotechnogo kredita [Modeling Mortgage Survival]. Applied Econometrics, 41(1), pp. 123-143.
Furmanov K.K. (2009) Modelirovanie dlitel'nosti bezraboticy po dannym Rossiyskogo monitoringa economiki i zdorovya [Modeling the Duration of Unemployment Using Data from Russian Longitudinal Monitoring Survey]. HSE Economic Journal, 13, 3, pp. 403-427.
Furmanov K.K., Shelkovnikova IA (2014) Bezrabotnye I ekonomicheski neaktivnye: v chyom ra-zlichiya? Modelirovanie veroyatnosti trudoustroystva [Unemployed and Out of the Labor Force: What Is the Difference? Modeling the Probability of Finding a Job]. Applied Econometrics, 35, 3, pp. 86-106.
Addison J.T., Portugal P. (2003) Unemployment Duration: Competing and Defective Risks. The Journal of Human Resources, 38, 1, pp. 156-191.
Boag J.W. (1949) Maximum Likelihood Estimates for the Proportion of Patients Cured by Cancer Therapy. Journal of the Royal Statistical Society. Series B (Methodological), 11, 1, pp. 15-53.
Blumen I.M., Kogan M., McCarthy P.J. (1955) The Industrial Mobility of Labor As a Probability Process. Ithaca: Cornell University Press.
Clark K.B., Summers L.H. (1979) Labor Market Dynamics and Unemployment: A Reconsideration. Brookings Papers on Economic Activity, 1, pp. 13-72.
Ehrenberg R., Smith R. (1994) Modern Labor Economics. New York: Harper-Collins.
Foley M.C. (1997a) Determinants of Unemployment Duration in Russia. Yale University, Economic Growth Center. Center Discussion Paper no 779.
Foley M.C. (1997b) Labor Market Dynamics in Russia. Yale University, Economic Growth Center. Center Discussion Paper no 780.
Flinn C.J., Heckman J.J. (1983) Are Unemployed and Out of the Labor Force Behaviorally Distinct Labor Force States? Journal of Labor Economics, 1, pp. 28-42.
Goldsmith A.H., Veum J.R., Darity Jr.W. (1995) Are Unemployed and Out of the Labor Force Distinct States?: A Psychological Approach. Journal of Economic Psychology, 16, pp. 275-295.
Gonul F. (1992) New Evidence on whether Unemployment and Out of the Labor Force are Distinct States. Journal of Human Resources, 27, pp. 329-361.
Grogan L., van den Berg G.J. (2001) The Duration of Unemployment in Russia. Journal of Population Economics, 14, 3, pp. 549-568.
Gronau R. (1971) Information and Frictional Unemployment. American Economic Review, 61, 3, pp. 290-301.
Hilaski H.J. (1971) How Poverty Area Residents Look for Work. Monthly Labor Review, 94, 3, pp. 41-45.
Hilbe J.M. (2009) Logistic Regression Models. CRC Press.
Lancaster T. (1979) Econometric Methods for the Duration of Unemployment. Econometrica, 47, 4, pp. 939-956.
Liu B., Sing T.F. (2018) «Cure» Effects and Mortgage Default: A Split Population Survival Time Model. The Journal of Real Estate Finance and Economics, 56, 2, pp. 217-251.
Maltz M.D., McCleary R. (1977) The Mathematics of Behavioral Change: Recidivism and Construct Validity. Evaluation Quarterly, 1, pp. 421-438.
Mortensen D. (1970) Job Search, The Duration of Unemployment, and the Phillips Curve. American Economic Review, 60, 5, pp. 847-862.
Nickell S. (1979) Estimating the Probability of Leaving Unemployment. Econometrica, 47, 5, pp. 12491266.
Nivorozhkin A. (2006) New Estimates of the Risk and Duration of Registered Unemployment in Urban Russia. International Journal of Manpower, 27, 3, pp. 274-289.
Reid G.L. (1972) Job Search and Effectiveness of Job-Finding Methods. Industrial and Labor Relations Review, 25, 4, pp. 479-495.
Schmidt P., Witte A.D. (1989) Predicting Criminal Recidivism Using 'Split Population' Survival Time Models. Journal of Econometrics, 40, 1, pp. 141-159.
Swaim P., Podgursky M. (1994) Female Labor Supply Following Displacement: A Split-Population Model of Labor Force Participation and Job Search. Journal of Labor Economics, 12, 4, pp. 640-656.
Yamaguchi K. (1998) Mover-Stayer Models For Analyzing Event Nonoccurence and Event Timing with Time-Dependent Covariates: An Application to an Analysis of Remarriage. Sociological Methodology, 28, pp. 327-61.
Yamaguchi K. (2003) Accelerated Failure-Time Mover-Stayer Regression Models for the Analysis of Last-Episode Data. Sociological Methodology, 33, 1, pp. 81-110.