Научная статья на тему 'Об измерении средней продолжительности безработицы по данным Российского мониторинга экономики и здоровья'

Об измерении средней продолжительности безработицы по данным Российского мониторинга экономики и здоровья Текст научной статьи по специальности «Математика»

CC BY
451
58
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Прикладная эконометрика
Scopus
ВАК
Область наук

Аннотация научной статьи по математике, автор научной работы — Фурманов Кирилл Константинович

В данной статье рассматривается проблема анализа данных Российского мониторинга экономики и здоровья (РМЭЗ) относительно длительности безработицы. Показывается, что результаты предыдущих исследований по данным РМЭЗ подвержены смещению отбора, которое приводит к завышению оценок средней длительности безработицы более чем в 2 раза и к искаженным оценкам функции риска, отражающей, в свою очередь, изменение вероятности выхода из безработицы с течением времени. Предлагается метод анализа, учитывающий смещение отбора. Обновленный подход позволяет получить более реалистичные оценки средней длительности безработицы, которые оказываются согласованными с данными Росстата. Метод может быть использован для оценки эконометрических моделей длительности состояний.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Questions concerning analysis of the unemployment duration using RLMS data are considered. It is shown that estimates of the average unemployment duration and the hazard function based on these data obtained in the earlier research are seriously biased. A new method of analyzing the duration of unemployment using RLMS is proposed in the paper. Estimates of the average unemployment duration which agree with the estimates by Rosstat are obtained. The proposed method can be used for estimation of various econometric duration models.

Текст научной работы на тему «Об измерении средней продолжительности безработицы по данным Российского мониторинга экономики и здоровья»

№2(14)2009

К. К. Фурманов

Об измерении средней продолжительности безработицы по данным Российского мониторинга экономики и здоровья

В данной статье рассматривается проблема анализа данных Российского мониторинга экономики и здоровья (РМЭЗ) относительно длительности безработицы. Показывается, что результаты предыдущих исследований по данным РМЭЗ подвержены смещению отбора, которое приводит к завышению оценок средней длительности безработицы более чем в 2 раза и к искаженным оценкам функции риска, отражающей, в свою очередь, изменение вероятности выхода из безработицы с течением времени. Предлагается метод анализа, учитывающий смещение отбора. Обновленный подход позволяет получить более реалистичные оценки средней длительности безработицы, которые оказываются согласованными с данными Росстата. Метод может быть использован для оценки эконометрических моделей длительности состояний.

Одним из наиболее часто используемых индикаторов состояния рынка труда является уровень безработицы. В самом деле доля людей из состава рабочей силы, находящихся в этом неблагополучном состоянии, представляется вполне разумной мерой измерения тяжести проблемы. Однако одной этой меры явно недостаточно для более-менее полного описания ситуации с безработицей. Корак и Хейц [Согак, Не^ (1995)] приводят следующий пример: уровень безработицы в 10% может наблюдаться в том случае, если в каждом месяце 10% состава рабочей силы теряет работу и находит ее в течение месяца. Но такой же уровень может наблюдаться и тогда, когда эти 10% остаются безработными в течение года, а нового притока в состав безработных нет. Ясно, что во втором случае описывается более проблемная ситуация: попадание в категорию безработных означает для индивида существенное снижение благосостояния.

Чтобы получить более полную картину, используем другой индикатор — среднюю продолжительность безработицы. К сожалению, официальной статистики недостаточно для определения этого показателя. Министерство труда и социального развития РФ предоставляет данные о продолжительности завершенной безработицы среди людей, зарегистрированных органами Государственной службы занятости (ГСЗ). Однако доля безработных, обращающихся в ГСЗ, невелика. Кроме того, выход из числа зарегистрированных в ГСЗ безработных не означает прекращения состояния безработицы: индивид, не нашедший работу с помощью службы занятости, может продолжать поиск ее своими силами. Таким образом, данные Минтруда могут занижать продолжительность безработицы и завышать долю безработных, вышедших из состава рабочей силы.

Введение

74

_ №2(14)2009

Другим источником сведений о длительности поиска работы является обследование насе- | ления по проблемам занятости (ОНПЗ), проводимое Федеральной службой статистики. | К сожалению, публикуемые данные ОНПЗ содержат информацию только о продолжительности незавершенного поиска работы (время, в течение которого индивид пробыл безра- ^ ботным на момент опроса). Существуют способы, позволяющие на основе таких данных получить оценку средней продолжительности безработицы (см., например, [Baker, Trivedy (1985)], [Corak, Heisz (1995)]). В частности, Салан [Salant (1997)] показал, что если продолжительность безработицы подчиняется показательному закону, то средняя длительность завершенных периодов безработицы совпадает со средней длительностью незавершенных.

Однако по данным о незавершенных состояниях, нельзя получить ответы на вопросы: чем заканчивается поиск работы? Какая доля безработных находит работу, а какая выходит из состава рабочей силы? Результаты исследований, проведенных различными авторами по РМЭЗ1, весьма сильно расходятся в оценках средней продолжительности безработицы, но все они значительно превышают оценки Минтруда и ОНПЗ.

В чем же причина этой разницы в оценках? Рассмотрим подробнее, что представляют собой данные РМЭЗ и в чем заключается способ, которым пользовались исследователи для определения продолжительности безработицы.

РМЭЗ — это панель опросов домохозяйств, которые проводятся 1 раз в год или в 2 года. На основании ответов респондента можно определить, является ли он безработным и когда уволился с последнего места работы (если он не имеет работы на момент опроса). Анализируя ответы того же респондента в последующих опросах, можно примерно определить, когда состояние безработицы закончилось, нашел ли респондент работу или прекратил поиск, выйдя из состава рабочей силы. Весьма подробно расчет длительности состояний безработицы описан в работе М. А. Карцевой ([Карцева (2002)], с. 12-16). Проблема заключается в том, что момент опроса, с большой вероятностью, приходится на продолжительные периоды безработицы, в то время как кратковременные периоды между опросами оказываются незамеченными.

Кроме оценки средней длительности безработицы, смещение отбора искажает оценку другой важной для эконометристов характеристики безработицы — функции риска, которая показывает, как с течением времени, проведенного в состоянии безработицы, меняется вероятность покинуть это состояние. Существуют весомые основания полагать, что вероятность нахождения работы снижается с течением времени, — как минимум, такой результат должен наблюдаться, если не учитывать неоднородность индивидов. Исследования, утверждающие, что вероятность выхода из безработицы со временем растет (например, Хекман и Сингер [Heckman, Singer (1984)]), учитывают неоднородность индивидов по наблюдаемым признакам (пол, возраст, образование и др.), кроме того, часто пытаются учитывать ненаблюдаемую неоднородность (unobservedheterogeneity). Известно, что неоднородность выборки приводит к отрицательному наклону функции риска, т. е. к снижению вероятности выхода ([Neuman (1995)], с. 41).

В то же время оценки функции риска, приводимые в работах Фолей, Грогана и Ван ден Берга [Foley (1997)], [Grogan, van den Berg (1999)], свидетельствуют о немонотонности риска даже без учета неоднородности: вероятность нахождения работы сначала растет, а затем падает, причем вероятность выхода из безработицы в первые месяцы близка к нулю, что весьма странно.

Это прежде всего работы [Foley (1997)], [Grogan, van den Berg (1999)] и [Карцева (2002)].

75

№2(14)2009 ^

Опишем статистический эксперимент, результаты которого показывают, что подобные оценки также могут являться следствием смещения отбора. Затем перейдем к изложению метода, позволяющего оценивать закон распределения длительностей по данным РМЭЗ с учетом этого смещения.

1. Основные понятия и методы анализа длительностей

С вероятностной точки зрения индивид может находиться в следующих состояниях:

1) работать или находиться в состоянии «занятость»;

2) быть безработным, т. е. находиться в состоянии «быть безработным»;

3) выйти из состава рабочей силы, т. е. быть в состоянии «не быть в составе рабочей силы» = «не быть рабочей силой».

Длительность некоторого состояния моделируется как неотрицательная случайная ве-§ личина. Ее, как и другие случайные величины, можно охарактеризовать функцией распределения или функцией плотности (либо вероятностями реализаций, если случайная величина дискретна). Однако в анализе длительностей состояний большее внимание уделяется особым характеристикам, которые будут рассмотрены ниже.

Функция дожития 5Щ (часто также называемая функцией надежности) сопоставляет некоторому числу t вероятность того, что случайная величина Т примет значение, не меньшее t. Иначе говоря, это вероятность того, что некоторое состояние продлится дольше, чем t единиц времени:

о

»0

«

3

3

§ 5 а) = р(т > t)=1-е а), (1)

| где Е^) — функция распределения случайной величины t.

з-з £

а

I £

з

о »0

о &

'3

«I £

В качестве характеристики средней продолжительности состояния используется, как правило, математическое ожидание длительности, которое может быть выражено следующим образом:

Е (Т) = / 5 а С, (2)

о

если Тнепрерывна.

Для дискретной (точнее, для целочисленной неотрицательной) величины интеграл замесу няется на сумму:

Е (Т) = £ 5 а). (3)

Кроме математического ожидания длительности, будем также использовать медианную | длительность — такую величину ТтеС1, что 5(Ттес[) = 0,5. В своем роде ТтеС также характеризует §■ среднюю продолжительность состояния: половина состояний длятся менее ТтеС, и половина | оказываются более продолжительными.

§ Важной характеристикой распределения длительностей является функция риска (функция опасности отказов). Для непрерывной случайной величины она определяется следующим образом:

76

lim P(t <T <T + h|T > t) § X(t) = ---. (4) §

h I

Можно сказать, что функция риска выражает интенсивность, с которой состояние, длящееся в течение времени t, стремится к прекращению, или вероятность, с которой это состояние прекратится в ближайшее время.

Для дискретной длительности Tфункция риска определяется как вероятность завершения наблюдаемого состояния в момент t при условии, что это состояние уже «дожило» до этого момента:

X(t) = P(T = 11T > t). (5)

Часто при изучении длительностей представляет интерес именно форма функции риска, так как она отражает характер временной зависимости (duration dependence).

Говорят, что в момент времени t* имеет место положительная временная зависимость, если

dX(t)

dt

> 0при t = t*,

т.е. при небольших отклонениях длительностей от t* для состояния, длящегося в течение большего периода времени, выше вероятность прекращения в ближайшие сроки.

Соответственно существует и отрицательная временная зависимость. Если функция риска постоянна, говорят, что временная зависимость отсутствует. Среди непрерывных распределений свойством отсутствия временной зависимости обладает показательное распределение, среди дискретных — геометрическое.

Восстановление закона распределения по имеющимся данным обычно бывает затруднено вследствие цензурирования. Исследователю неизвестна полная длительность некоторых состояний, так как наблюдение за ними было прекращено в некоторый момент, называемый моментом цензурирования (точнее, такой тип цензурирования называется цензурированием справа, right-censoring). Например, если на момент последнего наблюдения за индивидом он был безработным, то неизвестно, когда состояние безработицы закончилось. Про цензу-рированные справа состояния исследователю известно только то, что они продолжались от момента начала до момента цензурирования, т.е. известна их минимальная возможная длительность. Обычно считается, что моменты цензурирования либо детерминированы, либо независимы от длительности состояний. В таких условиях для оценивания функции дожития применим метод Каплана—Мейера.

Предположим, моменты прекращения, соответствующие нецензурированным наблюдениям, расположены в порядке возрастания:

t, < t2<...< tK .

Количество нецензурированных моментов прекращения K меньше, чем размер выборки n, так как, во-первых, могут присутствовать цензурированные моменты прекращения, а во-вторых, в выборке могли оказаться моменты прекращения с одинаковыми значениями.

Пусть hj — количество нереализованных моментов цензурирования, т. е. количество наблюдений, моменты прекращения которых действительно наблюдались, с длительностями j j = 1,..., K. Очевидно, что при отсутствии в выборке длительностей с совпадающими значениями все hj равны 1.

77

о »0

о &

№2(14)2009 ^

Введем также величину т,, показывающую количество наблюдений, цензурированных в момент времени между ^ и ^ + В данном случае ткбудет означать количество наблюдений, продолжавшихся дольше tк (длительность, соответствующая наиболее продолжительному нецензурированному наблюдению).Таким образом, величина п, которая показывает количество либо незаконченных, либо цензурированных к моменту ^ случайных величин, являющихся моментами прекращения состояний, равна:

П =Е (т, + Ь!). (6)

' > 1

Естественно оценивать функцию риска при значении аргумента ^ как отношение числа |. нецензурированных наблюдений длительностью ^ к числу наблюдений с длительностями « не меньшими 1

з 1

§ X ) = (7)

15 п1

Соответственно оценка функции дожития S(t1■) в данном случае будет представлять собой совместную вероятность того, что к моменту ^ событие не завершится:

I

г ~ ' (п- — Ь) 1

s(ti) = п —=п (1—'х а,)). (8)

53 ,=1 п! =

,1!

з Это и есть оценка функции дожития Каплана—Мейера. Она не дает информации о поведении функции дожития после последнего наблюдаемого момента прекращения, что не позволяет на ее основе рассчитывать оценку для математического ожидания. Однако, если цензурированных наблюдений не слишком много, метод Каплана—Мейера позволяет оце-

о нить медианную длительность.

г Если исследователя интересует риск выхода в различные состояния (например, требуется

| отдельно оценить вероятность трудоустройства, т. е. вероятность перехода в состояние «за-£

.

нятость» и вероятность выхода из состояния «быть рабочей силой», т. е. вероятность перехода в состояние «не быть рабочей силой»), то при оценке риска выхода в некоторое состояние моменты прекращения, в которые происходил выход в другие состояния, считаются моментами цензурирования. Например, если состояние безработицы продолжалось 1 месяц и закончилось выходом индивида из состава рабочей силы, т. е. переходом в состояние «не быть § рабочей силой», то при анализе риска выхода в состояние «занятость» это наблюдение будет I считаться цензурированным справа в момент «1 месяц».

3 2. Статистический эксперимент

Чтобы понять, к каким последствиям приводит смещение отбора при анализе длительно-| стей по данным РМЭЗ, был проведен статистический эксперимент, в котором моделировался !■ как истинный процесс перехода между различными состояниями: «занятость», «быть безра-| ботным», «не быть в составе рабочей силы» = «не быть рабочей силой», так и отбор наблю-§ даемых состояний, происходящий в условиях непостоянного наблюдения за индивидами.

Опишем нашу модель подробнее.

78

к

_ №2(14)2009

В момент времени t = 0 любой индивид находится водном из 3 возможных состояний с не- | которыми заданными вероятностями. Также предполагается, что каждое из этих состояний | началось в тот же момент (это, конечно, неправдоподобная предпосылка, однако, если задать моменты наблюдения достаточно далеко отточки t = 0, начальное состояние перестает ^ быть важным).

Длительности каждого состояния генерировались в соответствии с моделью соревнующихся рисков (competing risks — [Neumann (1995)], с. 62) следующим образом: существуют две независимые случайные величины, описывающие длительность текущего состояния до момента перехода в одно из двух других состояний (так какдля состояния безработицы существуют длительности до выхода «в занятость» и до выхода в неактивность — состояние «не быть рабочей силой»). Обозначим эти величины соответственно TE и TN, их функции дожития — SE(t) и SN(t), а функции риска — \E(t) и XN(t). Наблюдаемая длительность равна минимуму этих двух величин: T = min(TE, TN). Ее функция дожития S(t) равна произведению функций дожития для выхода в каждое из возможных состояний, в нашем случае S(t) = SE(t) ■ SN(t).

Случайные величины для длительностей всех состояний моделировались нами как подчиняющиеся закону распределения Вейбулла.

Устанавливались 3 момента наблюдения (т.е. моделируется ситуация, в которой анализируются данные 3 раундов РМЭЗ). В выборку попадали только те состояния безработицы, которые начались после первого момента наблюдения и которые продолжались на момент второго или третьего моментов наблюдения (раундов опроса). Так поступают Гроган и ван дер Берг, а также М. А. Карцева [Grogan, van den Berg (1999)], [Карцева (2002)] — если включать в выборку состояния, начавшиеся ранее, смещение отбора становится еще сильнее. Если наблюдаемое состояние закончилось до третьего момента, считалось, что моменты его начала и завершения известны с точностью до целого числа, и известно, в какое состояние был осуществлен переход. Если состояние безработицы еще продолжалось к третьему моменту, то наблюдение за ним считалось цензурированным на момент третьего раунда — соответственно состояние, в которое был осуществлен переход, оставалось неизвестным.

Получив таким образом выборку, состоящую частично из нецензурированных, а частично из цензурированных справа наблюдений, мы оценивали распределение длительностей безработицы с помощью метода Каплана—Мейера. Некоторые результаты приведены на графиках (на рис. 1 и 2 представлены графики перечисленных ниже функций).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Из приведенных оценок функции дожития видно, что оценка медианной длительности безработицы сильно завышается. Графики функций риска показывают, что оценки риска являются заниженными, а в области малых длительностей оценки свидетельствуют о положительной временной зависимости, даже когда в реальности временная зависимость отсутствует или является отрицательной. Видимо, именно этот эффект и привел к выявлению немонотонного характера функций риска в работах [Foley (1997)] и [Grogan, van den Berg (1999)].

3. Метод расчета средней продолжительности безработицы по данным РМЭЗ (непрерывная модель)

Рассмотрим случай, когда для анализа используются данные двух раундов опроса. Каждый индивид на момент первого раунда либо не является безработным и не включается в анали-

79

№2(14)2009

т

1,2" 1,0" 0,8" 0,6" 0,4" 0,2" о

--S(f)

----l(f)

"1 I г

3 5 7

1 I I I I I I г 9 11 13 15 17 19 21 23

а

о *

»0

«

3

Ü г

0

1 §

§ &

Ii §

г

о

1 I I I I I I Г 9 11 13 15 17 19 21 23

s_m

1,2" 1,0" 0,8" 0,6" 0,4" 0,2" 0

--s_m

----ijV(f)

1 I I Г 13 5 7

A(f)A

0,6

0,5 0,4 0,3 0,2 0,1

П I I I I I I г 9 11 13 15 17 19 21 23

--т

----h(t)

^ /

N j

О 1 I I I I I I I I I I пг 1 3 5 7 9 11 13 15 17 19 21 23 *

г s

lg а га

0 с 3 г з

S £

а

1 £

з §

0

1

5

! »0

о

6

'3

«I £

3 3 X

«I &

€ 3

VO

о

hN(t)

0,6" 0,5" 0,4" 0,3" 0,2" 0,1" 0

Л --ь_т

----hm

i

_

л

_ — ^ v - 1

Г"!

1 3 5 7 9 11 13 15 17 19 21 23

h_E(t) А

0,6

0,5 0,4 0,3 0,2 0,1 0

--Л_№)

----h_E(t)

I /»

/» I >

-*-4—Г

_1_

"1 I I I I I I I I I Г , 3 5 7 9 11 13 15 17 19 21 23 *

Рис. 1. Отсутствие временнб|й зависимости: а—истинная функция дожития до выхода из безработицы S(t) и ее оценка 5(t) (по оси абсцисс откладывается время, измеряемое в условных единицах, по оси ординат—значение функции дожития, измеряемое числом); 6 — истинная функция дожития до выхода из рабочей силы S_N(t) и ее оценка S _ N(t) (по оси абсцисс откладывается время, измеряемое в условных единицах, по оси ординат — значение функции дожития, измеряемое числом); в — истинная функция дожития до выхода в занятость S_E(t) и ее оценка S_ E(t) (по оси абсцисс откладывается время, измеряемое в условных единицах, по оси ординат—значение функции дожития, измеряемое числом); г—истинная функция риска выхода из безработицы h(t) и ее оценка h(t) (по оси абсцисс откладывается время, измеряемое в условных единицах, по оси ординат — значение функции риска, измеряемое числом); д — истинная функция риска выхода из состава рабочей силы h_N(t) и ее оценка h_ N(t) (по оси абсцисс откладывается время, измеряемое в условных единицах, по оси ординат—значение функции риска, измеряемое числом); е—истинная функция риска выхода в занятость h_E(t) и ее оценка h_ E(t) (по оси абсцисс откладывается время, измеряемое в условных единицах, по оси ординат —

значение функции риска, измеряемое числом)

80

т2(14)2009

11 13 15 17 19 21 23

О 1 I I I I I I I I I I I 1 3 5 7 9 11 13 15 17 19 21 23 f

0 t а

1

¡с ¡с

О 1 I I I I I I I I I I Г , 1 3 5 7 9 11 13 15 17 19 21 23 f

A(f)

0,6"

0,5 0,4" 0,3" 0,2" 0,1" 0

--т

----т

г - —

/> /» / \

\/ \

1 I I I I I I I I I I г~г 1 3 5 7 9 11 13 15 17 19 21 23 *

"I I I I I I I Г 9 11 13 15 17 19 21 23

h_E(t)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0,6" 0,5" 0,4" 0,3" 0,2" 0,1"

--Л_£М

----h_E(t)

лл

\/ V

о 1 I I I I I I I I I I г~г

1 3 5 7 9 11 13 15 17 19 21 23 *

Рис. 2. Положительная временная зависимость для выхода из рабочей силы и отрицательная—для выхода в занятость: а—истинная функция дожития до выхода из безработицы S(t) и ее оценка 5(t) (по оси абсцисс откладывается время, измеряемое в условных единицах, по оси ординат—значение функции дожития, измеряемое числом); 6 — истинная функция дожития до выхода из рабочей силы S_N(t) и ее оценка S _ N(t) (по оси абсцисс откладывается время, измеряемое в условных единицах, по оси ординат — значение функции дожития, измеряемое числом); в — истинная функция дожития до выхода в занятость S_E(t) и ее оценка S_ E(t) (по оси абсцисс откладывается время, измеряемое в условных единицах, по оси ординат—значение функции дожития, измеряемое числом); г—истинная функция риска выхода из безработицы h(t) и ее оценка h(t) (по оси абсцисс откладывается время, измеряемое в условных единицах, по оси ординат — значение функции риска, измеряемое числом); д — истинная функция риска выхода из состава рабочей силы h_N(t) и ее оценка h_ N(t) (по оси абсцисс откладывается время, измеряемое в условных единицах, по оси ординат — значение функции риска, измеряемое числом); е — истинная функция риска выхода в занятость h_E(t) и ее оценка h_ E(t) (по оси абсцисс откладывается время, измеряемое в условных единицах, по оси ординат —

значение функции риска, измеряемое числом)

<8 а

£ £

з §

о t

§

»o

о &

'3

«I £

№2(14)2009 ^

о &

»0

«

3

3

зируемую выборку, либо находится в состоянии безработицы уже tl месяцев (/ — номер индивида в выборке безработных). На момент второго раунда это состояние либо завершилось, либо продолжается уже + /,) месяцев, где ¡1 — время между опросами /-го индивида в первом и втором раундах. Обратим внимание: если прежнее состояние безработицы завершилось, это вовсе не означает, что на момент второго раунда индивид не является безработным, — он мог покинуть это состояние между опросами и вернуться в него.

Пусть Т — случайная величина, описывающая продолжительность состояния «быть безработным» у /-го индивида, имеющая функцию дожития Б^). Вероятность того, что /-е состояние на момент второго раунда опроса будет продолжаться при условии, что к моменту первого раунда оно длилось t¡ месяцев, равна:

> + цт > ) = Р({Т/ > ^ + ¡/} ПУ, > ^}) = Р(Т/ > ^ + /1) = 5^). (9)

р(т > tj) р(т > tj) 5 а,)

| Соответственно вероятность того, что /-е состояние безработицы закончится к моменту | второго раунда опроса, равна:

Ц Р(Т/ < ti + /, | Т > tl) = 1-Р(Т/ > ti + /, | Т > tl) = 1—. (10)

Если функция дожития известна с точностью до вектора параметров 0, то эти параметры можно оценить с помощью метода максимального правдоподобия.

В дальнейшем будем использовать следующее обозначение: У — индикатор /-го состояния безработицы на момент второго опроса. У = 1, если состояние завершилось, иначе У = 0. Тогда задача метода максимального правдоподобия может быть записана следующим образом:

+ /, 10) ^

г s

lg а га о с 3 г

.....У; t1.....tn; /,.....In; 0) =П П

Yi =0 S (ti j 0) Yi =1

1 —

s(ti 10)

max. (11)

0

§ Решение задачи даст оценку функции дожития, из которой без труда можно получить и оценку средней продолжительности безработицы.

Рассмотрим более подробно случай, когда длительности подчиняются показательному закону распределения: 5^) = е.Тогда средняя продолжительность безработицы выражается через параметр X следующим образом:

§ 1

E(T)=v

Показательный закон обладает свойством отсутствия последействия:

P(T < t + xj T > t) = P(T < x).

Иначе говоря, вероятность того, что некоторое состояние продлится еще несколько ме-| сяцев, не зависит оттого, сколько оно уже длится (в приложениях, связанных с анализом дли-§. тельностей состояний, это свойство называется также отсутствием временной зависимости). | Предположение о том, что риск выхода из безработицы постоянен и распределение дли-§ тельностей подчинено показательному закону, следует из простейшей модели поиска работы (см., например, [Kiefer (1998)]). Несмотря на то что такое ограничение может представлять-

82

ся жестким, применение показательного распределения является естественным, как мини-

I

мум, для получения «первого приближения». 1

I

При предпосылке об отсутствии временной зависимости вероятности завершения/продолжения /-го состояния на момент второго раунда опроса выражаются следующим образом:

т = о) = ==в—х/,, (12)

S (t/) е—*' Р(У, = 1) = 1 — в—х/'. (13)

В этом случае для оценивания параметра X не нужно обладать информацией о времени, уже проведенном в состоянии безработицы, так как в силу отсутствия последействия это время не влияет на вероятность выхода.

Задачу оценивания X можно свести к уже известной задаче бинарного выбора — с!од!од-регрессии, реализованной в статистических пакетах (например, в Б!а!а). В с!од!од-регрессии бинарной величины у на регрессоры х1,..., хк-1 вероятности значений у, выражаются следующим образом:

Р( у, = 0) = ехр(—ехр( 3 о + 31X1,/ +...+(3 к—Л—у ));(14) Р(у/ = 1) = 1—ехр(—ехр(3о + 31X1,/ +...+3к-1хк-и)). (15)

Здесь р0,..., 3к-1 — коэффициенты при регрессорах плюс свободный член уравнения.

Запишем вероятность (8) в другой форме:

Р( у1 = 0) = ехр(—ехр(!п Х + !п ^)). (16)

Очевидно, что выражение (16) сводится к выражению (14) при к =2, р0 = !п X, р1 = 1.Таким образом задача оценки параметра сведена к задаче оценки свободного члена в с!од!од-рег-рессии У на !п / при том ограничении, что коэффициент при !п / равен единице. Получив оценку свободного члена 30, можно рассчитать оценку для параметра X и среднюю продолжительность безработицы:

Е(Т) =1 = в—3 0. (17)

X

В дальнейшем понадобится также оценка для медианной продолжительности, которую легко получить из условия S(Ттеа)) = 0,5:

Тте* = ^ = Е(Т )•! п 2. (18)

Видно, что медианная продолжительность пропорциональна средней и всегда ниже ее, если длительность описывается показательным законом.

Таким образом, задача оценивания становится достаточно легкой, если не считать затрат сил и времени на подготовку данных. Для того чтобы оценить коэффициент р0 в пакете Б!а!а, нужно создать переменные у и !п /, содержащие соответственно данные о завершении/продолжении состояний безработицы и логарифм времени между раундами опроса, после чего

о »0

10

о &

'3

«I £

№2(14)2009 ^

ввести команду с!од!од у, оАзе^п /). Затем следует рассчитать оценку для средней продолжительности безработицы по формуле (17). Можно показать, что если в с!од!од-регрессию включить объясняющие переменные, то задача оценивания будет являться задачей нахождения коэффициентов в простейшей модели длительности — экспоненциальной регрессии.

Для анализа можно использовать и более двух опросов. Предположим, мы располагаем данными трех раундов. Время между первым и вторым, между вторым и третьим раундами обозначим /1 и /2 соответственно. Состояние безработицы, наблюдавшееся в первом раунде и продолжавшееся к моменту первого раунда в течение времени t, могло закончиться между первым и вторым раундами, между вторым и третьим или продолжаться до третьего раунда. Найдем вероятности каждого из этих исходов.

Вероятность того, что /-е состояние закончится до второго раунда опроса:

i PT < ti + /у | T > ti) = 1-5{t[ + /v \ (19)

I 5(ti)

§ Вероятность того, что /-е состояние завершится между вторым и третьим раундами:

§ &

I §

г

о

л

I

а

га о с

г

3 £

а

I £

з

Р(^ + /у < Т/ < ti + /у + /2,/ |Т/ > ti ) = Р(Т/ > ti + /у |Т/ > ti ) •Р(Т/ < ti + /у + /2,/ |Т/ > ti + /у ). (20)

Вероятность того, что /-е состояние продлится до третьего раунда:

Р(Т/ >t/ + /и + /2,/1Т/ > t/) = Р(Т/ >t/ + /и|Т/ > t/)• Р(Т/ > t¡ + /и + /2,/1Т >t¡ + /у). (21)

Подобным же образом можно расписать вероятности для произвольного количества раундов опроса. Существенным здесь является то, что правую часть выражения (20) можно трактовать и как вероятность совместного наступления двух событий: во-первых, некоторое состояние, продолжавшееся к моменту первого раунда опроса в течение t/ месяцев, будет продолжаться в течение /1, / месяцев до второго раунда;во-вторых, некоторое состояние, продолжавшееся к моменту первого раунда в течение + //) месяцев, закончится в течение /2, / месяцев до второго раунда.

Аналогично выражение (21) можно трактовать как вероятность того, что два состояния, первое из которых продолжалось на момент первого раунда опроса t/ месяцев, а второе — + /1,/) месяцев, будут продолжаться до второго раунда. Как следствие, функция правдоподобия для анализа множества раундов опроса по сути не будет отличаться от функции (11) для двух раундов, хотя количество состояний будет искусственным образом увеличено.

| 4. Расчет вероятности нахождения работы и выхода

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

| из состава рабочей силы в условиях непрерывной модели

Важно знать не только вероятность выхода из безработицы, но и доли безработных, нашедших работу, и безработных прекративших поиск, не найдя ее. Чтобы получить соответст-§■ вующие оценки, можно использовать модель соревнующихся рисков (competing risks). I Пусть существуют две независимые случайные величины: первая — «продолжитель-!■ ность периода безработицы до выхода в состояние «занятость» (TE) и вторая — «продолжи-| тельность периода до выхода из состава рабочей силы — перехода в состояние «не быть § рабочей силой» (TN).

Если TE < TN, то индивид находит работу, а длительность периода безработицы равна TE.

84

Если ТЕ > Ты, то индивид прекращает поиск, проведя в состоянии безработицы время Т| Соответственно реальная длительность безработицы определяется как: 1

Т = гп!п(Те, Ты).

Это та же самая модель, что использовалась в ранее описанном статистическом эксперименте.

Пусть неизвестен точно момент прекращения состояния безработицы, но известно, закончилось ли это состояние между соседними раундами опроса, и если закончилось, то чем: занятостью или выходом из рабочей силы. Чтобы учесть эту информацию, зададим величину У, как имеющую три возможных значения:

0 — состояние не завершилось;

1 — респондент вышел из состояния, найдя работу;

(-1) — состояние завершилось выходом респондента из состава рабочей силы, т. е. переходом в состояние «не быть рабочей силой».

Теперь нужно выразить вероятности для каждого из значений.

Р(У = 0) = Р({Те,/ > t¡ + / /} П {Ты,, > t¡ + / / }| {Те,/ > t¡} П {Ты,/ > t¡}), (22)

Р(У = 1) = Р({Те/ < t| + / /} П {Те/ < Ты,/ }| {Те,/ > t|} П {Ты., > t|}), (23)

Р(У =-1) = Р({Ты, / <t| +/,} П {Ты,, < Те ,, }| {Те ,/ > t|} П {Ты,, > t|}). (24)

Рассмотрим случай, когда отсутствует временная зависимость для выходов в каждое состояние, т. е. когда обе величины — ТЕ и Ты — имеют показательное распределение, параметры которого обозначим соответственно ХЕ и Хы. В силу свойства отсутствия последействия, выражения (22)—(24) для этого случая упрощаются:

Р(У = 0) = Р({Те,/ > //} П {Ты,, > /,}), (25)

Р(У = 1) = Р({Те,/ < //} П {Те,/ < Ты,/}), (26)

Р(У = -1) = Р({Ты,/ < //} П {Ты,/ < Те,/}). (27)

Проще всего получить выражение для Р(У/ = 0), так как события {ТЕ/ > / } и {Ты1/ > / } независимы:

Р(У/ = 0) = Р(Те,/ > // )• Р(Ты/ > //) = ехр(—Х е// )ехр(-Х ы/,) = ехр(-( X Е +Х ы )• //). (28)

Отметим, что выражение (26) можно записать следующим образом:

Р(У/ = 1) = Р({Те,/ < //} П {Те,/ < Ты,/ < //}) + Р({Те,/ < //} П {Ты,/ > //}) = (29)

= Р({Те,/ < /i} П {Ты,/ < // })• Р({Те,/ < Ты,/1 Те,/ < //} П {Ты,/ < //}) + Р(Т,/ < //} П {Ты,/ > //})'

Обозначим через А(ХЕ, Хы, Х/) условную вероятность Р({ТЕ,| < Ты,| |ТЕ,| < //} П {Ты,/ < //}). Можно доказать (см. приложение), что она имеет следующее выражение:

Л ,, Xе +Хе ехр(-(Xе +Хы)//)-(Xы +Хе)ехр(-Хы//)

А(X е , X ы !/) —-. (30)

(XЕ + Xы )(1 -ехр— ы/I ))(1 -ехр— е/1 ))

85

I

о

»0

«

3

3

о

г

а »о о с

£

! »0

о &

'3

«I £

№2(14)2009 ^

Тогда формулу (29) можно записать так:

Р(У/ = 1) = Р({Те/ < //} П Т,/ < //}) • А(X е, X N, //) + Р([ТЕ,/ < //} П {Тм,/ > //}) = . (31) = (1—ехр— е// ))(1—ехр— N // ))А(X е , X N, //) + (1—ехр— е//)) ехр— N //)

Аналогично получаем выражение для Р(У/ = —1):

Р(У/ = —1) = (1 —ехр(—X е/, ))(1—ехр(—X ы/1 ))А( X N, X е , /,) + (1 — ехр(—\ ы/1 ))exp(—X е// ).(32)

Зная выражение вероятностей (25)—(27) через параметры XE и XN и величину /,., можно получить оценку параметров методом максимального правдоподобия. Кроме того, обнаружился простой метод, который дает оценки параметров XE и XN, весьма близкие к оценкам максимального правдоподобия. Алгоритм его применения следующий:

1. Получить оценку параметра X в модели без учета различных состояний выхода (с помощью с!од!од-регрессии). § 2. Рассчитать оценки для XE и Хг^ по следующим формулам:

~ ~ Число нашедших работу

X е = X--, (33)

Число покинувших состояние безработицы

§ ~ ~ Число вышедших из состава рабочей силы

§ X N = X• --д----. (34)

? Число покинувших состояние безработицы

Различие в оценках, полученных двухшаговым методом, и оценках максимального правдоподобия для проанализированных данных проявлялось не ранее, чем в третьем знаке по-5 сле запятой. Это практически не влияло на оценку средней продолжительности безработи-§ цы и математических ожиданий величин ТЕ и Т^ Не исключается возможность того, что это расхождение вызвано погрешностью вычислений. Тем не менее свойства оценок двухшаго-вого метода не выяснялись.

5 5. Дискретная модель длительности

I?

Вышеизложенную непрерывную модель не удалось распространить на тот случай, когда в анализ включаются объясняющие переменные, точнее, не удалось реализовать процедуру оценки такой модели из-за проблем с максимизацией функции правдоподобия. Впрочем, если существует только один вариант выхода, оценивание не составляет труда, однако при анализе безработицы имеет смысл учитывать возможность выхода в занятость и выхода из состава рабочей силы. Несмотря на то что целью данной работы не является изучение влияния индивидуальных характеристик на вероятность выхода из безработицы, понятно, что анализ распределения длительностей — как правило, первый шаг при построении эко-§■ нометрической модели, включающей экзогенные переменные. Ниже предлагается альтер-| нативный метод оценивания, который позволяет с легкостью включить в модель объясняю-!■ щие переменные и учесть временную зависимость вероятности выхода из безработицы. Ц Дискретный подход к моделированию длительности безработицы был, насколько известен но автору, впервые использован в статье Никеля [Ы 1ске!! (1979)] — одной из самых первых работ по данной тематике. Для анализа российских данных дискретный подход был использо-

86

I

¡с ¡с

ван в работе [Foley (1997)]. Применение непрерывных и дискретных моделей часто приводит | к одинаковым результатам, так что решение об использовании того или иного подхода, как | правило, основывается на удобстве для исследователя. Часто непрерывные модели применяются к данным, которые на самом деле носят дискретный характер (длительности известны, например, с точностью до месяца).

Метод, использованный Никелем, заключается в том, что для состояния «быть безработным», продолжающегося в течение t единиц времени (Никель использовал недельные данные), вероятность выхода из него в ближайшую единицу времени описывается logit-регрессией, где в качестве регрессоров выступают индивидуальные характеристики безработного и некоторая функция от t, описывающая временную зависимость вероятности выхода (в работе [Nickell (1979)] эта зависимость описывалась квадратичной функцией). Кроме logit- часто используется cloglog-регрессия (в таком случае дискретная модель соответствует непрерывной модели пропорциональных рисков — одному из наиболее распространенных подходов к анализу длительностей). Как правило, результаты оценивания по logit- и cloglog- регрессиям схожи.

Так как нас интересуют различные варианты выхода из состояния «быть безработным» — как в состояние «занятость», так и в состояние «не быть рабочей силой», — logit-и cloglog- модели оказываются неподходящими. Естественным расширением logit-регрес-сии является множественная logit-регрессия (multinomial logit). В таком случае, если моделируется вероятность выхода из безработицы как функция от времени, то вероятности выхода в состояние «занятость» и в состояние «не быть рабочей силой» (обозначим их pE(t) и pN(t) соответственно) в течение ближайшего месяца для состояния, продлившегося t месяцев, равны:

pE (t) =-^-, (35)

1 + exp(^ e (t)) + exp(^ n (t))

exp(^n (t))

Pn (t) =-—--. (36)

1 + exp(^ e (t)) + exp(^ n (t))

Обозначим также вероятность остаться в состоянии «быть безработным» до следующего месяца:

1

Pu (t) = 1-PE (t) - Pn (t) = --——-——. (37)

1 + exp(^ e (t)) + exp(^ N (t))

Здесь ^E(t) и y>N(t) — некоторые функции, известные с точностью до некоторого набора параметров и характеризующие временную зависимость вероятности выхода в соответствующее состояние. Например, в работе [Nickell (1979)] использовалась квадратичная функция для вероятности выхода из состояния «быть безработным» (варианты выхода там не различались). Можно предложить и другие варианты. Так, для анализа длительности безработицы мы использовали следующие спецификации: • постоянная:

= const,

№2(14)2009

квадратичная:

кусочно-постоянная:

ф(Г) = а о + а^ + а 2t:

ф(Г) =

ф 1, г < Г1

Ф 2, Гт < Г < Г 2 ф Р , г > Гр

о &

»о

«

3

3

г

0

1

г

§ &

I §

г

о

л

I

а »о о с

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

г

3

£ £

а

I £

з

кусочно-линеиная:

ф(Г) =

Г

— (ф 1 -фо), Г < Г1

Г1

ф 1 + уГ-^(ф 2 -ф 1), Гт < Г < Г 2

ф Р-1 +

ф р <

(Г 2 —Г 1)

(г—Гр—1)

(Гр — Гр—1

(фр — фр—1), Гр—1 < Г < Гр Г > Гр;

• экспоненциальная:

ф(Г) = а + Ье"

Оценивание постоянной функции проводилось прежде всего для сравнения результатов, полученных по дискретной и непрерывной моделям, так как в непрерывной спецификации оценивались только постоянные функции риска. Квадратичная, кусочно-постоянная и кусочно-линейная функции являются довольно гибкими и позволяют оценить немонотонную временную зависимость. Экспоненциальная функция описывает монотонную временную зависимость, при которой вероятность нахождения работы или выхода из состава рабочей силы стремится к некоторому асимптотическому значению.

Функции риска и дожития выглядят следующим образом:

Х(Г) = 1 — ри (Г) = ре (Г) + ры (Г),

(38)

§

»0

о &

'3

«I £

3 3 X

«I &

€ 3

5(Г) =П ри (к).

к=0

(39)

Напомним: наша задача состоит в оценивании закона распределения длительностей на основании имеющихся данных о времени, проведенном /-м индивидом в состоянии «быть безработным» на момент первой волны опроса Г,, времени между первой и второй волнами опроса 1, и индикатором выхода УЗ равным 0 — для состояний, не завершившихся к моменту второго опроса, 1 — для состояний, завершившихся выходом в занятость, -1 — для состояний, завершившихся выходом из рабочей силы, т. е. переходом в состояние «не быть рабочей силой». В нашей модели это задача оценивания параметров функций фЕ(г) и фЫ(Г), для решения которой будем опираться на метод максимального правдоподобия.

Г—1

88

№2(14)2009

Вероятность того, что за время между волнами опросов состояние безработицы не закончится, равна:

б а/ + /,)

P(Y = 0| t /, li) = P(J, > ti +1i | Ti > ti) = ■

,/f) = П Pu (ti + k).

J (ti ) k=0

(40)

li -1

P(Y = 1 ti, li) = £

k=0

k-1

Pe (ti + k )П Pu (ti + 7)

j=0

Аналогично рассчитывается вероятность выхода из состава рабочей силы:

ii -1

P(Yi =-1| ti, li) = £

k=0

k-1

Pn (ti +k )П Pu (ti + j)

j=0

Задача максимизации функции правдоподобия имеет следующий вид:

L = П P(Yi = 0| ti, li)П P(Yi = 1 ti, li) П P(Yi = -1 ti, li) ^ max,

Yi =0

Yi =1

Y( =-1

0 E ,0 N

(41)

(42)

(43)

где 0E и 0N — вектора оцениваемых параметров функций фЕЩ и ф^).

X e (t) = ■

exp(ф e (t))

(44)

1 + ехр(ф е а))

Соответственно функция дожития до выхода в занятость выглядит следующим образом:

Se (t) = П (1-X e (k)).

(45)

k=0

E (T) = £ t • P(T = t) = £ S (t).

(46)

Стоит отметить, что в дискретную модель длительности легко включить и объясняющие переменные, эффект которых будет суммироваться с эффектом временной зависимости.

0 t а

1

¡с ¡с

Вероятность выхода в состояние «занятость» за период времени между волнами опроса складывается из вероятности найти работу в течение первого месяца, вероятности остаться в состоянии «быть безработным» в первом месяце, но найти работу во втором и т. д.:

Для того чтобы можно было сравнить результаты дискретной и непрерывной моделей, определим отдельно распределение длительностей до выхода в состояние «занятость» и до выхода из состава рабочей силы. Будем обозначать через XE(t) и \Е(^ условные функции риска и дожития при условии, что выхода из рабочей силы не произойдет (именно их оценки приведены на рис. 3). Так как в данном случае в каждом месяце существуют только два варианта исхода (остаться безработным или найти работу), множественная Ьд^-модель превращается в обычную Ьд^-спецификацию:

Аналогично задаются функции риска и дожития до выхода из состава рабочей силы — 5ы(б и Xы(t).

Из оцененной функции дожития легко рассчитать среднюю длительность безработицы:

t-1

т2(14) 2009

- Постоянная

- Квадратичная

- Кусочно-попоянная

— Кусочно-линейная —Экспоненциальная

Вероятность дожития

А

о *

»0

«

3

3

г

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0

1

г

Вероятность выхода

А

§ &

I §

г

о

1 I I I I I I I I ГН Г

2 4 6 8 10 12 14 16 18 20 22 24

Длительность пребывания в состоянии безработицы, мес.

Вероятность выхода

А

0,35" 0,30

0,25" § 0'20"

| 0,15" £ 0,10 I 0-05"

г з

£ £

а

I £

з

§

»0

о &

'3

«I £

3 3 X

«I &

€ 3

о

0,8 0,6 0,4 0,2

"1 I I I I I I I Г*" 8 10 12 14 16 18 20 22 24

"1—I—Г 2 4 6

"1—I—I—I—I—I—I—I—Г 8 10 12 14 16 18 20 22 24

Длительность в состоянии безработицы, мес.

Вероятность выхода

А

0,35"

0,30" 0,25" 0,20" 0,15" 0,10" 0,05"

"1 I I I I I I I I I I Г^ 2 4 6 8 10 12 14 16 18 20 22 24

Длительность пребывания в состоянии безработицы, мес.

Вероятность дожития

А

1,2 1,0

0

"1 I I I I I I I I I I Г*" 2 4 6 8 10 12 14 16 18 20 22 24

Длительность пребывания в состоянии безработицы, мес.

Вероятность дожития

А

0,20" 0,18"

0,16" 0,14" 0,12" 0,10"

"1 I г

2 4 6

Длительность пребывания в состоянии безработицы, мес. д

1 I I I I I I I Г*" 8 10 12 14 16 18 20 22 24

"1 I Г 2 4 6

Длительность пребывания в состоянии безработицы, мес. е

Рис. 3. Оценки функций риска и дожития с учетом временной зависимости: а — оценки функции дожития, 2000-2005 гг.; 6 — оценки функции риска выхода из состава рабочей силы, 2000-2005 гг.; в — оценки функции риска выхода из безработицы, 2000-2005 гг.; г — оценки функции риска выхода в занятость, 2000-2005 гг.; д — оценки функции дожития, 1994-1996 гг.; е — оценки функции риска выхода из безработицы, 1994-1996 гг.

90

^-

- №2(14)2009

Например, вероятность нахождения работы в течение месяца можно определить так: |

Ре Г) =-еХР(ф Е (Г) + Х'3 Е)-, (47) I

1 + ехр(ф е (Г) + х1 (3 е ) + ехр(ф м (Г) + х1 ( м) ^

гдеX — вектор-строка значений объясняющих переменных (экзогенных факторов, влияю- * щих на вероятность нахождения работы);

вектора (е и (м — коэффициенты, определяющие, каким образом значения экзогенных факторов влияют на вероятность нахождения работы и на вероятность выхода из состава рабочей силы.

Аналогично задаются и р^). Отметим, что в вектор объясняющих переменных не стоит включать свободный член, если он присутствует в функциях ф^) и фм(^. Проблем с максимизацией функции правдоподобия не возникает.

6. Данные

В исследовании использовались данные второй волны Российского мониторинга экономики и здоровья (РМЭЗ) за период с 1994 по 2005 г. (У-Х1У раунды опроса). Опрос домохо-зяйств проводился в конце каждого года анализируемого периода, кроме 1997 и 1999 гг. Анализировались состояния безработицы, зафиксированные в раундах У—ХШ, данные раунда XIV использовались для того, чтобы выяснить, как завершились (и завершились ли) состояния, наблюдавшиеся в предыдущем раунде.

В анализируемую подвыборку попали только индивиды в возрасте от 18 до 60 лет включительно независимо от пола. Хотя российская служба статистики включает в состав безработных индивидов от 15 до 72 лет, мы намеренно исключили крайние возрастные группы, опасаясь того, что для них закон распределения длительности безработицы может сильно отличаться. По тем же причинам в выборку не включались индивиды, трудоустройству которых мешает плохое состояние здоровья (табл. 1).

Таблица 1

Численность безработных в возрасте 18-60 лет, готовых к работе по состоянию здоровья, в выборке РМЭЗ

Раунд РМЭЗ (год) Число безработных в выборке, чел. Число опрошенных, чел.

V (1994) 462* 11 290

VI (1995) 476* 10 666

VII (1996) 525* 10 465

VIII (1998) 617*(593) 10 675

IX (2000) 539*(493) 10 975

X (2001) 514 12 121

XI (2002) 500 12 523

XII (2003) 467 12 656

XIII (2004) 438 12 641

* Выборка построена без учета критерия готовности немедленно приступить к работе.

з £

a

I £

3

§

»0

о &

'3

«I £

№2(14)2009 ^

о &

»o

В определении безработицы использовалась методология Международной организации труда (МОТ). Согласно этой методологии безработным считается индивид:

• не имеющий работы;

• желающий найти и активно ищущий ее;

• готовый приступить к работе в ближайшее время.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Отметим, что некоторые исследователи (Нестерова и Сабирьянова [Нестерова, Сабирьянова (1998)], Гроган и ван ден Берг [Grogan, van den Berg (1999)], Карцева [Карцева (2002)]) включали в категорию безработных также индивидов, которые хотят найти работу, однако не заняты активным поиском. Гроган и ван ден Берг предлагали и другие определения, согласно которым безработными считались индивиды в неоплачиваемом отпуске и даже те, кто испытывает задержки заработной платы. Фолей опирался на самоопределение индивидов и включал в анализируемую выборку тех, кто считал себя безработным. В части работ анализировались разные выборки — построенные по классическому определению МОТ и по альтернативным оп-

з

§ ределениям.

| Для выявления принадлежности индивида к категории безработных, занятых или не вхо-о дящих в рабочую силу, использовались ответы на следующие вопросы опросника РМЭЗ: | 1. «Ваше основное занятие в настоящее время?»

2. «Хотели бы вы найти работу?»

3. «Вы обращались куда-нибудь или к кому-нибудь в поисках работы в течение последних 30 дней?»

4. «Если бы на прошлой неделе вам предложили подходящую работу, вы смогли бы приступить к ней сразу?»

5. «Какой ответ лучше всего описывает ваше основное занятие в настоящее время?» Ответ на вопрос 1 использовался для того, чтобы определить, имеет ли респондент работу.

Положительные ответы на вопросы 2,3и4 являлись необходимым условием для включения респондента в анализируемую выборку безработных согласно используемому нами определению безработицы. Вопрос 5 был нужен для исключения из анализа людей с плохим здоровьем (среди вариантов ответов предлагался следующий: «не работаю по состоянию здоровья»).

Вопрос4 был включен в опросники только в 1998 г., поэтому при анализе предыдущихлет не было возможности воспользоваться критерием готовности приступить к работе — индивид классифицировался как безработный, если он удовлетворял всем остальным критериям. Как отмечают К. В. Маркова и С. Ю. Рощин ([Маркова, Рощин (2004)], с. 86), это не должно приводить к значительному искажению результатов, так как более 90% индивидов, отнесенных к безработным по остальным критериям, удовлетворяют и критерию готовности приступить к работе (по данным 1998-2001 гг.). Чтобы иметь возможность сравнить наши результаты с результатами других исследований, для 1998 и 2000 гг. были составлены две выборки безработных — с учетом и без учета критерия готовности к работе.

Чтобы определить, нашел ли респондент работу между двумя раундами опроса, исполь-§■ зовались ответы на следующие вопросы:

| • «Скажите, пожалуйста, у вас есть сейчас работа, вы находитесь в оплачиваемом или не-§. оплачиваемом отпуске или у вас нет работы?»

| • «В каком году и в каком месяце вы ушли с вашей последней работы, перестали работать?» § Если безработный в п-м раунде респондент в следующем раунде опроса указывал, что у него есть работа, считалось, что из состояния «быть безработным» он вышел в состояние

92

_ №2(14)2009

«занятость». Тот же вывод заключался, если респондент указывал, что с последней работы | он ушел после раунда п, пусть даже в раунде (п + 1) он опять был безработным (т. е. за проме- | жуток времени между раундами он перешел из безработицы в занятость, а потом обратно). Респондент, не нашедший работу между раундами п и (п + 1), но и не оставшийся в составе ^ безработных, классифицировался как вышедший из рабочей силы. Если в течение периода безработицы индивид стал старше 60 лет, учитывались только те наблюдения за ним, в которых его возраст удовлетворял нашим ограничениям, после 60 лет этот респондент считался выбывшим из рассмотрения (но не вышедшим из состава рабочей силы). Аналогично не рассматривались наблюдения за индивидами младше 18 лет, но как только эти индивиды достигали совершеннолетия, они могли классифицироваться как безработные.

Такой подход не учитывает некоторые варианты переходов. Например, индивид, осуществивший между двумя раундами опроса переход «быть безработным» — «не быть рабочей силой» — «занятость», будет рассматриваться, как вышедший в состояние «занятость», хотя состояние «быть безработным» завершилось выходом в состояние «не быть рабочей силой». Аналогично переход «быть безработным» — «не быть рабочей силой» — «быть безработным» приведет к тому, что выход из состояния «быть безработным» вообще не будет зафиксирован. Такие переходы (как и другие, более сложные, варианты, приводящие к ошибкам классификации) маловероятны в силу того, что состояние «не быть рабочей силой» является наиболее стабильным из рассматриваемых состояний и вероятность выхода из него в течение года довольно мала. Тем не менее был проведен ряд статистических испытаний, которые показали, что смещение оценки в результате ошибок классификации весьма невелико.

При учете временной зависимости считалось, что на вероятность выхода из безработицы влияет время, прошедшее с момента увольнения с последней работы (если месяц увольнения и месяц опроса совпадали, считалось, что респондент пребывает в состоянии безработицы 0 месяцев). Ошибки измерения, связанные с не совпадающими в разных раундах ответами на вопрос о дате увольнения, не учитывались. Они не оказывают существенного влияния на результаты, о чем свидетельствует, в частности, близость оценок средней длительности безработицы в моделях с учетом и без учета временной зависимости.

Время, прошедшее между двумя раундами опроса, рассчитывалось исходя из данных о годе и месяце опроса респондента.

7. Результаты оценивания

Прежде всего, оценивалась непрерывная модель длительности безработицы для двухлетних панелей, составленных из соседних по времени раундов опроса РМЭЗ. Результаты оценивания приведены в табл. 2.

Как видно из табл. 2, наибольшая длительность безработицы наблюдалась в 1996-2000 гг. Частично этот факт можно списать на недостатки используемого метода (как уже говорилось, при увеличении временного промежутка между раундами опроса точность оценок падает из-за ошибок в определении состояния выхода).

Отметим, что это происходит не вследствие недостатка метода самого по себе, а из-за того, что данные РМЭЗ не позволяют точно отслеживать переходы между состояниями «быть безработным» и «не быть рабочей силой». Также отметим, что в этот период времени наблю-

№2(14)2009

дался и наиболее высокий уровень безработицы (табл.3), что вполне согласуется с полученными результатами.

Таблица 2

Оценки средней продолжительности безработицы (СПБ) и вероятности выхода из безработицы в течение месяца (ВВБ) в предположении об отсутствии

временной зависимости

Годы Средняя продолжительность безработицы, мес. Медианная продолжительность безработицы, мес. Вероятность нахождения работы в течение месяца, % Вероятность выхода из рабочей силы в течение месяца, % Вероятность выхода из безработицы в течение месяца, %

1994-1995* 6,3 4,4 10,0 5,2 14,7

1995-1996* 8,6 5,9 7,6 3,7 11,0

1996-1998* 13,6 9,4 4,6 2,6 7,1

1998-2000* 12,3 8,6 5,6 2,3 7,8

2000-2001 7,6 5,3 8,4 4,3 12,3

2001-2002 7,2 5,0 8,3 5,1 13,0

2002-2003 6,2 4,3 9,4 6,0 14,8

2003-2004 6,5 4,5 10,0 4,7 14,3

2004-2005 6,9 4,8 8,1 5,9 13,5

о *

»0

«

3

3

г

0

1

г

§ &

I §

г

о

г

I

а

»о

0 с 3 г

3

£ £

а

1 £

з §

0

1

£

! »0

о &

'3

«I £

3 3 X

«I &

€ 3

* При анализе первых четырех панелей для определения безработицы не использовался критерий готовности приступить к работе.

Таблица 3

Уровень безработицы и средняя продолжительность поиска работы (незавершенной безработицы), поданным ОНПЗ Госкомстата РФ

Год Уровень безработицы, % Среднее время поиска, мес.

1992 5,2 4,4

1993 н/д 5,7

1994 н/д н/д

1995 9,5 7,4

1996 9,7 8,2

1997 11,8 8,8

1998 13,2 9,1

1999 13,0 9,7

2000 9,8 9,1

2001 8,8 8,2

№2(14)2009

Окончание табл. 3

Год Уровень безработицы, % Среднее время поиска, мес.

2002 8,5 8,6

2003 7,8 8,2

2004 7,9 8,5

2005 7,1 8,4

2006 6,7 8,9

0

1

а

I

¡с ¡с

Тем не менее наши оценки значительно ниже приводимых в предыдущих исследованиях. Для сравнения перейдем от рассмотрения средней длительности безработицы к медианной длительности. Дело в том, что метод Каплана—Мейера, использованный в предыдущих работах, не позволяет оценить математическое ожидание анализируемой случайной величины, но дает оценку для медианы.

Рассмотрим несколько результатов из имеющихся работ. Приводимая в работе [Foley (1997)]2 оценка функции дожития для длительности безработицы в России в 1992-1994 гг. свидетельствует о медианной длительности 14 мес. Гроган и ван ден Берг [Grogan, van den Berg (1999)] дают оценку функции дожития с медианой на уровне 7 мес. (для выборки безработных, производимой по методологии МОТ). Согласно Карцевой [Карцева (2002)], медианная длительность безработицы в период 1994-2000 гг. оценивается как 17,9 мес. Как видно, исследователи дают весьма различные оценки.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Оценивание непрерывной модели без учета временной зависимости для выборки 19941996 гг. дает оценку медианы в 5,3 мес., а для выборки 1994-2000 гг. — 7,2 мес. К сожалению, мы не смогли оценить длительность безработицы для 1992-1994 гг. из-за отсутствия данных.

Для каждой из двухлетних панелей оценивалась и дискретная модель без временной зависимости (функциями ф£(г) и фМ(Г), равными константе). Так как дискретная модель дает оценку среднего числа полных месяцев работы, аналогичный показатель был рассчитан и на основании непрерывной модели, чтобы сделать возможным сравнение двух подходов (табл.4). Как видно, обе модели дают практически одинаковые результаты.

Оценивание с учетом временной зависимости проводилось по объединенным панелям: отдельно для 1994-1996 гг. и для 2000-2005 гг. Так как для учета временной зависимости необходима информация о дате последнего увольнения, индивиды без опыта работы не входили в эти выборки. Дискретная модель без учета временной зависимости (с функциями фЕ(Г) и фМ(Г), равными константе) оценивалась по объединенным выборкам дважды: до исключения «неопытных» индивидов и после их исключения. Оказалось, что средняя длительность безработицы почти не меняется в зависимости оттого, включили «неопытных» индивидов в выборку или нет. Однако оценки, полученные по выборке, состоящей только из «опытных» респондентов, свидетельствуют о том, что для них относительно больше вероятность нахождения работы и меньше вероятность выхода из рабочей силы.

2 Приведенные результаты взяты из оценок Каплана—Мейера для функций дожития, приводимых в работах [Foley (1997)] и [Grogan, van den Berg (1999)].

95

№2(14)2009

При оценке кусочно заданных функций использовались следующие временные промежутки: 0-11 мес., 12-23 мес., 24-35 мес., 36-47 мес., 48 мес. и более — для выборки 1994-1996 гг., 0-2 мес., 3-11 мес., 12-23 мес., 24-35 мес., 36 мес. и более — для выборки 2000-2005 гг. Результаты, полученные с использованием различных функций временной зависимости фЕ(Г) и ф^(Г), приведены на рис. 3.

Таблица 4

Среднее число полных месяцев безработицы согласно непрерывной и дискретной моделям

Годы Среднее число полных месяцев безработицы (непрерывная модель) Среднее число полных месяцев безработицы (дискретная модель)

1994-1995 5,82 6,11

1995-1996 8,08 8,09

1996-1998 13,13 13,07

1998-2000 11,84 11,83

2000-2001 7,10 7,07

2001-2002 6,71 6,67

2002-2003 5,73 5,80

2003-2004 5,99 5,87

2004-2005 6,42 5,92

о *

»0

«

3

3

г

0

1

г

§ &

I §

г

о

г з

I

а

»о

0 с 3 г

3

£ £

а

1 £

з §

0

1

£

! »0

о &

'3

«I £

3 3 X

«I &

€ 3

Оценки закона распределения длительностей при различных спецификациях оказались весьма схожи. Согласно информационному критерию Акаике (табл.5) наилучшим образом описывает данные модель с экспоненциальными функциями временной зависимости. Оценка математического ожидания неполного числа месяцев поиска работы по этой модели равна 5,5 мес., а оценка медианы — 3,2 мес.3 для выборки 2000-2005 гг. Для ранней выборки эти показатели равны соответственно 6,1 и 3,4 мес.

Как видно, вероятность выхода из безработицы снижается стечением времени — результат типичный, хотя и расходящийся с результатами предыдущих исследований по РМЭЗ. При этом вероятность нахождения работы убывает, а вероятность выхода из состава рабочей силы оценивается различными моделями по-разному. Оценки по кусочно-заданным функциям Фе(0 и фМ(Г) свидетельствуют о том, что в первые месяцы эта вероятность высока, затем резко падает, после чего постепенно растет примерно до первоначального уровня (при анализе выборки 2000-2005 гг.). В то же время квадратичная и экспоненциальная формы модели не замечают спада вначале и дают возрастающую функцию риска выхода из рабочей силы. Вероятно, это различие объясняется недостаточной гибкостью квадратичной и экспоненциальной спецификаций.

3 Оценка для медианы получена линейной интерполяцией функции дожития: оцененная функция дожития равна 0,52 для 3-го месяца и 0,42 для 4-го.

96

_ №2(14)2009

Оценки по выборкам 1994-1996 гг. и 2000-2005 гг. оказались весьма схожими, несмотря | на то, что меньший объем первой выборки не дает возможности использовать гибкую специ- | фикацию, которая позволила бы точнее оценить временную зависимость в первые месяцы поиска работы. Соответственно все модели свидетельствуют о росте вероятности выхода ^ из состава рабочей силы с течением времени. Модели с кусочно заданной временной зависимостью свидетельствуют о том, что вероятность выхода из безработицы после 2 лет сходится к некоторому устойчивому значению. Экспоненциальная модель дает такие же результаты, что, впрочем, является просто следствием спецификации (так же как квадратичная модель этим результатам противоречит — согласно такой спецификации функция риска обязательно стремится к 1 или 0).

Таблица 5

Качество подгонки для различных спецификаций функций временной зависимости

Спецификация 1994-1996 гг. 2000-2005 гг.

Логарифм функции правдоподобия AIC Логарифм функции правдоподобия AIC

Постоянная -593,37 1190,74 -1570,64 3143,28

Квадратичная -572,28 1148,57 -1478,41 2962,82

Кусочно-постоянная -567,70 1139,38 -1470,98 2951,95

Кусочно-линейная -567,12 1138,25 -1471,77 2953,55

Экспоненциальная -566,87 1137,74 -1471,95 2949,90

Приводимые оценки средней длительности безработицы не расходятся с данными официальной статистики России. Согласно опубликованным результатам обследования населения по проблемам занятости, средняя продолжительность незавершенных состояний безработицы в период 2000-2005 гг. составляла 8-9 мес. Известно, что в случае отсутствия временной зависимости и неоднородности индивидов средние продолжительности незавершенных и завершенных состояний совпадают [Salant (1977)], если же существует отрицательная временная зависимость, незавершенные состояния в среднем длиннее завершенных ([Carlson, Horrigan (1983)], с. 1144)4. Кроме того, в нашу выборку не входили представители крайних возрастных групп и те, кто не работал по состоянию здоровья. Соответственно средняя продолжительность безработицы в нашей выборке должна быть несколько ниже, чем в выборке ОНПЗ, так как для исключенных групп вероятность нахождения работы, скорее всего, относительно низка.

4 То, что незавершенные состояния в среднем оказываются такими же или даже более длительными, чем завершенные, может показаться неправдоподобным. Однако стоит учесть, что на продолжительность незавершенных состояний влияет эффект отбора: момент опроса населения, скорее, застанет более продолжительные состояния безработицы.

97

№2(14)2009 ^

В то же время полученные оценки несколько выше тех, что приводит Минтруд России. Дело втом, что продолжительность зарегистрированной безработицы ниже продолжительности безработицы, определяемой по методологии МОТ.

Заключение

В настоящей статье показано, что результаты предыдущих исследований безработицы по данным РМЭЗ, относящиеся к средней продолжительности безработицы и характеру временной зависимости, являются следствием смещения отбора, возникающего при попытке | примененить классические методы анализа длительностей состояний для анализа данных |. опросов населения. Проведенный статистический эксперимент показал, что игнорирование 1 смещения отбора приводит к значительному завышению оценки средней длительности без-5» работицы и к серьезному искажению функции риска.

g В статье предложен метод анализа, который позволяет при работе с данными РМЭЗ полу-| чить оценку средней длительности безработицы и функции риска как для выхода в состоя-S ние «занятость», так и для перехода в состояние «не быть рабочей силой», а также учесть § влияние объясняющих переменных.

| Полученные оценки средней продолжительности безработицы согласуются с данными § Росстата и Минтруда РФ и значительно ниже оценок, полученных ранее разными исследова-| телями по данным РМЭЗ.

| Предложенный метод может быть использован для исследования длительностей других I состояний поданным панели опросов населения (анализ брачной стабильности, продолжи-£ тельности курения и др.).

Л Список литературы

с

3 КарцеваМ. А. Влияние образования на вероятность нахождения работы в России (препринт). М., 2002. ! Маркова К. В., Рощин С. Ю. Поиск работы на российском рынке труда. М.: ТЕИС, 2004.

Нестерова Д., Сабирьянова К. Инвестиции в человеческий капитал в переходный период в России. ^ Серия «Научные доклады». М.: РПЭИ. 1998. № 99. Апрель.

VO

g СавинцеваО. С. Анализ длительностей до момента прекращения. Международная научная студено ческая конференция. НГУ, 2001.

| Сайт федеральной службы государственной статистики. URL: http://www.gks.ru § BakerG.M., TrivedyP.K. Estimation of Unemployment Duration from Grouped Data: A Comparative | Study // Journal of Labor Economics. 1985.Vol. 3. № 2. P. 153-174.

'o Carlson J. A, Horrigan M.W. Measures of Unemployment Duration as Guides to Research and Policy: Comment // The American Economic Review. 1983. Vol. 73. № 5. P. 1143-1150.

ф

CorakM, HeiszA. Alternative Measures of the Average Duration of Unemployment. Statistics Canada. 1995.

ф

Foley M. C. Determinants of Unemployment Duration in Russia. Yale University. 1997. | Grogan L, Van den Berg G. The Duration of Unemployment in Russia. University of Amsterdam, 1999. g. HeckmanJ., Singer B. A Method for Minimizing the Impact of Distributional Assumptions in Econometric I Models for Duration Data // Econometrica. 1984. Vol. 52. № 2. P. 271-320.

о KieferN.M. Economic Duration Data and Hazard Functions// Journal of Economic Literature. 1988. Vol. 26 № 2. P. 646-679.

т2(14)2009

NickellS.J. Estimating the Probability of Leaving Unemployment II Econometrica. 1979. Vol. 47. №5. P. 1249-1266.

Neumann G. R. Search Models and Duration Data. Handbook of Applied Econometrics. 1995. Ch. 4. SalantS.W. Search Theory and Duration Data: A Theory of Sorts II The Quarterly Journal of Economics. 1977. Vol. 91. № 1. P. 39-57.

ПРИЛОЖЕНИЕ

Доказательство формулы (30)

В силу независимости случайных величин TE и TN искомую вероятность можно выразить следующим образом:

P(Te < Tn |{Te < l} П {Tn < l}) =

l l

= JJfE(x|{Te <l})-fN(y|{Tn <l})dydx =.

0 x

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ll = J fE (x|{Te < l})J fN (y|{TN < l})dydx.

0x

Найдем условную функцию плотности fE (x|{TE < l})для x < l:

fE (x|{Te < l}) = dP(Te < x|{Te < l}) = dP(Te < X|{Te < l}) = d dx dx dx

X О

11

'1- -exp(~ -X ex Xe exp(— -X ex )

ч 1 — exp(- -X eI ) 1—exp(- -X eI )

Аналогично,

Таким образом,

fN (y |{Tn < l}) =

XN exp(—Xnx) 1- exp(—X nI )

D/T -у- I.-у гXeexp(-Xex) pXnexp(-XNy) , ,

P(Te < Tn | {Te < I} П {Tn < I}) = I---- I---f-dydx =

J0 1-exp(-XeI) Jx 1—exp(-XnI)

1

(1 — exp(— -X eI ))(1 1 —exp(— -X NI ))

(1 — exp(— -X eI ))(1 1 —exp(— -X ni ))

(1 — exp(— -x ei ))(1 1 — exp(— -X ni ))

(1 — exp(— -x ei ))(1 1 — exp(— -X ni ))

(1 — exp(— -x ei ))(1 — exp(— -X nI ))

JXe exp(—Xex) •(—exp(—XNy)|!x)dx =

0 l

J Xe exp(—(Xex) -(exp(—Xnx) — exp(—XnI)) dx =

0

ll

JXe exp(—(Xe +Xn )x) dx — JXe —exp(—Xex — XnI) dx

X E +X,

-exp(—(X e +X n )x

— (—exp(—(X ex + X nI ) 0)

XE

X E +X,

= XE + XN exp(—(XE + XN )l) — (XE + XN )exp(—XnI) (X e +X n )(1 —exp(—X El ))(1 —exp(—X nI ))

что и требовалось доказать.

-(1—exp(—(X e +X n )l)) + exp(—(X e +X n )l) — exp(—X nI )

0

X E

0

i Надоели баннеры? Вы всегда можете отключить рекламу.