А.В. Вушкан
ОПРЕДЕЛЕНИЕ ТИПА ЭКОНОМЕТРИЧЕСКОЙ МОДЕЛИ ДЛЯ ОЦЕНКИ ДЕТЕРМИНАНТ ВЫБОРА ПРЕКРАЩЕНИЯ ИЛИ ПРОДОЛЖЕНИЯ РАБОТЫ ПОСЛЕ ВЫХОДА НА ПЕНСИЮ
Аннотация
В статье исследуется отражение социально-экономических изменений в обществе на вероятность активной трудовой деятельности после выхода на пенсию для людей пенсионного возраста.
Данный анализ основывается на первой волне выборочного обследования «Ро-
2008 № 2
Вестник Ростовского государственного экономического университета «РИНХ»
дители и дети, мужчины и женщины в семье и обществе».
В наш анализ были включены лица, которые, оформив трудовую (или государственную) пенсию по старости (или возрасту), продолжали работать.
Исходя из данной цели анализировался период времени - интервал от момента официального оформления пенсии (выход на пенсию) до момента фактического прекращения работы или до окончания наблюдения.
Annotation
The possibility to work after retiring for people of a pension age in the context of the reflection of social and economic changes is investigated in the article.
The given analysis is based on the first wave of selective inspection “Parents and children, men and women in a family and a society”.
Our analysis concerns the persons who having issued their labour (or state) old-age pension (or the state one), continued to work.
Following this aim the period of time - an interval from the moment of official registration of pension (retiring) till the moment of actual cessation of work or before finish of supervision was analyzed.
Ключевые слова
Пенсионеры, работающие пенсионеры, неработающие пенсионеры, пенсия, выход на пенсию, логистическая регрессия, логит-модель, пробит-модель.
Key words
Pensioners, working pensioners, idle pensioners, pension, retiring, logistical regress, a logit-model, a probit-model.
Что влияет на решение пенсионера
о продолжении работы после оформления пенсии? Для ответа на этот вопрос необходимо оценить различия в характеристиках, определяющих
социально-демографический, профессиональный профиль людей, выходящих на пенсию и влияющих на его решение о продолжении работы. Адекватным эконометрическим
инструментом решения такой задачи представляется логистическая модель.
Логистическая регрессия
позволяет предсказывать наличие или отсутствие исследуемой характеристики (в нашем случае продолжение работы после пенсии или нет) в зависимости от набора факторов, влияющих на выбор модели поведения пенсионера.
Классическая линейная регрессия не налагает ограничений на вид зависимой переменной. В то же время существует большой класс задач, в которых
нам необходимо наложить определенные ограничения на моделируемую переменную. Наиболее часто речь идет о том, что моделируемая переменная имеет не непрерывную, а дискретную природу. Например, экономически активный индивид может находиться в одном из двух состояний: занят экономической деятельностью или нет (безработный); или неработающий пенсионер - работающий пенсионер. Такая модель, когда зависимая переменная может принимать два значения (0 или 1), называется моделью бинарного отклика и относится к классу моделей качественного выбора.
Пусть имеются данные наблюдений двоичной переменной у. Предположим, что существует ненаблюдаемая или латентная переменная у*, изменяющаяся от -сю до +ю, которая порождает наблюдаемую зависимую переменную у. Таким образом, у* имеет большие значения при у=1 и соответственно
меньшие при у=0.
Понятие латентной (скрытой) переменной - основное в подходе к определению модели бинарного отклика.
Так, рассматриваемые в анализе пенсионеры могут находиться в одном из двух состояний: неработающий пенсионер - работающий пенсионер. Добавим, что при этом один пенсионер может быть близок к решению оставить работу и заняться поиском новой, более подходящей; другой может быть полностью удовлетворен своим местом работы; третий решает оставить работу и уйти на заслуженный отдых. Во всех этих случаях наблюдаемое у = 1. Идея скрытой переменной состоит в том, что существует ряд факторов, порождающих наблюдаемое состояние. Невозможно непосредственно наблюдать у*, но изменение этой переменной - результат таких изменений, которые можно наблюдать.
Предположим, что латентная переменная у* линейно зависит от вектора наблюдаемых переменных х:
* п
У і = Р + є,
(1)
Латентная переменная у* связана с наблюдаемой бинарной переменной у следующей системой:
У г =
11 если у г * > т I 0 если уг * < т
(2)
где т - это некоторое пороговое значение.
Таким образом, у=0, если у* меньше или равно некоторому пороговому значению т, если же у* превышает это значение, то у=1. Не нарушая общности, можно считать, что т=0.
Однако, так как зависимая переменная не наблюдаема, то модель не может быть оценена методом наимень-
ших квадратов. В этом случае вместо МНК используют метод максимального правдоподобия, который требует предположения о распределении ошибок. Наиболее часто выбирают между нормальным и логистическим распределением. Если выбирается нормальное распределение, то модель называется пробит-моделью, если логистическое, то логит-моделью. Как и в линейной регрессионной модели, предполагается, что Е(в|х)=0.
Так как у* не наблюдаема, то нельзя оценить дисперсию ошибок, поэтому для пробит-модели исходят из предположения, что Уаг(в|х)=1, а для логит-модели, что Уаг(в|х)=п2/3^3,29. Выбранное точное значение произвольно в том смысле, что оно не определяется по имеющимся данным: оно выбрано таким образом, чтобы получить простейшее выражение для функции распределения в. В результате этих предположений имеем функцию плотности вероятности следующего вида:
1 є2
ф(є) = .— ехр(----------) - для нормально-
\2п 2
го закона
Я(є) = ■
ехр(є)
[1 + ехр(є)]2 го закона
- для логистическо-
и фу нкции распределения:
є 1 ґ 2
Ф (є) = Г ,— ехр(------)Ж
У2Ї 2 ’
мального закона
Л(є) =
ехр(є)
для нор-
- для логи-
1 + ехр(в) стического закона
Такое распределение называется стандартным нормальным и стандартным логистическим распределением соответственно.
Если взять логистическое распре-
деление с единичной дисперсией, то такая функция распределения будет практически тождественной функции распределения для нормального закона. Такое логистическое распределение называется стандартизированным (а не стандартным). Однако функция распределения и функция плотности вероятности в этом случае записываются более сложно:
Л(є)=
уехр(^є)
[1 + ехр(хє)]2
(3)
ехр(є)
Л^ (є) =
1 + ехр(^є)
(4)
где г =
Так как для стандартного логистического распределения выражение тривиальнее, то, как правило, для логит-модели используют именно его.
Имея конкретную форму распределения в, можно вычислить вероятность того, что у = 1 при некоторых заданных значениях вектора х.
Так как нормальное и логистическое распределение симметричны, то легко получить следующее выражение:
Рг(у = 1| х) = Рг(в < рх | х) = Е(вх),
(5)
где Б для логит-модели - это логистическая функция распределения Л, а для пробит-модели - функция распределения нормального закона Ф.
Рассмотрим логит-модель для случая одной независимой переменной:
Рг(у = 1| х) = Л(а + Рх).
(6)
При увеличении значения х на
единицу аргумент функции Л растет на Р единиц.
Для оценки моделей бинарного отклика используется метод максимального правдоподобия.
Для определения уравнения правдоподобия введем Р как вероятность наблюдать какое-либо значение у:
Р, =
Рг(уі = 11 х,), если мы наблюдаем уі = 1 1 - Рг(уі = 11 хі), если мы наблюдаем у, = 0
(7)
Если наблюдения независимы, уравнение правдоподобия будет:
N
L(fi\y, X) = П Рг
Или, раскрывая (7):
де І у, X) = П Рг(у, = 1 \ х, )П [1 - Рг(У, = 1 \ х,)]
У=1 у=0
где индекс показывает, какой результат брать для умножения: тот, где у=1 или у=0 соответственно.
Используя уравнение (5) и (6), получим:
Цв І у, X) = П Р(х, в)П [1 - Р(х, в)]
у=1 у=0
Логарифмируя, мы получаем логарифмическое уравнение правдоподобия:
1п Ь(в \ у, X) = X 1п Р(х,в) + X 1п[1 - Р(х,в)]
у=1 у=0
(8)
Желательные свойства для МП-оценок - состоятельность, нормальность и эффективность - асимптотичны. Это значит, что эти свойства выполняются, когда размер выборки приближается к бесконечности.
Логистическая модель определяет
і =1
вероятность для пенсионера работать или нет P( Уi = 1) следующим образом:
ехР(р0 + xik рк )
P(Уі =1| xi)
1 + + xik (Ik)
(9)
где P(Уі = 1 х,) есть вероятность того, что в домохозяйстве , присутствует пенсионер при условии наличия некоторых экзогенных характеристик, и где у, = признак
трудовой деятельности; у, = 1, если пенсионер работает, и нулю, если
пенсионер не работает;
Х
ik
k -я
объясняющая переменная вероятности для пенсионера i работать, и -параметр оценки, ассоциируемый с Хк.
Значимость индивидуальных переменных определяется с помощью статистики хи-квадрат Вальда, которая представляет собой квадрат отношения оцененного коэффициента регрессии к оценке его стандартной ошибки.
Для оценки качества модели используются два аналога R2 для линейной регрессии: pseudo R2 и McFaddenR2.
Пусть lnLi равен максимуму логарифмической функции правдоподобия для нашей модели, а lnLo равен максимуму логарифмической функции правдоподобия для модели, в которой все параметры, за исключением свободного члена, равны нулю. Очевидно, что lnL1> lnL0. Чем больше различаются их значения, тем лучше наша модель. Именно на этом факте строятся оба показателя.
pseudoR2 = 1 -
1
2(ln L1 - ln L0)
1 +
N
(10)
McFaddenR2 = 1 - -ln Ll
ln L
(11)
где N - число наблюдений,
0 - значение функции
правдоподобия для модели,
включающей только свободный член;
L1 - значение функции
правдоподобия для модели,
включающей все переменные
Меру, предложенную Макфадденом, также часто называют индексом отношения правдоподобия (likelihood ratio index).
Для оценки качества подгонки модели используется также отношение максимального правдоподобия. Мерой правдоподобия служит отрицательное удвоенное значение логарифма этой функции (-2LL). В качестве начального значения (-2LL) применяется значение, которое получается в регрессионной модели, содержащей только константы. Для того чтобы вычислить значение lnL0, необязательно оценивать логит-или пробит-модель со всеми параметрами, кроме свободного члена, равными нулю. В этом случае модель можно записать в следующем виде:
Pr(у = 1| х) = p,
где р - это константа, принадлежащая сегменту [0,1].
Оценкой максимального правдоподобия для р будет:
p N і
p = , N
где N і =£ У.
Тогда значение логарифма правдоподобия можно вычислить следующим способом:
1п Ь0 = £у,1п(N1 / N) + X (1 - у, )1п(1 - N1 / N) = i=1 , = 1
= N11п(N1 / N) + (N - N1) 1п(1 - N1/ N)
(12)
Кроме того, для оценки качества модели можно сравнить долю правиль-
ных и неправильных предсказаний, сделанных по построенной модели.
Интерпретацию результатов
логистической регрессии удобно проводить в терминах коэффициента отношения шансов (odds ratio), который показывает, насколько больше (или меньше) частота случаев продолжения трудовой деятельности (или
непродолжения) в каждой категории социально-экономической переменной по отношению к контрольной категории (свободному члену уравнения).
Для его расчета определяется отношение вероятностей двух событий, которое называется шансом (odds):
odds(Y =1) = =0) = exp(eo + eX).
(13)
Из полученной формулы видно, что логарифм коэффициента соотношения вероятностей
представляет собой линейную функцию переменной X . Основной интерес представляет собой коэффициент при X , который дает оценку условной вероятности для пенсионера
продолжать трудовую деятельность в зависимости от других характеристик.
Детерминантами, влияющими на продолжительность работы после пенсии, риск ее прекращения, являются переменные, отражающие социальнодемографический и профессиональный статус работающих пенсионеров. На решение пенсионера о продолжении трудовой деятельности и сроке работы в наибольшей степени, на наш взгляд, влияет семейное положение, структура домохозяйства, уровень дохода
домохозяйства.
Совершенно четкойпредставляется закономерность, согласно которой, чем крупнее населенный пункт, где живет пенсионер, тем выше вероятность для него работать после пенсии.
Чем выше уровень образования у пенсионера, тем значительнее шансы продолжать работу.
Плохое состояние здоровья -определяющий фактор прекращения работы после пенсии.
Поясним метод на простом примере. Пусть Y - переменная, принимающая значение 1, если в домохозяйстве есть работающий пенсионер, и нулю, если пенсионер не работает. Пусть X - переменная, принимающая значение, равное единице, если это домохозяйство одинокого пенсионера, и равное нулю -для других случаев.
Шансы продолжать работу после выхода на пенсию для одиноких есть exp(^0 + в X) , а для домохозяйств другого состава - exp(e,). Тогда отношение шансов выражается следующей формулой, поясняющей смысл коэффициента в:
odds ratio или OR
= odds(Y = 1X = 1> = ифЩ +Д) = )
odss(Y = 1X = 0) exp(e0)
(14)
Отношение шансов OR = 1
указывает на отсутствие различий между сравниваемыми группами (работающими пенсионерами и неработающими). Если OR > 1, то шансы для одиноких пенсионеров работать выше, чем для пенсионеров, проживающих в домохозяйствах иного типа (домохозяйства пенсионеров, домохозяйства сложного состава). Если OR < 1, то шансы работать для
одиноких пенсионеров ниже, чем для пенсионеров, проживающих в
домохозяйствах сложного состава (домохозяйства, имеющие в своем
составе как пенсионеров, так и не-пенсионеров). В случае, если переменная X имеет непрерывный
характер, экспонента коэффициента показывает, как изменится указанное
ъ
соотношение при увеличении на единицу величины фактора X . Таким же образом интерпретируется модель со многими факторами.
Библиографический список
1. Александрова Е.Н. Ключевые проблемы развития социальной сферы России: организационно-экономический аспект // Финансы и кредит, 2007. - №28. -с.67-75.
2.Доходы и социальные услуги: нера-
венство, уязвимость, бедность. Коллективная монография / Рук. JI.H. Овчаро-ва; Независимый институт социальной политики. - М.: Изд. Дом ГУ ВШЭ,
2005.-348 с.
3.Новый энциклопедический словарь. -М.: РИПОЛ КЛАССИК, 2002. - 1456 с.
4.Обзор социальной политики в России. Начало 2000-х / Под ред. Т.М. Малевой; Независимый институт социальной политики. - М.: НИСП, 2007. - 432 с.
5.Скребенков Н.Н. Современное состояние системы пенсионного обеспечения в России // Власть, 2007. - №9. -с.30-32.
6.Abbring J.H., van den Berg G.J. The unobserved heterogeneity distribution in duration analysis, working paper. 2003.
7.Blossfeld H.P., Hamerle A., Mayer K.U. Event history analysis. - Hillsdale, New
и
Jersey: Lawrence Erlbaum, 1989.
Bibliographic list
1 .Aleksandrova E.N. A Key Problem of Development the Social Sphere of Russia: Organizational and Economic Aspect // Finance and Credit, 2007. - № 28. - p.67-75.
2.Profits and Social Services: Non-
equality, Vulnerability, Poverty. The Collective Monography / L.N. Ovcharova; Independent Institute of Social Policy. - М.: Izd. Dom GU VSHE, 2005,- 348 p.
3.The New Encyclopedic Dictionary. - М.: RIPOL CLASSIC 2002. - 1456 p.
4. Survey on Social Policy in Russia. The Beginning of the 2000 th. / Ed. by T.M. Malevoy; Independent Institute of Social Policy. - М.: NISP, 2007. - 432 p. 5.Skrebenkov N.N. Modern Condition of a System of Provision of Pensions in Russia // Authority, 2007. - № 9. - p.30-32.
6.Аббринг Ж.Г., Берг Ж.Ж. Ненаблюдаемое распределение разнородности в пролонгированном анализе, рабочий доклад. 2003.
7.Блоссфилд Г.П., Хамерл А., Мэйер К.У. Случайный анализ истории. - Хил-лсдейл, Нью-Джерси: Лоуренс Эрлбаум, 1989.