Прикладная эконометрика, 2019, т. 54, с. 105-125. Applied Econometrics, 2019, v. 54, pp. 105-125. DOI: 10.24411/1993-7601-2019-10006
А. Р. Нартикоев, А. А. Пересецкий
Моделирование динамики распределения доходов в России
В данной работе четырехпараметрическое обобщенное бета-распределение второго типа (GB2) применяется для моделирования распределения населения России по доходам на основе квартальных микроданных доходов домохозяйств за период с 2003 по 2015 г. Параметры распределения оценивались методом максимума взвешенного правдоподобия, и оценки параметров за разные периоды были объединены во временные, которые прогнозировались на 4 квартала вперед. По полученным прогнозным значениям параметров распределения рассчитывались прогнозные значения мер неравенства распределения доходов, таких как риск нахождения за чертой бедности, относительная медианная глубина бедности, отношение квинтилей и индекс Джини. Таким способом получились робастные оценки мер неравенства, при этом точность прогноза составила около 5%. При анализе динамики параметров распределения получен интересный вывод о том, что в кризисные периоды уровень неравенства по доходам снижается, вопреки распространенному интуитивному суждению, что в кризисные периоды неравенство усиливается.
ключевые слова: обобщенное бета-распределение второго типа; меры неравенства; распределение по доходам; Россия. JEL classification: I32; C13; D31; D63; O15.
1. введение
Анализ распределения домохозяйств России по доходу и динамики этого распределения дает рациональную основу для проведения взвешенной и эффективной социальной и экономической политики.
В настоящей работе строится модель функциональной формы распределения домохозяйств России по их располагаемым доходам. Модель строится на основе данных ряда массивов выборочных наблюдений доходов. Рассматривается динамика параметров построенной модели распределения, и на ее основе формируется динамика количественных показателей неравенства распределения доходов. Полученные оценки динамики показателей являются робастными, т.к. они основаны на оценках динамики небольшого числа параметров модели.
1 Нартикоев Алан Ревазович — Национальный исследовательский университет «Высшая школа экономики», Москва; alan.nartikoev@gmail.com.
Пересецкий Анатолий Абрамович — Национальный исследовательский университет «Высшая школа экономики», Москва; aperesetsky@hse.ru.
Первой публикацией, в которой проводилось статистическое изучение распределения доходов населения, была работа (Pareto, 1897). Парето показал (вопреки существовавшему в то время мнению, что большинство естественных явлений имеют симметричное нормальное распределение), что связь между числом налогоплательщиков Nx (с задекларированным доходом не менее x) и величиной их дохода x хорошо описывается убывающей кривой
Nx = Ax—a, (1)
где A > 0 и а > 0 — константы. Величина а интерпретируется как процент уменьшения числа получателей дохода x при увеличении x. Иными словами, —а есть эластичность числа налогоплательщиков по доходу: dln Nj dln ( x ) = —а
Парето предложил формулировку «закона распределения доходов». «Классический» вид функции распределения Парето определяется формулой
F (x) = 1 — (x/xo )—а, x > xo > 0, (2)
где а > 0 — параметр формы (shape parameter) распределения, задающий «массу» правого хвоста, x0 — параметр масштаба (scale parameter).
Эмпирически было выявлено, что уровень а постоянен для разных стран и экономик и находится в интервале (1; 2) — обычно параметр принимает значение около 1.5 независимо от степени диверсификации экономики и общественного устройства. Исходя из этого, Парето заключил, что неравенство доходов определяется не моделью экономической или общественной организации, а только человеческой природой, т. е. естественным неравенством способностей разных людей. Тем самым Парето утверждал, что в его модели богатство индивида всегда определяется его способностями «заработать» и «сберечь».
Gibrat (1931) предложил использовать логнормальный закон для описания распределения доходов индивидов и размеров фирм. В основе модели лежит принцип пропорционального эффекта, согласно которому в каждом периоде исходная величина увеличивается на некоторую случайную долю этой величины. Эта работа оказала значительное влияние на ход истории статистического моделирования доходов, а логнормальное распределение использовалось в подавляющем большинстве эмпирических исследований. Широкое распространение метода связано с тем, что логарифм логнормальной случайной величины распределен согласно нормальному закону распределения.
Существенный недостаток этого подхода заключается в том, что правые хвосты распределений в действительности значительно «тяжелее», чем у логарифмически нормального закона, поэтому это распределение не подходит для моделирования высших уровней дохода. Однако правые хвосты достаточно точно аппроксимируются функцией распределения Парето в силу наличия бесконечных моментов второго и более высоких порядков k, если k > а, поэтому нередко распределение доходов моделируется смесью логнормального и Па-рето-распределений (Neal, Rosen, 2000).
Одна из первых попыток модифицировать подход Gibrat (1931) с целью увеличения точности модели была предпринята в работе (Champernowne, 1952). Однако предложенное че-тырехпараметрическое распределение, несмотря на большую сложность, не гарантирует отсутствие критических ошибок. В работе (Fisk, 1961) на примере данных о доходах в Богемии
за 1933 г. и в США за 1947 г. был показан высокий уровень отклонений средних групповых '§ доходов, оцененных по этому распределению, от истинных значений. J
В работе (Singh, Maddala 1976) предложено трехпараметрическое распределение, осно-
f (X)
ванное на использовании функции интенсивности отказов (hazard function): h( x) =
1 - F ( x)'
ш
I «ï «ï
to Q> О
где f(x) — функция плотности случайной величины, а F (x) — ее функция распределения. § Для аппроксимации правых хвостов распределения требуется убывающая интенсивность а. отказов, поэтому был предложен новый класс распределений, основывающийся на пред- * положении, что интенсивность отказов распределена согласно логистическому закону. Распределение Сингха-Маддалы широко используется во многих исследованиях благодаря гибкости и относительно высокой точности. Функция является обобщением распределений Парето, Вейбулла и частным случаем обобщенного бета-распределения. Распределение Сингха-Маддалы впервые доказало свою применимость на данных переписи США с 1960 по 1972 г., для которых оно показало наилучшее приближение среди всех конкурирующих моделей.
В работе (Dagum, 1996) предложена классификация распределений, которая в обобщенной форме выделяет три семейства функций: 1) Пирсона; 2) Д'Аддарио; 3) Берра (семейство обобщенных логистических распределений).
Систематизация теорий распределения доходов приведена в работе (McDonald, 1984), в которой предложены два обобщенных бета-распределения. Позже, в (McDonald, Xu, 1995), они были обобщены в единую пятипараметрическую функцию. Обобщенное бета-распределение включает в себя подавляющее большинство известных распределений (бета-, гамма-, Парето, Берра, Вейбулла, Фиска, Ломакса, Рэлея, Стьюдента, Фишера, степенное, равномерное, экспоненциальное, логнормальное, нормальное и т. д.). Это позволяет в рамках одной функциональной формы проверить несколько гипотез о значениях параметров моделей, являющихся ее частными случаями, и тем самым определить вид распределения, наиболее точно описывающий данные для выбранной страны или периода.
Среди работ, посвященных моделированию доходов в России по микроданным обследований бюджетов домохозяйств, отметим следующие. В (Айвазян, 1997, 2012; Aivazian, Kolenikov, 2001) предлагается использовать логнормальные смеси для оценивания распределения реальных подушевых доходов в предположении о высокой доле ненаблюдаемых заработков. Сиротин и Раднаев (2008) использовали смесь логнормальных распределений для выделения однородных групп в составе общей неоднородной совокупности — схожий подход применялся Flachaire, Nunez (2007) для данных по Великобритании. Динамика доходов по квинтильным группам за период 1970-2004 гг. изучалась в работе (Царев, 2008) на основе использования модели равновесного дохода. В (Колмаков, 2015) предложена модель гибридного распределения (логнормального и Парето) доходов населения на данных Рос-стата за 2012-2014 гг. Аналогичная модель рассмотрена в работе (Бутаева, 2016) для моделирования доходов населения России в 2014 г. по данным RLMS-HSE.
В настоящей работе четырехпараметрическое обобщенное бета-распределение второго типа используется для моделирования распределения доходов в России по квартальным микроданным обследования бюджетов домашних хозяйств с 2003 по 2015 г. На основе полученных оценок проведен анализ ряда индикаторов неравенства, исследована динамика этих показателей, а также их реакция на кризисные явления 2008 и 2014 гг.
2. модель распределения доходов и меры неравенства
2.1. Обобщенное бета-распределение второго типа GB2
Функция плотности. Плотность обобщенного бета-распределения (McDonald, Xu, 1995) задается функцией, определенной на положительной полуоси пятью параметрами:
fGB ( х;a,b, c p, q ) =
?xap-1[l-(l- c) ( x/ b)a T ba
L J если 0 < xa <-
bapB(p, q)[l + c(x / b)a ]p+q ' 1- c' (3)
0, иначе,
где a,b, p, q > 0, 0< c < 1, B (p, q) — бета-функция.
Обобщенные бета-распределения первого (GB1) и второго (GB2) типа представляют собой частные случаи функции fGB (•):
fGBi (x; a, b, p, q) = fGB (x; a,b, c =0, p, q), (4)
fGB 2 (x;a, b, p, q) = fGB (x;a, b, c =1, p, q).
В работах (McDonald, 1984; Bordley et al., 1997; Bandourian et al., 2002) и ряде других (см. Kleiber, Kotz, 2003, p. 195-196) было эмпирически доказано, что GB2 превосходит все иные распределения по качеству моделирования размера доходов. Поэтому в дальнейшем из семейства обобщенных бета-распределений будет рассматриваться только распределение второго типа:
r i г. \ a (x / b)ap-1
fGB 2(x; a,b, p, q )=^—7-7-rp+7, * >0, (5)
bB(p, q) (1 + (x / b)a)
где b — параметр масштаба, a — параметр формы, характеризующий симметричность плотности, p и q — параметры формы, характеризующие «массу» левого и правого хвостов соответственно.
Функция распределения. Функция распределения GB2 легко выражается через регуля-ризованую неполную бета-функцию, являющуюся функцией распределения случайной величины, имеющей бета-распределение, т. е.
1у(^q)=i(Ppq)= гp-1 (1 -u)q-1 du=Рве*(y;Aq), y^.
После замены переменной интегрирования u = t/ (1 +1) получаем, что
(6)
1 л t p-1 z
Iz(p,q) = BJq) { (TTtT ^ = ^ (p,q), ГД6 J = ^ ■ (7)
Выразим функцию распределения GB2 как интеграл от функции плотности и произведем замену предела интегрирования: ^
01 £
\аР-1 1 (х/Ь)а (+ I и\а(р-Х)
x n(tlh\ap- 1 ( Х/Ъ ' (tlh\a(P-)
Fem ( x; a, b, p, q) = j ^/ b) d, = ' j (t b) d(, / b)a. (8)
0 bB(p,q)(l + (t/b)a) B(p,q) 0 (l + (t/b)a)
x
j J * / ( J ) dy
Заметим, что выражение (8) равно Iz (p, q) при z = (x / b)a. Следовательно, функция обоб- g. щенного бета-распределения второго типа в точке x равна функции обычного бета-распре- *
(x / b)a , ч f (x / b)a ^
деления в точке с параметрами ^ и q : 2 (x; a, b, p, q) = FBeta —; p, q
1 + (x / b) ^ 1 + (x / b)
Это свойство особенно полезно для нахождения численных значений квантилей GB2-рас-пределения.
Момент k-го порядка случайной величины, имеющей GB2-распределение, равен
е (х k )=bkB(p+k / a, q- k / a) (9)
B ^ q)
из чего следует, что момент k-го порядка определен только при p + k / a > 0 и q — k / a > 0, т. е. при —ap < k < aq .
С целью удобства задания аналитических форм для большинства распространенных мер неравенства в работе (Butler, McDonald, 1989) предложено определение нормированного неполного момента k-го порядка (k-th normalized incomplete moment). Нормированный неполный момент k-го порядка для случайной величины X с плотностью f (x) представляет собой долю k-го момента в интервале от 0 до x, т. е.
F (х)= 0 , k4 , 0 < х<«. (10)
«v } e (Xk)
В (Butler, McDonald, 1989) показано, что нормированный неполный момент k-го порядка для распределения GB2 (a,b, p, q) также можно выразить через его функцию распределения:
F(k)(x) = F(x;a,b,p + k/a,q — k/a), 0 < x(11)
Далее неполный момент первого порядка используется для задания некоторых индикаторов неравенства по доходам как функций от параметров обобщенного бета-распределения второго типа.
2.2. Меры неравенства
Степень имущественного неравенства населения, измеряемую с помощью кривой Лоренца, и ряд мер неравенства распределения доходов, таких как риск нахождения за чертой бедности (at-risk-of-poverty rate, ARPR), относительная медианная глубина бедности (RMPG), отношение квинтилей и индекс Джини, можно выразить в виде функции от параметров
распределения населения по доходам. Эти индексы используются статистическим ведомством Европейского союза для наблюдения за бедностью и с целью проведения национальных сопоставлений в пределах ЕС (Eurostat, 2018).
Риск нахождения за чертой бедности ARPR определяется как доля населения с доходами ниже порогового значения риска бедности (at-risk-of-poverty threshold, ARPT), который, согласно методологии Eurostat, устанавливается на уровне 60% от медианного дохода:
ARPT (a, b, p, q) = 0.6F-1 (0.5), (12)
где F-1 (0.5) — медиана обобщенного бета-распределения второго типа. Таким образом, риск нахождения за чертой бедности представляет собой вероятность наблюдения реализации случайной величины X ~ GB2(a,b,p,q) ниже порога бедности (ARPT), т. е.
ARPR (a,b, p, q) = P (X < ARPT (a,b, p, q)) = F(ARPT (a,b, p, q);a,b, p, q) . (13)
Индекс относительной медианной глубины бедности RMPG (relative median poverty gap) дает содержательное представление о том, насколько бедны наиболее бедные слои населения. Он равен разности между границей бедности и медианным доходом всех проживающих за чертой бедности, выраженной в процентах от значения границы бедности2. RMPG выражается через квантильную функцию GB2:
ч F- (ARPR)- F- (0.5ARPR) F- (0.5ARPR) RMPG(ARPR;a,b,p,q)= У R1 ^rpR)-U (14)
Отношение долей квинтилей QSR (quintile share ratio) представляет собой отношение суммарного дохода верхнего квинтиля к суммарным доходам нижнего квинтиля распределения . Следуя (Graf et al., 2011), можем записать этот индикатор в терминах неполных моментов первого порядка:
( b ) 1-F(1)(Х0.в) fjyf (У) dy 1-F (Хр.8; ab p + a-1, q - a-1)
QSR ( x;a,b, p, q) = ——(-r = —-—— = —7- -1--yy. (15)
f(d (*0.2) j *yf(y)dy F(x0.2;a,b,p+a ,q-a )
Коэффициент Джини (G) — возможно, самая известная и часто встречающаяся мера неравенства, рассчитываемая и публикуемая статистическими ведомствами всех стран. Он принимает значения от 0 до 1 и показывает, насколько распределение доходов далеко от абсолютного равенства, при котором доходы равномерно распределены между всеми индивидами. Значение G = 1 говорит об абсолютном неравенстве, при котором все доходы сосредоточены у одного индивида (Kleiber, Kotz, 2003).
В соответствии с преобразованием, предложенным в (Dorfman, 1979), коэффициент Джини для случайной величины X с функцией распределения F (*) можно записать в терминах функции распределения:
1 да
G=1 - Ёт)^1" F(*))2 d*. (16)
2 См. https://ec.europa.eu/eurostat/statistics-explained/index.php/Glossary:Relative_median_at-risk-of-poverty_gap.
3 См. https://ec.europa.eu/eurostat/statistics-explained/index.php/Glossary:Income_quintile_share_ratio.
Как показано в (McDonald, Ransom, 2008, p. 155), аналитический вид формулы (16) для '§ случая обобщенного бета-распределения выражается через разность двух обобщенных ги- if пергеометрических рядов. ^
ё
2.3. Метод оценки параметров распределения GB2 о
I
В выборочных исследованиях доходов домохозяйств каждому наблюдению присваива- а. ется весовой коэффициент, поэтому все члены домашнего хозяйства обладают одинаковым * весом в генеральной совокупности. Отсюда следует, что наблюдаемые величины дохода внутри каждого выборочного наблюдения не являются независимыми. Поэтому для оценки параметров распределения на основе взвешенных наблюдений вместо функции правдоподобия будет использоваться взвешенная функция правдоподобия, которая для случая выборочных исследований бюджетов домохозяйств была предложена в (Chambers, Skinner, 2003) и использовалась в (Graf et al., 2011; Graf, Nedyalkova, 2014).
Пусть wi — постстратификационный вес i-го домохозяйства с подушевым доходом x, i = 1, ..., m. Вес обратно пропорционален вероятности отбора домохозяйства в выборку и учитывает вероятность неучастия данной страты в выборочном обследовании. Пусть n t — число лиц, проживающих в i-м домохозяйстве. Тогда оценка методом максимума взвешенного правдоподобия определяется как
n
в = argmax /wini ln f (xt;в), (17)
6 tf
где 6 = (a, b, p, q)' — вектор оцениваемых параметров. Эта оценка находится как решение следующей системы уравнений (условия оптимальности первого порядка):
д m 1 д —lnL(e;x) = ywn—,-Г—f (x ;e)= 0. (18)
дв v ' ' tf ' 1 f (x,;в)дву V " ;
В работе (Venter, 1983) было отмечено, что частные производные lnL(6; xt) по a и b линейны относительно р и q, поэтому можно выразить p и q как функции от a и b. Далее, под-
д д
ставив полученные выражения в уравнения —lnL (в; x) = 0 и —lnL (в; x) = 0 , можно ре-
др dq
шить систему из двух нелинейных уравнений с двумя неизвестными. Такой метод нахождения оценок называют profile maximum likelihood, он позволяет сэкономить значительное время при поиске глобального максимума, если основной интерес представляют параметры a или b.
В настоящем исследовании для поиска максимума взвешенной функции правдоподобия используется алгоритм оптимизации Бройдена-Флетчера-Гольдфарба-Шанно (BFGS), см. (Nocedal, Wright, 2006). В соответствии с (Graf, Nedyalkova, 2015), начальные значения определяются как оценки параметров лог-логистического распределения (распределение Фиска), являющегося частным случаем обобщенного бета-распределения:
Fisk(a,b) = GB2(a, b, p = 1, q = 1). (19)
Оценки параметров Fisk(a,b) определяются по формулам:
a =п
Em
j=1
-I
w,.
W, i=1 j =1 j
Zw ln; j =1 j
ln x --
Em
j =1
wj j =1 j
, b = exp
/ /
2
w
w
v \
S m
-ln x.
wj
=1 J
(20)
П
В качестве начальных значений параметров для поиска оценок максимума взвешенного правдоподобия взяты: а0 = а, Ь0 = Ь, р0 = д0 = 1.
3. Данные обследования бюджетов домашних хозяйств (ОБДХ)
3.1. Эквивалентный располагаемый доход
Понятие благосостояния предполагает множественные толкования в зависимости от предпосылок исследования и доступности данных о доходах домохозяйств и отдельных лиц. В общем случае сравнение совокупных доходов нескольких случайно отобранных домохозяйств некорректно в силу ряда причин. Во-первых, совокупный доход в общем случае не отражает потребительских возможностей домохозяйства, потому что не учитывает его текущие обязательства. Во-вторых, внутренний состав этих домохозяйств может быть неоднороден по численности и возрасту работоспособных и работающих членов семьи, а также неработоспособных и неработающих, например, стариков и детей.
За объективную оценку уровня материального благополучия экономического субъекта примем располагаемый доход, т. е. величину всех средств, доступных для потребления, сбережения и инвестирования. Располагаемые доходы в терминах методологии ОЭСР будут представлять собой сумму денежных доходов за вычетом налогов и сборов, прочих обязательных выплат и переданных натуральных трансфертов.
Очевидно, что денежное состояние домохозяйства формируется за счет вклада каждого работающего индивида, однако следует брать во внимание другое важное следствие неоднородности домохозяйств — экономию от масштаба в потреблении. Например, расходы на электричество и телекоммуникационные услуги не пропорциональны числу членов домохозяйства и могут быть одинаковыми как для отдельно проживающего индивида, так и для семьи из трех человек. Наиболее практичным способом преодоления неоднородности домохозяйств является нормирование располагаемого дохода по шкале эквивалентности, которая ставит в соответствие каждому домашнему хозяйству некоторую положительную величину, пропорциональную величине домохозяйства. Шкала эквивалентности позволяет задать так называемый эквивалентный доход как функцию от общего дохода домохозяйств и его размера:
х = y/v(a, k), (21)
где x — эквивалентный доход, y — общий доход домохозяйства, v (•) — эквивалентный размер домохозяйства, определяемый числом проживающих в нем взрослых a и детей k. Вид функции v(a, k) зависит от используемой шкалы эквивалентности, среди которых наиболее распространенными считаются следующие три (OECD, 2013):
шкала ОЭСР (OECD equivalence scale); '!
t
• модифицированная шкала ОЭСР (OECD-modified equivalence scale);
• шкала квадратного корня (square root scale). Модифицированная шкала ОЭСР впервые была представлена в работе (Hagenaars et al., ^
1994) и с конца 1990-х годов официально применяется службой Eurostat для расчета экви-
валентного дохода4. Шкала назначает каждому члену домохозяйства следующие весовые о коэффициенты: §
jS
• глава домохозяйства (взрослый старше 14 лет, внесший наибольший вклад в бюджет) — 1; а.
• каждый последующий взрослый — 0.5; *
• ребенок до 14 лет — 0.3. ^
Следовательно, эквивалентный размер /-го домохозяйства:
v ( at, k ) = 1 + 0.5 (a г -1) + 0.3k,, (22)
где a f — число взрослых (старше 14 лет), kt — число детей (до 14 лет).
В последующем анализе в качестве основного показателя дохода будет рассматриваться эквивалентный располагаемый доход (equivalised disposable income), равный располагаемому доходу домохозяйства в расчете на одного «эквивалентного взрослого»:
X =_y__(23)
' 1 + 0.5 (at -1) + 0.3k,'
Везде далее под доходом домохозяйства будем понимать эквивалентный располагаемый доход.
3.2. Первичная обработка данных ОБДХ
Оценка параметров распределений производится на основе данных обследования бюджетов домашних хозяйств, ежеквартально проводимого Федеральной службой государственной статистики . Каждая квартальная выборка включает в себя в среднем 51 тыс. наблюдений.
К числу рассматриваемых показателей относятся потребительские и промежуточные расходы домохозяйств, сумма налогов и обязательных отчислений, произведенных и израсходованных сбережений, изменение стоимости финансовых активов и иные агрегированные показатели.
Каждому выборочному наблюдению ставится в соответствие весовой коэффициент, обратно пропорциональный вероятности отбора взятого домохозяйства в выборку . Взвешивание наблюдений распространяет исследуемые выборочные характеристики на генеральную совокупность, представляющую собой все домохозяйства России.
4 См. https://ec.europa.eu/eurostat/statistics-explained/index.php/Glossary:Equivalised_disposable_income.
5 Данные доступны на странице https://obdx.gks.ru/.
6 См. http://www.gks.ru/bgd/free/b99_10/isswww.exe/stg/d020/i020460r.htm.
Таблица 1. Число наблюдений в каждом исследуемом квартале
Год
I квартал
II квартал
III квартал
IV квартал
2003
2004
2005
2006
2007
2008
2009
2010 2011 2012
2013
2014
2015
53149 53159 46813 53093 53074 51288 51285 51302 51328 51321 51617 51589 51033
53158 53154 53064 53094 53054 51296 51295
51327
51328 51323 51620 51610 51036
53154 53172 53129 53088 53104 51292 51300 51337 51335 51313 51621 51619 51029
53142 53159 53135 53071 53096 51300 51309 51319 51329 51319 51616 51627 51027
Все переменные в денежном выражении представлены в текущих ценах, поэтому для объективного отражения реальной динамики распределения и для обеспечения сопоставимости показатели были скорректированы по уровню инфляции и приведены к постоянным ценам первого квартала 2003 г.
Поскольку в 2005-2007 гг. происходило изменение состава некоторых субъектов Российской Федерации, данные были агрегированы в соответствии с административно-территориальным делением, актуальным на 2017 г.
Методом максимума взвешенного правдоподобия были оценены параметры GB2-распре-деления на основе обследования доходов домашних хозяйств с I квартала 2003 г. по IV квартал 2015 г. Параметры распределения оценивались отдельно для каждого квартала в имеющейся выборке7. На основе полученных оценок для каждого квартала были рассчитаны значения индикаторов неравенства, представленных ранее, а также соответствующие доверительные интервалы (серая сплошная линия) и сглаженный тренд, полученный с помощью метода LOESS (Locally Estimated Scatterplot Smoothing) (штриховая пунктирная линия). На рисунках 1-3 эти значения сравниваются с эмпирическими аналогами (точечная пунктирная линия), рассчитанными на тех же данных.
Как видно из рисунков 1-3, эмпирические значения медианного и среднего доходов, отношения долей квинтилей и коэффициентов Джини входят в 95%-ный доверительный интервал оцененных значений индексов. Исключение составляют ARPR и RMPG, поскольку MLE-оценки устойчиво превышают эмпирические аналоги. Этот факт известен и описан в работе
7 Оценивание производилось с помощью программы на языке R с пакетом GB2 (Graf, Nedyalkova, 2015).
4. Результаты
4.1. Оценка параметров распределения
Рис. 1. Динамика оценок значений индикаторов: слева — медианный доход, справа — средний доход; 2003-2015 гг.
Рис. 2. Динамика оценок значений индикаторов: слева — АЯРЯ, справа — RMPG; 2003-2015 гг.
Рис. 3. Динамика оцененных значений индикаторов: слева — QSR, справа — коэффициент Джини; 2003-2015 гг.
(Graf, Nedyalkova, 2014). Возможным решением может служить предложенный в той же статье метод корректировки весов экстремальных значений, поскольку выборочные исследования доходов имеют тенденцию неверно оценивать доли населения, получающего наибольшие по величине доходы. В рамках настоящей работы этот эффект игнорируется, поскольку он существенно не искажает результаты анализа.
Вертикальные пунктирные линии на графиках 1-3 обозначают временной интервал с III квартала 2008 г. по I квартал 2010 г., который соответствует времени активной фазы финансового кризиса в России. По сглаженному тренду (штриховая пунктирная линия) заметно, что в ходе кризисных явлений, несмотря на замедление роста и снижение реальных медианных и средних доходов, наблюдается номинальное снижение неравенства по доходам. Снижение риска нахождения за чертой бедности может свидетельствовать о том, что кризисные явления оказывают меньшее воздействие на бедные слои общества, чем на богатые. Вероятное объяснение этому на первый взгляд парадоксальному явлению состоит в том, что экономические кризисы провоцируют замедление роста или снижение показателя медианного располагаемого дохода. Медианный располагаемый доход, в свою очередь, однозначно определяет пороговый уровень нахождения за чертой бедности — ARPT. Из определения функции распределения случайной величины следует, что если ARPT0 > ARPTX, то при прочих равных условиях FGB2 (ARPT0 )> FGB2 (ARPTJ) . Относительная медианная глубина бедности демонстрирует монотонное снижение, что говорит об уменьшении «зазора» между доходами внутри бедной части населения. Реакция показателя RMPG на шоковые явления хоть и незначительная, но наблюдаемая — происходит предсказуемое замедление темпа убывания относительной глубины бедности, но по окончании кризиса и стабилизации роста медианных и средних доходов показатель RMPG продолжает уменьшаться.
Во время кризисных явлений особенно заметны резкие скачки оцененных значений отношения долей квинтилей и индекса Джини. Оказывается, что QSR, т. е. отношение суммарных доходов верхней двадцатипроцентной группы населения к суммарным доходам нижней группы, значительно снижается в ходе кризисных явлений. Точно такая же динамика прослеживается и для индекса Джини, который также отражает степень концентрации доходов у наиболее богатых слоев населения. Эти факты явным образом говорят о том, что в ходе рецессии сокращается разница между доходами наиболее и наименее обеспеченных слоев общества.
MLE-оценки параметров обобщенного бета-распределения второго типа позволяют получить достаточно точные теоретические оценки индикаторов неравенства. Однако больший практический интерес представляет возможность использования параметров GB2-распре-деления для прогнозирования значений индексов.
4.2. Прогнозирование мер неравенства
Прогнозирование осуществлялось следующим образом: исходный временной ряд оценок параметров раскладывался на трендовую и сезонную составляющие методом STL (seasonal-trend decomposition using Loess (Cleveland et al., 1990)). Основная задача — построить прогнозы трендовой составляющей. Для этого применяется метод скользящего окна и прогнозирование на один год вперед с помощью моделей ARIMA(1,1,1) и экспоненциального сглаживания. Параметры ARIMA-моделей оценивались по трем годам наблюдений, предшествовавшим прогнозируемому периоду.
Модель экспоненциального сглаживания следует работе (Holt, 2004). Прогноз ряда y в момент t на h шагов вперед: J
yt+h\t = i1 + |
где i1 = аУг +(!-a){11-1 + bt-l ) — уравнение уровня, bt = ß(i t - i t) + (l-ß) bt-i — урав" J
нение тренда. Параметры экспоненциального сглаживания a и ß не оценивались, а были о подобраны исходя из содержательного смысла модели (а = ß = 0.95), тем самым наиболее | поздние наблюдения имеют наибольшее влияние на прогнозные значения. а.
Сезонная компонента прогнозируется наивным способом с помощью скользящего окна: сезонные колебания прогнозируемого года принимаются равными сезонным колебаниям последнего наблюдаемого года.
С помощью моделей экспоненциального сглаживания и ARIMA(1,1,1) методом скользящего окна были построены годовые прогнозы трендовых компонент параметров a, b, p, q GB2-распределения, к которым далее были добавлены прогнозы сезонных колебаний, и на основе полученных значений были построены прогнозы индикаторов неравенства. На графиках 4-6 сопоставлены прогнозы (сплошная линия) с фактическими оценками (пунктир) при использовании метода экспоненциального сглаживания на плавающем окне шириной в четыре квартала.
Как видно из графиков на рис. 4-6, прогнозирование параметров a,b, p, q позволяет получить достаточно точные прогнозы индикаторов неравенства на горизонте одного года. Более наглядно точность прогноза методом экспоненциального сглаживания параметров GB2-распределения продемонстрирована на графиках относительной погрешности прогнозных значений, представленных на рис. 7-9. Горизонтальными пунктирными линиями указан десятипроцентный коридор (от -5% до +5%) отклонений прогнозных значений от фактических. Видно, что наиболее точно прогнозируются медиана и риск нахождения за чертой бедности. На тех графиках, где преобладают значения ниже нуля, модель чаще недооценивает фактический уровень индикатора, например, RMPG и QSR. Как видно, существенные отклонения присутствуют только в прогнозе QSR — в трех из сорока восьми наблюдениях фактический уровень был недооценен более чем на 10%.
Численно уровень погрешности прогноза удобно оценить с помощью MAE — средней абсолютной ошибки:
1 T
MAE(y) = -yt -л|.
1 t=i
Значения MAE были найдены для прогнозов, построенных с помощью экспоненциального сглаживания, ARIMA(1,1,1)-модели, а также для прямого прогноза значений индикаторов методом экспоненциального сглаживания, без этапа прогнозирования параметров GB2-распределения. Результаты представлены в табл. 2.
Прогнозы методами экспоненциального сглаживания и ARIMA(1,1,1), примененными к параметрам GB2-распределения, имеют близкие уровни погрешности, но при этом ожидаемо проигрывают прямому прогнозу показателей неравенства, поскольку в них оценивается меньшее количество параметров. Однако параметры a,b, p, q представляют большую аналитическую ценность как инструмент параметрического моделирования — например, позволяют моделировать профили распределения доходов.
il 4
л л Л Д ï к / ; Л/V V 1 *
/V V V •
V
А/
'Л г
/V
V
Рис. 4. Прогнозные и фактические значения индикаторов: слева — медианный доход, справа — средний доход; 2004-2016 гг.
Рис. 5. Прогнозные и фактические значения индикаторов: слева — ARPR, справа — RMPG; 2004-2015 гг.
Рис. 6. Прогнозные и фактические значения индикаторов: слева — QSR, справа — коэффициент Джини; 2004-2015 гг.
A M M
г Г"
î u
Ш
I «ï «ï
10 Q)
i
t CL «ï
Рис. 7. Ошибки прогноза индикаторов: слева — медианный доход, справа — средний доход; 2004-2016 гг.
Рис. 8. Ошибки прогноза индикаторов: слева — АЯРЯ, справа — RMPG; 2004-2015 гг.
Рис. 9. Ошибки прогноза индикаторов: слева — QSR, справа — коэффициент Джини; 2004-2015 гг.
Таблица 2. Средняя абсолютная ошибка прогноза индикаторов неравенства
Метод Медиана Среднее ARPR RMPG QSR Джини
Holt 259.48 775.83 0.30 0.55 0.36 0.01
ARIMA 330.29 946.70 0.30 0.48 0.37 0.01
Прямой прогноз 238.03 750.75 0.18 0.45 0.29 0.01
В целом, примененный подход показал свою эффективность с точки зрения практического прогнозирования распределения доходов и, к удивлению, не показал существенных ошибок прогноза для периодов, характеризовавшихся макроэкономическими шоками.
5. Заключение
В настоящей работе обобщенное бета-распределение второго типа было использовано для моделирования динамики распределения доходов на основе данных выборочных наблюдений домохозяйств.
Для этого квартальные микроданные обследования бюджетов домашних хозяйств с 2003 по 2015 г. были объединены в единый массив и приведены в соответствие с актуальным административно-территориальным делением России. На основе агрегированных показателей бюджетов домохозяйств был вычислен показатель эквивалентного располагаемого дохода, являющийся ключевой переменной в методологии Eurostat для анализа бедности и международных сопоставлений. Для обеспечения сопоставимости и отражения реальной динамики показателей данные были приведены к постоянным ценам первого квартала 2003 г.
Параметрические оценки плотности, полученные методом максимума взвешенного правдоподобия, позволили оценить значения индикаторов неравенства, которые были определены как функции от четырех параметров GB2-распределения. Сопоставление полученных оценок и эмпирических значений индикаторов неравенства показало высокую степень их согласия.
При анализе динамики оцененных индикаторов неравенства были выявлены их реакции на макроэкономический шок, которым являлся кризис 2008-2010 гг. Показатели неравенства, характеризующие степень бедности — риск нахождения за чертой бедности и относительная медианная глубина бедности — показали нисходящий тренд, что формально свидетельствует об уменьшающихся рисках находиться в наиболее малообеспеченных слоях населения России. В то же время отношение долей квинтилей и коэффициент Джини продемонстрировали значительное снижение доходного неравенства во время рецессий.
На основе рассмотренных показателей, в частности, отношения долей квинтилей и коэффициента Джини, можно предположить, что для наиболее обеспеченных экономических агентов эластичность располагаемого дохода по состоянию рыночной конъюнктуры намного выше, чем для субъектов с низкими доходами. Возможно, что такая закономерность вызвана прямой зависимостью между «богатством богатых» и уровнем деловой активности, который снижается в периоды рецессий. В то же время «бедность бедных» в силу постоянства их источников дохода менее зависима от внешних факторов. Интерпретируя вышеизложенные выводы в аллегорической манере, можно сказать, что «общая беда сближает даже самых разных людей».
Для демонстрации практической применимости подхода был сделан прогноз индикаторов неравенства, для чего использовалось изначальное прогнозирование тренда параметров if GB2-распределения с помощью скользящего окна. Тем самым были получены достаточно точные прогнозы медианного и среднего доходов, риска нахождения за чертой бедности, с медианной глубины бедности, отношения долей квинтилей и индекса Джини. Потенциаль- ^ но эти прогнозы более робастные, т. к. они основаны на прогнозе всего четырех параметров о
GB2-распределения, а не прогнозе каждого из показателей в отдельности. §
в
I
Список литературы ^
Айвазян С. А. (1997). Модель формирования распределения населения России по величине среднедушевого дохода (экспертно-статистический подход). Экономика и математические методы, 33 (4), 74-86.
Айвазян С. А. (2012). Анализ качества и образа жизни населения (эконометрический подход). М.: Наука.
Айвазян С. А., Колеников С. О. (2001). Уровень бедности и дифференциация населения России по расходам. Научный доклад 01/01. Российская программа экономических исследований (РПЭИ).
Бутаева К. О. (2016). К вопросу о распределении денежных доходов населения России. Уровень жизни населения регионов России, 2 (200), 130-136.
Колмаков И. Б. (2015). Сопряжение логарифмически нормального распределения населения по уровню денежных доходов с распределением Парето. Аудит и финансовый анализ, 2, 124-131.
Сиротин В. П., Раднаев Д. Э. (2008). Трансформация распределения населения России по доходам в переходный период. Экономические науки, 41 (4), 366-371.
Царев И. Г. (2008). О моделировании распределения дохода в обществе. Прикладная эконометрика, 11, 43-51.
Bandourian R., McDonald J. B., Turley R. S. (2002). A comparison of parametric models of income distribution across countries and over time. Luxembourg Income Study Working Paper 305.
Bordley R. F., McDonald J. B., Mantrala A. (1997). Something new, something old: Parametric models for the size of distribution of income. Journal of Income Distribution, 6 (1), 91-103.
Butler R. J., McDonald J. B. (1989). Using incomplete moments to measure inequality. Journal of Econometrics, 42 (1), 109-119.
Chambers R. L., Skinner C. J. (2003). Analysis of survey data. John Wiley.
Champernowne D. G. (1952). The graduation of income distribution. Econometrica, 20 (4), 591-615.
Cleveland R. B., Cleveland W. S., McRae J. E., Terpenning I. (1990). STL: A seasonal-trend decomposition procedure based on Loess. Journal of Official Statistics, 6, 3-73.
Dagum C. (1996). A systemic approach to the generation of income distribution models. Journal of Income Distribution, 6 (1), 105-126.
Dorfman R. (1979). A formula for the Gini coefficient. The Review of Economics and Statistics, 61 (1), 146-149.
Eurostat (2018). Statistics explained, https://ec.europa.eu/eurostat/statistics-explained.
Fisk P. (1961). The graduation of income distributions. Econometrica, 29 (2), 171-185.
Flachaire E., Nunez O. (2007). Estimation of the income distribution and detection of subpopulations: An explanatory model. Computational Statistics and Data Analysis, 51 (7), 3368-3380.
Gibrat R. (1931). Les inégalités économiques: applications, aux inégalités des richesses, à la concentration des entreprises, aux populations des villes, aux statistiques des familles, etc. D'une loi nouvelle, la loi de l'effect proportionnel. Thèses. Paris: Libr. du Recueil Sirey.
Graf M., Nedyalkova D. (2014). Modeling of income and indicators of poverty and social exclusion using the generalized beta distribution of the second kind. Review of Income and Wealth, 60 (4), 821-842.
Graf M., Nedyalkova D. (2015). GB2: Generalized beta distribution of the second kind: Properties, likelihood, estimation. Repository CRAN.
Graf M., Nedyalkova D., Seger J., Zins S. (2011). Parametric estimation of income distributions and indicators of poverty and social exclusion. European Commission. The Seventh Framework Programme for Research. Project AMELI. Research Report 2.1. (FP7-SSH-2007-217322 AMELI).
Hagenaars A. J. M., de Vos K., Zaidi M. A. (1994). Poverty statistics in the late 1980s: Research based micro-data. Luxembourg: Office for Official Publications of the European Communities.
Holt C. C. (2004). Forecasting seasonals and trends by exponentially weighted moving averages. International Journal of Forecasting, 20 (1), 5-10.
Kleiber C., Kotz S. (2003). Statistical size distributions in economics and actuarial sciences. Wiley.
McDonald J. B. (1984). Some generalized functions for the size distribution of income. Econometrica, 52 (3), 647-665.
McDonald J. B., Ransom M. (2008). The generalized beta distribution as a model for the distribution of income: estimation of related measures of inequality. In: Modeling Income Distributions and Lorenz Curves, edited by D. Chotikapanich, 147-166. New York, NY: Springer New York.
McDonald J. B., Xu Y. J. (1995). A generalization of the beta distribution with applications. Journal of Econometrics, 66 (1-2), 133-152.
Neal D., Rosen S. (2000). Theories of the distribution of earnings. Handbook of Income Disribution, vol. 1, 379-427.
Nocedal J., Wright S. J. (2006). Numerical optimization, 2nd ed. Springer.
OECD (2013). OECD framework for statistics on the distribution of household income, consumption and wealth. Paris: OECD Publishing.
Pareto V. (1897). Cours d'économie politique professé à l'université de Lausanne. Lausanne: Rouge.
Singh S. K., Maddala G. S. (1976). A Function for size distribution of incomes. Econometrica, 44 (5), 963-970.
Venter G. G. (1983). Transformed beta and gamma distributions and aggregate losses. Proceedings of the Casualty Actuarial Society, 70 (133), 156-193.
Поступила в редакцию 07.03.2019; принята в печать 17.05.2019.
Applied Econometrics, 2019, v. 54, pp. 105-125.
'S
Nartikoev A. R., Peresetsky A. A. Modeling the dynamics of income distribution in Russia. §
if
DOI: 10.24411/1993-7601-2019-10006 | _ c
Alan Nartikoev
National Research University Higher School of Economics, Moscow, Russian Federation; |
alan.nartikoev@gmail.com £
f
Anatoly Peresetsky oj
National Research University Higher School of Economics, Moscow, Russian Federation; aperesetsky@hse.ru
Modeling the dynamics of income distribution in Russia
In this paper, the four-parameter generalized beta distribution of the second kind (GB2) is applied to simulate the distribution of the income of Russian population based on the quarterly micro-data of household income for the period from 2003 to 2015. The distribution parameters were estimated via the maximum weighted-likelihood method, and the distributional parameter estimates were aggregated into quarterly time series. The time series have undergone the decomposition by the STL method. ARIMA and exponential smoothing models were applied to the trend component of the time series, and the distributional parameter forecasts were produced. Based on the predicted values of the distribution parameters, several inequality measures was estimated, such as at-risk-of-poverty rate, relative median poverty gap, quintile share ratio and Gini index. Thus, the robust estimates of inequality measures were obtained, the prediction accuracy of which was about 5%. An analysis of the dynamics of distributional parameters yielded an interesting conclusion that during the crisis periods the nominal level of income inequality decreases, in contrast to common apparent belief that negative macroeconomic shocks induce higher inequality.
Keywords: generalized beta-distribution of the second kind; inequality measures; income distribution; Russia. JEL classification: I32; C13; D31; D63; O15.
References
Aivazian S. A. (2012). Analysis of the quality and lifestyle of the population (econometric approach). M.: Nauka (in Russian).
Aivazian S. A., Kolenikov S. O. (2001). Poverty and expenditure differentiation of the Russian population. Economics Education and Research Consortium (EERC), 01/01.
Aivazian S. A. (1997). Model of distribution of Russian population by income per capita (Expert-statistical approach). Economics and Mathematical Methods, 33 (4), 74-86 (in Russian).
Butaeva K. O. (2016). Considering the problem of personal income distribution in Russia. Level of Life of the Population of Region of Russia, 2 (200), 130-136 (in Russian).
Kolmakov I. B. (2015). Sopryazheniye logarifmicheski normal'nogo raspredeleniya naseleniya po urovnyu denezhnykh dokhodov s raspredeleniyem Pareto. Audit and financial analysis, 2, 124-131 (in Russian).
Sirotin V. P., Radnaev D. E. (2008). Transformaciya raspredeleniya naseleniya Rossii po dohodam v pere-khodnyj period. Economic Sciences, 41 (4), 366-371 (in Russian).
Tsarev I. (2008). Modeling the income distribution in the society. Applied Econometrics, 11, 43-51 (in Russian).
Bandourian R., McDonald J. B., Turley R. S. (2002). A comparison of parametric models of income distribution across countries and over time. Luxembourg Income Study Working Paper 305.
Bordley R. F., McDonald J. B., Mantrala A. (1997). Something new, something old: Parametric models for the size of distribution of income. Journal of Income Distribution, 6 (1), 91-103.
Butler R. J., McDonald J. B. (1989). Using incomplete moments to measure inequality. Journal of Econometrics, 42 (1), 109-119.
Chambers R. L., Skinner C. J. (2003). Analysis of survey data. John Wiley & Sons.
Champernowne D. G. (1952). The graduation of income distribution. Econometrica, 20 (4), 591-615.
Cleveland R. B., Cleveland W. S., McRae J. E., Terpenning I. (1990). STL: A seasonal-trend decomposition procedure based on Loess. Journal of Official Statistics, 6, 3-73.
Dagum C. (1996). A systemic approach to the generation of income distribution models. Journal of Income Distribution, 6 (1), 105-126.
Dorfman R. (1979). A formula for the Gini coefficient. The Review of Economics and Statistics, 61 (1), 146-149.
Eurostat (2018). Statistics explained. https://ec.europa.eu/eurostat/statistics-explained.
Fisk P. (1961). The graduation of income distributions. Econometrica, 29 (2), 171-185.
Flachaire E., Nunez O. (2007). Estimation of the income distribution and detection of subpopulations: An explanatory model. Computational Statistics and Data Analysis, 51 (7), 3368-3380.
Gibrat R. (1931). Les inégalités économiques: Applications: aux inégalités des richesses, à la concentration des entreprises, aux populations des villes, aux statistiques des familles, etc. D'une loi nouvelle, la loi de l'effect proportionnel. Thèses. Paris: Libr. du Recueil Sirey.
Graf M., Nedyalkova D. (2014). Modeling of income and indicators of poverty and social exclusion using the generalized beta distribution of the second kind. Review of Income and Wealth, 60 (4), 821-842.
Graf M., Nedyalkova D. (2015). GB2: Generalized beta distribution of the second kind: Properties, likelihood, estimation. Repository CRAN.
Graf M., Nedyalkova D., Seger J., Zins S. (2011). Parametric estimation of income distributions and indicators of poverty and social exclusion. European Commission. The Seventh Framework Programme for Research. Project AMELI. Research Report 2.1. (FP7-SSH-2007-217322 AMELI).
Hagenaars A. J. M., de Vos K., Zaidi M. A. (1994). Poverty statistics in the late 1980s: Research based micro-data. Luxembourg: Office for Official Publications of the European Communities.
Holt C. C. (2004). Forecasting seasonals and trends by exponentially weighted moving averages. International Journal of Forecasting, 20 (1), 5-10.
Kleiber C., Kotz S. (2003). Statistical size distributions in economics and actuarial sciences. Wiley.
McDonald J. B. (1984). Some generalized functions for the size distribution of income. Econometrica, 52 (3), 647-665.
McDonald J. B., Ransom M. (2008). The generalized beta distribution as a model for the distribution of income: estimation of related measures of inequality. In: Modeling Income Distributions and Lorenz Curves, edited by D. Chotikapanich, 147-166. New York, NY: Springer New York.
McDonald J. B., Xu Y. J. (1995). A generalization of the beta distribution with applications. Journal of '§
t
Pareto V. (1897). Cours d'économie politique professé à l'université de Lausanne. Lausanne: Rouge. Singh S. K., Maddala G. S. (1976). A function for size distribution of incomes. Econometrica, 44 (5), 963-970.
Venter G. G. (1983). Transformed beta and gamma distributions and aggregate losses. Proceedings of the Casualty Actuarial Society, 70 (133), 156-193.
Received 07.03.2019; accepted 17.05.2019.
Econometrics, 66 (1-2), 133-152.
Neal D., Rosen S. (2000). Theories of the distribution of earnings. In: Handbook of Income Disribu- a
tion, vol. 1, 379-427. ^
«i
Nocedal J., Wright S. J. (2006). Numerical optimization, 2nd ed. Springer.
OECD (2013). OECD framework for statistics on the distribution of household income, consumption ® and wealth. Paris: OECD Publishing. |
I