Капитанов В.А.
к.т.н., ведущий специалист, АО «НИИ «Полюс»
Иванова А.А.
к.т.н., с.н.с. Института прикладной математики и механики, г. Донецк
Максимова А.Ю.
к.т.н., ученый секретарь Института прикладной математики и механики, г. Донецк maximova.alexandra@mail. ru
НЕДОСТАТКИ И АЛЬТЕРНАТИВЫ ОБЩЕПРИНЯТЫХ МЕТОДОВ ПРЕДСТАВЛЕНИЯ
СОЦИАЛЬНОГО НЕРАВЕНСТВА
Ключевые слова: неравенство, гистограммы, кривые Лоренца, функции распределения, индексы неравенства. Keywords: inequality, histograms, Lorentz curves, distribution functions, inequality indices.
Введение. Вопрос о реальном распределении людей по уровню доходов или экономической структуре общества (ЭСО) важен тем, что имея адекватные данные о распределении людей по доходам, исследователь может сделать не искаженные никакими идеологическими шорами выводы о реально существующем механизме движения благ между людьми и о действительной причине богатства и бедности.
Актуальность данной работы обусловлена необходимостью разработки методов представления неравенства при отсутствии части информации (чаще всего о доходах богатых членов общества), поскольку полные данные о распределении населения по доходам отсутствуют, и получить их не представляется возможным.
По данным Росстат суммарный доход россиян в 2015 г. составил 53,101 трлн. руб. [1], а по данным Федеральной налоговой службы (ФНС)1 - всего лишь 22,053 трлн. руб. [2]. Отличие данных Росстат от данных ФНС состоит в том, что Росстат оценивает анонимные доходы без привязки их к личностям конкретных получателей [3], ФНС же в силу необходимости выполнения фискальных обязанностей определяет доходы с привязкой к конкретным получателям, с которых ФНС и взымает налоги.
Из сопоставления двух приведённых цифр следует, что доходы скрыть весьма несложно, раз скрываемые доходы в 2,5 раза больше, чем нескрываемые.
Инструменты сокрытия доходов не являются секретом - в условиях глобализации формальный вывод за рубеж расположенного де-факто в России бизнеса не составляет труда: есть даже сайты, предлагающие подобные услуги [см. 4]. Но такие инструменты доступны только крупному бизнесу, то есть скрывается информация о доходах именно богатых когорт.
Итак, имеющиеся в нашем распоряжении данные о неравенстве по доходам характеризуются существенной неполнотой, причём неполнотой довольно специфической - чем выше доходы, тем меньше информации о них. Отсюда следуют два важных требования к методам представления неравенства.
Никакой источник данных нельзя считать заслуживающим доверия, и только совпадение данных о распределении населения по доходам из нескольких независимых источников позволит считать имеющуюся информацию достоверной. Поскольку подобного рода данные публикуются квантованными, разбитыми на когорты, то исследуемые индексы, описывающие неравенство, должны быть нечувствительны к квантованию и вычислимы при любом квантовании - в противном случае невозможно будет сопоставлять данные, полученные из различных источников.
Известны доходы отдельных богатых и даже богатейших граждан страны, публикуемые «Форбс» [5] и ФНС [6], но эти данные недостаточны для полного описания существующей в России ЭСО, поскольку количество богатых людей, скрывших свои доходы и не попавших в поле зрения «Форбс» и ФНС, неизвестно. В такой ситуации приходится признать, что нам доступна информация о ширине диапазона доходов (определяемой доходом богатейшего человека страны), но и только. Достоверных данных о наполнении богатых когорт не существует, есть лишь данные о том, насколько далеко справа на шкале доходов располагаются богатые когорты. Поэтому предлагаемые нами методы представления неравенства должны быть безусловно чувствительны к ширине диапазона доходов при любом сколь угодно малом наполнении богатых когорт.
1 Более поздние данные приведены быть не могут, поскольку на момент написания данной статьи последний опубликованный ФНС «Отчет о декларировании доходов физическими лицами» датируется 2015 г. Поэтому для обеспечения сопоставимости данных все прямые (официальные и неофициальные) сведения о доходах в данной статье будут относиться к 2015 г.
1. Полигоны относительных частот распределения и невозможность сопоставления данных
из нескольких источников
Полигон относительных частот распределения показателей - это ломаная линия, соединяющая середины верхних сторон столбиков гистограммы. Полигоны частот широко распространены как метод графического представления данных о неравенстве, и это не случайность - они очень наглядны, применяются давно и широко [7, 8] и позволяют зримо сопоставить реальную ЭСО и некоторые до сих пор бытующие представления о социальном неравенстве (рис. 1).
ф ,5;
§ I
I ?
" 1
о <=1
0 х
X
£ I
1 3
ж ш
О (В
О 5
а л
О X
X I
в: ™
^ Ч о <3
40%
32%
24%
16%
8%
0%
2Я 24 20 16 12
(1
0%
-©—24 когорты
-♦—15 когорт
I
©♦©—-©20%
Относительная цена автомобиля -♦-©-
40%
60%
80%
100%
Относительный вес ребенка
0%
20%
40%
60%
80%
100%
5%
| I 4%
х ° л
и Л
3%
% Ь
9 о.
с; ш
§ §
2%
1%
0%
Относительный словарный запас "°°ооооо
0%
20%
40%
60%
80%
100%
Рисунок 1.
а - распределение людей по доходам, оценённое по стоимости автомобилей (при разном квантовании) [9]; б - распределение новорождённых по весу [10]; в - распределение людей по словарному запасу (русский язык) [11, 12]
Вид полигонов частот, представляющих экономическую структуру общества, может подтвердить или опровергнуть представления о причинах появления и усиления неравенства.
Ненаучные представления о причинах социального неравенства распространены довольно широко, современное общество унаследовало эти заблуждения из реакционных идеалистических работ некоторых мыслителей прошлого.
Например, вот изложение оснований социального неравенства в изложении знаменитого русского философа И.А. Ильина: «Если бы люди были действительно равны, жизнь была бы предельно простой, и справедливость было бы чрезвычайно легко найти и ввести в обиход. Стоило бы только сказать: одинаковым людям - одинаковую долю; или - всем всего поровну... На самом деле люди не равны ни телом, ни душою, ни духом» [13].
В наиболее одиозных версиях данная система верований оправдывает неравенство «хорошими генами» или «благородным происхождением», как в трудах религиозного и политического философа Н.А. Бердяева: «Существование «белой кости» есть не только сословный предрассудок, это есть также неопровержимый и неистребимый антро-
дологический факт... Аристократия сотворена Богом и от Бога получила свои качества... Никакие социальные революции не могут уничтожить качественных преимуществ расы» [14].
Если бы социал-расистская система верований отражала действительность, то распределение населения по доходам было бы нормальным. Однако люди действительно рождаются (рис. 1б) и живут неравными, в т.ч. интеллектуально (рис. 1в), но только это неравенство ничуть не напоминает приведенное на рис. 1а неравенство по доходам.
В экономической реальности не наблюдается ничего похожего на нормальное распределение. Распределение населения по доходам - логнормальное, причем максимум его настолько сильно смещён влево, в сторону беднейших когорт, что сливается с осью ординат.
В [15] нами было показано, что причина богатства и бедности - ранговый обмен, т.е. систематическая практика неэквивалентных сделок, совершаемых неравноправными партнерами. Сделок, при которых богатый контрагент смещает рыночную цену в свою пользу и делает это тем эффективнее, чем больше у него богатства. Именно ранговый обмен даёт характерное логнормальное распределение с «тяжёлым хвостом», представленное на рис. 1а.
Но несмотря на отмеченные несомненные достоинства - прежде всего простоту и наглядность выявления причин социального неравенства - полигоны частот не лишены недостатков, обусловленных необходимостью использования только квантованных данных.
Поэтому сопоставление на одной диаграмме полигонов частот из нескольких источников с разным разбиением на когорты не представляется возможным - высота каждого столбца гистограммы однозначно связана с шириной соответствующей этому столбцу когорты, ибо чем шире диапазон доходов данной когорты, тем больше вероятность у человека в эту когорту попасть.
Несложно заметить (см. рис. 1а), что менее подробное квантование даёт большую, примерно в полтора раза высоту пика. Таким образом, для одних и тех же данных можно построить кардинально отличающиеся полигоны частот путём изменения способа квантования этих данных. Тем более полигоны частот не способны обеспечить сопоставимость данных из различных источников.
2. Кривые Лоренца
На рис. 2 представлены визуально неразличимые кривые Лоренца, построенные по данным Росстат (для общества с максимальным доходом 96 тыс. руб./мес.) и по сводным данным Росстат и «Форбс» (для общества с максимальным доходом 14,3 млрд. руб./мес.). Методика соединения массивов данных изложена в [10]). Дополнение данных информацией о доходах наиболее богатых никак не повлияло на вид кривой Лоренца.
1 т«
=1 2100% 0 к § 80% о; та 1 60% ш X к 40% Ш >■ * 20% 0% I 0
—В— Росстат
А Росстат+Форбс
Кумулятивная доля населения
% 20% 40% 60% 80% 100%
Рисунок 2.
Кривые Лоренца. Данные Росстат, сводные данные Росстат и «Форбс» [9]
Фундаментальная проблема с применением кривых Лоренца кроется в том, что полных данных о богатых когортах ученые-экономисты не имеют и иметь не будут по той же причине, по которой этих данных не имеет государство.
3. Функции распределения
Функции распределения (рис. 3) уже применяются в качестве инструмента представления неравенства [16], хотя пока не столь популярны, как кривые Лоренца или полигоны частот.
0% 20% 40% 60% 80% 100%
Безразмерный доход/цена автомобиля/недвижимости
Безразмерный доход/цена автомобиля
Рисунок 3 [9].
а - функции распределения при различном квантовании данных, а также логнормальное (реальная ЭСО), нормальное и равномерное распределение; б - сопоставление данных неравенстве в РФ из нескольких независимых источников в т.ч. при неполных данных о богатых когортах
Из рис. 3а следует, что различия в квантовании данных (avtopoisk.ru, 15 и 24 когорты) не влияют на ход кривых, а потому могут применяться для сопоставления данных из самых разных источников при любом разбиении на когорты и даже при отсутствии такового.
Функции распределения наглядны. На рис. 3а визуально, без какого-либо количественного анализа, прекрасно различаются вымышленные распределения населения по доходам (равномерное и нормальное) и реальные логнор-мальные распределения, построенные по ценам на автомобили.
Данные Росстат и Росстат+«Форбс» благодаря функциям распределения оказались легко визуально различимы. Следовательно, они наглядно представляют отличие данных, в которых максимальный доход равен 96 тыс. руб./мес. от данных с максимальным доходом 14,3 млрд. руб./мес. Отметим, что и данные Росстат и данные Росстат+«Форбс» не содержат полной информации о доходах наиболее богатых членов общества.
4. Числовые индексы неравенства
Вычисление индексов неравенства (табл. 1) продемонстрировало, что коэффициенты фондов (децильный, квинтильный и т.п.) невычислимы при произвольном квантовании, а потому непригодны при сопоставлении данных из источников, отличающихся квантованием (табл. 1, столб. 3).
Индекс Джини также не даёт адекватного представления степени неравенства, поскольку его значение абсолютно не реагирует на добавление данных о субъектах, существенно отличающихся величиной максимального дохода (табл.1, столб. 4, стр. 1 и 2).
Значение показателя Парето а не связано однозначно с неравенством - показатель Парето выше для заведомо неполных и характеризующихся заниженным неравенством данных Росстат, чем для данных о неравенстве, определённом по ценам на автомобили (табл.1, столб. 5, стр. 1, 4, 5, 6).
Первые три показателя общей энтропии вБ (табл.1, столб. 6, 7, 8 стр. 9), а также отношение максимального дохода (имущества) к модальному 1тах/тоа (табл., столб. 10 стр. 9), наиболее сильно из всех рассмотренных критериев
неравенства зависят от квантования данных, а потому непригодны при сопоставлении данных, отличающихся квантованием.
Интенсивность экспоненциального распределения X не обладает перечисленными недостатками - она однозначно больше при большем неравенстве, она вычислима при произвольном квантовании и достаточно слабо от него зависит, она чувствительна к ширине диапазона доходов и не требует абсолютно полных данных о богатых когортах.
Таблица 1
Сравнение индексов неравенства
№№ Данные Индекс неравенства R2 экспоненц. аппроксимации
Фондов децильн. Джини а GE(0) GE(1) GE(2) Imax/mod I
1 2 3 4 5 6 7 8 9 10 11
1 Росстат 15,61 0,38 1,36 0,187 0,241 0,256 8,03 2,43 0,9360
2 Росстат + «Форбс» Вычисление невозможно из-за отсутствия квантования по децилям 0,38 1,54 0,283 0,451 2584 1,19E6 4,85Е5 0,9775
3 Росстат + ФНС 0,48 1,38 0,436 1,284 4340 1,19E6 2,63Е5 0,9706
4 avtopoisk.ru 24 когорты 0,46 1,22 0,415 0,438 0,098 680 418 0,9915
5 avtopoisk.ru 15 когорт 0,48 1,25 0,468 0,491 1,125 589 434 0,9917
6 avito.ru автомобили 0,53 1,26 - - - 1290 217 0,9990
7 avito.ru недвижимость 0,55 1,37 - - - 1860 1010 0,9918
8 Credit Suisse да 0,91 1,4 - - - - 60,8 0,9271
9 Невязка 4 и 5 строк - 4,2% 2,4% 11,21% 10,85% 91,31% 14,33% 3,7% -
5. Некоторые ограничения полученных результатов
Исследование поведения экспоненциального распределения [17] на модельных примерах показало, что:
- экспоненциальной функцией распределения хорошо описываются только ЭСО с высоким социальным неравенством (характеризующиеся заниженным неравенством данные Росстат и Credit Suisse см. рис. 3б хуже всех аппроксимируются экспоненциальной зависимостью см. табл. 1, столб. 11);
- значения интенсивности экспоненциального распределения может быть использовано как индикатор неполноты данных (при Л <10 мы должны признать, что не располагаем полным описанием ЭСО);
Из недостатков интенсивности распределения можно отметить также некоторую её неочевидность и сложность вычисления (последнее не является проблемой при современном развитии компьютерной техники), поэтому для быстрой и наглядной, хотя и более грубой оценки неравенства можно использовать индекс Imax/mod.
Кроме того, интенсивность распределения не аддитивна, т.е. не раскладывается без остатка на сумму неравенств внутри отдельных групп и межгруппового неравенства [18], как, впрочем, и повсеместно применяемый индекс Джини. Поэтому в случае необходимости декомпозиции неравенства (но только при доступности неквантованных данных) целесообразно использовать показатели общей энтропии, включая индекс Тейла.
Во всех же остальных случаях в качестве индекса неравенства лучше предпочесть интенсивность экспоненциального распределения.
Однако из сказанного не следует, что от общепринятых индексов представления неравенства следует безусловно и навсегда отказаться.
В случаях, когда неравенство мало, а данные полны (например, при описании неравенства стран мира по душевому ВВП) следует пользоваться именно коэффициентом фондов, индексом Джини etc.
Кроме того, в социально-экономических науках уже накоплены многолетние тренды неравенства, выраженного с помощью индекса Джини или (реже) других общепринятых коэффициентов. И если целью исследования является изучение динамики неравенства (именно изучение динамики, а не межстрановое сравнение, оно с помощью общепринятых индексов невозможно) то вычисление индекса Джини с целью продления тренда вполне оправдано.
Список литературы и источников
1. Федеральная служба государственной статистики. «Россия в цифрах - 2016 г.». «2. 7.6. Денежные доходы и удельный вес расходов в денежных доходах населения (в процентах к общему объему)». - http://www.gks.ru/bgd/regl/b16_11/IssWWW.exe/Stg/ d01/07-06.doc
2. Федеральная налоговая служба России. «Отчет о декларировании доходов физическими лицами. Раздел 1». - https://www. nalog.ru/rn77/related_activities/statistics_and_analytics/forms/#t1
3. «Информация о методиках расчета показателей, используемых для мониторинга выполнения поручений, содержащихся в Указах Президента Российской Федерации от 07 мая 2012 года № 596-606». П. 42. «Реальные располагаемые денежные доходы населения (процентов)». - http://www.gks.ru/metod/metodika.htm
4. SAA Finance. «Регистрация компаний. ВНЖ&ПМЖ&Гражданства». - http://saa-finance.com
1 Принято по данным Росстат, но вычисление коэффициента фондов по опубликованной Росстат ЭСО невозможно.
99
5. «Форбс». «200 богатейших бизнесменов России». - http://www.forbes.rU/rating/200-bogateishikh-biznesmenov-rossii-2015/2015# all_rating
6. Федеральная служба государственной статистики. «Россия в цифрах - 2016 г.». «7.9. Распределение населения по величине среднедушевых денежных доходов (в процентах к итогу)». - http://www.gks.ru/bgd/regl/b16_11/Main.htm
7. Davis H.T. Political statistic. - Evanston (1ll.): The Principia Press of Illinois, 1954: - 365 p. - https://babel.hathitrust.org/cgi/pt?id=mdp. 39015065433917;view=1up;seq=386
8. Кислицына О.А. Неравенство в распределении доходов и здоровья в современной России. - М.: РИЦ ИСЭПН, 2005. - 376 с. -http://www.kislitsyna. ru/characters.php?id=1
9. Капитанов В.А., Иванова А.А., Максимова А.Ю. Преимущества функции распределения как метода графического представления экономической структуры общества // Статистика и экономика. - М., 2018. - Т. 15, № 1. - С. 4-16. - https://statecon. rea.ru/jour/article/view/1188
10. Кузмичев Ю.Г., Орлова М.И., Бурова О.Н., Гуренко С.П., Лазарева Е.П. Оценочные таблицы физического развития доношенных новорожденных детей города Нижнего Новгорода // Врач-аспирант. 2013, - Т. 59, № 4.3. - С. 494-498. - http://vrach-aspirant.ru/articles/pediatrics/13334/
11. «Сколько слов вы знаете?» - http://myvocab.info
12. Головин Г.В. Измерение пассивного словарного запаса русского языка. 2015 Социо- и психолингвистические исследования. 2015. Вып. 3. - С. 148-159. - http://splr.psu.ru/wp-content/uploads/2015/12/Головин_2015.pdf
13. Ильин И.А. Я вглядываюсь в жизнь. Книга раздумий. - М.: Эксмо, 2007. - 528 с.
14. Бердяев Н.А. Философия неравенства. - М.: Институт русской цивилизации; 2012. - 624 с.
15. Капитанов В.А., Иванова А.А. Неравенство и ранговый обмен // Россия: тенденции и перспективы развития. Ежегодник / РАН, ИНИОН. - М., 2017. - Вып. 12, ч. 1. - С. 661-668.
16. Романовский М.Ю., Романовский Ю.М. Введение в эконофизику: Статистические и динамические модели. - Ижевск: Институт компьютерных исследований, 2012. - 340 с.
17. Капитанов В.А., Иванова А.А., Максимова А.Ю. Проблемы числовых оценок неравенства // Статистика и Экономика. - М., 2018. - Т. 15, № 4. С. 4-15. - https://doi.org/10.21686/2500-3925-2018-4-4-15
18. Кислицына О.А. Неравенство в распределении доходов и здоровья в современной России. - М.: РИЦ ИСЭПН, 2005. - С. 37. -http://kislitsyna.ru/data/files/inequality/Glava2.pdf