Научная статья на тему 'Анализ типов потребительского поведения и распределения населения республики Армения по среднедушевым доходам'

Анализ типов потребительского поведения и распределения населения республики Армения по среднедушевым доходам Текст научной статьи по специальности «Экономика и бизнес»

CC BY
109
56
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Анализ типов потребительского поведения и распределения населения республики Армения по среднедушевым доходам»

В. С. Мхитарян,

Московский государственный университет экономики, статистики и информатики (МЭСИ) В. К. Мовсисян,

Центральный Банк Республики Армения

АНАЛИЗ ТИПОВ ПОТРЕБИТЕЛЬСКОГО ПОВЕДЕНИЯ И РАСПРЕДЕЛЕНИЯ НАСЕЛЕНИЯ РЕСПУБЛИКИ АРМЕНИЯ ПО СРЕДНЕДУШЕВЫМ ДОХОДАМ

Анализ потребительских поведений домашних хозяйств (ДХ) Армении является одной из задач определения уровня жизни населения, для чего необходимо осуществить классификацию ДХ, например, с помощью методов кластерного анализа. С этой целью предварительно были выбраны необходимые переменные для классификации, методы кластерного анализа и предполагаемое число кластеров.

На первом этапе были выбраны 56 переменных, характеризующие среднедушевые годовые объемы потребления продовольственных продуктов (включая потребление алкогольных напитков и табачных изделий) п = 4498 дх Армении за 2003 год. Прежде чем начать процедуру классификации, мы проанализировали исходные данные на предмет возможного снижения волатильности. В результате объем исходной выборки уменьшился до 4000 ДХ.

В виду большого массива исходных данных был использован один из последовательных процедур кластерного анализа, метод □ - средних [1].

Подчеркнем, что изначально была сделана попытка снизить размерность исследуемого многомерного признака с помощью факторного анализа, т.е. из 56 переменных выбрать наиболее информативные, или производные от них другие переменные. Однако результаты не дали нам основания применять полученные вспомогательные переменные из-за их низкой информативности, что, прежде всего можно объяснить слабой коррелированностью исходных признаков. Последнее обстоятельство в свою очередь удовлетворяет требованию для применения обычного евклидово расстояния в методе □ - средних.

Надо отметить, что нам не известно число необходимых однородных потребительских групп (кластеров). Как показывает мировой опыт, количество кластеров, которое необходимо взять для описания потребительского поведения населения, варьируется от 5 до 9. Метод □ -средних был применен для классификации домохозяйств на 5, 6, 7, 8 и 9 кластеров.

Структура полученных кластеров по числу домохозяйств представлена в табл. 1:

Таблица 1.

Классификация ДХ на различные группы по методу □ -средних

Число класте-ров Число ДХ в каждом кластере Общее число ДХ

1 2 3 4 5 6 7 8 9

5 1771 569 1134 169 357 - - - - 4000

% 44.28 14.22 28.35 4.22 8.93 - - - - 100

6 569 124 1736 109 337 1125 - - - 4000

% 14.23 3.1 43.4 2.72 8.43 28.12 - - - 100

7 289 554 142 114 1622 266 1013 - - 4000

% 7.23 13.85 3.55 2.85 40.55 6.65 25.32 - - 100

8 238 996 108 518 163 432 1264 281 - 4000

% 5.95 24.9 2.7 12.95 4.07 10.8 31.6 7.03 - 100

9 76 952 115 1533 379 300 293 80 272 4000

% 1.9 23.8 2.88 38.32 9.48 7.5 7.32 2 6.8 100

Качество результатов классификации ДХ оценивалось с помощью дискриминантного анализа. Применяя статистический пакет SPSS, мы оценили качество результатов кластерного анализа по проценту правильной дискриминации (табл. 2).

Таблица 2

Результаты дискриминантного анализа

Число кластеров Доля правильной дискриминации (%)

5 94.9

6 95.2

7 94.7

8 93.6

9 94.5

Из табл. 2 следует, что удельные веса правильно классифицированных, например, при

классификации домохозяйств по семи группам с помощью метода к -средних 94.7% домохозяйств были правильно классифицированы по кластерам.

Таким образом, с помощью метода к -средних ДХ были классифицированы по группам с различными потребительскими структурами. Однако остается открытым вопрос: все-таки

сколько потребительских групп целесообразно иметь для исследования и анализа потребительских поведений ДХ?

В кластерном анализе для определения необходимого числа кластеров не существует достаточно строгих методов. Необходимое число групп приблизительно можно оценить либо из целей исследования или с помощью одного из критерий однородности, в частности с помощью -критерия. Применение □ -статистики в данном случае связано с проверкой нулевых гипотез следующего вида:

где Л - число кластеров при классификации ( ),

- номер (* -го) кластера в к -й классификации, ^ - номер (^ -го) кластера в ^ -й классификации (? ^),

7 ) = 1, 56

- номер переменных: ^ '

/ ^ 'А'/ - средняя арифметическая -ой переменной -го кластера К -й классификации.

Таким образом, проверяются гипотезы равенства средних всех переменных внутри

любой классификации. Например, число таких гипотез во второй классификации равно 840

(15*56), где 15 число всех комбинаций (сочетаний) для одной переменной. Это число можно

получить по формуле сочетаний:

п\

С —

п

т\ п — т !

В данном случае ^ - 6, да - 2 Результаты проверки нулевых гипотез для каждой классификации представлены в табл. 3.

Таблица 3

Количество и удельный вес не отвергнутых гипотез

Число кластеров 5 6 7 8 9

Общее число не отвергаемых нулевых гипотез 53 118 198 207 330

Количество нулевых гипотез 560 840 1176 1568 2016

Удельный вес не отвергнутых нулевых гипотез (%) 8.57 14.04 16.83 13.20 16.37

Во второй строке представлены общее количество тех случай, когда с 0.05 уровнем значимости не отвергается нулевая гипотеза. Например, для классификации с семью кластерами, проверялось в общем счете 1176 нулевых гипотез. Из них не отвергается с 0.05

уровнем значимости 198 гипотез (13.20 %). Таким же образом были проанализированы остальные классификации. Необходимо отметить, что чем ниже удельный вес принятия нулевых гипотез, тем выше качество классификации потребительского поведения ДХ. Из табл. 3 видно, что минимальный удельный вес принятия нулевой гипотезы наблюдается при классификации ДХ по пяти кластерам. Исходя из этого, можно заключить, что для обследования и анализа структуру и динамику потребительских поведений ДХ наиболее целесообразно применять пять потребительских групп.

Таким образом, в дальнейшем анализе рассматривалась классификация 4000 ДХ по пяти кластерам.

Для наглядного представления различий между полученными стратами, на рис. 1 представлены среднедушевые потребление нескольких видов продуктов питания.

30 27 24 21 М8 15 12 9 6 3 0

<и <и га га га

и и и

и 3 и и и и

о о £ ^ о « и £ и и и О £

у у ч и

и у ю о 1-4 га РР

о

ю ё и

03

ю Рч

га ж и

Л

¿у

□ 1-й кластер ■ 11-й кластер □ Ш-й кластер ■ ГУ-й кластер ■ У-й кластер

Рис. 1. Средние значения потребления основных продуктов питания по кластерам

Нетрудно увидеть, что данные кластеры действительно отличаются друг от друга по среднедушевому потреблению представленных продуктов питания.

Полученные страты использовались в дальнейшем при определении закона распределения населения Республики Армения по среднедушевым эквивалентным доходамб. Нужно подчеркнуть, что здесь рассматривается не просто вопрос выявления формы распределения доходов, а прежде всего вопрос о форме распределении доходов внутри однородных по потребительскому поведению кластеров.

5 Среднедушевой эквивалентный доход это среднедушевой доход, скорректированный по шкале эквивалентности, т.е. при сравнении уровня жизни ДХ учитывается экономия от ведения большого хозяйства [5].

Экономика, Статистика и Информатика И 39 №2, 2006_

Исследователи предлагают разные формы распределения домохозяйств по среднедушевым доходам. Например, в своих работах С. А. Айвазяна ([2], [3] и [5]) предложено описывать распределение семей по величине среднедушевого дохода смесью логарифмически-нормальных законов. Где каждая компонента смеси интерпретируется как некий однородный (в определенном смысле) слой населения (страта). В данной статье, мы также исходим из гипотезы, что распределение населения по эквивалентным среднедушевым доходам можно представить смесью логнормальных законов, т.е. функция плотности распределения домохозяйств по среднедушевым эквивалентным доходам имеет следующий вид:

к х _Опрл )

/ X = ¿«7,-7—-е 2"

2

^ ч, гг

7=1 ^

7=1 сгх

где - среднее значение логарифма среднедушевого дохода ^ -й страты;

<Т] - дисперсия логарифма среднедушевого дохода ^ -й страты; к - общее число страт;

У ]

] - удельный вес населения ] -й страты во всем обществе. Распределение населения внутри ] -й страты по величине среднедушевого

эквивалентного дохода ] описывается логарифмически-нормальным законом распределения с

плотностью:

2

2

г ± 2 сг

Л х = I——е

3 V2жах

Распределение населения по среднедушевому доходу хорошо описывается смесью логарифмически-нормальных законов распределения, когда каждая компонента смеси интерпретируется как некий однородный слой населения.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Здесь под однородностью страт будем понимать полученную нами однородность по продовольственному потреблению. Правомерность применения такого подхода распределения эквивалентных душевых доходов можно объяснить тем, что с доходами прежде всего связано продовольственное потребление, т.е. домохозяйства прежде всего удовлетворяют свои потребительские нужды в продуктах питания, а приобретение предметов длительного пользования в основном имеет эпизодический характер. В этой связи в определении понятия однородность мы будем основываться на потреблении продовольственных продуктов.

а

С учетом табл 1, где приведены удельные веса однородных страт ( 1), в табл. 4 представлены полученные по стратам оценки параметров логнормального распределения.

Таблица 4

Основные характеристики компонентов смеси распределения домохозяйств РА по эквивалентному среднедушевому месячному доходу

Номер страты Удельный вес доходной группы (41), % £ 1 а1

1 44.275 8.94 0.9710

2 14.225 9.25 0.9956

3 28.35 9.31 0.9445

4 4.225 9.49 0.8007

5 8.925 9.75 0.8759

Итого 100.0

где ^] - оценка среднего значения логарифма среднедушевого эквивалентного дохода 1 -й страты;

- оценка среднеквадратического отклонения логарифма среднедушевого

эквивалентного дохода 1 -й страты.

Для получения объективных оценок степени соответствия фактических распределений теоретическим, т.е. между выдвинутой гипотезой и фактическими данными использовался критерий согласия, с помощью которого статически проверялась гипотеза о модельном виде закона распределения вероятностей исследуемой случайной величины. В нашем случае проверяются гипотезы о логнормальном распределении среднедушевых эквивалентных

доходов внутри однородных страт. Одной из распространенных критерий согласия является

2

критерия % Пирсона, который при большом числе наблюдений является состоятельным. Из всех критериев согласия он обеспечивает наименьшую ошибку в принятии гипотезы.

Результаты проверки подтверждают гипотезу, что внутри каждой из однородных по потреблению групп среднедушевой эквивалентный доход имеет логнормальное распределение. Например, гистограмма среднедушевого эквивалентного дохода внутри третьего по потреблению кластера имеет следующий вид:

Переменная: СЭД*, Распределение: Лог-нормальное Колмогоров-Смирнов d = 0,03955, p < 0,10 Хи-квадрат тест = 32,01752, df = 23, p = 0,10082

СЭД (тыс. драмов)

* СЭД - среднедушевой эквивалентный доход Рис. 2. Гистограмма распределения среднедушевого эквивалентному дохода внутри

третьего по потреблению кластера

Поинтервальное распределение домохозяйств РА по среднедушевому эквивалентному доходу рассчитывается по формуле:

Р с<х<с2

]=1

ф

г \

1пс2 - /лз

\ J J

ф

л

V У

где и С2 - заданные концевые точки интервала

Ф X

- функция распределении случайной величины х, имеющий логнормальное

распределение.

Ф х =

ч/2тг

\е'2/2Ж

Расчет вероятностей, ^ С' Х <"'/+| прежде всего необходим для выявления адекватности п1 остроенной нами модели смеси логнормального распределения. Дело в том, что

, с, / = 0,1,..., 4 ч л 0

квинтильные точки распределения ( ', ' ' ' ), предполагают равенству 0.2 вероятности

1

п . . тт х,

Р а<х<см сп (. хкеп к

' 7+1 . В роли и будем использовать А (" - пространство значении

случайной величины х ).

В табл. 5 представлены результаты расчетов вероятностей появления данного

домохозяйства в конкретном дециле по величине среднедушевого эквивалентного дохода,

произведенные по вышеуказанной формуле.

Таблица 5

Рассчитанные по модели смеси вероятности появления домохозяйства РА в конкретном квинтиле по величине среднедушевого эквивалентного дохода

Границы квинтильных групп эквивалентных среднедушевых доходов Р c< *<C,-+i i = 0,1, ...,4

От 0 до c 0.2200

От c до 02 0.2114

От c до c 0.1835

От c3 до c4 0.1772

От c4 до c5 0.2079

От 0 до c 1.0000

Значения вероятностей подтверждают адекватность модели смеси к простой модели распределения доходов, т.е. мы можем утверждать, что смесь лог - нормальных распределений, построенной на основе кластеризации домохозяйств по потреблению продуктов питания, действительно можно применять в задачах распределения ДХ по отдельным показателям доходов.

Сохраняя логику построения кривой Лоренца по квинтильным группам, вместо удельных весов данного показателя в каждом квинтиле мы будем использовать удельные веса среднедушевых эквивалентных доходов для квинтильных групп домохозяйств, рассчитанные по модели смеси.

На рис. 3 изображены кривые Лоренца, описывающие степень неравномерности распределения населения по уровню среднедушевого дохода (для данных НСС РА6) и по уровню эквивалентных среднедушевых доходов (в модели смеси).

6 НСС РА- Национальная статистическая служба Республики Армения

Экономика, Статистика и Информатика И 43 №2, 2006

смеси по эквивалентному среднедушевому доходу)

Результаты расчетов позволили нам оценить степень социального расслоения населения республики по доходам.

Коэффициент Джини равен - 0,446, в то время как по данным НСС коэффициент Джини - 0,438 [6].

Как видно из проведенного анализа население республики по величине среднедушевого дохода распределено крайне неравномерно. Подавляющее большинство населения сконцентрировано в первых трех стратах (86.85%), которые достаточно тесно соприкасаются друг с другом. В то же время страты, вобравшие в себя наиболее обеспеченные слои населения, практически не соприкасаются ни с первыми тремя группами, ни друг с другом.

Оценивая рассмотренную статистическую модель и подход к ее практической реализации, следует отметить, что сама по себе структура модели является достаточно общей и гибкой, легко адаптируемой к любым структурным изменениям в обществе и источниках дохода. Это потребует лишь соответствующей модификации содержательного наполнения страт, и возможно их количества.

Основные нововведения в данной модели кластеризации связаны с тем, что здесь кластеризация ДХ проводилась отдельно по показателям, характеризующие потребление ДХ продуктов питания. Кластеризация была проведена с помощью методов многомерного статистического анализа, а полученные удельные веса кластеров были использованы в роли удельных весов компонентов смеси в задаче оценивания параметров смеси логнормального распределения населения по среднедушевым доходам.

Литература

1. Айвазян С. А., Мхитарян В. С. Теория вероятностей и прикладная статистика. М.: ЮНИТИ-ДАНА, 2001. - 656с.

2. Айвазян С.А., Колеников С.О. Уровень бедности и дифференциация по расходам населения России. - М.: МЭСИ, 2002. - 74 с.

3. Aivazian S. A. Probabilistic-Statistical Modelling of the Distributary Relations in Society // Private and Enlarge Consumption. North-Holland Publ. Comp. Amsterdam - New Yoek -Oxford, 1976.

4. Бородкин Ф. М., Айвазян С. А. Социальные индикаторы. Учебник для вузов. М.: ЮНИТИ - ДАНА, 2006. - 607с.

5. Мовсисян В. К. Построение шкал эквивалентности приведения среднедушевых доходов домохозяйств Армении к эквивалентному уровню // Финансы & Экономика, 2006. - с 131-132.

6. Статистический ежегодник Армении. - Ереван, 2004.

i Надоели баннеры? Вы всегда можете отключить рекламу.