Научная статья на тему 'Выявление типологических групп потребительского поведения домашних хозяйств Армении'

Выявление типологических групп потребительского поведения домашних хозяйств Армении Текст научной статьи по специальности «Экономика и бизнес»

CC BY
69
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук

Аннотация научной статьи по экономике и бизнесу, автор научной работы — В.К. Мовсисян

В странах с низкими доходами, какой является и Армения, более реальную картину уровня жизни отражают показатели потребления. Предполагается, что данные о потреблении декларируются более четко и менее чувствительны к краткосрочным флуктуациям. В статье решается задача разбиения домашних хозяйств Армении на однородные группы по потребительскому поведению.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Выявление типологических групп потребительского поведения домашних хозяйств Армении»

В.К. Мовсисян,

аналитик управления денежно-кредитной политики ЦБ РА

Выявление типологических групп потребительского поведения домашних хозяйств Армении

В странах с низкими доходами, какой является и Армения, более реальную картину уровня жизни отражают показатели потребления. Предполагается, что данные о потреблении декларируются более четко и менее чувствительны к краткосрочным флуктуациям. В статье решается задача разбиения домашних хозяйств Армении на однородные группы по потребительскому поведению.

В странах с низкими доходами, какой является и Армения, более реальную картину уровня жизни отражают показатели потребления. Предполагается, что во время опросов, о потреблении представляются более точная информация и что потребление осуществляется более гладко, без колебаний и оно не настолько чувствительно к краткосрочным флуктуациям, как показатель дохода, особенно в странах с переходной экономикой [4].

В данной статье, решается задача выделения однородный типов потребительского поведения домашних хозяйств, основываясь только на физических объемах потребления продуктов питания. На наш взгляд, преимущество применения физических объемов потребления в том, что в них не выражаются ценовые различия одного и того же продукта в разных регионах страны. Ведь реальный уровень удовлетворенности будет выражаться, прежде всего, количеством потребляемый продуктов, чем их стоимостью. Однако нужно отметить также один недостаток этого подхода: недостаток заключается в том, что физические объемы потребления ничего не говорят о качествах этих продуктов, и поэтому могут искажать реальную картину в этой сфере. Тем не менее, в нынешнем экономическом положении для большинства населения Армении более важно объемы потребления, чем качество продуктов.

Классификация домашних хозяйств по потребительскому поведению осуществлялась на основе 43 исходныгх переменных, характеризующие среднедушевые годовые объемы потребления продуктов питания домохозяйств Армении. Источником информации об объемах потребления заслужил проведенное в 2003 г. Национальной статистической службой Армении выборочное бюджетное обследование уровня жизни домашних хозяйств.

И так, мы обладаем следующей матрицей исходных данных:

ХпХт }

где х. — среднедушевое годовое потребление г-го домохозяйства /-го продукта питания (г = 1 ,п = 1,4000, / = 1,т = 1,43)

Матрица Хпхт включает потребление следующих пяти групп продуктов

5

питания (X т = т):

г=1

1) хлеб и хлебопродукты (т =6 наименований продуктов);

2) овощи (т2=10);

3) фрукты (т=11);

4) мясо и мясопродукты (т =8);

5) молочные продукты (т =8).

Поскольку пространство классификационных признаков довольно большое и возможно включает в себя тесно коррелированные переменные, то

Экономика, Статистика и Информатика 49 №1, 2007

сначала решим задачу снижения признакового пространства, внутри каждой из пяти групп переменных. Для этого применяется метод главных компонент. Целью этой задачи является замена всех переменных внутри каждой группы их первыми главными компонентами, объясняющие большую часть суммарной дисперсии исходных переменных.

Для применения метода главных, из исходных значений переменных (х) перейдем к их нормированным значениям (хУ) с помощью нормиру-

ющего преобразования ( х*

где и ( — являются соответственно выборочным средним и выборочным среднеквадратичным отклонением у-й переменной) [1].

С помощью статистического пакета 81а1Мса 6.0 для пяти групп переменных получили первые главные компоненты, которые связаны с нормированными переменными следующими зависимостями:

скому поведению продолжим на основе полученных пяти обобщенных признаков в место исходных 43.

Задача классификации решалась с применением методов кластерного и дискриминантного анализа. Для этого, из исходной выборочной совокупности (4000 домохозяйств), ранжированной по величине среднедушевого дохода, была сделана 10 процентная пропорциональная выборка (400 домохозяйств), чтобы в нее вошли объекты из разных доходных групп.

По этой выборке проводился кластерный анализ. Из-за большого объема выборки (п=400) [1] использовался метод к-средних. Надо отметить также, что нам не было известно как число классов, так и число однородных потребительских групп. Однако, как показывает мировой опыт, количество кластеров, которое необходимо взять для классификации населения по потребительскому поведению, варьируется от 5 до 9.

=-0.14 ■ х1 -0.19 ■ X2 -0.31 ■ х3 -0.29 ■ х4 -0.3 ■ х5 -0.23 ■ х6 г2 =-0.16 ■ х 7 - 0.16 ■ х*- 0.13 ■ х* - 0.14 ■ х*0 -0.14 ■ х* -0.14 ■ х* -0.16 ■ х*3 --0.15 ■ х*4 - 0.12 ■ х*5 - 0.13 ■ х*6

23 =-0.15 ■ х*7 -0.13 ■ х*8 -0.17 ■ х*9 -0.16 ■ х20 -0.16 ■ х^! -0.12 ■ х22 -0.16 ■ х23 --0.13 ■ х2*4 -0.15 ■ х* -0.14 ■ х*6 -0.11 ■ х2*7

г4 =-0.2 ■ х28 -0.18 ■ х29 -0.14 ■ х^0 -0.2 ■ х^ -0.2 ■ х*2 -0.17 ■ х*3 -0.2 ■ х*4 -0.15 ■ х^ 25 =-0.17 ■ х*6 - 0.16 ■ х* -0.19 ■ х*8 -0.2 ■ х3*9 -0.18 ■ х*0 - 0.24 ■ х¡1 - 0.21 ■ х*2 -- 0.21 ■ х *

где г2, х3, г4, г5 — первые главные компоненты (нормированные) для соответствующих групп переменных и объясняющие соответственно 44,7%, 48,7%, 40,5%, 47,5% и 40,5% суммарной дисперсии исходных переменных этих групп.

Исходя из содержательности продуктов, включенных в каждую группу, назовем первые главные компоненты как уровень потребления: ц _ хлебопродуктов; ц г2 _ овощей; ц г3 _ фруктов; Ц г4 _ мясопродуктов; Ц 2"5_ молочных продуктов. Таким образом, классификацию домашних хозяйств по потребитель-

Классификация домохозяйств проводилась предварительно на 5, 6, 7, 8 и 9 кластеров. Структура кластеров при этих разбиениях представлена в табл. 1.

В кластерном анализе не существует алгоритмов однозначного определения числа кластеров.

Для определения необходимого числа групп в работе предложен алгоритм, основанный на статистических критериях. Согласно алгоритму, из полученных вариантов классификаций на к групп, где к = 5; 6; 7; 8; 9, которая наиболее соответствует выбранному статистическому критерию однородности. Здесь однородность понимается в широком смыс-

ле, т.е. группы будут считаться однородными по конкретным показателям, если вариация показателей внутри этих групп минимальны, а вектора средних кластеров будут статистически отличаться друг от друга.

Здесь использовался критерий однородности Стьюдента (¿-крите-рий) для проверки нулевых гипотез следующего вида: к к Н0= тУ

где к—число кластеров при каждой классификации (к = 5, 6, 7, 8, 9), гк — номер (г-й) кластера при данном к,

1к — номер (1-й) кластера при данном к, (г ФI),

у — номер переменных (у = 1, 2,...43),

— средняя арифметическая у-ой переменной гк-го кластера при числе кластеров к (обратим особое внимание на то, что проверяются средние значения исходных (ненормированных) переменных (лу), а не тех пяти переменных (нормированных), по которым проводилась классификация).

Таким образом, в нашем случае проверяется гипотеза равенства средних всех переменных внутри любой из пяти классификаций. Например, число таких гипотез во второй классификации при к = 6 равно 645 (15 • • 43), где 15 число всех комбинаций для одной переменной. Это число можно получить по формуле сочетаний из к = 6 элементов по два.

Результаты проверки нулевых гипотез для каждого числа классов к представлены в табл. 2.

Во второй строке представлено общее количество тех случаев, когда с 0.05 уровнем значимости не отвергается гипотеза. Необходимо отметить, что если удельный вес принятия нулевых гипотез относительно высок, то по этой классификации трудно хорошо характеризовать различия в потребительских поведениях домохозяйств. Из табл. 2 видно, что в первой классификации из 430 проверяемых гипотез не отвергались 33 (7,67%), т.е. уровень однородности этой классификации высок относительно других классификаций, что

№1, 2007

Таблица 1

Классификация домашних хозяйств по методу к-средних

Число Число домашних хозяйств в каждом кластере Общий объем

кластеров 1 2 3 4 5 6 7 8 9 выборки

5 число наблюдений 20 45 73 109 153 — — — — 400

% наблюдений 5 11,25 18,25 27,25 38,25 — — — — 100

6 число наблюдений 20 43 48 53 129 107 — — — 400

% наблюдений 5 10,75 12 13,25 32,25 26,75 — — — 100

7 число наблюдений 48 57 132 1 20 107 35 — — 400

% наблюдений 12 14,25 33 0,25 5 26,75 8,75 — — 100

8 число наблюдений 24 38 33 50 83 57 97 18 — 400

% наблюдений 6 9,5 8,25 12,5 20,75 14,25 24,25 4,5 — 100

9 число наблюдений 12 41 35 31 28 54 89 65 15 400

% наблюдений 3 10,25 8,75 7,75 7 13,5 22,25 23,75 3,75 100

Номера кластеров (1, 2, потребления в них.

9) упорядочены по мере снижения объемов

Таблица 2

Количество и удельный вес не отвергнутых гипотез

Число кластеров

Общее число не отвергаемых нулевых гипотез_

33 85 170 245 346

Количество нулевых гипотез

430 645 903 1204 1548

Удельный вес не отвергнутых нулевых гипотез (%)

7,67 13,18 18,82 20,35 22,35

дает нам основание взять ее для характеристики потребительского поведения домохозяйств.

Теперь нам известны основные типы потребительского поведения 400 домашних хозяйств. Для распространения полученных результатов на всю выборочную совокупность воспользуемся дискриминантным анализом по обучающей выборке [2].

Полученные результаты возьмем в качестве обучающих и на их основе проведем классификацию остальных объектов, не вошедших в обучающие выборки. С целью минимизации вероятности ошибки при классификации каждого объекта, для каждого, по потреблению однородного кластера, определим функции классификации.

Классификационные функции задаются следующей формулой: к

Si = с,- + X 1

]=1

где 5 — значение классификационной функции для г-го кластера (г = 1, 2,..., 5);

ил. — вес /-й переменной для г-го кластера (/ = 1, 2,., 5);

х — значение /-й переменной для конкретного домохозяйства;

с — свободный член классификатора для г- го кластера.

К г-ому классу (г = 1, 2,., 5) следует отнести наблюдение, которому

соответствует & = тах &. Таким

п=1,5

образом, нами были получены следующие функции классификации:

& =-46.8"6.33 • 21- 9.26'22 - 4.2423- 7.724 - 8.2125 =-9.94-3.82'21 -3.04 2: - 3.322, - 2.0224 - 3.212 & = -2.39-1.17 21- 0.48 2!- 0.4723- 1.024 - 1.1 825 & =-1.88+0.57' 21 + 0.7 ' 22 + 1.182 + 0.64' 24 + 0.95 25 & =-5.4+2.81' 21 + 2.65' 2 + 2.02 + 1.83 24 + 2.332

По этим функциям нами была проведена классификация оставшейся части массива.

Таким образом, окончательная структура основных типов потребительского поведения всей совокупности домохозяйств имеет следующий вид (табл. 3).

Чтобы убедиться в адекватности построенной (с помощью первых главных компонентов пяти групп продуктов питания) классификации домохозяйств, проверим гипотезы статистически значимого различия

исходных признаков между приведенными в табл. 3 кластерами, т.е. проверим следующие гипотезы:

Н0: т=т

где г и I — номера потребительских кластеров (, ФI);

/—номер переменных (1 = 1,43); №у — средняя арифметическая /-ой переменной в г-ом кластере.

Гипотезы проверяются I критерием однородности Стьюдента и показывают удивительный результат: все из проверяемых 430 гипотез отвергаются, а это значит, что, действительно, объемы потребления каждого из 43 продуктов питания различаются у полученных потребительских классов.

Для наглядного представления различия в потребительских кластерах, приведем среднее потребление некоторых продуктов питания.

Как известно, при относительном подходе к определению бедности показатели благосостояния соотносят не с минимальными потребностями, а с уровнем материальной обеспеченности, преобладающими в той или иной стране [3]. Согласно этому подходу упор делается на средства к существованию, на способность семей покупать товары, необходимые для удовлетворения основных потребностей. На практике в рамках данной концепции при конструировании доходной относительной черты бедности используется некоторая пропорция от величины среднего или медианного дохода.

Применяя данный подход в сфере продовольственного потребления, определим отношения полученных потребительских классов по сравнению со средним уровнем потребления, характерного для преобладающей части населения.

Для каждого потребительского класса рассчитаем обобщающий показатель потребления.

Введем следующие обозначения: р — среднее значения потребления г-го продукта питания в /-ом потребительском классе (г = 1, 2, ..., 43; / = 1, 2, .., 5);

q. — удельный вес /-го потребительского класса (X ^ = 1);

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1=1

Экономика, Статистика и Информатика

№1, 2007

р1 — среднее значение потребления г-го продукта питания в целом по стране.

Обобщающий показатель потребления (I) для каждого класса рассчитывается по следующей формуле:

1 n

Ij=11

Щ-

Pi

П i=1 _ 5

где p jr

j=1

Расчеты показывают, что I1 = 2,72, I2 = 1,75, I3 = 1,22, I4 = 0,84 и I2 = 0,51.

Обобщая результаты, можно сказать, что потребление 63,7% домохо-зяйств (четвертый и пятый кластеры) не достигает среднего уровня потребления по стране. Кроме того, 35,4% домохозяйств потребляют примерно два раза меньше, чем принято во всем обществе. А домохозяйства первого кластера (с наибольшим потреблением), составив только 4,7% всей совокупности, потребляют 2,72 раза больше.

Таким образом, уровень потребления продуктов питания можно считать самым реальным показателем благосостояния населения Армении, в которой существует сильная поляризация в обществе в этой сфере.

Литература:

1. Айвазян С.А., Мхитарян B.C. Теория вероятностей и прикладная статистика. Т. 1. М.: ЮНИТИ-ДАНА, 2001.

2. Дубров А.М., Мхитарян B.C., Тро-шин Л.И. Многомерные статистические методы. М.: Финансы и статистика, 2005.

3. Townsend. Poverty in the United Kingdom. Harmondsworth: Penguin, 1979.

4. Социальная ситуация и бедность Армении. Ереван, 2003. щ

Таблица 3

Распределение домашних хозяйств по потреблению продуктов питания

Потребительские Число Кумулятивное число домохозяиств Процет Куму лятив ны и процент домохозяиств

кластеры домохозяиств домохозяиств

1 188 188 4,700 4,700

2 523 711 13,075 17,775

3 741 1452 18,525 36,300

4 1132 2584 28,300 64,600

5 1416 4000 35,400 100,000

Всего 4000 100,000

220,00 -1 200,00 180,00 160,00 140,00 120,00 100,00 80,00 60,00 40,00 20,00 0,00

а

~ I

ь.-.j

■ b. -

о CL

01

Ci

л о

Ci о ^ ai -ft о ^ ю

? о 1- К

о Ci

IZ га

Г"-Г"-Г"-Г"-Г"-Г-Г-Г"-Г"-1

£ 5 га га 9 ^ ° 5 х х х S я й

CL

ю С

о о >. Ci

к

О

га

Ci

га

LQ

О

II кластер

кластер

кластер

IV кластер

Рис. 1. Средние значения потребления некоторых продуктов питания по кластерам за 2003 год

i Надоели баннеры? Вы всегда можете отключить рекламу.