Научная статья на тему 'Основы проведения факторного анализа социально-экономического развития региона с использованием программного комплекса SPSS (на примере Алтайского края)'

Основы проведения факторного анализа социально-экономического развития региона с использованием программного комплекса SPSS (на примере Алтайского края) Текст научной статьи по специальности «Экономика и бизнес»

CC BY
460
80
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ГЛАВНЫЕ КОМПОНЕНТЫ / PRINCIPLE COMPONENTS / МЕТОДЫ ВРАЩЕНИЯ / ROTATION METHODS / ВАРИМАКС / VARIMAX / КОРРЕЛЯЦИОННАЯ МАТРИЦА / CORRELATION MATRIX / СОБСТВЕННЫЕ ЧИСЛА / ФАКТОРНЫЙ АНАЛИЗ / FACTOR ANALYSIS / ЭКОНОМИКА РЕГИОНА / ECONOMY OF REGION / PROPER NUMBERS

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Попов Алексей Анатольевич

В статье продемонстрирована возможность разбиения экономики региона на сегменты (фактор), позволяющая организовать их целевое финансирование. Для реализации такого подхода возможно применение математического аппарата факторного анализа, который реализован в не-которых программных средствах, например, SPSS.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The article shows the possibility to split economy of the region into segments (factor) which gives an opportunity to organize their target financing. In order to implement this approach it is possible to use mathematic apparatus of factor analysis which is realized in some software facilities, for example SPSS.

Текст научной работы на тему «Основы проведения факторного анализа социально-экономического развития региона с использованием программного комплекса SPSS (на примере Алтайского края)»

Канд. техн. наук А. А. Попов

ОСНОВЫ ПРОВЕДЕНИЯ ФАКТОРНОГО АНАЛИЗА СОЦИАЛЬНО-ЭКОНОМИЧЕСКОГО РАЗВИТИЯ РЕГИОНА С ИСПОЛЬЗОВАНИЕМ ПРОГРАММНОГО КОМПЛЕКСА SPSS (на примере Алтайского края)

В статье продемонстрирована возможность разбиения экономики региона на сегменты (фактор), позволяющая организовать их целевое финансирование. Для реализации такого подхода возможно применение математического аппарата факторного анализа, которыш реализован в некоторые программный: средствах, например, SPSS.

Ключевые слова и словосочетания: главные компоненты, методы вращения, варимакс, корреляционная матрица, собственные числа, факторный анализ, экономика региона.

В современных экономических условиях возрастает роль способов оперативного анализа данных с целью выявления основных тенденций в развитии различных секторов экономики страны и ее регионов, в частности. Полученные результаты позволят грамотно инвестировать финансовые средства в экономику региона.

Для реализации такого подхода возможно применение математического аппарата факторного анализа, который реализован в некоторых программных средствах. В результате анализа экономика региона может быть разбита на ряд независимых или мало зависимых сегментов (факторов).

В данной статье анализируются социально-экономические показатели, характеризующие экономику Алтайского края в январе - августе 2009 г. (названия параметров и их условное обозначение приведены в табл. 1). Все параметры измеряются в процентах от аналогичного периода 2008 г. При этом параметр IFP показывает процент предприятий, имеющих положительный финансовый баланс на данный период времени, а параметр IUB - процент безработных. Значения ряда параметров, которые важны для получения более точной картины состояния региона либо отсутствуют, либо недостоверны, либо приведены не по всем месяцам. Данные получены с использованием информации с официального сайта Алтайского края. При помощи программной системы SPSS сделана попытка определить факторы, влияющие на развитие региона.

Т а б л и ц а 1

Исходные данные для проведения расчетов*

Название показателя Месяцы 2009 года

Январь Февраль Март Апрель Май Июнь Июль Август

Индекс продукции сельского хозяйства (IPS) 101,5 101,2 107,5 107,5 107,7 107,9 107,0 101,0

Индекс состояния жилищного строительства (IZS) 115,4 104,2 112,6 107,2 102,1 104,8 108,3 102,4

Индекс физического товарооборота (IFT) 101,9 104 102.1 100,1 96,5 93,4 91,1 89,3

Индекс оказания платных услуг населению (IPU) 106 103,5 102,9 102,5 102,3 101,0 100,3 100,0

Индекс добычи полезных ископаемых (IDP) 70,8 31,1 54,3 60,4 40,3 100,9 76,4 96,1

Индекс состояния обрабатывающей промышленности (IOP) 83,2 87,1 87,7 88,7 89,4 86,7 87,3 86,8

Индекс производства газа, электроэнергии и воды (IPG) 90,8 93,0 93,2 92,8 93,1 93,9 94,0 94,8

Индекс состояния пищевой промышленности (IPI) 119,6 127,6 125,9 123,3 123,8 114,6 114.6 113,5

Индекс финансово успешных предприятий (IFP) 72,7 58,1 59,4 58,7 59,8 65,8 64,3 65,5

Индекс средней зарплаты (ISZ) 123,8 116,2 113,5 112,7 111,9 111,6 111,6 110,7

Индекс среднедушевого дохода (ISD) 121,2 117,2 116,6 115,6 111,9 109,5 107,8 104,6

Индекс потребительских цен (IPC) 102,5 104,5 106,0 106,7 107,2 108,2 108,7 109,2

Индекс уровня безработицы (IUB) 2,9 3,4 3,7 3,7 3,5 3,3 3,3 3,2

* Источник: www.altairegion22.ru

В факторном анализе предполагается, что наблюдаемые переменные являются линейной комбинацией некоторых характерных факторов. Характерные факторы не вносят вклад в ковариацию между пере-

менными, а общие факторы, число которых предполагается гораздо меньшим числа наблюдаемых переменных, вносят вклад в ковариацию между ними. При решении задач факторного анализа обычно делают три шага: подготовка соответствующей ковариационной матрицы, выделение факторов и вращение с целью получения окончательного решения. В качестве исходных данных для проведения факторного анализа используется матрица корреляции, полученная на основании данных табл.1.

Основная цель выделения первичных факторов в факторном анализе заключается в определении минимального числа общих факторов, которые удовлетворительно воспроизводят корреляции между наблюдаемыми переменными.

Главная стратегия - общая для ряда методов определения факторов. Она включает проверку гипотез о минимальном числе общих факторов, необходимых для воспроизведения наблюдаемых корреляций. Анализ основных компонент представляется наиболее простым для введения таких особых понятий, как корни характеристического уравнения (собственные числа) и собственные векторы, а также позволяет определить их роли в алгоритмах факторного анализа. Анализ главных компонент - это метод преобразования данной последовательности наблюдаемых переменных в другую последовательность переменных. Тогда главная ось будет задаваться линией, для которой сумма квадратов расстояний до всевозможных точек минимальна. Новые оси являются математическими (линейными) функциями наблюдаемых переменных. Основной математический метод получения направлений главных осей основан на нахождении собственных чисел и векторов корреляционной (ковариационной) матрицы. Для определения собственных чисел и векторов используется уравнение в матричной форме1. Для определения факторов обычно используются следующие методы: метод главных факторов, метод наименьших квадратов, метод минимальных остатков, метод максимального правдоподобия, альфа-факторный анализ, метод анализа образов.

число выделяемых факторов определялось с помощью критерия, заключающегося в том, что соответствующие собственные величины должны быть больше 1.

Так, на первом этапе анализа определяется минимальное число факторов, адекватно воспроизводящих наблюдаемые корреляции, а также значения общностей каждой переменной. Следующий шаг сос-

1 См.: Ким Дж.-О., Мьюллер Ч. У., Клекка У. Р. и др. Факторный, дискриминантный и кластерный анализ. - М. : Финансы и статистика, 1989; Гайдышев И. П. Анализ и обработка данных : специальный справочник. - СПб. : Питер, 2001.

тоит в нахождении легко интерпретируемых факторов с помощью процедуры вращения. При этом число факторов и значения общностей переменный фиксируются. По результатам исследований с использованием исходных данных, приведенных в табл. 1, с помощью программной системы SPSS1, получены следующие факторы (табл. 2).

Т а б л и ц а 2

Факторы, полученные с помощью анализа главных компонент

Component Initial Eigenvalues

Total % of Variance Cumulative, %

1 7,003 53,870 53,870

2 4,262 32,788 86,658

3 1,128 8,678 95,336

4 ,351 2,698 98,034

5 ,168 1,289 99,323

6 ,064 ,490 99,812

7 ,024 ,188 100,000

8-14 0 0 0

Существуют три различных подхода к проблеме вращения. Первый подход - графический. Вращение заключается в проведении новых осей, которые соответствуют некоторому критерию простой, легко интерпретируемой структуры. Если в пространстве факторов есть явные скопления (кластеры) точек (переменных), легко отделяемых друг от друга, простая структура получается в том случае, когда оси проведены через эти скопления. Но если такое разделение не очевидно или число факторов велико, графический метод неприменим.

Второй подход связан с аналитическими методами. В этом случае выбирается некоторый объективный критерий, которым надо руководствоваться при выполнении вращения. В рамках этого подхода различают два вида вращения: ортогональное и косоугольное. А они в свою очередь имеют многочисленные вариации.

Третий подход заключается в задании априорной целевой матрицы. Цель вращения - нахождение факторного отображения, наиболее близкого к некоторой заданной матрице. Для упрощения описания столбцов факторной матрицы используется метод «варимакс», в котором вместо дисперсии квадратов нагрузок переменной рассматривается дисперсия квадратов нагрузок фактора.

1 См.: Бююль А., Цёфель П. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей : пер. с нем. - СПб. : ООО «ДиаСофтЮП», 2005.

Факторная структура является наипростейшей, когда все переменные имеют факторную сложность, равную 1, т. е. когда каждая переменная имеет ненулевую нагрузку только на один общий фактор. Если число факторов два и больше, то это означает, что в наиболее простой матрице факторной структуры каждая строка будет содержать только один ненулевой элемент, каждый столбец будет иметь несколько нулей и для каждой пары столбцов нулевые элементы не совпадают. Следовательно, задача состоит в том, чтобы определить факторную структуру, которая является самой близкой к простой структуре. Геометрический метод вращения практически неприменим, когда скопления точек трудно разделимы или когда число факторов больше двух. В качестве примера на рис. 1 приведена реализация графического метода для двух факторов.

-1,0 -0,5 0,0 0,5 1,0

Component 1

Рис. 1. Реализация графического метода вращения для двух факторов

Исходные данные (факторные нагрузки) для демонстрации возможностей графического метода приведены в табл. 3 и получены с использованием подходов, указанных в работе А. Бююля и П. Цёфеля1. Первичные факторные нагрузки - это ни что иное, как проекции переменных на две оси (в случае двухфакторной модели). Простая структура получается в том случае, когда все значения переменных лежат на этих осях. В ортогональном случае простая структура задается множеством точек, имеющих ненулевые нагрузки (нулевые проекции)

1 См.: Бююль А., Цёфель П. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей.

только на один фактор (на одну ось). Следует заметить, что на рис. 1 недостаточно отражена простая структура для двух факторов: для интерпретации факторов было бы оптимально, если бы точки лежали ближе к осям и подальше от точки начала отсчета. Тогда каждая переменная имела бы значительную нагрузку для одного фактора и незначительную для другого. На данном рисунке точки лежат достаточно близко к оси только вдоль оси, соответствующей фактору 2. Поэтому случай с двумя факторами, может быть использован лишь для геометрической наглядности: необходимо более двух факторов.

Т а б л и ц а 3

Факторная нагрузка после вращения

Название параметра Номер фактора

1 2

IPS -,233 ,538

IZS ,605 -,418

IFT ,952 ,235

IPU ,962 -,230

IDP -,669 -,609

IOP -,336 ,922

IPG -,896 ,297

IPI ,761 ,624

IFP -,027 -,976

ISZ ,817 -,571

ISD ,987 -,019

IPC -,964 ,245

IUB -,002 ,942

Существует несколько критериев определения числа факторов. Некоторые из них являются альтернативными по отношению к другим, а часть этих критериев можно использовать вместе, чтобы один дополнял другой. В случае определении факторов с помощью собственных чисел применяют правило, которое позволяет оставлять факторы с собственными числами, большими 1, после осуществления вращения (табл. 4).

Т а б л и ц а 4

Значение собственных чисел после вращения

Component Rotation Sums of Squared Loadings

Total % of Variance Cumulative, %

1 6,576 50,583 50,583

2 3,936 30,276 80,858

3 1,481 11,393 92,251

4 ,752 5,783 98,034

Из анализа табл. 4 видно, что значения, большие 1, имеют только три собственных числа. Поэтому, согласно данному правилу, количество факторов можно выбрать, равным трем.

Рассмотрим другой критерий выбора количества факторов. На рис. 2 представлено графическое изображение собственных чисел корреляционной матрицы, приведенных в табл. 1, которые наносятся на график в порядке их убывания. Количество факторов для данного критерия принимается, равным номеру параметра, после которого исследуемая зависимость близка к почти горизонтальной прямой линии. Из рисунка видно, что количество факторов можно принять, равным четырем.

Рис. 2. На графике по вертикальной оси отражены значения собственных чисел в порядке убывания, а по горизонтали - номер параметра

Для дальнейших расчетов количество факторов принято, равным четырем. С помощью SPSS были получены значения факторной нагрузки для четырех факторов (табл. 5). Значения факторных нагрузок, приведенных в табл. 5, обрабатываются так, чтобы для каждого фактора была отмечена та факторная нагрузка, которая имеет наибольшее абсолютное значение. Было произведено разбиение параметров социально-экономического региона по факторам в соответствии с факторной нагрузкой. В результате с фактором 1 (с ним коррелирует 6 параметров) связаны показатели физического товарооборота, оказания платных услуг, а также деятельность предприятий по производству газа, электроэнергии и воды. Также с фактором 1 связаны индексы, характеризующие большинство социальных параметров. Следовательно, на параметры социального развития (за исключением уровня безработицы) в основном влияет первый фактор. С фактором 2 коррелирует 5 пара-

метров. Данный фактор отражает работу предприятий в добывающей, обрабатывающей и пищевой промышленности. Таким образом, фактор 2 оказывает влияние на уровень финансово успешных предприятий и уровень безработицы. С фактором 3 связана деятельность предприятий сельского хозяйства, с фактором 4 - деятельность предприятий по строительству жилья.

Т а б л и ц а 5

Факторная нагрузка для четырех факторов

Параметры Component

1 2 3 4

IPS -,165 ,253 ,944 ,056

IZS ,627 -,293 ,127 ,675

IFT ,858 ,441 -,127 ,170

IPU ,980 -,051 -,151 ,063

IDP -,569 -,715 ,083 ,282

IOP -,409 ,751 ,409 -,296

IPG -,972 ,191 -,033 -,023

IPI ,627 ,770 -,057 -,040

IFP ,143 -,973 -,116 ,112

ISZ ,867 -,372 -,308 ,114

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ISD ,962 ,161 -,049 ,192

IPC -,955 ,025 ,271 -,097

IUB -,140 ,879 ,415 ,139

В результате такого разбиения экономики региона на факторы появляется возможность выдачи рекомендаций лицу, принимающему решение, по осуществлению целевых инвестиций для влияния на параметры социального развития, характеризующие качество жизни населения региона. Конечно, для выявления полной картины разбиения на факторы необходимо иметь большее количество параметров и соответственно больший объем для изложения всех материалов исследований.

Список литературы

1. Бююлъ А., Цёфелъ П. SPSS: Искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. - СПб. : ООО «ДиаСофтЮП», 2005.

2. Гайдышев И. П. Анализ и обработка данных : специальный справочник. - СПб. : Питер, 2001.

3. Ким Дж.-О., Мъюллер Ч. У., Клекка У. Р. и др. Факторный, дис-криминантный и кластерный анализ. - М. : Финансы и статистика, 1989.

i Надоели баннеры? Вы всегда можете отключить рекламу.