ББК 65.051.03В631:65.9(2Рос-4Аст)-94
А. Б. Эльдяева, Э. К. Салахова
МНОГОМЕРНАЯ КЛАССИФИКАЦИЯ РАЙОНОВ АСТРАХАНСКОЙ ОБЛАСТИ ПО УРОВНЮ СОЦИАЛЬНОГО РАЗВИТИЯ
A. B. Eldyaeva, E. K. Salakhova
MULTIDIMENSIONAL CLASSIFICATION OF AREAS OF THE ASTRAKHAN REGION BY LEVEL OF SOCIAL DEVELOPMENT
Приведены результаты исследования районов Астраханской области по уровню социального развития за 2006-2009 гг. Анализ результатов проведен на основе методов многомерной классификации. Результаты исследования позволяют сделать заключение о характере изменений социального положения районов Астраханской области за ряд лет. Использование методики может способствовать повышению эффективности действий органов исполнительной власти различных уровней в процессе регулирования социально-экономического развития общества.
Ключевые слова: многомерная классификация, разведывательный анализ, кластерный анализ.
The results of the research of the Astrakhan region areas by the level of social development in 2006-2009 are resulted. The given analysis is made on the basis of methods of multidimensional classification. The results of the research make it possible to draw the conclusion about change of a social status of the Astrakhan region areas during a number of years. The investigation of the methods can promote to increase the efficiency of executive bodies of different levels in the process of regulation of the social and economic development of the society.
Key words: multidimensional classification, the prospecting analysis, cluster analysis.
Концепция социально-экономического развития страны, разработанная Правительством Российской Федерации, исходит из содержательных задач развития экономики на основе научно-технического прогресса, кардинального повышения ее эффективности и социальной ориентированности.
В соответствии с рекомендациями науки Концепция определяет приоритеты государственной политики: инвестиции в человеческий капитал, подъем уровня образования, науки, здравоохранения, создание национальной инновационной системы, развитие естественных преимуществ России и модернизация экономики, развитие ее новых конкурентоспособных секторов в высокотехнологичных сферах экономики знаний, реконструкция и расширение производственной, социальной и финансовой инфраструктуры.
В рамках осуществления данной Концепции органам исполнительной власти требуется соответствующее информационно-аналитическое обеспечение, способы и приёмы, позволяющие создать обратную связь управляющей и управляемой подсистем в процессе принятия и реализации принятых решений в жизни российского общества.
Следует отметить высокую динамичность современных социально-экономических явлений, оценка которых не может быть осуществлена традиционными методами анализа. Интерпретация социально-экономической информации этими методами не позволяет оперативно принимать решения, адекватные общественным изменениям. Большое значение в последнее время в этом процессе уделяется различным видам статистического анализа, экономикоматематическим методам и моделям.
Муниципальные образования составляют низовые звенья регионов Российской Федерации, поэтому изменения, происходящие в этих образованиях, в совокупности характеризуют общие тенденции социально-экономического развития регионов и страны в целом. Комплексное проведение статистических исследований, в частности использование статистического многомерного анализа [1], позволит органам управления своевременно выявлять нежелательные тенденции социальных процессов и их причины, принимать соответствующие корректирующие и предупреждающие меры.
Для анализа социального развития внутри региональной структуры необходимо оперировать однородными совокупностями по исследуемым критериям. С помощью территориальной группировки районов имеется возможность снизить размерность задачи, что приведет к ее упрощению.
Однородная совокупность характеризуется сходными основными свойствами единиц совокупности. Различают качественную и количественную однородность. Другими словами, рассматриваемую совокупность можно считать качественно однородной, а результат будет отражать количественную оценку однородности.
Таким образом, основная задача классификации объектов может быть сформулирована следующим образом: исходные данные разбиты на к однородных групп (кластеров):
(1)
(х1 х1 р \ х1р
х = х1 хр
V хП хП хр п У
где 1 - номер объекта; ] - номер признака; р - количество признаков, характеризующих каждый из п объектов.
В самом начале проводится классификация объектов (в нашем случае - районов) по уровню социального и экономического развития - это разведывательный анализ, который основан на визуализации геометрической структуры многомерных данных на основе их проецирования в пространство низкой размерности. Линейное отображение представляется наиболее удобным пространством для отображения многомерных данных. В дальнейшем необходимо использовать проекции на плоскости главных компонент, т. к. в направлении осей первых главных компонент исходная совокупность имеет наибольшее рассеяние [2].
Рассматривается следующая схема решения задачи:
1. Нормирование данных осуществляют путем деления центрированной величины на среднеквадратическое отклонение, после чего переходят от матрицы Х к нормированной матрице с элементами:
-] хг
ч =—
о
(2)
где х - среднее арифметическое векторных наблюдений; о] - среднеквадратическое отклонение; х/ - нормированное значение наблюдения.
2. Для определения значения главных компонент для каждого из объектов по исходным данным из характеристического уравнения находят матрицу парных коэффициентов корреляции:
К-ц-Е = 0
( 1
К =
Г12 Ги
ГЛ г;2 1
Л
(3)
(4)
Затем:
- для каждого собственного числа ц, ц^,..., М/ находят собственный вектор из уравнения
(5)
где 1} =
(I ^ 11]
12 ]
\ 1Щ У
х
- далее составляют матрицу собственных чисел:
0, 0 Л
С = 0 т2 0
0, V 0 т 1 V
(6)
где м1 <ц2 <... < м ];
- формируют матрицу нормированных собственных векторов:
Ь = (/1, /2,...,/]); (7)
- определяют матрицу факторных нагрузок:
А = Ь - С2 (8)
- формализуют матрицу главных компонент:
2 = X1 -(А1), (9)
х( ]) - х(])
о( ])
3. Из р главных компонент выбирают первые т, объясняющие 70-80 % общей дисперсии исходного признакового пространства:
где Xі ={х-1)} , х-1 —----------——— (і = 1,п; 1 = 1,...,р).
М + --- + Мт--------------------------------100%> 70 + 80% (10)
М1 +М2 +--- + М р
4. Строят проекции исходных многомерных наблюдений на плоскости первых т главных компонент, используя найденные значения главных компонент для каждого из объектов.
5. На основе построенных проекций визуально производят отсев нехарактерных наблюдений и делают выводы о количестве и составе кластеров.
Для реализации алгоритма решения задачи используются программы 8Р88, 81ай8йса.
Далее, для окончательного разбиения совокупности объектов на классы, согласующиеся с результатами проведенного ранее общего и разведывательного анализа, используют агломеративные иерархические алгоритмы классификаций или метод к-средних, выбирая наиболее адекватный.
Оба алгоритма включают понятия «расстояния между отдельными объектами» и «расстояния между группами объектов». Каждому из п объектов исследуемой совокупности можно поставить в соответствие точку в р-мерном пространстве. Геометрическая близость двух или нескольких точек в этом пространстве означает близость «физических» состояний соответствующих объектов и в этом смысле их однородность. Тогда проблема классификации заключается в разбиении анализируемой совокупности точек-наблюдений на небольшое число кластеров таким образом, чтобы объекты, принадлежащие одному кластеру, находились на сравнительно небольшом расстоянии друг от друга.
Часто в расчётах используют обобщенное расстояние махаланобисского типа следующего вида:
Р0 (Х„Х] )^^Х~-Х]1ГАТ:Ё:1А{Х~-Х~), (11)
где X-1 ковариационная матрица генеральной совокупности, из которой извлекаются наблюдения х,,; Л - некоторая симметричная неотрицательно определенная матрица весовых коэффициентов.
Наиболее широко применяется в задачах кластер-анализа для оценки расстояния между отдельными объектами частный случай метрики ре - обычное евклидово расстояние:
Ре( х,, X, ) =
к 2
Z (x,i- x,i) • (12)
l=1
Иерархические агломеративные алгоритмы предназначены в основном для решения задач с неизвестным числом классов, поэтому необходимо построить иерархическое дерево исследуемой совокупности, или дендрограмму.
Основные классификационные процедуры иерархического типа используются в ситуациях, когда на выходе исследователь хочет получить не столько окончательный вариант разбиения анализируемой совокупности объектов на классы, сколько общее наглядное представление о стратификационной структуре этой совокупности (например, в виде специально устроенного графа - дендрограммы).
Принцип работы иерархических агломеративных процедур состоит в последовательном объединении групп элементов самых близких (далеких), а затем более отдаленных друг от друга (приближенных друг к другу). При этом агломеративные алгоритмы начинают обычно с объединения отдельных элементов.
Необходимо учитывать единицу измерения показателей, т. к. в случае разных единиц измерения нужно перейти к нормированию данных путем деления центрированной величины на среднеквадратическое отклонение [3].
В качестве одной из причин неэффективного применения кластерного анализа выделяют мультиколлинеарность. Данный показатель характеризует степень связи линейной зависимости между исходными признаками. В результате действия данного фактора нарушается условие взаимонезависимости исходных признаков и, как следствие, диагональности ковариационной матрицы при расчете расстояния Махаланобиса. На практике о наличии мультиколлинеарности судят по матрице парных коэффициентов корреляции. Если один из элементов матрицы по модулю больше 0,8, то считают, что имеет место мультиколлинеарность. Проблему мультиколлинеарности исходных признаков позволяет также решить проведение кластерного анализа на основе главных компонент, выделенных в ходе факторного анализа, т. к. главные компоненты не коррелированы между собой.
Завершающий этап классификации - ранжирование кластеров по исследуемому качеству. Ранжирование должно дать представление об уровне экономического и социального развития территории в сравнении с другими классами, определить место, занимаемое кластером по исследуемому качеству. При ранжировании кластеров предлагается использовать подход, основанный на сравнении средних по кластерам значений первой главной компоненты, построенных на исходных признаках. Но есть определенное ограничение - значение вариации, объясненной первой главной компонентой, должно быть не ниже 50-55 %.
В противном случае проводится ранжирование на основе средних, построенных на унифицированных значениях показателей. Для перехода из количественной оценки анализируемого качества к унифицированным показателям используется следующая формула:
X/ = Х'~Xmin . (13)
I J , v '
xj XJ
max min
Xj = 1 —X - Xmin . (14)
1 J J
x - x
max min
В результате область возможных значений признака определится отрезком [0; 1].
При этом нулевое значение преобразованного показателя будет означать самое низкое качество
по данному свойству, а единичное - самое высокое. В выражениях (13), (14) x^,ax и х^п -
соответственно наибольшее и наименьшее возможные значения ,-й исходной качественной характеристики. В случае соответствия больших значений показателей более высокому качеству необходимо перейти к нормированию значений (13). Если же, напротив, относительно большие
значения xJ свидетельствуют о плохом качестве, то при переходе к нормированным переменным следует воспользоваться преобразованием (14).
Для отслеживания процесса изменений внутри кластерной структуры во времени проводится построение кластеров по данным за ряд лет и затем - сравнительный анализ.
Результаты исследований
В нашем исследовании с помощью многомерной классификации рассмотрены те показатели, которые наиболее полно представляют социальный уровень жизни населения в районах Астраханской области в 2006-2009 гг.
Классификация проводилась на основе нормированных значений шести показателей, характеризующих уровень социального развития (в расчете на душу населения):
- среднемесячная заработная плата одного работника, руб.;
- коэффициент естественного прироста населения, %;
- численность медицинского персонала, %;
- обеспеченность населения жильем, %;
- количество зарегистрированных преступлений, %;
- уровень официально зарегистрированной безработицы, %.
Целесообразным оказалось выделение от трех до пяти кластеров, для которых уровень развития социальной сферы определяется как «низкий», «ниже среднего», «средний», «выше среднего», «относительно высокий» (далее в тексте и таблицах описание кластеров приводится в порядке увеличения уровня социального развития - от «низкий» до «относительно высокий»).
Результаты классификаций по уровню социального развития (в расчете на одного жителя) по данным за 2006 г. приведены в табл. 1. Оптимальное количество кластеров - 5.
Первый кластер - Енотаевский, Харабалинский районы, уровень социального развития -«низкий»:
- один из самых низких показателей среднемесячной заработной платы;
- один из самых низких показателей естественного прироста;
- низкий показатель уровня обеспеченности населения медицинским персоналом;
- самый низкий показатель обеспеченности населения жильем;
- второе место по уровню преступности населения;
- самый высокий уровень безработицы.
Второй кластер - Камызякский, Володарский и Черноярский районы, уровень социального развития - «ниже среднего»:
- самый низкий показатель среднемесячной заработной платы;
- низкий показатель естественного прироста;
- вторая позиция по обеспеченности населения медицинским персоналом;
- низкий показатель обеспеченности населения жильем;
- четвертое место по уровню преступности населения;
- одно из самых высоких значений уровня безработицы.
Третий кластер - Лиманский, Приволжский и Икрянинский районы, уровень социального развития - «средний»:
- третья позиция по среднемесячной заработной плате;
- убыль населения остается самой низкой на протяжении исследуемого отрезка времени.
- средний уровень обеспеченности населения медицинским персоналом;
- лидер по обеспеченности населения жильем;
- третье место по уровню преступности населения;
- один из самых низких уровней безработицы.
Четвертый кластер - Ахтубинский район, уровень социального развития - «выше среднего»:
- вторая позиция по среднемесячной заработной плате;
- убыль населения остается самой низкой на протяжении исследуемого отрезка времени;
- лидирующая позиция по численности медицинского персонала;
- третье место по обеспеченности населения жильем;
- самый высокий уровень преступности;
- один из самых низких уровней безработицы.
Пятый кластер - Наримановский район, уровень социального развития - «относительно высокий»:
- самый высокий показатель среднемесячной заработной платы;
- единственный кластер, который имеет положительное сальдо естественного прироста;
- самый низкий показатель обеспеченности населения медицинским персоналом;
- вторая позиция по уровню обеспеченности населения жильем;
- самый низкий уровень преступности населения;
- самый низкий уровень безработицы.
Таблица 1
Классификация районов Астраханской области по уровню социального развития по данным за 2006 г. (средние значения в расчете на одного жителя)
Показатель 1 кластер 2 кластер 3 кластер 4 кластер 5 кластер
Среднемесячная заработная плата одного работника, руб. 4 692,0 4 315,0 5 572,5 6 255,0 7 019,0
Уровень естественного прироста, % -0,21 -0,17 -0,14 -0,5 0,04
Численность медицинского персонала, % 0,79 0,81 0,78 1,04 0,26
Обеспеченность населения жильем, % 1,7 1,79 2,1 1,84 1,9
Уровень правонарушений, % 3,2 3,02 3,1 3,25 2,03
Уровень безработицы, % 3,8 2,6 1,8 1,88 1,7
Результаты классификации по уровню социального развития (в расчете на одного жителя) по данным за 2007 г. приведены в табл. 2. Оптимальное количество кластеров - 4.
Первый кластер - Енотаевский, Харабалинский, Володарский и Камызякский районы, уровень социального развития - «низкий»:
- самый низкий показатель среднемесячной заработной платы;
- один из самых низких показателей естественного прироста;
- низкий показатель обеспеченности населения медицинским персоналом;
- самый низкий показатель обеспеченности населения жильем;
- самый высокий уровень преступности населения;
- один из самых высоких показателей уровня безработицы.
Второй кластер - Черноярский район, уровень социального развития - «ниже среднего»:
- один из самых низких показателей уровня среднемесячной заработной платы;
- самый низкий показатель естественного прироста;
- лидер по обеспеченности населения медицинским персоналом;
- вторая позиция по обеспеченности населения жильем;
- третье место по уровню преступности населения;
- самый высокий показатель уровня безработицы;
Третий кластер - Ахтубинский, Лиманский, Приволжский и Икрянинский районы, уровень социального развития - «средний»:
- вторая позиция по среднемесячной заработной плате;
- убыль населения остается самой низкой на протяжении исследуемого отрезка времени;
- средний уровень обеспеченности населения медицинским персоналом;
- лидер по обеспеченности населения жильем;
- второе место по уровню преступности населения;
- самый низкий уровень безработицы.
Четвертый кластер - Наримановский район, уровень социального развития - «относительно высокий»:
- самый высокий показатель среднемесячной заработной платы;
- положительное сальдо естественного прироста;
- самый низкий показатель по уровню обеспеченности населения медицинским персоналом;
- вторая позиция по уровню обеспеченности населения жильем;
- самый низкий уровень преступности населения;
- один из самых низких показателей уровня безработицы.
Таблица 2
Классификация районов Астраханской области по уровню социального развития по данным за 2007 г. (средние значения в расчете на одного жителя)
Показатель 1 кластер 2 кластер 3 кластер 4 кластер
Среднемесячная заработная плата одного работника, руб. 5 256,8 5 921,6 6 921,925 9 072,1
Уровень естественного прироста, % 0,072234 -0,29703 -0,04382 0,222222
Количество медицинского персонала, % 0,788807 0,841584 0,811102 0,251701
Обеспеченность населения жильем, % 1,724843 1,993069 2,076582 1,908163
Уровень правонарушений, % 3,190734 2,475248 2,816227 2,315193
Уровень безработицы, % 3,200456 4,39604 1,53519 2,367347
Результаты классификации по уровню социального развития (в расчете на одного жителя) по данным за 2008 г. приведены в табл. 3. Оптимальное количество кластеров - 3.
Первый кластер - Камызякский, Володарский, Черноярский, Харабалинский и Енотаев-ский районы, уровень социального развития - «ниже среднего»:
- самый низкий показатель среднемесячной заработной платы;
- средний уровень естественного прироста;
- вторая позиция по обеспеченности населения медицинским персоналом;
- самый низкий показатель обеспеченности населения жильем;
- самый высокий уровень преступности;
- самый высокий показатель уровня безработицы.
Второй кластер - Лиманский, Приволжский, Ахтубинский и Икрянинский районы, уровень социального развития - «средний»:
- средний уровень среднемесячной заработной платы;
- кластер, имеющий положительное сальдо естественного прироста, но отстающий по показателю на фоне остальных кластеров;
- самый высокий показатель обеспеченности населения медицинским персоналом;
- самый высокий показатель обеспеченности населения жильем;
- второе место по уровню преступности населения;
- самый низкий уровень безработицы.
Третий кластер - Наримановский район, уровень социального развития - «относительно высокий»:
- самый высокий показатель среднемесячной заработной платы;
- самый высокий уровень естественного прироста;
- вторая позиция по уровню обеспеченности населения жильем;
- самый низкий показатель обеспеченности населения медицинским персоналом;
- самый низкий уровень преступности;
- средний уровень безработицы.
Таблица 3
Классификация районов Астраханской области по уровню социального развития по данным за 2008 г. (средние значения в расчете на одного жителя)
Показатель 1 кластер 2 кластер 3 кластер
Среднемесячная заработная плата одного работника, руб. 7 017,44 8 814,62 11 996,0
Уровень естественного прироста, % 0,11 0,03 0,21
Численность медицинского персонала, % 0,8 0,81 0,28
Обеспеченность населения жильем, % 1,8 2,08 1,93
Уровень правонарушений, % 3,0 2,97 2,3
Уровень безработицы, % 2,1 0,9 1,5
Результаты классификации по уровню социального развития (в расчете на одного жителя) по данным за 2009 г. приведены в табл. 4. Оптимальное количество кластеров - 3.
Первый кластер - Камызякский, Володарский, Черноярский, Харабалинский, Икрянин-ский и Енотаевский районы, уровень социального развития - «ниже среднего»:
- самый низкий показатель среднемесячной заработной платы;
- самый низкий уровень естественного прироста;
- лидер по обеспеченности населения медицинским персоналом;
- самый низкий показатель обеспеченности населения жильем;
- самый высокий уровень преступности;
- самый высокий показатель уровня безработицы.
Второй кластер - Лиманский, Приволжский и Ахтубинский районы, уровень социального развития - «средний»:
- средний уровень среднемесячной заработной платы;
- кластер, имеющий положительное сальдо естественного прироста, но отстающий по показателю на фоне остальных кластеров;
- средний показатель обеспеченности населения медицинским персоналом;
- самый высокий показатель обеспеченности населения жильем;
- второе место по уровню преступности населения;
- самый низкий уровень безработицы.
Третий кластер - Наримановский район, уровень социального развития - «относительно высокий»;
- самый высокий показатель среднемесячной заработной платы;
- самый высокий уровень естественного прироста;
- самый низкий показатель обеспеченности населения медицинским персоналом;
- вторая позиция по уровню обеспеченности населения жильем;
- самый низкий уровень преступности;
- средний уровень безработицы.
Таблица 4
Классификация районов Астраханской области по уровню социального развития по данным за 2009 г. (средние значения в расчете на одного жителя)
Показатель 1 кластер 2 кластер 3 кластер
Среднемесячная заработная плата одного работника, руб. 9 101,65 10 770,8 13 842,8
Уровень естественного прироста, % 0,01 0,09 0,1
Численность медицинского персонала, % 0,81 0,8 0,28
Обеспеченность населения жильем, % 1,9 2,1 1,91
Уровень правонарушений, % 3,24 2,8 2,08
Уровень безработицы, % 1,86 0,76 1,72
Далее были проанализированы изменения в составе кластеров. Результаты анализа приведены в табл. 5.
Таблица 5
Изменения в составе кластеров
Уровень развития Г од/район
2006 2007 2008 2009
Енотаевский Енотаевский - -
Харабалинский Харабалинский - -
- Володарский - -
- Камызякский - -
- - Енотаевский Енотаевский
- - Харабалинский Харабалинский
Володарский - Володарский Володарский
Камызякский - Камызякский Камызякский
Черноярский Черноярский Черноярский Черноярский
- - - Икр янинский
Лиманский Лиманский Лиманский Лиманский
Средний Приволжский Приволжский Приволжский Приволжский
Икрянинский Икрянинский Икрянинский -
- Ахтубинский Ахтубинский Ахтубинский
Выше среднего Ахтубинский - - -
Относительно высокий Наримановский Наримановский Наримановский Наримановский
Из табл. 5 следует, что неизменное положение на протяжении четырех лет сохранили: Черноярский район, уровень - «ниже среднего», Лиманский и Приволжский районы, уровень -«средний» и Наримановский район, уровень - «относительно высокий». Позитивные изменения отмечены в Енотаевском, Харабалинском, Володарском и Камызякском районах, уровень социального развития которых в 2008 г. оценивался как «ниже среднего» (в 2006-2007 гг. - «низкий»). Негативные изменения произошли в Икрянинском и Ахтубинском районах. В Икрянин-ском районе в 2006-2008 гг. уровень социального развития района оценивался как «средний», в 2009 г. - уже как «ниже среднего»; в Ахтубинском районе уровень социального развития в 2006 г. оценивался как «выше среднего», а в 2007-2009 гг. - как «средний», что демонстрирует нестабильную обстановку в социальной сфере этих районов.
Заключение
Апробация методики кластерного анализа на примере муниципальных образований Астраханского региона за 2006-2009 гг. позволила определить потребности отдельных районов области в бюджетных ассигнованиях, что позволяет скорректировать величину направляемых в них денежных средств.
Применение методики в различных регионах Российской Федерации будет способствовать повышению эффективности действий органов исполнительной власти различных уровней в процессе регулирования социально-экономического развития общества.
СПИСОК ЛИТЕРАТУРЫ
1. Айвазян С. А., Мхитарян В. С. Прикладная статистика и основы эконометрики: учеб. для вузов. -М.: ЮНИТИ, 1998. - 1022 с.
2. Дубров А. М., Мхитарян В. С., Трошин Л. И. Многомерные статистические методы: учеб. - М.: Финансы и статистика, 1998. - 350 с.
3. КильдишевГ. С., АболенцевЮ. И. Многомерные группировки. - М.: Статистика, 1978. - 160 с.
Статья поступила в редакцию 10.10.2011, в окончательном варианте - 16.12.2011
ИНФОРМАЦИЯ ОБ АВТОРАХ
Эльдяева Альмина Борисовна - Астраханский государственный университет; аспирант кафедры «Бухгалтерский учет, налогообложение и аудит»; [email protected].
Eldyaeva Almina Borisovna - Astrakhan State University; Postgraduate Student of the Department "Book Keeping, the Taxation and Audit"; [email protected].
Салахова Эльмира Камильбековна - Астраханский государственный технический университет; канд. экон. наук, доцент; доцент кафедры «Бухгалтерский учет, анализ хозяйственной деятельности и аудит»; [email protected].
Salakhova Elmira Kamilbekovna - Astrakhan State Technical University; Candidate of Economic Science, Assistant Professor; Assistant Professor of the Department "Accounting, Business Analysis and Audit"; [email protected].