ЭКОНОМИКА И УПРАВЛЕНИЕ КАЧЕСТВОМ
УДК 338.001.36
Г. И. МАНСУРОВА, П. М. МАНСУРОВ
ПРИМЕНЕНИЕ МЕТОДА КЛАСТЕРНОГО АНАЛИЗА
ПРИ ОЦЕНКЕ УРОВНЯ РАЗВИТИЯ СЕЛЬСКОЙ СОЦИАЛЬНОЙ
ИНФРАСТРУКТУРЫ (НА ПРИМЕРЕ УЛЬЯНОВСКОЙ ОБЛАСТИ)
Рассматривается возможность применения процедуры иерархического кластерного анализа с целью разбиения муниципальных районов на однородные группы по ряду показателей, характеризующих развитие сельской социальной инфраструктуры. Приводятся результаты применения этой методики на примере муниципальных образований Ульяновской области.
Ключевые слова: методика анализа социальной инфраструктуры, сельская социальная инфраструктура, социальная инфраструктура, оценка социальной инфраструктуры села, показатели социальной инфраструктуры села; иерархический кластерный анализ, группировка.
Социальная инфраструктура села - подсистема материальных и духовных средств жизнеобеспечения сельских жителей, способствующая удовлетворению социальных запросов и воспроизводству населения, опосредованно воздействующая на процесс аграрного производства.
Социальная инфраструктура села представляет собой искусственную среду, созданную человеком, обеспечивающую функционирование сферы социального обслуживания, и включает в себя объекты образования, культуры, здравоохранения, быта, коммуникаций и др.
Для правильной организации работы социальной инфраструктуры необходима выработка методики и системы показателей, характеризующих объём и уровень обеспеченности населения объектами социальной инфраструктуры. В качестве методологической базы для её анализа чаще всего используются общие статистические показатели, расчётные статистические показатели, социальные нормативы и ориентиры, социальные оценки.
Однако при исследовании социальной инфраструктуры одной из основных проблем выступает неоднородность обрабатываемой информации.
Кроме того, анализ состояния и уровня развития социальной инфраструктуры на межрайонном и внутрирайонных уровнях усложняется ещё и тем, что разные административные районы и даже хозяйства отличаются между собой по природно-географическим и почвенным
© Мансурова Г. И., Мансуров П. М., 2014
условиям, а это, в свою очередь, влияет на формирование и развитие объектов социальной инфраструктуры. Ещё большее влияние оказывает степень экономической развития района, уровень эффективности работы отдельно взятых хозяйств и их возможностей вкладывать средства в поддержание функционирования и развитие объектов инфраструктуры.
При анализе и прогнозировании социально-экономических явлений довольно часто сталкиваются с многомерностью их описания, что вызывает необходимость в применении методов многомерного статистического анализа.
Методы многомерного анализа - наиболее действенный количественный инструмент исследования социально-экономических процессов, описываемых большим числом характеристик. К ним относятся факторный анализ, кластерный анализ и др.
Кластерный анализ является аналогом факторного анализа в том смысле, что он также, как и факторный, позволяет выделить факторы (кластеры), объединяющие статистически схожие переменные. Однако в данном случае переменные классифицируются не на основании степени тесноты корреляционной связи, а на основании более сложных статистических процедур (расстояния между переменными в кластерах).
Первое применение кластерный анализ нашёл в социологии. Название «кластерный анализ» происходит от английского слова cluster -гроздь, скопление. Впервые в 1939 г. был определён предмет кластерного анализа и сделано его описание исследователем Трионом. Главное назначение кластерного анализа - разбиение
множества исследуемых объектов и признаков на однородные в соответствующем понимании группы, или кластеры. Это означает, что решается задача классификации данных и выявления соответствующей структуры в ней. Методы кластерного анализа можно применять в самых различных случаях, даже в тех случаях, когда речь идёт о простой группировке, в которой всё сводится к образованию групп по количественному сходству.
Большое достоинство кластерного анализа в том, что он позволяет производить разбиение объектов не по одному параметру, а по целому набору признаков. Кроме того, кластерный анализ в отличие от большинства математико-статистических методов не накладывает никаких ограничений на вид рассматриваемых объектов, и позволяет рассматривать множество исходных данных практически произвольной природы. Это имеет большое значение, когда показатели имеют разнообразный вид, затрудняющий применение традиционных эконометрических подходов.
Кластерный анализ позволяет рассматривать достаточно большой объём информации и резко сокращать, сжимать большие массивы социально-экономической информации, делать их компактными и наглядными.
Как и любой другой метод, кластерный анализ имеет определённые недостатки и ограничения. В частности, состав и количество кластеров зависит от выбираемых критериев разбиения. При сведении исходного массива данных к более компактному виду могут возникать определённые искажения, а также могут теряться индивидуальные черты отдельных объектов за счёт замены их характеристиками обобщённых значений параметров кластера.
Цель исследования заключалась в апробации возможности применения методов кластерного анализа при дифференциации муниципальных образований по показателям развития сельской социальной инфраструктуры. В задачи исследования входило построение кластерной модели положения муниципальных районов с выделением групп районов, имеющих схожую, однородную обстановку по показателям развития социальной инфраструктуры.
Для проведения кластерного анализа были использованы данные из сборника Госкомстата «Социальное и экономическое положение муниципальных районов и городских округов Ульяновской области в 2012 году» [1].
Кластерный анализ проведён по 21 муниципальному району Ульяновской области, каждый из которых оценивался 26 показателями, характеризующими развитие сельской социальной
инфраструктуры:
1) обеспеченность населения жильём, м2/чел.;
2) число больничных (амбулаторно-поликлинических) учреждений в расчёте на 10 тыс. населения, ед./10 тыс. чел.;
3) число фельдшерско-акушерских пунктов в расчёте на 10 тыс. населения, ед./10 тыс. чел.;
4) число больничных коек в расчёте на 10 000 населения, ед./10 тыс. чел.;
5) численность врачей в расчёте на 10 000 населения, чел./10 тыс. чел.;
6) охват детей дошкольными образовательными учреждениями в процентах к числу детей дошкольного возраста, %;
7) число детей в дошкольных образовательных учреждениях в расчёте на 100 мест, чел./100
ед.;
8) обеспеченность детей школьного возраста государственными дневными общеобразовательными учреждениями, ед./тыс. чел.;
9) число домашних телефонов на 10 тыс. человек населения, ед./10 тыс. чел.;
10) число учреждений культурно-досугового типа в расчёте на 10 000 населения, ед./10 тыс. чел.;
11) число библиотек на 1 тыс. населения, ед./тыс. чел.;
12) число музеев в расчёте на 1 тыс. населения, ед./тыс. чел.;
13) число спортивных сооружений на 10 тыс. населения, ед./10 тыс. чел.;
14) число стадионов в расчёте на 10 тыс. населения, ед./10 тыс. чел.;
15) удельный вес общей площади, оборудованной водопроводом, %;
16) удельный вес общей площади, оборудованной канализацией, %;
17) удельный вес общей площади, оборудованной отоплением, %;
18) удельный вес общей площади, оборудованной газом, %;
19) обеспеченность дорогами общего пользования с твёрдым покрытием, км/ 100 км2;
20) ввод в действие жилых домов, тыс. м2;
21) ввод в действие квартир на 1 тыс. населения, ед./тыс. чел.;
22) увеличение мощности амбулаторно-поликлинических учреждений, посещений в смену;
23) замена и ремонт водопроводных сетей, км;
24) замена и ремонт газовых сетей, км;
25) замена и ремонт тепловых сетей, км;
26) число киноустановок на 10 тыс. населения, ед./10 тыс. чел.
Таблица 1
Обзорная таблица порядка агломерации
Шаги агломерации
Этап Кластер объединён с Коэффициенты Этап первого появления кластера Следующий
этап
Кластер 1 Кластер 2 Кластер 1 Кластер 2
1 1 5 561,297 0 0 2
2 10 20 865,208 1 0 7
3 8 11 1013,382 0 0 10
4 3 13 1091,719 0 0 6
5 8 21 1401,027 0 0 8
6 1 18 1414,417 4 0 10
7 3 14 1861,401 2 0 9
8 1 6 2183,649 5 0 11
9 8 10 2316,750 7 0 12
10 3 16 2704,051 6 3 15
11 1 7 2714,642 8 0 14
12 1 4 3441,480 9 0 13
13 1 3 3732,016 12 0 14
14 1 8 4852,185 13 11 15
15 12 15 5495,189 14 10 17
16 1 17 7729,160 0 0 18
17 1 12 8919,651 15 0 18
18 1 2 10270,835 17 16 19
19 1 19 15689,663 18 0 20
20 19135,816 19 0 0
Таблица 2
Принадлежность районов Ульяновской области к кластерам
Наблюдение 8 кластеров 7 кластеров 6 кластеров 5 кластеров 4 кластеров
Барышский 2 2 2 2 2
Вешкаймский 3 1 1 1 1
Инзенский 1 1 1 1 1
Карсунский 1 1 1 1 1
Кузоватовский 1 1 1 1 1
Майнский 1 1 1 1 1
Мелекесский 4 3 1 1 1
Николаевский 1 1 1 1 1
Новомалыклинский 4 3 1 1 1
Новоспасский 4 3 1 1 1
Павловский 5 4
Радищевский 3 1 1 1 1
Сенгилеевский 3 1 1 1 1
Старокулаткинский 6 5
Старомайнский 3 1 1 1 1
Сурский 7 6 1
Тереньгульский 1 1 1 1 1
Ульяновский 8 7
Цильнинский 4 3 1 1 1
Чердаклинский 4 3 1 1 1
Для работы с базой данных и проведения кластерного анализа использовался статистический
пакет SPSS 20.0 для Windows [2]. Для обработки в статистическом пакете информация была организована в особом виде: матрица данных.
С помощью возможностей SPSS была получена обзорная таблица порядка агломерации (таблица 1).
В иерархических методах каждое наблюдение образовывает сначала свой отдельный кластер. На первом шаге два соседних кластера объединяются в один; этот процесс может продолжаться до тех пор, пока не останутся только два кластера.
После обычной общей статической сводки итогов по наблюдениям в таблице 1 сначала приводится обзор принадлежности, из которого можно выяснить очерёдность построения кластеров. Так, можно увидеть, что на первом шаге были объединены Базарносызганский и Карсунский районы. Эти два района максимально похожи и отдалены друг от друга на очень малое расстояние.
На следующем шаге происходит объединение Базарносызганского и Николаевского районов, затем Новомалыклинского и Цильнинского и т. д.
По данным таблицы 1 можно также определить оптимальное количество кластеров. Для этого решающее значение имеет расстояние между двумя кластерами. На том этапе, где эта мера расстояния увеличивается скачкообразно,
процесс объединения в новые кластеры следует остановить, так как будут объединены кластеры, находящиеся на относительно большом расстоянии друг от друга.
Значительный скачок коэффициента наблюдается после 17 шага, это означает, что для данных, включающих 21 наблюдение, оптимальным является решение с четырьмя кластерами.
Далее приводится таблица с информацией о принадлежности каждого района к одному из 8, 7, 6, 5 и 4 кластеров по отдельности.
Таблица показывает, что Ульяновский и Ба-рышский районы значительно отличаются от остальных районов области и образуют обособленные кластеры. При переходе к 7-кластерному решению Вешкаймский, Радищевский, Сенгиле-евский и Старомайнский районы, объединённые ранее в кластер 3, были включены в кластер 1, как соседствующие. Дальнейшее сжатие приводит к переходу в кластер 1 также Мелекесского, Новомалыклинского, Новоспасского, Цильнинского и Чердаклинского районов. И при переходе на 4-кластерное решение к кластеру 1 присоединяется Сурский район.
Дендрограмма (график объединения) визуализирует описанный процесс слияния. Она идентифицирует объединённые кластеры и значения коэффициентов на каждом шаге (рис. 1).
Дендрограмма с использованием метода межгрупповых
связей
Объединение кластеров по масштабированному расстоянию
О 5 10 15 20 25 _I_I_I_I_I_
1 Базарносызганский 1
5 Карсунский 5
9 Николаевский 9
18 Тереньг/льский 18
6 Куэо в это в ский 6
7 Майнский
4 Инзенский 4
3 Вешкаймский 3
13 Ради ще в ский 13
14 Сенгмлеевский 14 >- 16 Старомайнский 16
10 Новомалыклинский 10
20 Цильнинский 20 3 Мелекесский
11 Новоспасский 11
21 Чердаклинский 21 17 Сурский 17
12 Павловский 1 2
15 Старокулаткинский 1 5
2 Барышский 2
19 Ульяновский 19
Рис. 1. Дендрограмма многомерной группировки районов Ульяновской области по факторным показателям Таким образом, по результатам кластериза- ции были получены один крупный кластер (1),
включающий 17 районов, один маленький кластер (3), два очень маленьких (2) и (4), представленные одним районом (таблица 3).
Разбивка муниципальных районов Ульяновской области по кластерам наглядно представле-
на на карте (рис. 2).
Применение кластерного анализа позволяет выделить группы районов с низким (слабым), средним и сильным уровнем развития сельской социальной инфраструктуры.
Таблица 3
Распределение районов Ульяновской области по кластерам
Кластер Кол-во районов Состав
1 17 Базарносызганский, Вешкаймский, Инзенский, Карсунский, Кузоватовский, Майн-ский, Мелекесский, Николаевский, Новомалыклинский, Новоспасский, Радищевский, Сенгилеевский, Старомайнский, Сурский, Тереньгульский, Цильнинский, Чердаклин-ский
2 1 Барышский
3 2 Павловский, Старокулаткинский
4 1 Ульяновский
Рис. 2. Карта муниципальных районов Ульяновской области, основанная на объединении результатов кластеризации по показателям развития сельской социальной инфраструктуры Четвёртый кластер, представленный одним Ульяновским районом, занимает особое место.
Он характеризуется наилучшими показателями по многим факторам. В частности, удельный вес общей площади, оборудованной водопроводом, канализацией, отоплением, имеет значительное отличие от других кластеров. Огромный отрыв, более чем в три раза, наблюдается ещё по ряду показателей: ввод в действие жилых домов, квартир, увеличение мощности амбулаторно-поликлинических учреждений, замена и ремонт водопроводных сетей. Обеспеченность дорогами с твёрдым покрытием в два раза больше, чем в районах, представляющих другие кластеры. Резкий скачок по этим показателям объясняется тем, что Ульяновский район находится в непосредственной близости от областного центра. Этим можно объяснить, что показатель количество детей в ДОУ в расчёте на 100 мест также самый высокий - 108 детей. И, как ни странно, этим же можно объяснить наименьшее число домашних телефонов в расчёте на 10 тыс. чел. (149 по сравнению с максимальным значением 248 в других кластерах), так как основное количество операторов мобильной связи сосредоточено в областном центра (г. Ульяновск). Предлагаемые ими тарифные планы зачастую намного выгоднее абонентской платы за стационарную связь. Таким образом, можно сделать вывод, что четвёртый кластер наиболее сильный с точки зрения уровня развития сельской социальной инфраструктуры.
Отстают по многим показателям и имеют наименьшее значение районы, составляющие третий кластер - Павловский и Старокулаткин-ский. Но здесь наибольший процент охвата детей ДОУ (64%). Объяснить этот факт достаточно просто, в данном кластере число детей в ДОУ на 100 мест минимальное по сравнению с прочими и составляет всего 67 чел. Со значительным отрывом районы этого кластера лидируют по показателю числа спортивных сооружений на 10 тыс. чел. населения, который составляет почти 47 ед. Для сравнения, следующие по величине значения этого показателя в другом кластере - 28 ед. Наличие такой разницы объясняется тем, что районы этого кластера являются самыми удалёнными от областного центра, и долгое время финансирование спортивных объектов и создание новых имело одно из последних значений. Но с изменением политики областного правительства в направлении привлечения населения, а особенно молодёжи удалённых от областного центра районов к занятиям спортом, ситуация изменилась кардинально. Это позволяет сделать вывод, что третий кластер является наиболее слабым по уровню развития сельской социальной инфраструктуры.
В состав второго кластера, так же как и в первый кластер, входит один район - Барышский, характеризующийся тем, что имеет примерно равное количество максимальных и минимальных значений показателей. Это кластер превосходит остальные по числу больничных коек почти в три раза, имеет самый высокий уровень телефонизации, лидирует по числу стадионов, а также наиболее газифицирован (98%). Однако удельный вес общей площади оборудованной отоплением, составляет всего 31%, в то время как в других кластерах значение этого показателя колеблется от 50 до 95%. Кроме того, этот кластер самый отстающий по числу спортивных сооружений на 10 тыс. населения, а также это единственный кластер, не имеющий музеев. В целом, второй кластер является противоречивым, поэтому его невозможно однозначно классифицировать.
Первый кластер представлен многочисленной группой районов, имеющих среднестатистические значения практически по всем показателям. Исключение составляют уровень обеспеченности населения жильём и число киноустановок на 10 000 человек населения, здесь эти значения самые высокие из всех четырёх анализируемых кластеров. Показателей с наименьшими значениями также два - это обеспеченность дорогами общего пользования с твёрдым покрытием и замена и ремонт водопроводных сетей.
С помощью кластерного анализа были получены средние значения 26 показателей по четырём кластерам. Распределение средних значений наиболее значимых факторных показателей развития сельской социальной инфраструктуры по кластерам представлено на рисунке 3.
Представленная диаграмма наглядно демонстрирует уровень наиболее значимых показателей, по которым была проведена группировка муниципальных районов Ульяновской области в соответствующие кластеры.
Диаграмма ещё раз подтверждает, что четвёртый кластер является самым сильным по уровню развития сельской социальной инфраструктуры, самым слабым кластером является третий, и первый кластер занимает среднюю позицию.
Таким образом, описанная процедура кластерного анализа имеет практическое значение, заключающееся в необходимости разработки и применении дифференцированного подхода к формированию механизма регулирования сельской социальной инфраструктуры, предполагающая необходимость первоочередных инвестиций в социальную сферу в тех районах, где она находится в кризисном состоянии.
1 кластер
2 кластер
3 кластер
4 кластер
I Обеспеченностьжильем ■ Оборудованность канализацией
I Охват детей ДОУ ■ Оборудован ность газом
- :"::"::" :-:■ :::: ' Ввод в действие жилых домов
ЧисленностьБрачей ■ Оборудованной отоплением
Число детей в ДОУ ■ Обеспеченность дорогами с твердым покрытием
Оборудованное^ водопроводом ■ Замена и ремонт водопроводным сетей
Рис. 3. Распределение средних значений показателей по кластерам
БИБЛИОГРАФИЧЕСКИМ СПИСОК
1. Социальное и экономическое положение муниципальных районов и городских округов Ульяновской области в 2012 году: статистический сборник. - Ульяновск : Ульяновскстат, 2013. - 130 с.
2. Мансуров, П. М. Статистический анализ показателей, влияющих на развитие сельской социальной инфраструктуры Ульяновской области / Мансуров П. М. // Современные проблемы науки и образования. - 2012. - №2. - С. 290.
3. Мансуров, П. М. Дифференциация муниципальных образований по уровню развития сельской социальной инфраструктуры методом кластеризации / Мансуров П. М. // Экономика сельскохозяйственных и перерабатывающих предприятий. - 2012. - №11. - С. 39-43.
4. Мансуров, П. М. Влияние уровня развития социальной инфраструктуры на демографическое состояние в сельских муниципальных образованиях Ульяновской области / Мансуров П. М. // Региональная экономика: теория и практика. -2012. - №32. - С. 42-45.
Мансурова Гелия Ильфаровна, кандидат экономических наук, доцент кафедры «Бухгалтерский учёт, анализ и аудит», Ульяновский государственный технический университет. Мансуров Павел Михайлович, кандидат экономических наук, доцент кафедры «Бухгалтерский учёт, анализ и аудит», Ульяновский государственный технический университет.