МЕТОДИКА ОЦЕНКИ ДИФФЕРЕНЦИАЦИИ СУБЪЕКТОВ РОССИЙСКОЙ ФЕДЕРАЦИИ ПО УРОВНЮ ЭКОНОМИЧЕСКОГО РАЗВИТИЯ (на основе оптимизационного нечеткого c-means алгоритма Беждека-Данна)
С. а. полтавский
Ульяновский государственный университет
Особое значение ученые-регионалисты придают решению проблемы адекватного отражения дифференциации субъектов РФ по уровню экономического развития. Сегодня в научной литературе можно встретить несколько десятков альтернативных методик, каждая из которых имеет свои специфические характеристики, благодаря которым она образует совокупность отличительных признаков и приобретает свою уникальность. В качестве методологической базы подобных разработок выступают результаты исследований зарубежных и отечественных ученых-статистиков. Большинство признанных на сегодняшний день методов оценки дифференциации субъектов РФ по уровню экономического развития основываются на положениях таких разделов прикладной статистики, как сравнительный анализ, кластер-анализ, снижение размерности анализируемого признакового пространства и отбор наиболее информативных показателей (метод главных компонент, модели и методы факторного анализа, экспертно-статис-тический метод построения единого показателя, многомерное шкалирование).
Методология сравнительного анализа положена в основу широкого круга методов оценки дифференциации социально-экономического положения субъектов РФ. Как правило, такие методики используют результаты индикативного анализа для построения рейтингов (комплексных оценок) регионального развития. К их числу относятся методики Министерства экономического развития и торговли РФ [7], Совета по изучению производительных сил МЭРТ и РАН [8, с. 106—113], Института социально-экономических и энергетических проблем Севера Коми НЦ РАН [4], Института экономики Карельского НЦ РАН, Новосибирского
ИЭ и ОПП СО РАН [9], ученых-регионалистов субъектов Федерации — Вологодской области [6, с. 61—63] и др.
Инструмент кластер-анализа, при организации наблюдаемых данных в наглядные структуры, реализуется в разработках И. Б. Данилова, В. Арсе-евой [3, с. 32—38], Ю. В. Донченко, А. В. Евченко, С. С. Железнякова [5, с. 56—61], О.А. Хохловой [10, с. 58—65], С. Г. Бычковой [2, с. 24—28] и др.
Кроме того, в научной литературе, посвященной данной проблематике, встречаются подходы к выявлению дифференциации социально-экономического положения субъектов РФ на основе методик многомерного шкалирования. Среди ряда таких методик наиболее разработанными являются методика многомерных ранжировок (Т. С. Новиковой — С. А. Суспи-цына) и методика многомерных непараметрических оценок (В. М. Рябцева — Г. И. Чудилина).
Синтез возможностей различных разделов прикладной статистики в едином методе оценки дифференциации социально-экономического положения субъектов РФ, представляет собой магистральное направление совершенствования. Новейшей методикой в этом направлении является разработанная С. В. Барановым методика построения рейтингов социально-экономического развития регионов, основанная на методе главных компонент и использовании статистики Т2-Хоттелинга [1].
Совокупность перечисленных методик позволяет оценить дифференциацию социально-экономического развития по широкому кругу показателей. Таким образом, становится возможным построение упорядоченных оценок, характеризующих сравнительное положение регионов. Для получения информации о дифференциации социально-экономического положения субъектов
РФ по отдельным показателям в региональном анализе применяют ряд специальных методов на основе использования фундаментальных разработок в области исследования экономического неравенства. Наибольший вклад в развитие данного направления исследования дифференциации социально-экономического развития регионов внесли зарубежные исследователи J. G. Williamson [16], H. Theil [15], R. J. Barro, X. Sala-i-Martin [14] и др.
Основным недостатком настоящих методов оценки дифференциации социально-экономического развития субъектов РФ, по нашему мнению, является требование однозначной классификации, при котором субъект РФ принадлежит к одному и только одному классу, и не существует субъектов РФ, не вошедших ни в один класс. В действительности, в том числе и в региональном экономическом анализе, имеющем дело с плохо определенными структурами, требование четкой, однозначной классификации является чрезмерно жестким. Это обусловливается размытостью реальных классов по своей природе. Так, вполне возможно, что субъект РФ имеет приблизительно равное сходство с представителями нескольких классов. Действительно, практика показывает, что переход от принадлежности к непринадлежности субъектов Федерации к какому-либо классу является постепенным, а не скачкообразным. Следовательно, четкая классификация как грубое отражение действительности является искаженной. В результате разрабатываемые федеральные, региональные и муниципальные программы экономического развития являются неоптимальными, что приводит к возникновению многочисленных неоправданных издержек. В сложившихся условиях единственно корректно обоснованным решением является разбиение исходного множества исследуемых субъектов Федерации на некоторое число размытых кластеров, что не представляется возможным в рамках обозначенных методов. Поэтому существует острая необходимость разработки методов получения размытых кластеров и использование их в практике регионального анализа, в том числе и для оценки дифференциации экономического положения субъектов РФ. В настоящей работе предлагается решение данной задачи, что восполняет существующий пробел в соответствующих исследованиях.
Максимальной эффективности при разработке таких методов, по нашему мнению, можно добиться, основываясь на достижениях нечисловой статистики, являющейся сердцевиной современной прикладной статистики, в частности
на теории нечетких множеств (fuzzy set), которая была разработана в 1965 г. американским ученым L. A. Zadeh. Попытку решения задачи кластер-анализа с помощью потенциала теории нечетких множеств впервые предпринял Е. Руслини. Однако получить алгоритм нечеткой классификации смог лишь J. Bezdek в 1981 г. Данная разработка значительно продвинула вперед применение нечеткого подхода в задачах кластеризации.
За последнее десятилетие наблюдается существенный рост интереса специалистов различного профиля к теории нечетких множеств, результатом которого являются многочисленные теоретические и практические разработки, отражение которых можно найти в научных статьях, журналах и книгах. Однако в целях оценки дифференциации экономического развития регионов эти разработки никогда ранее не применялись. Вместе с тем использование методов нечеткой классификации по сравнению с четкими, по нашему мнению, позволит достичь следующих результатов. Во-первых, становится возможным получение более обоснованной классификации субъектов РФ по уровню экономического развития. Полученная таким образом классификация позволит разработать более эффективную экономическую политику на федеральном, региональном и муниципальном уровнях. Также становится возможной разработка обоснованной выравнивающей политики. Во-вторых, становится возможным выделение «полос размыва» между кластерами, т. е. получения информации, на основании которой можно сделать вывод о том, что какой-либо субъект РФ не может быть отнесен ни к одному из кластеров. Числовые значения степеней принадлежности такого субъекта к различным кластерам позволят выяснить, с представителями какого кластера имеется наибольшее сходство. В-третьих, результаты нечеткой классификации позволяют выявить группу субъектов РФ, «остро нуждающихся» в государственной (региональной, муниципальной) поддержке. В-четвертых, на основании результатов нечеткой классификации может быть получена четкая классификация, получение же нечеткой классификации на основании имеющейся четкой принципиально невозможно.
В настоящем исследовании для выявления дифференциации субъектов РФ по уровню экономического развития предлагается использовать оптимизационный нечеткий c-means алгоритм Беждека—Данна (fuzzy ISODATA algorithm, FCM algorithm), подробное описание которого можно найти в [11—14].
Для апробации настоящего алгоритма, положенного в основу предлагаемой методики оценки дифференциации, проведем экспериментальные расчеты по основным экономическим показателям, собираемым Федеральной службой государственной статистики по 79 субъектам РФ за 2004г. Из анализа исключим автономные округа в силу того, что они структурно являются частями соответствующих краев и областей и Чеченскую Республику из-за отсутствия данных.
Следует отметить, что в рамках настоящей работы не ставилась цель разработки наиболее точной системы показателей. Поэтому приведенная система экономических показателей может существенно меняться или дополняться в зависимости от потребностей конкретного прикладного исследования.
При обозначении ВРП на душу населения — х1, индекса промышленного производства — х2, инвестиций в основной капитал на душу населения — х3, среднедушевых денежных доходов населения — х4, среднедушевых денежных расходов и сбережений населения — х5, среднемесячной номинальной начисленной заработной платы работающих в экономике — х6, а самих субъектов РФ — символами х,, где символ i соответствует номеру субъекта РФ, i = 1,...,79 , и нормировке получившихся данных
по формуле х' = ху , получается матрица
/ max Xi
Xmxn = [xi] , где i = 1,...,79 , t = 1,...,6 («объект-признак»). При ее транспонировании она может быть представлена табл. 1.
При таком подходе каждый объект х,, i = 1,...,79 , представляя собой точку в шестимерном пространстве признаков, может быть интерпретирован как нечеткое множество на универсуме х', t = 1,...,6 признаков, так что каждое значение х', i = 1,...,79 , t = 1,..., 6 может быть представлено в виде функции принадлежности цх (х'), которая показывает степень выраженности t-го признака у i-го объекта.
Для получения нечеткого разбиения используем Fuzzy Logic Toolbox — пакет прикладных программ входящих в состав среды Matlab. Результаты экспериментальных расчетов для 2, 3, 4, 5, 6 и 11 кластеров представим на линейных диаграммах (рис. 1—6).
Прежде чем перейти к содержательной интерпретации полученных результатов, оценим получившиеся разбиения и выберем из них наиболее оптимальное.
Оценим качество полученной нечеткой классификации с помощью коэффициента разбиения Fc (P) и энтропии разбиения Hc (P). Результаты расчета настоящих показателей представлены в табл. 2.
Таблица 1
Матрица нормированных данных
Объект Признак
х1 х2 х3 х4 х5 х6
х1 0,145 0,866 0,061 0,200 0,173 0,259
х2 0,098 0,847 0,029 0,186 0,167 0,192
хз 0,122 0,872 0,041 0,169 0,161 0,233
х4 0,122 0,861 0,050 0,202 0,188 0,205
х5 0,087 0,848 0,027 0,136 0,135 0,188
хб 0,142 0,874 0,054 0,198 0,195 0,260
х7 0,124 0,870 0,048 0,184 0,168 0,224
х8 0,134 0,952 0,050 0,200 0,173 0,230
х9 0,224 0,861 0,085 0,212 0,177 0,254
х10 0,186 0,970 0,095 0,263 0,263 0,352
х11 0,148 0,893 0,042 0,192 0,172 0,206
х12 0,150 0,842 0,047 0,197 0,178 0,233
х13 0,137 0,866 0,066 0,221 0,202 0,242
х14 0,120 0,860 0,042 0,203 0,160 0,191
х15 0,140 0,882 0,091 0,180 0,158 0,247
х16 0,128 0,831 0,049 0,201 0,168 0,244
х17 0,211 0,836 0,079 0,254 0,216 0,287
х18 0,645 0,909 0,155 1,000 1,000 0,499
х19 0,185 0,819 0,084 0,293 0,233 0,330
х20 0,309 0,842 0,151 0,444 0,354 0,457
х21 0,223 0,985 0,129 0,287 0,234 0,361
х22 0,249 0,849 0,087 0,262 0,227 0,318
х23 0,148 0,935 0,086 0,226 0,219 0,275
х24 0,219 0,992 0,179 0,181 0,159 0,316
х25 0,253 0,836 0,089 0,424 0,341 0,501
х26 0,156 0,862 0,078 0,221 0,196 0,254
х27 0,111 0,854 0,045 0,211 0,190 0,218
х28 0,258 0,871 0,144 0,407 0,386 0,374
х29 0,063 0,897 0,034 0,151 0,112 0,192
хзо 0,058 0,865 0,025 0,126 0,100 0,139
хз1 0,028 0,699 0,011 0,083 0,030 0,207
х32 0,082 0,823 0,037 0,153 0,124 0,167
хзз 0,090 0,876 0,050 0,125 0,070 0,171
х34 0,075 0,895 0,034 0,156 0,113 0,178
х35 0,081 0,873 0,030 0,154 0,133 0,162
хзб 0,148 0,861 0,091 0,218 0,226 0,234
х37 0,111 0,914 0,049 0,183 0,203 0,203
х38 0,149 0,859 0,107 0,230 0,203 0,257
х39 0,141 0,851 0,049 0,226 0,206 0,231
х40 0,115 0,850 0,054 0,239 0,228 0,220
х41 0,187 0,876 0,080 0,247 0,206 0,258
х42 0,093 0,929 0,036 0,130 0,113 0,180
х43 0,115 1,000 0,060 0,162 0,118 0,188
х44 0,232 0,865 0,112 0,254 0,222 0,262
х45 0,172 0,874 0,050 0,184 0,160 0,252
х46 0,105 0,877 0,050 0,163 0,147 0,186
х47 0,115 0,805 0,030 0,184 0,169 0,211
х48 0,175 0,871 0,064 0,238 0,217 0,244
х49 0,159 0,957 0,058 0,186 0,146 0,226
х50 0,094 0,882 0,036 0,164 0,159 0,201
х51 0,228 0,871 0,085 0,312 0,271 0,306
х52 0,234 0,861 0,086 0,344 0,340 0,298
х53 0,136 0,895 0,047 0,198 0,165 0,200
х54 0,117 0,865 0,030 0,182 0,162 0,210
Окончание табл. 1
1.2
Л о.б
&0.4 л
5 0.2 -5
о
Объект Признак
X1 X2 X3 X4 X5 X6
Х55 0,106 0,856 0,035 0,170 0,147 0,212
Х56 0,193 0,888 0,072 0,314 0,302 0,325
Х57 1,000 0,900 0,639 0,627 0,446 0,844
Х58 0,176 0,890 0,061 0,238 0,204 0,280
Х59 0,105 0,770 0,035 0,171 0,105 0,221
Х60 0,131 0,897 0,062 0,229 0,203 0,290
Х61 0,074 0,873 0,016 0,171 0,089 0,272
Х62 0,148 0,878 0,045 0,224 0,207 0,293
Х63 0,096 0,884 0,031 0,172 0,153 0,182
Х64 0,263 0,867 0,076 0,327 0,280 0,427
Х65 0,189 0,841 0,052 0,270 0,230 0,355
Х66 0,163 0,872 0,059 0,292 0,231 0,305
Х67 0,172 0,897 0,050 0,231 0,268 0,268
Х68 0,167 0,899 0,055 0,268 0,256 0,256
Х69 0,273 0,938 0,134 0,321 0,263 0,387
Х70 0,133 0,897 0,060 0,239 0,204 0,315
Х71 0,385 0,834 0,192 0,490 0,375 0,561
Х72 0,165 0,869 0,044 0,252 0,263 0,335
Х73 0,235 0,892 0,105 0,369 0,341 0,427
Х74 0,168 0,871 0,122 0,229 0,219 0,343
Х75 0,226 0,885 0,114 0,422 0,351 0,598
Х76 0,350 0,765 0,112 0,486 0,386 0,543
Х77 0,342 0,836 0,291 0,456 0,374 0,540
Х78 0,124 0,906 0,045 0,241 0,196 0,313
Х79 0,965 0,849 1,000 0,812 0,569 1,000
* ■ . 1
*
20
40
60
100
О&ьект
> Кластер 1 ■ Кластер 2 |
Рис. 1. Линейная диаграмма нечеткого разбиения субъектов РФ по уровню экономического развития на два кластера
Рис. 3. Линейная диаграмма нечеткого разбиения субъектов РФ по уровню экономического развития на четыре кластера
Рис. 4. Линейная диаграмма нечеткого разбиения субъектов РФ по уровню экономического развития на пять кластеров
Рис. 5. Линейная диаграмма нечеткого разбиения субъектов РФ по уровню экономического развития на шесть кластеров
Рис. 2. Линейная диаграмма нечеткого разбиения субъектов РФ по уровню экономического развития на три кластера
Рис. 6. Линейная диаграмма нечеткого разбиения субъектов РФ по уровню экономического развития на одиннадцать кластеров
Таблица 2
Значения показателей качества разбиения при обработке исследуемой совокупности объектов оптимизационным алгоритмом Беждека-Дана
Число кластеров Коэффициент разбиения Рс (Р) Энтропия разбиения Н (Р)
с = 2 0,941696 0,110578
с = 3 0,818706 0,326110
с = 4 0,679032 0,574010
с = 5 0,585344 0,775261
с = 6 0,523302 0,918461
с = 11 0,389235 3,839760
0 < Ис (Р)< 4,36 . Однако следует отметить, что при значении с = 2 полученное разбиение является практически четким, так как Ес (Р)«1 и Ис (Р)« 0. И, наоборот, при значении с = 11 полученное разбиение является наиболее неопределенным. Поэтому из дальнейшего рассмотрения исключаем полученные разбиения при с = 2 и с = 11. Для выбора оптимального разбиения построим график зависимости значений функционала Е(х, ц) от числа кластеров (рис. 7).
Известно, что при значении числа кластеров, близком к оптимальному, происходит замедление убывания значений функционала. Как видно из полученного графика (см. рис. 7), замедление скорости убывания функционала происходит при с = 5. Таким образом, при данном значении (с = 5) полученное разбиение целесообразно содержательно осмысливать и интерпретировать.
Расчетные значения принадлежностей объектов кластерам при разбиении исследуемой совокупности на пять кластеров представлены в табл. 3.
Проанализируем полученные результаты нечеткой кластеризации субъектов РФ по уровню экономического развития (табл. 4).
Таблица 3
Значения принадлежностей объектов кластерам при разбиении исследуемой совокупности на пять кластеров
Номер объекта Номер кластера Номер объекта Номер кластера
1 2 3 4 5 1 2 3 4 5
1 2 3 4 5 6 7 8 9 10 11 12
1 0,0059 0,0006 0,0401 0,1704 0,7830 41 0,0085 0,0008 0,0972 0,065 0,8286
2 0,0046 0,0006 0,0209 0,8701 0,1038 42 0,0132 0,002 0,0493 0,7762 0,1593
3 0,0052 0,0006 0,0269 0,7744 0,1929 43 0,0289 0,0043 0,1115 0,5513 0,3040
4 0,0082 0,001 0,0457 0,5659 0,3793 44 0,0306 0,0025 0,3782 0,1131 0,4756
5 0,0055 0,0008 0,021 0,8955 0,0773 45 0,0107 0,0012 0,0666 0,3036 0,6179
6 0,0043 0,0004 0,031 0,103 0,8612 46 0,0012 0,0002 0,0054 0,9677 0,0255
7 0,0054 0,0006 0,0292 0,7105 0,2543 47 0,013 0,0016 0,0591 0,6571 0,2692
8 0,0166 0,002 0,095 0,4018 0,4847 48 0,0056 0,0005 0,0558 0,0577 0,8803
9 0,0209 0,0021 0,1601 0,1731 0,6438 49 0,0199 0,0025 0,104 0,4415 0,4322
При рассмотрении табл. 2 видно, что при переходе от с = 2 к с = 11 значения показателей качества разбиения соответствуют нормативному диапазону значений. Так, расчетный диапазон значений для исследуемой совокупности коэффициента разбиения Ес (Р) определяется неравенством 0,013 < Ес (Р)< 1, а расчетный диапазон значений энтропии разбиения Ис (Р) — неравенством
Е (х, ц )
О 2 4 б 8 10 12
Число кластеров
Рис. 7. Зависимость значений функционала Е (х, ц ) от числа кластеров
Окончание табл. 3
_ л а - 8 * Номер кластера а н | 3 Номер кластера
О [в 53 1 2 3 4 5 ва«! ^ о 1 2 3 4 5
10 0,0489 0,0035 0,6044 0,0903 0,2530 50 0,0015 0,0002 0,0069 0,9573 0,0341
11 0,0086 0,001 0,0484 0,5641 0,3779 51 0,0147 0,0008 0,8929 0,0214 0,0702
12 0,0093 0,001 0,0562 0,3525 0,5809 52 0,081 0,0039 0,696 0,0649 0,1541
13 0,0036 0,0004 0,0271 0,0766 0,8924 53 0,0076 0,0009 0,0411 0,6553 0,2950
14 0,0056 0,0007 0,0276 0,8001 0,1660 54 0,003 0,0004 0,0149 0,8879 0,0938
15 0,0109 0,0013 0,0631 0,3863 0,5384 55 0,0013 0,0002 0,0059 0,9615 0,0312
16 0,0107 0,0012 0,0604 0,4323 0,4955 56 0,0209 0,0011 0,868 0,0273 0,0827
17 0,0249 0,002 0,3364 0,1025 0,5342 57 0,0541 0,8599 0,0343 0,0238 0,0280
18 0,2972 0,2345 0,1893 0,1279 0,1511 58 0,0059 0,0005 0,07 0,0481 0,8755
19 0,0377 0,0024 0,598 0,0805 0,2814 59 0,0237 0,0032 0,0859 0,6269 0,2603
20 0,8634 0,0038 0,0823 0,0186 0,0319 60 0,008 0,0008 0,0729 0,0863 0,8320
21 0,073 0,005 0,5943 0,0961 0,2316 61 0,0198 0,0027 0,077 0,6501 0,2504
22 0,0344 0,0023 0,6304 0,0732 0,2597 62 0,007 0,0006 0,0677 0,0717 0,8529
23 0,0159 0,0015 0,1502 0,1288 0,7036 63 0,0021 0,0003 0,0091 0,9475 0,0410
24 0,0694 0,0081 0,3027 0,2297 0,3902 64 0,1486 0,0048 0,6588 0,0587 0,1292
25 0,6956 0,0069 0,1847 0,0413 0,0714 65 0,0357 0,0023 0,589 0,082 0,2911
26 0,0022 0,0002 0,0181 0,0333 0,9463 66 0,0238 0,0017 0,462 0,0839 0,4287
27 0,0093 0,0011 0,0527 0,4924 0,4446 67 0,0201 0,0017 0,2427 0,1133 0,6222
28 0,3986 0,0089 0,3997 0,0669 0,1259 68 0,0208 0,0017 0,274 0,1086 0,5949
29 0,0085 0,0013 0,0321 0,8484 0,1098 69 0,1105 0,0049 0,6808 0,0623 0,1413
30 0,0172 0,0028 0,0562 0,7663 0,1575 70 0,0162 0,0014 0,1633 0,1159 0,7032
31 0,0582 0,0105 0,143 0,5119 0,2764 71 0,9031 0,0071 0,048 0,0167 0,0251
32 0,01 0,0015 0,0364 0,8299 0,1222 72 0,0295 0,0021 0,5106 0,0891 0,3688
33 0,0161 0,0026 0,0546 0,7658 0,1608 73 0,2821 0,0065 0,5274 0,0608 0,1232
34 0,0071 0,0011 0,0268 0,8716 0,0935 74 0,0333 0,0026 0,3964 0,112 0,4557
35 0,0056 0,0008 0,0215 0,8953 0,0767 75 0,6766 0,0122 0,1736 0,0533 0,0843
36 0,0091 0,0009 0,0714 0,119 0,7995 76 0,8743 0,0071 0,0639 0,0218 0,0330
37 0,0119 0,0015 0,0636 0,5532 0,3698 77 0,7826 0,0158 0,1065 0,0379 0,0573
38 0,0088 0,0009 0,0749 0,0946 0,8208 78 0,0189 0,0017 0,1638 0,1522 0,6634
39 0,0078 0,0008 0,0551 0,1647 0,7716 79 0,0325 0,9089 0,0225 0,0169 0,0192
40 0,0151 0,0016 0,0995 0,2465 0,6373
Приложение 1
Результаты кластеризации
Кластер Субъекты РФ
Кластер 1 «Очень низкий уровень экономического развития» Брянская, Владимирская, Воронежская, Ивановская, Костромская, Орловская и Тамбовская области, Республика Адыгея, Республика Дагестан, Кабардино-Балкарская Республика, Республика Калмыкия, Карачаево-Черкесская Республика, Республика Северная Осетия — Алания, Ставропольский край, Республика Марий Эл, Республика Мордовия, Чувашская Республика, Кировская, Пензенская, Саратовская, Ульяновская и Курганская области, Республика Алтай, Республика Тыва, Алтайский край
Кластер 2 «Низкий уровень экономического развития» Белгородская, Калужская, Липецкая, Рязанская, Смоленская, Калининградская и Новгородская области, Краснодарский край, АстраХанская, Волгоградская и Ростовская области, Республика Башкортостан, Удмуртская Республика, Нижегородская и Челябинская области, Республика Бурятия, Республика Хакасия, Новосибирская, Омская, Читинская и Еврейская автономная области
Кластер 3 «Средний уровень экономического развития» Республика Карелия, Архангельская, Вологодская, Пермская, Самарская и Свердловская области, Красноярский край, Иркутская, Московская и Томская области
Окончание приложения 1
Кластер Субъекты РФ
Кластер 4 «Уровень экономического развития выше среднего» Республика Коми, Мурманская область, Республика Саха (Якутия), Камчатская, Магаданская и Сахалинская область
Кластер 5 «Высокий уровень экономического развития» Тюменская область, Чукотский АО
Выделим для каждого кластера ядро (множество типичных представителей данного кластера). Ядро каждого кластера можно получить как подмножество а-уровня данного кластера при а=0,6. Таким образом, в ядро вошли объекты, степень принадлежности которых к данному кластеру больше 0,6. Характеристики ядер полученных кластеров приведены в табл. 4.
Как видно, в табл. 4 классы упорядочены по возрастанию основных экономических показателей (за исключением индекса промышленного производства). В первом столбце таблицы приведены номера кластеров. Столбцы 2—6 показывают средние значения классификационных признаков для ядер каждого кластера. Последняя строка таблицы показывает среднее значение классификационных признаков по Российской Федерации в целом. Анализ данных строк показывает, что в первые два кластера вошли субъекты РФ, уровень экономического развития которых можно охарактеризовать как очень низкий и низкий. Для ядер этих кластеров характерен низкий уровень ВВП на душу населения, низкий уровень инвестиций в основной капитал на душу населения, низкие среднедушевые денежные доходы, низкие среднедушевые денежные расходы и сбережения населения, низкая среднемесячная номинальная начисленная заработная плата. По всем выделенным экономическим показателям значения субъектов РФ, относящихся к кластерам
1 и 2, ниже средних значений по РФ в целом. Коэффициент дифференциации между максимальным значением по РФ и минимальным значением по кластеру 1 составил: для ВРП на душу населения — 17 раз; для инвестиций в основной капитал на душу населения — 61 раз; для среднедушевых денежных доходов населения — 8 раз; для среднедушевых денежных расходов и сбережений — 14 раз и т. д. Типичными представителями кластера 1 с очень низким уровнем экономического развития являются такие субъекты РФ, как Алтайский край, Ивановская область, Карачаево-Черкесская Республика, Кировская, Курганская и Пензенская области, Республика Северная Осетия — Алания, Ульяновская область, Чувашская Республика. К ядру кластера 2 с низким уровнем экономического развития относятся Калужская, Смоленская и Новгородская области, Республика Хакасия и т. д.
Значения практически всех экономических показателей кластера 3 близки к средним по РФ и незначительно превышают их. Так, по показателям ВРП на душу населения среднее значение по кластеру 3 превышает средний уровень по РФ в 1,12 раз, среднедушевые денежные доходы, расходы и сбережения — в 1,2 раза. Однако, несмотря на то, что по уровню ВРП на душу населения субъекты РФ превосходят кластер 2 почти в 1,5 раза, а кластер 1 в 2,2 раза, индексы промышленного производства рассмотренных кластеров находятся практически на
Таблица 4
Характеристика ядер выделенных кластеров
Кластер Экономические показатели по субъектам РФ Численность ядра Мощность ядра
ВРП на душу населения, руб. Индексы промышленного производства,% Инвестиции в основной капитал на душу населения, руб. Среднедушевые денежные доходы населения, руб. Среднедушевые денежные расходы и сбережения населения, руб. Среднемесячная номинальная начисленная заработная плата работающих в экономике, руб.
1 35145 107 5119 2816 2675 3285,3 10 40 %
2 55283 107 10459 3745 3614,5 4441,4 6 28,5 %
3 76578,7 108,1 13096 5267,5 5104,5 5445,3 2 20 %
4 127591,6 102,4 25148 8185 6679 9386 3 50 %
5 351470,1 104,2 166906 13664 10143 17270,7 1 50 %
РФ 68315,87 107,30 14974,2 4338,6 3970,6 5121,4 —
одном уровне. Индекс промышленного производства составляет по 107 % для кластера 1 и 2 и 108,1 % для кластера 3. К ядру кластера 3 относятся субъекты РФ со средним уровнем экономического развития. Среди ярких представителей данного кластера отмечаются Пермская и Свердловская области.
Субъекты РФ, принадлежащие кластеру 4, превосходят среднероссийское значение по показателям ВРП на душу населения, среднедушевым денежным доходам, расходам и сбережениям почти в 2 раза. Однако показатель индекса промышленного производства здесь самый низкий среди всех рассматриваемых кластеров. Наиболее типичными представителями данного кластера выступают Республика Коми, Республика Саха (Якутия), Магаданская область. Можно сказать, что ядро класса
4 содержит представителей с уровнем экономического развития, превышающим среднее значение.
Наконец, типичным представителем кластера
5 с высоким уровнем экономического развития является Чукотский автономный округ. Социально-экономические показатели субъектов данного кластера многократно превышают среднероссийский уровень. Так, ВРП на душу населения в 5 раз больше среднероссийского, инвестиции в основной капитал — в 11 раз, среднедушевые денежные доходы — в 3 раза, среднедушевые денежные расходы и сбережения — в 2,5 раза и т. д. В данный кластер входят только северные субъекты РФ, располагающие значительными запасами природных ресурсов.
Восьмой столбец табл. 4 содержит показатель численности ядра. Данный показатель является аналогом численности класса при четкой классификации. Расчет характеристики численности осуществляется путем суммирования степеней принадлежности объектов к данному кластеру, т. е. суммы элементов каждого столбца матрицы Значения элементов данной строки позволяют рассчитать показатель, который мы предлагаем интерпретировать как процент «особо отсталых» субъектов РФ (остро нуждающихся в федеральной, региональной поддержке). Если к таким субъектам РФ отнести представителей ядра класса 1 и 2, то значение данного показателя составляет 20,3 %. Остальные же субъекты РФ, входящие в данные кластеры 1 и 2, можно интерпретировать как «отсталые» (2-я очередь нуждающихся субъектов РФ в федеральной, региональной поддержке). Таких субъектов 30 или 37,9 %. Нам представляется, что в целях сокращения чрезмерной экономической дифференциации в первую очередь региональная политика выравнивания должна быть нацелена
на совокупность «особо отсталых» субъектов РФ, и во вторую — на «отсталые» субъекты РФ. Таким образом, региональной экономической политикой выравнивания должны быть охвачены 46 субъектов РФ, или 58,2 %.
Последний столбец табл. 4 содержит значения, характеризующие так называемую мощность ядра данного кластера (доля численности ядра в общей численности кластера, выраженная в процентах). По результатам расчета видно, что наиболее однородными, а значит, и наименее размытыми, оказались крайние кластеры. Так, мощность ядра кластера 1 с очень низким экономическим развитием составила 40 %, а мощность ядер кластера 4 и 5 с высоким и очень высоким экономическим развитием по 50 %. Оставшиеся кластеры 2 и 3 менее размыты. Рассмотрим показатели вариации по выявленным кластерам (табл. 5).
Анализ показывает, что внутри кластера максимальные значения превосходят минимальные значения почти в 2 раза. Исключение составляют значения кластеров 1 и 4 по показателю инвестиций в основной капитал на душу населения, которые имеют значения 3,7 и 3,2 раза соответственно. Это свидетельствует об активизации инвестиционной деятельности в данных кластерах.
Среднее линейное отклонение по рассматриваемым кластерам принимает значение для кластера 1 по показателю ВРП на душу населения от 6 610,37 руб. до 6 295,5 руб. для кластера 5. Это означает, что в среднем ВРП на душу населения в изучаемой совокупности субъектов РФ отклоняется от среднего ВРП на душу населения по кластеру 1 на 6 610,37 руб. Аналогично можно интерпретировать результаты показателей для других кластеров. Интерпретация результатов расчета показателя среднего квадратического отклонения идентичны интерпретации результатов среднего линейного отклонения. Из табл. 5 видно, что настоящие значения имеют приблизительно одинаковую величину. Соотношение а:а зависит от наличия в совокупностях резких, выделяющихся отклонений и служит индикатором «засоренности» совокупности неоднородными с основной массой элементами. Как видно из табл. 5, для всех кластеров настоящее значение практически не превышает значения 1,2, что свидетельствует об однородности объектов, принадлежащих кластерам.
Анализ значений коэффициента вариации по показателю инвестиций в основной капитал на душу населения показывает, что наиболее неравномерны инвестиции в 4-м и 5-м кластерах.
Таблица 5
Показатели вариации для выделенных кластеров
Номер кластера Экономические показатели Показатели вариации
Коэффициент дифференциации (Кр Среднее линейное отклонение (а) Среднее квадратическое отклонение (ст) Относительный размах вариации (р) Относительное отклонение по модулю (т) Коэффициент вариации как относительное квадратическое отклонение (V)
1 ВРП на душу населения, руб. 2,54 6610,37 7940,8 1,2 0,88 0,18 0,22
Инвестиции в основной капитал на душу населения, руб. 3,7 1345,48 1628 1,2 1,16 0,21 0,26
Среднедушевые денежные доходы населения, руб. 1,63 297,79 369,72 1,2 0,47 0,11 0,13
Среднедушевые денежные расходы и сбережения населения, руб. 2,9 443,54 568,61 1,3 0,94 0,18 0,23
Среднемесячная номинальная начисленная заработная плата работающих в экономике, руб. 1,95 330,23 442,07 1,3 0,67 0,1 0,13
2 ВРП на душу населения, руб. 1,94 6769,86 8678,8 1,3 0,7 0,12 0,15
Инвестиции в основной капитал на душу населения, руб. 2,41 2292,69 2823,5 1,2 0,98 0,21 0,26
Среднедушевые денежные доходы населения, руб. 1,46 242,69 317,82 1,3 0,37 0,06 0,08
Среднедушевые денежные расходы и сбережения населения, руб. 1,68 306,78 439,83 1,4 0,53 0,08 0,12
Среднемесячная номинальная начисленная заработная плата работающих в экономике, руб. 1,43 336,67 431,17 1,3 0,36 0,07 0,1
3 ВРП на душу населения, руб. 1,47 9880,65 11365 1,2 0,39 0,12 0,14
Инвестиции в основной капитал на душу населения, руб. 2,6 2967,86 3733,9 1,3 0,92 0,2 0,25
Среднедушевые денежные доходы населения, руб. 1,31 408,1 456,47 1,1 0,27 0,08 0,09
Среднедушевые денежные расходы и сбережения населения, руб. 1,5 483,6 617,06 1,3 0,43 0,1 0,13
Среднемесячная номинальная начисленная заработная плата работающих в экономике, руб. 1,43 528,47 645,74 1,2 0,37 0,09 0,11
4 ВРП на душу населения, руб. 1,71 17607,6 20290 1,2 0,51 0,16 0,18
Инвестиции в основной капитал на душу населения, руб. 3,27 9283,55 11347 1,2 1,28 0,35 0,43
Среднедушевые денежные доходы населения, руб. 1,16 398 452,83 1,1 0,15 0,05 0,06
Среднедушевые денежные расходы и сбережения населения, руб. 1,13 265,17 282,43 1,1 0,12 0,04 0,04
Среднемесячная номинальная начисленная заработная плата работающих в экономике, руб. 1,31 630,51 773,6 1,2 0,26 0,07 0,08
5 ВРП на душу населения, руб. 1,04 6295,5 6295,5 1 0,04 0,02 0,02
Инвестиции в основной капитал на душу населения, руб. 1,57 30143,5 30144 1 0,44 0,22 0,22
Среднедушевые денежные доходы населения, руб. 1,29 1554 1554 1 0,26 0,13 0,13
Среднедушевые денежные расходы и сбережения населения, руб. 1,27 1092,5 1092,5 1 0,24 0,12 0,12
Среднемесячная номинальная начисленная заработная плата работающих в экономике, руб. 1,18 1343,3 1343,3 1 0,17 0,08 0,08
В кластере 4 коэффициент вариации составил 19,2 % максимально возможного, т. е. предельно допустимого уровня концентрации инвестиций в
одном субъекте РФ из шести, а в кластере 5 наблюдаемый коэффициент вариации составил 22,1 % максимально возможного.
Имеет практическое значение и такой показатель, как отношение среднего модуля отклонений к предельно возможному. Так, для показателя инвестиций в основной капитал на душу населения это соотношение составляет 13 % (для кластера 1). Интерпретация полученного показателя такова: для перехода от наблюдаемого распределения инвестиций в основной капитал на душу населения между субъектами Федерации кластера 1 к равномерному распределению потребовалось бы перераспределить 12,5 % общего объема инвестиций в совокупности.
Помимо информации о выделенных кластерах, оптимизационный нечеткий с-теаш алгоритм Беждека-Дана позволяет выявить объекты, которые не могут быть с высокой степенью достоверности отнесены ни к одному из кластеров. Анализ того, что представляют собой такие объекты, дает возможность изучить закономерности, присущие исследуемой совокупности, которые не могли бы быть исследованы в случае использования методов четкой кластеризации.
Так, например, могут быть выявлены аномальные наблюдения. Субъекты РФ, имеющие приблизительно равные степени принадлежности ко всем выделенным кластерам, могут быть рассмотрены как изолированные, т. е. не входящие ни в одну из областей сгущения точки. С качественной стороны такие наблюдения могут быть интерпретированы как субъекты, которые не могут быть проклассифицированы в рамках поставленной задачи.
Анализ результатов классификации по субъектам РФ показал, что наблюдения, имеющие приблизительно равные степени принадлежности к каждому из выделенных кластеров, с качественной точки зрения действительно могут быть охарактеризованы как аномальные. Среди таких наблюдений оказались два субъекта РФ — г. Москва и Ленинградская область. Объяснить данное явление можно, анализируя значения экономических показателей настоящих субъектов. Если для г. Москвы значение ВРП на душу населения сопоставить с аналогичным средним значением кластера 4, то видно, что противоречие возникает за счет превышения в 2,5 раза среднедушевых денежных доходов. Аналогичный результат получим, сравнивая данное значение со значением кластера 5, с той лишь разницей, что превышение среднедушевых денежных доходов в Москве составит 1,7 раза.
Анализ отношения ВРП на душу населения к среднедушевым денежным доходам в Ленинградской области выявил противоположную зависи-
мость. По значению ВРП на душу населения Ленинградская область сопоставима с 3-м кластером (и даже несколько превосходит среднее значение). Однако уровень среднедушевых денежных доходов населения в Ленинградской области в 1,7 раз меньше, чем у субъектов третьего кластера. Более того, он практически на одном уровне со значением среднедушевых денежных доходов второго кластера (при ВРП на душу населения, в 1,5 раза превышающем значение второго кластера).
Отдельный интерес может представлять исследование полос разрыва между кластерами. В полосу размыва между кластерами входят такие субъекты РФ, для которых степени принадлежности к данным кластерам меньше 0,6 (т. е. объекты не входят в ядра кластеров) и которые не могут быть отнесены к аномальным наблюдениям1.
В ходе исследования результатов нечеткой кластеризации субъектов РФ было выяснено, что не существует полос размыва между кластером 4 и кластером 5, т. е. не существует субъектов РФ, обладающих приблизительно равным сходством с типичными представителями регионов с высоким и уровнем экономического развития выше среднего.
Средние характеристики по экономическим показателям, а также численность существующих полос размыва представлены в табл. 6.
Численность полос размыва представляет собой реальное число объектов наблюдения, входящих в указанные полосы размыва (в отличие от численности ядер кластеров в табл. 4, посчитанных как суммы степеней принадлежности объемов к соответствующим кластерам).
Проанализируем полосу размыва между кластерами 1 и 2 (между субъектами Федерации с низким и очень низким уровнем экономического развития). Сравнение средних значений экономических показателей для данной полосы размыва (табл. 6) со средними значениями этих показателей для кластеров 1 и 2 (табл. 4) подтверждает адекватность представления об объектах, попавших в эту полосу, как о средних между 1-м и 2-м кластерами. Большинство субъектов РФ, вошедших в исследуемую полосу размыва (66,7 %), имеют большую степень принадлежности к кластеру 2, чем к кластеру 1. С качественной точки зрения это может означать,
1 К субъектам РФ, попавшим в полосу размыва, относятся: Курская, Тверская, Тульская, Ярославская и Псковская области, г. Санкт-Петербург, Республики Ингушетия и Татарстан, Оренбургская и Кемеровская области, Приморский и Хабаровский края, Амурская область.
Таблица 6
Средние экономические характеристики полос размыва между кластерами
Характеристики Полоса размыва
1 и 2 2 и 3 3 и 4
ВРП на душу населения, руб. 42416 68437,5 89774,4
Индексы промышленного производства, % 105,917 105,94 108,25
Инвестиции в основной капитал на душу населения, руб. 8440,17 13877,4 20811
Среднедушевые денежные доходы населения, руб. 2978 4309 6528
Среднедушевые денежные расходы и сбережения населения, руб. 2566,33 4106 6479,5
Среднемесячная номинальная начисленная заработная плата работающих в экономике, руб. 3947,2 5293,8 6918
Диапазон изменений степеней принадлежности [0,4; 0,5] [0,3; 0,5] [0,5; 0,4]
Численность субъектов РФ 6 5 2
что в среднем объекты, попавшие в полосу размыва между первым и вторым кластерами, имеют более высокую вероятность попасть в кластер 2, чем в кластер 1, что может означать наличие соответствующей тенденции. Это свидетельствует о некотором улучшении в экономическом положении таких регионов.
Средние значения субъектов РФ, попавших в полосу размыва между кластерами 2 и 3, также соответствуют табл. 4. Особую тревогу здесь вызывает обратная тенденция. Так если в полосе размыва между кластерами 1 и 2 регионы имели тенденцию к улучшению положения, то здесь наоборот. Большинство (60 %) регионов полосы размыва между 2-м и 3-м кластерами имеют более высокие принадлежности к классу 2. По нашему мнению, это свидетельствует об опасной тенденции, для противодействия которой следует разработать специальный комплекс мероприятий.
Рассматривая полосу размыва между 3-м и 4-м кластерами, можно отметить положительную тенденцию, так как половина субъектов, вероятно, улучшит свое экономическое положение.
Как показано ранее, исследование полос размыва между кластерами дает дополнительную информацию, представляющую интерес с точки зрения исследования возможных тенденций перехода субъектов РФ из одного кластера в другой.
Таким образом, в результате проделанной работы приходим к следующим выводам.
1. Существенная ограниченность сферы применения большинства существующих методов оценки дифференциации субъектов РФ по уровню экономического положения, вследствие накладываемых на исходные данные жестких требований, вызывает необходимость их совершенствования, применения новой методологии анализа.
2. Выявленные ограничения, по нашему мнению, можно преодолеть, используя предлагаемую
методику на основе оптимизационного нечеткого c-means алгоритма Беждека-Данна, которая может быть применена органами управления различного уровня с целью выявления дифференциации экономического развития субъектов РФ (федеральных округов, муниципальных образований).
3. Полученные с помощью такой методики результаты в области исследования дифференциации экономического положения субъектов РФ могут стать аналитическим фундаментом, послужить обоснованием для разработки эффективных программ экономического развития и повышения качества жизни населения в регионах.
ЛИТЕРАТУРА
1. Баранов С. В. Межрегиональная дифференциация и регулирование производства ВРП / http://vak. ed. gov. ru/announcements/.
2. Бычкова С. Г. Системный подход к статистической оценке различий регионов по уровню жизни населения // Вопросы статистики. 2005, №12. С. 24-28.
3. Данилова И. Б., Арсеева В. Региональные различия в уровне жизни населения субъектов РФ ПФО // Вопросы статистики. 2003, №12. С. 32—38.
4. Дмитриева Т. Е. Рейтинговая оценка в межрегиональных и внутрирегиональных сопоставлениях (методический аспект) / http://sopssecretary. narod. ru/Konferencya/Doclad/dmitrieva. doc
5. Донченко Ю. В., Евченко А. В., Железняков С. С. Социально-экономические аспекты оценки и регулирования территориальной асимметрии в развитии административных районов // Вопросы статистики. 2004, №8. С. 56—61.
6. Ефремов К. И., Георгадзе Е. И., Костылева Л. В. Методика проведения комплексной рейтинговой оценки социально-экономического развития муниципальных образований Вологодской области // Вопросы статистики. 2002, №2. — С. 61—63.
7. Методика комплексной оценки уровня социально-экономического развития субъектов РФ / http://www. akdi. ru/ECONOM/program/pril6.htm.
8. Полынев А. О. Межрегиональная экономическая дифференциация: методология анализа и государственного регулирования. — М.: Едиториал УРСС, 2003. — 208 с.
9. Суспицын С. Межрегиональные различия: сравнительный анализ федеральных округов и «субокругов» // Российский экономический журнал. 2001, № 1. С. 53—66.
10. Хохлова О. А. Методологические вопросы оценки уровня социально-экономического развития региона // Вопросы статистики. 2005, №1. С. 58—65.
11. Штовба С. Д. Введение в теорию нечетких множеств и нечеткую логику / http://matlab. exponenta. ru/fuzzylogic/book1/index. php.
12. Ярушкина Н. Г. Основы теории нечетких и гибридных систем: Учеб. пособие. — М.: Финансы и статистика, 2004. — 320 с.
13. Ярушкина Н. Г. Средства Data Minig для нечетких реляционных серверов данных // Информационные технологии. 2007, № 6. С. 20—29.
14. Barro R. J., Sala-i-Martin X. Convergence // Journal of Political Economy, 1992, Vol. 100, № 2. Р. 223—251.
15. Theil H. Economics and information theory. — Amsterdam: 1967. Р. 121—123.
16. Williamson J. G. Regional inequality and the process of national development: a description of the patterns // Economic development and cultural change. — 1965, Vol. 13, № 4. Р. 3—45.
Приглашаем к сотрудничеству!
Издательский дом «Финансы и Кредит» оказывает услуги по изданию книг, брошюр, монографий, учебников, учебно-методической и художественной литературы. Издание осуществляется за счет средств автора. Срок изготовления монографий объемом 10 печатных листов в мягкой обложке - от 40 дней.
Тел./факс: (495) 621-69-49, Http:/www.fin-izdat.ru
(495) 621-91-90 e-mail: [email protected]