А. В. Аксянова
КЛАСТЕРНАЯ МЕТОДОЛОГИЯ ИССЛЕДОВАНИЯ
РЕГИОНАЛЬНЫХ ЭКОНОМИЧЕСКИХ СИСТЕМ
ПО УРОВНЮ ИНВЕСТИЦИОННОЙ ПРИВЛЕКАТЕЛЬНОСТИ
Ключевые слова: инвестиционная привлекательность, кластерный анализ, метод главных компонент, обобщенные факторы инвестиционной привлекательности, специфические
региональные группы.
Предложена методология применения кластерного анализа для выявления концентрации региональных групп по отдельным классам по уровню инвестиционной привлекательности.
Keywords: investment attractiveness, cluster analysis, principal component analysis, generalized factors of investment attractiveness, specific regional groups.
The methodology of cluster analysis to identify the concentration of the regional groups for individual classes in terms of investment attractiveness is offered.
Разработка любых концепций в управлении региональными экономическими системами должна базироваться на аналитической и предупреждающей информации, способствующей принятию органами управления научно-обоснованных решений. В рамках до сих пор нерешенной дилеммы «выравнивание-неравенство» для регионов, образующих экономическое пространство России, переход от «госплановского» принципа определения преимуществ и потенциала регионов из федерального центра к осознанию неизбежности региональной дифференциации требует новых подходов к принятию стратегических решений с учетом структурных особенностей воспроизводственных механизмов различных региональных групп.
Определяющую роль в реализации эффективных воспроизводственных процессов, в том числе и на уровне отдельно взятого региона, является наличие благоприятной среды для привлечения инвестиций. Современная инвестиционная политика на федеральном уровне не создает полноценных условий для формирования эффективной инвестиционной среды. Более того, инвестиционные ресурсы распределяются между регионами крайне неравномерно, в основном концентрируясь в столичных регионах и регионах с высокой долей освоения минерально-сырьевой базы.
В связи с этим целесообразно обратиться к существующим методам многомерного статистического анализа, чтобы проследить концентрацию определенных региональных групп в отдельных классах по определенным показателям инвестиционной привлекательности.
Основными этапами разработанной методологии исследования явились следующие:
1 этап - исследование взаимосвязей между показателями инвестиционной привлекательности средствами корреляционного анализа;
2 этап - реализация факторного анализа для снижения размерности признакового пространства и получения обобщающих характеристик уровня инвестиционной привлекательности, а также для выявления специфических объектов;
3 этап - проведение классификации субъектов Российской Федерации на базе иерархической кластеризации и метода к-средних и интерпретация выделенных региональных групп.
В качестве базовых показателей инвестиционной привлекательности регионов были использованы следующие индикаторы по данным Федеральной службы государственной статистики за 2008-2009 гг. по 80 субъектам РФ [1]:
- сумма убытка организаций.(х-|), млн.руб;
- уровень зарегистрированной безработицы (х2), %;
- индекс физического объема инвестиций в основной капитал (хз), %;
- ввод в действие жилых домов (Х4), тыс. кв. м. общей площади;
- число малых предприятий на конец года (х5), тыс.;
- наличие собственных легковых автомобилей на 1000 населения (Хб), шт. на конец
года;
- объем бытовых услуг на душу населения (Х7), тыс. руб.;
- численность врачей на 10000 населения (Хв).
Одним из фундаментальных требований применения технологий кластерного анализа в статистических исследованиях является отсутствие эффекта мультиколлинеарности между переменными, по которым проводится сравнение «близости» характеристик классов. В связи с этим первоначально был проведен корреляционный анализ по выбранным индикаторам инвестиционной привлекательности.
Анализ матрицы парных коэффициентов корреляции выявил наличие сильной связи между рядом анализируемых показателей, а именно: суммой убытка организаций (х-|) и числом малых предприятий (Х5) (г(х-|,х5) = 0,846), вводом в действие жилых домов (Х4) и числом малых предприятий (Х5) (г(Х4,Х5) = 0,606). Так же наблюдалась значимая средняя взаимосвязь между вводом в действие жилых домов (х4) и объемом бытовых услуг на душу населения (х7) (г(х4,х7) = 0,472).
В дальнейшем для нивелирования эффекта мультиколлинеарности был осуществлен переход к системе обобщенных факторов (главных компонент) средствами факторного анализа, который позволил уменьшить размерность исследуемой совокупности и классифицировать набор индикаторов-переменных. Обычно как метод сжатия факторный анализ играет вспомогательную роль и служит для сокращения количества переменных до стержневого набора факторов, используемых затем кластерным анализом.
В факторном анализе предполагается, что наблюдаемые переменные являются линейной комбинацией латентных факторов, что выражается в виде следующей модели [2]:
Х]1 = ' • + Э]2 ' ^21 + ■■■ + Э]т ' •т] + ^ ' У]Г ,
] = 1, п; г = 1,т;1 = 1,Ы где Х] - значение ]-ого показателя у 1-го объекта исследования (региона);
• - г-й общий фактор (общими называют факторы, связанные значимыми коэффициентами веса более чем с одной переменной);
У] - значение ]-го характерного фактора на 1-м объекте исследования;
% - весовой коэффициент ]-й переменной на г-м общем факторе;
^ - весовой коэффициент ]-й переменной на ]-м характерном факторе.
Множество главных компонент представляет собой удобную систему координат, а соответствующие дисперсии главных компонент характеризуют их статистические
свойства. Из общего числа главных компонент для исследования, как правило, оставляют т (т < п) наиболее весомых, т. е вносящих максимальный вклад в объясняемую часть общей дисперсии.
Для определения количества обобщающих факторов в методе факторного анализа традиционно используются критерий Каттеля и график собственных значений - рисунок «каменистых осыпей» [3]. В данном случае результаты расчетов были получены на базе ППП ЗРББ. Согласно представленным данным наличие скоса (рис. 1), переходящего в плавную «осыпь», позволяет говорить о выделении трех факторов. Но точное количество факторов было определено по критерию Кайзера, согласно которому для дальнейшего анализа были взяты три главных компоненты, собственные значения которых составили не менее единицы (табл. 1).
Рис. 1 - График «каменистых осыпей» Таблица 1 - Результаты факторного анализа
Компонента Начальные собственные значения Суммы квадратов нагрузок вращения
Всего % дисперсии кумулятивный % Всего % дисперсии кумулятивный %
1 3,12 38,96 38,90 2,24 28,01 28,01
2 1,29 16,24 55,20 2,07 25,92 53,94
3 1,18 14,72 69,92 1,28 15,98 69,92
4 0,82 10,26 80,10
5 0,61 7,63 87,81
6 0,47 5,90 93,71
7 0,41 5,11 98,82
8 0,09 1,17 100,0
Таким образом, опираясь на комплексное использование указанных критериев, для дальнейшего исследования были использованы три главных компоненты, которые описывают около 70% суммарной дисперсии исходного пространства.
Для интерпретации матрицы факторных нагрузок было проведено ортогональное вращение по методу Варимакс [3], который упрощает интерпретацию факторов, максимизируя дисперсии переменных нагрузок на каждый фактор. Иными словами, осуществляется такое вращение, в результате которого одни переменные будут иметь высокие, а другие - низкие нагрузки на каждый фактор, что облегчает понимание и именование факторов. Таким образом были получены три обобщенных фактора, включающие в себя следующие комбинации показателей (табл. 2).
Таблица 2 - Матрица факторных нагрузок
Компонента
Р1 Р2 Р3
Х5 ,904 ,335 ,008
Х1 ,891 ,169 -,035
Хб ,182 ,758 ,152
Х7 ,190 ,747 -,104
Х4 ,450 ,633 -,201
Х2 ,117 -,627 -,539
Хз -,071 -,009 ,720
Х8 ,569 -,046 ,635
Первый обобщенный фактор (П) можно косвенно интерпретировать как фактор, определяющий экономический результат деятельности в сфере предпринимательства и малого бизнеса, и объединяющий показатели число малых предприятий и сумма убытка организаций в регионе.
Второй обобщенный фактор (Р2) объединил в себе показатели, позволяющие дать некоторую оценку уровня социально-экономического развития субъекта РФ (уровень зарегистрированной безработицы, объем бытовых услуг на душу населения, ввод в действие жилых домов, наличие собственных легковых автомобилей на 1000 населения, численность врачей на 10000 населения).
Третий обобщенный фактор (Р3) связан непосредственно с инвестиционной составляющей региона, а именно - индексом физического объема инвестиций в основной капитал.
После применения метода главных компонент с последующим вращением можно представить распределение регионов- субъектов РФ в системе обобщенных факторов П -Р2 (рис.2.) и П - Р3 (рис.3), что было бы затруднительным ранее из-за большой размерности признакового пространства. Распределение регионов образует вытянутое эллипсообразное облако, что является подтверждением нормальности исследуемой совокупности. При этом хорошо просматриваются субъекты РФ в данной выборке, обладающие специфическими особенностями и удалённые от эллипса.
8,00 - г. Москва
6,00 -
4,00 -
г. Санкт-Петербург
2,00 - Чеченская Республика
о
о О
Чукотский автономный в о Московская
0,00 - округ 0 о область
0
-2,00 "
1 1 1 1 1 1 -6,00 -4,00 -2,00 0,00 2,00 4,00
Рис. 2 - Классификация регионов РФ в системе обобщённых факторов ¥1 - ¥2
8,00 - г. Москва
6,00 -
4,00 - г. Санкт-Петербург
2,00 - Чеченская Республика О Чукотский автономный округ
Московская область 0 *?• ° Р о О О
0,00 - Республика Ингушетия О Республика Хакасия о Еврейская автономная область
-2,00 -
1 1 -4,00 -2,00 1 0,00 1 2,00
Рис. 3 - Классификация регионов РФ в системе обобщённых факторов ¥1 - ¥3
Таким образом, классификация регионов РФ в системе обобщенных факторов позволила выявить следующие специфические объекты: бесспорные лидеры по
инвестиционной привлекательности - города Москва, Санкт-Петербург и Московская область, а также регионы с крайне низкими значениями показателей -Чеченская Республика, Чукотский автономный округ, Еврейская автономная область, Республика Ингушетия. Перечисленные регионы в дальнейшем были исключены из рассмотрения при
проведении кластерного анализа. Следует отметить, что эти «особые» регионы также выделялись в обособленные группы для отдельного изучения и при ранее проводимых исследованиях по выделению однородных региональных систем, имеющих схожие воспроизводственные механизмы [4].
Многомерная классификация оставшихся субъектов проводилась с использованием иерархических агломеративных алгоритмов, а также итеративного метода к-средних.
В результате применения метода «ближайшего соседа» соединения между группами и выбора в качестве расстояния - квадрата Евклидова расстояния в пространстве ранее выделенных обобщённых факторов было выявлено, что наилучшим является разбиение на три кластера регионов. Данный метод использовался в качестве разведочного. В этом методе расстояние между двумя кластерами определялось расстоянием между двумя наиболее близкими объектами (ближайшими соседями) в различных кластерах. Это правило позволяет, в известном смысле, нанизывать объекты вместе для формирования кластеров, и результирующие кластеры имеют тенденцию быть представленными длинными "цепочками". Евклидовый тип расстояния, как наиболее часто используемый в технологии кластерного анализа, является геометрическим расстоянием в многомерном пространстве и вычисляется следующим образом:
Ре(Х|,Х|) =
Ё (х- - х]в)2
е=1
где х|е; х^ - величина е-ой компоненты и ]-ого (|-ого ) объекта.
Для уточнения количества кластеров далее была проведена классификация исходной совокупности с использованием метода к-средних. При его использовании регионы так же разделились на три кластера (табл.3).
Таблица 3 - Число наблюдений в каждом кластере
Кластер 1 27,000
2 17,000
3 28,000
Валидные 72,000
Пропущенные значения 0,000
В итоге первый кластер объединил 27 регионов, которых можно охарактеризовать как регионы с высоким уровнем инвестиционной привлекательности. Несмотря на то, что в среднем субъекты этого класьера имеют более низкие темпы роста инвестиций в основной капитал, они характеризуются наименьшим уровнем убыточности предприятий и высокими показателями социально-экономического развития. Яркими представителями данного кластера являются Краснодарский край, Республика Башкортостан, Республика Татарстан, Самарская область и Тюменская область.
Во второй кластер вошли 17 регионов с низкой инвестиционной привлекательностью. По средним значениям обобщенных факторов можно сказать, что эти регионы имеют высокий уровень убыточности предприятий, характеризуются очень низким уровнем социальной обеспеченности, хотя средний темп роста инвестиций в основной капитал по этому классу регионов не ниже, чем в регионах предыдущего
кластера. Во вторую кластерную группу вошли такие проблемные регионы, как Республика Дагестан, Республика Калмыкия, Республика Тыва, Кабардино-Балкарская и Карачаево-Черкесская Республики. Вместе с тем, при наличии достаточно низких значений показателей социальной составляющей в этот кластер вошли такие регионы, как Забайкальский и Хабаровский края и Амурская область.
Третий кластер объединил регионы со средним уровнем инвестиционной привлекательности («устойчивые середняки»), для которых характерным является наличие достаточно высоких темпов роста инвестиций в основной капитал и стабильных показателей развития социально-экономической сферы. Всего в данный кластер вошли 28 регионов, среди которых Тверская область, Новгородская область, Ставропольский край, Пермский и Красноярский края и ряд других.
Таким образом, кластерный анализ в данном случае позволил провести некоторую обобщенную классификацию регионов по заданному набору индикаторов, при этом объединение регионов по группам является выражением наличия некоторых схожих свойств среди элементов исследуемой совокупности объектов, что предполагает ее структуризацию.
Несмотря на то, что проведенная кластеризация регионов РФ по уровню инвестиционной привлекательности носит достаточно условный характер в силу выбранного набора индикаторов (выбор и уточнение этих характеристик могут рассматриваться в качестве отдельной проблемы исследований) следует отметить, что полученные результаты хорошо согласуются с оценкой инвестиционного климата регионов РФ, полученной рейтинговым агентством «Эксперт РА» [5]. По результатам составленных инвестиционных рейтингов среди совокупности регионов РФ за 2008-2009 гг. также было выделено три устойчивых укрупненных группы: регионы с умеренным и риском со средним или незначительным потенциалом; регионы с умеренным риском и пониженным потенциалом; регионы с высоким риском и незначительным потенциалом.
Как и любой другой метод, кластерный анализ имеет определенные недостатки и ограничения: в частности, состав и количество кластеров зависит от выбираемых критериев разбиения. При сведении исходного массива данных к более компактному виду могут возникать определенные искажения, а также могут теряться индивидуальные черты отдельных объектов за счет замены их характеристиками обобщенных значений параметров кластера. При проведении классификации объектов очень часто игнорируется возможность отсутствия в рассматриваемой совокупности каких-либо значений кластеров.
Несмотря на указанные недостатки, методы многомерного статистического анализа, в том числе и кластерный анализ, могут являться необходимой первичной информационной базой для разработки стратегических решений в практике принятия управленческих решений на региональном уровне.
Литература
1. Регионы России. Социально-экономические показатели. 2009: Стат. сб./Росстат. - М., 2009.
2. Ким, Дж.О. Факторный, дискриминантный и кластерный анализ / Дж.О. Ким, Ч.У. Мьюллер, У.Р. Клекка. - М.: Финансы и Статистика, 1989.
3. Мхитарян, В.С. Многомерные статистические методы / В.С. Мхитарян, А.М. Дубров, Л.И. Трошин. -М.: Финансы и Статистика, 2005.
4. Аксянова, А. В. Аналитическая оценка взаимосвязи показателей эффективности неоднородных хозяйственных систем / А. В. Аксянова // Вестник Казанского технологического университета. - 2010. -№ 1. - С. 330-314.
5. Обзоры исследований рейтингового агентства «Эксперт РА» (http://www.raexpert.ru)
© А. В. Аксянова - канд. техн. наук, доц. каф. химической кибернетики КГТУ, emelianov@kstu.ru.