4. Концепция развития государственного мониторинга земель сельскохозяйственного назначения и земель, используемых или предоставленных для ведения сельского хозяйства в составе земель иных категорий, и формирования государственных информационных ресурсов об этих землях на период до 2020 года. Одобрена распоряжением Правительства Российской Федерации от 30 июля 2010 г. № 1292-р. URL: http://www.mcx.ru/ documents /document/v7_show/14116.285.htm (дата обращения: 12.07.2013).
5. Система мониторинга оборота земель сельскохозяйственного назначения в Поволжье. Брошюра. Саратов ГНУ ПНИИ ЭО АПК. Саратов: Типография ЦВП «Саратовский источник», 2011. 30 с.
6. Доклад о состоянии и использовании земель в Ленинградской области в 2011 г. URL: http://www.to47.rosreestr.ru /zemleustroystvo/ zemleus troystvo_doklad/ (дата обращения: 22.06.2013).
7. Доклад о состоянии и использовании земель в Республике Карелия 2011 г. URL: http:// to10.rosreestr.ru/about/plans/analytic-and-staüstitinfo / 3749025/ (дата обращения: 22.06.2013).
Role of the state monitoring in the system of land relation in agrarian sector Dolov A.
Content and tasks of state monitoring of farmland are shown. Proposals on increasing of its effectiveness are done.
Key words: monitoring of farmlands, sown area, food security
УДК 519.237: 338.43
Кластеризация и ее применение для анализа финансово-экономического состояния отрасли растениеводства в регионах РФ
Владислав Владимирович Громов, аспирант
ФГБОУ ВПО «Кубанский государственный университет», г. Краснодар, Россия
Email: [email protected] С использованием комплекса методов математического моделирования, многомерного-статистического анализа, нечётких множеств проведен анализ финансово-экономического состояния отрасли растениеводства в регионах РФ. Опираясь на результаты кластерного анализа и статистические показатели, проведена кластеризация регионов России по выделенным факторам на пять групп, дана качественная и количественная характеристика каждому кластеру.
Ключевые слова: моделирование, финансово-экономическое состояние, кластеризация, нечеткие множества, сельское хозяйство, регионы РФ
Региональные особенности развития АПК, которые основываются на природно-климатических, географических, производственно-экономических, ресурсных, структурных и прочих особенностях конкретного региона, порождают не только различия в производственных, инвестиционных условиях, но и в подходах к решению проблем АПК. Негативным фактором при этом является неопределенность, информационная непрозрачность и сложность в оценке финансово-экономического состояния отрасли в регионе.
Цель исследований - проведение финансово-экономического анализа регионов РФ по отрасли растениеводства с использованием методов кластерного анализа и нечетких множеств.
Одним из самых популярных инструментов оценок финансовой стабильности, экономического состояния региона в целом или его отдельных отраслей являются рейтинги, которые присваиваются всем субъектам РФ.
Минсельхоз России и Российская академия сельскохозяйственных наук составляют рейтинг АПК регионов по показателям эффективности сельскохозяйственного производства. Рейтинг составляется на основе анализа шести критериев в АПК.
На наш взгляд, данные методики имеют ряд недочетов и недостатков. Во-первых, очень часто применяется ранжирование по исследуемым показателям. Во-вторых, отсутствует предварительный анализ исследуемых показателей. Также в данных методиках не используются современные методы многомерного статистического анализа и интеллектуальных систем, которые уже давно подтвердили свою эффективность в зарубежных исследованиях. Рейтинги, присвоенные по таким методикам, безусловно, способны определить лидеров и аутсайдеров, но могут дать весьма общую картину состояния региона и не способны адекватно определить состояние отрасли в отдельно
взятом регионе. В связи с этим, создание собственной адекватной оценочной системы регионов по уровню их финансово-экономического состояния является актуальной задачей. Для решения подобной задачи, на наш взгляд, целесообразно применять методы многомерного статистического анализа [1], нечетких множеств [2]. В качестве исходных данных использовали центральную базу Федеральной службы государственной статистики.
Под термином «состояние отрасли» мы понимаем экономическую категорию, отражающую финансово-экономическое состояние отрасли, характеризуемое на фиксированный момент времени значениями следующих основных харктеристик: произведенная продукция, эффективность деятельности и другими количественными и качественными характеристиками, позволяющими ответить на следующие вопросы: насколько эффективна деятельность региона в отрасли и каков производственный потенциал отрасли?
На первом этапе в качестве показателей, характеризующих финансово-экономическое состояние отрасли в регионе РФ, выбраны значения коэффициентов из статистического сборника «Регионы России. Социально-экономические показатели 2012» [3]: х1 - продукция растениеводства, млн. руб.; х2 - сальдированный финансовый результат организаций, млн. руб.; х3 - рентабельность проданных товаров, продукции, %; х4 - посевные площади сельскохозяйственных культур площади, тыс. гектаров. х5 - валовой сбор сельскохозяйственных культур, тыс. т.
В ходе проведения анализа возникла необходимость в предварительной обработке данных. Дело в том, что значения вышеперечисленных факторов для определенных регионов пропущены или указан знак «-». В целях качественной кластеризации пропущенные данные были заменены на минимальные значения соответствующих факторов.
Далее в программе Statistica создали описательные статистики каждому фактору и диаграмму размаха (рис. 1). Данные виды анализа позволят получить подробное представление о выбранных показателях. Так, среднее значение показателя х1 для всей России - (продукция растениеводства) равно 21 099,65 млн. руб. Сам фактор изменяется от 27,20 до 159 203,0 млн. руб., т.е. имеет очень большой «размах», что хорошо видно на рисунке 2. Поэтому вместо среднего значения имеет смысл учитывать и медиану, равную 15 024,30 млн. руб. Так как «размах» переменных очень большой, то не-
обходимо привести их к общему масштабу единиц исчисления. С помощью соответствующей процедуры в программе 8ш18йса нормализовали (стандартизировали) переменные.
Диаграмма размаха
x1 x2 x3
п Среднее I I Среднее±Ст.откл. ^
x4 x5
Среднее±1.96*Ст.откл.
Рис. 1. Диаграмма размаха
На втором этапе исследования провели кластерный анализ получившихся значений методами иерархической классификации, k-средних и fuzzy c-means.
Далее применялся метод иерархической классификации. Назначение этого алгоритма состоит в последовательном объединении объектов (регионов) в один кластер, используя меру сходства или расстояние между объектами. В результате кластеризации было построено иерархическое дерево (рис. 2). В качестве меры расстояний использовали евклидово расстояние, правила объединения - Метод Варда. Этот метод использует методы дисперсионного анализа для оценки расстояний между кластерами. В целом метод стремится создавать кластеры малого размера. В конечном итоге мы получили 6 кластеров (табл. 1).
В алгоритме k-средних (k-means) строится k кластеров, расположенных на возможно больших расстояниях друг от друга. Данный метод подтверждает гипотезы относительно числа кластеров. Выбор числа k базируется на результатах исследований, экспертной оценке. Было выделено 6 кластеров из нашей выборки. Гипотеза о существовании подтвердилась евклидовым расстоянием и квадратом евклидового расстояния между кластерами и таблицей дисперсионного анализа (рис. 3). В таблице приведены значения межгрупповых (Между СС) и внутригрупповых (Внутри СС) дисперсий признаков. Чем меньше значение внутригрупповой дисперсии и больше значение межгрупповой, тем лучше признак характеризует принадлежность объектов к кластеру и тем «качественнее» кластеризация. Параметры F и p также ха-
80000
60000
40000
20000
0
рактеризуют вклад признака в разделение объ- шие значения второго параметра. В нашем слу-екта на группы. Лучшей кластеризации соот- чае можно говорить о «хорошей» кластериза-ветствуют большие значение первого и мень- ции исходных данных.
Таблица 1
Кластеризация. Метод иерархической классификации
Кластер Регион Всего
№1 Очень низкое Архангельская обл., Магаданская обл., Мурманская обл., Ненецкий АО, Республика Карелия, Хабаровский край, Ханты-Мансийский АО, Ямало-Ненецкий АО 8
№2 Низкое -очень низкое Республика Ингушетия, Республика Саха (Якутия), Республика Тыва, Чеченская Республика, Чукотский АО 5
№3 Низкое Забайкальский край, Ивановская обл., Калининградская обл., Карачаево-Черкесская Республика, Приморский край, Псковская обл., Республика Коми, Республика Марий Эл, Республика Северная Осетия-Алания, Сахалинская обл., Смоленская обл., Томская обл. 12
№4 Среднее Астраханская обл., Владимирская обл., Вологодская обл., Еврейская автономная обл., Калужская обл., Камчатский край, Кабардино-Балкарская Республика, Костромская обл., Ленинградская обл., Новгородская обл., Республика Адыгея, Республика Алтай, Республика Бурятия, Республика Калмыкия, Республика Хакасия, Тверская обл., Ярославская обл. 17
№5 Высокое Амурская обл., Брянская обл., Иркутская обл., Кемеровская обл., Кировская обл., Красноярский край, Курганская обл., Липецкая обл., Московская обл., Нижегородская обл., Новосибирская обл., Орловская обл., Пензенская обл., Пермский край, Республика Дагестан, Республика Мордовия, Рязанская обл., Самарская обл., Свердловская обл., Тульская обл., Тюменская обл., Удмуртская Республика, Ульяновская обл., Челябинская обл., Чувашская Республика 25
№6. Очень высокое Алтайский край, Белгородская обл., Волгоградская обл., Воронежская обл., Краснодарский край, Курская обл., Омская обл., Оренбургская обл., Республика Башкортостан, Республика Татарстан, Ростовская обл., Саратовская обл., Ставропольский край, Тамбовская обл. 14
Дендрограмма для 81 набл. Метод Варда
Евклидово расстояние
Кластер Номер Евклидовы расст. между кластерами (2011_orig) Расстояния под диагональю Квадраты расстояний над диагональю
Но. 1 Но. 2 Но. 3 Но. 4 Но. 5 Но. 6
Но. 1 0.000001 1.144635 20.6768! 0.47228 0.90951 3.1 059S
Но. 2 1.069871 0.000000 14.0584 2.94893 3.80393 6.51841
Но. 3 4.54718: 3.74945. 0.00001 25.8539 27.74101 32.52259
Но. 4 0.687228 1.71724: 5.08467 0.00001 0.18283 2.1998'
Но. 5 0.95368 1.950367 5.26697 0.42759 0.00000 1.16205
Но. 6 1.762382 2.553117 5.7028( 1.48319 1.07798 0.00000
Дисперсионный анализ (2011_orig)
перемен. Между SS сс Внутри SS сс F значим. P
x1 69.36378 5 1 0.63622 75 97.8220 0.000000
x2 62.00539 5 17.9946 75 51.686( 0.000000
x3 70.5585 5 9.441 4i 75 1 12.0981 0.00000
x4 68.73715 5 1 1.26285 75 91.5451 0.000000
x5 67.29769 5 12.7023 75 79.4710 0.000000
Рис. 3. Анализ дисперсий. Расстояние между кластерами
Данный метод выделил Краснодарский край в качестве отдельного кластера, который отличается в лучшую сторону от группы регионов с очень высоким финансово-экономическим состоянием отрасли. В остальном же его результаты схожи с первым методом.
Далее был использован алгоритм нечеткой кластеризации (fuzzy c-means) и производилось сравнение полученных результатов. Главным достоинством данного метода является использование понятия нечеткости при определении принадлежности к определенному кластеру. Нечеткая кластеризация методом средних была проведена командой «fcm» Matlab. В качестве параметров минимизирующей функции выбирались параметры, предлагаемые по умолчанию. Средние значения для каждого полученного кластера (центр кластера) подтвердили гипотезу о существовании пяти кластеров. Анализируя матрицу принадлежности регионов к конкретному кластеру и центры кластеризации, стоит отметить, что алгоритм нечеткой кластеризации, используя понятия нечеткости, сумел лучше выделить кластеры и более «равномерно» распределил объекты наблюдений.
В целом, явно выделяются кластеры с низким и высоким финансово-экономическим состоянием. Остальные же кластеры можно охарактеризовать как «Среднее состояние» и провести дополнительную кластеризацию по этой группе. Используя результаты трех методов кластеризации, была составлена таблица, которая выделяет 18 регионов, относящихся к кластеру «Высокое» и «Низкое» (табл. 2). Да-
лее методом к-средних была проведена кластеризация оставшихся 62 регионов (рис. 4).
График средних для кажд. кл.
1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0
\ / \ \ /' 1
\ /' » V' »
J=f >
----о
/ V
x1
x2 x3
Перемен.
x4
x5
-О- Кластер 1 Кластер 2 Ч> Кластер 3
Рис. 4. График средних значений кластеров
Заключение. В ходе исследования нами были достигнуты следующие результаты: выполнен анализ состояния отрасли растениеводства в регионах России, разработан комплекс статистических показателей оценки состояния отрасли в регионах, проведен предварительный анализ показателей. Проведена кластеризация регионов по выделенным факторам тремя методами. Таким образом, используя результаты кластерного анализа, подтверждена гипотеза о существовании пяти кластеров регионов РФ в отрасли растениеводства:
- «Высокий» - содержит в себе группу регионов с высоким финансово-экономическим состоянием отрасли растениеводства (11 регионов);
Таблица 2
Кластеризация. Метод fuzzy c-means
Кластер Регион Всего
Высокое Краснодарский край, Воронежская обл., Волгоградская обл., Ростовская обл., Ставропольский край, Республика Башкортостан, Республика Татарстан, Оренбургская обл., Саратовская обл., Алтайский край, Омская обл. 11
Низкое Республика Карелия, Архангельская обл., Ненецкий АО, Мурманская обл., Ханты-Мансийский АО, Ямало-Ненецкий АО, Хабаровский край, Магаданская обл. 8
Выше среднего (кластер 1) Белгородская обл., Красноярский край, Курганская обл., Курская обл., Липецкая обл., Московская обл., Нижегородская обл., Новосибирская обл., Орловская обл., Пензенская обл., Самарская обл., Тамбовская обл., Тюменская обл., Челябинская обл. 14
Среднее (кластер 2) Амурская обл., Астраханская обл., Брянская обл., Владимирская обл., Вологодская обл., Еврейская автономная обл., Иркутская обл., Калужская обл., Камчатский край, Кабардино-Балкарская Республика, Кемеровская обл., Кировская обл., Костромская обл., Ленинградская обл., Новгородская обл., Приморский край, Республика Адыгея, Республика Алтай, Республика Бурятия, Республика Дагестан, Республика Калмыкия, Республика Мордовия, Республика Хакасия, Рязанская обл., Свердловская обл., Смоленская обл., Тверская обл., Тульская обл., Удмуртская Республика, Ульяновская обл., Чувашская Республика 32
Ниже среднего (кластер 3) Забайкальский край, Ивановская обл., Калининградская обл., Карачаево-Черкесская Республика, Пермский край, Псковская обл., Республика Ингушетия, Республика Коми, Республика Марий Эл, Республика Саха (Якутия), Республика Северная Осетия-Алания, Республика Тыва, Сахалинская обл., Томская обл., Чеченская Республика, Чукотский АО 16
- «Выше среднего» - содержит в себе группу регионов с состоянием выше среднего отрасли растениеводства (14 регионов);
- «Средний» - содержит в себе группу регионов со средним финансово-экономическим состоянием отрасли растениеводства (32 региона);
- «Ниже среднего» - содержит в себе группу регионов с состоянием ниже среднего отрасли растениеводства (16 регионов);
- «Низкий» - содержит в себе группу регионов с «низким финансово-экономическим состоянием отрасли растениеводства (8 регионов).
В дальнейшем, опираясь на результаты кластерного анализа и экспертные заключения, необходимо выполнить следующий этап
моделирования, связанный с методами факторного анализа, разработкой дискриминант-ных моделей и нечеткой продукционной системы. Эти модели позволят более точно и эффективно оценивать как отрасль растениеводства в целом, так и каждый регион РФ.
Список литературы
1. Халафян А.А. STATISTICA 6. Статистический анализ данных. 3-е изд. учеб. М.: Бином-Пресс, 2007. 512 с.
2. Леоненков А.В. Нечёткое моделирование в среде MATLAB и fUzzyTECH. СПб.: БХВ-Петербург, 2007. 736 с.
3. Центральная база статистических данных // Федеральная служба государственной статистики. URL: http//www.gks.ru (дата обращения: 01.04.2013).
Clustering and its application for financial and economic analysis of the plant industry of the Russian regions Gromov V.
The complex mathematical modeling, multivariate statistical analysis, and fuzzy sets were used to analyze the financial and economic state of the plant industry of Russian regions. Based on the results of cluster analyses the clustering of Russia regions on selected factors into five groups was done. Qualitative and quantitative characteristics of each cluster were received.
Key words: modeling, financial and economic situation, clustering, fuzzy sets, agriculture, regions of the Russian Federation