Научная статья на тему 'Применение карт Кохонена для анализа основных социально-экономических показателей административных районов Ставропольского края'

Применение карт Кохонена для анализа основных социально-экономических показателей административных районов Ставропольского края Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1170
170
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КЛАСТЕРНЫЙ АНАЛИЗ / КАРТА КОХОНЕНА / СОЦИАЛЬНОЭКОНОМИЧЕСКИЕ ПОКАЗАТЕЛИ / CLUSTER ANALYSIS / KOHONEN MAPS / SOCIO-ECONOMIC INDICATORS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Мамаев Иван Иванович, Сахнюк Павел Анатольевич, Сахнюк Татьяна Ивановна

Целью работы является кластеризация районов Ставропольского края по комплексу основных социально-экономических показателей. В качестве инструмента кластерного анализа используется нейронная сеть Кохонена, эмулируемая аналитической платформой Deductor Studio. На основе выбранных авторами параметров обучения нейронной сети получено разбиение административных районов Ставропольского края на 4 кластера по уровню их социальноэкономического развития. Лидеры: Буденовский, Изобильненский, Минераловодский районы; на втором месте: Кочубеевский, Красногвардейский, Шпаковский районы, отстающие: Андроповский, Апанасенковский, Арзгирский, Ипатовский, Новоалександровский, Новоселицкий, Труновский, Левокумский, Степновский, Туркменский районы; аутсайдеры: Александровский, Благодарненский, Георгиевский, Грачёвский, Кировский, Курский, Нефтекумский, Петровский, Предгорный, Советский районы. На основе визуализации многомерных данных с помощью самоорганизующихся карт Кохонена, профилей кластеров и кросс-диаграммы проведен анализ полученных кластеров в аналитической платформе Deductor Studio. Объективность полученных авторами результатов подтверждается их идентичностью с результатами кластерного анализа с помощью алгоритма k-means.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Мамаев Иван Иванович, Сахнюк Павел Анатольевич, Сахнюк Татьяна Ивановна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF KOHONEN MAPS FOR THE ANALYSIS OF THE MAIN SOCIO-ECONOMIC INDICATORS OF THE ADMINISTRATIVE DISTRICTS OF THE STAVROPOL TERRITORY

The aim of the work is the clustering of regions of Stavropol Krai on a complex of the main socio-economic indexes. As a tool for cluster analysis using Koho-nen neural network, emulated by the analytical Deductor Studio platform. On the basis of the selected by the authors of the parameters of the neural network training received a partition of the administrative districts of the Stavropol territory on the 4 cluster in the level of their socio-economic development. Leaders Budenovsky, Izobilnensky, Mineralovodsky areas, on the second place: Kochubeevsky, Krasnogvardeysky, Shpakovsky areas lagging: Andropov, Apanasenkovskij, Arzgirsky, Ipatovskaya, Novoaleksandrovsk, Novoselytsya, Trunovskogo, Levokumskoe, Stepnovskogo, Turkmen areas; outsiders Alexandra, Blagodarnenskogo, George, Grachevsky, Kirov, Kursk, Neftekumsk, Petrovsky, Foothill, the Soviet areas. On the basis of visualization of multidimensional data by means of Kokhonen's self-organizing cards, profiles of clusters and the cross-chart the analysis of the received clusters in the analytical Deductor Studio platform is carried out. Objectivity of the results received by authors is confirmed by their identity with results of cluster analysis by means of algorithm of k-means.

Текст научной работы на тему «Применение карт Кохонена для анализа основных социально-экономических показателей административных районов Ставропольского края»

УДК 338.001.36 ПРИМЕНЕНИЕ КАРТ КОХОНЕНА ДЛЯ АНАЛИЗА ОСНОВНЫХ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ПОКАЗАТЕЛЕЙ АДМИНИСТРАТИВНЫХ РАЙОНОВ СТАВРОПОЛЬСКОГО КРАЯ

Мамаев И.И., Сахнюк П.А., Сахнюк Т.И.

Целью работы является кластеризация районов Ставропольского края по комплексу основных социально-экономических показателей. В качестве инструмента кластерного анализа используется нейронная сеть Кохонена, эмулируемая аналитической платформой Deductor Studio. На основе выбранных авторами параметров обучения нейронной сети получено разбиение административных районов Ставропольского края на 4 кластера по уровню их социальноэкономического развития. Лидеры: Буденовский, Изобильненский, Минерало-водский районы; на втором месте: Кочубеевский, Красногвардейский, Шпаков-ский районы, отстающие: Андроповский, Апанасенковский, Арзгирский, Ипа-товский, Новоалександровский, Новоселицкий, Труновский, Левокумский, Степновский, Туркменский районы; аутсайдеры: Александровский, Благодар-ненский, Георгиевский, Грачёвский, Кировский, Курский, Нефтекумский, Петровский, Предгорный, Советский районы. На основе визуализации многомерных данных с помощью самоорганизующихся карт Кохонена, профилей кластеров и кросс-диаграммы проведен анализ полученных кластеров в аналитической платформе Deductor Studio. Объективность полученных авторами результатов подтверждается их идентичностью с результатами кластерного анализа с помощью алгоритма k-means.

Ключевые слова: кластерный анализ, карта Кохонена, социальноэкономические показатели.

APPLICATION OF KOHONEN MAPS FOR THE ANALYSIS OF THE MAIN SOCIO-ECONOMIC INDICATORS OF THE ADMINISTRATIVE DISTRICTS OF THE STAVROPOL TERRITORY

Mamaev I.I., Sahnyuk P.A., Sahnyuk T.I.

The aim of the work is the clustering of regions of Stavropol Krai on a complex of the main socio-economic indexes. As a tool for cluster analysis using Koho-nen neural network, emulated by the analytical Deductor Studio platform. On the basis of the selected by the authors of the parameters of the neural network training received a partition of the administrative districts of the Stavropol territory on the 4 cluster in the level of their socio-economic development. Leaders Budenovsky, Izo-bilnensky, Mineralovodsky areas, on the second place: Kochubeevsky, Krasnogvar-deysky, Shpakovsky areas lagging: Andropov, Apanasenkovskij, Arzgirsky, Ipatovs-kaya, Novoaleksandrovsk, Novoselytsya, Trunovskogo, Levokumskoe, Stepnovsko-go, Turkmen areas; outsiders Alexandra, Blagodarnenskogo, George , Grachevsky, Kirov, Kursk, Neftekumsk, Petrovsky, Foothill, the Soviet areas. On the basis of visualization of multidimensional data by means of Kokhonen's self-organizing cards, profiles of clusters and the cross-chart the analysis of the received clusters in the analytical Deductor Studio platform is carried out. Objectivity of the results received by authors is confirmed by their identity with results of cluster analysis by means of algorithm of k-means.

Keywords: cluster analysis, Kohonen maps, socio-economic indicators.

Целью работы является кластеризация районов Ставропольского края по комплексу основных социально-экономических показателей и отнесение их к наиболее и наименее благополучным. В качестве инструмента кластерного анализа будем использовать нейронную сеть Кохонена, достоинством которой по

сравнению с другими алгоритмами является возможность визуального анализа многомерных данных.

Рис. 1. Структура самоорганизующейся сети Кохонена Самоорганизующийся слой Кохонена (рис. 1) - это однослойная нейронная сеть с конкурирующей передаточной функцией, которая анализирует выходные значения нейронов слоя и выдаёт в качестве результата наибольшее из этих значений (значение нейрона-победителя). Веса синаптических связей нейронов образуют вектор ж = [жх,ж2,...,ж т] [2]. После нормализации входных векторов при активации сети вектором х в конкурентной борьбе побеждает тот нейрон, веса которого в наименьшей степени отличаются от соответствующих компонентов этого вектора. Для ж-го нейрона-победителя выполняется отношение

й&Жж) = тт Л(хж), (1)

1<;<и

где d (х, ж) обозначает расстояние (в смысле выбранной метрики) между векторами х и ж, а п - количество нейронов. Вокруг нейрона-победителя образуется топологическая окрестность Sw(k) с определенной энергетикой, уменьшающейся с течением времени. Нейрон-победитель и все нейроны, лежащие в пределах его окрестности, подвергаются адаптации, в ходе которой их векторы весов изменяются в направлении вектора х по правилу Кохонена:

ж(1с +1) = ж(1с) + (1с)[х - ж (1с)] (2)

для I е (к), где 77. (к) - коэффициент обучения 1-го нейрона из окрестности

Sw (k )в к момент времени. Значение 77. (k) уменьшается с увеличением расстояния между i-м нейроном и победителем. Веса нейронов, находящихся за пределами Sw (k), не изменяются. Размер окрестности и коэффициенты обучения нейронов являются функциями, значения которых уменьшаются с течением времени. Адаптация по формуле (2) эквивалентна градиентному методу обучения, основанному на минимизации целевой функции

E(w) =1 £S, (x(k))[x(k) - Wj(k)]2, (3)

2 i, j ,k

где St (x(k) представляет собой функцию определения окрестности, изменяющуюся в процессе обучения. За счет этого SOM (Self Organizing Maps - SOM) можно считать одним из методов проецирования многомерного пространства в пространство с более низкой размерностью. Поэтому обучение по Кохонену напоминает натягивание эластичной сетки прототипов на массив данных из обучающей выборки. При использовании этого алгоритма вектора, схожие в исходном пространстве, оказываются рядом и на полученной карте.

Карты Кохонена позволяют также представить полученную информацию в простой и наглядной форме путем нанесения раскраски. Для этого раскрашиваем узлы карты цветами, соответствующими интересующим нас признакам объектов. Каждый признак данных порождает свою раскраску ячеек карты - по величине среднего значения этого признака у данных, попавших в данную ячейку. Собрав воедино карты всех интересующих нас признаков, получим топографический атлас, дающий интегральное представление о структуре многомерных данных (рис. 3) [3].

Для проведения анализа применяется рабочее место аналитика Deductor Studio, которое входит в состав аналитической платформы Deductor [1]. Данное приложение содержит набор механизмов импорта, обработки, визуализации и экспорта данных для быстрого и эффективного анализа информации. Будем использовать 14 наиболее важные показателя социально-экономического положения административных районов края (рис. 4, 5) [6], которые представим отно-

сительными величинами интенсивности в зависимости от численности населения. Такой перевод является важным для объективной оценки территорий по уровню социально-экономического развития. Анализ других показателей затрудняется отсутствием числовых или категорийных значений по районам края.

Осетия-Алания

Рис. 2. Кластеризация районов Ставропольского края по социальноэкономическому положению за 2010 г. с указанием плотности населения

Таблица 1

Результаты кластеризации районов Ставропольского края

N п/п кластер 3 кластер 1 кластер 2 кластер 0

1. Александровский Андроповский Кочубеевский Буденовский

2. Благодарненский Апанасенковский Красногвардейский Изобильненский

3. Г еоргиевский Арзгирский Шпаковский Минераловодский

4. Г рачёвский Ипатовский

5. Кировский Новоалександровский

6. Курский Новоселицкий

7. Нефтекумский Труновский

8. Петровский Левокумский

9. Предгорный Степновский

10. Советский Туркменский

Карта Кохонена х| Профили кластеров х Kyd х|

■у 1=1 tf1 a1 S - а-^ £ О. ®. я 'Й

Среднегодовая численность зг Среднемесячная номинальная х| Сальдированный Финансовый х| Инвестиции в основной капит> х| Объем отгруженных товаров - х|

1 Буденовск \ Изоби ; кощ красногв Шпг У Мин НЫ5 J Кощ КЬасногв Шпг / Мин 1 Кощ Красногв Шпг 1 Буденовск Ч Изоби ж - ж- КЬасногв Шпг 1 Буденовск V' Изоби я —V ( Мин ') Кот Красногв Шпг

8,5779 15.647 |18,951122,715* 8,842 |12,583|636 18,43 -4.8869 |11.194| 20.844 46,575 5.3466 41,167 17Б.988 ( 122,7031 116.57 232,?'

Производство и распределена х| Ввод в действие общей плоша. х I Оборот розничной торговле ^_x] Производство продукции сель ХІ Производство продукции селі ХІ

г ^ - £ ИММНМ!Ш j Коф Красногв Шпг 1 Буденовск ^ Р Коч^ Красногв Шпг 1. Буденовск \ Изоби 1 ) Коч^ Красногв Шп; і Буденовск \ Изоби ( Мин ) Коч^ Красногв Шп;

и,Р78^| 63,058 125,55' 'jl 3.^81 52.081 101,05' |т 5,5441 28.668 43,644' 1,5467 6.7054 111.864 [ 1,813|2.876Э| 4.0976 6.3815

Производство (реализация) нёх| Производство молока, тонн JiJ Производство яиц куриных, ты_х| Производство шерсти, тонн ЛІ Кластеры ЛІ

1 Буденовск \ Изоби / Мин ) К°^ (Срасногв Шпг L. Буденовск ^ , S Коф Красногв Шпг Красногв Шпг \ к Коа ~ З Кочз Красногв Шпг

2.4794 30,30^ 39,2871 58,135' 1,2537 4,75|5,S098| 8,2602' 1.15| 4,81271 9.7193 18,28?' 0.392161 23.085 46,063 0 1 [2] з'

Рис. 3. Карты Кохонена показателей социально-экономического положения

районов

На рис. 3 курсивом выделены сокращенные названия районов представителей кластера 0, подчеркнуты - представители кластера 2, по оси Х выделены значения для Красногвардейского района.

Рис. 4. Профили кластеров районов Ставропольского края по показателям уровня социально-экономического положения

Рис. 5. Нормализованная столбчатая диаграмма кластеров по показателям уровня социально-экономического положения районов края

Результаты по сформированным кластерам наиболее удобно рассматриваются с помощью визуализатора "Куб", в котором встроена кросс-диаграмма, изображающая полученные кластеры в графическом виде, что существенно упрощает анализ.

Как видно из рисунка 5, явным лидером является кластер 0. Высокие интегральные показатели социально-экономического положения в котором, получены не за счет результатов сельскохозяйственной деятельности.

Вторым по уровню социально-экономического положения является кластер 2. Его можно охарактеризовать высокими уровнями инвестиций в основной капитал, темпов строительства, результатов сельскохозяйственной деятельности и одновременно низкими значениями объема отгруженных товаров, производства и распределения электроэнергии, газа и воды, невысоким сальдированным финансовым результатом. Уровень занятости и заработанной платы также невысокие.

На третьем месте расположился кластер 1: при высоких значениях показателей сельскохозяйственной деятельности наблюдается низкий уровень производства продукции сельского хозяйства на 100 га посевных площадей, что говорит о низкой производительности труда. Как следствие: при высокой численности занятых в организациях - низкая заработанная плата.

Аутсайдером являются представители третьего кластера с низкими уровнями значений почти по всем показателям.

В качестве заключения можно отметить что, качество проведения кластерного анализа значительно увеличится в случае наличия большего числа показателей, по которым есть числовые или категорийные значения [4, 5]. Однако наибольшее влияние на полученные результаты оказывает квалификация и интуиция эксперта-аналитика. Именно он решает, на сколько кластеров необходимо разбить исследуемый набор данных, и какие свойства будут основными при построении кластера. Большое значение на способность обобщения при помощи полученной карты оказывает подходящий выбор начального радиуса

обучения нейронов. Удачно выбранный способ инициализации карты (из обучающего множества или из собственных векторов) может существенно ускорить обучение и привести к получению более качественных результатов.

Для проверки полученных результатов проведен кластерный анализ с помощью алгоритма k-means, также реализуемого Deductor Studio. Полное совпадение результатов кластеризации свидетельствует об их объективности.

Полученная объективная информация может быть использована для выработки стратегии и принятия управленческих решений по развитию районов Ставропольского края.

Список литературы

1. BaseGroup Labs. Технологии анализа данных: сайт. URL:

http://www.basegroup.ru (дата обращения: 06.12.2012).

2. Осовский С. Нейронные сети для обработки информации / Пер. с польского И.Д. Рудинскго. М.: Финансы и статистика, 2002. 344 с.

3. Паклин Н.Б., Орешков В.И. Бизнес аналитика: от данных к знаниям: Учебное пособие 2-е изд., перераб. и доп. СПб.: Петербург, 2010. 704 с.

4. Сахнюк Т.И. Организационно-экономический механизм функционирования природоохранной деятельности: монография. Ставрополь: Бюро новостей, 2011. 156 с.

5. Сахнюк Т.И., Сахнюк П.А. Кластерный анализ состояния окружающей среды субъектов федерации юга России // Научный журнал КубГ АУ [Электронный ресурс]. Краснодар: КубГАУ, № 82(08), октябрь, 2012. Шифр Информреги-стра: 0421100012\0319. Режим доступа: http://ej.kubagro.ru/2012/08/pdf/37.pdf

6. Ставропольский край в цифрах, 2011. Статистический ежегодник/ Территориальный орган федеральной службы государственной статистики по Ставропольскому краю. 2011. 288 с.

References

1. BaseGroup Labs. Tekhnologii analiza dannykh [BaseGroup Labs. Technology analysis]. http://www.basegroup.ru (accessed December 06, 2012).

2. Osovskiy S. Neyronnye seti dlya obrabotki informatsii [Neural networks for information processing]. Moscow: Finance and Statistics, 2002. 344 p.

3. Paklin N.B., Oreshkov V.I. Biznes analitika: ot dannykh k znaniyam [Business Intelligence: From Data to Knowledge]. St.: St. Petersburg, 2010. 704 p.

4. Sakhnyuk T.I. Organizatsionno-ekonomicheskiy mekhanizm funktsioni-rovaniya prirodookhrannoy deyatel'nosti [Organizational-economic mechanism of the environmental]. Stavropol News Bureau, 2011. 156 p.

5. Sakhnyuk T.I., Sakhnyuk P.A. Klasternyy analiz sostoyaniya okruzhayush-chey sredy sub"ektov federatsii yuga Rossii [Cluster analysis of the environment of the federal subjects of southern Russia]. Nauchnyy zhurnal KubGAU, no. 82 (October, 2012). http://ej.kubagro.ru/2012/08/pdf/37.pdf

6. Stavropol'skiy kray v tsifrakh, 2011. Statisticheskiy ezhegodnik [Stavropol region in figures, 2011. Statistical Yearbook]. Territorially organ federal'noy sluzh-by gosudarstvennoy statistiki po Stavropol'skomu krayu [Territorial body of the Federal State Statistics Service of the Stavropol Region].2011 288 p.

ДАННЫЕ ОБ АВТОРАХ

Мамаев Иван Иванович, заведующий кафедрой «Математика», доцент Ставропольский государственный аграрный университет пер. Зоотехнический, д.12, г. Ставрополь, Ставропольский край, 355017, Россия

e-mail: pav-sahnyuk@yandex. ru

Сахнюк Павел Анатольевич, доцент кафедры «Информационные системы и технологии», кандидат технических наук, доцент Ставропольский государственный аграрный университет

пер. Зоотехнический, д.12, г. Ставрополь, Ставропольский край, 355017, Россия

e-mail: pav-sahnyuk@yandex. ru

Сахнюк Татьяна Ивановна, доцент кафедры «Менеджмент», кандидат экономических наук, доцент

Ставропольский государственный аграрный университет пер. Зоотехнический, д.12, г. Ставрополь, Ставропольский край, 355017, Россия

e-mail: shapysa@mail. ru DATA ABOUT THE AUTHORS

Mamaev Ivan Ivanovich, Head of the "Mathematics", Associate Professor

Stavropol State Agrarian University

per. Zootechnical, 12, Stavropol, Stavropol Territory, 355017, Russia e-mail: pav-sahnyuk@yandex. ru

Sahnyuk Pavel Anatolyevich, Associate Professor of "Information systems and technologies", candidate of technical sciences, Associate Professor

Stavropol State Agrarian University

per. Zootechnical, 12, Stavropol, Stavropol Territory, 355017, Russia e-mail: pav-sahnyuk@yandex. ru

Sahnyuk Tatiana Ivanovna, Associate Professor of "Management", PhD, Associate Professor

Stavropol State Agrarian University

per. Zootechnical, 12, Stavropol, Stavropol Territory, 355017, Russia e-mail: shapysa@mail. ru

Рецензент:

Тарасенко Надежда Васильевна, доктор экономических наук, профессор, заведующий кафедрой государственного и муниципального управления ФГОБУ ВПО «Ставропольский государственный аграрный университет»

i Надоели баннеры? Вы всегда можете отключить рекламу.