УДК 348
А.Ю. Трусова, А.И. Ильина, Д.Е. Люкшин*
ПРИВОЛЖСКИЙ ФЕДЕРАЛЬНЫЙ ОКРУГ И ЕГО СОЦИАЛЬНО-ЭКОНОМИЧЕСКИЕ ПОКАЗАТЕЛИ В ФОКУСЕ МНОГОМЕРНОГО ШКАЛИРОВАНИЯ
В работе средствами метрического и неметрического шкалирования рассчитаны координаты стимулов объектов - субъектов ПФО за 2016 год, визуализированы исходные многомерные данные. Проведена кластеризация субъектов ПФО, учитывая меру сходства и различия.
Ключевые слова: метрическое и неметрическое шкалирование, координаты стимулов, кластеризация субъектов ПФО.
Государственная социально-экономическая политика РФ заключается в постоянном развитии регионов, государственных, экономических и социальных подразделений. Важную роль в развития благосостояния государства в целом играет отдельный федеральный округ. В настоящее время вопросы, связанные с совершенствованием региональной политики в сферах экономики, играют первостепенное значение. Органы государственной статистики ведут постоянный учет социально-экономических показателей как на государственном, так и на региональном уровне. Документально оформленные статистические данные позволяют проводить глубокий анализ с использованием математических методов и информационных технологий. В этой связи изучение социально-экономических показателей федеральных округов является актуальным и практически значимым. В работе в качестве объекта статистического исследования рассматривается Приволжский федеральный округ (ПФО), включающий в себя 14 объектов. Каждый объект ПФО (республика, область) характеризуется большим числом показателей, что, с одной стороны, затрудняет выбор приоритетных характеристик, с другой стороны, усложняет комплексный подход при разработке генеральной концепции развития как региона в целом, так и отдельного его субъекта. В этой связи математический аппарат многомерного анализа в сочетании с информационными технологиями позволяет решить задачу комплексного анализа всех показателей с сохранением позиции отдельного субъекта в общей структуре ПФО, а также структурировать комплексно как показатели, так и объекты в одном пространстве, что позволяет выбрать ключевые показатели и кластеризовать объекты в пространстве приоритетных характеристик. Известно, что монотетический подход имеет существенные ограничения. Изучая отдельно каждый показатель, можно проследить его специфическую тенденцию, однако обнаружить воздействие этого показателя и его проявление в среде субъектов ПФО является весьма затруднительным. Многомерный статистический анализ способствует выявлению групп ведущих и слабых показателей с одновременным описанием всех объектов в пространстве этих показателей. Таким образом, научной новизной является совместное изучение показателей и описание субъектов ПФО в теоретическом пространстве стимулов средствами метрического и неметрического шкалирования. Кроме того, многомерный подход позволяет визуализировать данные и соотнести их, например, в двумерном пространстве стимулов, соотнести взаимное расположение относительно идеального образа. Выявить геометрическую кластеризацию изучаемых объектов в теоретическом пространстве стимулов. В многомерном шкалировании основным понятием является мера сходства или мера различия как объектов, так и показателей их описывающих. В качестве метрик используются Евклидова метрика простая и взвешенная и другие, однако при расчете метрик как сходства, так и различия используются разные показатели, в частности, в поиске индивидуальных предпочтений и поиске идеальных точек могут быть использованы гипотетические (теоретические) показатели, которые могут рассматриваться как
* © Трусова А.Ю., Ильина А.И., Люкшин Д.Е., 2017
Трусова Алла Юрьевна ([email protected]), Ильина Алла Ивановна ([email protected]), Люкшин Данила Евгеньевич ([email protected]), кафедра математики и бизнес-информатики, Самарский национальный исследовательский университет имени академика С.П. Королева, 443086, Российская Федерация, г. Самара, Московское шоссе, 34.
идеальные. В этой связи интересным представляется рассмотрение взаимного расположения субъектов относительно идеальной точки, что способствует формированию прогнозных показателей исходного пространства данных. Математический аппарат метрического и неметрического шкалирования достаточно полно изучен и обстоятельно представлен в научной литературе. В работе проведен анализ показателей ПФО за 2016 год, представленный в официальном статистическом сборнике. В качестве объектов исследования выбраны районы Приволжского федерального округа (14 объектов). В качестве показателей выбраны социально-экономические, описывающие данные региона. Данные взяты из Всероссийского статистического ежегодника за 2017 год.
Для анализа были выбраны следующие показатели: Х] - Численность населения (тыс. чел.), Х2 -Численность рабочей силы (тыс. чел.), Х3 - Валовой региональный продукт (млн руб.), Х4 - Инвестиции в основной капитал (млн руб.), Х5 - Число предприятий и организаций, Х6 - Индекс промышленного производства (процент к предыдущему году), Х7 - Индекс производства продукции сельского хозяйства (процент к предыдущему году), Х8 - Объем отгруженных товаров собственного производства, выполненных работ и услуг собственными силами (млн руб.). В таблице 1 представлены нормализованные исходные данные.
Таблица 1
Нормализованные исходные данные за 2016 год по ПФО
Субъекты ПФО Х1 Х2 Х3 Х4 Х5 Х6 Х7 Х8
Республика Башкортостан 1,72 1,54 1,18 1,12 0,79 -0,34 -0,67 -0,74
Республика Марий Эл -1,26 -1,28 -1,05 -0,87 -1,08 0,16 -1,47 0,99
Республика Мордовия -1,15 -1,12 -1,01 -0,72 -1,06 -1,40 0,31 -0,95
Республика Татарстан 1,56 1,62 2,17 2,80 1,91 -0,34 -0,16 -0,94
Удмуртская республика -0,53 -0,51 -0,41 -0,53 -0,39 0,32 -0,87 2,18
Чувашская республика -0,78 -0,78 -0,88 -0,74 -0,82 1,20 -0,73 -0,30
Кировская область 0,45 0,35 0,66 0,38 0,63 1,15 -0,85 -0,88
Нижегородская область -0,73 -0,72 -0,83 -0,72 -0,54 -0,93 -0,19 0,87
Оренбургская область 1,00 1,13 0,70 0,28 1,25 0,11 -0,79 -0,80
Пензенская область -0,11 -0,16 0,13 -0,05 -0,41 0,83 0,75 0,91
Пермский край -0,68 -0,67 -0,72 -0,65 -0,80 -1,86 0,10 -0,07
Самарская область 0,96 1,11 1,03 0,50 1,42 0,59 1,44 -0,84
Саратовская область 0,32 0,23 -0,18 -0,17 -0,21 -0,85 1,45 0,99
Ульяновская область -0,76 -0,76 -0,79 -0,62 -0,697 1,36 1,69 -0,41
Средствами многомерного шкалирования рассчитаны координаты субъектов ПФО в пространстве стимулов. С использованием меры сходства и различий полученные координаты отражены в таблице 2.
Таблица 2
Координаты стимулов и субъектов ПФО за 2016 год
Субъекты ПФО Координаты стимулов (мера различий) Координаты стимулов (мера сходства)
Шкала 1 Шкала 2 Шкала 1 Шкала 2
Республика Башкортостан 2,0102 0,2521 0,78 0,134
Республика Марий Эл -1,8437 0,9077 -0,699 0,397
Республика Мордовия -1,4518 -0,9016 -0,698 -0,325
Республика Татарстан 3,1436 0,0633 1,212 -0,014
Удмуртская республика -1,1123 1,0922 -0,334 0,565
Чувашская республика -1,0731 0,4748 -0,38 0,309
Кировская область 0,9110 0,4854 0,349 0,338
Окончание табл. 2
Субъекты ПФО Координаты стимулов (мера различий) Координаты стимулов (мера сходства)
Шкала 1 Шкала 2 Шкала 1 Шкала 2
Нижегородская область -1,2070 0,0876 -0,497 0,031
Оренбургская область 1,4226 0,4085 0,552 0,196
Пензенская область -0,2848 -0,1062 -0,049 -0,043
Пермский край -1,1141 -0,5118 -0,573 -0,2
Самарская область 1,6795 -0,6796 0,624 -0,372
Саратовская область -0,0918 -0,8478 0,004 -0,413
Ульяновская область -0,9884 -0,7246 -0,293 -0,602
Средствами многомерного шкалирования осуществлена визуализация данных в двумерном пространстве стимулов с учетом меры сходства и различий. На рисунках 1 и 2 представлено взаимное расположение субъектов ПФО в теоретическом пространстве с учетом меры различия и меры сходства. Как видно из взаимного расположения изучаемых объектов - субъектов ПФО, они могут быть сгруппированы по группам (кластерам) с учетом схожести их по показателям, а также с учетом различий между изучаемыми объектами.
Субъекты ПФО в теоретическом пространстве
Удмуртская 1,5 Республика
Ф Республика 1 Марий-Эл
Чувашская ^ о 5 Республика
Нижегородсн область
ая
Кировская область
Республика
Оренбургская ♦ Татарстан
область Республика
Рис. 1. Субъекты ПФО в теоретическом пространстве (мера различий)
Одновременный анализ таблицы 1 и рисунков 1 и 2 свидетельствует, что по первой шкале первую группу формируют такие субъекты, как Пензенская область и Саратовская область. Вторую группу образуют Кировская область, Оренбургская область и Самарская область, третью группу - Республика Башкортостан и Республика Татарстан, остальные субъекты входят с четвертую группу по первой шкале. По второй шкале первую группу в теоретическом пространстве стимулов формируют Республика Татарстан, Нижегородская область и Пензенская область. Чувашская область, Кировская и Оренбургская области образуют вторую группу. Республика Марий Эл и Удмуртская республика объединяются в третью группу. Остальные субъекты ПФО включаются в четвертую группу по изучаемым показателям.
Как видно из рис. 3, лидирующими показателями являются индекс промышленного производства и объем отгруженных товаров собственного производства, выполненных работ и услуг собственными силами. Индекс производства продукции сельского хозяйства сохраняет положительную тенденцию только по одной шкале. Инвестиции в основной капитал и валовой региональный продукт также только по одной шкале сохраняют положительную оценку. Остальные показатели демонстрируют слабо удовлетворительную оценку.
Субъекты ПФО в Удмуртская 0,8 Республика + 0,6 Республика Чувашская ^Мари°-4л Республика 0,2 гч Нижегородская ™ область п теоретическом пространстве Кировская область ♦ ^ ф Республика Оренбургская Республика Татарстан
(В 0 * 3-1 -0,5 Пензе Пермский край -0рБл ♦ Республика -0,4 < Мордовия ♦ -0,6 Ульяновск обЛарь область Башкортостан нская 0,5 1 1,5 асть _ Самарская Саратовская ф , область область ая Шкала 1
Рис. 2. Субъекты ПФО в теоретическом пространстве (мера сходства)
Социально-эконог в тео| 0,8 0,6 Х4 0,4 ^ 0 2 Х3 0,2 0 мические показатели ПФО за 2016 год эетическом пространстве ♦ Х6 ♦ Х8
<5 Х5 и |0,6 -0,% -0,2 -0 2 ( Ш Х1 Х2 -0,4 -0,6 -0,8 -1 0,2 0,4 0,6 0,8 1 1,2 ♦ Х7 Шкала 1
Рис. 3. Социально-экономические показатели ПФО за 2016 год в теоретическом пространстве
На рис. 4 представлены изучаемые показатели в пространстве латентных факторов. Первый фактор имеет высокие коэффициенты корреляции практически со всеми изучаемыми показателями, второй латентный фактор имеет максимальную корреляцию с индексом сельскохозяйственного производства. В качестве доминирующих показателей в теоретическом пространстве рекомендуется выбрать валовой региональный продукт и индекс производства продукции сельского хозяйства. Эти показатели позволяют группировать субъекты ПФО в теоретическом пространстве стимулов.
Рис. 4. Социально-экономические показатели в пространстве главных компонент
Группировка субъектов ПФО в теоретическом пространстве позволяет описать их с использованием эмпирических характеристик. Учитывая максимальную корреляцию изучаемых показателей со шкалами теоретического пространства, оцененную методом главных компонент, можно усреднить отдельные показатели, характеризующие кластеры. В таблицах 3 и 4 представлены средние величины максимально коррелирующих показателей с теоретическими латентными факторами. В частности, такие показатели, как численность рабочей силы, валовой региональный продукт, инвестиции в основной капитал и число предприятий и организаций, вносят основной вклад в шкалу 1.
Индекс производства продукции сельского хозяйства является определяющим шкалу 2. Таким образом, учитывая, что разные субъекты ПФО образуют группы по шкале 1 и шкале 2, можно выявить перспективные экономические отношения, которые необходимо развивать между субъектами ПФО.
Таблица 3
Средние величины доминирующих показателей по шкале 1
Показатели шкалы 1 Х2 Хз Х4 Х5
1 группа по шкале 1 1127 696179 155064 45265,5
2 группа по шкале 1 1614,67 1119206 237815 99604,3
3 группа по шкале 1 2034,5 1575323 501720 109250
4 группа по шкале 1 612,714 287920 57429,7 27696,9
Таблица 4
Средние величины доминирующего показателя по шкале 2
Показатель шкалы 2 Х7
1 группа по шкале 2 106,267
2 группа по шкале 2 100,1
3 группа по шкале 2 97,6
4 группа по шкале 2 110,217
Субъекты ПФО в Пензенская область 1 0,8 Республика Ульяновское Марий-Эл область i ♦ ♦ 0,4 ™ Республика я 0,2 ^ ф Мордовия * 0 теоретическом пространстве Республика Башкортостан ♦ Саратовская область Самарская область
3 0 -2 -1 -02 Удмуртская ' Республика Нижегор©дск Чувашская область Республика -0,6 * -0,8 Пермский край -1 ) 1 2 3 ♦ ая Республика Кироаская ф Татарстан область Оренбургская область Шкала 1
Рис. 5. Субъекты ПФО в теоретическом пространстве (мера сходства), 2013 год
В таблице 5 представлена группировка субъектов ПФО по Шкале 1 и Шкале 2.
В таблицах 6 и 7 отражены усредненные по группам и по шкалам изучаемые показатели, которые доминируют по указанным шкалам.
Сравнивая результаты за 2013 и 2016 годы, видим, что ряд субъектов ПФО изменили свое теоретическое состояние. Для большинства субъектов ПФО наблюдается положительная динамика, что соответствует удовлетворительному изменению (рис. 5, 6).
Мера различий (табл. 8) в неметрическом многомерном шкалировании также позволяет сгруппировать субъекты ПФО на группы. Такие субъекты, как Пензенская область и Саратовская область, сохраняют свои позиции по изучаемым показателям. Остальные субъекты меняют свои координаты, что свидетельствует об изменении показателей как в сторону улучшения, так и в сторону ухудшения. Таким образом, сравнительный анализ позволяет корректировать управление ключевыми показателями субъектов ПФО.
Субъекты ПФО в „0,6 Пермскии край 0,4 Чувашская Республика Удмуртская ^ 0,2 Республика Нижегоро ^ Республика кая облас теоретическом пространстве Кировская область Оренбургска я область Республика дс Татарстан ть
то Мордовия Ульяновская 3 область-0,2 Республика Марий-Эл -0,4 Пензенск об-6*Рь -0,8 0,5 ♦ Самар1кая 1,5 ♦ Саратовская РесЛбШьа область Башкортоста ♦н ая Шкала 1
Рис. 6. Субъекты ПФО в теоретическом пространстве (мера различия), 2013 год
Таблица 5
Группировка субъектов ПФО по Шкале 1 и Шкале 2 (мера сходства) за 2013 год
Субъекты ПФО Шкала 1 Группа Субъекты ПФО Шкала 2 Группа
Пензенская область -0,2705 1 Пензенская область -0,2469 1
Саратовская область -0,0035 1 Республика Татарстан 0,1136 1
Ульяновская область -0,9828 2 Нижегородская область 0,1517 1
Пермский край -0,8806 2 Республика Башкортостан -0,3023 2
Удмуртская республика -0,6537 2 Оренбургская область -0,2692 2
Кировская область 0,7711 2 Чувашская Республика 0,3977 2
Чувашская республика -1,286 3 Кировская область 0,4048 2
Нижегородская область -1,0128 3 Республика Марий-Эл -0,5521 3
Самарская область 1,3751 3 Удмуртская Республика -0,5373 3
Оренбургская область 1,3827 3 Республика Мордовия 0,4797 3
Республика Марий Эл -1,4904 4 Саратовская область -0,7401 4
Республика Мордовия -1,4471 4 Ульяновская область -0,6496 4
Республика Башкортостан 1,8843 4 Самарская область 0,6824 4
Республика Татарстан 2,6141 4 Пермский край 1,0676 4
Таблица 6
Усредненные по группам показатели за 2013 год
2013 год Среднее значение
Шкала 1 X, Х2 Х3 Х4 Х5 Х6
Группа 1 2260 1161,5 619100 137377 45388 99,6
Группа 2 1699 888,25 457360 104390 42959 102,45
Группа 3 2267 1218,75 603930 162628 66385,5 101,55
Группа 4 2348 1213,5 771967 221322 59503,3 100,925
Таблица 7
Усредненные по группам показатели за 2013 год
2013 Среднее значение
Шкала 2 Х7 Х8
Группа 1 100,1 455801,33
Группа 2 102,6 547939,75
Группа 3 100,8 513278,33
Группа 4 105,9 778406
Таблица 8
Группировка субъектов ПФО по группам (мера различия) за 2013 год
ПФО Шкала 1 Шкала 2 Шкала 1 Шкала 2
Республика Башкортостан 0,847 -0,391 4 3
Республика МарийрЭл -0,684 -0,276 3 2
Республика Мордовия -0,683 -0,063 3 1
Республика Татарстан 1,218 0,141 4 1
Удмуртская республика -0,321 0,173 2 2
Чувашская республика -0,622 0,306 3 3
Кировская область 0,363 0,349 2 3
Нижегородская область -0,539 0,153 3 1
Оренбургская область 0,631 0,294 3 2
Пензенская область -0,117 -0,578 1 4
Пермский край -0,311 0,456 2 4
Самарская область 0,64 -0,122 3 1
Саратовская область 0,049 -0,215 1 2
Ульяновская область -0,47 -0,227 4 2
Погрешности результатов анализа многомерных данных метрическим и неметрическим шкалированием представлены в таблице 9.
Таблица 9
Меры стресса и согласия
Погрешность 2016 год 2013 год
Нормализованный простой стресс 0,01366 0,00757
Стресс-1 0,11687 0,08699
Стресс-11 0,23117 0,19436
8-С стресс 0,04067 0,01156
Как видно из таблицы 9, рассчитанные показатели качества анализа являются удовлетворительными.
Библиографический список
1. Российский статистический ежегодник. 2017: стат. сб. / Росстат. Р76. М., 2017. 686 с.
2. Дейвисон М. Многомерное шкалирование: Методы наглядного представления данных / пер. с англ. М.: Финансы и статистика, 1988.
3. Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы: учебник. М.: Финансы и статистика, 2000. 352 с.
4. Сошникова Л.А., Тимашевич В.Н., Уебе Г., Шефер М. Многомерный статистический анализ в экономике: учеб. пособие для вузов / под ред. проф. В.Н. Тимашевича. М.: ЮНИТИ-ДАНА, 1999. 598 с.
5. Наследов А.Д. SPSS 17: профессиональный статистический анализ данных. СПб.: Питер, 2008.
6. Трусова А.Ю. Анализ социально-экономических данных средствами многомерного шкалирования // Прикладная информатика. 2009. № 6.
7. Трусова А.Ю. Многомерное шкалирование структуры общества // Вестник Самарского государственного университета. 2008.
8. Трусова А.Ю., Ильина А.И. Анализ многомерных экспертных данных методом главных факторов // Математика, экономика и управление. 2016. Т. 2. № 3. С. 107-110.
References
1. Rossiyskiy statisticheskiy yezhegodnik [Russian Statistical Yeaibook]. 2017: stat. Sat. Rosstat. P76. M., 2017, 686 p. [in Russian].
2. Davison M. Mnogomernoye shkalirovaniye: Metody naglyadnogo predstavleniya dannykh [Multidimensional scaling: Methods of visual presentation of data], trans. with English. M.: Finance and Statistics, 1988 [in Russian].
3. Dubrov A.M., Mkhitaryan V.S., Troshin L.I. Mnogomernyye statisticheskiye metody: uchebnik [Multidimensional statistical methods: a textbook]. M.: Finance and Statistics, 2000, 352 p. [in Russian].
4. Soshnikova L.A., Timashevich V.N., Uebe G., Shefer M. Mnogomernyy statisticheskiy analiz v ekonomike: ucheb. posobiye dlya vuzov [Multivariate statistical analysis in economics: textbook manual for universities]. Ed. prof. V.N. Timashevich. M.: UNITY-DANA, 1999, 598 p. [in Russian].
5. Nasledov A.D. SPSS 17: professional'nyy statisticheskiy analiz dannykh [SPSS 17: professional statistical analysis of data]. St. Petersburg: Peter, 2008 [in Russian].
6. Trusova A.Yu. Analiz sotsial'no-ekonomicheskikh dannykh sredstvami mnogomernogo shkalirovaniya [Analysis of socio-economic data using multi-dimensional scaling]. In: Prikladnaya informatika [Applied Informatics], 2009, no. 6 [in Russian].
7. Trusova A.Yu. Mnogomernoye shkalirovaniye struktury obshchestva [Multidimensional scaling of the structure of society]. In: Vestnik Samarskogo gosudarstvennogo universiteta [Vestnik of the Samara State University], 2008 [in Russian].
8. Trusova A.Yu., Ilyina A.I. Analiz mnogomernykh ekspertnykh dannykh metodom glavnykh faktorov [Analysis of multidimensional expert data by the main factors method]. In: Matematika, ekonomika i upravleniye [Mathematics, Economics and Management], 2016, vol. 2, no. 3, pp. 107-110 [in Russian].
A. Yu. Trusova, A.I. Ilyina, D.E. Lyukshin *
PRIVOLZHSKY FEDERAL DISTRICT AND ITS SOCIO-ECONOMIC INDICATORS IN THE FOCUS OF MULTIDIMENSIONAL SCALING
In the work of metric and non-metric scaling tools, the coordinates of the stimuli of the objects - the subjects of the Volga Federal District for 2016 were calculated, the initial multidimensional data was visualized. Clustering of PFD subjects was carried out, taking into account the measure of similarity and difference.
Key words: metric and non-metric scaling, stimulus coordinates, clustering of PFD entities.
Статья поступила в редакцию 11/II/2017.
The article received 11/II/2017.
* Trusova Alla Yuriyevna ([email protected]), Ilyina Elena Alekseevna ([email protected]), Lyukshin Danila Evgenyevich ([email protected]), Department of Mathematics and Business Informatics, Samara National Research University, 34, Moskovskoye shosse, Samara, 443086, Russian Federation.