Научная статья на тему 'ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ В ОЦЕНКЕ ВЛИЯНИЯ РАЗВИТИЯ ЧЕЛОВЕЧЕСКОГО КАПИТАЛА НА СОЦИАЛЬНО-ЭКОНОМИЧЕСКОЕ ПОЛОЖЕНИЕ РЕГИОНА'

ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ В ОЦЕНКЕ ВЛИЯНИЯ РАЗВИТИЯ ЧЕЛОВЕЧЕСКОГО КАПИТАЛА НА СОЦИАЛЬНО-ЭКОНОМИЧЕСКОЕ ПОЛОЖЕНИЕ РЕГИОНА Текст научной статьи по специальности «Экономика и бизнес»

CC BY
79
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ / КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ / КЛАСТЕРИЗАЦИЯ / НЕЙРОННАЯ СЕТЬ / ТРЕНД / АНАЛИТИЧЕСКАЯ МОДЕЛЬ / ЧЕЛОВЕЧЕСКИЙ КАПИТАЛ / ВАЛОВОЙ РЕГИОНАЛЬНЫЙ ПРОДУКТ / СТАТИСТИЧЕСКАЯ ИНФОРМАЦИЯ

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Жиленкова Е.П., Буданова М.В.

В статье рассмотрены вопросы применения методов интеллектуального анализа данных в процессе оценки влияния параметров формирования и развития человеческого капитала на социально-экономическое положение региона на примере данных по Брянской области. На основе использования АП Loginom разработана аналитическая модель, в которой осуществлена предобработка входных данных, включая заполнение пропусков и редактировании выбросов, проведен анализ на автокорреляцию между признаками, а также факторный анализ влияния уровня развития человеческого капитала на показатель валового регионального продукта региона, определена направленность и степень тесноты связи между факторами и результирующим признаком, выделены значимые параметры, представлено уравнение множественной регрессии, проведен регрессионный анализ влияния уровня развития человеческого капитала на валовой региональный продукт на основе нейросетевого моделирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Жиленкова Е.П., Буданова М.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DATA MINING IN ASSESSING THE IMPACT OF HUMAN CAPITAL DEVELOPMENT ON THE SOCIO-ECONOMIC SITUATION OF THE REGION

The article deals with the application of data mining methods in the process of assessing the impact of the parameters of the formation and development of human capital on the socio-economic situation of the region on the example of data on the Bryansk region. Based on the use of the Loginom API, an analytical model has been developed in which input data has been preprocessed, including filling in gaps and editing emissions, an analysis of autocorrelation between features has been carried out, as well as a factor analysis of the impact of the level of human capital development on the gross regional product of the region, the orientation and degree of closeness of the relationship between factors and the resulting feature have been identified, significant parameters, the multiple regression equation is presented, on the basis of neural network modeling, a regression analysis of the impact of the level of human capital development on the gross regional product was carried out.

Текст научной работы на тему «ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ В ОЦЕНКЕ ВЛИЯНИЯ РАЗВИТИЯ ЧЕЛОВЕЧЕСКОГО КАПИТАЛА НА СОЦИАЛЬНО-ЭКОНОМИЧЕСКОЕ ПОЛОЖЕНИЕ РЕГИОНА»

лей оценки устойчивости, их можно легко реализовать в виде отдельных модулей и подключить как новые контроллеры к основному контроллеру, согласно используемому шаблону MVC.

Кроме того, к элементам научной новизны можно отнести использование методов нечеткой математики для задания интервалов достоверности показателей оценки устойчивости, подробнее о методах в [3]. Также к научной новизне следует отнести разработку алгоритмов по разработанным авторами в [1,3,5,9] моделям и методикам. ИТ-сервис реализует в своем функционале следующий комплекс моделей:

- модели для оценки интеграционной и элементарной устойчивости, включая модели оценки устойчивости центрального элемента сети и отдельных элементов-листьев;

- модели для оценки кадровой устойчивости, включая коэффициент стабильности и модель формирования кадрового резерва на основе модели компетенций;

- модели для оценки рисковой устойчивости;

- модель для оценки организационной устойчивости. Также реализован ряд вспомогательных моделей, а именно:

- графовая иерархическая модель для динамического формирования групп показателей, на базе которых осуществляется оценка устойчивости;

- модель для семантического формирования функций принадлежности нечетких множеств, задающих рекомендательные значения показателей;

- модель расчета значений групп показателей и их нечеткая интерпретация;

Разработанный ИТ-сервис предоставляется по модели SAAS, в которой компьютерный ресурс предоставляются Интернет-пользователю в виде «онлайн-сервиса». Таким образом нет препятствий в текущем моменте к коммерциализации предложенного ИТ-решения.

Внедрение и развитие предложенного ИТ-сервиса для оценки устойчивости способно обогатить существующий пакет прикладных систем, активно используемых для анализа сетевых предприятий и обеспечивающих оперативное принятие управленческих решений.

Источники:

1. Ефанова Н.В. Интеграционная и элементарная устойчивость сетевой экономической структуры [Электронный ресурс] / Н.В. Ефанова, И.В. Слесаренко // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ). - Краснодар: КубГАУ, 2020. - №10(164). С. 357 - 368. - Режим доступа: http://ej.kubagro.ru/2020/10/pdf/29.pdf.

2. Ефанова, Н. В. Исследование понятия устойчивости экономических сетевых структур / Н. В. Ефанова, К. А. Ковалева // Современная экономика: проблемы и решения. - 2020. - № 11(131). - С. 91-101. - DOI 10.17308/meps.2020.11/2467.

3. Ефанова, Н. В. К вопросу обеспечения организационной и кадровой устойчивости сетевых экономических структур / Н. В. Ефанова // Трансформация социально-экономического пространства России и мира : Сборник статей международной научно-практической конференции, Сочи, 29 сентября - 02 2021 года / Под редакцией Г.Б. Клейнера, Х.А. Константиниди, В.В. Сорокожердьева. -Краснодар: ООО "Просвещение-Юг", 2021. - С. 48-53.

4. Ефанова, Н. В. К вопросу организации и управления сетевыми структурами предприятий малого и среднего бизнеса / Н. В. Ефанова // Трансформация социально-экономического пространства России и мира : Сборник статей международной научно-практической конференции, Сочи, 01-03 октября 2020 года / Под редакцией Г.Б. Клейнера, Х.А. Константиниди, В.В. Сорокожердьева, З.М. Хашевой. - Сочи: АНО "Научно-исследовательский институт истории, экономики и права", 2020. - С. 32-39.

5. Ефанова, Н. В. Модель формирования кадрового резерва на основе модели компетенций как элемент обеспечения устойчивости сетевой экономической структуры / Н. В. Ефанова, И. В. Слесаренко, А. В. Коваленко // Вестник Академии знаний. - 2021. - № 47(6). - С. 146-150. - DOI 10.24412/2304-6139-2021-6-146-150.

6. Модель SaaS простыми словами [Электронный ресурс]. - Режим доступа к ресурсу: URL: https://habr.com/ru/company/ uteam/blog/113980/.

7. Обзор ASP.NET [Электронный ресурс]. - Режим доступа к ресурсу: URL: https://msdn.microsoft.com/ru-ru/library/ 4w3ex9c2 (v=vs.100).aspx.

8. Риз, Дж. Облачные вычисления / Дж. Риз. - СПб.: БХВ-Петербург, 2011. - 288 с.

9. Efanova, N. V. Competency model as a tool for network economic system HR sustainability assessment / N. V. Efanova, I. V. Slesarenko // Modern Economics: Problems and Solutions. - 2021. - No 11(143). - P. 28-37. - DOI 10.17308/meps.2021.11/2710.

10. SQLite [Электронный ресурс]. - Режим доступа к ресурсу: URL: https://ru.wikipedia.org/wiki/SQLite.

EDN: ZGGZVJ

Е.П. Жиленкова - к.э.н., доцент кафедры экономики, оценки бизнеса и бухгалтерского учета, Брянский государственный инженерно-технологический университет, Брянск, Россия, JHelen21@yandex.ru,

E.P. Zhilenkova - candidate of economics, associate professor of the department of economics, business valuation and accounting, Bryansk state university of engineering and technology, Bryansk, Russia;

М.В. Буданова - к.э.н., доцент, зав.кафедрой экономики, оценки бизнеса и бухгалтерского учета, Брянский государственный инженерно-технологический университет, Брянск, Россия, budanovi@mail.ru,

M.V. Budanova - candidate of economics, associate professor, head of the department of economics, business valuation and accounting, Bryansk state university of engineering and technology, Bryansk, Russia.

ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ В ОЦЕНКЕ ВЛИЯНИЯ РАЗВИТИЯ ЧЕЛОВЕЧЕСКОГО КАПИТАЛА

НА СОЦИАЛЬНО-ЭКОНОМИЧЕСКОЕ ПОЛОЖЕНИЕ РЕГИОНА DATA MINING IN ASSESSING THE IMPACT OF HUMAN CAPITAL DEVELOPMENT ON THE SOCIO-ECONOMIC

SITUATION OF THE REGION

Аннотация. В статье рассмотрены вопросы применения методов интеллектуального анализа данных в процессе оценки влияния параметров формирования и развития человеческого капитала на социально-экономическое положение региона на примере данных по Брянской области. На основе использования АП Loginom разработана аналитическая модель, в которой осуществлена предобработка входных данных, включая заполнение пропусков и редактировании выбросов, про-

веден анализ на автокорреляцию между признаками, а также факторный анализ влияния уровня развития человеческого капитала на показатель валового регионального продукта региона, определена направленность и степень тесноты связи между факторами и результирующим признаком, выделены значимые параметры, представлено уравнение множественной регрессии, проведен регрессионный анализ влияния уровня развития человеческого капитала на валовой региональный продукт на основе нейросетевого моделирования.

Abstract. The article deals with the application of data mining methods in the process of assessing the impact of the parameters of the formation and development of human capital on the socio-economic situation of the region on the example of data on the Bryansk region. Based on the use of the Loginom API, an analytical model has been developed in which input data has been prepro-cessed, including filling in gaps and editing emissions, an analysis of autocorrelation between features has been carried out, as well as a factor analysis of the impact of the level of human capital development on the gross regional product of the region, the orientation and degree of closeness of the relationship between factors and the resulting feature have been identified, significant parameters, the multiple regression equation is presented, on the basis of neural network modeling, a regression analysis of the impact of the level of human capital development on the gross regional product was carried out.

Ключевые слова: интеллектуальный анализ данных, корреляционно-регрессионный анализ, кластеризация, нейронная сеть, тренд, аналитическая модель, человеческий капитал, валовой региональный продукт, статистическая информация.

Keywords: data mining, correlation and regression analysis, clustering, neural network, trend, analytical model, human capital, gross regional product, statistical information.

Процесс переоценки роли человеческого капитала в различных областях жизни общества привел к признанию его значимости не только как ресурса, но и важнейшего фактора социально-экономического развития.

Ускорение информационных потоков, увеличение объемов данных, их разнообразие и разносторонность коренным образом способствуют изменениям в жизни людей, определяют тренд современной цифровизации общества и открывают новые возможности перед исследователями и аналитиками.

В настоящее время процесс анализа влияния параметров человеческого капитала на социально-экономическое развитие региона в среде больших данных в основном сосредоточен на трех аспектах: 1) процесс Data mining - процесс решения бизнес-задач, который «начинается с формулирования целей...», далее «...следует сбор необходимых и доступных данных и поиск скрытых закономерностей в данных, помогающих достижению поставленных целей»; 2) процесс Big data, который включает все операции по обработке «структурированных или неструктурированных массивов данных большого объема при помощи специальных автоматизированных инструментов» [9]; 3) процесс Big data research - включает в себя смешение и интеграцию данных, машинное обучение и нейронные сети, предиктивную аналитику, визуальный анализ, извлечение ценности из данных.

Следуя процессу анализа влияния параметров человеческого капитала на социально-экономическое развитие региона, модель анализа включает три аналитические части: кластерный анализ, корреляционный анализ и регрессионный анализ. В соответствии с процессом постановки аналитической задачи, процесс анализа влияния параметров человеческого капитала на социально-экономическое развитие региона включает в себя поэтапное проведение сбора и предобработки данных, выбор метода анализа, проведение горизонтального и вертикального анализа, визуализацию результатов (рисунок 1).

Рисунок 1 - Модель процесса анализа влияния параметров человеческого капитала на социально-экономическое развитие региона

Применение интеллектуального анализа данных в процессе анализа влияния параметров человеческого капитала на социально-экономическое развитие региона (рисунок 2) «..можно охарактеризовать как итеративный цикл, в котором приложения интеллектуального анализа данных вносят вклад в улучшение использования человеческого капитала, а также используют полезные знания для принятия решений» [5].

Применение методов интеллектуального анализа данных

Рисунок 2 - Процесс интеллектуального анализа данных

Совершенствование программных инструментов, предназначенных для анализа данных, позволяет привлекать к исследованиям специалистов, не имеющий опыт в программировании, что является главным фактором, который поспособствовал развитию интеллектуального анализа данных.

По данным [10] значительная часть статей, которые были опубликованы в журналах Intelligent Tutoring Systems, и User Modeling and Adaptive Personalization, «доклады на конференциях по интеллектуальному анализу данных и аналитике применяют такие свободно распространяемые пакеты, как: Loginom, PolyAnalyst, Polymatica, SPSS, Stata и др. Данные пакеты содержат алгоритмы, которые реализуют описанные выше методы анализа данных, так же обеспечивают импорт и поддержку предварительной обработки данных для применения в рамках этих методов» [10].

Аналитическая платформа АП Loginom дает возможность рассматривать обширный спектр бизнес-задач, требующих обработки больших объемов данных, реализации сложной логики и применения методов машинного обучения. При помощи данной аналитической платформы эксперт-аналитик самостоятельно, без привлечения IT-специалистов, на основе визуального проектирования имеет возможность обработки сотни миллионов строк [2]. Платформа обладает возможностями использования алгоритмов очистки, исследования данных и машинного обучения без необходимости писать код, решения сложных задач анализа: комбинировать данные из любых источников, накапливать их, повторно использовать наработки, что улучшает качество анализа и сокращает время на ожидания результата.

В данной аналитической платформе была осуществлена разработка аналитической модели с учетом проведения кластеризации и регрессионного анализа для нескольких переменных: валовой региональный продукт (ВРП) который выступает результативным признаком и набор данных их семи факторов, которые прямо и косвенно отражают факторы развития человеческого капитала в регионе: уровень рождаемости, среднемесячная номинальная заработная плата, число учащихся ВУЗов и ССУЗов в расчет на 10000 общей численности населения, среднегодовая численность занятых, инвестиции в основной капитал, основные фонды в экономике по полной стоимости, индекс производительности труда (таблица 1). В данном случае ВРП будем рассматривать как результативный признак (Y), а остальные параметры выступают как факторные признаки (Xi _ Х7). Статистические данные собраны на основе официальных публикаций Территориального органа Федеральной службы государственной статистики по Брянской области [8].

Таблица 1 _ База данных для проведения корреляционно-регрессионного анализа

1

Год ВРП (в текущих основных ценах), млн. ру&. У Факторы

Уровень рож-дае-мости, про-мил-ле, Х1 Среднемесячная номинальная заработная плата, ру&. Х2 Число учащихся ВУЗов и ССУЗов в расчет на 10000 общей числен-ности населения, чел., Х3 Среднегодовая численность занятых, тыс.чел., Х4 Инвестиции в основной капитал, млн. руб., Х5 Основные фонды в экономике по полной стоимости, (на конец года), млн.руб., Х6 Индекс производительности труда (в процентах к предыдущему году), Х7 Ожидае-мая продол-житель-ность жизни при рождении, лет Х8

1998 11051,3 8,2 66,27

1999 16809,4 7,8 65,05

2000 24650,5 7,8 64,68

2001 30110,3 7,9 64,92

2002 37374,1 8,6 2612,5 456 601,1 4737,8 158390 63,82

2003 43700,3 9,1 3316,0 473 602,3 6527,5 191104 64,25

2004 51003,4 9,2 4196,1 486 601,0 6751,4 203623 64,15

2005 66692,3 9,0 5235,3 497 604,1 8496,3 218523,0 105,8 63,40

2006 82100,4 9,2 6533,5 505 603,3 12461,7 234250 106,2 65,28

2007 102706,2 10,2 8189,6 508 607,7 21010,2 311385 110,1 66,09

2008 125834,4 11,0 10220,1 520 608,2 25298,0 327029 105,9 66,46

2009 126477,4 11,2 10950,7 532 582,1 26857,9 350832,0 95,3 67,84

2010 147024,0 10,7 12325,6 508 571,6 41989,0 384939,0 105,3 67,92

2011 174211,8 10,9 13912,0 471 561,2 48013,8 431052,0 110,3 68,83

2012 207397,5 11,4 16530 449 559,6 46551,2 468273,0 109,1 69,06

2013 219502,8 11,1 18973,9 411 547,5 60864,2 518609,0 103,0 69,75

2014 242722,4 11,0 20911,0 399 533,6 66066,3 571616,0 106,4 69,42

2015 271782,5 11,4 21679,0 434 547,7 62254,9 627396,0 104,3 70,36

2016 316489,4 10,9 22923,0 446 540,6 68194,6 733112,0 101,4 70,92

2017 341177,8 9,5 24743,4 420 530,2 55120,9 794829,0 105,6 71,27

2018 367157,1 9,2 27250,9 409 523,0 58918,3 841645,0 104,9 71,71

2019 399113,8 8,3 29853,1 408 508,6 63553,0 1812903,0 105,0 72,31

2020 412335,5 8,0 31945,7 419 498,5 73886,8 1855052,0 70,63

В АП Loginom была выполнена загрузка данных на основе создания узла импорта данных.

В связи с тем, что база входной информации имеет пропуски в некоторых данных, таких как: среднемесячная номинальная заработная плата, число учащихся ВУЗов и ССУЗов в расчет на 10000 общей численности населения и др., то начальным этам в анализе данных является предобработка загруженных данных, которая была осуществлена на основе добавления трех узлов: 1) аналитический узел - заполнение пропусков, который «является элементом одномерного анализа, что означает восстановление значений на основе информации одного столбца. Анализируемые данные упорядоченные и имеют непрерывный вид, в связи с этим в данном пакете анализа замена осуществлялась наиболее вероятным значением, когда выявленные пропуски заменяются наиболее вероятным значением по столбцу, замена производится на среднее значе-

ние из наиболее вероятного интервала, число интервалов варьируется в зависимости от объема выборки - чем она больше, тем больше интервалов» [4]; 2) аналитический узел - редактирование выбросов, «который корректирует существенное отклонение величины признака от средних по ряду динамики. В данном случае, с целью автоматической корректировки выбросов в наборе данных, был применен метод стандартного отклонения, при котором критерием является отклонение значения признака от среднего более, чем на заданное число стандартных отклонений» [7]. Замена аномалий в данной работе производится наиболее вероятным значением по столбцу, замена производится на среднее значение из наиболее вероятного интервала; 3) аналитический узел сглаживание - данный обработчик предназначен для сглаживания численных рядов данных и выделения трендовой составляющей. Для этих целей в нем использован фильтр Ходрика-Прескотта.

На рисунке 3 синим цветом изображен график, соответствующий исходному ряду данных (динамика ВРП по Брянской области), а оранжевым — исходный ряд, обработанный компонентом Сглаживание с помощью фильтра Ходрика-Прескотта с параметром Lambda, равным 100.

Рисунок 3 - Визуализатор узла «Сглаживание»

Исследовательский блок в разрабатываемой аналитической модели включает в себя АП узел Автокорреляции, методика которого заключается в вычислении корреляции между временным рядом и его копией, сдвинутой на один или несколько временных отсчетов [1], т.е. дает характеристику степени статистической взаимосвязи между элементами данных одного временного ряда [1].

Блок корреллицонного анализ применяется для оценки зависимых выходных полей данных от входных факторов и устранения незначимых факторов. Принцип корреляционного анализа заключается в поиске таких значений, которые в наименьшей степени коррелированны с выходным результатом. Такие факторы исключаются из результирующего набора данных. Критерием принятия решения об исключении фактора при построении линейной модели зависимости является величина коэффициента корреляции Пирсона, с помощью которой определяем силу и направление линейной зависимости между процессами, происходящими одновременно.

В ходе проведения корреляционного анализа использовались следующие входные данные: валовой региональный продукт учитывался как выходной (результатирующий) фактор, а параметры - независимые факторы следующие:

Х1 - Уровень рождаемости, промилле;

Х2 - Среднемесячная номинальная заработная плата, руб.;

Х3 - Число учащихся ВУЗов и ССУЗов в расчет на 10000 общей численности населения, чел.;

Х4 - Среднегодовая численность занятых, тыс.чел.;

Х5 - Инвестиции в основной капитал, млн. руб.;

Х6 - Основные фонды в экономике по полной стоимости, ( на конец года), млн.руб.;

Х7 - Индекс производительности труда (в процентах к предыдущему году);

Х8 - Ожидаемая продолжительность жизни при рождении, лет.

На основе данных визуализатора узла «Корреляционный анализ» (рисунок 4) был сделан следующий вывод:

^ГВГГТэГ^^^ИВМДДДДЯДТ

Рисунок 4 - Визуализатор узла «Корреляционный анализ»

1) между ВРП и параметрами Х7, Х3, Х4 - существует обратная связь, так как коэффициент корреляции отрицательный, а между ВРП и параметрами Х6, Х1, Х2, Х5 и Х8 - связь прямая, так как расчетный коэффициент корреляции есть величина положительная; 2) параметры Х7, Х1 и Х3 исключаем из дальнейшего анализа, так как величина коэффициента корреляции по модулю менее 0,4, что говорит о слабой парной корреляционной связи между фактором и результатом; 3) фактор Х4 не включаем в построение уравнений регрессии на основе экспертного суждения. Так как на основе полученных расчетов коэффициента корреляции делается вывод, что теснота связи между ВРП и численностью занятых в экономике имеет тенденцию к снижению, то можно предположить, что рост ВРП все меньше зависит от численности населения и численности занятых в экономике, вероятно, из-за возрастающей доли автоматизированного труда, а также изменившейся конъюнктуры цен на продукцию; 4) в дальнейшем анализе оставляем для использования факторы, для которых коэффициент корреляции Пирсона отражают прямую тесную зависимость между параметрами, т.е. это факторы Х6, Х2, Х5 и Х8.

Добавив компонент Множественная линейная регрессия в рабочую область сценария, запускаем процесс построения линейной регрессии на основе импортированных и преобразованных данных.

В процессе построения множественной регрессии используем факторы Х2, Х5 и Х8. Фактор Х6 не учитываем в построении, так как на основе экспертного суждения он был исключен в связи с тем, что имеет тесную корреляционную зависимость с другим фактором - инвестиции в основной капитал.

На основе визуализатора Отчет по регрессии (рисунок 5) можно построить следующее уравнение множественной регрессии:

У = 15,75Х2 - 0,51Х5 - 1661,05Х8 + 81867,24 (1)

п ■

Рисунок 5 - Визуализатор «Отчет по регрессии»

В случае, когда полученная функция регрессии интерпретирована и обоснована оценка точности, то можно ее использовать с целью прогнозирования. При этом нужно понимать то, что прогнозные значения, полученные в результате применения данной регрессионной модели, являются средними значениями, которые можно ожидать в будущем.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Нейросеть в Ь(^тош решает задачу регрессии, в результате работы узла в выходном наборе Нейросеть выдаст «прогнозируемое значение переменной, зависимое от множества входных параметров» [6].

По данным, представленным в документации для пользователей АП Loginom [6], можно констатировать, что «перед тем, как производить прогноз, алгоритм обучается на тренировочном наборе данных - обучающей выборке. Каждая строка такой выборки содержит: 1) в полях, обозначенных как входные множество входных параметров; 2) в поле, обозначенном как выходное - соответствующее входным параметрам значение зависимой переменной. Технически обучение заключается в нахождении весов - коэффициентов связей между нейронами. В процессе обучения нейронная сеть способна выявлять сложные зависимости между входными параметрами и выходными, а также выполнять обобщение. Это значит, что в случае успешного обучения, Нейросеть способна выдать верный результат на основании данных, которые отсутствовали в обучающей выборке, а также на неполных и/или «зашумленных», частично искажённых данных. Для обучения используется квазиньютоновский метод Бройдена-Флетчера-Гольдфарба-Шанно с ограниченным использованием памяти L-BFGS». Стандартные настройки аналитической платформы предполагают разбиение множества - 100 % обучающее и 0 % тестовое.

На рисунке 6 представлен графический результат работы нейросети (регрессия).

Рисунок 6 - Визуализатор Нейросеть (регрессия)

В случае же, если изменить модуль настройки Нейросети до следующих параметров: 1) разбиение множества входных данных на структуру - 70 % обучающее и 30 % тестовое; 2) автоматический подбор параметров нейросети, то выходные данные по расчетному уровню валового регионального продукта на основе исходных данных приближается к фактическим данным за анализируемый период (рисунок 7).

На основе экспертного суждения, принимая во внимание результаты построения множественной регрессии и нейросети (регрессия) и отклонения, полученные в результате расчета прогнозных значений, за основу для анализа принимаем узел Множественная регрессия, так как результаты отклонений факта от расчетных значений меньше, чем при прогнозировании на основе узла Нейросеть.

Результатами данного исследования явилась аналитическая модель (рисунок 8) влияния развития человеческого капитала на уровень социально -экономического положения региона, разработанная в АП Loginom.

Разработанная аналитическая модель включает в себя: 1) факторный анализ влияния уровня развития человеческого капитала на показатель валового регионального продукта региона; 2) предобработка входной информации, которая включает в себя процедуру заполнения пропусков и редактировании выбросов; 3) «...исследование, которое заключается в

проведении анализа на автокорреляцию между признаками, корреляционного анализа с целью определения направленности и степени тесноты связи между факторами и результативным признаком, выделения значимых параметров, построены уравнений парной и множественной регрессии, на основе методов регрессионного анализа» [3] и построения нейросети (регрессия), а также на основе нейросетевого моделирования проведение кластеризации регионов ЦФО по уровню развития человеческого капитала; 4) экспорт данных включает выгрузку результатов в файлы формата Excel.

Рисунок 7 - Визуализатор Диаграммы узла Нейросеть (регрессия) с измененными настройками

Рисунок 8 - Аналитическая модель влияния развития человеческого капитала на уровень социально-экономического положения региона, разработанная в АП Loginom

На основе разработанной аналитической модели были определены значимые факторы, связанные с человеческим капиталом региона и влияющие на уровень его социально -экономического положения. Также интересным является аспект исследования классических детерминант формирования человеческого капитала региона, таких как: 1) среднедушевые денежные доходы в месяц, руб.; 2) среднемесячная номинальная заработная плата, руб.; 3) среднегодовая численность занятых, тыс.чел.; 4) уровень смертности, промилле; 5) уровень рождаемости, промилле; 6) ожидаемая продолжительность жизни при рождении, лет. Данные показатели характеризуют эффективность деятельности органов исполнительной власти субъектов Российской Федерации в сфере формирования человеческого капитала региона.

Формирование возможных направлений развития человеческого капитала и их внедрение при принятии управленческих решений возможно на основе анализа построенной аналитической модели. Результаты исследования на основе данной модели могут быть использованы при разработке федеральных и региональных стратегий, программ и перспективных планов повышения уровня социально -экономического положения регионов с учетом развития процессов формирования человеческого капитала.

Источники:

1. Автокорреляция [Электронный ресурс]. - URL: https://help.loginom.ru/userguide/processors/scrutiny/ autocorrelation.html. - (дата обращения 7.12.2022).

2. Аналитическая платформа Loginom [Электронный ресурс]. - URL: https://loginom.ru/. - (дата обращения: 8.11.2022).

3. Жиленкова Е.П., Афанасьев Н.Г. Интеллектуальный анализ данных: применение АП Loginjm при анализе статистической информации / Материалы VIМеждународной научно-практической конференции «Статистические методы исследования социально-экономических и экологических систем региона». - Тамбов: ТГТУ, 2022. - 346 с.

4. Заполнение пропусков [Электронный ресурс]. - URL: https://help.loginom.ru/userguide/processors/preprocessing/ imputation.html. - (дата обращения 7.12.2022).

5. Лесных Е.Ю. Методы и алгоритмы интеллектуального анализа данных для оценки поведения студента в системе электронного обучения [Электронный ресурс]. - URL: https://dspace.tltsu.ru/xmlui/bitstream/handle/123456789/9754/ Лесных%20Е.Ю._ПМИм-1701а.pdf?sequence=1&isAllowed=y. - (дата обращения 7.12.2022).

6. Нейросеть (регрессия) [Электронный ресурс]. - URL: https://help.loginom.ru/userguide/processors/datamining/neural-network-regression.html. - (дата обращения 7.12.2022).

7. Редактирование выбросов [Электронный ресурс]. - URL: https://help.loginom.ru/userguide/processors/preprocessing/ eliminate-outliers.html. - (дата обращения 7.12.2022).

8. 8.Территориальный орган Федеральной службы государственной статистики [Электронный ресурс]. - URL: https://bryansk.gks.ru/folder/31508. - (дата обращения 7.12.2022).

9. 9.Что такое Big Data? [Электронный ресурс]. - URL: https://trends.rbc.ru/trends/innovation/5d6c020b9a7947a 740fea65c. - (дата обращения 7.12.2022).

10. Baker R., Siemens G. Educational Data Mining and Learning Analytics [Электронный ресурс]. URL: http://www.columbia.edu/~rsb2162/ BakerSiemens Handbook 2013.pdf. - (дата обращения 15.09.2022).

i Надоели баннеры? Вы всегда можете отключить рекламу.