Научная статья на тему 'Применение алгоритма случайного леса в моделировании состояния экономической безопасности экономических систем'

Применение алгоритма случайного леса в моделировании состояния экономической безопасности экономических систем Текст научной статьи по специальности «Экономика и бизнес»

CC BY
52
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
экономическая безопасность / машинное обучение / деревья классификации / моделирование финансовой устойчивости предприятия / случайный лес / economic security / machine learning / classification trees / modeling of financial stability of an enterprise / random forest

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Мария Владимировна Кулабухова

В статье рассматриваются возможности применения такого метода машинного обучения, как алгоритм случайного леса в решении задач, связанных с моделированием состояния экономической безопасности экономических систем. Приведена методика использования указанного алгоритма для повышения степени адекватности регрессионной модели экономической безопасности одного из лидеров отечественной цветной металлургии — ПАО «ГМК «Норильский никель»». Показано достигнутое с помощью алгоритма случайного леса существенное по сравнению с регрессионной моделью уменьшение уровней отклонений предсказанных значений переменных, отражающих состояние экономической безопасности данного предприятия.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Мария Владимировна Кулабухова

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Application of the random forest algorithm in modeling the state of economic security of economic systems

This article discusses the possibilities of using such a machine learning method as the random forest algorithm in solving problems related to modeling the state of economic security of economic systems. The method of using this algorithm to increase the adequacy of the regression model of economic security of one of the leaders of the domestic non-ferrous metallurgy — PJSC MMC Norilsk Nickel is given. The reduction of the levels of deviations of the predicted values of variables reflecting the state of economic security of this enterprise, achieved with the help of the random forest algorithm, in comparison with the regression model, is shown.

Текст научной работы на тему «Применение алгоритма случайного леса в моделировании состояния экономической безопасности экономических систем»

Образование. Наука. Научные кадры. 2023. № 4. С. 139—143. Education. Science. Scientific personnel. 2023;(4):139—143.

РЕГИОНАЛЬНАЯ И ОТРАСЛЕВАЯ ЭКОНОМИКА

Научная статья УДК 338.2

https://doi.org/10.24412/2073-3305-2023-4-139-143 EDN: https://elibrary.ru/CRBCXX

NIION: 2007-0062-4/23-235 MOSURED: 77/27-004-2023-04-435

Применение алгоритма случайного леса в моделировании состояния экономической безопасности

экономических систем

Мария Владимировна Кулабухова

Российский университет кооперации, Москва, Россия, makull@mail.ru

Аннотация. В статье рассматриваются возможности применения такого метода машинного обучения, как алгоритм случайного леса в решении задач, связанных с моделированием состояния экономической безопасности экономических систем. Приведена методика использования указанного алгоритма для повышения степени адекватности регрессионной модели экономической безопасности одного из лидеров отечественной цветной металлургии — ПАО «ГМК «Норильский никель»». Показано достигнутое с помощью алгоритма случайного леса существенное по сравнению с регрессионной моделью уменьшение уровней отклонений предсказанных значений переменных, отражающих состояние экономической безопасности данного предприятия.

Ключевые слова: экономическая безопасность, машинное обучение, деревья классификации, моделирование финансовой устойчивости предприятия, случайный лес

Для цитирования: Кулабухова М.В. Применение алгоритма случайного леса в моделировании состояния экономической безопасности экономических систем // Образование. Наука. Научные кадры. 2023. № 4. С. 139—143. https://doi.org/10.24412/2073-3305-2023-4-139-143. ЕОЫ: https://elibrary.ru/CRBCXX.

REGIONAL AND SECTOR ECONOMY

Original article

Application of the random forest algorithm in modeling the state of economic security of economic systems

Mariia V. Kulabukhova

Russian University of Cooperation, Moscow, Russia, makull@mail.ru

Abstract. This article discusses the possibilities of using such a machine learning method as the random forest algorithm in solving problems related to modeling the state of economic security of economic systems. The method of using this algorithm to increase the adequacy of the regression model of economic security of one of the leaders of the domestic non-ferrous metallurgy — PJSC MMC Norilsk Nickel is given. The reduction of the levels of deviations of the predicted values of variables reflecting the state of economic security of this enterprise, achieved with the help of the random forest algorithm, in comparison with the regression model, is shown.

Keywords: economic security, machine learning, classification trees, modeling of financial stability of an enterprise, random forest

For citation: Kulabukhova M.V. Application of the random forest algorithm in modeling the state of economic security of economic systems // Obrazovaniye. Nauka. Nauchnyye kadry = Education. Science. Scientific personnel. 2023;(4):139 — 143. (In Russ.). https://doi.org/10.24412/2073-3305-2023-4-139-143. EDN: https://elibrary.ru/CRBCXX.

Транснационализация финансовых, сырьевых и технологических рынков, протекающая в процессе совместной эволюции совокупности государственно оформленных рыноч-

© Кулабухова М.В., 2023

ных систем, являет собой одну из наиболее значимых с социально-экономических позиций граней системной глобализации, охватывающей все без исключения аспекты жизни мирового сообщества. Важным ее следствием становятся повышение степени взаимосвязанности и взаимо-

зависимости отдельных групп субъектов экономических отношений друг от друга, а также возникновение в новых системах таких субъектов целого ряда сверхаддитивных эффектов, обладающих, применительно к их деятельности, значительным потенциалом, способным в зависимости от условий реализовываться как в положительных, так и в отрицательных направлениях.

Особое значение в указанных условиях приобретают вопросы, связанные с поддержанием достаточного для обеспечения устойчивого роста национальной экономики и отдельных ее отраслей уровня экономической безопасности и, как следствие, с формированием качественной методической базы, являющейся необходимым условием эффективного функционирования организационно-экономического механизма, призванного обеспечивать необходимый уровень таковой.

Одним из перспективных направлений развития соответствующей методической базы является использование при моделировании состояния экономической безопасности экономических систем (ЭС) технологий искусственного интеллекта (ИИ) и такой их составляющей, как машинное обучение [7].

С учетом того, что решение задачи описания и моделирования состояния экономической безопасности ЭС предполагает анализ значительных объемов разнородных данных, характеризующих как различные аспекты деятельности ЭС, большинство из которых является значимым в контексте определения состояния экономической безопасности, так и состояние внешней по отношению к ЭС социально-экономической среды в динамике, необходимо отметить, что их обработка невозможна без использования специальных математических методов, одним из которых является метод случайного леса.

Случайный лес (random forest) — метод машинного обучения, состоящий в формировании модели, позволяющей на основании значений некоторого набора независимых переменных предсказать значение дискретной либо непрерывной зависимой переменной. Данный метод в настоящее время приобрел значительную популярность ввиду своей универсальности и возможности использоваться для решения задач регрессии, кластеризации и классификации [6]. Подробное описание алгоритма метода случайного леса содержится в работе американского математика Л. Бреймана [9].

Использование отмеченного метода представляется целесообразным в контексте моделирования состояния экономической безопасности ЭС, поскольку такое моделирование предполагает не

только установление взаимозависимостей между значительным числом параметров, характеризующих внешнюю и внутреннюю среду ЭС, но и является требовательным к выделению наиболее информативных параметров из всей их совокупности. Помимо этого, применение метода случайного леса не требует предварительной обработки данных, достаточно корректно работает с массивами данных, содержащих пропуски либо аномальные значения, и обладает значительной точностью решения задач регрессии и классификации [5].

Начальный этап моделирования состояния экономической безопасности ЭС с помощью рассматриваемого метода предполагает нахождение зависимости между независимыми признаками, отражающими существенные в данном контексте факторы внешнего по отношению к ЭС социально-экономического пространства (предикторами), и переменными, характеризующими состояние значимых для экономической безопасности внутренних параметров ЭС. Этот шаг может выполняться с привлечением различных методов математической статистики и имеет своим назначением получение на выходе множества предполагаемых отношений между независимыми и зависимыми переменными [2].

Далее адекватность выделенной на первом этапе моделирования совокупности отношений между предикторами и зависимыми признаками повышается с использованием метода случайного леса, в ходе реализации которого такая совокупность используется в качестве обучающей выборки [8].

В процессе реализации алгоритма по каждой из выборок производится построение бинарных деревьев классификации (CART), для каждого из которых из общего множества признаков случайным образом выбирается n признаков. Результатом этого становится случайный лес, т.е. ансамбль, включающий в себя некоторое количество деревьев, число которых является настраиваемым и, как правило, подбирается исходя из требования минимальности ошибки классификатора на тестовой выборке. При этом на каждом шаге формирования таких деревьев производится перебор всех возможных вариантов ветвления и выбор того предиктора, при котором оценочная функция дает наилучший показатель [1].

В качестве примера применения алгоритма случайного леса в моделировании состояния экономической безопасности ЭС можно привести анализ совокупности данных, характеризующих отдельные показатели деятельности ПАО «ГМК «Норильский никель»» и ряд факторов внешне-

го социально-экономического пространства, выбранных за период наблюдений с 2003 по 2022 г. включительно.

Поскольку в данном примере все зависимые переменные являются непрерывными, их прогнозируемые значения будут представлять собой среднеарифметические всех прогнозов, полученных в результате расчета, произведенного по каждому из деревьев случайного леса.

В результате предварительного регрессионного анализа указанной совокупности получена регрессионная модель состояния экономической безопасности компании, включающая в себя зависимые переменные, характеризующие изменения финансовой устойчивости: рыночная капитализация, выручка и валовая прибыль от реализации металлов, чистая прибыль, оборотные и внеоборотные активы, EBITDA, собственный капитал, краткосрочные обязательства, административные и коммерческие, прочие операционные расходы, балансовая стоимость основных средств, CAPEX, свободный денежный поток, расходы на персонал, и следующие предикторы:

Одним из подходов к формированию прогноза состояния экономической безопасности ПАО «ГМК «Норильский никель»» является линей-

среднегодовые биржевые цены на палладий, никель, платину и медь (данные металлы являются основной продукцией ПАО «ГМК «Норильский никель»»), ВРП, добыча полезных ископаемых в валовой добавленной стоимости, инвестиции в основной капитал, стоимость и степень износа основных фондов, совокупный оборот и сальдированный финансовый результат предприятий и организаций, экспорт и импорт машин и оборудования, а также экспорт и импорт технологий и услуг технологического характера.

Основанные на расчете среднего уровня отклонений предсказанных значений зависимых переменных от соответствующих им значений реальных наблюдений за такими переменными результаты повышения адекватности регрессионной модели состояния экономической безопасности ПАО «ГМК «Норильский никель»» с помощью метода случайного леса в отношении некоторых из вышеотмеченных целевых переменных показывают существенные улучшения адекватности регрессионной модели и отражены на рис. 1.

ная экстраполяция перспективных значений предикторов на основании средних значений соответствующих им временных рядов с последу-

I Регрессионная модель □ Метод случайного леса

5,43

9,12

8,40

Рыночная Выручка от Чистая

капитализация реализации прибыль

EBITDA

CAPEX Краткосрочные Собственный обязательства капитал

металлов

Рис. 1. Средние уровни отклонений предсказанных значений целевых переменных в регрессионной модели и модели, сформированной методом случайного леса, %

ющим нахождением на основании экстраполированных предикторов значений целевых переменных, определяющих уровень финансовой устойчивости рассматриваемого предприятия. Такая экстраполяция производится исходя из предположения о неизменности среднего уровня временного ряда и отсутствия тенденции к его изменению [3], т.е. равенства прогнозируемого уровня искомой переменной прошлым средним значениям ее уровней: Уш = У. Определение границ доверительного интервала для средней в данном случае и при условии небольшого числа наблюдений осуществляется как: Ут = У + taSy, где ta — табличное значение ^статистики Стью-дента с п - 1 степенями и уровнем вероятности р,

а Я =

1У - У)2

— среднее квадратичное

п - 1

отклонение для рассматриваемой выборки, где у{ — фактические значения показателя. Поскольку общая дисперсия здесь составит величину S2 + S2 / п, то доверительные интервалы прогностической оценки, выполненной с помощью указанного метода, будут равны:

1

Уж = У + taS]| 1 + п [4].

Результаты полученной с помощью указанного подхода прогностической оценки ряда показателей финансовой устойчивости рассматриваемого предприятия до 2030 г. приведены ниже (табл. 1).

Таблица 1. Текущие и спрогнозированные с помощью модели случайного леса значения основных коэффициентов финансовой устойчивости ПАО «ГМК «Норильский никель»»

в 2020—2030 гг.

Наименование коэффициента 2020 г. 2022 г. 2024 г. 2026 г. 2028 г. 2030 г.

Коэффициент рентабельности активов 0,1 22,7 12,3 0,4 -1,3 -4,7

Коэффициент рентабельности собственного капитала 0,6 101,4 43,1 4,8 -0,2 -2,4

Коэффициент рентабельности продаж 19,8 53,1 22,7 12,2 -5,6 -8,3

Коэффициент автономии 12,7 26,9 8,4 6,3 4,4 4,1

Коэффициент абсолютной ликвидности 84,2 27,3 17,9 11,4 8,6 4,3

Коэффициент быстрой ликвидности 120,1 92,9 57,1 35,5 27,8 22,2

Коэффициент текущей ликвидности 141,8 124,4 107,2 93,9 85,7 62,0

Чистая рентабельность 22,0 33,9 18,0 8,2 -3,4 -6,7

Оценка прогнозных значений приведенных в табл. 1 коэффициентов, рассчитанных с помощью метода случайного леса, приводит к выводу о предстоящем резком и последовательном ухудшении рентабельности ПАО «ГМК «Норильский никель»» уже с 2024 г., появлении и развитии выраженных кризисных тенденций в его функционировании, значительной вероятности компании банкротства на отрезке 2028—2030 гг.

Необходимо указать, что такие результаты получены с помощью математической модели, содержащей целый ряд допущений, составленной на основании весьма ограниченной информационной базы и не учитывающей многих существенных для состояния экономической безо-

пасности предприятия факторов. Так, ПАО «ГМК «Норильский никель»» является одним из системообразующих предприятий отечественной цветной металлургии, что естественным образом в случае резкого ухудшения финансового положения данного предприятия, скорее всего, вынудит государство оказать ему самую активную поддержку.

Список источников

1. Бова А. Деревья решений как техника добычи данных // Социология: теория, методы, маркетинг. 2002. № 1. С. 128—136.

2. Борзова Е.П. Проблема соотношения человеческого фактора и алгоритмов искусственного

интеллекта в экономике и финансовой сфере / / Московский экономический журнал. 2018. № 5 (2). С. 63—68.

3. Курников Д.С., Петров СА. Использование нейронных сетей в экономике / / Технические науки. 2017. № 6. C. 10—12.

4. Саханевич Д.Ю., Кремин А.Е. Систематизация методов машинного обучения в целях внедрения искусственного интеллекта в социально-экономические процессы региона / / Вестник Владимирского государственного университета имени Столетовых. Сер.: Экономические науки. 2019. № 4 (22). С. 57—65.

5. Фомина Е.Е. Возможности метода деревьев классификации при обработке социологической информации / / Гуманитарный вестник. 2018. № 11 (73). С. 5.

6. Чистяков С.П. Случайные леса: обзор // Труды Карельского научного центра РАН. 2013. № 1. С. 117—136.

7. Шамин Р.В. Машинное обучение в задачах экономики. М.: Грин Принт, 2019. 140 с.

8. Bradley Efron. Bootstrap Methods: Another Look at the Jackknife // Annals of Statistics. 1979. Vol. 7, no. 1. P. 1—26.

9. Breiman L. Random Forest // Machine Learning. 2001. Vol. 45, no. 1. P. 5—32.

References

1. Bova A. Decision trees as a data mining technique / / Sociology: theory, methods, marketing. 2002. No. 1. pp. 128—136.

2. Borzova E.P. The problem of the ratio of the human factor and artificial intelligence algorithms in economics and finance / / Moscow Economic Journal. 2018. No. 5 (2). pp. 63—68.

3. Kournikov D.S., Petrov SA. The use of neural networks in economics / / Technical Sciences. 2017. № 6. pp. 10—12.

4. Sakhanevich D.Yu., Kremin A.E. Syste-matization of machine learning methods for the implementation of artificial intelligence in the socio-economic processes of the region / / Bulletin of the Vladimir State University named after the Stoletovs. Series: Economic Sciences. 2019. № 4 (22). Pp. 57—65.

5. Fomina E.E. Possibilities of the method of classification trees in the processing of sociological information // Humanitarian Bulletin. 2018. № 11 (73). P. 5.

6. Chistyakov S.P. Random forests: a review // Proceedings of the Karelian Scientific Center of the Russian Academy of Sciences. 2013. No. 1. pp. 117—136.

7. Shamin R.V. Machine learning in economic problems. Moscow: Green Print, 2019. 140 p.

8. Bradley Efron. Bootstrap Methods: Another Look at the Jackknife // Annals of Statistics. 1979. Vol. 7, no. 1. P. 1—26.

9. Breiman L. Random Forest // Machine Learning. 2001. Vol. 45, no. 1. P. 5—32.

Информация об авторе

М.В. Кулабухова — соискатель кафедры экономики и таможенного дела Российского университета кооперации.

Information about the author

M.V. Kulabukhova — Applicant of the Department of Economics and Customs of the Russian University of Cooperation.

Статья поступила в редакцию 26.09.2023; одобрена после рецензирования 10.10.2023; принята к публикации 26.10.2023.

The article was submitted 26.09.2023; approved after reviewing 10.10.2023; accepted for publication 26.10.2023.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.