Научная статья на тему 'Принципы формирования моделей прогнозирования вероятности банкротства предприятий с использованием элементов машинного обучения'

Принципы формирования моделей прогнозирования вероятности банкротства предприятий с использованием элементов машинного обучения Текст научной статьи по специальности «Экономика и бизнес»

CC BY
315
49
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БАНКРОТСТВО / ПРОГНОЗ / МОДЕЛЬ / МАШИННОЕ ОБУЧЕНИЕ / BANKRUPTCY / FORECAST / MODEL / MACHINE LEARNING

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Опекунов Алексей Николаевич, Кузьмина Мария Геннадьевна

Предмет и цель работы. Представлены материалы исследования методов прогнозирования вероятности банкротств предприятий, в частности, предложена методика, основанная на использовании в этих целях элементов машинного обучения. Целью является формирование методологических и методических основ прогнозирования вероятности банкротства предприятий на основе использования принципов машинного обучения. Материалы и методы. Реализация этого подхода рассмотрена на примере Logit-модели, построенной на материалах предприятий Пензенской области, сформированных в обучающую выборку. Обучающая выборка была составлена на данных финансовой отчетности предприятий, вступивших в процедуру банкротства, а также сохранивших платежеспособность в одном временном отрезке. В целях прогнозирования банкротства предложено использовать модели с обучением бинарной классификации, позволяющие не только оценить вероятность наступления события, но и классифицировать объекты исследования. Результаты и выводы. Предложенная классификация моделей показала, что алгоритм их разработки, основанный на линейной регрессии по финансовым коэффициентам, не отвечает современным требованиям. Тем самым обоснована необходимость формирования нового методического подхода к разработке прогностических моделей, основанного на принципах машинного обучения. Обоснованно доказана невозможность построения моделей бинарной классификации линейного типа. Кроме того, Logit-модели имеют большую точность и позволяют включать в модель не только количественные, но и качественные факторы. Разработанная по данной методике модель прогнозирования банкротства предприятий показала высокую точность на обучающей выборке 92 % на интервале 1 год; 85 % на интервале 2 года.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PRINCIPLES OF FORMING MODELS FOR FORECASTING THE PROBABILITY OF BANKRUPTCY OF ENTERPRISES USING MACHINING ELEMENTS

Subject and goals. The materials of the study of methods for predicting the probability of bankruptcy of enterprises are presented; in particular, a methodology is proposed based on the use of machine learning elements for these purposes. The goal is the formation of methodological and methodological foundations for predicting the probability of bankruptcy of enterprises based on the use of machine learning principles. Materials and methods. The implementation of this approach is considered on the example of the Logit model, built on the materials of the enterprises of the Penza region, formed into a training sample. The training sample was compiled from the financial statements of enterprises that entered into bankruptcy proceedings, as well as those that retained solvency in one time period. In order to predict bankruptcy, it is proposed to use models with training in binary classification, which allow not only to assess the likelihood of an event, but also to classify research objects. Results and conclusions. The proposed classification of models showed that the algorithm for their development, based on a linear regression of financial ratios, does not meet modern requirements. This substantiates the need for a new methodological approach to the development of prognostic models based on the principles of machine learning. The impossibility of constructing models of a binary classification of a linear type is proved reasonably. In addition, Logit models are more accurate and allow you to include in the model not only quantitative, but also qualitative factors. The bankruptcy forecasting model developed by this methodology has shown high accuracy in the training sample 92 % over a 1-year interval; 85 % over an interval of 2 years.

Текст научной работы на тему «Принципы формирования моделей прогнозирования вероятности банкротства предприятий с использованием элементов машинного обучения»

УДК 338.2

ПРИНЦИПЫ ФОРМИРОВАНИЯ МОДЕЛЕЙ ПРОГНОЗИРОВАНИЯ ВЕРОЯТНОСТИ БАНКРОТСТВА ПРЕДПРИЯТИЙ С ИСПОЛЬЗОВАНИЕМ ЭЛЕМЕНТОВ МАШИННОГО ОБУЧЕНИЯ

А. Н. Опекунов, М. Г. Кузьмина

PRINCIPLES OF FORMING MODELS FOR FORECASTING THE PROBABILITY OF BANKRUPTCY OF ENTERPRISES USING MACHINING ELEMENTS

А. N. Opekunov, M. G. Kuzmina

Аннотация. Предмет и цель работы. Представлены материалы исследования методов прогнозирования вероятности банкротств предприятий, в частности, предложена методика, основанная на использовании в этих целях элементов машинного обучения. Целью является формирование методологических и методических основ прогнозирования вероятности банкротства предприятий на основе использования принципов машинного обучения. Материалы и методы. Реализация этого подхода рассмотрена на примере Logit-модели, построенной на материалах предприятий Пензенской области, сформированных в обучающую выборку. Обучающая выборка была составлена на данных финансовой отчетности предприятий, вступивших в процедуру банкротства, а также сохранивших платежеспособность в одном временном отрезке. В целях прогнозирования банкротства предложено использовать модели с обучением бинарной классификации, позволяющие не только оценить вероятность наступления события, но и классифицировать объекты исследования. Результаты и выводы. Предложенная классификация моделей показала, что алгоритм их разработки, основанный на линейной регрессии по финансовым коэффициентам, не отвечает современным требованиям. Тем самым обоснована необходимость формирования нового методического подхода к разработке прогностических моделей, основанного на принципах машинного обучения. Обоснованно доказана невозможность построения моделей бинарной классификации линейного типа. Кроме того, Logit-модели имеют большую точность и позволяют включать в модель не только количественные, но и качественные факторы. Разработанная по данной методике модель прогнозирования банкротства предприятий показала высокую точность на обучающей выборке - 92 % на интервале 1 год; 85 % на интервале 2 года.

Ключевые слова: банкротство, прогноз, модель, машинное обучение.

Abstract. Subject and goals. The materials of the study of methods for predicting the probability of bankruptcy of enterprises are presented; in particular, a methodology is proposed based on the use of machine learning elements for these purposes. The goal is the formation of methodological and methodological foundations for predicting the probability of bankruptcy of enterprises based on the use of machine learning principles. Materials and methods. The implementation of this approach is considered on the example of the Logit model, built on the materials of the enterprises of the Penza region, formed into a training sample. The training sample was compiled from the financial statements of enterprises that entered into bankruptcy proceedings, as well as those that retained solvency in one time period. In order to predict bankruptcy, it is proposed to use models with training in binary classification, which allow not only to assess the likelihood of an event, but also to classify

research objects. Results and conclusions. The proposed classification of models showed that the algorithm for their development, based on a linear regression of financial ratios, does not meet modern requirements. This substantiates the need for a new methodological approach to the development of prognostic models based on the principles of machine learning. The impossibility of constructing models of a binary classification of a linear type is proved reasonably. In addition, Logit models are more accurate and allow you to include in the model not only quantitative, but also qualitative factors. The bankruptcy forecasting model developed by this methodology has shown high accuracy in the training sample -92 % over a 1-year interval; 85 % over an interval of 2 years.

Keywords: bankruptcy, forecast, model, machine learning.

Введение

Нестабильность ситуации как в общемировом масштабе, так и в отечественной экономике порождает резкие, периодические колебания в предпринимательской среде, сопровождающиеся большим числом закрытий (ликви-даций) субъектов хозяйственной деятельности (предприятий). Особенно остро в периоды экономических кризисов встает проблема роста банкротств предприятий различных секторов.

В последнее время появилось достаточно много научных и практических исследований, объясняющих причины и последствия данной проблемы. Однако, на наш взгляд, большинство исследований недостаточно полно раскрывают взаимосвязь кризисных ситуаций конкретных хозяйственных единиц и макроэкономический характер проблемы.

С другой стороны, следует отметить, что характер публикуемых исследований формируется по направлению усложнения разрабатываемых моделей, что, несомненно, снижает их практическую ценность. На наш взгляд, усложнение моделей, нацеленных на прогнозирование банкротства и управление кризисными ситуациями на предприятиях, не всегда оправданно. Обоснование таких выводов, как правило, было затруднено методологическими и методическими подходами к разработке моделей.

Однако реализация новых подходов, в первую очередь методологии машинного обучения моделей, дает возможность не только оценивать точность и адекватность моделей, но и проводить их динамические изменения в условиях изменения основных предпосылок.

Исследования данного научно-практического направления, несомненно, будут способствовать устойчивости развития и роста экономики страны.

Постановка проблемы

Проблемы прогнозирования банкротства предприятий рассматриваются сегодня во многих научных работах как российских, так и зарубежных авторов. Однако следует отметить, что большинство зарубежных методик слабо адаптируются к российским условиям. Вместе с тем модели прогнозирования, построенные по отечественным методикам, не всегда соответствуют заявленным точности и адекватности [1]. Существует высокая потребность в разработке методов прогнозирования банкротства предприятий, которые отличались бы высокой точностью, гибкостью моделей и одновременно умеренной сложностью их построения.

В современных условиях появились новые инструменты экономико-математического моделирования - анализ данных и машинное обучение, позволяющие решать такие задачи. Реализация принципов машинного обучения позволяет не только строить прогнозные модели, но и эффективно адаптировать их к быстроменяющимся условиям рыночной среды.

Несмотря на огромное многообразие предлагаемых моделей прогнозирования банкротства предприятий их можно достаточно узко классифицировать. Так, большинство моделей построены по принципам линейной регрессии, где в качестве регрессоров выступают финансовые коэффициенты. К таким подходам можно отнести модели Бивера, Лиса, Тишоу и др. [2].

В моделях Альтмана, Фулмера, Спрингейта применены элементы дис-криминантного анализа, который позволяет эффективно распределить объекты исследования по классам - ранжировать по степени вероятности наступления банкротства [2].

Большинство отечественных моделей прогнозирования банкротства сформированы на основе этих двух подходов. К ним можно отнести: модель О. П. Зайцевой, модель Р. С. Сайфуллина и Г. Г. Кадыкова, модель Иркутской ГЭА, модель А. В. Колышкина и др. [3].

В последнее время большую распространенность получили модели, построенные на основе ^й-регрессий [4]. Использование logit-моделей позволяет получить более высокую точность прогноза за счет включения в модель как количественных, так и качественных переменных. Наиболее известны ^й-модели Ольсона, Евстропова, Хайдаршиной [5].

Современные тенденции развития научного инструментария в экономике формируют и новые подходы к разработке моделей прогнозирования банкротства предприятия, основанные на использовании современных экономико-математических методов (моделей машинного обучения, нейросете-вых моделей, моделей искусственного интеллекта) [6].

Методы исследования

По результатам анализа методов прогнозирования банкротства предприятий с использованием элементов машинного обучения определено, что наиболее часто обучению подвергаются модели, основанные на линейных и ^й-регрессиях. При этом ^й-модели имеют более высокую предсказательную способность.

На основании этого сформируем элементы методики построения logit-модели прогнозирования банкротства предприятий, используя принципы машинного обучения [7].

В задачах с обучением необходимо сформировать прогноз дискретного признака Y, зная набор значений экзогенных факторов х1, х2, ..., хп. Для целей прогнозирования банкротства, на наш взгляд, целесообразно использовать модели машинного обучения бинарной классификации. При таком подходе зависимая переменная или бинарный признак Y принимает два значения:

- 1, если событие произойдет;

- 0, если событие не произойдет.

Использование в задачах бинарной классификации моделей линейной регрессии невозможно, так как зависимая переменная Y здесь принимает любые значения от -да до +да.

Процесс поиска и построения оптимальной функции, предсказывающей вероятность того или иного, называется обучением. В основе этого процесса лежит минимизация функционала качества (ошибки), измеряющий качество работы модели [8].

С помощью построения logit-модели регрессии проанализируем зависимость наступления банкротства от значения коэффициента текущей ликвидности. Для двадцати фирм рассчитаем значения признака х - коэффициента текущей ликвидности и значения признака Y, равного нулю для тех фирм, которые успешно функционируют, и единице для тех, которые стали банкротами (табл. 1).

Таблица 1

Определение параметров обучаемой ^й-модели

х у а0 7,145969 Ш L -5,739361961

0,880042852 1 а1 -6,31325 1п L (при =сош1) -12,47664925

1,099836572 1

0,133160244 1 р 0,5 Отношение правдоподобия 13,47457458

0,556478261 1 Число степеней свободы 1

0,088398018 1 Р-значение 0,000241818

0,259866144 1

1,376578862 1 х 1,5

1,004014513 1 Рл(у=1|х} 0,089162507

0,778048468 1

0,424361942 1

1,672766965 0

1,421899886 0

1,876226089 0

1,018889339 0

1,389917326 0

1,080869776 0

3,439537102 0

1,267136327 0

9,229677076 0

8,359749012 0

В выделенных ячейках оценены параметры: a0 = 7,145969 и al = -6,31325. Таким образом, модель имеет вид:

1п^- = а0 + а1х = 7,145969 - 6,31325х 1 - p

или

P 1 + ^-7,145969+6,31325* .

Далее определим отношение правдоподобия. Так как в модели всего один регрессор, то введем число степеней свободы, равное единице, и вычислим наблюдаемый уровень значимости гипотезы Н0:а1 = 0. Поскольку он

1

оказался равен 0,000241818, есть основания отвергнуть гипотезу Н0 и считать, что вероятность наступления банкротства зависит от коэффициента текущей ликвидности при любом уровне значимости, большем 0,000241818.

Отрицательное значение коэффициента а\ указывает на наличие обратной связи, т.е. чем меньше Ктл, тем выше вероятность того, что фирма обанкротится. Более точно, уменьшение значения коэффициента текущей ликвидности на 0,01 пункта сопровождается в среднем увеличением шанса наступления банкротства в в"6'31325 = 0,0018 раза.

Апробация предложенной модели оценки вероятности несостоятельности (банкротства) проведена на примере выборки предприятий Пензенской области (20 предприятий различной отраслевой принадлежности), применявшим процедуру банкротства в 2016 году. Оценка риска наступления банкротства по полученным результатам значений осуществлялась за период с 2015 по 2016 г., т.е. за два года, предшествующие банкротству.

Точность оценки риска банкротства по предложенной модели составила 92 % на период прогнозирования 1 год и 85 % на период прогнозирования 2 года. Сравнительная оценка степени достоверности моделей банкротства представлена в табл. 2.

Таблица 2

Степень достоверности моделей банкротства

Модель Вероятность до 1 года, % Вероятность до 2 лет, % Примечание

Двухфакторная Альтмана [9] 65 60 Многообразие финансовых процессов не всегда отражается в коэффициентах платежеспособности

Оригинальная пятифакторная Альтмана [9] 85 51 Недостаток информации относительно рыночной стоимости капитала предприятия

Усовершенствованная пятифакторная [9] 88 66 Адаптирована к российской отчетности

Logit-модель (после обучения) 92 85 Выявлена на основании оценки российских компаний, учитывает макроэкономическую ситуацию, отраслевую принадлежность предприятия

Выводы

На рис. 1 представлены результаты апробации обученной модели прогнозирования вероятности банкротства на временном интервале 2 года. Точками отмечены наблюдения, а квадратными рамками обозначены прогнозы, полученные с помощью отсечения (фирма считается успешной при прогнозе вероятности р(х) > 1,5 и банкротом при р(х) < 1,5.

□ —•— •

О 0,5 1 1,5 2 2,5 3 3,5 4

х

Рис. 1. Результаты апробации сформированной Logit-модели.

Видно, что три точки обведены рамками: две компании-банкрота признаны успешными, а одна успешная - банкротом. В целом же 17 из 20 наблюдений были классифицированы правильно, а 3 из 20 - неправильно. Таким образом, доля правильных прогнозов на интервале 2 года составила 85 %.

Заключение

Предложенная методика разработки моделей прогнозирования вероятности банкротства организации с использованием элементов машинного обучения, несомненно, имеет более высокую предсказательную способность по сравнению с традиционными подходами, например моделями Альтмана. Однако, на наш взгляд, рост точности прогноза достигается не совсем оправданным усложнением методического подхода к прогнозированию. Используемый в целях обучения и построения моделей математический аппарат явно будет недоступным для практических работников реальных экономических субъектов.

Поэтому при решении конкретных задач прогнозирования вероятности банкротства более оправдано применение традиционных методов, которые позволяют получить достоверные оценки при сравнительно низких затратах (в том числе и времени, и усилий практических работников).

В целях же макроэкономического прогнозирования и прогнозирования развития региона модели, разработанные с элементами машинного обучения, несомненно, необходимы, так как дают более точные оценки. Однако их разработка - это прерогатива специализированных (отвечающих за управление банкротствами) организаций, а также научных организаций, имеющих соответствующий кадровый и технический потенциал.

Библиографический список

1. Копелев, И. Факторы прогнозирования риска банкротства компании / И. Копелев // Финансы и кредит. - 2014. - № 45 (621). - С. 42-49.

2. Bauer, J. Are hazard models superior to traditional bankruptcy prediction approaches? A comprehensive test / J. Bauer, V. Agarwal // Journal of Banking & Finance. - 2014. -Vol. 40. - P. 432-442.

3. Федорова, Е. А. Разработка моделей прогнозирования банкротства российских предприятий строительной и сельскохозяйственной отраслей / Е. А. Федорова, Я. В. Тимофеев // Финансы и кредит. - 2015. - № 32. - С. 2-10.

4. Brindescu-Olariu, D. Bankruptcy prediction logit model developed on Romanian paired sample / D. Brindescu-Olariu // Theoretical & Applied Economics. - 2017. - Vol. 24, № 1. - P. 5-22.

5. Казакова, Н. А. Риск-ориентированная модель для оценки вероятности банкротства компаний-членов стратегического альянса / Н. А. Казакова // Экономический анализ: теория и практика. - 2019. - № 7 (490). - С. 1295-1308.

6. Lacombe, D. J. Hierarchical Spatial Econometric Models in Regional Science. Regional Research Frontiers / D. J. Lacombe, et al. - Glazgo : Springer, 2017. - Vol. 2. Methodological Advances, Regional Systems Modeling and Open Sciences. - P. 151-167.

7. Keller, B. S. B. Abstract: Data Mining Alternatives to Logistic Regression for Prope / B. S. B. Keller, J.-S. Kim, P. M. Steiner. - Columbia University, 2013. - Vol. 48:1. -P. 164-164.

8. Mohri, M. Foundations of Machine Learning / M. Mohri, A. Rostamizadeh, A. Talwalkar. - Second Edition. - Cambridge ; Massachusetts ; London : MIT Press, 2018.

9. Малкина, М. Ю. Оценка финансовой нестабильности экономических систем: различные методы и модели / М. Ю. Малкина, А. О. Овчаров // Экономический анализ: теория и практика. - 2019. - № 7 (490). - С. 1273-1294.

References

1. Kopelev I. Finansy i kredit [Finance and credit]. 2014, no. 45 (621), pp. 42-49. [In Russian]

2. Bauer J., Agarwal V. Journal of Banking & Finance. 2014, vol. 40, pp. 432-442.

3. Fedorova E. A., Timofeev Ya. V. Finansy i kredit [Finance and credit]. 2015, no. 32, pp. 2-10. [In Russian]

4. Brindescu-Olariu D. Theoretical & Applied Economics. 2017, vol. 24, no. 1, pp. 5-22.

5. Kazakova N. A. Ekonomicheskiy analiz: teoriya i praktika [Economic analysis: theory and practice]. 2019, no. 7 (490), pp. 1295-1308. [In Russian]

6. Lacombe D. J. et al. Hierarchical Spatial Econometric Models in Regional Science. Regional Research Frontiers. Glazgo: Springer, 2017, vol. 2. Methodological Advances, Regional Systems Modeling and Open Sciences, pp. 151-167.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7. Keller B. S. B., Kim J.-S., Steiner P. M. Abstract: Data Mining Alternatives to Logistic Regression for Prope. Columbia University, 2013, vol. 48:1, pp. 164-164.

8. Mohri M., Rostamizadeh A., Talwalkar A. Foundations of Machine Learning. Second Edition. Cambridge; Massachusetts; London: MIT Press, 2018.

9. Malkina M. Yu., Ovcharov A. O. Ekonomicheskiy analiz: teoriya i praktika [Economic analysis: theory and practice]. 2019, no. 7 (490), pp. 1273-1294. [In Russian]

Опекунов Алексей Николаевич

кандидат экономических наук, доцент, кафедра экономики и финансов, Пензенский государственный университет

(Россия, г. Пенза, ул. Красная, 40) E-mail: opekunovan@yandex.ru

Opekunov Aleksey Nikolaevich candidate of economical sciences, associate professor,

sub-department of economics and finance,

Penza State University

(40 Krasnaya street, Penza, Russia)

Кузьмина Мария Геннадьевна

кандидат экономических наук, доцент, кафедра экономики и финансов, Пензенский государственный университет

(Россия, г. Пенза, ул. Красная, 40) E-mail: lu-mariya@mail.ru

Kuz'mina Mariya Gennad'evna candidate of economical sciences, associate professor,

sub-department of economics and finance,

Penza State University

(40 Krasnaya street, Penza, Russia)

Образец цитирования:

Опекунов, А. Н. Принципы формирования моделей прогнозирования вероятности банкротства предприятий с использованием элементов машинного обучения / А. Н. Опекунов, М. Г. Кузьмина // Модели, системы, сети в экономике, технике, природе и обществе. - 2019. - № 4 (32). - С. 24-31.

i Надоели баннеры? Вы всегда можете отключить рекламу.