Научная статья на тему 'АНАЛИЗ ПРОЦЕССА, ВЕДУЩЕГО К ФИНАНСОВОМУ КРАХУ ФИРМЫ, НА ОСНОВЕ БАЙЕСОВСКИХ СЕТЕЙ'

АНАЛИЗ ПРОЦЕССА, ВЕДУЩЕГО К ФИНАНСОВОМУ КРАХУ ФИРМЫ, НА ОСНОВЕ БАЙЕСОВСКИХ СЕТЕЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY-NC-ND
102
21
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БАНКРОТСТВО / ПРОЦЕСС ФИНАНСОВОГО КРАХА / БАЙЕСОВСКАЯ СЕТЬ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Зеленков Юрий Александрович

В работе исследуются этапы процесса, ведущего к финансовому краху компании, с использованием байесовской сети в качестве инструмента моделирования, поскольку такой подход позволяет выявить причинно-следственные связи в профиле фирмы. Использованы общедоступные данные о французских, итальянских и российских фирмах, содержащие пять выборок, соответствующих периодам от одного года до пяти лет до момента наблюдения. Полученные результаты подтверждают, что существует разница между стадиями процесса, ведущего к банкротству. Для фирм, находящихся в начале длительного процесса (3-5 лет до дефолта), ключевым фактором, определяющим ликвидность, является кумулятивная прибыльность. По мере развития процесса, в среднесрочной перспективе (1-2 года до дефолта) для экономик с большей неопределенностью на первый план выходит способность обслуживать обязательства. Этот фактор ограничивает возможности получения прибыли, что приводит к дальнейшему развитию проблем. Существуют также национальные особенности, которые обусловлены, во-первых, уровнем экономического развития и, во-вторых, неопределенностью экономической политики.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ANALYSING THE FIRM FAILURE PROCESS USING BAYESIAN NETWORKS

This work analyses the firm failure process stages using the Bayesian network as a modelling tool because it allows us to identify causal relationships in the firm profile. We use publicly available data on French, Italian and Russian firms containing five samples corresponding to periods from one to five years before observation. Our results confirm that there is a difference between the stages of the failure process. For firms at the beginning of a lengthy process (3-5 years before observation), cumulative profitability is the key that determines liquidity. Then, as the process develops, leverage comes to the fore in the medium term (1-2 years before observation) for economies with more uncertainty. This factor limits the opportunities for making a profit, leading to further development of the failure. There are also national specifics that are caused, firstly, by the level of economic development and, secondly, economic policy uncertainty.

Текст научной работы на тему «АНАЛИЗ ПРОЦЕССА, ВЕДУЩЕГО К ФИНАНСОВОМУ КРАХУ ФИРМЫ, НА ОСНОВЕ БАЙЕСОВСКИХ СЕТЕЙ»

БИЗНЕС-ИНФОРМАТИКА Т. 16 № 1 - 2022 DOI: 10.17323/25 87-814X.2022.1.22.41

Анализ процесса, ведущего к финансовому краху фирмы,

^ W W

на основе байесовских сетей

Ю.А. Зеленков

E-mail: yzelenkov@hse.ru

Национальный исследовательский университет «Высшая школа экономики»

Адрес: Россия, 101000, г. Москва, ул. Мясницкая, д. 20

I Аннотация

В работе исследуются этапы процесса, ведущего к финансовому краху компании, с использованием байесовской сети в качестве инструмента моделирования, поскольку такой подход позволяет выявить причинно-следственные связи в профиле фирмы. Использованы общедоступные данные о французских, итальянских и российских фирмах, содержащие пять выборок, соответствующих периодам от одного года до пяти лет до момента наблюдения. Полученные результаты подтверждают, что существует разница между стадиями процесса, ведущего к банкротству. Для фирм, находящихся в начале длительного процесса (3—5 лет до дефолта), ключевым фактором, определяющим ликвидность, является кумулятивная прибыльность. По мере развития процесса, в среднесрочной перспективе (1—2 года до дефолта) для экономик с большей неопределенностью на первый план выходит способность обслуживать обязательства. Этот фактор ограничивает возможности получения прибыли, что приводит к дальнейшему развитию проблем. Существуют также национальные особенности, которые обусловлены, во-первых, уровнем экономического развития и, во-вторых, неопределенностью экономической политики.

Ключевые слова: банкротство, процесс финансового краха, байесовская сеть

Цитирование: Зеленков Ю.А. Анализ процесса, ведущего к финансовому краху фирмы, на основе байесовских сетей

// Бизнес-информатика. 2022. Т. 16. № 1. С. 22-41. DOI: 10.17323/2587-814X.2022.1.22.41

Введение

Изучение финансовых крахов является одним из ключевых вопросов в бизнес-исследованиях. Его можно разделить на два направления [1]: первое — предсказание дефолтов, второе — теоретические и эмпирические исследования процесса, ведущего к дефолту. Изучение процесса краха позволяет рассмотреть поведение

неуспешных фирм в более длительной перспективе [2, 3], в то время как модели предсказания дефолта часто фокусируются на финансовых показателях только за один или несколько лет до наступления проблем [4, 5].

Основной недостаток моделей краткосрочного прогнозирования заключается в том, что обязательства компании часто бывают длиннее того перио-

да, в течение которого риск дефолта оценивается с приемлемой точностью [6]. Таким образом, компанию следует анализировать в более длительной перспективе. Более того, в то время как одни фирмы с определенным профилем финансовых показателей терпят крах, другие с таким же профилем могут преодолеть трудности и вернуться к нормальной деятельности. Поэтому многие авторы утверждают, что существуют различные типы траекторий, которые могут привести или не привести фирму к дефолту в зависимости от ее предыстории и текущих возможностей [1, 7—9].

Существование различных вариантов процессов краха фирмы (firm failure process, FFP) подтверждается многими теоретическими и эмпирическими исследованиями. Однако в научном сообществе нет единого мнения не только о точном определении этих процессов, но даже о количестве их вариантов. Например, в [10] представлены три траектории финансового краха фирм, в [8] описываются четыре различных типа процессов, в [11] выделено семь типов FFP. Эти различия объясняются, во-первых, используемой методологией, например, работы [8] и [10] основаны на кейс-методе, а в [11] анализируются эмпирические данные с помощью самоорганизующихся карт. Во-вторых, авторы рассматривают процесс с разных сторон. Авторы [10, 11] фокусируются на финансовых результатах (этот подход используется и во многих других работах, например, [1, 2] и др.), в то время как [8] рассматривает проблему через призму эффективности управления.

В данной работе мы фокусируемся на определении специфики различных этапов процесса неудачи фирмы. Этой цели соответствуют три исследовательских вопроса (research questions, RQ):

♦ RQ1: как изменяются причинно-следственные связи между финансовыми коэффициентами, описывающими состояние фирмы, в различные периоды до дефолта?

♦ RQ2: существуют ли различия в процессах финансового краха фирм, которые определяются спецификой страны?

♦ RQ3: как степень неопределенности экономической политики влияет на процесс краха фирмы?

Мы используем байесовскую сеть в качестве

инструмента моделирования, поскольку она позволяет выявить причинно-следственные связи в профиле фирмы. Исследование выполнено на общедоступных данных о французских, итальянских и российских компаниях, представляющих финан-

совые коэффициенты фирм за период от одного года до пяти лет до дефолта.

Полученные результаты подтверждают, что существует разница между стадиями процесса, ведущего к банкротству (Л0). Для фирм в начале длительного процесса (за 3—5 лет до момента наблюдения) кумулятивная прибыльность является ключевым фактором, определяющим ликвидность. Затем, по мере развития процесса, в среднесрочной перспективе (1—2 года до момента наблюдения) для экономик с большей неопределенностью на первый план выходит способность обслуживать обязательства. Этот фактор ограничивает возможности получения прибыли, что приводит к дальнейшему развитию факторов, ведущих к банкротству. Существуют также национальные особенности, которые обусловлены, во-первых, уровнем развития экономики (Я02) и, во-вторых, неопределенностью экономической политики (^^3).

Статья организована следующим образом. После обзора источников, анализирующих FFP, представлены основные концепции байесовских сетей. Далее описаны наборы данных и операции предварительной обработки, необходимые для подготовки данных к моделированию. В заключительной части анализируются полученные сетевые структуры и обсуждаются дальнейшие исследования для расширения предложенного подхода.

1. Обзор литературы

Первые исследования в области прогнозирования банкротств начались в 1930-х годах [12]. Эти исследования в основном фокусировались на сравнении индивидуальных показателей успешных и неуспешных фирм, однако количество публикаций оставалось относительно небольшим. Первая многомерная модель была представлена Альтманом в 1968 г. [13], который использовал дискриминант-ный анализ на основе пяти финансовых коэффициентов. Эта модель, также известная как Z-модель, открыла эру интенсивных исследований. Исследователи разработали множество прогностических моделей, используя как статистические методы, так и машинное обучение. Следует отметить, что модели, основанные на машинном обучении, в целом обеспечивают более высокие показатели [14, 15]; однако Z-модель с некоторыми модификациями также остается актуальной [4].

Общей особенностью прогнозных моделей является то, что они рассматривают проблему про-

гнозирования банкротства как задачу бинарной классификации. При этом чаще всего рассматриваются данные финансовой отчетности за небольшое количество периодов до дефолта. Фактически, эти модели строятся на кросс-секционных данных; коэффициенты за разные периоды времени часто объединяются в одну точку наблюдения; таким образом, индивидуальная динамика фирмы не учитывается. Такой подход игнорирует тот факт, что компании меняются с течением времени, что вызывает различные проблемы и ограничения [16]. Профиль фирмы, измеренный в момент времени t, не может быть сведен только к измерениям в момент времени t — 1, поскольку дефолт в большинстве случаев является результатом длительного процесса [9], а дискриминационная способность коэффициентов нестабильна во времени [17].

Существуют модели, основанные на наблюдениях за один, два или более лет до неудачи в момент времени t, которые, как считается, могут предсказать состояние в годы t + 1, t + 2 или даже t + 10 [2, 18]. Однако, поскольку они не рассматривают крах фирмы как процесс, они имеют те же ограничения, что выделены [16].

В некоторых прогностических исследованиях используются методы, позволяющие учитывать как динамику популяции фирм, так и их уникальные характеристики, например, панельная регрессия [19] или анализ выживаемости [20]. Однако в целом количество таких работ в общем потоке исследований по прогнозированию финансовых проблем сравнительно невелико.

1.1. Процесс, ведущий к дефолту фирмы

Дж. Ардженти [10] был, пожалуй, первым, кто начал изучать процесс краха фирмы. Он выделил три модели спада и обнаружил, что разоряющиеся фирмы не терпят крах сразу после спада. Некоторые из них могут откладывать наступление банкротства на годы.

Р. Д'Авени [7] эмпирически проверил эти выводы на основе изучения отдельных кейсов. По мнению обоих авторов, существуют три процесса финансового краха:

♦ Внезапный спад (sudden decline), то есть быстрый крах фирмы. Этот процесс неудачи характерен для небольших или конкурентно неблагополучных фирм, которые слишком смело переориентировали свою стратегию.

♦ Постепенный упадок (gradual decline), т.е. медленный и постепенный процесс, характерный для бюрократических и плохо управляемых фирм, которые не могут адаптироваться к внешней среде.

♦ Затяжной упадок (lingering decline). Этот процесс характерен для фирм, которые приходят в упадок либо быстро, либо постепенно, но откладывают банкротство на несколько лет. Такие фирмы после спада часто приобретают жесткую централизованную структуру и демонстрируют стратегический паралич и снижение активности. Основываясь на этих исследованиях, в [1] постулируется существование трех типов процесса краха:

♦ краткосрочный процесс, когда потенциальный финансовый сбой может быть обнаружен не более чем в течение 1 года после последней отчетности;

♦ среднесрочный процесс соответствует ситуации, когда первые сигналы потенциального сбоя могут быть обнаружены за 2—3 года до дефолта;

♦ долгосрочный процесс, когда потенциальный сбой может быть обнаружен более чем за 3 года до дефолта.

Краткосрочные процессы больше подходят для описания ситуации, когда фирма с хорошими показателями внезапно терпит крах. Среднесрочные и долгосрочные процессы, в свою очередь, могут описывать две ситуации: фирма никогда не становится достаточно успешной или фирма становится хуже постепенно, шаг за шагом.

Для эмпирической проверки этого предположения авторы [1] проанализировали 1234 обанкротившихся производственных предприятия малого и среднего бизнеса из нескольких Европейских стран. Они применили четыре метода кластеризации к восьми различным наборам переменных (представленных в [4]) за последние пять лет до банкротства. Их результаты подтверждают существование трех типов процессов банкротства, различающихся длительностью и, следовательно, скоростью спада.

Обобщая их результаты, можно отметить следующее. Для краткосрочных процессов риск неудачи (failure risk, FR) наблюдаем только в год t — 1, а отрицательная годовая прибыльность является наиболее важным индикатором. Для среднесрочных процессов риск неудачи может быть обнаружен в годы t — 2 и t — 3. При этом наиболее важным индикатором является также отрицательная годовая

рентабельность, а вторым по уровню значимости — размер заемных средств. Для фирм, вовлеченных в долгосрочный процесс, первые сигналы могут быть обнаружены до t — 3, индикаторами служат годовая и кумулятивная рентабельность и размер заемных средств. Эти факторы вносят вклад в FR также в годы t — 2 и t — 1. Ликвидность как показатель FR важна только для последних стадий среднесрочных и долгосрочных процессов.

Однако такой взгляд на процессы финансового краха не является единственным. Например, в [8] представлено четыре различных процесса, объясняемых через призму менеджмента: (1) неудачный старт из-за отсутствия управленческого или отраслевого опыта, (2) рискованный рост фирм с чрезмерно оптимистичным руководством, (3) несбалансированный рост, вызванный ослеплением руководства, и (4) апатичная зрелая фирма, управляемая людьми с недостатком мотивации и приверженности.

В серии работ [6, 9, 11] моделируются различные процессы неудач (также называемые траекториями или профилями) с помощью самоорганизующихся карт (self-organized maps — SOM) Кохоне-на. Основная идея применения SOM для изучения индивидуальных траекторий фирм проста. Пусть у нас есть панельные данные (наблюдения за объектами, соответствующие измерениям, сделанным в разные периоды времени). Если все наблюдения классифицировать с помощью SOM, как независимые, то можно изучить изменение состояния данного объекта во времени [21]. Насколько нам известно, впервые этот подход был использован в [22] для анализа финансового состояния испанских банков. Автор отметил, что обученная модель SOM группирует объекты в соответствии с их сходством финансового состояния. Таким образом, новые наблюдения будут помещены в определенную зону (банкроты или не банкроты) в соответствии с активированными нейронами на карте. Таким образом, можно наблюдать за эволюцией банка, используя финансовую информацию за разные годы.

Вкратце методологию [6, 9, 11] можно описать следующим образом: на первом этапе все фирмы отображаются на SOM, наблюдения фирмы в разные моменты времени считаются независимыми. Затем строятся траектории фирм, представленные списком нейронов, которые соответствуют наблюдениям одной организации в последовательные моменты времени. На последнем этапе траектории группируются в мета-классы, которые можно рассматривать как процессы, приводящие или не

приводящие к дефолту. Результаты авторов подтверждают, что ошибка обобщения, достигнутая с помощью SOM, остается более стабильной с течением времени, чем ошибка, достигнутая с помощью обычных моделей дефолта (дискриминантный анализ, логистическая регрессия, модель выживания Кокса, нейронные сети и ансамблевые методы). Однако, что более важно в контексте нашего обсуждения, автор рассматриваемой методологии выделяет разное количество процессов, которые показывают перемещение фирм между регионами с разной вероятностью краха: шесть в работе [9], семь в [11], восемь в [6]. Это различие можно объяснить влиянием используемых данных (конкретные годы и временной лаг до дефолта) и влиянием техники группировки траекторий. Это может быть несущественным с точки зрения эффективности модели, поскольку основной целью этих работ является повышение точности прогнозирования за счет учета предыстории фирмы. Однако, даже если этот подход улучшает прогностические возможности, он не позволяет анализировать процессы отказа, поскольку основан на модели «черного ящика».

Таким образом, можно сделать вывод, что существование различных процессов краха фирмы является общепризнанным фактом, однако нет единого мнения относительно определения этих процессов. Чтобы внести вклад в решение этой проблемы, мы предлагаем использовать метод моделирования причинности, а именно байесовские сети. Такой подход позволяет выявить причинно-следственные связи между финансовыми коэффициентами в различные периоды до банкротства, что может пролить свет на динамику развития фирмы.

1.2. Байесовские сети и моделирование причинно-следственных связей

Интуитивно причинно-следственную связь можно определить как влияние, посредством которого причина способствует возникновению следствия, при этом причина частично ответственна за следствие, а следствие частично зависит от причины [23]. Сложные системы характеризуются наличием множества взаимосвязанных аспектов. Таким образом, одной из самых больших проблем является извлечение причинно-следственных связей из эмпирических данных и построение моделей сложных систем, позволяющих изучать эти связи.

Подход, основанный на декларативном представлении [24], базируется на каузальной модели, кото-

рая кодирует знания о том, как работает система. Для представления причинно-следственных связей каузальная модель использует комбинацию уравнений и графиков. Математические уравнения, выражающие форму причинности (например, линейную или нелинейную), являются симметричными объектами, поэтому отношения переменных могут быть инвертированы с помощью простых манипуляций. По этой причине уравнения дополняются диаграммой, которая определяет направления причинно-следственного влияния [25]. Такая модель может быть построена вручную на основе знаний экспертов или автоматически с помощью алгоритмов машинного обучения [26].

Согласно [27], причинный вывод расширяет пре-диктивное моделирование (которое представляет собой оценку условного распределения ^(Y|X) переменных Y и X на основе случайной выборки) до каузального моделирования, где модель должна быть способна оценить условное распределение ^(Y|X||M) при манипуляции M.

Существует несколько подходов к построению причинно-следственных моделей, в частности моделирование структурными уравнениями (structural equation modeling, SEM) и байесовские сети (Bayesian networks, BN). SEM [28] ограничен, во-первых, тем, что требует априорных гипотез о причинно-следственных связях в системе. Во-вторых, он допускает только линейные типы связей. Поэтому в нашем исследовании мы будем использовать байесовские сети, поскольку они свободны от этих недостатков. Структура сети и ее параметры могут быть извлечены из данных, связи между переменными носят вероятностный характер.

Байесовская сеть кодирует совместное распределение вероятностей P(X) набора из m случайных категориальных переменных, X = (X1, ..., Xm), в виде направленного ациклического графа (directed acyclic graph, DAG) и набора таблиц условных вероятностей (conditional probability table, CPT). Более формально, это пара {Q, Т), где Q — DAG, вершины которого соответствуют переменным в X, а дуги представляют прямые зависимости между переменными, а Р — набор функций, определяющих поведение каждой переменной в X с учетом ее родителей в графе [27, 29].

Размер полной совместной таблицы P(X) экспоненциально зависит от числа переменных m. Этот размер может быть сокращен благодаря условию Маркова, которое гласит, что в байесовской сети

каждая переменная условно независима от своих не-потомков и не-родителей. Таким образом, для множества случайных переменных X в Q плотность P(X) имеет вид

т

Р(Х) = Р(Хр..., хт) = Р(Х. I parents^)),

i=1

где parents(X.) обозначает множество переменных X. а X, таких, что в графе существует дуга от узла j к узлу i.

Другими словами, каждый узел в графе Q, соответствующий переменной, имеет связанную с ним CPT, которая представляет вероятность каждого состояния переменной с учетом состояния ее родителей в графе. Такой вид представления позволяет компактно описать структуру сложного распределения [30]. С формальной точки зрения, байесовская сеть представляет собой базовое совместное распределение, включая такие вероятностные свойства, как условная независимость переменных друг от друга. С одной стороны, это более компактное представление сложных многомерных распределений. С другой стороны, «хорошая» структура сети должна соответствовать причинности, в том смысле, что ребро X —» Гчасто предполагает, что X «является причиной» Y, поскольку значения х из X определяют распределение значений Y[24, 25].

Байесовские сети имеют много преимуществ [24]. Во-первых, такой тип представления может быть легко интерпретирован. Во-вторых, такая структура позволяет отвечать на запросы, т. е. вычислять вероятность одних переменных при наличии данных о других. В-третьих, модели могут быть построены как экспертом, так и автоматически путем обучения на основе данных. В нашем исследовании мы будем использовать последний подход — обучение на основе данных.

Процесс построения байесовских сетей на основе данных V включает два этапа: генерацию графа, представляющего оптимальную структуру сети (обучение структуры), и определение условных вероятностей (обучение параметров). Многие авторы применяют байесовские сети для решения задач в различных областях: например, бизнес [31], экология [32], здравоохранение [33], диагностика неисправностей в инженерных системах [34] и многие другие [35].

Следует также отметить, что существует расширение модели байесовской сети для панельных данных, а именно динамические байесовские сети. Однако динамические модели основаны на пред-

положении, что исследуемый процесс является стационарным, то есть его параметры не меняются со временем. Согласно [1] и другим исследованиям, процесс банкротства фирмы не является стационарным. Поэтому в нашем исследовании мы генерируем структуры сетей для разных временных интервалов независимо друг от друга.

1.3. Вывод и объяснение в байесовских сетях

Вывод (inference) — это процесс извлечения новой вероятностной информации из байесовской сети. Он вычисляет совместные апостериорные вероятности для подмножества неизвестных переменных с учетом доказательств, которыми являются значения известных переменных. Такое вычисление является NP-полной задачей, поэтому предложены как алгоритмы, реализующие точное вычисление, так и алгоритмы для приближенного вычисления, которые могут сходиться медленно и даже не точно, но во многих случаях полезны на практике. Эта возможность позволяет использовать байесовскую сеть для контролируемой классификации, целью которой является присвоение меток экземплярам, описываемым набором предиктивных переменных [36].

Однако, в отличие от многих методов машинного обучения, байесовская сеть может использоваться не только для предсказания, но и для объяснения [37]. Задачи объяснения в байесовских сетях можно разделить на три категории [38]:

♦ объяснение модели — представление знаний о системе,

♦ объяснение рассуждений — представление выведенных результатов и процесса рассуждений,

♦ объяснение доказательств, т.е. определение того, какие значения ненаблюдаемых переменных объясняют имеющиеся наблюдения. Поскольку целью настоящего исследования является анализ структур байесовских сетей, которые моделируют фирмы в разные периоды времени перед финансовым крахом, объяснение модели является наиболее важным вопросом. В [39] авторы приводят примеры объяснений модели. Эти объяснения могут включать свойства узлов и их взаимное влияние, которое может быть отрицательным или положительным. Влияние узла A на узел B являет-

ся положительным, когда более высокие значения A делают более вероятными высокие значения B. Определения отрицательного влияния и отрицательной связи аналогичны.

2. Данные

Поскольку одним из вопросов нашего исследования является сравнение FFP для разных стран, для анализа выбраны фирмы трех страны: Франция, Италия и Российская Федерация.

Для сравнения экономик на макроуровне мы используем валовой внутренний продукт (ВВП), пересчитанный в доллары 2017 года по паритету покупательной способности (ППС) и разделенный на общую численность населения1.

На рис. 1 показано изменение этого показателя за временной интервал 2009—2019 гг. Франция имеет наиболее стабильную экономику; она демонстрирует постоянный рост ВВП на душу населения в течение всего исследуемого периода. Экономика Италии более нестабильна; после 2010 года наблюдался спад, рост возобновился только в 2015 году. Движущей силой итальянской экономики в значительной степени являются малые и средние предприятия, многие из которых находятся в семейной собственности. В Италии также существует значительная теневая экономика, которая оценивается в 17% от ВВП2. Исходя из этих данных, можно ожидать, что модель FFP для французских фирм будет более стабильной, чем для итальянских, поскольку они работают в более предсказуемой среде. Отметим, что согласно классификации Всемирного банка, обе страны относятся к группе развитых стран.

Российская Федерация относится к группе развивающихся стран или стран с переходной экономикой. Российская экономика характеризуется значительной долей государственного сектора и в значительной степени регулируется не рынком, а политическими решениями. Сочетание падения цен на нефть, международных санкций и структурных ограничений ввергло Россию в глубокую рецессию в 2015 году, однако в 2017 году падение ВВП было остановлено, поскольку мировой спрос на нефть вырос. Наличие этих факторов ведет к высокому росту экономической неопределенности. В

1 https://data.workdbank.org

2 CIA (2021) The World Factbook. https://www.cia.gov/the-world-factbook/

♦ Неуспешные компании ( Class = 1), которые имеют один из статусов: Active (default of payment), Active (insolvency proceedings), Bankruptcy, Dissolved (liquidation), and Dissolved.

Таким образом, для каждой из рассматриваемых стран получено пять выборок, соответствующих периоду t — n, n = 1, ..., 5 до наблюдения в году t. Каждое наблюдение имеет метку класса, которая указывает на состояние фирмы в конце прогнозного периода t: финансовый крах (Class =1) или успешная компания (Class = 0). Количество наблюдений для каждого временного периода представлено в таблице 1; в скобках указано количество фирм, потерпевших неудачу. Как видно, все наборы данных являются несбалансированными. Значения коэффициента дисбаланса (imbalance ratio, IB), рассчитанного как отношение числа наблюдений отрицательного класса к числу неудачных компаний, также приведены в таблице 1.

2.1. Отбор переменных

Поскольку целью работы является построение интерпретируемых причинно-следственных моделей, необходимо сократить количество переменных в исходном наборе данных, оставив только те, которые обеспечивают оптимальный баланс простоты и полноты. Поэтому мы будем следовать подход [1], которые при анализе процесса банкротства использовали четыре переменные, включенных в Z''-модель Альтмана.

В работе, представляющей первоначальную Z-модель, Альтман [13] рассмотрел 22 потенциаль-

Таблица 1.

Характеристики набора данных

t - 5 t - 4 t - 3 t - 2 t - 1

Франция Кол-во фирм 48024 (1509) 47163 (1503) 44151 (1439) 41798 (1382) 39720 (1313)

IB 30,825 30,379 29,682 29,245 29,251

Италия Кол-во фирм 55895 (5223) 56036 (5349) 56170 (5522) 56115 (5535) 55728 (5498)

IB 9,702 9,476 9,172 9,138 9,136

РФ Кол-во фирм 44354 (1941) 43859 (2077) 43153 (2167) 43050 (2337) 42931 (2398)

IB 21,851 20,117 18,914 17,421 16,903

3 Bureau van Dijk. Amadeus. https://amadeus.bvdinfo.com 28 =

50000 45000 40000 35000 30000 25000 20000

2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 - FRA ----ITA ...........RUS

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 1. Изменение ВВП по ППС на душу населения (доллары США).

таких условиях можно ожидать, что модель FFP для российских фирм будет довольно сильно меняться на разных этапах.

Данные, необходимые для исследования, были получены из базы Bureau van Dijk Amadeus3. Отобраны фирмы, относящиеся к малому и среднему бизнесу, работавшие в 2009—2019 гг. (2020 год исключен, чтобы избежать влияния шоков, связанных с пандемией COVID-19). Размер фирмы определялся по количеству сотрудников за последний доступный год, заданы ограничения min = 10, max = 250. Отобранные фирм для каждой страны размечены согласно следующему правилу: ♦ Успешные компании (Class = 0), которые имеют статус Active в последнем доступном году.

Таблица 2.

Финансовые коэффициенты модели Альтмана

Категория Коэффициент Формула Примечания

Ликвидность WCTA Working Capital / Total Assets Оборотный капитал определяется как разница между текущими активами и текущими обязательствами, поэтому данный коэффициент является мерой чистых ликвидных активов фирмы по отношению к общей капитализации [13]. Роль ликвидности основана на юридических соображениях, поскольку неспособность выплатить непогашенный долг является достаточным условием для начала официального процесса банкротства [1].

Кумулятивная прибыльность RETA Retained Earnings / Total Assets Это мера кумулятивной прибыльности во времени, которая неявно включает в себя возраст фирмы [13].

Текущая прибыльность EBITTA Earnings before Interest and Taxes / Total Assets Это показатель истинной производительности активов фирмы, абстрагированный от любых налоговых или факторов левериджа [13].

Леверидж BVETL Book Value of Equity / Book Value of Total Liabilities В первоначальной Z-модели использовалась рыночная стоимость собственного капитала, но этот подход применим только к публично торгуемым компаниям [4]. Этот коэффициент измеряет способность компании обслуживать обязательства за счет собственного капитала, поскольку дополнительный долг при прочих равных условиях увеличивает вероятность банкротства [1].

Активность STA (excluded) Sales / Total Assets Исключен из пересмотренной Zи-модели, поскольку является переменной, чувствительной к отрасли [4].

но важных финансовых коэффициента, классифицированных по пяти стандартным категориям: ликвидность, прибыльность, леверидж (способность обслуживать обязательства за счет собственных средств), платежеспособность и активность. Только пять финансовых коэффициентов были включены в окончательную дискриминантную модель (таблица 2). Более высокие значения всех выбранных коэффициентов соответствуют более низкой вероятности банкротства.

Позже автор отметил, что оригинальная модель применима только к публично торгуемым компаниям, поскольку включает рыночную стоимость (marked value of equity) фирмы [40]. По этой причине в новой версии модели он заменил рыночную стоимость капитала балансовой (book value of equity) стоимостью (Z'-модель). Следующим значительным усовершенствованием стало исключение коэффициента «Продажи / Общие активы», поскольку его значение сильно зависит от отрасли (Z''-модель).

Таким образом, мы будем использовать четыре коэффициента (WCTA, RETA, EBITTA и BVETL), включенные в Z''-модель. Одним из предварительных условий моделирования на основе байесовской

сети является отсутствие латентных переменных (ненаблюдаемых переменных, влияющих на переменные сети). Основываясь на модели Альтмана, можно с уверенностью считать, что это условие выполнено и латентных факторов в эмпирических данных нет.

В работе [4] Альтман и соавторы проверили эффективность Z''-модели, используя международный набор данных (более 2,6 млн наблюдений фирм из 31 страны в обучающей выборке). В целом их результаты подтверждают, что точность модель достаточно высока, несмотря на ее простоту. Однако авторы сделали несколько важных уточнений:

♦ коэффициенты модели должны оцениваться раздельно для каждой выборки,

♦ модель, основанная на логистической регрессии, дает лучшие результаты, чем версия на основе множественного дискриминантного анализа.

Поэтому мы будем использовать логистическую регрессию как базовую модель для валидации преобразований данных. В таблице 3 представлены значения ROC AUC, полученные с помощью процедуры 10-кратной кросс-валидации логистической регрессии (LR) для данных, содержащих вышеуказанные четыре признака Альтмана (см.

Таблица 3.

Значение метрики ROC AUC (10-кратная кросс-валидация)

Данные Модель Период

t - 5 t - 4 t - 3 t - 2 t - 1

Франция

Raw data LR 0,675(0,034) 0,686(0,034) 0,694(0,026) 0,705(0,024) 0,714(0,028)

Discretized data LR 0,687(0,030) 0,696(0,029) 0,712(0,022) 0,723(0,019) 0,729(0,027)

BN 0,686(0,028) 0,697(0,028) 0,712(0,016) 0,726(0,015) 0,727(0,032)

Италия

Raw data LR 0,695(0,039) 0,727(0,031) 0,744(0,026) 0,768(0,017) 0,802(0,012)

Discretized data LR 0,716(0,027) 0,761(0,019) 0,777(0,015) 0,798(0,013) 0,826(0,009)

BN 0,717(0,028) 0,757(0,019) 0,776(0,013) 0,809(0,021) 0,833(0,015)

Российская Федерация

Raw data LR 0,658(0,023) 0,675(0,021) 0,691(0,014) 0,711(0,014) 0,742(0,010)

Discretized data LR 0,676(0,024) 0,683(0,018) 0,695(0,011) 0,731(0,021) 0,757(0,020)

BN 0,709(0,034) 0,740(0,038) 0,738(0,034) 0,743(0,030) 0,770(0,037)

строку «Raw data» для каждой страны). Отметим, что качество прогнозирования снижается по мере увеличения интервала между наблюдением и оценкой, поскольку подход классификации игнорирует изменения в фирме с течением времени [16].

2.2 Дискретизация

Еще одна проблема применения байесовских сетей связана с тем, что концепция нелинейной байесовской сети была разработана для работы с дискретными или категориальными данными. Существует три общих подхода к расширению байесовской сети на непрерывные данные [41]. Первый заключается в моделировании условной плотности вероятности непрерывных переменных с помощью параметрических распределений, а затем в перепроектировании алгоритмов обучения сети на основе параметризации [42]. Второй подход заключается в использовании непараметрических распределений, таких как гауссовские процессы [43]. Третий подход — дискретизация, то есть процесс, который преобразует непрерывную переменную в конечное число интервалов и связывает с каждым интервалом дискретное значение [44, 45].

Подход к дискретизации в контексте байесовских сетей можно разделить на две части. Во-первых,

существуют алгоритмы, которые дискретизируют атрибуты на основе взаимозависимостей между метками классов и значениями атрибутов, например метод энтропийного бининга [46]. Эти алгоритмы основаны на подходе классификации данных. Они используются для дискретизации всех непрерывных переменных перед обучением структуры байесовской сети. Следующий класс алгоритмов требует, чтобы структура сети была известна заранее [41, 45, 47]. Эти алгоритмы начинают с некоторой предварительной политики дискретизации, затем запускается алгоритм обучения структуры для определения локально оптимальной структуры графа. Затем политика дискретизации обновляется на основе обученной сети, и этот цикл повторяется до сходимости.

Мы провели серию экспериментов и выяснили, что предварительная дискретизация по методу [46] позволяет обучать сети с более высокой метрикой качества. В таблице 3 приведены оценки ROC AUC логистической регрессии (LR), полученные на дис-кретизированных данных, которые подтверждают, что выбранный подход к дискретизации улучшает производительность модели.

Для справки, на рис. 2 и 3 показано распределение необработанных и дискретизированных данных соответственно набора данных по Италии за период t — 1. Отметим, что средние значения преобразованных

ЯЕТД: ц = 0,02 а = 0,10 skew = -5,91

12,5- 1,5"

10,0-

7,5- 1,0-

5,0-

1 0,5 -

2,5 - д

2-

1 0 -1 -2

-2,5 0 2,5 Теоретические квантили

\«СТД: ц = 0,17 а = 0,26 Бке^« = -0,50

ЕВ1ТТА: ц = 0,05 а = 0,11 skew = -3,09

ВУЕТ1_: ц = 0,44 а = 0,51 skew = 1,73

-2,5 0 2,5 Теоретические квантили

-2,5 0 2,5 Теоретические квантили

-2,5 0 2,5 Теоретические квантили

Рис. 2. Набор данных Италия t- 1: распределение исходных (непрерывных) данных.

1,2 1,0

I 0,8

н

лот 0,6

0,4 0,2 0

ия 12,5

ачен 10,0 а

1 7,5 ы

ченны 5,0

рядоч 2,5 р

по 0

ЯЕТД: ц = 0,02 а = 0,10 skew = -5,91

WCTД: ц = 0,17 а = 0,26 skew = -0,50

ЕВ1ТТА: ц = 0,05 а = 0,11 skew = -3,09

ВУЕТЬ: ц = 0,44 а = 0,51 skew = 1,73

-2,5 0 2,5 Теоретические квантили

-2,5 0 2,5 Теоретические квантили

-2,5 0 2,5 Теоретические квантили

-2,5 0 2,5 Теоретические квантили

Рис. 3. Набор данных Италия t- 1: распределение дискретизированных данных.

0

0

0

2

0

коэффициентов изменились, поскольку теперь вместо абсолютных значений мы используем определение интервалов, на которые делится каждая переменная. Для моделирования на основе байесовской сети такое преобразование приемлемо, поскольку в модели используются совместные вероятности. Количество интервалов, согласно [46], определяется на основе совместного распределения дискретизируе-мого признака и целевой переменной.

3. Эксперимент и результаты

Процесс построения байесовских сетей по данным D включает два этапа: генерирование направленного ациклического графа Q, представляющего оптимальную структуру байесовской сети (обучение структуры), а затем определение таблиц условных вероятностей Т для каждого узла графа (обучение параметров). Для нашего исследования наиболее важно изучить структуру байесовских сетей, соответствующих различным периодам до дефолта. Однако мы выполнили оба этапа обучения, так как CPT важен для причинного вывода и, следовательно, использования модели в качестве прогностического инструмента.

Обучение структуры байесовских сетей может быть сложным по двум основным причинам: (1) вывод причинности и (2) сверхэкспоненциальное число направленных ребер, которые могут существовать в наборе данных. Большинство методов изучения структуры можно отнести к одной из следующих категорий [24, 29]:

♦ обучение структуры в процессе решения задачи оптимизации некоторой метрики score (G, D)

argmax score (G, D).

GeQ

Другими словами, задача состоит в том, чтобы найти наилучший ориентированный ациклический граф в соответствии с некоторой функцией оценки, которая измеряет его соответствие данным. Широко распространенными оценками являются метрика Байеса-Дирихле (BDeu), Байесовский информационный критерий (BIC), который аппроксимирует BDeu, и информационный критерий Акаике (AIC).

♦ семейство алгоритмов обучения на основе ограничений, которые выполняют серию статистических тестов для поиска взаимно независимых переменных и строят DAG в соответствии с этими ограничениями.

Согласно [24], подход на основе оптимизации метрики оценивает полную структуру сети против нулевой гипотезы о том, что сеть является пустой. Таким образом, он использует более глобальную перспективу, что позволяет найти компромисс между приближениями в различных частях сети. Поэтому мы используем алгоритмы на основе оптимизации метрики.

Для оценки структуры мы используем показатель BIC. Пусть у нас есть набор случайных переменных D, S — оцениваемая структура байесовской сети, а &S — вектор параметров для S. Тогда

BIC = logP (К ©*) -1 logAT,

где ©* — оценка ©S; d — число свободных параметров в S; N — размер набора данных.

Первый член в формуле представляет собой логарифм правдоподобия, а второй — штраф за сложность.

BIC обладает двумя важными свойствами, которые позволяют использовать его в качестве универсальной метрики. Во-первых, BIC инвариантен к эквивалентности, т. е. он дает одинаковые оценки эквивалентным моделям. С ростом числа переменных растет и число возможных сетевых структур. Это свойство BIC гарантирует присвоение одинакового балла эквивалентным сетям. Во-вторых, BIC локально согласован, если размер выборки достаточно велик.

Существует множество различных программных пакетов, реализующих широкий набор методов обучения байесовских сетей (например, см. обзор в [29]). В данной работе использовалась библиотека Python c открытым исходным кодом pomegranate

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[48], в которой реализовано несколько методов на основе метрик, в частности точный алгоритм A*

[49], его «жадная» версия и алгоритм [50].

На первом этапе мы протестировали все алгоритмы в пакете pomegranate, чтобы найти те, которые дают наилучшие результаты на наших данных. Согласно тестам, лучшие результаты показал точный алгоритм A*. В таблице 4 представлены полученные значения BIC для байесовской сети. Мы также протестировали Наивную байесовскую модель (Naive Bayes, NB), чтобы убедиться, что учет вероятностных отношений между переменными повышает качество моделирования. NB — это простейшая форма байесовской сети, вытекающая из

Байесовский информационный критерий (Б1С) для байесовской сети (БМ и модели наивный байесовский классификатор (МБ)

Таблица 4.

t - 5 t - 5 t - 5 t - 5 t - 5

Франция

NB -201 163 -192127 -180 853 -178 759 -159 080

BN -171 651 -162 705 -152 862 -147 833 -129 372

Италия

NB -360 293 -375 556 -380 321 -391 209 -394 780

BN -316 636 -332 979 -324 984 -326 920 -329 246

Российская Федерация

NB -199197 -249 535 -235 613 -240 508 -247 257

BN -167615 -214696 -204 133 -206 716 -211 850

предположения о взаимной независимости экзогенных переменных. Результаты, представленные в таблице 4, подтверждают, что наивная байесовская модель уступает по точности байесовским сетям. Соответствующие значения BIC примерно на 20% хуже, чем полученные для байесовских сетей.

Мы также проверили производительность классификатора, построенного на основе найденной байесовской сети [36]. Учитывая, что данные являются несбалансированными, мы использовали настройку порога принятия решения, вводя различные штрафы за ошибки неправильной классификации [51]. Так, для наблюдения х предсказанная метка класса у(х) = 1 тогда и только тогда, когда IP(jc) > i. Здесь Р(х) — это вывод байесовской сети, когда известны все переменные, кроме Class. Порог t вычисляется как

где Cj — стоимость предсказания класса i, когда истинным классом является j. Мы задали C10 = 1 и C01 = IB, где IB — коэффициент дисбаланса обучающего набора данных (см. таблицу 1).

В таблице 3 представлены значения ROC AUC, полученные с помощью 10-кратной перекрестной валидации классификатора на основе байесовской сети (строки «Discretized data / BN»). Как мы видим, производительность такого классификатора, как минимум, сопоставима с логистической регрессией для всех наборов данных и превосходит ее в большинстве случаев, особенно для

экономик с высокой неопределенностью (Россия и Италия).

4. Обсуждение

Сетевые структуры, представленные на рис. 4—6, позволяют сделать некоторые важные выводы об особенностях различных стадий процесса, ведущего к финансовому краху фирмы. Переменная Class, обозначающая состояние фирмы (0 для успешных фирм и 1 для банкротов), находится в корне графов. Это можно легко интерпретировать следующим образом. Состояние фирмы является первопричиной, определяющей значения ее финансовых коэффициентов. Это согласуется с задачей прогнозирования краха, когда состояние фирмы вычисляется по значениям финансовых коэффициентов.

Как следует из рис. 4—5, для развитых экономик (Италия, Франция) ранние стадии долгосрочного процесса (t — 5, t — 4) совпадают. В период t — 5 кумулятивная прибыльность положительно влияет на разницу между активами и обязательствами, т. е. на леверидж (отметим, что числитель BVETL — это разница между совокупными активами и совокупными обязательствами). Оба фактора затем определяют текущую ликвидность и текущую прибыльность фирмы. Отметим также, что ликвидность и текущая рентабельность условно независимы. Однако, начиная с периода t — 4 текущая прибыльность становится фактором, влияющим на ликвидность.

Для более предсказуемой экономики (Франция) модель не меняется в периоды t — 4, t — 3 и t — 2.

t - 1

t - 2

t - 3

t - 4

t - 5

Рис. 4. Франция: Байесовские сети для различных периодов до дефолта.

t - 1

t - 2

t - 3

t - 4

t - 5

Рис. 5. Италия: Байесовские сети для различных периодов до дефолта.

t - 1

СИаББ

t - 2

С!азБ

t - 3

t - 4

t - 5

Рис. 6. Российская Федерация: Байесовские сети для различных периодов до дефолта.

За год до финансового краха сетевая структура для Франции меняется и становится похожей на период t — 5. В целом можно сделать вывод, что кумулятивная прибыль является ключевым фактором успеха французских фирм.

Модель, представляющая процесс краткосрочного банкротства итальянских фирм (t — 2 и t — 1), меняется более радикально. Ключевым фактором является разница между активами и обязательствами (леверидж), которая определяет способность фирмы генерировать прибыль и ликвидность. Отметим также, что значения ликвидности условно не зависят от кумулятивной и годовой прибыльности на этих этапах. Очевидно, это связано с повышенной неопределенностью в итальянской экономике. Фирмы, не способные выполнить обязательства за счет собственных активов, не могут быстро исправить ситуацию, увеличив производительность за счет заемных ресурсов.

Для российских компаний ключевыми факторами являются леверидж и кумулятивная прибыльность. Также отметим, что в данном случае ликвидность зависит от всех рассматриваемых переменных (кроме периода t — 2). В целом процесс можно описать следующим образом. В средне- и долгосрочном периодах (t — 3 и t — 4) кумулятивная прибыльность оказывает положительное влияние на годовую рентабельность. Это можно объяснить тем, что коэффициент RETA неявно отражает возраст фирмы [13] и ее способность стабильно генерировать прибыль. Накопленная прибыль также обуславливает количество привлеченных внешних ресурсов. В то же время текущая рентабельность и леверидж условно независимы, однако они совместно полностью определяют ликвидность. Условную независимость текущей прибыльности и способности выполнять обязательства за счет собственных ресурсов можно объяснить тем, что на данных этапах мы рассматриваем достаточно длительный процесс, результаты которого будут оцениваться через 3—4 года. Очевидно, что на этот процесс большее влияние оказывают управленческие решения, основанные на финансовых показателях, которые отражают долгосрочные тенденции (кумулятивная прибыльность), чем краткосрочные результаты (текущая прибыльность).

На этапе t — 2 леверидж становится ключевым фактором. Это означает, что способность привлекать ресурсы позволяет отстающим фирмам увеличить прибыльность и повысить ликвидность и избежать финансовых сбоев через 2 года. В год

t — 1 кумулятивная прибыльность становится причинным фактором, определяющим леверидж. Это можно объяснить тем, что потенциальные кредиторы оценивают общие результаты деятельности фирмы в долгосрочной перспективе, что может ограничить доступность заемных ресурсов. Годовая рентабельность обусловлена способностью генерировать прибыль в долгосрочной перспективе и обслуживать долг. Леверидж и годовая рентабельность определяют текущее значение ликвидности, которая на данном этапе является основным показателем потенциальных финансовых неудач.

Основной вывод из представленных результатов заключается в том, что взаимное влияние факторов, определяющих состояние фирмы, меняется с течением времени (^0). В целом, для фирм в начале длительного процесса, который может привести к краху, кумулятивная прибыльность является ключевым фактором, определяющим другие метрики, такие как ликвидность и леверидж. Затем, по мере развития процесса, в среднесрочной перспективе, степень самодостаточности, измеряемая леверид-жем, выходит на первый план, особенно для экономик с более высокой неопределенностью. На этих этапах низкие значения этих факторов ограничивают возможности получения прибыли. Это приводит к дальнейшему развитию процесса, ведущего к финансовому краху.

Кроме того, существует национальная специфика, обусловленная, во-первых, уровнем развития экономики (Я02) и, во-вторых, неопределенностью экономической политики (^0>3). Эта специфика проявляется как в изменении причинно-следственных связей между факторами на разных этапах процесса краха фирмы, так и в скорости смены моделей. Наиболее устойчивый набор моделей получен для Франции, для которой характерна наименьшая неопределенность. Для России, для которой характерен максимальный рост экономической неопределенности за последние 10 лет, модели меняются чаще и радикальнее.

Таким образом, полученные модели проливают свет на специфику различных этапов процесса, ведущего к финансовому краху. Насколько нам известно, данная работа является первой попыткой анализа FFP на основе байесовских сетей. Однако наше исследование в его нынешнем виде имеет некоторые ограничения. В частности, можно отметить следующее:

♦ Используемая выборка содержит кросс-секционные данные за различные периоды времени, предшествующие финансовым проблемам. Это позволяет нам выявить различия в причинно-следственных связях на этапах FFP; но невозможно проследить эволюцию конкретных фирм. Для решения такой проблемы необходимы панельные данные. Анализ данных, содержащих последовательные периоды для успешных и провальных фирм, может дать более подробную информацию о причинно-следственных связях в процессе краха фирмы. Однако решение этой задачи требует другого инструмента, которым может стать динамическая байесовская сеть.

♦ Анализируемые факторы ограничены только четырьмя финансовыми коэффициентами, представленными в Z" -модели Альтмана. Мы приняли это ограничение, исходя из требований простоты модели и возможности ее дальнейшей интерпретации. Это позволило сделать важные выводы о внутренней динамике фирмы. Однако в дальнейших исследованиях список финансовых коэффициентов может быть расширен для получения более сложных и детальных моделей. Также необходимо изучить влияние других параметров, например, корпоративного управления и факторов внешней среды. Следующий вопрос, представляющий практический интерес — это определение текущей стадии процесса анализируемой фирмы. Эта информация может быть полезна для прогностических моделей, которые будут рассчитывать вероятность дефолта для нескольких будущих периодов. Этот вопрос также является темой будущих исследований.

Заключение

Основная цель нашей работы — продемонстрировать, что байесовские сети могут служить надежным инструментом для анализа динамики фирм и изучения процесса финансового краха фирмы. Наши результаты, с одной стороны, подчеркивают специфику этапов процесса банкротства для разных экономик. С другой стороны, они позволяют нам строить прогностические модели, превосходящие Z" -модель Альтмана, используя те же переменные. Насколько нам известно, представленная работа является первой, использующей байесовские сети для анализа FFP, поэтому многие вопросы остались за рамками нашего исследования. Возможные области исследования включают:

♦ Построение моделей на панельных данных, описывающих динамику множества фирм.

♦ Расширение числа анализируемых признаков.

♦ Моделирование специфики отраслей.

♦ Определение стадии процесса для прогнозирования неудачи в долгосрочной перспективе.

Все это открывает обширное поле для новых исследований, которые, в свете полученных результатов, представляются перспективными, поскольку потенциально могут внести значительный вклад в теоретический и эмпирический анализ процесса краха фирмы. ■

Благодарности

Работа выполнена в рамках проекта «Разработка количественных методов прогнозирования банкротств», поддержанного грантом Высшей школы бизнеса НИУ ВШЭ.

Литература

1. Lukason O., Laitinen E.K. Firm failure processes and components of failure risk: An analysis of European bankrupt firms // Journal of Business Research. 2019. Vol. 98. P. 380-390. https://doi.org/10.1016/jobusres.2018.06.025

2. Altman E.I., Iwanicz-Drozdowska M., Laitinen E., Suvas, A. A Race for Long Horizon Bankruptcy Prediction // Applied Economics. 2020. Vol. 52. No. 37. P. 4092-4111. https://doi.org/10.1080/00036846.2020.1730762

3. du Jardin P. Forecasting corporate failure using ensemble of self-organizing neural networks // European Journal of Operational Research. 2021. Vol. 288. No. 3. P. 869-886. https://doi.org/10.1016/j.ejor.2020.06.020

4. Altman E.I., Iwanicz-Drozdowska M., Laitinen E.K., Suvas A. Financial distress prediction in an international context: A review and empirical analysis of Altman's Z-Score model // Journal of International Financial Management & Accounting. 2017. Vol. 28. No. 2. P. 131-171. http://doi.org/10.1111/jifm.12053

5. Zelenkov Y., Fedorova E., Chekrizov D. Two-step classification method based on genetic algorithm for bankruptcy forecasting // Expert Systems with Applications. 2017. Vol. 88. P. 393-401. https://doi.org/10.1016/j.eswa.2017.07.025

6. du Jardin P. Dynamics of firm financial evolution and bankruptcy prediction // Expert Systems with Applications. 2017. Vol. 75. P. 25-43. https://doi.org/10.1016/j.eswa.2017.01.016

7. D'Aveni R. The aftermath of organizational decline: A longitudinal study of the strategic and managerial characteristics of declining firms // Academy of Management Journal. 1989. Vol. 32. No. 3. P. 577-605. http://doi.org/10.5465/256435

8. Ooghe H., De Prijcker S. Failure processes and causes of company bankruptcy: A typology // Management Decision. 2008. Vol. 46, No. 2. P. 223-242. https://doi.org/10.1108/00251740810854131

9. du Jardin P., Séverin E. Forecasting financial failure using a Kohonen map: A comparative study to improve model stability over time // European Journal of Operational Research. 2012. Vol. 221. No. 2. P. 378-396. https://doi.org/10.1016/j.ejor.2012.04.006

10. Argenti J. Corporate collapse: The causes and symptoms. NY: McGraw-Hill. 1976.

11. du Jardin P. Bankruptcy prediction using terminal failure processes // European Journal of Operational Research. 2015. Vol. 242. No. 1. P. 276-303. http://doi.org/10.1016/j.ejor.2014.09.059

12. Bellovary J.L., Giacomino D.E., Akers M.D. A review of bankruptcy prediction studies: 1930 to present // Journal of Financial Education. 2007. Vol. 33. P. 1-42.

13. Altman E.I. Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy // Journal of Finance. 1968. Vol. 23. P. 589-609.

14. Barboza F., Kimura H., Altman E. Machine learning models and bankruptcy prediction // Expert Systems with Applications. 2017. Vol. 83. P. 405-417. https://doi.org/10.1016/j.eswa.2017.04.006

15. Zelenkov Y., Volodarskiy N. Bankruptcy prediction on the base of the unbalanced data using multi-objective selection of classifiers // Expert Systems with Applications. 2021. Vol. 185. Article ID 115559. https://doi.org/10.1016/j.eswa.2021.115559

16. Balcaen S., Ooghe H. 35 Years of Studies on Business Failure: An Overview of the Classic Statistical Methodologies and Their Related Problems // The British Accounting Review. 2006. Vol. 38. P. 63-93. https://doi.org/10.1016/j.bar.2005.09.001

17. Bardos M. What is at stake in the construction and use of credit scores? // Computational Economics. 2007. Vol. 29. No. 2. P. 159-172. https://doi.org/10.1007/s10614-006-9083-x

18. Iwanicz-Drozdowska M., Laitinen E.K., Suvas A., Altman E.I. Financial and Nonfinancial Variables as Long-horizon Predictors of Bankruptcy // Journal of Credit Risk. 2016. Vol. 12. No. 4. P. 49-78. https://doi.org/10.21314/JCR.2016.216

19. Pizzi S., Caputo F., Venturelli A. Does it pay to be an honest entrepreneur? Addressing the relationship between sustainable development and bankruptcy risk // Corporate Social Responsibility and Environmental Management. 2020. Vol. 27. No. 3. P. 1478-1486. https://doi.org/10.1002/csr.1901

20. Zelenkov Y. Bankruptcy Prediction Using Survival Analysis Technique // IEEE 22nd Conference on Business Informatics (CBI), 2020. Vol. 2. P. 141-149. https://doi.org/10.1109/CBI49978.2020.10071

21. Cottrell M. Some other applications of the SOM algorithm: how to use the Kohonen algorithm for forecasting // 7th International Work-Conference on Artificial Neural Networks (IWANN), 2003. Invited lecture.

22. Serrano-Cinca C. Let financial data speak for themselves // Visual Explorations in Finance with Self-Organizing Maps / Deboeck G., Kohonen T. (eds.). Springer. 1998. P. 3-23.

23. Bunge M. Causality and modern science: Fourth revised edition. NY: Routledge, 2017.

24. Koller D., Friedman N. Probabilistic graphical models: Principles and techniques. Cambridge, MA: MIT Press, 2009.

25. Pearl J. Causality. Cambridge, UK: Cambridge University Press, 2009.

26. Zhao Q., Hastie T. Causal Interpretations of Black-Box Models // Journal of Business & Economic Statistics. 2021. Vol. 39. No. 1. P. 272-281. https://doi.org/10.1080/07350015.2019.1624293

27. Spirtes P. Introduction to causal inference // Journal of Machine Learning Research. 2010. Vol. 11. P. 1643-1662.

28. Hair J.F., Hult G.T.M., Ringle C.M., Sarstedt M., Thiele K.O. Mirror, mirror on the wall: a comparative evaluation of composite-based structural equation modeling methods // Journal of the Academy of Marketing Science. 2017. Vol. 45. No. 5. P. 616-632. https://doi.org/10.1007/s11747-017-0517-x

29. Scanagatta M., Salmeron A., Stella F. A survey on Bayesian network structure learning from data // Progress in Artificial Intelligence. 2019. Vol. 8. P. 425-439. https://doi.org/10.1007/s13748-019-00194-y

30. Sucar L.E. Probabilistic graphical models: Principles and applications. Cham, Switzerland: Springer Nature, 2021.

31. Erici A., Ekici S.O. Understanding and managing complexity through Bayesian network approach: The case of bribery in business transactions // Journal of Business Research. 2021. Vol. 129. P. 757-773. https://doi.org/10.1016/jobusres.2019.10.024

32. Marcot B.G., Penman T.D. Advances in Bayesian network modelling: Integration of modelling technologies // Environmental Modelling & Software. Vol. 111. P. 386-393. https://doi.org/10.1016/j.envsoft.2018.09.016

33. McLachlan S., Dube K., Hitman G. A., Fenton N. E., Kyrimi E. Bayesian networks in healthcare: Distribution by medical condition // Artificial Intelligence in Medicine. 2020. Vol. 107. Article ID 101912. https://doi.org/10.1016/j.artmed.2020.101912

34. Cai B., Huang L., Xie M. Bayesian networks in fault diagnosis // IEEE Transactions on Industrial Informatics. 2017. Vol. 13. No. 5. P. 2227-2240. https://doi.org/10.1109/TII.2017.2695583

35. Pourret O., Nairn P., Marcot B. Bayesian Networks: A Practical Guide to Applications. Hoboken: Wiley, 2008.

36. Bielza C., Larranaga P. Discrete Bayesian Network Classifiers: A Survey // ACM Computing Surveys. 2014. Vol. 47. No. 1. Article ID 5. http://doi.org/10.1145/2576868

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

37. Yuan C., Lim H., Lu T.C. Most relevant explanation in Bayesian networks // Journal of Artificial Intelligence Research. 2011. Vol. 42. P. 309-352. https://doi.org/10.1613/jair.3301

38. Lacave C., Diez F.J. A review of explanation methods for Bayesian networks // The Knowledge Engineering Review. 2002. Vol. 17. No. 2. P. 107-127.

39. Lacave C., Luque M., Diez F. Explanation of Bayesian networks and influence diagrams in Elvira // IEEE Transactions on Systems, Man, and Cybernetics, Part B: Cybernetics. 2007. Vol. 37. No. 4. P. 952-965. https://doi.org/10.1109/TSMCB.2007.896018

40. Altman E.I. Corporate Financial Distress: A Complete Guide to Predicting, Avoiding, and Dealing with Bankruptcy. Hoboken: Wiley, 1983.

41. Chen Y.C., Wheeler T.A., Kochenderfer M.J. Learning discrete Bayesian networks from continuous data // Journal of Artificial Intelligence Research. 2017. Vol. 59. P. 103-132. https://doi.org/10.1613/jair.5371

42. Weiss Y., Freeman W.T. Correctness of belief propagation in Gaussian graphical models of arbitrary topology // Neural Computation. 2001. Vol. 13. No. 10. P. 2173-2200. https://doi.org/10.1162/089976601750541769

43. Ickstadt K., Bornkamp B., Grzegorczyk M., Wieczorek J., Sheriff M.R., Grecco H.E., Zamir E. Nonparametric Bayesian network // Bayesian Statistics. 2010. Vol. 9. P. 283-316.

44. Kurgan L.A., Cios K.J. CAIM discretization algorithm // IEEE transactions on Knowledge and Data Engineering. 2004. Vol. 16. No. 2. P. 145-153. https://doi.org/10.1109/TKDE.2004.1269594

45. Lustgarten J.L., Visweswaran S., Gopalakrishnan V., Cooper G.F. Application of an efficient Bayesian discretization method to biomedical data // BMC bioinformatics. 2011. Vol. 12. No. 1. P. 1-15.

46. Fayyad U.M., Irani K.B. Multi-Interval Discretization of Continuous-Valued Attributes for Classification Learning // Proceedings of 13th International Joint Conference on Artificial Intelligence (IJCAI'93). 1993. P. 1022-1027.

47. Friedman N., Goldszmidt M. Discretization of continuous attributes while learning Bayesian networks // Proceedings of 13-th International Conference on Machine Learning. 1996. P. 157-165.

48. Schreiber J. Pomegranate: fast and flexible probabilistic modeling in python // Journal of Machine Learning Research. 2018. Vol. 18. No. 164. P. 1-6.

49. Yuan C., Malone B., Wu X. Learning optimal Bayesian networks using A* search // 22nd International Joint Conference on Artificial Intelligence (IJCAI). 2011. P. 2186-2191.

50. Chow C. K., Liu C.N. Approximating discrete probability distributions with dependence trees // IEEE Transactions on Information Theory. 1968. Vol. 14. No. 3. P. 462-467.

51. Elkan C. The foundations of cost-sensitive learning // Proceedings of International Joint Conference on Artificial Intelligence (IJCAI'01). 2001. P. 973-978.

Об авторе

Зеленков Юрий Александрович

доктор технических наук;

профессор департамента бизнес-информатики, Высшая школа бизнеса, Национальный исследовательский университет «Высшая школа экономики», 101000, г. Москва, ул. Мясницкая, д. 20; E-mail: yzelenkov@hse.ru ORCID: 0000-0002-2248-1023

Analysing the firm failure process using Bayesian networks

Yuri A. Zelenkov

E-mail: yzelenkov@hse.ru HSE University

Address: 20, Myasnitskaya Street, Moscow 101000, Russia

Abstract

This work analyses the firm failure process stages using the Bayesian network as a modelling tool because it allows us to identify causal relationships in the firm profile. We use publicly available data on French, Italian and Russian firms containing five samples corresponding to periods from one to five years before observation. Our results confirm that there is a difference between the stages of the failure process. For firms at the beginning of a lengthy process (3-5 years before observation), cumulative profitability is the key that determines liquidity. Then, as the process develops, leverage comes to the fore in the medium term (1-2 years before observation) for economies with more uncertainty. This factor limits the opportunities for making a profit, leading to further development of the failure. There are also national specifics that are caused, firstly, by the level of economic development and, secondly, economic policy uncertainty.

Keywords: financial failure, firm failure process, Bayesian network

Citation: Zelenkov Y. (2022) Analysing the firm failure process using Bayesian networks. Business Informatics, vol. 16, no. 1,

pp. 22-41. DOI: 10.17323/2587-814X.2022.1.22.41

References

1. Lukason O., Laitinen E.K. (2019) Firm failure processes and components of failure risk: An analysis of European bankrupt firms. Journal of Business Research, vol. 98, pp. 380-390. https://doi.org/10.1016/jobusres.2018.06.025

2. Altman E.I., Iwanicz-Drozdowska M., Laitinen E., Suvas A. (2020) A Race for Long Horizon Bankruptcy Prediction. Applied Economics, vol. 52, no. 37, pp. 4092-4111. https://doi.org/10.1080/00036846.2020.1730762

3. du Jardin P. (2021) Forecasting corporate failure using ensemble of self-organizing neural networks. European Journal of Operational Research, vol. 288, no. 3, pp. 869-886. https://doi.org/10.1016/j.ejor.2020.06.020

4. Altman E.I., Iwanicz-Drozdowska M., Laitinen E.K., Suvas A. (2017) Financial distress prediction in an international context: A review and empirical analysis of Altman's Z-Score model. Journal of International Financial Management & Accounting, vol. 28, no. 2,

pp. 131-171. https://doi.org/10.1111/jifm.12053

5. Zelenkov Y., Fedorova E., Chekrizov D. (2017) Two-step classification method based on genetic algorithm for bankruptcy forecasting. Expert Systems with Applications, vol. 88, pp. 393-401. https://doi.org/10.1016Zj.eswa.2017.07.025

6. du Jardin P. (2017) Dynamics of firm financial evolution and bankruptcy prediction. Expert Systems with Applications, vol. 75, pp. 25-43. https://doi.org/10.1016/j.eswa.2017.01.016

7. D'Aveni R. (1989) The aftermath of organizational decline: A longitudinal study of the strategic and managerial characteristics of declining firms. Academy of Management Journal, vol. 32, no. 3, pp. 577-605. https://doi.org/10.5465/256435

8. Ooghe H., De Prijcker S. (2008) Failure processes and causes of company bankruptcy: A typology. Management Decision, vol. 46, no. 2, pp. 223-242. https://doi.org/10.1108/00251740810854131

9. du Jardin P., Séverin E. (2012) Forecasting financial failure using a Kohonen map: A comparative study to improve model stability over time. European Journal of Operational Research, vol. 221, no. 2, pp. 378-396. https://doi.org/10.1016/j.ejor.2012.04.006

10. Argenti J. (1976) Corporate collapse: The causes and symptoms. New York, NY: McGraw-Hill.

11. du Jardin P. (2015) Bankruptcy prediction using terminal failure processes. European Journal of Operational Research, vol. 242, no. 1, pp. 276-303. https://doi.org/10.1016/j.ejor.2014.09.059

12. Bellovary J.L., Giacomino D.E., Akers M.D. (2007). A review of bankruptcy prediction studies: 1930 to present. Journal of Financial Education, vol. 33, pp. 1-42.

13. Altman E.I. (1968) Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy. Journal of Finance, vol. 23, pp. 589-609.

14. Barboza F., Kimura H., Altman E. (2017) Machine learning models and bankruptcy prediction. Expert Systems with Applications, vol. 83, pp. 405-417. https://doi.org/10.1016Zj.eswa.2017.04.006

15. Zelenkov Y., Volodarskiy N. (2021) Bankruptcy prediction on the base of the unbalanced data using multi-objective selection of classifiers. Expert Systems with Applications, vol. 185, article ID 115559. https://doi.org/10.1016/j.eswa.2021.115559

16. Balcaen S., Ooghe H. (2006) 35 Years of Studies on Business Failure: An Overview of the Classic Statistical Methodologies and Their Related Problems. The British Accounting Review, vol. 38, pp. 63-93. https://doi.org/10.1016/j.bar.2005.09.001

17. Bardos M. (2007) What is at stake in the construction and use of credit scores? Computational Economics, vol. 29, no. 2, pp. 159-172. https://doi.org/10.1007/s10614-006-9083-x

18. Iwanicz-Drozdowska M., Laitinen E.K., Suvas A., Altman E.I. (2016) Financial and Nonfinancial Variables as Long-horizon Predictors of Bankruptcy. Journal of Credit Risk, vol. 12, no. 4, pp. 49-78. https://doi.org/10.21314/JCR.2016.216

19. Pizzi S., Caputo F., Venturelli A. (2020) Does it pay to be an honest entrepreneur? Addressing the relationship between sustainable development and bankruptcy risk. Corporate Social Responsibility and Environmental Management, vol. 27, no. 3, pp. 1478-1486. https://doi.org/10.1002/csr.1901

20. Zelenkov Y. (2020) Bankruptcy Prediction Using Survival Analysis Technique. In: 2020IEEE 22nd Conference on Business Informatics (CBI), vol. 2, pp. 141-149. IEEE. https://doi.org/10.1109/CBI49978.2020.10071

21. Cottrell M. (2003) Some other applications of the SOM algorithm: how to use the Kohonen algorithm for forecasting. In: Invited lecture at the 7th International Work-Conference on Artificial Neural Networks IWANN2003.

22. Serrano-Cinca C. (1998) Let financial data speak for themselves. In: Deboeck, G., Kohonen, T. (eds.) Visual Explorations in Finance with Self-Organizing Maps. Springer, pp. 3-23.

23. Bunge M. (2017) Causality and modern science: Fourth revised edition. Routledge, NY.

24. Koller D., Friedman N. (2009) Probabilistic graphical models: Principles and techniques. MIT Press, Cambridge: MA.

25. Pearl J. (2009) Causality. Cambridge University Press.

26. Zhao Q., Hastie T. (2021) Causal Interpretations of Black-Box Models. Journal of Business & Economic Statistics, vol. 39, no. 1, pp. 272-281. https://doi.org/10.1080/07350015.2019.1624293

27. Spirtes P. (2010) Introduction to causal inference. Journal of Machine Learning Research, vol. 11, pp. 1643-1662.

28. Hair J.F., Hult G.T.M., Ringle C.M., Sarstedt M., Thiele K.O. (2017) Mirror, mirror on the wall: a comparative evaluation of composite-based structural equation modelling methods. Journal of the Academy of Marketing Science, vol. 45, no. 5, pp. 616-632. https://doi.org/10.1007/s11747-017-0517-x

29. Scanagatta M., Salmeron A., Stella F. (2019) A survey on Bayesian network structure learning from data. Progress in Artificial Intelligence, vol. 8, pp. 425-439. https://doi.org/10.1007/s13748-019-00194-y

30. Sucar L.E. (2021) Probabilistic graphical models: Principles and applications. Springer Nature. Cham, Switzerland.

31. Ekici A., Ekici S.O. (2021) Understanding and managing complexity through Bayesian network approach: The case of bribery in business transactions. Journal of Business Research, vol. 129, pp. 757-773. https://doi.org/10.1016/jjbusres.2019.10.024

32. Marcot B.G., Penman T.D. (2019) Advances in Bayesian network modelling: Integration of modelling technologies. Environmental Modelling & Software, vol. 111, pp. 386-393. https://doi.org/10.1016/j.envsoft.2018.09.016

33. McLachlan S., Dube K., Hitman G.A., Fenton N.E., Kyrimi E. (2020) Bayesian networks in healthcare: Distribution by medical condition. Artificial Intelligence in Medicine, vol. 107, article ID 101912. https://doi.org/10.1016/j.artmed.2020.101912

34. Cai B., Huang L., Xie M. (2017) Bayesian networks in fault diagnosis. IEEE Transactions on Industrial Informatics, vol. 13, no. 5, pp. 2227-2240. https://doi.org/10.1109/TII.2017.2695583

35. Pourret O., Naim P., Marcot B. (2008) Bayesian Networks: A Practical Guide to Applications. Wiley, Hoboken.

36. Bielza C., Larranaga P. (2014) Discrete Bayesian network classifiers: A survey. ACM Computing Surveys, vol. 47, no. 1, article ID 5. https://doi.org/10.1145/2576868

37. Yuan C., Lim H., Lu T.C. (2011) Most relevant explanation in Bayesian networks. Journal of Artificial Intelligence Research, vol. 42, pp. 309-352. https://doi.org/10.1613/jair.3301

38. Lacave C., Díez F.J. (2002) A review of explanation methods for Bayesian networks. The Knowledge Engineering Review, vol. 17, no. 2, pp.107-127.

39 Lacave C., Luque M., Diez F. (2007) Explanation of Bayesian networks and influence diagrams in Elvira. IEEE Transactions on Systems, Man, and Cybernetics, Part B: Cybernetics, vol. 37, no. 4, 952-965. https://doi.org/10.1109/TSMCB.2007.896018

40. Altman E.I. (1983) Corporate Financial Distress: A Complete Guide to Predicting, Avoiding, and Dealing with Bankruptcy. Hoboken: Wiley.

41. Chen Y.C., Wheeler T.A., Kochenderfer M.J. (2017) Learning discrete Bayesian networks from continuous data. Journal of Artificial Intelligence Research, vol. 59, pp. 103-132. https://doi.org/10.1613/jair.5371

42. Weiss Y., Freeman W.T. (2001) Correctness of belief propagation in Gaussian graphical models of arbitrary topology. Neural Computation, vol. 13, no. 10, pp. 2173-2200. https://doi.org/10.1162/089976601750541769

43. Ickstadt K., Bornkamp B., Grzegorczyk M., Wieczorek J., Sheriff M.R., Grecco H.E., Zamir E. (2010) Nonparametric Bayesian network. Bayesian Statistics, vol. 9, pp. 283-316.

44. Kurgan L.A., Cios K.J. (2004) CAIM discretization algorithm. IEEE transactions on Knowledge and Data Engineering, vol. 16, no. 2, pp. 145-153. https://doi.org/10.1109/TKDE.2004.1269594

45. Lustgarten J.L., Visweswaran S., Gopalakrishnan V., Cooper G.F. (2011) Application of an efficient Bayesian discretization method to biomedical data. BMCbioinformatics, vol. 12, no. 1, pp. 1-15.

46. Fayyad U.M., Irani K.B. (1993) Multi-Interval Discretization of Continuous-Valued Attributes for Classification Learning, In: Proceedings of 13th International Joint Conference on Artificial Intelligence (IJCAI'93), pp. 1022-1027.

47. Friedman N., Goldszmidt M. (1996) Discretization of continuous attributes while learning Bayesian networks. In: Proceedings of 13-th International Conference on Machine Learning (ICML), pp. 157-165.

48. Schreiber J. (2018) Pomegranate: fast and flexible probabilistic modeling in python. Journal of Machine Learning Research, vol. 18, no. 164, pp. 1-6.

49. Yuan C., Malone B., Wu X. (2011) Learning optimal Bayesian networks using A* search. In: 22nd International Joint Conference on Artificial Intelligence (IJCAI), pp. 2186-2191.

50. Chow C.K., Liu C.N. (1968) Approximating discrete probability distributions with dependence trees. IEEE Transactions on Information Theory, vol. 14, no. 3, pp. 462-467.

51. Elkan C. (2001) The foundations of cost-sensitive learning. In Proceedings of International Joint Conference on Artificial Intelligence (IJCAI'01), pp. 973-978.

About the author

Yury A. Zelenkov

Dr. Sci. (Tech.);

Professor, Department of Business Informatics, Graduate School of Business, National Research University Higher School of Economics, 20, Myasnitskaya Street, Moscow 101000, Russia; E-mail: yzelenkov@hse.ru ORCID: 0000-0002-2248-1023

i Надоели баннеры? Вы всегда можете отключить рекламу.