DOI: 10.26794/2587-5671-2018-22-3-112-123 УДК 378.675(045) JEL C45, C58, C65
Нейросетевая модель диагностики стадий развивающегося банкротства корпораций
СА. Горбатков,
Уфимский филиал Финансового университета, Уфа, Россия https://orcid.org/0000-0002-7752-8431
СА. Фархиева,
Уфимский филиал Финансового университета, Уфа, Россия https://orcid.org/0000-0002-2556-2785
аннотация
В статье исследуется проблема разработки информационно-математической модели для поддержки принятия решений по реструктуризации кредитной задолженности корпораций в банковских технологиях финансового менеджмента.
Цель статьи - создание модели, позволяющей диагностировать стадии развивающегося кризиса корпораций в сложных условиях неполноты и зашумленности данных. Модель должна служить инструментом повышения объективности и качества принимаемых решений по реструктуризации кредитной задолженности корпораций. Исследование проводилось на основе нейросетевых методов моделирования и системного анализа, методов теории принятия решений, решения обратных задач интерпретации, т.е. извлечения новых знаний из данных. Разработан оригинальный метод построения нейросетевой логистической модели банкротств (НЛМБ) в сложных условиях моделирования. Новыми признаками метода, увеличивающими прогностическую силу модели, являются: 1) оптимальный отбор факторов с помощью байесовского ансамбля вспомогательных нейросетей, осуществляющих компрессию факторного пространства; 2) ступенчатая компрессия факторов на основе обобщенной функции желательности Харрингтона; 3) регуляризация основной (рабочей) нейросетевой модели на байесовском ансамбле нейросетей. НЛМБ апробирована на реальных данных корпораций строительной отрасли. Число верно идентифицированных объектов на тестовом множестве составило более 90% на всех нейросетях ансамбля.
В НЛМБ достаточно высокое прогностическое качество нейросетевой модели обеспечивается новыми признаками метода и порождает эмерджентный эффект, проверенный в вычислительных экспериментах: улучшение качества нейросетевой модели по критерию правильно идентифицированных объектов © составляет 3,336 раза при компрессии факторов в 1,35 раза. НЛМБ может быть распространен на широкий круг задач финансового менеджмента.
Ключевые слова: нейросетевая модель; стадии развития банкротства корпораций; поддержка решений реструктуризации кредитной задолженности
Для цитирования: Горбатков С. А., Фархиева С. А. Нейросетевая модель диагностики стадий развивающегося банкротства корпораций. Финансы:теория и практика. 2018;22(3):112-123. DOI: 10.26794/2587-5671-2018-22-3-112-123
(CC)
DOI: 10.26794/2587-5671-2018-22-3-112-123 UDC 378.675(045) JEL C45, C58, C65
Neural Network Model of Diagnostics of Stages of Developing Corporate Bankruptcy
SA. Gorbatkov,
Ufa branch of the Financial University, Ufa, Russia https://orcid.org/0000-0002-7752-8431
SA. Farkhieva,
Ufa branch of the Financial University, Ufa, Russia https://orcid.org/0000-0002-2556-2785
abstract
The article deals with the problem of developing an information and mathematical model to support decisionmaking on the restructuring of corporate debt in the banking technologies of financial management. The purpose of the article is to create a model that allows diagnostic of the stages of developing corporate crisis in difficult conditions of incomplete and noisy data. The model should serve as a tool for improving the objectivity and quality of decisions on the restructuring of corporate debt. The study was conducted on the basis of neural network modelling and system analysis methods, methods of decision-making theory, a solution of inverse problems of interpretation, i.e. extraction of new knowledge from data. We developed an original method of constructing neural network logistic model of bankruptcies (NNLMB) in the difficult conditions of the simulation. New features of the method, increasing the predictive power of the model, are: 1) optimal selection of factors using Bayesian ensemble of auxiliary neural networks, performing compression of factor space; 2) step compression of factors based on the generalized Harrington desirability function; 3) regularization of the main (working) neural network model on Bayesian ensemble of neural networks. NNLMB is tested on real data from corporations of the construction industry. The number of correctly identified objects on the test set was more than 90% on all neural networks of the ensemble. In NNLMB, a sufficiently high prognostic quality of the neural network model is provided by new features of the method and generates an emergent effect, which was proven in computational experiments: the improvement of the quality of the neural network model by the criterion of correctly identified objects © is 3.336 times with the compression of factors by 1.35 times. NNLMB can be applied to a wide range of financial management tasks. Keywords: neural network model; stages of development of corporate bankruptcy; support of decisions on credit debt restructuring
For citation: Gorbatkov S.A., Farkhieva S.A. Neural network model of diagnostics of stages of developing corporate bankruptcy. Finansy: teoriya i praktika = Finance: Theory and Practice. 2018;22(3):112-123. (In Russ.). DOI: 10.26794/2587-5671-2018-22-3-112-123
ВВЕДЕНИЕ
Работа посвящена вопросам повышения эффективности банковских технологий финансового менеджмента по реструктуризации кредитной задолженности корпораций-заемщиков. В качестве инструмента поддержки принятия решений по реструктуризации задолженности разработана ней-росетевая логистическая модель, которая позволяет в условиях неопределенности и зашумленности данных достаточно объективно оценивать стадии развивающегося процесса банкротства в корпора-
ции. Как известно [1-5], нейросеть способна работать в сложных условиях моделирования, в которых традиционные методы регрессионного анализа оказываются практически неработоспособными, однако с двумя оговорками: должна быть сделана эффективная предобработка данных и обеспечена регуляризация (устойчивость) построенной нейросетевой модели. Возникающие здесь проблемы нестандартны, интересны и весьма сложны для исследования.
Дело в том, что нейросетевая модель банкротств в математическом аспекте является обратной зада-
чей (ОЗ): в исходных данных заданы наблюдаемые характеристики объектов моделирования, а требуется восстановить финансово-экономические закономерности, скрытые в данных. То есть требуется получить с помощью нейросети новые знания из данных. Как известно [6], ОЗ являются некорректно поставленными, и требуется разработка специальных алгоритмов регуляризации решения (обеспечения устойчивости модели к новым данным).
По поводу предобработки данных следует отметить, что весьма эффективным инструментом является оптимальный отбор факторов, а также компрессия факторного пространства. Эти операции алгоритма предопределяют качество получаемой нейросетевой модели (НСМ), особенно в условиях сильной зашумленности данных и малого объема наблюдений [3, 5]. Однако алгоритмы оптимального отбора факторов, а также компрессии факторного пространства в классе ОЗ для НСМ банкротств до сих пор не исследованы, точнее отсутствует общепринятый теоретический подход в этом вопросе [7].
Подчеркнем также важность системного подхода к разработке алгоритма предобработки данных. Если рассматриваемые НСМ восстановления зависимостей являются классом моделей, управляемых данными [8], то следует ожидать, что учет взаимосвязи алгоритмов предобработки данных (включая оптимальный отбор и компрессию факторного пространства) с алгоритмами обучения модели и ее регуляризации породит положительный эмерджентный эффект. Этот вопрос в литературе не рассматривался.
В литературе также не рассматривался вопрос об агрегировании переменных в НСМ на основе обобщенной функции желательности Харрингтона [9, 10], что позволяет уже на стадии предобработки данных эффективно учитывать взаимодействие факторов, т.е. их нелинейное влияние друг на друга.
Проведение исследований по указанным выше малоизученным актуальным вопросам применения нейросетей (НС) в моделях банкротств [11-14] и послужило посылом к написанию данной статьи.
Целью указанных исследований является изучение возможности расширения существующих инстру-ментариев компьютерного моделирования оценки финансового состояния корпораций-заемщиков, а также методов повышения эффективности этих инструментариев применительно к сложным условиям моделирования.
ПОСТАНОВКА ЗАДАЧИ ИССЛЕДОВАНИЯ
Вначале оговорим экономическую постановку задачи, которая состоит в обслуживании банком своего кредитного портфеля в рамках выделенного при-
мерно однородного кластера корпораций-заемщиков, сходных по отрасли экономики, условиям деятельности на рынке, экономико-политической обстановке в регионе и др. Фактор масштабности корпораций учитывается приведением экономических показателей стандартной бухгалтерской отчетности к безразмерному виду. Примером служат так называемые финансовые коэффициенты [4, 5], отражающие ликвидность корпораций, платежеспособность, рентабельность бизнеса, деловую активность и другие показатели финансово-экономического состояния. Число этих коэффициентов может доходить до нескольких десятков. Требуется построить модель для указанного выше кластера корпораций-заемщиков, которая позволяла бы оценивать вероятность банкротства конкретного заемщика и, главное, определять способы реструктуризации задолженности в зависимости от достигнутой стадии банкротства. При этом для построения модели предполагается использование ретроспективных данных аналогичного кластера заемщиков, содержащих для каждой корпорации информацию типа «банкрот — не банкрот». Для этих целей могут быть использованы базы данных самой кредитной организации, базы «Бюро кредитных историй Российской Федерации», налоговых органов.
Теперь изложим информационно-математическую постановку задачи исследования. Будем рассматривать обратную задачу (ОЗ) восстановления зависимости вероятности банкротства Р от вектора экзогенных переменных х = (х1, х2,..., х],..., хп), скрытой в данных. Эту зависимость будем определять в виде логистической функции, предложенной Ольсоном [15]:
P (t ) = 1/[l + exp (-y ( x (t) ,t))
, P e [0, 1], (1)
где t — время, а показатель экспоненты у ( х (t), t), играющий роль аргумента в (1), восстанавливается с помощью НС-отображения из данных:
у (х, t) = Г (х^^), Г : х е Я(п) ^ у е Я(1) (2)
где W — множество синаптических весов НС; ¥ (•) — оператор НС-отображения.
Отметим сразу особенности логистической НСМ (1)-(2).
1. Модель (1)-(2) способна восстанавливать любые (даже очень сильные) нелинейные зависимости у (х, t), что выгодно отличает ее от регрессионных моделей Альтмана [16] и его последователей. В частности, в модели (1)-(2) исчезает проблема мульткол-линеарности факторов.
2. Логистическое отображение (1) является сжимающим в том смысле, что интервал для аргумента у (х, ^) е [-6; 6] отображается в соответствующий интервал значения функции Р е [0, 1], т.е. коэффициент сжатия составляет примерно 12. Следовательно, если НСМ (1)-(2) уже получена, протестирована и проэкзаменована, то ошибки в задании вектора факторов х будут «сжиматься» оператором логистического отображения (1) при вычислении вероятности Р. Однако задача обучения НС, т.е. нахождения синаптических весов Ж, является ОЗ, некорректно поставленной по Адамару [3], что требует специальных мер по регуляризации ее решения. Одним из путей является подход введения некорректной ОЗ в класс корректно поставленных по Тихонову [6].
Подчеркнем основную идею теории А. Н. Тихонова: для регуляризации ОЗ следует сужать пространство 2 искомых решений. В работе [6] разработаны такие конструктивные методы, в частности стабилизирующие функционалы Оф.
Применительно к рассматриваемой ОЗ восстановления параметров НСМ банкротств (1)-(2) роль искомой функции х играет множество параметров НС, т.е. синаптических весов Ж сети, аналогом обратного оператора А-1 в ОЗ является обратный оператор НС-отображения Р — из выражения (2). В качестве наблюдаемых экспериментальных характеристик объекта и выступают кортежи (вектор-строки) таблицы выборки данных х, у^, г = 1, N, g = 1, G, где уг — метки «банкрот — не банкрот» для корпорации-заемщика; g — номер объекта; / — номер наблюдения. В качестве стабилизирующего функционала Тихонова в нашей задаче может быть выбран функционал О (I) = || ||2 где ||«||^ — эвклидова норма матрицы Ж Такой пример рассмотрен авторами работы [3].
Однако даже при теоретической корректности ОЗ возможно появление практической некорректности. Причинами могут быть наличие шумов в экспериментальных данных (потеря устойчивости решения) и дискретность набора экспериментальных точек (неединственность решения) — наблюдаемые характеристики объекта могут быть описаны несколькими различными функциями =Р1- (х, у), г2 =Р2-1 (х, у) и др. В случае НС Н(-), — это различные операторы НС отображения (2).
Так, в работе [5] авторами на модельном примере НС-аппроксимации искусственно зашумленной детерминированной зависимости было показано, что существует критический уровень зашумленности и ее объема в данных по доле зашумленных вектор-столбцов {хг]} и у г, когда НС теряет устойчивость.
Следовательно, требуется специальный алгоритм регуляризации ОЗ обучения НС. Этот вопрос при-
менительно к НСМ банкротств практически не был изучен. Авторы статьи разработали на базе подхода С.А. Шумского [17] и К. Д. Мак [18] алгоритм регуляризации обучения НС, названный «квазибайесовским» (см. ниже в разд. 2 настоящей работы). Этот термин означает отказ от допущения об априорном задании вида закона распределения шумов в данных, что приближает НСМ к практике и использует парадигму А. Н. Тихонова сужения пространства искомых решений.
3. При формировании обучающего множества НС возникает проблема, которую мы назвали «динамической неполнотой данных». До исследования авторов [3] решение этой проблемы в литературе не рассматривалось. Подчеркнем, что «динамическая неполнота данных» при обучении НС — это одно из наглядных свойств НСМ как модели, управляемой данными. Суть этой проблемы состоит в следующем.
Пусть имеются ретроспективные данные наблюдения входного вектора x = (x1,....,xi,...xn) в нескольких временных срезах {tk}, k = 1, N. Обучающая выборка {xgk y^, g = 1,G содержит наблюдения для G предприятий. При этом в последнем временном срезе (k = N) известны как векторы значения факторов {xgN}, так и значения выходной переменной y = arg (P ( xgN, tN )). Это позволяет обучить НС и оценить вероятность риска банкротства P в последнем временном срезе (t = tN ). Однако для всех предшествующих временных срезов t1, t2,____, tN _1 значения выходной (эндогенной) переменной уф = arg (P (xgk, tk)) k = 1, N _ 1 могут быть неизвестны, поскольку к моменту t < tN для части корпораций-заемщиков процесс кризиса развивается, и они еще не признаны банкротами. В этом и проявляется глубокая специфика моделируемых объектов. Нужно построить специальный итерационный процесс восстановления эндогенных переменных k = 1, N _ 1, g = 1, G во всех временных срезах и для всех объектов. Соответствующий нейросетевой логистический динамический метод (НЛДМ), базирующийся на системном законе инерционности экономических процессов, разработан авторами в работе [4, 5]. Описание этого метода выходит за рамки статьи. Поэтому далее будем считать, что данные во всех временных срезах, т.е. кортежах (xgk,yk,t^j, восстановлены и являются полными и НСМ рассматривается как статическая задача для каждого фиксированного среза (у = tk = const).
4. Целью исследований в работе является разработка оригинального нейросетевого статического логистического метода (НСЛМ) моделирования банкротств в сложных условиях зашумленности и неполноты данных с оптимальным отбором факторов для формирования исходных данных, а также агрегированием
факторов в виде обобщенных функций желательности Харрингтона [9, 10]. Цель направлена на повышение качества НСЛМ-моделей.
5. Для достижения цели было необходимо:
A. Разработать алгоритм оптимального отбора факторов для НСМ.
Б. Изучить возможность эффективного использования в построении НСМ банкротств агрегирующих функций Харрингтона.
B. Разработать алгоритм регуляризации решения обратной задачи обучения НС, оценить в этом алгоритме влияние агрегирования факторов в виде обобщенных функций Харрингтона.
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЙ. КОЛИЧЕСТВЕННЫЕ ОЦЕНКИ
Сформулируем идеи, связанные с решением задач А, Б, В по разработке НСЛМ с оптимальным отбором факторов, а также с агрегированием факторов с указанием конкретной научной и прикладной новизны этих идей, а затем уже детализируем соответствующие операции алгоритмов указанных выше задач и приведем количественные оценки.
Задача А. Здесь осуществляется оптимальный отбор факторов. Формируется экспертным способом стартовый набор факторов, т.е. «сырые данные» D и по ним строится байесовский ансамбль вспомогательных нейросетевых субмоделей (ВНСМ), где НС-гипотезы {hq (x, W, s) } отличаются друг от друга видом активационных функций и параметрами структуры s сети (числом скрытых слоев нейронов и оптимальным числом нейронов в этих слоях). Согласно байесовской концепции регуляризации обучения [3, 17, 18] все НС-гипотезы {hq }, q = l,Q, о происхождении данных D должны относиться к одному и тому же классу Q, т.е. иметь одну и ту же «метагипотезу», V hq 6 Q, q = 1, Q. В данной работе для выбора Q мы использовали парадигму многослойных персептронов с обратным распространением ошибки при обучении [Multilayer Perseptron — Back Propagation (MLP-BP)]. В алгоритме оптимального отбора факторов используется критерий © , усредненный на апостериорном, т.е. отфильтрованном байесовском ансамбле НС {hq |D, W, H}, q = 1, Q , Qq < Q. При этом критерий отбора © выражается прямым способом через число ошибок первого и второго рода идентификации сетью объектов типа «банкрот — не банкрот». Организуется итерационный процесс оптимального отбора факторов, т.е. двойной фильтрации факторов исходных данных D: «внешних» итераций по индексу j (номеру фактора), j = 1, n и «внутренних» итераций по индексу q (номеру сети) в байесовском ансамбле НС-гипотез {h }. Внешние итерации осуществляются
как случайный выбор фактора из выборки Б. Если фактор х^ оказывается достаточно информативным по критерию © распознавания меток «банкрот — не банкрот» на выборке Б, то он возвращается в выборку. В противном случае фактор исключается из выборки, поскольку он не несет полезной информации и ведет себя как шум. Такой случайный выбор охватывает перебор всех факторов. Критерий © выражается следующими формулами:
©д =(N(/ N)+(N(11) /N); (3)
© j =
Q
Z© *
q=i
/N ; j = 1, n,
где N — общее число корпораций-заемщиков в исходной выборке <х.,у >.?, I = 1,N, g = 1,О ; , N(п) — число ошибок первого и второго рода при идентификации обученной и протестированной НС предъявленных примеров по всей выборке; О* — число НСМ на байесовском ансамбле, отфильтрованном во внутреннем итерационном цикле по индексу д = 1,2.
Правило отбора очередного/-го фактора в выборе:
x
: ©j < П I ©,q < П
12
(4)
Здесь звездочка «*» в факторе x* означает, что он возвращается в выборку D при отборе; r|i и П2 _ экспертно задаваемые числа, характеризующие качество ансамблевой идентификации для НСМ. Если для банка-кредитора важно учесть в оценке (3)-(4) различие ошибок первого и второго рода с точки зрения кредитной политики, то можно это сделать введением коэффициентов предпочтения [5] Фишбер-на в формуле (3). Отметим, что критерий 0, в отличие от критерия, принятого в [17], не требует априорного задания аналитического вида функции правдоподобия, что упрощает расчет и приближает его к практике.
Во внутреннем итерационном процессе фильтрации НС-гипотез {hq }, q = 1,Q, при каждом фиксированном факторе Xj (j = const) используется тот же критерий отбора © по (3)-(4). НС-гипотеза hq остается в байесовском ансамбле, если для нее выполнено условие ©jq < п2. В противном случае hq исключается для данного j-го шага внешних итераций из ансамбля.
Таким образом, оптимальный отбор факторов в итоге двойной фильтрации во внешнем (по индексу j) и внутреннем (по индексу q) цикле можно представить формулой
= аг§
шш
у=1, п
(0У}| Ид (х,у,1 )еН
(5)
где ху опт — оптимальный вектор (набор факторов) с номером V при случайном переборе всех факторов ( j = 1, п); на этом наборе критерий @тгп по (3)-(4) имеет минимальное значение. Если множество ху опт не пусто, то (5) и есть мера эффекта предварительной компрессии факторов за счет их оптимального отбора. Поскольку алгоритм (5) включает в себя за счет внутренних итераций на байесовском ансамбле реализацию НСМ, то эту компрессию можно рассматривать [5] как «предрегуляризацию» основной НСМ в итоге решения последующих задач Б и В.
Теперь мы можем на концептуальном уровне сформулировать научную новизну основной идеи, заложенной в алгоритм (3)-(5) решения задачи А. Алгоритм отличается от известных алгоритмов следующими признаками:
1. Оптимальный отбор факторов осуществляется не изолированно от построения основной (рабочей) НСМ, а в тесной взаимосвязи с нею с использованием ансамбля ВНСМ из того же класса О и того же критерия качества (3), (5), что и в основной НСМ.
2. Одновременно с оптимальным отбором факторов осуществляется регуляризация ВНСМ на байесовском ансамбле НС, которую в составе НСЛМ можно трактовать как «предрегуляризацию» всей модели.
Порождаемый этими новыми признаками эмер-джентный эффект — предварительная оптимальная компрессия факторного пространства и, соответственно, облегчение построения основной НСМ в аспекте обеспечения ее требуемых прогностических свойств.
Задача Б. Здесь осуществляется основной процесс комплексного (ступенчатого) агрегирования факторов, отличающийся от известных алгоритмов компрессии факторов тем, что вначале на эвристическом уровне по функциональному экономическому признаку формируются группы (кластеры) факторов, а затем внутри каждого и-го кластера факторы агрегируются в виде обобщенной функции желательности Хар-рингтона (ОФХ) [9] {Ни}; и = 1,М, и НС строится по агрегированным переменным в (2):
• сильная компрессия данных и облегчение обучения НС в аспекте повышения ее прогностической силы согласно рекомендациям Риссанена [7];
• возможность учета в явной форме нелинейного взаимного влияния факторов хг, хк, к ф j друг на друга внутри структур функции Харрингтона {Ни};
• возможность наглядной экономической интерпретации зависимостей вероятности банкротства от агрегатов {Ни}, получаемых с помощью (1) и НСМ. Например, {Ни} могут оценивать рентабельность бизнеса, ликвидность корпораций-заемщиков, платежеспособность и другие свойства.
Сделаем краткие комментарии по ОФХ. Более подробное описание содержится в работе [9]. Одним из наиболее удобных способов агрегирования как экзогенных хг, так и эндогенных ут переменных, по мнению авторов статьи, является построение обобщенной функции желательности Харрингтона Н. В основе построения этой функции лежит преобразование натуральных значений переменных в безразмерную шкалу желательности или предпочтительности: xj, ут ^ dj, где dj — частная функция желательности.
Шкала желательности (см. рисунок) относится к психофизическим шкалам. Ее назначение — установление соответствия между физическими и психологическими (лингвистическими) величинами. Под психологическими величинами понимаются чисто субъективные (экспертные) оценки желательности того или иного значения переменных Х/, ут. В данной работе все количественные оценки относятся к факторам {Х/}, j = 1, п, хотя полученные результаты в принципе справедливы и для агрегированных эндогенных переменных {ут }.
Чтобы получить шкалу желательности, удобно пользоваться готовыми разработанными таблицами между отношениями предпочтения в числовой системе (отметка dj на шкале частных функций желательности) и лингвистической шкале (табл. 1) [9].
Более точные результаты, чем табл. 1, дает аналитическое представление функции желательности:
dJ = ехР (- ехР (-х ]')); ^ [0,1]; хе [-6,6] ■
(7)
у (Ни, гк ) = Р (Ни, гк), к = 1, N, и = 1, м. (6) Заметим, что ширина интервала нормированной
Достигаемые за счет этого признака НСЛМ эмер-джентные эффекты:
• возможность внесения в алгоритм предобработки данных априорной эвристической информации, аккумулирующей профессиональный опыт аналитика, разрабатывающего НС при образовании кластеров факторов;
переменной х должна выбираться так, чтобы значение х] = -6 соответствовало в табл. 1 лингвистической оценке «Очень плохо» (dj = 1,0), а х/ = 6 должно соответствовать оценке «Очень хорошо» (dj = 1,0). Ось абсцисс на рисунке можно сузить, например Х/ е[-3,3]. Тогда функция желательности d](х]) будет иметь более крутой вид, и точность графических оценок несколько снизится.
Харрингтоном был предложен единый комплексный мультипликативный показатель, а именно обобщенная функция желательности (среднее геометрическое в каждом и-м кластере):
Hu = n№ ,u = 1,M ,
(8)
значения которой также могут быть интерпретированы по шкале, представленной в табл. 1. График ОФХ (8) будет таким же, как и для частных функций желательности d по (7) (см. рисунок). В исследуемой нами задаче число агрегируемых факторов в каждом кластере будет различным, т.е. в (8) вместо n следует подставлять {nu}.
Использование функции Харрингтона по (7), (8) требует выполнения следующих правил.
Все факторы в фиксированном кластере факторов (u = const) должны быть однонаправленными, т.е. уменьшению вероятности банкротства P в логистической функции (1) должно соответствовать увеличение фактора x* и рост показателя экспоненты y (x) соответственно. Если некоторые из факторов {xk} в кластере имеют инверсный характер, т.е. рост этих факторов увеличивает вероятность банкротства P в формуле (1), то их следует преобразовать, например:
Xk ^ X k = 1/ Xk •
ОФХ H по (8) устроена так, что, если одна из частных функций желательности dj (Xj ) внутри кластера (Xj е Hu ,u = const) равна нулю, то обнуляется и весь агрегат Hu с потерей его информативности. Поэтому авторы статьи, учитывая малую чувствительность функции частных желательностей dj ( X.j) по (7) вблизи нуля, предлагают несколько загрубить оценку, принимая
d', =
[ s, если dj < 0,1, 1 d. в противном случае.
(9)
Здесь е — задаваемое аналитиком малое число, например е = 0,05.
Задача В. По сути квазибайесовский алгоритм регуляризации (КБАР) решения ОЗ нахождения параметров НСМ, т.е. множества синаптических весов IV, был описан выше в алгоритме задачи А. Более подробно этот вопрос изложен в работе [3]. Остается сформулировать основную идею КБАР и конкретизировать его новизну. КБАР использует ту же парадигму регуляризации решения ОЗ, что и теория А. Н. Тихонова — это сужение пространства искомых решений 2 с Я, где 2 — некоторый «компакт». Однако способ
сужения Z до компакта Z в КБАР другой, отличный от построения стабилизаторов Тихонова Q (z).
В КБАР сужение пространства Z осуществляется последовательно в три этапа:
Этап 1. Выбор класса (метагипотезы Q; (hq (x, y, W) e Q) и вида НС-гипотез {hq} внутри Q. Как было отмечено выше, в качестве Q был выбран класс MLP-BP, а в качестве варьируемых внутри Q активационных функций для {hq } — гиперболический тангенс или логистическая функция; в качестве параметров структуры s сети выбрано число скрытых слоев и оптимальное число нейронов в этих слоях.
Этап 2. Апостериорная фильтрация НС-гипотез байесовского ансамбля {hq }, q = 1, Q, по прямому критерию ошибок первого и второго рода при идентификации объектов выборки в (3)-(4).
Этап 3. Усреднение критерия 0 на отфильтрованном байесовском ансамбле О* по (3).
КБАР отличается от известного алгоритма С. А. Шумского [17] двумя новыми признаками:
1) отказом от допущения об известном априори виде закона распределения шумов (в [17] используются гауссовы и лапласовы распределения);
2) регуляризация решения ОЗ для основной НСМ выполняется взаимосвязанно с алгоритмом оптимального отбора факторов: для одинакового класса hq 6 Q вспомогательных субмоделей и основной модели, а также одинакового критерия качества (3), (4).
Получаемый эмерджентный эффект от этих новых признаков — упрощение расчетов (не требуется выполнять расчет функции правдоподобия распределения шумов, которая обычно не известна), обеспечение работоспособности (устойчивости) НСМ в сложных условиях моделирования (за счет процедур пред-регуляризации — регуляризации ОЗ), приближение НСМ к практике.
Количественные оценки. В качестве исходных данных D использовали ретроспективные данные бухгалтерской отчетности корпораций-заемщиков, одной из наиболее распространенных отраслей экономики — строительной отрасли, полученные фирмой Bereua Van Dijk [19]. База данных содержала 136 наблюдений. Использовалась система из 15 удельных показателей, широко применяемых в задачах оценки банкротств [3, 20]: L — быстрый коэффициент ликвидности; L2 — коэффициент покрытия запасов; P — текущий коэффициент ликвидности; Fx — коэффициент финансовой зависимости; F2 - коэффициент автономии собственных средств; F3 — обеспеченность запасов собственными оборотными средствами; F4 — индекс постоянного актива; R — общая рентабельность; R2 — рентабельность активов; R3 — рентабельность собственного капитала; R — рентабельность обо-
"j
I
ил J
8 5 4 2 -0.2 1 1 5 Xj 1
Частная функция желательности dj (xj) / Private function of desirability dj (xj)
Источник/Source: [9, с. 37].
Таблица 1 / Table 1
Стандартные отметки на шкале желательности / Standard marks on a desirability scale
Желательность (лингвистическая оценка переменной Xj) / Desirability (linguistic evaluation of the Xj variable) Отметка на шкале желательности dj / Mark on the scale of desirability dj
Очень хорошо / Very good 0,8...1,0
Хорошо / Good 0,63...0,8
Удовлетворительно / Sufficient 0,37.0,63
Плохо / Bad 0,2.0,37
Очень плохо / Very bad 0.0,2
Источник/Source: [9, c. 36].
ротных активов; A2 — оборачиваемость активов; A4 — оборачиваемость кредиторской задолженности; A5 — оборачиваемость дебиторской задолженности; A6 — оборачиваемость запасов.
Формулы для расчета этих удельных показателей содержатся в работе [3, 5] и оперируют с данными стандартной бухгалтерской отчетности.
Был реализован алгоритм (5), описанный выше для задачи А оптимального отбора факторов с применением регуляризации на байесовском ансамбле ВНСМ. Характеристики ансамбля: метагипотеза Q — MLP-BP, реализованный на программном продукте NeuroSolutions 5.0 (демоверсия). Характеристики НС-гипотез {hq}, q = 1, Q приведены в табл. 2.
В скрытых слоях НС использованы активационные функции логистической сигмоиды и гиперболического тангенса:
/ ( 5 )= гк ( Ъь ), Ъ > 0, (10)
/(5 ) = , * > ° а1)
Активационная функция выходного слоя во всех НСМ — линейная.
Указанные выше характеристики ансамбля были едиными в количественных оценках для всех трех задач А, Б, В (см. ниже).
Экспертно задаваемое число П в правиле отбора факторов выбирали равным 0,1 (или 90% правильно идентифицируемых объектов). Результаты оптимального отбора факторов показаны в табл. 3. Видно, что все шесть НС-гипотез {И} в байесовском ансамбле успешно прошли фильтрацию, и усредняемый кри-
Таблица 2/ Table 2
Байесовский ансамбль НСМ {hq} / Bayesian ensemble of neural network models {hq}
№ НСМ / Number of Число скрытых слоев / Number of hidden layers Вид активационной функции в скрытых слоях / The form of the activation function in the hidden layers
1 1 (10)
2 2 (10) в обоих слоях
3 2 (10) в обоих слоях, (11) - во втором слое
4 1 (11)
5 2 (11) в обоих слоях
6 2 (10) - во втором слое
Источник/Source: разработано авторами / developed by the authors.
терий качества НСМ 0 по (3) вычисляется по всем шести НС, т.е. О* = 6. Оптимальный вариант отбора соответствует пятой итерации и набору из 11 факторов: А, Ь2, ^, Р2 ,РЪ , ^, ^ ,Я3 ,А2, Л4, А6, при минимальном значении критерия качества по (3) ®тт = 0,0444 (или 95,56% верно идентифицированных объектов).
Таким образом, применение байесовского ансамбля в сочетании с отбором признаков приводит к улучшению модели: критерий © уменьшился по сравнению с исходным значением (V = 0), равным 0,0778, до значения © = 0,0444, т.е. в 1,75 раза, при сокращении числа факторов с 15 до 11 (в 1,36 раза). Это весьма ощутимый выигрыш за счет оптимального отбора факторов, причем одновременно реализуется процесс предрегуляризации основной НСМ.
Количественные оценки для задач Б и В сведены в итоговую табл. 4. Предлагаемый метод агрегирования на базе ОФХ (модель 1), который был подробно описан выше в задачах Б и В, сравнивался с широко применяемыми другими моделями: вариантами расчета на 15 факторах (без агрегирования) (модель 2), с рассмотренным выше оптимальным отбором факторов (модель 3) и также с агрегированием факторов по методу нечеткой матричной свертки [20] (модель 4).
Заметим, что эффект фильтрации на апостериорном байесовском ансамбле (обученных и протестированных НС) проявился четко для модели 1 (отсеяна НС с номером 2 при 0 > п = 0,1) и в модели 4 (НС с номерами 1, 2, 3 и 6).
Наилучший результат (© = 0,0333) соответствует предлагаемой модели 1 с агрегированием факторов по четырем кластерам по ОФХ {Ни}, и = 1, 2, 3, 4. В кластере Н1 агрегируются факторы ликвидности; в кластере Н 2 — факторы рентабельности и в кластере Н4 — факторы деловой активности. Таким образом, позиционированный эмерджентный эффект предла-
гаемого метода в обеих задачах Б и В подтвержден на реальных зашумленных данных строительной отрасли.
ЗАКЛЮЧЕНИЕ
1. В предложенном методе оптимального отбора факторов при формировании базы исходных данных Б (см. табл. 3) достигается эммерджен-тный эффект — улучшение качества НСМ 0 по критерию (5) в 3,336 раза при компрессии факторов в 1,35 раза, что достигается за счет взаимосвязи алгоритма отбора факторов с регуляризацией ВНСМ на байесовском ансамбле. Механизм указанной «взаимосвязи», по мнению авторов статьи, состоит в учете нелинейного влияния факторов друг на друга в процессе обучения ВНСМ в методе отбора факторов, что повышает информативность данных Б и качество всей рабочей НСМ по прогностическому критерию ©.
2. В предложенном методе комплексного (ступенчатого) агрегирования факторов на основе функций Харрингтона достаточно высокое прогностическое качество НСМ в сложных условиях моделирования банкротств (см. табл. 4) обеспечивается основным новым признаком метода: операция агрегирования проводится взаимосвязанно с операцией регуляризации решения ОЗ на байесовском ансамбле путем поэтапного сужения пространства искомых решений (2 ^ 2где 2' — компакт).
3. Предложенные теоретические идеи двух оригинальных методов компрессии переменных подтверждены результатами на реальных данных строительной отрасли и позволяют оценить стадии развивающегося в корпорации процесса банкротства: 1 стадия банкротства — стратегический кризис (0 ^ Р ^ 0,15); 2 стадия — структурный кризис (0,15 ^ Р < 0,3); 3 стадия — оперативный кризис (0,3 < Р < 0,45); 4 стадия — кризис ликвидности (0,45 ^ Р < 0,6); 5 стадия — кризис
Таблица 3/ Table 3
Итерационный процесс оптимального отбора факторов / Iterative process of optimum selection
of factors
№ шага итерации V / Number of iteration step v Набор факторов {x. } / Set of factors {x. } Исключение (-) или включение (+) факторов / Exclusion (-) or inclusion (+) of factors N (I ) N(II) @ по (3) /0 according to (3)
0 A ' L2- P A ' F2- F4-R1- R2,R3- R5' A2- A4- A5- A6 4 3 0,0778
1 L2- p ' A ' F2- F3" F4- К R2' R3-A2- A4- A5- A6- - R 2 3 0,0556
2 L2- P\- A ' F2- F3- R1- R2- R3- A2' A4- A5- A6 - F4 3 1 0,0444
3 Li- l2- p F2, F3, R^ r2, R3, A4- A5, A6 - A 4 1 0,0556
4 L2- p ' A ' F2- F3" R1- R2' R3' A2' A4' A6 +A2 - - A5 3 1 0,0444
5 L2- F\-F2- F3,Rl' R' R3' A2' A4' A6 - P 3 1 0,0444
6 L2- F\-F2- R\- R2- R3" A2- A4- A6 - F 3 3 0,0667
Источник/Source: разработано авторами / developed by the authors.
Таблица 4/ Table 4
Результаты нейросетевого моделирования при агрегировании факторов на основе функций
Харрингтона и сравнения с другими моделями / Results of neural network modeling with aggregation of factors on the basis of Harrington's functions and comparison with other models
Номер модели / Number of Показатель / Indicator Номер НС-гипотез в ансамбле / Number of NC-hypotheses in the ensemble Среднее на ансамбле / Average on
model 1 2 3 4 5 6 ensemble
N(I) 2 7 5 0 2 2 1
1 N( 11 ) 4 8 4 1 3 3 2
0 0,0667 0,1667 0,1 0,0111 0,0556 0,0556 0,0333
N (I) 4 4 3 3 2 3 4
2 N( 11 ) 3 4 2 2 4 2 3
0 0,07778 0,0889 0,0556 0,0556 0,0667 0,0556 0,0778
N (I) 3 4 4 2 1 3 3
3 N( 11 ) 2 3 1 1 2 1 1
0,0333
0 0,0556 0,0778 0,0556 0,0333 0,0444 0,0444
N (I) 2 3 2 2 1 1 2
4 N( 11 ) 12 11 10 7 5 9 8
0 0,1556 0,1556 0,1333 0,1 0,0667 0,1111 0,1111
Источник/Source: разработано авторами / developed by the authors. FINANCETP.FA.R U •-
платежеспособности (0,6 < Р < 0,8); 6 стадия — несостоятельность предприятия (0,8 < Р < 1).
4. В аспекте дальнейшего развития предложенных двух методов представляет интерес их последо-
вательное сочетание при большом числе факторов (сотни) — вначале оптимального отбора факторов, затем агрегирования факторов на основе функций Харрингтона.
СПИСОК ИСТОЧНИКОВ
1. Галушкин А. И. Нейронные сети: основы теории. М.: Горячая линия-Телеком; 2012. 469 с.
2. Галушкин А. И. Применение нейрокомпьютеров в финансовой деятельности. URL: http://masters.donntu. org/2007/kita/bolkune\dch/library/galuwkin.htm (дата обращения: 28.08.2017).
3. Горбатков С. А., Полупанов Д. В., Макеева Е. Ю., Бирюков А. Н. Методологические основы разработки ней-росетевых моделей экономических объектов в условиях неопределенности. М.: Изд. дом «Экономическая газета»; 2012. 494 с.
4. Горбатков С. А., Фархиева С. А., Белолипцев И. И. Нейросетевые и нечеткие методы моделирования диагностики и прогнозирования банкротств корпораций. М.: Прометей; 2018. 371 с.
5. Белолипцев И. И., Горбатков С. А., Романов А. Н., Фархиева С. А. Моделирование управленческих решений в сфере экономики в условиях неопределенности. М.: Инфра-М; 2015. 299 с.
6. Тихонов А. Н., Арсенин В. Я. Методы решения некорректных задач. М.: Наука: Физматлит; 1986. 288 с.
7. Rissanen J. Modeling by shortest data description. Automatica. 1978;14(5):465-471. DOI: 10.1016/0005-1098(78)90005-5
8. Доленко С. А. Нейросетевые методы решения обратных задач. XV Всеросс. науч.-техн. конф. «Нейроинформа-тика-2013»: Лекции по нейроинформатике (г. Москва, 21-25 января 2013 г.). М.: НИЯУ МИФИ; 2013:214-269.
9. Адлер Ю. П., Маркова Е. В., Грановский Ю. В. Планирование эксперимента при поиске оптимальных условий. М.: Наука; 1976. 279 с.
10. Горский В. Г., Адлер Ю. П. Планирование промышленных экспериментов. М.: Металлургия; 1974. 112 с.
11. Давыдова Г. В., Беликов А. Ю. Методика количественной оценки риска банкротства предприятий. Управление риском. 1999;(3):13-20.
12. Altman E. I., Marco G., Varetto F. Corporate distress diagnosis: Comparisons using linear discriminant analysis and neural network (the Italian experience). Journal of Banking and Finance. 1994;18(3):505-529. DOI: 10.1016/0378-4266(94)90007-8
13. Cho S., Kim J., Bae J. K. An integrative model with subject weight based on neural network learning for bankruptcy prediction. Expert Systems with Applications. 2009;36(1):403-410. DOI: 10.1016/j.eswa.2007.09.060
14. Udo G. Neural network performance on the bankruptcy classification problem. Computers and Industrial Engineering. 1993;25(1-4):377-380. DOI: 10.1016/0360-8352(93)90300-M
15. Ohlson J. A. Financial ratios and the probabilistic prediction of bankruptcy. Journal of Accounting Research. 1980;18 (1):109-131. DOI: 10.2307/2490395
16. Altman E. I. Corporate financial distress: A complete guide to predicting, avoiding, and dealing with bankruptcy. New York: Wiley-Interscience Publ.; 1983. 368 p.
17. Шумский С. А. Байесова регуляризация обучения. Науч. сессия МИФИ 2002. IV Всеросс. науч.-техн. конф. «Нейроинформатика-2002»: Лекции по нейроинформатике (г. Москва, 23-25 января 2002 г.). Ч. 2. М.: НИЯУ МИФИ; 2002:30-93. URL: http://neurolectures.narod.ru/2002/Shumsky-2002.pdf (дата обращения: 18.05.2018).
18. MacKay D. Bayesian interpolation. Neural Computation. 1992;4(3):415-447. DOI: 10.1162/neco.1992.4.3.415
19. Makeeva E. U., Neretina E. A. Binary model versus discriminant analysis relating to corporate bankruptcies: The case of Russian construction industry. Journal of Accounting, Finance and Economics. 2013;3(1):65-76.
20. Шевченко И. В., Халафян А. А., Васильева Е. Ю. Создание виртуальной клиентской базы для анализа кредитоспособности российских предприятий. Финансы и кредит. 2010;(1):13-18.
REFERENCES
1. Galushkin A. I. Neural networks: theory bases. Moscow: Goryachaya liniya-Telekom; 2012. 469 p. (In Russ.).
2. Galushkin A. I. The use of neurocomputers in financial activity. URL: http://masters.donntu.org/2007/kita/ bolkunevich/library/galuwkin.htm (accessed 28.08.2017). (In Russ.).
3. Gorbatkov S. A., Polupanov D. V., Makeeva E. Yu., Biryukov A. N. Methodological bases of development of neural network models of economic objects in the conditions of uncertainty. Moscow: Publ. House of "Ekonomicheskaya gazeta"; 2012. 494 p. (In Russ.).
4. Gorbatkov S. A., Farkhieva S. A., Beloliptsev I. I. Neural network and fuzzy methods for modeling corporate bankruptcy diagnostics and forecasting. Moscow: Prometheus; 2018. 371 p. (In Russ.).
5. Beloliptsev I. I., Gorbatkov S. A., Romanov A. N., Farkhieva S. A. Modeling of managerial decisions in the sphere of economy in the conditions of uncertainty. Moscow: Infra-M; 2015. 299 p. (In Russ.).
6. Tikhonov A. N., Arsenin V. Ya. Methods for solving incorrect problems. Moscow: Nauka: Fizmatlit; 1986. 288 p. (In Russ.).
7. Rissanen J. Modeling by shortest data description. Automatica. 1978;14(5):465-471. DOI: 10.1016/0005-1098(78)90005-5
8. Dolenko S. A. Neural network methods for solving inverse problems. In: 15th All-Russ. sci.-techn. conf. "Neuroinformatics -2013": Lectures on neuroinformatics (Moscow, 21-25 Jan. 2013). Moscow: NRNU MEPhI; 2013:214-269. (In Russ.).
9. Adler Yu.P., Markova E. V., Granovskii Yu.V. Planning an experiment in the search for optimal conditions. Moscow: Nauka; 1976. 279 p. (In Russ.).
10. Gorskii V. G., Adler Yu. P. Planning of industrial experiments. Moscow: Metallurgiya; 1974. 112 p. (In Russ.).
11. Davydova G. V., Belikov A. Yu. Technique of quantitative assessment of the risk of bankruptcy of enterprises. Upravlenie riskom. 1999;(3):13-20. (In Russ.).
12. Altman E. I., Marco G., Varetto F. Corporate distress diagnosis: Comparisons using linear discriminant analysis and neural network (the Italian experience). Journal of Banking and Finance. 1994;18(3):505-529. DOI: 10.1016/0378-4266(94)90007-8
13. Cho S., Kim J., Bae J. K. An integrative model with subject weight based on neural network learning for bankruptcy prediction. Expert Systems with Applications. 2009;36(1):403-410. DOI: 10.1016/j.eswa.2007.09.060
14. Udo G. Neural network performance on the bankruptcy classification problem. Computers and Industrial Engineering. 1993;25(1-4):377-380. DOI: 10.1016/0360-8352(93)90300-M
15. Ohlson J. A. Financial ratios and the probabilistic prediction of bankruptcy. Journal of Accounting Research. 1980;18 (1):109-131. DOI: 10.2307/2490395
16. Altman E. I. Corporate financial distress: A complete guide to predicting, avoiding, and dealing with bankruptcy. New York: Wiley-Interscience Publ.; 1983. 368 p.
17. Shumsky S. A. Bayesian regularization of learning. In: Sci. session of MEPhI 2002. 4th All-Russ. sci.-techn. conf. "Neuroinformatics — 2002": Lectures on neuroinformatics (Moscow, 23-25 Jan. 2002). Pt. 2. Moscow: NRNU MEPhI; 2002:30-93. URL: http://neurolectures.narod.ru/2002/Shumsky-2002.pdf (accessed 18.05.2018). (In Russ.).
18. MacKay D. Bayesian interpolation. Neural Computation. 1992;4(3):415-447. DOI: 10.1162/neco.1992.4.3.415
19. Makeeva E. U., Neretina E. A. Binary model versus discriminant analysis relating to corporate bankruptcies: The case of Russian construction industry. Journal of Accounting, Finance and Economics. 2013;3(1):65-76.
20. Shevchenko I. V., Khalafyan A. A., Vasil'eva E. Yu. Development of virtual client base for the analysis of solvency of Russian enterprises. Finansy i kredit = Finance and Credit. 2010;(1):13-18. (In Russ.).
ИНФОРМАЦИЯ ОБ АВТОРАХ
Станислав Анатольевич Горбатков — доктор технических наук, профессор, заслуженный деятель науки Республики Башкортостан, профессор кафедры «Математика и информатика», Уфимский филиал Финансового университета, Уфа, Россия SAGorbatkov@fa.ru
Светлана Анатольевна Фархиева — кандидат технических наук, заведующая кафедрой «Математика и информатика», Уфимский филиал Финансового университета, Уфа, Россия SAFarhieva@fa.ru
ABOUTTHE AUTHORS
Stanislav A. Gorbatkov — Dr. Sci. (Engin.), Professor, Honored worker of science of the Republic of Bashkortostan, Professor of the Department of "Mathematics and Informatics", Ufa branch of the Financial University, Ufa, Russia SAGorbatkov@fa.ru
Svetlana A. Farkhieva — Cand. Sci. (Engin.), Head of the Department of "Mathematics and Informatics", Ufa branch
of the Financial University, Ufa, Russia
SAFarhieva@fa.ru
financetp.fa.ru
123