Научная статья на тему 'Выбор системы экономических показателей для диагностики и прогнозирования банкротств на основе нейросетевого байесовского подхода'

Выбор системы экономических показателей для диагностики и прогнозирования банкротств на основе нейросетевого байесовского подхода Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
503
151
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИАГНОСТИКА БАНКРОТСТВ / ПРОТИВОРЕЧИВЫЕ ДАННЫЕ / НЕЙРОСЕТЬ / PROBIT-МОДЕЛЬ / БАЙЕСОВСКИЙ ПОДХОД / ИНТЕЛЛЕКТУАЛЬНЫЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ / BANKRUPTCY PREDICTION / CONFLICTING DATA / NEURAL NETWORK / PROBIT-MODEL / BAYESIAN APPROACH / INTELLIGENT INFORMATION TECHNOLOGIES

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Горбатков Станислав Анатольевич, Белолипцев Илья Игоревич, Макеева Елена Юрьевна

В настоящее время разработано и применяется на практике множество моделей диагностики банкротств, различающихся методами построения моделей и набором факторов. Указанные методы в основном относятся к пяти группам: классическим статистическим методам, методам регрессионного анализа, методам дискриминантного анализа, методам logit-анализа, методам нечетких множеств и нейросетевым методам. Возможны комбинации указанных методов. Последние три группы методов в настоящее время развиваются особенно быстро. Что касается выбора факторов банкротства, то здесь господствует эвристика. Отсутствует методология формализованного отбора и сравнения групп экономических показателей для построения модели банкротств, а также эффективных методов предобработки данных. В данной работе предлагается оригинальный метод выбора системы показателей с последующим построением нейросетевой модели диагностики банкротств на основе байесовского подхода. Разработанная концепция формализации выбора и сравнительной оценки системы показателей (мета-гипотез) для модели банкротств на основе байесовского подхода позволила создать предпосылки для разработки эффективной нейросетевой модели банкротств. Предложенные в работе методы и идеи апробированы в вычислительных экспериментах. Построенная модель диагностики банкротств была проверена на реальных данных и оказалась вполне работоспособной и имеющей хорошие прогностические свойства. Предлагаемая концепция и основанный на ней нейросетевой байесовский метод построения модели банкротств апробирован для строительной отрасли экономики. Однако авторы считают, что в силу общности развиваемого подхода эти концепция и метод могут быть полезны и в других отраслях для решения широкого круга экономических задач, таких как формирование кредитного портфеля, проведение внешнего аудита или оценка финансового состояния организации.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Горбатков Станислав Анатольевич, Белолипцев Илья Игоревич, Макеева Елена Юрьевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SELECTION OF THE SYSTEM OF ECONOMIC INDICATORS FOR DIAGNOSTICS AND PREDICTION OF BANKRUPTCIES BASED ON NEURAL NETWORK BAYESIAN APPROACH

Currently, an impressive number of models for bankruptcy diagnostics have been developed and put into practice. They differ from each other in methods of building and sets of factors. The abovementioned building methods generally fall into five groups: classical statistical methods, regression analysis methods, discriminant analysis methods, logit-analysis methods, fuzzy sets methods and neural network methods. It should be noted that today the last three groups of methods are being developed particularly fast. Also, the methods can be combined. As for the choice of bankruptcy factors,here heuristics prevails. But there is no methodology for formalized selection and comparison between groups of economic indicators nor effective methods for data preprocessing. In this paper we describe an original method to select indicators and construct neural network model for diagnosing bankruptcies using Bayesian approach. The developed concept of formalized selection and comparative evaluation of indicators(metahypotheses)for the bankruptcy prediction model using Bayesian approach helped provide the base for the creation of an efficient neural network model to reveal failure. Suggested methods and ideas have been tested in computational experiments. The bankruptcy prediction model has been tested on real data and proved to be quite efficient. Moreover, the model demonstrated good predictive properties. Although so far the Bayesian neural network-based forecasting model has only been applied in the construction sector, the authors believe that because of the generality of the approach, the concept and method are easily applicable in other areas to solve a variety of economic problems, such as formation of the credit portfolio, an external audit or evaluation of the financial state of the organization.

Текст научной работы на тему «Выбор системы экономических показателей для диагностики и прогнозирования банкротств на основе нейросетевого байесовского подхода»

УДК 336.1

выбор системы экономических показателей для диагностики и прогнозирования банкротств на основе нейросетевого байесовского подхода

ГОРБАТКОВ СТАНИСЛАВ АНАТОЛЬЕВИЧ

доктор технических наук, профессор кафедры «Математика и информатика» Уфимского филиала Финансового университета, Уфа, Россия E-mail: sgorbatkov@mail.ru

БЕЛОЛИПЦЕВ ИЛЬЯ ИГОРЕВИЧ

преподаватель кафедры «Математика и информатика» Уфимского филиала Финансового университета, Уфа, Россия E-mail: red7315@gmail.com

МАКЕЕВА ЕЛЕНА ЮРЬЕВНА

кандидат экономических наук, доцент кафедры «Экономика и финансы фирмы» Департамента экономики Научно-исследовательского университета «Высшая школа экономики», Москва, Россия E-mail: len-makeeva@yandex.ru

АННОТАЦИЯ

В настоящее время разработано и применяется на практике множество моделей диагностики банкротств, различающихся методами построения моделей и набором факторов. Указанные методы в основном относятся к пяти группам: классическим статистическим методам, методам регрессионного анализа, методам дискриминантного анализа, методам logit-анализа, методам нечетких множеств и нейросетевым методам. Возможны комбинации указанных методов. Последние три группы методов в настоящее время развиваются особенно быстро. Что касается выбора факторов банкротства, то здесь господствует эвристика. Отсутствует методология формализованного отбора и сравнения групп экономических показателей для построения модели банкротств, а также эффективных методов предобработки данных. В данной работе предлагается оригинальный метод выбора системы показателей с последующим построением нейросетевой модели диагностики банкротств на основе байесовского подхода. Разработанная концепция формализации выбора и сравнительной оценки системы показателей (мета-гипотез) для модели банкротств на основе байесовского подхода позволила создать предпосылки для разработки эффективной нейросетевой модели банкротств. Предложенные в работе методы и идеи апробированы в вычислительных экспериментах. Построенная модель диагностики банкротств была проверена на реальных данных и оказалась вполне работоспособной и имеющей хорошие прогностические свойства.

Предлагаемая концепция и основанный на ней нейросетевой байесовский метод построения модели банкротств апробирован для строительной отрасли экономики. Однако авторы считают, что в силу общности развиваемого подхода эти концепция и метод могут быть полезны и в других отраслях для решения широкого круга экономических задач, таких как формирование кредитного портфеля, проведение внешнего аудита или оценка финансового состояния организации.

Ключевые слова: диагностика банкротств; противоречивые данные; нейросеть; probit-модель; байесовский подход; интеллектуальные информационные технологии.

selection of the system of economic indicators for diagnostics and prediction of bankruptcies based on neural network

bayesian approach

STANISLAV GORBATKOV

Doctor of Engineering, Professor of the chair «Mathematics and Informatics», Financial university under the Government of the Russian Federation, ufa branch, Russia E-mail: sgorbatkov@mail.ru

ILIA BELOLIPTSEV

Lecturer of the chair «mathematics and informatics «, financial university under the Government of the Russian federation, ufa branch, Russia E-mail: red7315@gmail.com

ELENA MAKEEVA

Phd (economics), Associate Professor of the chair «economics and company's finances», National Research university «Higher school of economics», Moscow, Russia E-mail: len-makeeva@yandex.ru

ABSTRACT

Currently, an impressive number of models for bankruptcy diagnostics have been developed and put into practice. They differ from each other in methods of building and sets of factors. The above-mentioned building methods generally fall into five groups: classical statistical methods, regression analysis methods, discriminant analysis methods, logit-analysis methods, fuzzy sets methods and neural network methods. It should be noted that today the last three groups of methods are being developed particularly fast. Also, the methods can be combined. As for the choice of bankruptcy factors, here heuristics prevails. But there is no methodology for formalized selection and comparison between groups of economic indicators nor effective methods for data preprocessing. In this paper we describe an original method to select indicators and construct neural network model for diagnosing bankruptcies using Bayesian approach.

The developed concept of formalized selection and comparative evaluation of indicators (meta-hypotheses) for the bankruptcy prediction model using Bayesian approach helped provide the base for the creation of an efficient neural network model to reveal failure. Suggested methods and ideas have been tested in computational experiments. The bankruptcy prediction model has been tested on real data and proved to be quite efficient. Moreover, the model demonstrated good predictive properties.

Although so far the Bayesian neural network-based forecasting model has only been applied in the construction sector, the authors believe that because of the generality of the approach, the concept and method are easily applicable in other areas to solve a variety of economic problems, such as formation of the credit portfolio, an external audit or evaluation of the financial state of the organization.

Keywords: bankruptcy prediction; conflicting data; the neural network; probit-model; Bayesian approach; intelligent information technologies.

ВВЕДЕНИЕ

Проблема прогнозирования банкротства предприятий впервые была затронута западными учеными в 30-е гг. XX в. и продолжает быть одной из актуальных тем исследования в настоящее время. С момента появления первой ключевой работы (Е. Актап (1968)) [10], основанной на методе множественного диск-риминантного анализа, методологическая база в данной области получила значительное развитие. По причине таких факторов, как появление новых данных с течением времени, изменение среднего размера компаний на рынке и изменение в стандартах учета и отчетности, существующие методы и модели должны постоянно обновляться и совершенствоваться, чтобы наиболее полно учитывать сложившуюся ситуацию. С появлением большого количества транснациональных корпораций и развитием рынков капитала возникла необходимость применения данных методов на развивающихся рынках для оценки компаний из тех стран, вложение в экономику которых может быть более выгодным ввиду высоких процентных ставок при условии принятия допустимого уровня риска. В России обращение к данной тематике исследований было обусловлено переходом к рыночной экономике и кризисом 1998 г., который показал наличие потребности в локальных методах оценки вероятности банкротства предприятий в целях эффективного управления структурой инвестиционных вложений и распределения заемного капитала.

Особенно актуальны такие модели в кризисные периоды, когда влияние всех факторов, приводящих к будущей неплатежеспособности, усиливается. Одной из основных отраслей, страдающих от кризисных явлений, является строительная отрасль. Продолжение проектов в строительном бизнесе происходит, как правило, с использованием выручки от продаж объектов незавершенного строительства. В кризисные периоды выручка от предварительных продаж падает, к тому же снижается объем ипотечного кредитования. Положение строительных компаний ухудшается тем, что строительные объекты в условиях обвала рынка перестают являться хорошим залогом при получении банковских кредитов.

Другой особенностью строительных предприятий является сезонность хозяйственной деятельности, которая приводит к образованию значительного дефицита денежных средств в первом и втором кварталах каждого года. Снижение объемов выполненных работ в строительстве наблюдается ежегодно с декабря по март, а периодом активных строительных работ считается сезон с апреля по октябрь. В период пика строительных работ наблюдается недостаток оборотного капитала у строительных предприятий.

Позже в рамках дискриминантного анализа в России и за рубежом был предпринят ряд попыток усовершенствования модели Альтмана путем изменения групп факторов банкротства (от 2 до 21), способа их оценки (рыночной вместо балансовой) и правила отнесения новых объектов к классам: Р. Таф-флер и Г. Тишоу (1977 г.) [14], У. Бивер (1966) [11], Фулмер (1984) [12], и Спрингейт (1978), А. Д. Шеремет, Р. С. Сайфуллин, Е. В. Нега-шев (1988) [7]. Интересный подход развил Ю. Д. Шмидт [8], который в качестве моделируемого индикатора Y банкротств предложил функцию правдоподобия, куда в качестве одного из агрегированных факторов входит модифицированная функция Альтмана.

Новые методы построения моделей банкротств (методы бинарного отклика, нечеткие и нейросетевые методы) принципиально отличаются от классического регрессионного и дискриминантного анализа рядом положительных свойств:

1) в методах бинарного отклика logit-анали-за не требуется соблюдения условия подчинения переменных многомерному нормальному закону распределения;

2) получаемая logit-модель может учитывать нелинейную зависимость выходной величины (вероятность банкротства) от факторов;

3) получаемая модель, в отличие от дискри-минантных моделей, определяет конкретную вероятность наступления банкротства, то есть отсутствуют зоны неопределенности.

В последние годы бурно развиваются интеллектуальные нейросетевые информационные технологии, нечеткие и нейронечеткие методы. Особо следует отметить новаторскую работу Rong-Ho Lin, Chun-Ling Chuang (1999-2006) [13].

Однако в рассмотренных выше исследованиях отсутствует методология формализации выбора систем факторов банкротства и их объективного сравнения. Чаще всего набор факторов формируется экспертно. Сам по себе вопрос подбора оптимального набора показателей в целях диагностики банкротств является предметом отдельного исследования и в рамках данной работы не рассматривается. Мы ограничимся кругом вопросов методологии сравнения различных уже сформировавшихся систем показателей (факторов) банкротства. Итогами этого исследования являются предложенная концепция сравнения систем факторов и реализующий эту концепцию байесовский нейросетевой метод.

1. ВЫБОР ИНСТРУМЕНТАРИЯ МОДЕЛИРОВАНИЯ

В общем случае эконометрическая модель имеет вид:

у = F (b, x),

(1)

где х = (х1, х2,..., хп) - вектор независимых переменных; Ь - вектор оцениваемых параметров модели. В задаче диагностики банкротств зависимая переменная у является качественной и может принимать только два возможных значения - 0 и 1, соответствующих двум возможным состояниям изучаемых объектов: «банкрот» и «не банкрот». То есть модель (1) представляет собой модель бинарного отклика [1].

В качестве моделируемой величины в (1) будем рассматривать вероятность того, что при заданных значениях факторов X = (хп, XI2,..., хп) предприятие с номером I окажется банкротом.

- _ 1 с —

yt (xt) = P(yt = 1) = Ф(и) = -j= J e 2 dz, (3)

где u = bTx - аргумент функции Лапласа. Такие модели получили название probit-моде-лей.

Очевидно, что значение аргумента u зависит от значений входных факторов x = (x1,x2,...,xn), то есть u = ф(Х). При этом характер этой связи заранее неизвестен и, скорее всего, не является линейным. Для восстановления зависимости u = ф( x) предлагается применить нейросетевое моделирование. На вход нейросети будут подаваться значения входных факторов xt, а откликом сети будут значения аргумента u . В процессе обучения нейросеть в неявном виде восстанавливает зависимость u = ф(х) путем подбора оптимальной комбинации синаптических весов W. Значения синаптичесчких весов W можно рассматривать как аналог вектора оцениваемых параметров b в (1).

Значения u в обучающих примерах известны. Если в исходной базе данных y = 1, это означает, что P (y = 1) = Ф(и) = 1. По таблице распределения Лапласа найдем соответствующее этой вероятности значение аргумента u = 3,9. Если y = 0, это означает, что P (y = 1) = Ф(и) = 0 и соответствующее значение аргумента u = -3,9. Для большей наглядности в табл. 1 представлен фрагмент обучающего множества (столбец Y в обучении не участвует и используется после построения модели для ее проверки).

Предъявляя обученной сети новые наборы данных x* = (х.,Л, x., 2,..., x.,n), получим смоделированное нейросетью значение аргумента Ш*, зная которое можно оценить вероятность того, что предприятие с номером i является

yt(x) = P(y = m) = F(b ,x),m = 1;0, (2) банкротом

где F(■) - некоторая непрерывная функция. Так как левая часть (2) имеет смысл вероятности, необходимо, чтобы значения F (■) принадлежали интервалу [0;1]. Чаще всего в качестве В (ЬТ, х ) используют интегральную нормализованную функцию распределения Лапласа. Тогда выражение (2) можно записать в виде:

P (у, = 1) = Ф(ыг).

(4)

После того как получены значения вероятностей (4), открываются широкие возможности для использования современных нечетких методов, для получения более точной и объективной классификации изучаемых объектов. Однако, в этой работе

Подготовка данных перед обучением нейросети

Таблица 1

№ XI Х2 Х3 ... Х10 Y и

1 0,1388 -0,0037 -0,3559 -0,0470 1 3,9

2 -0,1388 0,0560 0,4436 -0,0484 0 -3,9

3 -0,1390 0,1867 -1,0459 0,08471 1 3,9

4 -0,1378 0,1293 1,9329 -0,0154 0 -3,9

ограничимся наиболее простым правилом: если Р(у* = 1) > 0,5, предприятие признается банкротом, в противном случае - считается надежным в аспекте платежеспособности.

2. МЕТОД ПОСТРОЕНИЯ НЕЙРОСЕТЕВОЙ МОДЕЛИ ДИАГНОСТИКИ БАНКРОТСТВ

Изложим сущность предлагаемого подхода. На основе данных бухгалтерской отчетности формируется несколько альтернативных систем показателей, которые в рамках развиваемого авторами байесовского подхода можно назвать метагипотезами Нк. Метагипотезы {Н1,Н2,...,Нк,...,Н0} отличаются между собой набором факторов:

Нк =< X,>, I = ,к = \~о, (5)

где NH - количество опытов (независимых переменных) X) в системе показателей Нк; G - количество альтернативных систем показателей (метагипотез); ^ номер опыта. Например, система показателей (СП), предложенная О. П. Зайцевой [3], включает в себя 6 переменных; по мнению А. О. Недосекина [4] для диагностики банкротств нужно использовать 16 показателей.

Некоторые исследователи утверждают, что невозможно построить универсальную модель диагностики банкротств, которая одинаково хорошо работала бы для предприятий любой отрасли. В данной работе делается попытка построения модели диагностики банкротств для строительных предприятий. При этом заранее неизвестно, какая из систем показателей наилучшим образом подходит для достижения этой цели.

Отдельного изучения требует вопрос о влиянии на качество обучения нейросетей так называемых аномальных или противоречивых наблюдений, содержащихся в данных. Пока ограничимся достаточно общим определением: противоречивыми (аномальными) можно считать наблюдения, явно выделяющиеся на фоне всей выборки (например, если значение переменной в десятки раз отличается от среднего). В рамках классического регрессионного анализа удаление аномальных наблюдений считается полезной и необходимой процедурой. Удаление аномальных наблюдений делает данные более однородными. Для задач аппроксимации это, несомненно, хорошо. Но при построении нейросетевой модели диагностики банкротств существует своя специфика: в процессе обучения нейросеть «учится» распознавать образ банкрота или не банкрота по некоторому набору значений входных переменных. Если перед обучением будут удалены все аномальные точки, то данные могут стать слишком однородными, «неконтрастными» и нейросети будет сложнее идентифицировать банкротов и небанкротов. До проведения вычислений вопрос о влиянии аномальных наблюдений на качество модели остается открытым.

Какие данные можно считать аномальными? Для решаемой нами задачи необходимо подобрать подходящий критерий. Широко известный критерий Ирвина в данном случае неприемлем, так как наши данные являются многомерными, каждое наблюдение представляет собой вектор-строку < ,у >,1 = 1,N. В работе, посвященной построению моделей налогового контроля [2], для выявления противоречивых наблюдений авторы предлагали использовать аналог константы Липшица:

Уа-Ур

—» —♦ 1

(6)

где - близкие по выбранной число-

вой мере вектор-строки, уа, - соответствующие им значения выходной величины. Однако в рассматриваемой задаче исходная переменная У принимает дискретные значения 0 или 1, поэтому величина (6) становится неинформативной.

Для выявления аномальных наблюдений предлагается следующее правило: вектор-строка < хп у1 > признается аномальной, если хотя бы один компонент вектора х1 нарушает правило «трех сигм», то есть не выполняется условие:

(7)

банкротств цена ошибок первого и второго рода различна. В большинстве случаев гораздо опаснее ошибки первого рода (например, лучше отказать в займе надежному заемщику, чем выдать кредит потенциальному банкроту). Для окончательной оценки качества нейросе-тевых моделей предлагается использовать следующий показатель:

Кн =АС Г-М

Ну' 1

Ну 2

2

Ну'3 >

N1 К

(8)

где NНк - количество верно идентифицированных предприятий для метагипотезы Нк;

- количество ошибок 1-го рода; Ы2Н - количество ошибок 2-го рода; гх,г2,гг - удельный вес каждого показателя. Веса гх,гг,гъ назначаются согласно правилу Фишберна [4]:

2(п-1 + 1)

П

(п + 1)п

(9)

где X. - среднее по выборке значение фактора х.; а - выборочное среднеквадрати-ческое отклонение фактора . Аномальные наблюдения удаляются из базы данных и не участвуют в обучении нейросети, но включаются в тестовое множество и используются для оценки качества обучения.

Для выбора оптимальной системы показателей строится вспомогательная нейросеть, которая обучается на разных наборах данных, соответствующих метагипотезам НК. При этом используется один и тот же алгоритм обучения, одинаковое количество эпох обучения, фиксируется количество точек в обучающем и тестовом множестве.

Оценка качества полученных нейросетевых моделей проводится по результатам тестирования на данных, не участвовавших в обучении. При этом недостаточно просто вычислить долю правильно идентифицированных предприятий, необходимо учитывать количество, а главное, характер допущенных моделью ошибок. В задачах классификации возможны два вида ошибок. Если предприятие-банкрот было классифицировано как надежное, то это ошибка первого рода («пропуск цели» по терминологии радиолокации), если, наоборот, надежное предприятие было определено как банкрот, то это ошибка второго рода («ложная тревога»). Очевидно, что при диагностике

где п - количество ранжируемых показателей. Формулу (9) можно использовать в случае, если некоторое множество критериев упорядочено в порядке убывания их значимости. В нашем случае будем считать, что при оценке качества диагностики наиболее важным является общее количество верно идентифицированных предприятий, а затем следует учитывать количество ошибок первого и второго рода (и = 3). Окончательный выбор системы показателей осуществляется по правилу:

нкопт -.к\нк=т^{кНк\кеТё.

То есть наилучшей признается система показателей, для которой величина (8) будет наибольшей.

Суть байесовского подхода заключается в том, что для построения модели диагностики банкротств следует использовать не одну нейросеть, а ансамбль гипотез-нейросетей, принадлежащих к одному типу (например, многослойный персептрон) [9]. Нейросети, входящие в ансамбль, могут отличаться количеством скрытых слоев, количеством нейронов в скрытых слоях и видом актива-ционных функций. Для обучения сетей байесовского ансамбля используется система показателей Нк . Очевидно, что качество

нейросетевых моделей ансамбля будет различным, поэтому после обучения проводится процедура апостериорной фильтрации, в результате которой будут отсеяны наименее удачные гипотезы-нейросети. В качестве критерия фильтрации логично было бы использовать критерий (8). Фильтрация ней-росетевых моделей байесовского ансамбля проводится по правилу:

Кнк >

> h:

(10)

где ц - экспертно задаваемое значение. Те нейросети, для которых правило (10) не выполняется, удаляются из байесовского ансамбля.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Окончательная классификация проводится путем осреднения всех расчетных характеристик на отфильтрованном байесовском ансамбле.

3. РЕЗУЛЬТАТЫ ВЫЧИСЛИТЕЛЬНЫХ ЭКСПЕРИМЕНТОВ

В рамках вычислительных экспериментов рассматривалось четыре альтернативных системы показателей, которые используются в различных моделях диагностики банкротств: в пятифакторной модели Альтмана [6], моделях Недосекина [4], Зайцевой [3] и Рахимкуловой [5]. Во всех указанных моделях в качестве факторов (показателей) используются относительные величины, характеризующие финансовое состояние предприятия. Например в модели Альтмана используется следующий набор показателей: отношение собственного оборотного капитала к сумме активов; отношение нераспределенной прибыли к сумме активов; отношение прибыли до уплаты процентов к сумме активов; отношение стоимости собственного капитала к заемному капиталу; отношение выручки к сумме активов.

Общим недостатком многих моделей диагностики банкротств является тот факт, что в модель включаются взаимно коррелированные показатели. В работе [5] предлагается методика построения системы независимых показателей, на основе которой в дальнейшем строится модель диагностики банкротств. По мнению авторов, это выгодно отличает модель Рахимкуловой от моделей Альтмана,

Недосекина и Зайцевой. Информационной базой при построении всех упомянутых выше моделей являются данные бухгалтерской отчетности.

В распоряжении авторов были данные о финансовом состоянии 136 российских строительных предприятий, причем 68 из них - банкроты, а 68 - стабильно работающие предприятия1. На основе этой информации было сформировано четыре базы данных вида D = (xt, y ),i = 1, N, отличающиеся количеством экзогенных переменных {Xj}. Каждая база данных была случайным образом разбита на обучающее и тестовое множества. В обучающее множество входит 100 предприятий, в тестовое - 36.

Для изучения вопроса о влиянии аномальных наблюдений было сделано следующее: в каждой базе данных были выявлены аномальные вектор-строки по правилу (7). В среднем, количество аномальных наблюдений составляло 8-12 % от общего объема выборки. Аномальные наблюдения были принудительно включены в тестовые множества. При этом общее количество записей в обучающих и тестовых множествах осталось тем же самым - 100 и 36 строк соответственно. Перед обучением все данные были нормированы стандартным образом.

Построение нейросетевых моделей проводилось при помощи нейроэмулятора Neuro Solutions 4.0 (демоверсия). Для выбора наилучшей системы показателей была создана вспомогательная нейросеть следующей конфигурации: многослойный персептрон с пятью скрытыми слоями нейронов, акти-вационная функция в скрытых слоях - гиперболический тангенс, в выходном слое -линейная. Количество нейронов в скрытых слоях назначалось случайным образом: в первом слое - 8; во втором - 24; в третьем - 72; в четвертом - 36; в пятом - 6. При обучении использовался алгоритм с обратным распространением ошибки.

После обучения сети были протестированы на данных, которые не участвовали в обучении (36 предприятий). Результаты тестирования сетей представлены в табл. 2.

1 Данные бухгалтерской отчетности получены авторами из международной базы данных «Вигеиа VanDijk», а сведения о банкротстве получены по данным Высшего арбитражного суда РФ.

Таблица 3

Байесовский ансамбль нейросетей для системы показателей Недосекина

Таблица 2

Результаты тестирования вспомогательной нейросети для различных систем показателей

Система показателей Количество правильно распознанных предприятий Доля правильно распознанных предприятий Всего ошибок Ошибок 1-го рода Ошибок 2-го рода Кнк

Противоречивые данные не удалялись и участвовали в обучении нейросети

СП Недосекина 25 69,44 % 11 6 5 9,67

СП Рахимкуловой 25 69,44 % 11 10 1 9,00

СП Зайцевой 30 83,33 % 6 5 1 13,17

СП Альтмана 30 83,33 % 6 3 3 13,50

Противоречивые данные в обучении не участвовали, а вошли в тестовое множество

СП Недосекина 33 91,67 % 3 1 2 15,83

СП Рахимкуловой 32 88,89 % 4 2 2 15,00

СП Зайцевой 27 75,00 % 9 3 6 11,50

СП Альтмана 31 86,11 % 5 3 2 14,17

№ сети Количество скрытых слоев Оптимальное количество нейронов в скрытых слоях Вид активационной функции в скрытых слоях

НСМ1 1 12 Гиперболический тангенс

НСМ2 1 14 Гиперболический тангенс

НСМ3 2 11, 11 Гиперболический тангенс в обоих слоях

НСМ4 2 13, 14 Гиперболический тангенс в первом слое, сигмоид - во втором

НСМ5 2 13, 13 Гиперболический тангенс в обоих слоях

НСМ6 2 13, 14 Гиперболический тангенс в первом слое, сигмоид - во втором

НСМ7 3 13, 14, 10 Гиперболический тангенс в первом и третьем слое, сигмоид -во втором

НСМ8 3 13, 13, 11 Гиперболический тангенс во всех слоях

НСМ9 3 12, 12, 13 Гиперболический тангенс во всех слоях

НСМ10 3 10, 14, 15 Гиперболический тангенс во всех слоях

Оценка качества моделей проводилась по критерию (8). Анализ таблицы 2 показывает, что общее количество ошибок и ошибок 1-го рода заметно меньше в том случае, если аномальные наблюдения предварительно удалялись и не участвовали в обучении. Предположение о полезности аномальных

наблюдений в задачах классификации не подтвердилось.

Наилучший результат (наименьшее количество ошибок и наибольшее значение Кн = 15,83) был достигнут для системы показателей Недосекина, которая включает в себя 16 факторов. Близкие результаты были

Таблица 4

Результаты тестирования байесовского ансамбля нейросетей, обучавшихся на системе показателей Недосекина

№ сети Доля верно распознанных предприятий Всего ошибок Количество ошибок 1-го рода Количество ошибок 2-го рода

НСМ1 66,7 % 12 6 6 59,00

НСМ2 66,7 % 12 6 6 59,00

НСМ3 80,56 % 7 2 5 63,00

НСМ4 75,0 % 9 3 6 61,50

НСМ5 86,11 % 5 1 4 64,50

НСМ6 72,2 % 10 4 6 60,67

НСМ7 80,56 % 7 3 4 62,83

НСМ8 80,56 % 7 3 4 62,83

НСМ9 75,0 % 9 4 5 61,33

НСМ10 77,78 % 8 3 5 62,17

Среднее на отфильтрованном ансамбле 83,33 % 6 3 3 63,50

получены для системы показателей Рахимку-ловой, включающей в себя 10 факторов. Эти две системы показателей можно признать равноценными.

Далее, для каждой из выбранных систем показателей был создан ансамбль из 10 ней-росетевых моделей (далее - НСМ). Характеристики байесовского ансамбля для системы показателей Недосекина приведена в табл. 3. Оптимальное количество нейронов в скрытых слоях подбиралось путем предварительного обучения нейросетей.

Предварительные расчеты показали, что из всех видов активационных функций, доступных пользователю в нейроэмуляторе Neuro Solutions, функция гиперболического тангенса обеспечивает наилучшее качество обучения. Поэтому именно эта функция использовалась в большинстве нейросетей байесовского ансамбля. Оптимальное количество нейронов в скрытых слоях подбиралось

с использованием специальных возможностей программы Neuro Solutions.

Результаты тестирования нейросетей ансамбля приведены в табл. 4.

Фильтрация нейросетей проводилась по правилу (10). Был выбран уровень отбраковки h = 0,62. Таким образом, процедуру фильтрации прошли только 5 из 10 сетей байесовского ансамбля: НСМ3, НСМ5, НСМ7, НСМ8 и НСМ10. Для каждого предприятия, вошедшего в тестовое множество, было рассчитано среднее на отфильтрованном ансамбле значение отклика

- 1 Q л и = — ^ u. ,

Q if ',

(11)

где Q - количество гипотез-нейросетей, прошедших процедуру фильтрации. По правилу (4) была оценена вероятность банкротства. Результаты окончательной классификации отражены в последней строке табл. 4.

Таблица 5

Результаты тестирования байесовского ансамбля нейросетей, обучавшихся на системе показателей Рахимкуловой

№ сети Доля верно распознанных предприятий Всего ошибок Количество ошибок 1-го рода Количество ошибок 2-го рода

НСМ1 80,5 % 7 2 5 63,00

НСМ2 75 % 9 2 7 61,67

НСМ3 83,3 % 6 2 4 63,67

НСМ4 80,5 % 7 3 4 62,83

НСМ5 77,7 % 8 3 5 62,17

НСМ6 80,5 % 7 3 4 62,83

НСМ7 83,3 % 6 3 3 63,50

НСМ8 66,65 % 12 5 7 59,17

НСМ9 86,11 % 5 2 3 64,33

НСМ10 80,56 % 7 2 5 63,00

Среднее на отфильтрованном ансамбле 88,8 % 4 1 3 65,17

Как видно из таблицы, после операции осреднения (11) доля верно распознанных предприятий составила 83,3 % (30 из 36 предприятий тестового множества). Этот результат превосходит показатели каждой из нейросетей байесовского ансамбля в отдельности (кроме НСМ5). Таким образом, мы получили убедительное свидетельство эффективности байесовского подхода.

Результаты тестирования байесовского ансамбля нейросетей, обучавшихся на системе показателей Рахимкуловой, приведены в табл. 5. По своей структуре сети этого ансамбля мало отличаются от ансамбля сетей из табл. 3, поэтому подробно описывать их не будем.

Был выбран уровень отбраковки ц = 0,63. Процедуру фильтрации прошли следующие сети байесовского ансамбля: НСМ1, НСМ3, НСМ7, НСМ9 и НСМ10. В данном случае эффект от байесовского подхода проявляется еще ярче. Все показатели качества

диагностики, рассчитанные путем осреднения на отфильтрованном ансамбле, лучше показателей каждой нейросети в отдельности.

ВЫВОДЫ

Цели и задачи исследования достигнуты: предложен и апробирован в вычислительных экспериментах метод построения нейросетевой модели диагностики банкротств на основе байесовского подхода. В вычислительном эксперименте обоснована необходимость удаления из данных аномальных наблюдений. Получено убедительное свидетельство эффективности байесовского подхода при построении моделей диагностики банкротств с использованием интеллектуальных информационных технологий. Дальнейшие исследования будут посвящены развитию байесовской идеологии применительно к задачам данного класса, а также использованию нечетких методов классификации экономических объектов.

ЛИТЕРАТУРА

1. Горбатков С. А., Полупанов Д. В., Фархиева С. А., Коротнева М. В. Эконометрика. Под ред. С. А. Горбаткова.- Уфа: РИЦ БашГУ, 2012.- 204 с.

2. Горбатков С. А., Белолипцев И. И. Очистка данных наблюдений как процедура пред-регуляризации нейросетевой модели налогового контроля // Социальная ответственность бизнеса: теория, методология, практика: Материалы II Всероссийской научно-практической конференции.- Уфа: ВЗФЭИ, 2012.- С. 114-118.

3. Зайцева О. П. Антикризисный менеджмент в российской фирме // Аваль. (Сибирская финансовая школа).- 1998.- № 11-12.

4. Недосекин А. О. Методологические основы моделирования финансовой деятельности с использованием нечетко-множественных описаний: Дис. ... д-ра экон. наук: 05.13.10.-СПб., 2003.- 280 с.

5. Рахимкулова Г. З. Принятие управленческих решений при антикризисном управлении предприятием (на основе разработки модели потенциальной неплатежеспособности): Автореф. дис. ... канд. экон. наук: 05.13.10.- Уфа, 2009.- 21 с.

6. Савицкая Г. В. Анализ хозяйственной деятельности предприятия. - 3-е изд., перераб. и доп.- М.: ИНФРА-М, 2006.- 425 с.

7. Шеремет А. Д., Сайфулин Р. С., Негашев Е. В. Методика финансового анализа.- М.: ИНФРА-М, 2008.- 371 с.

8. Шмидт Ю. Д. Экспресс-диагностика кризисных ситуаций на предприятии промышленности // Проблемы прогнозирования.- 2007.- № 6.- С. 108-118.

9. Шумский С. А. Байесова регуляризация обучения // Научная сессия МИФИ 2002. IV Научно-техническая конференция «Нейроинформатика-2002»: Лекции по нейроинфор-матике. Часть 2.- М.: МИФИ, 2002.- С. 30-93.

10. Altman E. I. Financial ratios, discriminant analysis and the predittion of corporate bankruptcy. Journal of Finance, 1968, vol. 23 (4), pp. 589-609.

11. Beaver W. H. Financial Ratios as Predictors of Failure. Journal of Accounting Research, supplement, 1966, pp. 71-127.

12. Fulmer J., Moon J., Gavin T. and Erwin J. A bankruptcy classification model for small firms. The Journal of Commercial Bank Lending, 1984, vol. 66 (11), pp. 25-37.

13. Lin R. and Chuang C. Development of a Hybrid Case-Based Reasoning for Bankruptcy Prediction. In Proceedings of ICCSA (3), 2010, pp. 178-188.

14. Taffler R. Empirical models for the monitoring of UK corporations. Journal of Banking and Finance, 1984, vol. 8 (2), pp. 199-227.

REFERENCES

1. Gorbatkov S. A., Polupanov D. V., Farkhieva S. A., Korotneva M. V. Econometrics, edited by Gorbatkov S. A. Ufa, 2012. 204 pages (in Russian).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. Gorbatkov S. A., Beloliptsev 1.1. Cleaning observation data as a pre-regularization procedure of neural network model for tax control. Corporate social responsibility: theory, methodology, practice: Proceedings of Scientific and Practical Conference. Ufa, 2012, pp. 114-118 (in Russian).

3. Zaytseva O. P. Crisis Management in the Russian company.Aval (Siberian School of Finance), 1998, no. 11-12 (in Russian).

4. Nedosekin A. O. Methodological foundations of the financial modeling using fuzzy multiple descriptions, Thesis for the degree of Grand PhD in Economics 05.13.10, Saint Petersburg, 2003. 280 pages (in Russian).

5. Rakhimkulova G. Z. Management decision-making at the entreprise under crisis management conditions (based on the potential insolvency model), Thesis abstract for the degree of PhD: 05.13.10, Ufa, 2009 (in Russian).

6. Savitskaya G. V. Analysis of the enterprise economic performance. Moscow, 2006, 425 pages (in Russian).

7. Sheremet A. D., Sayfullin R. S., Negashev E. V. Methods of financial analysis. Moscow, 2008, 371 pages (in Russian).

8. Shmidt Y. D. Rapid crisis diagnostics at the industrial enterprise. Forecast Issues - Problemy prognozirovaniia, 2007, no. 6. Pp. 108-118 (in Russian).

9. Shumsky S. A. Bayesian training regularization. Scientific and Technical Conference «Neuroinformatics 2002»: Lectures on neuroinformatics. Part 2. MIFI, 2002, pp. 30-93 (in Russian).

10. Altman E. I. Financial ratios, discriminant analysis and the predittion of corporate bankruptcy. Journal of Finance, 1968, vol. 23 (4), pp. 589-609.

11. Beaver W. H. Financial Ratios as Predictors of Failure. Journal of Accounting Research, supplement, 1966 , pp. 71-127.

12. Fulmer J., Moon J., Gavin T. and Erwin J. A bankruptcy classification model for small firms. The Journal of Commercial Bank Lending, 1984, vol. 66 (11), pp. 25-37.

13. Lin R. and Chuang C. Development of a Hybrid Case-Based Reasoning for Bankruptcy Prediction. In Proceedings of ICCSA (3), 2010, pp. 178-188.

14. Taffler R. Empirical models for the monitoring of UK corporations. Journal of Banking and Finance, 1984, vol. 8 (2), pp. 199-227.

ЧИТАТЕЛЮ НА ЗАМЕТКУ

ПЕРЦЕПТРОН, или ПЕРСЕПТРОН (англ. регсер^оп от лат. регсер^о - восприятие; нем. регеер^оп) - математическая и компьютерная модель восприятия информации мозгом (кибернетическая модель мозга), предложенная Фрэнком Розенблаттом в 1957 г. и реализованная в виде электронной машины «Марк-1» в 1960 г. Перцептрон стал одной из первых моделей нейросетей, а «Марк-1» -первым в мире нейрокомпьютером. Несмотря на свою простоту, перцептрон способен обучаться и решать довольно сложные задачи.

На фоне роста популярности нейронных сетей, в 1969 г. вышла книга Мар-вина Минского и Сеймура Паперта, которая показала принципиальные ограничения перцептронов. Это привело к смещению интереса исследователей искусственного интеллекта в противоположную от нейросетей область символьных вычислений.

Впоследствии интерес к нейросетям, и в частности, работам Розенблатта, возобновился. Так, например, сейчас стремительно развивается биокомпьютинг, который в своей теоретической основе вычислений, в том числе, базируется на нейронных сетях.

i Надоели баннеры? Вы всегда можете отключить рекламу.