Научная статья на тему 'Многоступенчатый метод анализа и управления адекватностью нейросетевой модели прогнозирования банкротств на основе последовательного принципа Вальда'

Многоступенчатый метод анализа и управления адекватностью нейросетевой модели прогнозирования банкротств на основе последовательного принципа Вальда Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
291
79
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЙРОСЕТЬ / МОДЕЛЬ БАНКРОТСТВА / АДЕКВАТНОСТЬ / ПОСЛЕДОВАТЕЛЬНЫЙ ПРИНЦИП ВАЛЬДА / АГРЕГИРОВАНИЕ / КАСКАДНОЕ УСИЛЕНИЕ ПОЛОЖИТЕЛЬНОГО СВОЙСТВА АЛГОРИТМА / БАЙЕСОВА РЕГУЛЯРИЗАЦИЯ НЕЙРОСЕТЕВОЙ МОДЕЛИ / NEURAL NETWORK / A MODEL OF BANKRUPTCY / ADEQUACY / CONSISTENT WALD PRINCIPLE / THE AGGREGATION CASCADE AMPLIFICATION OF POSITIVE PROPERTIES OF THE ALGORITHM / BAYESIAN REGULARIZATION NEURAL NETWORK MODEL

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Горбатков Станислав Анатольевич, Бирюков Александр Николаевич, Касимова Лиана Ириковна

В статье рассмотрен актуальный в прикладном аспекте вопрос об оценке адекватности нейросетевой логистической модели диагностики и прогнозирования банкротства корпораций. Новизна предлагаемого подхода заключается в том, что на его основе появляется возможность не только оценивать адекватность нейосетевой модели, но и управлять ею на различных стадиях (этапах) последовательного алгоритма. В качестве теоретической основы предлагаемого метода использовано обобщение последовательного принципа Вальда организации схемы наблюдений и в более общем случае исследований, а также общесистемные законы агрегирования систем и каскадного принципа усиления положительного эффекта. Основная идея предлагаемого метода состоит в поэтапном алгоритме регуляризации модели и улучшения ее прогностических свойств во взаимосвязи с оценкой адекватности подмоделей на каждом этапе. Алгоритм имеет древовидную слоистую иерархическую структуру, в которой подмодели «вложены» друг в друга, т.е. выходы подмоделей верхнего слоя по иерархии (сверху-вниз) служат входами для подмоделей следующего за ним слоя. Основное эмерджентное свойство такой обобщенной математикоинформационной системы это создание каждой подмоделью предыдущего слоя по направлению преобразования информации предпосылок для обеспечения хорошего качества подмоделей нижеследующего слоя. В итоге на выходе обобщенной нейросетевой модели достигается приемлемый результат по адекватности в очень сложных условиях моделирования. В качестве концепции регуляризации обобщенной нейросетевой модели используется байесовский подход. Предложенный метод апробирован на реальных данных в экономике.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Горбатков Станислав Анатольевич, Бирюков Александр Николаевич, Касимова Лиана Ириковна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Multi-stage method of analysis and management the adequacy of the neural network model prediction of bankruptcy based on the successive principle Valda

The article describes the current in the applied aspect, the issue of assessing the adequacy of the logistic model neural network for diagnosis and prediction of corporate bankruptcy. The novelty of our approach lies in the fact that on its basis it becomes possible not only to assess the adequacy negoslavci model, but also to manage it at different stages (phases) of the sequential algorithm. As the theoretical basis of the proposed method used a consistent generalization of the Wald principle of the scheme observations and in the more General case studies, as well as common laws aggregation systems and cascading principle enhance the positive effect. The basic idea of proposed method consists in the gradual model regularization algorithm for improving its predictive properties in conjunction with the assessment of submodels adequacy at each stage. The algorithm has a complex hierarchical three structure in which the submodel “nested” into each other, i.e. output submodels top-level hierarchy (top-down) used as the entrance to the next submodels for them layers. The main emergent property of a generalized mathematical and information system is the creation of each submodel from the previous layer in the direction of transformation, the information prerequisites for a lower layers good quality of submodels. As the result, an acceptable result for output of the generalized model neural network on modeling adequacy in very difficult conditions could be achieved. Bayesian approach is used as the concept of a regularization neural network model. The proposed method was tested on real data in the economy.

Текст научной работы на тему «Многоступенчатый метод анализа и управления адекватностью нейросетевой модели прогнозирования банкротств на основе последовательного принципа Вальда»

Интернет-журнал «Науковедение» ISSN 2223-5167 http ://naukovedenie.ru/ Том 7, №4 (2015) http ://naukovedenie. ru/index.php?p=vol7-4 URL статьи: http://naukovedenie.ru/PDF/43EVN415.pdf DOI: 10.15862/43EVN415 (http://dx.doi.org/10.15862/43EVN415)

УДК 336.6

Горбатков Станислав Анатольевич

ФГБОУ ВПО «Финансовый университет при Правительстве Российской Федерации»

Филиал в г. Уфа1 Доктор технических наук, профессор E-mail: sgorbatkov@mail.ru

Бирюков Александр Николаевич

ФГБОУ ВПО «Башкирский государственный университет»

Филиал в г. Стерлитамак2 Доктор экономических наук, профессор E-mail: guzsa@ufamts.ru

Касимова Лиана Ириковна

ОАО «Сбербанк России» Стерлитамакское отделение №8598/0349

Россия, г. Стерлитамак3 ФГБОУ ВПО «Башкирский государственный университет»

Россия, г. Уфа Аспирант

E-mail: liankakasimva@yandex.ru

Многоступенчатый метод анализа и управления адекватностью нейросетевой модели прогнозирования банкротств на основе последовательного принципа Вальда

1 450000, Уфа, ул. Мустая Карима, 69/1

2 453103, Республика Башкортостан, г. Стерлитамак, пр. Ленина, д. 49

3 453120, Республика Башкортостан, г. Стерлитамак, ул. Караная Муратова, д. 4, кв. 39

Аннотация. В статье рассмотрен актуальный в прикладном аспекте вопрос об оценке адекватности нейросетевой логистической модели диагностики и прогнозирования банкротства корпораций. Новизна предлагаемого подхода заключается в том, что на его основе появляется возможность не только оценивать адекватность нейосетевой модели, но и управлять ею на различных стадиях (этапах) последовательного алгоритма. В качестве теоретической основы предлагаемого метода использовано обобщение последовательного принципа Вальда организации схемы наблюдений и в более общем случае - исследований, а также общесистемные законы агрегирования систем и каскадного принципа усиления положительного эффекта. Основная идея предлагаемого метода состоит в поэтапном алгоритме регуляризации модели и улучшения ее прогностических свойств во взаимосвязи с оценкой адекватности подмоделей на каждом этапе. Алгоритм имеет древовидную слоистую иерархическую структуру, в которой подмодели «вложены» друг в друга, т.е. выходы подмоделей верхнего слоя по иерархии (сверху-вниз) служат входами для подмоделей следующего за ним слоя. Основное эмерджентное свойство такой обобщенной математико-информационной системы - это создание каждой подмоделью предыдущего слоя по направлению преобразования информации предпосылок для обеспечения хорошего качества подмоделей нижеследующего слоя. В итоге на выходе обобщенной нейросетевой модели достигается приемлемый результат по адекватности в очень сложных условиях моделирования. В качестве концепции регуляризации обобщенной нейросетевой модели используется байесовский подход. Предложенный метод апробирован на реальных данных в экономике.

Ключевые слова: нейросеть; модель банкротства; адекватность; последовательный принцип Вальда; агрегирование; каскадное усиление положительного свойства алгоритма; байесова регуляризация нейросетевой модели.

Ссылка для цитирования этой статьи:

Горбатков С.А., Бирюков А.Н., Касимова Л.И. Многоступенчатый метод анализа и управления адекватностью нейросетевой модели прогнозирования банкротств на основе последовательного принципа Вальда // Интернет-журнал «НАУКОВЕДЕНИЕ» Том 7, №4 (2015) http://naukovedenie.ru/PDF/43EVN415.pdf (доступ свободный). Загл. с экрана. Яз. рус., англ. DOI: 10.15862/43EVN415

Введение

Данная статья посвящена вопросам нейросетевого моделирования риска банкротств корпораций. Предметом исследования является анализ и управление адекватностью нейросетевых логистических моделей банкротств. Нейросети являются универсальными аппроксиматорами и классификаторами [1], способными работать в условиях высокой априорной непараметрической неопределенности в данных, т.е. когда априори нельзя задать вид функции распределения шумов. Тем не менее, как показали исследования авторов статьи [2], существуют для каждого класса задач нейросетевого моделирования предельные уровни зашумленности данных, когда нейросеть теряет устойчивость и начинает аппроксимировать в большей степени шум, чем восстанавливаемые действительные зависимости. Поэтому интерес к вопросам обеспечения качества и адекватности нйросетевых моделей (НСМ) в последнее десятилетие нарастает [3].

До настоящего времени не исследована проблема оценки и управления адекватностью разрабатываемой нейросетевой модели типа многослойного персептрона (Multi Lauer Perseptron (MLP)). Суть проблемы заключается в следующем.

В классических моделях регрессионного анализа, получаемых с помощью метода наименьших квадратов (МНК) [4], оценка адекватности моделей не представляет трудностей - она сводится к проверке статистических гипотез о выполнении предпосылок МНК. В рассматриваемых условиях обработки данных и построения НСМ эти предпосылки заведомо нарушаются. Здесь и возникает непростая и практически неисследованная проблема оценки адекватности получаемой нелинейной многомерной НСМ, для решения которой авторы разработали оригинальный метод, основанный на принципе последовательного нейросетевого моделирования.

Истоки последовательного принципа организации схемы наблюдений берут начало из работ А. Вальда [5] и С.А. Айвазяна [6]. Изложим в сжатой форме суть этого принципа.

Как известно [6], построение статистического критерия y(w) = у(х^х2, ...,Xj, xw), где Xj - наблюдаемое в i-ом опыте значение анализируемого признака (фактора), для проверки гипотезы при условии фиксированного объема выборки N сводится к разбиению области возможных значений критической статистики у(№)на две: область I правдоподобных (в условиях проверяемой гипотезы Н0) и область II неправдоподобных значений y(w). При попадании конкретного (экспериментального) значения статистики у(х1,х2,...,xN) в область неправдоподобных значений принимается решение об отклонении проверяемой гипотезы Н0 и принятии противоположной гипотезы Н1 = Н0.

«Качество» анализируемого статистического критерия y(w) характеризуется уровнем значимости (вероятности ошибки первого рода) а, мощностью критерия (1 — ß), где ß -вероятность ошибки второго рода, свойствами несмещенности и состоятельности. Для состоятельных критериев можно добиваться сколь угодно малых величин а и ß лишь за счет увеличения объема выборки N, на основании которой принимается решение.

В классической схеме организации наблюдений, заранее не известно, достаточно ли фиксированное количество наблюдений N для различия интересующих нас гипотез Н0 и Н1 = Н0 с заданными характеристиками точности (a,ß).

Наряду с классической схемой наблюдения в практике статистических исследований применяются последовательные схемы наблюдений, при которых на каждом из последовательных во времени этапах наблюдения принимается одно из трех решений:

Интернет-журнал «НАУКОВЕДЕНИЕ» Том 7, №4 (июль - август 2015)

http://naukovedenie.ru publishing@naukovedenie.ru

• «принять основную гипотезу Н0», если конкретное (число) значение статистики у(х1,.,ху) попадает в область Г^ правдоподобных (в условиях справедливости Н0) значений критической статистики ур, где V - объем выборки априори не ограниченный;

• «отвергнуть гипотезу Н0», если конкретное числовое значение статистики у(х1,... ,ху) попадает в область Г^ неправдоподобных значений критической

V

статистики у,

• «окончательный вывод откладывается и проводится следующее (V + 1) — е наблюдение», если конкретное числовое значения статистики у(х1, ...,Ху) попадает в область Г„ сомнительных значений.

Последовательная схема организации наблюдений является более гибкой и экономичной по числу опытов V, необходимых для обеспечения заданного качества (а,Р) проверки, статистического критерия уу, по сравнению с классической схемой наблюдений, где V = N — фиксировано. Иногда удается сократить необходимое число опытов в 2-3 и даже в 4 раза [6].

В качестве конкретного примера последовательного критерия приведем широко известный критерий отношения правдоподобия Вальда [5], предназначенный для различия двух простых гипотез вида:

• «Н0: выборка извлечена из генеральной совокупности с законом распределения плотности вероятности ((X, в0);

• «Н1: выборка извлечена из генеральной совокупности с законом распределения §(Х, в1)», где в0, в1 - параметры закона распределения.

Критическая статистика этого критерия для последовательности независимых наблюдений х1, х2, ...,хь определяется отношением правдоподобия Вальда:

V

^((Х, в1)

. , 1(х.е<>)

1=1

Области правдоподобных Г^, неправдоподобных Г^, и сомнительных Г„, значений критической статистики Вальда уу по (1) (в условиях справедливости гипотезы Н0) задаются приближенно соотношениями:

ГН0 = ]у : у^ < 1п

1 — а)'

ГН1 = {у : Г™*^}; (2)

У

I Р 1—Р

Г*у = \у : < У(р) <1п

1 — а а

В статье при реализации последовательного принципа Вальда мы предлагаем рассматривать в качестве последовательных этапов исследования системы обработки данных алгоритмы построения подмоделей общей нейросетевой модели, которые организованны в иерархическую структуру (см. ниже Рис. 1). Другими словами, предлагается комплексная нейросетевая модель, построенная по принципу «матрешки»: подмодели вкладываются друг в друга (сверху-вниз на Рис. 1), что создает условия для многоступенчатой (иерархической) структуры метода оценки и управления адекватностью НСМ.

1. Постановка задачи

Пусть решается задача аппроксимации многомерных данных D в нейросетевом базисе:

У(х) = F(x, W); D = (уи щ), i = lJT, (3)

где у(х) - восстановленное НСМ значение моделируемой случайной величины Y; х -вектор экзогенных переменных (факторов); i - номер наблюдения; N - число примеров (кортежей) в данных D; F() - оператор нейросетевого отображения:

F: хеХп^уеХ(1). (4)

Здесь Хп, Х(1) - пространства вещественных чисел входа размерности п и выхода размерности 1; W - матрица синаптических весов нейросети [1].

Предполагаем, что читателю известен принцип работы MLP - нейросетей из [1], и сразу перейдем к описанию предлагаемого метода оценки и управления адекватности НСМ

(3), (4).

2. Формулировка концепции последовательного «вложения» как методологической основы предлагаемого метода

На основе общесистемных законов агрегирования и каскадного усиления [7] предложена концепция вложения подмоделей и соответствующих методов их построения по принципу «матрешки», суть которой состоит в том, что обобщенная нейросетевая модель сложной системы обработки данных синтезируется в виде древовидной иерархической структуры (Рис. 1) так, что выход моделей верхнего слоя по иерархии служит входом для модели следующего за ним (сверху-вниз) слоя. Основное эмерджентное свойство такой обобщенной математико-информационной системы - это создание каждой моделью предыдущего слоя по направлению преобразования информации предпосылок для обеспечения хорошего качества моделей последующих слоев таким образом, что на выходе обобщенной НСМ мы получаем приемлемый результат качества модели в очень сложных условиях моделирования.

Замечание. Поскольку модели слоев иерархической структуры взаимодействуют между собой, то в этой структуре имеет место агрегирование всех четырех типов, т.е. агрегаты -конфигураторы, агрегаты-операторы, агрегаты-структуры, агрегаты-статистики [8].

3. Описание алгоритма метода

Конкретизируем виды подмоделей по слоям т.е. в направлении преобразования информации (сверху-вниз на Рис. 1) и снабдим их краткими комментариями.

На Рис. 1 введены обозначения: {¡к} - совокупность систем показателей (/* — оптимальная по критерию Ф = Е • Б система показателей факторов); Г - номер отбракованных точек; ха, Хр - две близкие точки по выбранной норме ||-|| в пространстве Яп входа модели, которым соответствуют два значения уа, ур по норме Н в пространстве И1 выхода модели. Ьа,р - критерий Липшица, Ь0 - допустимый уровень константы Липшица, характеризующий растягивающие (либо сжимающие) свойства оператора объекта У(х); Е - ошибка обобщения нейросетевого отображения (3), (4); ^ - заданное малое число; 5 - показатель устойчивости нейросети [2]; - множество (байесовский ансамбль) априорных гипотез - НСМ;

Q- количество априорных гипотез; Ы^Ы - количество «хороших» (адекватно объясненных) точек тестового множества в п-ой НСМ при ее фильтрации и общее число тестовых точек

соответственно (количество точек N одинаково для всех фильтруемых сетей {hq})^; ш -допустимый уровень качества объяснения НСМ данных; в - критерии отбора системы экономических показателей (факторов).

Рис. 1. Структурная схема агрегирования подмоделей в комплексную НСМ

В слое 1 содержатся подмодели 1.1-1.5 предобработки данных. Применяемые в этом агрегате - конфигураторе языки описания:

• язык нейросетевых отображений;

• вероятностный язык байесовского подхода, т.е. язык субъективных вероятностей [6];

• язык математической статистики.

Подмодели слоя 1 повышают однородность и информативность данных и, следовательно, создают предпосылки для построения в нижестоящем по иерархии слое 2 НСМ хорошего качества. Достигаемый в слое 1 положительный эффект (эмерджентность) основан на основном признаке всех моделей этого слоя: предобработка данных производится не изолированно, а в объединенном пространстве размерности пХт входных и выходных сигналов нейросетей

(X е ип) и (У е ит) (5)

где и - логический знак объединения множеств, причем критерии предобработки данных в каждой подмодели слоя 1 подчинены критериям качества обобщения сетью данных для специально введенных вспомогательных нейросетевых субмоделей (НССМ); Яп, -пространства вещественных чисел размерностей п и т соответственно.

В слое 2 содержатся нейросетевые подмодели 2.2-2.3 байесовского ансамбля, которые служат для аппроксимации предобработанных данных. Здесь согласно основной парадигме регуляризации из [1, 9] происходит сужение множества искомых решений обратной задачи нахождения синаптических весов Ш нейросети. Применяемые в слое 2 агрегаты - это агрегаты-операторы в виде восстанавливаемых многомерных функций нейросетевых отображений вида (3), (4), и агрегаты-структуры в виде многослойных нейросетей. Достигаемый в слое 2 эмерджентный эффект - это регуляризация вспомогательных НССМ на байесовских ансамблях за счет механизмов их фильтрации по качеству аппроксимации данных и затем усреднения этого качества на НССМ, отфильтрованного ансамбля.

В подмоделях слоя 3 вычисляются выходные характеристики, необходимые для анализа моделируемого объекта или системы и поддержки разработки управленческих решений. Новизна этих моделей обусловлена новизной НСМ из слоя 2. Достигаемый эмерджентный эффект состоит в увеличении объективности достоверности разрабатываемых управленческих решений.

Замечание. Определяемые в слое 3 выходные (финишные) характеристики финансового объекта, помимо своей прикладной функции для принятия управленческих решений, нужны также в слое 4 как неотъемлемая часть алгоритма оценки адекватности всей НСМ.

Наконец, в подмоделях слоя 4 с использованием выходных характеристик моделируемого объекта производится оценка адекватности обобщенной (гибридной НСМ), получаемой по МВММ из [2]. Естественно, методы получения указанных оценок различны для различных прикладных задач. Общий положительный эффект (эмерджентность) для подмодели 4 обусловлен предложенным многоступенчатым методом контроля качества преобразования информации на всех ступеням (слоях) обобщенной НСМ. Другими словами оценка адекватности обобщенной НСМ носит интегральный (финишный) характер, т.е. она вбирает в себя положительные и отрицательные моменты всех предшествующих (сверху вниз на схеме Рис. 1) алгоритмов. Как правило, при этом происходит сглаживание исходных погрешностей данных, поскольку преобразование содержит в слоях 1,2 и 3 операторы

усреднения, интегрирования, сокращения длины описания данных, регуляризации, которые уменьшают ошибки моделирования.

Дальнейшая детализация алгоритмов подмоделей уже выходит за границы объемы статьи, ее можно найти в [2] применительно к экономическим системам.

4. Результаты количественных оценок

Ниже приведены фрагменты количественных оценок эмерджентных эффектов, достигаемых в подмоделях слоев 1,2 и 3 многоступенчатого алгоритма оценки адекватности НСМ (Рис. 1). Полное описание результатов расчетов далеко выходят за рамки данной статьи.

Для слоя 1 в подмодели 1.1 производился выбор оптимальной системы экономических показателей (факторов) для построения комплексной НСМ диагностики банкротств. Базовой (стартовой) системой показателей служила публичная бухгалтерская отчетность для строительных организаций из [10]. В распоряжении авторов были данные о финансовом состоянии 136 российских строительных предприятий, причем 68 из них были банкротами , а 68 - стабильно работающие предприятия. На основе этой информации было сформировано 4 системы показателей (СП), которые используются в большинстве известных моделей диагностики банкротств: в пятифакторной модели Альтмана, моделях Недосекина, Зайцевой и Рахимкуловой и другими краткий обзор которых можно найти в [11]. Указанные модели отличаются количеством факторов {ху), в качестве которых используются относительные величины, характеризующие финансовое состояние предприятия.

Согласно (3) в задаче диагностики банкротств зависимая переменная Р может принимать непрерывные возможные значения в интервале [0; 1]. Границы интервала соответствуют двум возможным состояниям изучаемых объектов: «банкрот» или «не банкрот». Моделируемая величина у(х) выбиралась так, чтобы при заданных значениях факторов XI = (хц,х^2, ...,Х1П), предприятие с номером / идентифицировалось по вероятности Р по степени близости к банкротству:

1

Р(у1 = т)=^^-];и = у(х);т = 0;1. (6)

Значение аргумента и в обучающих примерах известны. Если в исходной базе данных У1 = 1, это означает, что Р(у^ = 1)=1 при и « 7. А если у1 = 0, то Р(у^ = 0)=0 при и « —7.

В задачах диагностики банкротств возможны два вида ошибок. Если предприятие -банкрот было классифицировано как надежное, то это ошибка второго рода («пропуск цели по терминологии радиолокации), если наоборот, надежное предприятие было определено как банкрот, то это ошибка первого рода («ложная тревога»). В большинстве случаев, гораздо опаснее ошибки второго рода (например, лучше отказать в займе надежному заемщику, чем выдать кредит потенциальному банкроту). Для окончательной оценки качества нейросетевых моделей используется следующий показатель:

Кнк = (ЧкГ1 — N^2 — ^кг3), (7)

где - количество верно идентифицированных предприятий для метагипотезы Нк; - количество ошибок 2-го рода; - количество ошибок 1-го рода, г1,г2,г3 - удельный вес каждого показателя. Веса г1,г2, г3 назначаются согласно правилу Фишберна [11]:

2(п-1 + 1)

1 (п+1)п '

где п - количество ранжируемых параметров.

(8)

Для выбора наилучшей системы показателей по (7) была создана вспомогательная нейросеть типа многослойный персептрон с пятью скрытыми слоями нейронов, активационная функция в скрытых слоях - гиперболический тангенс. Каждая база данных была случайным образом разбита на обучающее и тестовое множества. В обучающее множество входило 100 предприятий, в тестовое -36. Перед обучением нейросети из данных были удалены аномальные наблюдения по следующему правилу: вектор-строка {х^у^ признается аномальной, если хотя бы один компонент вектора х^ нарушает правило «трех сигм», т.е. не выполняет условие:

х1] е [х] - 3ах.; х) + 3ах. ]. (9)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Аномальные наблюдения не участвовали в обучении нейросети , но включались в тестовое множество для оценки качества обучения. Результаты тестирования всех СП приведены в таблице 1.

Таблицы 1

Результаты тестирования вспомогательной нейросети

Система показателей Доля верно распознанных предприятий Всего ошибок Ошибки 2-го рода Ошибки 1-го рода

СП Недосекина 91,67% 3 1 2 15,83

СП Рахимкуловой 88,89% 4 2 2 15,00

СП Зайцевой 75,00% 9 3 6 11,50

СП Альтмана 86,11% 5 3 2 14,17

Наилучший результат (наибольшее значение КНк = 15,83) был достигнут для системы показателей Недосекина [11].

Таким образом, в алгоритме 1.1 на Рис. 1 достигнуто улучшение системы ключевых экономических показателей по критерию (7), характеризующего прогностическую силу логистической модели банкротства (6), где показатель экспоненты и(х) вычисляется НСМ вида (3), (4), т.е. с учетом нелинейной зависимости функции и от векторного аргумента х. При этом доля верно диагностированных предприятий увеличилась с 75% до 91,67%. Это и есть эмерджентное свойство подмодели 1.1. Свой вклад в улучшение комплексной НСМ внесли также подмодели 1.2, 1.3, 1.4 и 1.5.

Далее приведем фрагменты оценок для подмоделей слоя, назначением которых является регуляризация НСМ на байесовском ансамбле. Для выбранной системы показателей {¡¡¡}, был создан ансамбль из 10 гипотез-нейросетей типа MLP, отличающихся количеством скрытых слоев, видом активационных функций и количеством нейронов в скрытых слоях. Результаты тестирования нейросетей ансамбля приведены в таблице 2.

Таблица 2

Результаты тестирования ансамбля нейросетей

Доля верно Количество Количество

№ сети в ансамбле распознанных предприятий Всего ошибок ошибок 1-го рода ошибок 2-го рода Kq по (7)

НСМ1 66,7% 12 6 6 59,00

НСМ2 66,7% 12 6 6 59,00

НСМ3 80,56% 7 2 5 63,00

НСМ4 75,0% 9 3 6 61,50

НСМ5 86,11% 5 1 4 64,50

НСМ6 72,2% 10 4 6 60,67

НСМ7 80,56% 7 3 4 62,83

НСМ8 80,56% 7 3 4 62,83

НСМ9 75,0% 9 4 5 61,33

НСМ10 77,78% 8 3 5 62,17

Среднее 83,33% 6 3 3 63,50

Фильтрация нейросетей проводилась по правилу: критерий качества обучения (7) должен быть не менее заданного значения, выраженного в процентах:

> ч, % (10)

где ^ - экспертно задаваемое значение. Был выбран уровень отбраковки ^ = 62%. Таким образом, процедуру фильтрации прошли только 5 из 10 сетей байесовского ансамбля: НСМ3, НСМ5, НСМ 7, НСМ8 и НСМ10.

После апостериорной фильтрации ансамбля восстанавливаемая многомерная зависимость и(Х, I) осредняются (прямым или взвешенным способом) на отфильтрованном ансамбле нейросетей:

[i Qq:=1uq<t0)] U\t=t0=-Q*-, (11)

где Q* - количество нейросетей на отфильтрованном ансамбле; q* - номер НСМ «одобренной» по итогам фильтрации; (t0) - последний временной срез наблюдений.

Как видно из таблицы 2, качество идентификаций «банкротов» и «небанкротов» у разных нейросетей отличается. Поэтому при составлении окончательной классификации предприятий в (11) были введены весовые коэффициенты Cq*, учитывающие качество каждой НСМ:

[lQq*=1uq*Cq*] к

u = —тт*—; сч* = —лг^ (12)

Q max(Ka*)

q*

Доля верно распознанных предприятий составила 83,3% (30 из 36 предприятий тестового множества). Этот результат превосходит показатели каждой из нейросетей байесовского ансамбля в отдельности (кроме НСМ5).

Таким образом, изложенной байесовский алгоритм содержит три механизма регуляризации за счет последовательного сужения класса искомых решений и(х):

• априорного выбора гипотез-нейросетей {hq}, q = 1,Q байесовского ансамбля из фиксированного класса нейросетей (мета-гипотез), например MLP или RBF -сетей [1];

• апостериорной фильтрации после обучения гипотез-нейросетей по критерию качества аппроксимации согласно (10);

• усреднения расчетных характеристик отфильтрованного ансамбля по (11), (12).

Количественные оценки по апробации байесовского алгоритма регуляризации на основе реальных данных предприятий строительной отрасли из [10] (Международная база данных «Bareua Van Diyk» подтвердили его идею.

Выводы:

1. На основе последовательного принципа Вальда, а также общесистемных законов агрегирования и каскадного усиления полезного свойства системы разработан метод последовательно анализа и управления адекватностью нейросетевой модели диагностики и прогнозирования банкротств.

2. Вычислительные эксперименты на реальных данных строительных организаций подтвердили правильность основных сформулированных идей.

3. Предложенный метод тесно связан с проблемой регуляризации нейросетевых моделей для трудноформализируемых систем со сложными условиями моделирования (априорная непараметрическая неопределенность в данных, их нечеткость, неполнота), подробно рассмотренной в других работах авторов.

4. Направлением дальнейших исследований является разработка практической методики отбора факторов для нейросетевой модели, содержащей как количественные так и качественные показатели.

ЛИТЕРАТУРА

1. Хайкин С. Нейронные сети: полный курс: Монография / Пер. с англ., 2-е издание. - М.: Издательский дом «Вильямс» 2006. -1104 с.

2. Горбатков С.А., Полупанов Д.В., Макеева Е.Ю., Бирюков А.Н. Методологические основы разработки нейросетевых моделей экономических объектов в условиях неопределенности: Монография. - М.: Издательский дом «Экономическая газета», 2012. - 494 с.

3. Галушкин А.И. Нейрокомпьютеры и их применение на рубеже тысячелетий в Китае: Монография / В двух томах. Том 2. - М.: Горячая линия - Телеком, 2004. - 464 с.

4. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики: Учебник для вузов. - М.: ЮНИТИ, 1998. - 1022 с.

5. Вальд А. Последовательный анализ: Монография / Перевод с англ. - М.: Физматиз, 1960. - 320 с.

6. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Основы моделирования и первичная обработка данных: Справочное издание. - М.: Финансы и статистика, 1983. - 471 с.

7. Прангишвили И.И. Системный анализ и общесистемные закономерности: Монография. М.: СИНТЕГ, 2000. - 525 с.

8. Перегудов Ф.И., Тарасенко Ф.П. Введение в системный анализ: Учебное пособие для вузов. - М.; Высшая школа, 1989. - 367 с.

9. Шумский А.С. Байесова регуляризация обучения // Лекции для школы семинара «Современные проблемы нейроинформатики» (23-25 января 2002 г.). - М.: МИФИ, 2002 (Ше/ШейроОКИнтесофт.ЬШ). - 33 с.

10. Горбатков С.А., Белолипцев И.И., Макеева Е.Ю. Выбор системы экономических для диагностики и прогнозирования банкротства на основе нейросетевого байесовского подхода // Известия Финансового университета при Правительстве РФ. 2013. - №4. - С. 50-61.

11. Недосекин А.О. Методологические основы моделирования финансовой деятельности с использованием нечетко-множественных описаний: диссертация доктора экономических наук: 05.13.10. - С. Петербург, - 2003. - 280 с.

Рецензент: Макарова Елена Анатольевна, доктор технических наук, доцент, профессор кафедры «Технической кибернетики» ФГОУ «Уфимский государственный авиационный технический университет».

Gorbatkov Stanislav Anatolevich

Financial University under the Government of the Russian Federation, Ufa branch

Russia, Ufa E-mail: sgorbatkov@mail.ru

Biryukov Aleksandr Nikolaevich

Bashkir State University, Sterlitamak branch

Russia, Sterlitamak E-mail: guzsa@ufamts.ru

Kasimova Liana Irikovna

Sberbank of Russia, Sterlitamak branch №8598/0349

Russia, Sterlitamak Aspirant Baskir State University Russia, Ufa E-mail: liankakasimva@yandex.ru

Multi-stage method of analysis and management the adequacy of the neural network model prediction of bankruptcy based on the successive principle Valda

Abstract. The article describes the current in the applied aspect, the issue of assessing the adequacy of the logistic model neural network for diagnosis and prediction of corporate bankruptcy. The novelty of our approach lies in the fact that on its basis it becomes possible not only to assess the adequacy negoslavci model, but also to manage it at different stages (phases) of the sequential algorithm. As the theoretical basis of the proposed method used a consistent generalization of the Wald principle of the scheme observations and in the more General case - studies, as well as common laws aggregation systems and cascading principle enhance the positive effect. The basic idea of proposed method consists in the gradual model regularization algorithm for improving its predictive properties in conjunction with the assessment of submodels adequacy at each stage. The algorithm has a complex hierarchical three structure in which the submodel "nested" into each other, i.e. output submodels top-level hierarchy (top-down) used as the entrance to the next submodels for them layers. The main emergent property of a generalized mathematical and information system is the creation of each submodel from the previous layer in the direction of transformation, the information prerequisites for a lower layers good quality of submodels. As the result, an acceptable result for output of the generalized model neural network on modeling adequacy in very difficult conditions could be achieved. Bayesian approach is used as the concept of a regularization neural network model. The proposed method was tested on real data in the economy.

Keywords: neural network; a model of bankruptcy; adequacy; consistent Wald principle; the aggregation cascade amplification of positive properties of the algorithm; Bayesian regularization neural network model.

REFERENCES

1. Khaykin S. Neyronnye seti: polnyy kurs: Monografiya / Per. s angl., 2-e izdanie. - M.: Izdatel'skiy dom «Vil'yams» 2006. -1104 s.

2. Gorbatkov S.A., Polupanov D.V., Makeeva E.Yu., Biryukov A.N. Metodologicheskie osnovy razrabotki neyrosetevykh modeley ekonomicheskikh ob"ektov v usloviyakh neopredelennosti: Monografiya. - M.: Izdatel'skiy dom «Ekonomicheskaya gazeta»,

2012. - 494 s.

3. Galushkin A.I. Neyrokomp'yutery i ikh primenenie na rubezhe tysyacheletiy v Kitae: Monografiya / V dvukh tomakh. Tom 2. - M.: Goryachaya liniya - Telekom, 2004. -464 s.

4. Ayvazyan S.A., Mkhitaryan V.S. Prikladnaya statistika i osnovy ekonometriki: Uchebnik dlya vuzov. - M.: YuNITI, 1998. - 1022 s.

5. Val'd A. Posledovatel'nyy analiz: Monografiya / Perevod s angl. - M.: Fizmatiz, 1960. - 320 s.

6. Ayvazyan S.A., Enyukov I.S., Meshalkin L.D. Prikladnaya statistika: Osnovy modelirovaniya i pervichnaya obrabotka dannykh: Spravochnoe izdanie. - M.: Finansy i statistika, 1983. - 471 s.

7. Prangishvili I.I. Sistemnyy analiz i obshchesistemnye zakonomernosti: Monografiya. M.: SINTEG, 2000. - 525 s.

8. Peregudov F.I., Tarasenko F.P. Vvedenie v sistemnyy analiz: Uchebnoe posobie dlya vuzov. - M.; Vysshaya shkola, 1989. - 367 s.

9. Shumskiy A.S. Bayesova regulyarizatsiya obucheniya // Lektsii dlya shkoly seminara «Sovremennye problemy neyroinformatiki» (23-25 yanvarya 2002 g.). - M.: MIFI, 2002 (file//NeyroOKIntesoft.htm). - 33 s.

10. Gorbatkov S.A., Beloliptsev I.I., Makeeva E.Yu. Vybor sistemy ekonomicheskikh dlya diagnostiki i prognozirovaniya bankrotstva na osnove neyrosetevogo bayesovskogo podkhoda // Izvestiya Finansovogo universiteta pri Pravitel'stve RF.

2013. - №4. - S. 50-61.

11. Nedosekin A.O. Metodologicheskie osnovy modelirovaniya finansovoy deyatel'nosti s ispol'zovaniem nechetko-mnozhestvennykh opisaniy: dissertatsiya doktora ekonomicheskikh nauk: 05.13.10. - S. Peterburg, - 2003. - 280 s.

i Надоели баннеры? Вы всегда можете отключить рекламу.