Научная статья на тему 'Использование аппарата искусственных нейронных сетей для оценки кредитоспособности юридических лиц'

Использование аппарата искусственных нейронных сетей для оценки кредитоспособности юридических лиц Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
139
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЙРОННЫЕ СЕТИ / КРЕДИТНЫЙ СКОРИНГ / КРЕДИТОСПОСОБНОСТЬ ЮРИДИЧЕСКИХ ЛИЦ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Михалченкова Екатерина Андреевна, Пучков Андрей Юрьевич

Авторы в данной статье провели исследование, доказывающее, что аппарат искусственных нейронных сетей является эффективным способом оценки кредитоспособности юридических лиц.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Михалченкова Екатерина Андреевна, Пучков Андрей Юрьевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Использование аппарата искусственных нейронных сетей для оценки кредитоспособности юридических лиц»

Литература

1. Тельнов Ю. Ф. Интеллектуальные информационные системы в экономике: Учебное пособие М: СИНТЕГ, 2002. 316 с.

2. Дубок С. А. Информационные системы в экономике: Учебный курс. [Электронный ресурс]: URL: http: //www.e-

college.ru/xbooks/xbook018/book/index/index. html?go=part-019*page.htm (дата обращения: 26.03.2016).

Использование аппарата искусственных нейронных сетей

для оценки кредитоспособности юридических лиц

1 2 Михалченкова Е. А. , Пучков А. Ю.

Михалченкова Екатерина Андреевна /Mikhalchenkova Ekaterina Andreevna - cmydeHm;

2Пучков Андрей Юрьевич /Puchkov Andrei Yurevich - кандидат технических наук, доцент, кафедра менеджмента и информационных технологий в экономике (МИТЭ), Филиал федерального государственного бюджетного образовательного учреждения Высшего образования Национальный исследовательский университет, г. Смоленск

Аннотация: авторы в данной статье провели исследование, доказывающее, что аппарат искусственных нейронных сетей является эффективным способом оценки кредитоспособности юридических лиц.

Ключевые слова: нейронные сети, кредитный скоринг, кредитоспособность юридических лиц.

Аппарат искусственных сетей представляет собой совокупность математических моделей (нейронных сетей), способных обучаться на массивах данных и с помощью этого решать задачи прикладного характера, будь то прогноз или классификация, с чем лучше всего справляется модель нейронной сети - многослойный персептрон.

Алгоритм проведенного исследования можно представить следующим образом:

1. Сбор статистической информации, характеризующей две группы заемщиков. В первую группу были включены заемщики, которые в той или иной степени отклонились от условий договора о займе, нарушив его пункты; во вторую группу -лица, в полной мере погасившие свои обязательства без каких - либо сложностей.

2. Выбор скоринговой модели, наиболее точно отражающей финансовую устойчивость предприятия.

3. Формирование обучающегося и тестового массивов. Выполнить предобработку данных, используя принцип «один из N».

4. Определение архитектуры нейронной сети: числа слоев и количества нейронов в них, вид нейронной (синоптической) связи.

5. Обучение нейросети выбранной архитектуры.

6. Определение оптимальной архитектуры нейросети, обеспечивающей наименьшую ошибку. Осуществление прогноза кредитоспособности.

Операции по обработке исходных данных и формированию массивов для нейронной сети были осуществлены в программе MS Excel с использованием арифметических функций, функций логики и условия. Полученные результаты представлены в таблице №1.

Предприя тия Значе ние функции У Z Интерпри тация

Х1 Х2 Х3 Х4 Х5 Х6

1 0,80064 2,68484 0,00097 0,88119 1,89106 0,35704 -2,54613 0,07269 Кр ед.

2 0,05235 2,49390 0,01426 0,41008 0,99717 2,83177 -1,01895 0,26523 Кр ед.

3 0,30114 2,91183 0,00977 0,16299 0,58747 0,57228 -3,06988 0,04437 Кр ед.

4 0,16384 0,52511 1,13864 0,03108 0,46258 3,83246 -10,83930 0,04437 Кр ед.

5 0,12270 5,72909 0,00229 0,36492 0,12822 0,37417 -2,72130 0,06173 Кр ед.

6 0,17588 2,94926 0,00511 0,15144 1,06611 -1,92098 0,12775 1,06611 Кр ед.

7 0,43610 9,41988 0,07697 0,36758 0,65547 -1,64052 0,16239 0,655547 Кр ед.

8 0,017588 3,83456 0,41404 0,28100 0,77616 -4,59071 0,01004 0,77616 Кр ед.

9 0,43610 8,53230 0,00966 0,64412 0,21252 -1,58159 0,17057 0,212521 Кр ед.

10 0,01751 8,42811 0,15833 0,87430 5,79969 -0,09400 0,46752 5,79969 Кр ед.

11 0,22338 2,15619 0,05306 0,65731 1,64107 -0,89449 0,29018 1,64107 Кр ед.

12 0,0361 3,22236 0,17166 1,11258 2,59547 1,24141 0,77581 2,59547 Не кр.

13 0,05236 3,08963 0,09864 1,05689 1,85694 2,08964 1,58580 0,832002 Не крд

14 0,07894 3,84597 0,21346 1,16247 2,67854 2,89453 1,11833 0,75368 Не кр.

15 0,02154 7,05783 0,08763 1,05973 1,10034 4,97861 1,26767 0,78034 Не кр.

16 0,07048 3,01768 0,03459 1,09427 0,32760 1,27907 2,00535 0,88136 Не кр.

17 0,04531 2,69873 0,03170 0,67014 0,76201 2,34901 0,1261 0,53163 Не кр.

Не

18 0.2760 2,30739 0,01643 0,75390 1,02490 2,72091 0,61975 0,65016

кр.

Не

19 0,02549 4,01590 0,12079 1,30591 1,86071 3,10591 2,55642 0,92800

кр.

Не

20 0,01509 3,80460 0,05971 1,60759 3,05790 1,76904 4,59687 0,990022

кр.

21 0,01095 2,89071 0,00947 0,067809 0,88097 2,40291 0,26260 0,56227 Не

кр.

22 0,90170 3,90971 0,01601 1,29056 0,45096 0,19070 3,43415 0,96875 Не

кр.

23 0,50794 3,06401 0,00195 0,95071 2,01950 0,50941 -2,80295 0,05717 Кр

ед.

24 0,79502 2,00129 0,00009 0,61097 1,05697 0,19531 -2,11361 0,10778 Кр

ед.

25 0,10091 1,05491 0,02098 0,21060 1,00491 1,20930 -5,64344 0,00353 Кр

ед.

26 0,03109 4,30980 0,05230 0,30184 0,32098 0,52971 -1,65883 0,15992 Кр

ед.

27 0,06971 2,70984 0,02594 0,70948 0,89460 2,50987 0,38091 0,59409 Не

кр.

28 0,05089 3,09531 0,092531 0,75014 0,21940 0,81091 0,15885 0,53963 Не

кр.

29 0,08388 1,86971 0,04109 0,086901 0,38094 1,34971 1,05620 0,74196 Не

кр.

30 0,2490 3,59409 0,00941 0,85091 0,14091 0,10801 1,50304 0,81803 Не

кр.

31 0,63031 2,39510 0,00075 0,72071 1,23109 0,21934 -2,29088 0,09188 Кр

ед.

32 0,35107 1,67301 0,00109 0,36107 0,67196 0,09107 -2,35662 0,08654 Кр

ед.

33 0,05819 8,30519 0,26109 0,98106 1,27910 4,37910 -0,35861 0,41130 Кр

ед.

34 0,10150 2,97019 0,01947 0,79179 0,98091 2,74091 0,38360 0,59474 Не

кр.

35 0,58109 1,34109 0,10951 0,38901 1,32901 1,47610 - 4,38274 0.01234 Кр

ед.

Вычислить функцию регрессии и выходной вектор - эталон обучающего множества (при уже рассчитанном входном массиве) можно, используя возможности среды MatLab, в обход MS Excel, задав алгоритм в командной строке или с помощью редактора M - йков. Основной код сети прописан в M - file.

С целью формирования массивов, обработанные исходные данные (табл.1) были разбиты на обучающую, в которую вошли предприятия с 1 - го по 22 - ое, и тестовую части - оставшиеся 13 предприятий.

В контексте решаемой задачи принцип «один из №> представляет собой простейший случай, так как компоненты вектора - эталона могут принимать лишь одно значение из двух возможных: «0» (предприятие кредитоспособно) или «1» (предприятие некредитоспособно). В конечном итоге обучающий вектор будет представлен в виде матрицы входных значений размерностью 6х22 (6 строк по числу входов ИНС -коэффициентов модели), а выходной вектор (вектор - эталон) 1Х22. Таким же преобразованиям подвергаются тестовый входной и выходной вектора [1; с. 12].

После построения входных массивов ИНС осуществляется выбор ее архитектуры. Оптимальное число слоев и нейронов (и не только данных параметров) определяется методом «проб и ошибок». В проведенном исследовании межнейронная синоптическая связь описывалась сигмодиальной функцией гиперболического тангенса. Данные зависимости разрешают использование обучающего алгоритма обратного распространения ошибки, позволяющего обучить в равной степени все слои. Условие его применения - дифференцируемость передаточной функции на всей числовой оси.

Дифференциация ИНС производилась различными способами. В процессе обучения архитектур осуществлялось сравнение результатов их работы на тестовом множестве из 13 предприятий. Изменению подвергались основные компоненты ИНС, касающиеся как ее структуры непосредственно, так и ее обучающего алгоритма. Оптимальные параметры архитектуры, касательно ее структуры, можно представить, как 1 скрытый слой и 1 выходной, 6 нейронов в скрытом (по числу входов сети) и 1 в выходном (по числу выходов). Эти значения были перенесены на все топологии.

Практически все архитектуры (исключения: № 9, 11, 14, 15, 20, 24, 27) нейронной сети безошибочно решили поставленную задачу, однако далеко не каждая - с абсолютной «уверенностью». Компоненты вектора - эталона имеют следующие значения: (0,0,0,0,1,1,1,1,0,0,0,1,0).

Практически идентичные компоненты данного вектора получили на выходе сети лишь в одном случае - у типа № 26, обучив ее с 4- го раза, что более чем достаточно, т.к. абсолютно идентичный исход чрезвычайно редкий. Кроме того, основная задача обучения - научить ИНС аппроксимировать и обобщать данные, а не добиваться абсолютно точного результата.

Для более детального сравнения сопоставим графические данные - скриншоты окна программы двух лучших вариантов архитектуры нейронной сети: тип № 26 и № 30.

Градиент на поверхности ошибок меньше в первом случае, который составил 1,78 е -11, тогда как во втором - 2,94е -07. Минимальная ошибка на валидационном множестве, являющаяся основным критерием успешного обучения и его остановки, в случае многократного последовательного увеличения, достигается также в первом случае (1,69е-12). Такой результат достигнут в обоих случаях за незначительное количество итераций (9 в первом случае против 19 во втором).

Ошибки на всех подмножествах падали без резких скачков как в сторону повышения, так и понижения, приблизительно с одинаковой динамикой. Однако больший и плавный спуск, так же, как и ритмичность наблюдается в первом случае (тип № 26).

Заключительный этап по оптимизации имеет место быть в случае, когда результат далек от эталонного и требуемая точность не достигнута. Однако уже созданная конфигурация сети решает поставленную задачу с завидной точностью. Тем не менее, в целях поиска путей оптимизации, имеющего прикладное значение и представляющие неподдельный интерес, реализуем данный этап, внеся изменения не в топологию сети, а в исходные данные - выходной вектор значений логистической функции, а приближенные: 0.1 и 0.9 вместо 0 и 1.

16

Выходной вектор тестового множества в результате корректировки стал иметь вид: (0.1,0.1,0.1,0.1,0.9,0.9,0.9,0.9,0.1,0.1,0.1,1001,0.9,0.1). Данный прогнозный результат лучше предыдущего и точность практически стопроцентная. Однако, несмотря на это, можно предположить, что способность к обобщению снизилась, так как ошибка на валидационном множестве в этом случае больше, чем раннее полученная (1.79е-08 против 1.69е-12), и наравне с этим произошло резкое отклонение функции ошибок от общей динамики на тестовом множестве.

Градиент ошибки обучения также, как и валидационная ошибка, в данном случае больше, чем до оптимизации, и ее колебания характеризовались увеличением ошибки [2; с. 289].

Таким образом, с одной стороны, результат на тестовом множестве стал лучше, однако основное свойство нейросетей - способность обобщать «опыт» на новые данные вполне могло «уйти в затмение» и причина тому примечательное свойство ИНС - их нелинейность. Поэтому нельзя со стопроцентной уверенностью утверждать, что найдена оптимальная конфигурация сети: вполне возможно, что есть иная, лучше моделирующая существующую зависимость.

Описанный метод скоринга позволяет оценить текущее состояние предприятия и предугадать его возможную динамику с высокой точностью, что подтверждается практикой и, как следствие, статистикой. Для более полного анализа и достижения нужного результата, следует использовать иные методы - нелинейные, одновременно учитывая динамику, ведь скоринговая модель - это статическая зависимость линейного типа.

Этот недочет устраняется аппаратом искусственных нейронных сетей, благодаря появлению новых видов передаточных функций.

Используя такой «тандем» можно добиться впечатляющих результатов. При комбинировании методов весомые недостатки каждого устраняются достоинствами другого. В ситуации, когда реализуешь тот же метод оценки, что и потенциальный инвестор или кредитор, становится в разы проще убедить партнера в обоюдовыгодном соглашении и будущем потенциале деловых отношений. Кредитная организация же, в свою очередь, сможет избежать увеличения «плохих активов» в своем кредитном портфеле, сохранив уровень доходности вложений, а возможно и увеличить, снизив при этом уровень риска.

Литература

1. Круглое В. В. Искусственные нейронные сети // Экономика и управление. - № 4. -2015. - С.12 - 18.

2. Хайкин, Саймон. Нейронные сети: полный курс, 2 - ое издание. - М: Издательский дом «Вильямс», 2006. - С. 1104.

i Надоели баннеры? Вы всегда можете отключить рекламу.