Научная статья на тему 'НЕЙРОННЫЕ СЕТИ В ОБУЧЕНИИ СКОРИНГОВЫХ СИСТЕМ'

НЕЙРОННЫЕ СЕТИ В ОБУЧЕНИИ СКОРИНГОВЫХ СИСТЕМ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
31
17
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЙРОННЫЕ СЕТИ / СКОРИНГ / ОБУЧЕНИЕ / КРЕДИТОСПОСОБНОСТЬ / БАНК

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Артюшкина Е.С., Захарова О.И.

Статья посвящена ознакомлению с принципами работы программы STATISTICA NEURAL NETWORKS, а также проведение оценки кредитоспособности физических лиц с помощью нейронных систем.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

NEURAL NETWORK TRAINING SCORING SYSTEMS

The article is devoted to familiarization with the principles of the program STATISTICA NEURAL NETWORKS, and assessing the creditworthiness of individuals by using of neural systems.

Текст научной работы на тему «НЕЙРОННЫЕ СЕТИ В ОБУЧЕНИИ СКОРИНГОВЫХ СИСТЕМ»

ИНФОРМАЦИОННЫЕ И КОММУНИКАТИВНЫЕ

ТЕХНОЛОГИИ

УДК 336.77.

Артюшкина Е.С. студент 2 курса

факультет «Информационных систем и технологий»

Захарова О.И., к. техн. н.

доцент

кафедра «Информационные системы и технологии» Поволжский государственный университет телекоммуникаций и

информатики Россия, г. Самара НЕЙРОННЫЕ СЕТИ В ОБУЧЕНИИ СКОРИНГОВЫХ СИСТЕМ Статья посвящена ознакомлению с принципами работы программы STATISTICA NEURAL NETWORKS, а также проведение оценки кредитоспособности физических лиц с помощью нейронных систем.

Ключевые слова: нейронные сети, скоринг, обучение, кредитоспособность, банк.

Artyushkina E. S.

student

2 course, faculty "Information systems and technologies" Povolzhskiy state University of telecommunications and Informatics

Russia, Samara

Zakharova O. I., candidate of technical Sciences, associate Professor associate Professor of the Department "Information systems and technologies" Povolzhskiy state University of telecommunications and Informatics

Russia, Samara NEURAL NETWORK TRAINING SCORING SYSTEMS The article is devoted to familiarization with the principles of the program STATISTICA NEURAL NETWORKS, and assessing the creditworthiness of individuals by using of neural systems.

Key words: neural networks, scoring, training, creditworthiness, Bank. Уже несколько лет мы наблюдаем очень бурный интерес к нейронным сетям, они успешно применяются в различных областях, таких как: бизнес, медицина, техника, физика и т.д. Нейронные сети используются в практике почти везде, где нужно решать задачи прогнозирования, классификации или управления.

Для улучшения существующих сетей требуется много работы. Должны быть развиты новые технологии, улучшены существующие методы и расширены теоретические основы, прежде чем данная область сможет

полностью реализовать свои потенциальные возможности.

В современном обществе деятельность кредитных учреждений обширна. Банки занимаются различными видами операций, но самая главная это кредитование. Развитие кредитования проходит в условиях жесткой продуктовой и ценовой конкуренции основных участников рынка, что неизбежно ведет к снижению доходности данного направления банковского бизнеса. В этой ситуации качество управления кредитными рисками приобретает огромное значение.

Существует возможность возникновения ситуации, когда различные модели оценки вероятности банкротства, одновременно указывают на разные классы кредитоспособности одного заемщика и сотруднику банка приходится принимать решение о присвоении рейтинга кредитоспособности клиента на основе противоречивых данных [1].

Таким образом, сотрудникам банка бывает тяжело охарактеризовать окончательную кредитоспособность заемщика, которая является базой для определения условий кредитной сделки.

Актуальность данной работы обусловлена необходимостью дальнейшего совершенствования математических и инструментальных средств управления кредитными рисками, направленных на оптимальное распределение финансовых ресурсов банков с помощью скоринг-систем.

Исследование было направлено на ознакомление с принципами работы программы STATISTICA 8 Neural Networks, а также проведение оценки кредитоспособности физических лиц с помощью нейронных сетей.

Основными этапами исследования являлись:

1. Изучение понятия «скоринг».

2. Изучение программы STATISTICA 8 Neural Networks, её возможностей для решения задач классификации.

3. Тестирование программы STATISTICA 8 Neural Networks для обработки информации, связанной с процессом оценки кредитоспособности.

Для выбора кредитоспособных заемщиков можно использовать автоматизированные скоринговые системы.

Скоринг - это математическая (статистическая) модель, с помощью которой на базе кредитной истории уже имеющихся клиентов банк определяет, насколько велика вероятность, что тот или иной клиент вернет кредит в назначенный срок. Если в ходе этого процесса заемщик не набирает строго определенного количества баллов, то в получении кредита ему отказывают [2].

Скоринг осуществляется в основном автоматически при оформлении кредита в различных кредитных организациях.

Основные типы скоринга, применяемые в российской банковской практике:

- аррНсайоп-скоринг - оценка кредитоспособности гражданина для получения кредита;

- fraud-скоринг - оценка вероятности мошенничества потенциального заемщика;

- collection-скоринг - механизм работы с просроченной задолженностью

[3].

Скоринг представляет собой классификационную задачу: исходя из имеющейся информации, необходимо получить функцию, наиболее точно разделяющую выборку клиентов на «плохих» и «хороших».

STATISTICA 8 Neural Networks (SNN). STATISTICA - это интегрированная система, предназначенная для статистического анализа и обработки данных. Это программное обеспечение является полнофункциональной, мощной и быстрой средой анализа нейросетевых моделей, соответствует наиболее современным требованиям, с автоматическим обучением и сравнением качества обучения, и технологиям в сфере работы с нейронными сетями. Эта система предоставляет огромное количество уникальных возможностей для разработки скоринговых моделей, в том числе для ипотечного кредитования клиентов или оценка кредитоспособности физических лиц [4].

Работа с программой SNN осуществляется по следующему алгоритму. Чтобы начать работу, в меню «Пуск/Все программы» необходимо запустить

программу И STATISTICA Далее выбирается File/New... (Рисунок 1).

Рисунок 1- Запуск программы Statistica В окне «Create New Document» задается количество столбцов и строк в создаваемой таблице. В рамках исследования было рассмотренно 13 столбцов (12 входных и 1 выходная переменные) и 50 строк (случаев), (Рисунок 2). Далее нажимается кнопка «Ок».

Рисунок 2- Выбор количества переменных и случаев Созданная таблица, состоит из 13 переменных и 50 случаев (Рисунок

Она Spre«nhe*U- II». by lWc

* I 1 ъ i f 1 | IB 11 ii и

Уж! у*г у»? Vtt4 Virt Vni VmT Vl4 Vurt V«i1t Vjfll v»ii; y»n

1 1114 1 4 1 t i 4 С

t 1 2 1 1 в

t i 1 4 1 4 ) A

4 < 4 1 1 } I 1 2 С

| ) » 4 2 1 1 2 1 1 ' 4 ) С 1 в

| 1 ; 4 J 4 4 7 4 А

$ } 2 4 1 J ! 2 1 ] С

t 2 4 1 1 1 J t 2 В

10 Г 1 ) 1 } } 4 \ А

11 2 1 1 1 4 1 1 t 2 1A

Рисунок 3- Таблица переменных и случаев Возможности данной системы позволяют проводить конструирование и

обучение нейронной сети.

Для этого необходимо выбрать на панели задач вкладку Statistics/Automated Neural Networks (Рисунок 4).

В "> С а Ч ' Statistica 64 - [Da

Home Edit View Format Statistics Data Mining Graphs Tools Data gjj 0 Advanced Models' tj Neural Nets

Рисунок 4- Вкладка Neural Nets Далее задаются следующие необходимые настройки. В открывшемся окне «SANN - Analysis/Deployment» для анализа данных задается тип

Рисунок 5 - Выбор типа решаемой задачи В следующем окне «SANN - Data selection» осуществляется переход на вкладку Variables, для указания входных и выходных переменных (Рисунок 6)

Рисунок 6- Значение входных и выходных параметров В «Select variables for analysis» выделяется один выходной параметр (13-й столбец) и 12 входных параметров (1-12 столбцы), т.к. все входные параметры являются числовыми, они выделяются как Continuous inputs (Рисунок 7).

0

Select variables for analysis

2-Var2 Л 1 Varl Л

3-Var3 2 Var2

4-Var4 3 Var3

5-Var5 4 Var4

6-VarS 5 VarS

7-Var7 Б Var6

S - VarS 7 Var7

9-Var9 8 VarS

10- Varl D Э Var9

11 - Varl 1 1D - Varl D

12-Var12 11 - Varl 1

13 ■ Varl 3 V 12 ■Varl 2 V

1 - Varl Л

2 - Var2

3 - Var3

4 - Var4

5-Var5

G-VarS

7 - Var7

8-VarS

9 - Var9

1D - Varl D

11 - Varl 1

12-Var12 V

OK

Spread Zoom Spread Zoom Spread Zoom

Categorical target Continuous inputs Categorical inputs

13 1-12

Cancel

Q Bundles ]...

Use the "Show appropriate variables only-option to pre-E-creen variable lists and show categorical and continuous variables. Press F1 for more information.

I I Show appropriate variables only

Рисунок 7- Выделение параметров В окне «SANN - Automated Network Search» указывается количество сетей, которые будут построены, и количество сохраняемых сетей. По умолчанию программа строит 20 сетей и оставляет 5 лучших (Рисунок 8).

Рисунок 8 - Количество сетей В работе производилось обучение нейронной сети по кредитополучателям, исход деловых отношений с которыми известен. Для этого после задания всех нужных настроек, отмечалось нажатием «Train», и программа строила методом перебора оптимальную топологию нейронной сети и проводила её обучение на нашей выборке.

В результате этапа обучения было построено 5 НС, из них выбрана наилучшая по ошибке верификации. В следующем окне рассматривались результаты, и была сохранена нейронная сеть для дальнейшего тестирования или переобучения. После сохранения сеть можно будет использовать для определения кредитоспособности новых клиентов (Рисунок 9).

1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

SANN - Results: Spreadsheet2

Active neural networks

Net. ID Net. name Training perf. Test perf. Validation perf. AJ g ci nth m Brorfunct Л

1 MLP 12-6-3 66,666667 100,000... 100,000000 BFGS 0 CE

2 MLP 12-7-3 77,777778 0.000000 100,000000 BFGS 0 CE

3 MLP 12-5-3 100,000000 0.000000 100,000000 BFGS 0 SOS

л Г..Ч P 1^-1 1 Г|П Г1Г1Г1Г1Г1Г1 П Г1Г1Г1Г1Г1Г1 1 nn ПГ1ПППГ1 rf^ç n «зпс

< ï

Select\Deseled active networks

Delete networks

Build models with CNN

Build models with ANS

Build models with Subsampling

Predictions | Graphs ] Details | Liftcharts ] Custom predictions |

Predictions spreadsheet Predictions type (•) Standalones О Ensemble

О Standalones and ensemble \Щ Predictions

Include EH Inputs 0 Targets 0 Output

Absolute res. I I Sguare res. _Standard res.

□ Accuracy Variables I I Confidence levels

Summary

Ш Save networks^

Cancel

jS Options

Samples 0 Train □ Test EH Validation

EH Missing

Рисунок 9- Вывод построенных НС В дальнейшем, после сохранения полученной сети можно будет проверить эффективность ее работы на тестовых данных. Для такой проверки

мы открывали вкладку «Predictions», в ней можно анализировать предсказание по 25 последним случаям, которое делает каждая построенная сеть (Рисунок 10).

Workbook!* - Prediction» tpreadiheet for V»rH (SprwdtheeO) |».ч.|

tatnk |c»w v»«13 V«rij Output i Vw13 Output ' Virt3 Output ' VwtY OutpuTTVtrll Output ' L ( Pn n»ma_l_Tyat^ 1 Ш.Р t?13-3 I 2 MLP tMt-J I ) MLP i; t>0 I I MLP 12-7-3 I 5 MIP j

Рисунок 10 - Количество предсказаний по последним случаям Архитектура (число слоёв и число нейронов в каждом слое) обученной формальной нейронной сети представлена на (Рисунке 11).

c-tV---

о-С

Рисунок 11- Архитектура обученной НС В результате тестирования работы программы можно сделать вывод, что использования данного программного продукта кредитными организациями для автоматизированной оценки кредитоспособности потенциальных клиентов, будет очень полезно. Для реального предложения кредитным организациям требуется пополнение клиентской базы, обучение нейронных сетей для серьёзного функционирования.

Заключение. Качественно и количественно разработанная оценка кредитоспособности клиентов необходима банку для дальнейшего совершенствования своей кредитной деятельности. От правильной оценки часто зависит жизнеспособность банка. Применение современных информационных систем и БЫК статистика в частности, позволяет кредитным организациям решить одну из важнейших проблем - снизить количество «невозвратных» кредитных сделок и в целом снизить риски от кредитной деятельности.

В процессе дальнейшей работы по данной тематике и изучения современных средств, реализующих принципы нейронных сетей, планируется провести более тщательное обучение сети с целью улучшения качества и производительности сети для оценки кредитоспособности.

Использованные источники: 1. Андреева Г.В. Скоринг как метод оценки кредитного риска // Банковские

технологии. http : //www.cfin.ru/finanalysis/banks/scoring. shtml

2. Захарова О.И. Методика определения кредитоспособности заемщика банка. Международная научно-практическая конференция «Социально-экономические аспекты развития современного государства», Саратов, февраль 2010 г.

3. Пещанская И.В. Краткосрочный кредит: теория и практика. М.: Издательство «Экзамен», 2011. 320 с.

4. Хомич А.В., Жуков Л.А. Оптимизация топологии рекуррентных и многослойных нейронных сетей с применением генетических алгоритмов // Нейроинформтика. 2004. Часть 2. С. 68-74.

Афганлы А.Я.

Южно-Российский институт управления Российская академия народного хозяйства и государственной службы при Президенте Российской Федерации

Россия, г. Ростов-на-Дону

ОБЛАЧНЫЕ ТЕХНОЛОГИИ: ТЕНДЕНЦИИ РАЗВИТИЯ В

ЭКОНОМИКЕ

Аннотация:

^атья затрагивает проблему развития облачных технологий и их применения в экономике. В настоящее время наблюдается устойчивый тренд на использование облачных технологий в экономике российскими компаниями, что и будет рассмотрено в данной статье.

Ключевые слова:

Информационные технологии в экономике, облачные технологии, центры обработки данных, конфиденциальности, сохранность данных, облачные решения.

Сейчас применение облачных технологий - наиболее перспективное направление. Развитие мировой ИТ-индустрии идет по четырем главным направлениям:

1. облачные вычисления, мобильные решения и мобильные технологии;

2. обработка и анализ больших данных;

3. обеспечение всех видов информационной безопасности и конфиденциальности;

4. защита данных [1].

«Облака» активно внедряются в самые разные сферы деятельности -медицину, образование, органы власти, науку. Не составляет исключение и сфера экономики и бизнеса.

Облачные технологии состоят в «предоставлении конечным пользователям удаленного динамического доступа к услугам, вычислительным ресурсам и приложениям через Интернет» [2].

Облачные технологии начали свое развитие еще в 1960-е годы с возникновением компьютерной техники. Но особенно активно развиваться и применяться они стали с 2009 года, когда было запущено приложение Google

i Надоели баннеры? Вы всегда можете отключить рекламу.