Научная статья на тему 'Процесс прогнозирования возврата кредитов в банке на основе марковских цепей и методов классификации'

Процесс прогнозирования возврата кредитов в банке на основе марковских цепей и методов классификации Текст научной статьи по специальности «Экономика и бизнес»

CC BY
430
57
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АГРЕГИРОВАНИЕ / КРЕДИТОВАНИЕ / МЕТОДЫ КЛАССИФИКАЦИИ / МАРКОВСКИЕ ЦЕПИ / LENDING / CLASSIFICATION METHOD / AGGREGATION / MARKOV CHAINS

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Шунина Юлия Сергеевна

The paper gives the forecasting method of loan recovery based on adaptive aggregated classification methods and Markov chains of the first and second order. It is presented the description and highlights of the method implementation during in lending by banks

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Forecasting process of loan recovery in a bank based on Markov chains and classification methods

The paper gives the forecasting method of loan recovery based on adaptive aggregated classification methods and Markov chains of the first and second order. It is presented the description and highlights of the method implementation during in lending by banks

Текст научной работы на тему «Процесс прогнозирования возврата кредитов в банке на основе марковских цепей и методов классификации»

ЭКОНОМИКА И УПРАВЛЕНИЕ КАЧЕСТВОМ

УДК 336.717.061 Ю. С. ШУНИНА

ПРОЦЕСС ПРОГНОЗИРОВАНИЯ ВОЗВРАТА КРЕДИТОВ В БАНКЕ НА ОСНОВЕ МАРКОВСКИХ ЦЕПЕЙ И МЕТОДОВ КЛАССИФИКАЦИИ

Предложена методика прогнозирования возврата кредитов на основе адаптивных агрегированных методов классификации и марковских цепей первого и второго порядка. Приведено описание и основные моменты реализации данной методики при кредитовании клиентов банками.

Ключевые слова: агрегирование, кредитование, методы классификации, марковские цепи.

В процессе кредитования клиентов банк заинтересован в возвращении выданных сумм с процентами. Поэтому одной из основных задач данной организации является прогнозирование возврата кредитов как при решении вопроса о

выдаче кредита, так и при погашении кредита заёмщиком.

Предлагается методика прогнозирования возврата кредитов на основе адаптивных агрегированных методов классификации и марковских цепей (рис. 1).

Рис. 1. Методика прогнозирования возврата кредитов на основе адаптивных агрегированных методов классификации и марковских цепей

© Шунина Ю. С., 2016

Суть данной методики заключается в том, что банк имеет некоторую базу данных клиентов, которым выдали кредит. Определим их как «старые» клиенты. База данных «старых» клиентов содержит анкетные данные и информацию о погашении кредита. Анкетные данные - сведения о заёмщике, заполняемые при подаче заявки на кредит и включающие в себя ФИО, возраст, семейное положение, размер запрашиваемого кредита, ежемесячные доходы и расходы и т. д. Сведения о погашении кредита представляют собой информацию о том, вернул ли заёмщик кредит, наличие просроченных платежей, количество просроченных дней и т. д. Другими словами, база данных «старых» клиентов представляет собой выборку, в которой каждому набору признаков (анкетные данные) соответствует некий результат (вернул кредит/ наличие задолженности).

Для решения задачи прогнозирования возврата кредитов применимы методы на основе машинного обучения с учителем. Машинное обучение с учителем заключается в том, чтобы с помощью компьютерной программы научить модель в процессе построения верно сопоставлять набор входных признаков и соответствующий результат, а не программировать заранее, какой результат выводить при поступлении тех или иных данных.

Для построения методов прогнозирования экспертом банка формируется обучающая выборка, а для оценки качества построенных методов - тестовая выборка [10]. При этом обучающая выборка и тестовая не должны содержать одни и те же данные о клиентах. Критерием качества методов прогнозирования при решении вопроса о выдаче кредита является средний квадрат отклонения истинной вероятности возврата кредита г-м клиентом Р(УГ) от её прогнозируемого значения р(Хг) [11]:

1 1

=т£ ( р(Уг ) - р хг ))2,

(1)

где Хг — вектор признаков (анкетные данные)

г-го клиента; I - количество клиентов, Уг имеет следующие значения:

(\ — клиент кредитоспособен (кредит вернёт),

Г = -

0 — клиент некредитоспособен

(задолженность 90 дней и более),

(2)

При решении вопроса о погашении кредита критерием качества моделей является доля верных прогнозов, усреднённая по всем состояниям кредитного счёта заёмщика.

Для прогнозирования возврата кредитов при решении вопроса о выдаче кредита предлагаются адаптивные агрегированные методы класси-

фикации [4], которые представляют собой объединённые результаты следующих методов классификации [1,3,6]: нейронная сеть, дискрими-нантный анализ, наивный байесовский классификатор, логистическая регрессия, метод опорных векторов, дерево решений и бэггинг деревьев решений. Объединение результатов проводится отдельно по нескольким критериям: по среднему значению, по медиане, а также с помощью процедуры голосования. С помощью метода полного перебора осуществляется построение всевозможных наборов из перечисленных моделей и выбор наилучшего из них.

Оптимизация метода заключается в подборе оптимального вектора д, обеспечивающего

наивысшее качество метода, то есть минимальный средний квадрат ошибок:

о(д) =£. (Р(Гг) - Р(Хг, ч))2. (3)

г=1

Адаптивность агрегированных методов классификации заключается в способности моделей отражать изменяющуюся обстановку в экономической среде за счёт применения псевдоградиентной процедуры [2]. Пседоградиентная процедура основана на корректировке параметров моделей, используемых в методах классификации, при поступлении сведений о возврате кредита каждым новым клиентом:

Чг+1 = Ч -игУЗ(дX (4)

где дг — следующее за дг приближение оптимального вектора д; УЗ (дг) — псевдоградиент функции о (ч); и — коэффициенты, влияющие на величину шага.

При погашении кредита заёмщиком дополнительно с анкетными данными рассматривается кредитная история и условия кредитной сделки [7]. Для прогнозирования возврата выданных кредитов предлагаются модели динамики погашения кредита на основе марковских цепей первого и второго порядка [5]:

™ (5)

V, (Г + 1) =Х Рр а К (Г),

V,и+1) = ЕЕ Рк (* )М'),

¡=1 р =1

где V() - вероятность того, что кредитный счёт заёмщика окажется в состоянии в момент времени р - вероятность перехода счёта из состояния в момент времени t в состояние за один шаг; V - количество состояний; Vj(t) - вероятность того, что счёт окажется в состоянии «р в момент времени t, если предыдущим состоянием было РуО - вероятность перехода счёта в состояние «к, если предыдущими состояниями были и «р.

-=1

Для нахождения оценок переходных вероятностей р. (I) и р (I) используются приведённые выше методы классификации [9].

Эксперт банка после построения методов прогнозирования возврата кредитов выполняет отбор наилучших методов по соответствующим критериям качества. Для принятия решения о выдаче кредита выбирается наилучший метод классификации, а для обеспечения возврата выданных кредитов - марковская цепь лучшего порядка и метод классификации для оценки переходных вероятностей для каждого перехода из одного состояния кредитного счёта в другое.

При поступлении заявки на получение кредита новым клиентом кредитный сотрудник, имея в наличии наилучший метод классификации «старых» клиентов, выполняет прогнозирование возврата кредитов новым клиентом и в соответствии с заданным порогом классификации принимает решение, выдавать кредит или отказать.

При наличии кредитной истории заёмщика минимум за два месяца, кредитный сотрудник с помощью наилучшего порядка марковской цепи и метода классификации осуществляет прогнозирование изменения платёжеспособности заёмщика на следующий месяц. При отсутствии кредитной истории необходимо её накопление. Прогнозирование возврата выданных кредитов позволяет произвести градацию заёмщиков на группы с тем, чтобы вовремя отслеживать заёмщиков, не справляющихся с выполнением своих обязанностей перед банком, и принимать к ним соответствующие меры.

Предлагаемая методика на основе адаптивных агрегированных методов классификации и марковских цепей направлена на повышение точности прогнозирования возврата кредитов и может быть использована банками в процессе кредитования клиентов, начиная с принятия решения о выдаче кредита и при погашении кредитов заёмщиками [8].

СПИСОК ЛИТЕРАТУРЫ

1. Дуда Р., Харт П. Распознавание образов и анализ сцен / пер. с англ. Г. Г. Вайештейна и А. М. Васьковского, под ред. В. Л. Стефанюка. -М. : Издательство «МИР», 1976. - 509 с.

2. Крашенинников В. Р., Шунина Ю. С., Клячкин В. Н. Обновление моделей прогнозирования кредитоспособности клиентов // Финансо-

вая аналитика: проблемы и решения. — 2016. — №8 (290). — С. 2-9.

3. Мерков А. Б. Распознавание образов: введение в методы статистического обучения. -М. : URSS, 2010. — 254 с.

4. Шунина Ю. С., Алексеева В. А., Клячкин В. Н. Прогнозирование кредитоспособности клиентов банка на основе методов машинного обучения // Финансы и кредит. — 2015. — №27 (651). — С. 2-12.

5. Клячкин В. Н., Донцова Ю. С. Сравнительный анализ точности нелинейных моделей при прогнозировании состояния системы на основе марковской цепи // Известия Самарского научного центра Российской академии наук. —

2013. — Т. 15, №4 (4). — С. 924-927.

6. Донцова (Шунина) Ю. С. Анализ методов бинарной классификации // Известия Самарского научного центра Российской академии наук. —

2014. —Т. 16, №6 (2). — С. 434-438.

7. Алексеева В. А., Донцова Ю. С., Клячкин В. Н. Восстановление пропущенных наблюдений при классификации объектов // Известия Самарского научного центра Российской академии наук. — 2014. — Т. 16, №6 (2). — С. 357-359.

8. Клячкин В. Н., Шунина Ю. С. Система оценки кредитоспособности заёмщиков и прогнозирования возврата кредитов // Вестник компьютерных и информационных технологий. —

2015. — №11. — С. 45-51.

9. Клячкин В. Н., Шунина Ю. С. Методы прогнозирования платежеспособности заемщиков // Финансовая аналитика: проблемы и решения. — 2015. — №41 (275). — С. 10-21.

10. Шунина Ю. С. Влияние способа формирования обучающей и тестовой выборок на качество классификации // Вестник Ульяновского государственного технического университета. —2015. — №2 (70). — С. 43-46.

11. Шунина Ю. С., Алексеева В. А., Клячкин

B. Н. Критерии качества работы классификаторов // Вестник Ульяновского государственного технического университета. — 2015. — №2 (70). —

C. 67-70.

Шунина Юлия Сергеевна, аспирант кафедры «Прикладная математика и информатика» УлГТУ.

Поступила 19.04.2016 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.