ЭКОНОМИКА И УПРАВЛЕНИЕ КАЧЕСТВОМ
УДК 336.717.061 Ю. С. ШУНИНА
ПРОЦЕСС ПРОГНОЗИРОВАНИЯ ВОЗВРАТА КРЕДИТОВ В БАНКЕ НА ОСНОВЕ МАРКОВСКИХ ЦЕПЕЙ И МЕТОДОВ КЛАССИФИКАЦИИ
Предложена методика прогнозирования возврата кредитов на основе адаптивных агрегированных методов классификации и марковских цепей первого и второго порядка. Приведено описание и основные моменты реализации данной методики при кредитовании клиентов банками.
Ключевые слова: агрегирование, кредитование, методы классификации, марковские цепи.
В процессе кредитования клиентов банк заинтересован в возвращении выданных сумм с процентами. Поэтому одной из основных задач данной организации является прогнозирование возврата кредитов как при решении вопроса о
выдаче кредита, так и при погашении кредита заёмщиком.
Предлагается методика прогнозирования возврата кредитов на основе адаптивных агрегированных методов классификации и марковских цепей (рис. 1).
Рис. 1. Методика прогнозирования возврата кредитов на основе адаптивных агрегированных методов классификации и марковских цепей
© Шунина Ю. С., 2016
Суть данной методики заключается в том, что банк имеет некоторую базу данных клиентов, которым выдали кредит. Определим их как «старые» клиенты. База данных «старых» клиентов содержит анкетные данные и информацию о погашении кредита. Анкетные данные - сведения о заёмщике, заполняемые при подаче заявки на кредит и включающие в себя ФИО, возраст, семейное положение, размер запрашиваемого кредита, ежемесячные доходы и расходы и т. д. Сведения о погашении кредита представляют собой информацию о том, вернул ли заёмщик кредит, наличие просроченных платежей, количество просроченных дней и т. д. Другими словами, база данных «старых» клиентов представляет собой выборку, в которой каждому набору признаков (анкетные данные) соответствует некий результат (вернул кредит/ наличие задолженности).
Для решения задачи прогнозирования возврата кредитов применимы методы на основе машинного обучения с учителем. Машинное обучение с учителем заключается в том, чтобы с помощью компьютерной программы научить модель в процессе построения верно сопоставлять набор входных признаков и соответствующий результат, а не программировать заранее, какой результат выводить при поступлении тех или иных данных.
Для построения методов прогнозирования экспертом банка формируется обучающая выборка, а для оценки качества построенных методов - тестовая выборка [10]. При этом обучающая выборка и тестовая не должны содержать одни и те же данные о клиентах. Критерием качества методов прогнозирования при решении вопроса о выдаче кредита является средний квадрат отклонения истинной вероятности возврата кредита г-м клиентом Р(УГ) от её прогнозируемого значения р(Хг) [11]:
1 1
=т£ ( р(Уг ) - р хг ))2,
(1)
где Хг — вектор признаков (анкетные данные)
г-го клиента; I - количество клиентов, Уг имеет следующие значения:
(\ — клиент кредитоспособен (кредит вернёт),
Г = -
0 — клиент некредитоспособен
(задолженность 90 дней и более),
(2)
При решении вопроса о погашении кредита критерием качества моделей является доля верных прогнозов, усреднённая по всем состояниям кредитного счёта заёмщика.
Для прогнозирования возврата кредитов при решении вопроса о выдаче кредита предлагаются адаптивные агрегированные методы класси-
фикации [4], которые представляют собой объединённые результаты следующих методов классификации [1,3,6]: нейронная сеть, дискрими-нантный анализ, наивный байесовский классификатор, логистическая регрессия, метод опорных векторов, дерево решений и бэггинг деревьев решений. Объединение результатов проводится отдельно по нескольким критериям: по среднему значению, по медиане, а также с помощью процедуры голосования. С помощью метода полного перебора осуществляется построение всевозможных наборов из перечисленных моделей и выбор наилучшего из них.
Оптимизация метода заключается в подборе оптимального вектора д, обеспечивающего
наивысшее качество метода, то есть минимальный средний квадрат ошибок:
о(д) =£. (Р(Гг) - Р(Хг, ч))2. (3)
г=1
Адаптивность агрегированных методов классификации заключается в способности моделей отражать изменяющуюся обстановку в экономической среде за счёт применения псевдоградиентной процедуры [2]. Пседоградиентная процедура основана на корректировке параметров моделей, используемых в методах классификации, при поступлении сведений о возврате кредита каждым новым клиентом:
Чг+1 = Ч -игУЗ(дX (4)
где дг — следующее за дг приближение оптимального вектора д; УЗ (дг) — псевдоградиент функции о (ч); и — коэффициенты, влияющие на величину шага.
При погашении кредита заёмщиком дополнительно с анкетными данными рассматривается кредитная история и условия кредитной сделки [7]. Для прогнозирования возврата выданных кредитов предлагаются модели динамики погашения кредита на основе марковских цепей первого и второго порядка [5]:
™ (5)
V, (Г + 1) =Х Рр а К (Г),
V,и+1) = ЕЕ Рк (* )М'),
¡=1 р =1
где V() - вероятность того, что кредитный счёт заёмщика окажется в состоянии в момент времени р - вероятность перехода счёта из состояния в момент времени t в состояние за один шаг; V - количество состояний; Vj(t) - вероятность того, что счёт окажется в состоянии «р в момент времени t, если предыдущим состоянием было РуО - вероятность перехода счёта в состояние «к, если предыдущими состояниями были и «р.
-=1
Для нахождения оценок переходных вероятностей р. (I) и р (I) используются приведённые выше методы классификации [9].
Эксперт банка после построения методов прогнозирования возврата кредитов выполняет отбор наилучших методов по соответствующим критериям качества. Для принятия решения о выдаче кредита выбирается наилучший метод классификации, а для обеспечения возврата выданных кредитов - марковская цепь лучшего порядка и метод классификации для оценки переходных вероятностей для каждого перехода из одного состояния кредитного счёта в другое.
При поступлении заявки на получение кредита новым клиентом кредитный сотрудник, имея в наличии наилучший метод классификации «старых» клиентов, выполняет прогнозирование возврата кредитов новым клиентом и в соответствии с заданным порогом классификации принимает решение, выдавать кредит или отказать.
При наличии кредитной истории заёмщика минимум за два месяца, кредитный сотрудник с помощью наилучшего порядка марковской цепи и метода классификации осуществляет прогнозирование изменения платёжеспособности заёмщика на следующий месяц. При отсутствии кредитной истории необходимо её накопление. Прогнозирование возврата выданных кредитов позволяет произвести градацию заёмщиков на группы с тем, чтобы вовремя отслеживать заёмщиков, не справляющихся с выполнением своих обязанностей перед банком, и принимать к ним соответствующие меры.
Предлагаемая методика на основе адаптивных агрегированных методов классификации и марковских цепей направлена на повышение точности прогнозирования возврата кредитов и может быть использована банками в процессе кредитования клиентов, начиная с принятия решения о выдаче кредита и при погашении кредитов заёмщиками [8].
СПИСОК ЛИТЕРАТУРЫ
1. Дуда Р., Харт П. Распознавание образов и анализ сцен / пер. с англ. Г. Г. Вайештейна и А. М. Васьковского, под ред. В. Л. Стефанюка. -М. : Издательство «МИР», 1976. - 509 с.
2. Крашенинников В. Р., Шунина Ю. С., Клячкин В. Н. Обновление моделей прогнозирования кредитоспособности клиентов // Финансо-
вая аналитика: проблемы и решения. — 2016. — №8 (290). — С. 2-9.
3. Мерков А. Б. Распознавание образов: введение в методы статистического обучения. -М. : URSS, 2010. — 254 с.
4. Шунина Ю. С., Алексеева В. А., Клячкин В. Н. Прогнозирование кредитоспособности клиентов банка на основе методов машинного обучения // Финансы и кредит. — 2015. — №27 (651). — С. 2-12.
5. Клячкин В. Н., Донцова Ю. С. Сравнительный анализ точности нелинейных моделей при прогнозировании состояния системы на основе марковской цепи // Известия Самарского научного центра Российской академии наук. —
2013. — Т. 15, №4 (4). — С. 924-927.
6. Донцова (Шунина) Ю. С. Анализ методов бинарной классификации // Известия Самарского научного центра Российской академии наук. —
2014. —Т. 16, №6 (2). — С. 434-438.
7. Алексеева В. А., Донцова Ю. С., Клячкин В. Н. Восстановление пропущенных наблюдений при классификации объектов // Известия Самарского научного центра Российской академии наук. — 2014. — Т. 16, №6 (2). — С. 357-359.
8. Клячкин В. Н., Шунина Ю. С. Система оценки кредитоспособности заёмщиков и прогнозирования возврата кредитов // Вестник компьютерных и информационных технологий. —
2015. — №11. — С. 45-51.
9. Клячкин В. Н., Шунина Ю. С. Методы прогнозирования платежеспособности заемщиков // Финансовая аналитика: проблемы и решения. — 2015. — №41 (275). — С. 10-21.
10. Шунина Ю. С. Влияние способа формирования обучающей и тестовой выборок на качество классификации // Вестник Ульяновского государственного технического университета. —2015. — №2 (70). — С. 43-46.
11. Шунина Ю. С., Алексеева В. А., Клячкин
B. Н. Критерии качества работы классификаторов // Вестник Ульяновского государственного технического университета. — 2015. — №2 (70). —
C. 67-70.
Шунина Юлия Сергеевна, аспирант кафедры «Прикладная математика и информатика» УлГТУ.
Поступила 19.04.2016 г.