ISSN 2311-8768 (Online) ISSN 2073-4484 (Print)
Мониторинг и прогнозирование банковских рисков
МЕТОДЫ ПРОГНОЗИРОВАНИЯ ПЛАТЕЖЕСПОСОБНОСТИ ЗАЕМЩИКОВ Владимир Николаевич КЛЯЧКИНа% Юлия Сергеевна ШУНИНАь
а доктор технических наук, профессор кафедры прикладной математики и информатики, Ульяновский государственный
технический университет, Ульяновск, Российская Федерация
v_kl@mail.ru
ь аспирантка кафедры прикладной математики и информатики, Ульяновский государственный технический университет, Ульяновск, Российская Федерация ydoncova@yandex.ru • Ответственный автор
История статьи:
Принята 09.07.2015 Одобрена 28.07.2015
УДК 336.77 JEL: C02, C53, G21
Ключевые слова:
кредитование, задолженность, возврат кредита, марковская цепь, машинное обучение
Аннотация
Предмет. В статье рассматривается процесс прогнозирования платежеспособности заемщиков кредитных организаций. Для формирования грамотной стратегии при работе с различными видами задолженностей по кредиту актуальной задачей является разработка более точных методов прогнозирования платежеспособности заемщиков на этапе погашения кредита.
Цели. Разработка методов, адекватно описывающих динамику погашения кредита каждого заемщика в зависимости от условий кредита, информации о самом заемщике и его кредитной истории, а также обеспечение достаточной точности прогноза его платежеспособности в следующем периоде.
Методология. Предложены методы прогнозирования платежеспособности заемщика на основе марковских цепей 1-го и 2-го порядков, позволяющих учитывать прошлые состояния кредитной истории, совместно с методами машинного обучения для оценки вероятностей переходов из одного состояния кредитного счета в другое с включением факторов, предположительно имеющих влияние на платежеспособность. В рассматриваемом подходе также предлагается провести предварительный анализ данных кредитной истории и восстановить пропущенные значения.
Результаты. На основе разработанных методов предложен алгоритм прогнозирования платежеспособности заемщиков. Эффективность подхода показана на примере. Для данных по кредитным счетам реализованы методы прогнозирования, среди которых выявлены наилучшие методы по каждому переходу из одного состояния кредитного счета в другое. При оценке качества расчета найдены матрицы расхождений между реальными и прогнозными значениями.
Выводы. Использование предложенных методов повышает результативность прогнозирования платежеспособности для каждого перехода из одного состояния кредитного счета в другое и позволяет кредитной организации заранее принять меры по снижению риска аномальных ситуаций.
© Издательский дом ФИНАНСЫ и КРЕДИТ, 2015
Постановка задачи
Имеется множество заемщиков банка, которым одобрили кредит и которые погашают его в течение заданного срока Т. Известна кредитная история каждого заемщика (1ъ ..., I), представляющая собой последовательность состояний кредитного счета, принимающих значение из конечного множества 5ь .., Sm за определенный период Кредитная история заемщика, как правило, характеризует своевременность платежей. Также известен X = (х1, .., х^) - ^-мерный вектор признаков, предположительно влияющих на кредитную историю заемщика.
Задача заключается в разработке методов описания динамики состояния кредитного счета заемщика, способных обеспечить с достаточной точностью прогноз состояния счета на следующем шаге It+i на основе информации о прошлых состояниях счета Ii, ..., It с учетом признаков X = (xi, ..., Xd).
В области кредитования данная задача решается в рамках поведенческого скоринга и имеет также название behavioral scoring [1-2].
В качестве набора признаков хь .., xd, могут выступать следующие данные:
• данные о заемщиках из анкет, которые заполняются при подаче заявки на кредит (фамилия, имя, отчество, дата рождения,
образование, семейное положение, ежемесячные доходы и расходы, информация об имеющемся имуществе и т.д.);
• сведения о кредите (год взятия, процентная ставка, сумма, коэффициенты LTV (кредит/залог), DTI (платеж/доход);
• информация о кредитной истории (просрочил ли клиент первый платеж по кредиту, наихудшее состояние счета в прошлом);
• внешние факторы, связанные с состоянием экономической среды и конъюнктурой;
• внутренние факторы, вызванные ошибочными действиями самого банка.
Что касается состояний кредитного счета Si, ..., Sm, то Центральный банк РФ1 выделяет как для физических лиц, так и для субъектов малого и среднего предпринимательства следующие состояния просроченной задолженности по ссудам:
• без задолженности;
• задолженность от 1 до 30 календарных дней;
• задолженность от 31 до 90 календарных дней;
• задолженность от 91 до 180 календарных дней;
• задолженность свыше 180 календарных дней.
По законодательству РФ каждая кредитная организация должна взаимодействовать с кредитным бюро, отправляя данные как о физических, так и о юридических заемщиках. Это, как правило, информация о заемщике и о том, как он выполняет свои обязательства по кредиту. Согласно данным кредитных бюро2, существуют следующие состояния кредитного счета S1, ..., Sm:
• 0 - новый счет, оценка невозможна;
• X - нет информации;
• 1 - оплата без просрочек;
• A - просрочка от 1 до 29 дней;
• 2 - просрочка от 30 до 59 дней;
Положение Банка России от 26.03.2004 № 254-П «О порядке формирования кредитными организациями резервов на возможные потери по ссудам, по ссудной и приравненной к ней задолженности» (в ред. от 04.12.2009).
URL: https://www.tcsbank.ru/tournament.
• 3 - просрочка от 60 до 89 дней;
• 4 - просрочка от 90 до 119 дней;
• 5 - просрочка более 120 дней;
• 7 - регулярные консолидированные платежи;
• 8 - погашение по кредиту с использованием залога;
• 9 - безнадежный долг (передано на взыскание, пропущенный платеж).
Решение задачи прогнозирования
платежеспособности: обзор методов и моделей
Для решения поставленной задачи может быть использована теория марковских цепей, которая была изучена в работах по исследованию динамики структуры кредитного портфеля [3-4]. При этом основная проблема заключается в оценке вероятностей - переходных из одного состояния кредитного счета в другое.
В работе [3] для прогнозирования состояний задолженностей по кредитам авторы предлагают разделить исходную совокупность данных на несколько групп, в которых различаются некоторые вероятности переходов, а затем применить марковскую цепь 1-го порядка, где в качестве оценок переходных вероятностей используют байесовские оценки.
Однако в этом случае нет возможности учета различных факторов, которые могут иметь влияние на оценку платежеспособности заемщика (анкетные данные по кредиту, коэффициенты LTV или DTI и др.).
В работе [4] исследуется динамика структуры кредитного портфеля на основе описания изменения состояния отдельного кредита как марковской цепи 1-го порядка с конечным числом состояний задолженности. С помощью марковской цепи и построения доверительных интервалов для оценок матрицы переходных вероятностей прогнозируется структура портфеля. В качестве оценок переходных вероятностей состояний кредита pj(t) принимаются наблюдаемые частоты
переходов:
fj (t)
Ра (t ) =
f( t-1)
1
где - количество кредитов, перешедших из состояния Si в состояние Sj на шаге У;
fl(t - 1) - количество кредитов, находящихся в состоянии Si в момент У - 1.
Однако в данном случае задача ориентирована на прогноз структуры портфеля кредитов в целом, то есть нельзя проанализировать платежеспособность отдельно взятого заемщика. Кроме того, также нет возможности учета различных факторов.
Основной недостаток названных работ может быть исправлен путем применения полиномиальной логистической модели [5-7]. Тем не менее она не обладает явным преимуществом перед другими многочисленными классами технологий: нейронными сетями, байесовскими
классификаторами, дискриминантным анализом, методом опорных векторов и т.д. [8].
Подготовка исходных данных
При анализе кредитной истории заемщиков могут возникнуть проблемы, связанные с отсутствующей или пропущенной информацией, которая может привести в итоге к неадекватным результатам. В этом случае используют различные методы восстановления данных [9-10].
Период кредитной истории берется, как правило, равным 1-2 годам: при меньшем сроке можно недооценить вероятность задолженности, а за больший период могут произойти перемены социально-экономического уровня, в результате которых характеристики новых заемщиков будут резко выделяться на фоне старых.
При задании вектора признаков X = (хь ..., ха) на результативность прогнозирования могут оказывать влияние наличие корреляционной связи между ними, их значимость, дискретность и непрерывность [11].
Чтобы проверить точность и адекватность методов прогнозирования состояния счета, исходная выборка разбивается на обучающую и контрольную части.
Обучающая выборка используется для построения методов прогнозирования и представляет собой по каждому заемщику набор признаков Х1, .., ха и кредитную историю 11, ..., I-1.
Контрольная выборка используется для оценки точности построенных методов путем сравнения реального и прогнозируемого состояний счета I для каждого заемщика.
Предлагаемые методы состояния счета заемщика
прогнозирования
Кредитная история отдельно взятого заемщика представляет собой последовательность дискретно распределенных случайных величин 11, ..., I, каждая из которых принимает значение из некоторого фиксированного множества Sl, ..., Sm. При этом вероятность того, что кредитный счет заемщика находится в данном состоянии в данный момент, можно определить на основе предшествовавших состояний. Таким образом, последовательность 11, ..., I можно назвать цепью Маркова [12-13].
Марковская цепь позволяет на основе оценки матрицы переходных вероятностей
спрогнозировать платежеспособность заемщика, то есть состояние его кредитного счета в следующем периоде.
Порядок марковской цепи определяется количеством предшествовавших состояний, которые влияли на текущее состояние счета. Поскольку результаты прогнозирования на основе марковских цепей 3-го и более высоких порядков, как показали расчеты, не улучшают результатов прогнозирования, полученных с использованием марковских цепей меньших порядков, ограничимся рассмотрением марковских цепей 1-го и 2-го порядков.
Введем следующие обозначения:
vi(t) - вероятность того, что счет окажется в состоянии Х- в момент У, где i = 1, ..., т, причем 0 < vI(0 < 1, vl(t) + ... + Vm(t) = 1;
v(t) - вектор вероятностей состояний счета в момент У, v(t) = [^(Р), ..., Vm(t)\;
Р(Р) - матрица переходных вероятностей марковской цепи 1-го порядка;
р-ХО - вероятность перехода счета из состояния Х- в момент у в состояние Sj за один шаг:
р,;(0 ^ Р(Ь+1 = = Х-);
фк(Р) - вероятность того, что счет окажется в состоянии Хк в момент У, если предыдущими
состояниями были и &, где г,] = 1, ..., т, причем Тогда будем рассматривать отдельные переходы из 0<фк(с)<1, ф1 (Г) + ... + фп(Г)=1 (где п - одного состояния в другое (& ^ Sj для марковской количество состояний с учетом состояний);
двух предыдущих цепи 1-го порядка и переходы & марковской цепи 2-го порядка).
^ Sj ^ Sk - для
ф(0 - вектор вероятностей состояний счета в момент Р:
ф(0 = [ф1(^>, ..., фл(0] = = [(у^ - 1), ЫО), ..., (У1(г - 1), УтШ (Ут(( - 1), ЫО), ..., - 1), ^(0)];
Таким образом, в качестве зависимой переменной будут выступать оценки переходных вероятностей для марковских цепей 1-го и 2-го порядков соответственно:
©(^) - матрица переходных марковской цепи 2-го порядка;
вероятностей
Pj=
Pijk =
1,если был совершен переход — 0, если иначе
Рг,к(0 - вероятность перехода счета в состояние &к, если предыдущими состояниями были в момент Построим
1, если был совершен переход ——&к 0, если иначе
t - 1
Sj
момент
Pjk(t) = P(It+1 = Sk II It = Sj, lt-1 = S).
зависимости между оценками переходных вероятностей для марковской цепи 1-го и 2-го порядков, а также факторами,
Предположим, что вероятности перехода не предположительно влияющими на
зависят от номера шага, т р() = рр. Тогда пгатеж^п^обшстъ заемщиков х = (х1, ..., ^ на
основе методов машинного обучения:
на основе дискриминантного анализа (ДА)3:
динамику состояния счета отдельно взятого заемщика можно описать с помощью марковской цепи 1-го и 2-го порядков соответственно:
m
'j ( t + 1) = L PnVi( t ) ,
i=1
m m
Ф k (t + 1) = H Pijk (Vi (t - 1) ,Vj (t)).
i=1 j=1
Запишем эти модели для векторов вероятностей состояний счета отдельного заемщика:
у(г + 1) = у(Г)Р(г, г + 1),
ф(г + 1) = ф(0@(£ ( + 1).
Предполагается, что матрицы переходных вероятностей Р и © точно не известны, и
необходимо найти их оценки,
спрогнозировать состояние счета заемщика на ^ _ вес г-го синапса-следующем шаге.
Воспользуемся различными методами машинного обучения для построения зависимости между а - значение смещения; оценками переходных вероятностей и факторами, предположительно влияющими на
платежеспособность заемщиков X = (х1, ..., х^).
Поскольку состояние счета может перейти в одно из т возможных состояний, то каждую строку матрицы переходных можно описать с помощью полиномиальной модели, которую представим в виде набора бинарных моделей.
Рг= 40 + 41 Х1 +- + 4dXd , где 40, ..., qd- параметры регрессии;
на основе логистической регрессии (ЛР) [5]:
* ехр (4 0+41х 1 + ... +4^)
Р =-1-7
11 1+ехр (40 +41 х1 +...+4dxd)
ехР(40+41х 1 +...+4dxd)
Pj 1+ exp (q0 + q x 1 +... + qdXd)'
• на основе нейронной сети (НС) [15]:
d
4ГХГ + а,
г = 1
Рг= F (0),р1]к=F (О),
чтобы где О - результат суммирования;
Хг - входной сигнал;
р.. - выходной сигнал; F - функция активации;
• на основе метода опорных векторов (МОВ) [16]:
Рг,=F (X ) = sign «ц,Х >+р),
3
Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы. М.: Финансы и статистика, 2003. 352 с.
t
и
в
Р,к_F(X)=явд«ц,Х) + р), , где [ \ - скалярное произведение;
ц - нормальный вектор к разделяющей гиперплоскости;
X - вектор-столбец признаков;
в - вспомогательный параметр;
• на основе наивного байесовского классификатора (НБК) [17-18]:
Ру_Р (Х- + Х,|Х = х)=
а
Р (Х- +Х,)П Р (Хг=хД +Х)
__Т=1_ .
X Р (Х-+Sj)' П Р (хг_хМ+Sj)')
(г+у) г_1
Рук_Р (Х +Sj +Хк1Х _х)_
а
Р ( х, + Хк )П Р (Хг_ хХ + Х, + Хк)
Г = 1
X Р(Х + Х,+Хк)'П Р(Хг_хг|(х,+Х, + Хк)')
иъ) Г_1
• на основе деревьев решений (ДР)4: для каждого перехода Х ^ Х, и Х ^ Х, ^ Хк строится свое дерево решений.
Предлагаемый алгоритм прогнозирования
платежеспособности заемщиков:
1. Обработка исходных данных и приведение их к определенному виду (табл. 1);
2. Восстановление пропусков в кредитной истории (I = N при помощи моделирования с использованием условного распределения по присутствующим параметрам [20]. Чтобы сделать это, необходимо найти общую для всех заемщиков матрицу переходных вероятностей (из одного состояния кредитного счета в другие) определенного вида (табл. 2).
При этом ру находится по формуле
Ы fj (У)
Р,,(Р)_-~
(t-1)'
Якупов А.И. Применение деревьев решений для моделирования кредитоспособности клиентов коммерческого банка // Искусственный интеллект. 2008. № 4. С. 208-213.
где (У) - количество счетов, перешедших из состояния Х- в X на шаге У;
fi (У - 1) - количество счетов, находящихся в состоянии Х- в момент У - 1.
При обнаружении пропуска в качестве Х-используется предыдущее состояние кредитной истории, а восстановленное состояние можно найти с помощью построенной матрицы переходных вероятностей, которая будет иметь максимальное значение вероятности перехода из состояния Х-.
3. Формирование обучающей и контрольной выборок. В случае кредитной истории за 12 мес. обучающая выборка будет представлять собой по каждому заемщику набор признаков х1, ..., xd и кредитную историю за 11 мес., а контрольная выборка - состояние кредитной истории за 12-й месяц по каждому заемщику.
4. Построение разработанных моделей описания динамики погашения кредита на обучающей выборке с помощью марковских цепей и нахождение оценок вероятностей с помощью методов классификации для всех переходов Х- ^ Ху и Х- ^ Х ^ Хъ Тогда для марковских цепей получатся свои матрицы переходных вероятностей (табл. 3, 4).
5. Построение прогноза по каждому заемщику на следующем шаге Ь+1, то есть определение состояния кредит ного счета на 12-й месяц. Для этого в случае марковской цепи 1-го порядка необходимо определить для каждого счета текущее состояние И и подставить значения факторов х1, ..., xd в модели. Тогда результат прогнозирования каждого счета будет представлять собой распределение вероятностей перехода из текущего состояния I в следующее Ли:
It It+1
S1 S2 S3 Sm
Si p г1 p г 2 P i3 P im
В случае марковской цепи 2-го порядка необходимо определить для каждого счета текущее состояние Л и предыдущее состояние Л-1 и подставить значения факторов х1, ..., ха в модели.
Тогда результат прогнозирования каждого счета
будет представлять собой следующее распределение вероятностей перехода:
It-1, It It+1
Si S2 S3 Sm
S, Sj p j1 p j 2 p ,j3 P ijm
1. Определение прогнозируемого состояния It+i с помощью максимальной вероятности перехода.
2. Анализ результатов прогнозирования и оценка качества построенных методов с помощью нахождения матрицы расхождений (табл. 5). Ее строки представляют собой реальное состояние счета заемщика на следующем шаге It+i, а столбцы - прогнозируемое состояние на следующем шаге It+i. Таким образом, на диагонали находится общее количество верно прогнозируемых состояний Saa, а в остальных ячейках - количество ошибок первого и второго рода Sab, где a = 1, ..., m, b = 1, ..., m.
Процент верных прогнозов s, усредненный по всем имеющимся состояниям, может быть найден по формуле
m с
ZSaa
m
a = 1
е=-
I S
b = l
ab
•100%.
m
3. Выбор для каждого перехода метода, наилучшим образом прогнозирующего будущее состояние счета (с наибольшей долей правильных прогнозов), и формирование для конкретных исходных данных матрицы переходных вероятностей, наилучшим образом прогнозирующей состояние счета по всем переходам.
Пример. В качестве примера были рассмотрены данные по 8 500 кредитным счетам под залог недвижимости. Кредитная история каждого заемщика представлена ежемесячными
состояниями кредитного счета в период с июня 2011 г. по июнь 2012 г. В качестве состояний кредитного счета представлены следующие состояния задолженности:
• С - без задолженности;
• 30 - 0-29 дней просрочки;
• 60 - 30-59 дней просрочки;
• 90 - 60-89 дней просрочки;
• 120 - 90-119 дней просрочки;
• F - 120-149 дней просрочки (переход права собственности на заложенное имущество к кредитору);
• R - более 149 дней просрочки (продажа заложенного имущества кредитором для покрытия задолженности).
В качестве факторов, описывающих кредитный счет, представлена информация об условиях кредита (дата получения кредита, его сумма, коэффициенты LTV, DTI и т.д.).
На основе данной выборки был составлен прогноз платежеспособности заемщиков. В качестве среды программирования использована программа MATLAB.
1. Были определены допустимые (+) и недопустимые (-) переходы из одного состояния счета в другие (табл. 6).
2. Кредитная история по всем счетам была разделена на обучающую выборку, представляющую собой последовательность ежемесячных состояний счетов в период с июня 2011 г. по май 2012 г., и на контрольную выборку - состояния счетов в июне 2012 г.
3. Был проведен процесс восстановления пропущенных данных по кредитной истории.
4. В качестве факторов, влияющих на платежеспособность заемщиков, были приняты текущий коэффициент LTV и коэффициент DTI.
5. Для каждого перехода из одного состояния в другие по всем счетам были реализованы предложенные методы платежеспособности на основе марковской цепи (МЦ) 1-го и 2-го порядков.
В табл. 7 представлены проценты верных прогнозов по всем возможным переходам из одного состояния Si в другие и средний процент по всем переходам для каждого метода, а также максимальные значения для каждого перехода.
Результаты исследования показали, что нет единого метода, наилучшим образом прогнозирующего все переходы. Оптимальным вариантом является выбор наилучшего метода или одного из лучших способов для каждого перехода, ru/journal/fa/ 15
что в среднем улучшает результаты отдельных методов примерно на 7-20%. Таким образом, наилучший результат достигается при использовании нескольких методов
прогнозирования (табл. 8).
Выводы
В работе предложены методы описания динамики состояния кредитного счета отдельного заемщика. Их особенностью является возможность учета
прошлых состояний счета, а также факторов, предположительно влияющих на данное состояние.
На основе разработанных методов предложен алгоритм прогнозирования состояния кредитного счета в следующем месяце, что позволяет работникам кредитной или коллекторской организации оценить платежеспособность заемщиков и принять соответствующие меры к имеющим просроченную задолженность.
Таблица 1
Исходные данные для алгоритма
№ счета Признаки Кредитная история
заемщика Х1, . ., Xd 11, .., I,
1 X11, . ., X1d 111, .., I1,
2 X21, . ., X2d 121, .., I2t
3 X31, . ., X3d 131, .., I3t
n Xn1, . •, Xnd In1,
Таблица 2
Общая матрица переходных вероятностей
Si Sj
Si S2 S3 Sm
S1 P11 P12 P13 P1m
S2 P21 P22 P23 P2m
Sm Pm1 Pm2 Pm3 Pmm
Таблица 3
Матрица переходных вероятностей для марковской цепи 1-го порядка
Si Sj
Si S2 S3 Sm
S1 pm 11 pm 12 pm 13 P 1m
S2 pm 21 pm22 pm 23 P 2m
Sm P ml Pm 2 Pm3 p mm
Таблица 4
Матрица переходных вероятностей для марковской цепи 2-го порядка
Si ^ Sj Sk
Si S2 S3 .. .. Sm
S1 S1 p 111 P 112 P113 ■ ■■ P 11m
S1 S2 P 121 P 122 P 123 . ■■ P 12m
Sm Sm pmm1 P mm2 P mm 3 . • • Pmmm
Таблица 5
Матрица расхождений
Реально Прогноз
& S2 S3 Sm
S1 511 512 513 51m
S2 521 522 523 52m
Sm 5m1 5m2 5m3 5mm
Таблица 6
Значения переходов
Реально Прогноз
С 30 60 90 120 F R
C + + - - - - -
30 + + + - - - -
60 + + + + - - -
90 + + + + + - -
120 + + + + + + -
F + + + + + + +
R + + + + + + +
Таблица 7
Результаты прогнозирования
Si МЦ 1-го порядка МЦ 2-го порядка Максимум
ЛР ДА НБК ДР МОВ НС ЛР ДА НБК ДР НС
С 99,5 99,5 99,5 99,5 99,5 99,5 99,7 99,7 99,7 99,5 99,7 99,7
30 49,6 49,6 49,6 49,6 49,6 49,6 38,1 38,1 38,1 44,2 35,4 49,6
60 33,3 33,3 33,3 33,3 40 40 40 33,3 26,7 20 33,3 40
90 0 0 33,3 50 0 25 50 50 50 50 50 50
120 75 75 33,3 41,7 75 58,3 41,7 50 41,7 16,7 50 75
F 100 100 100 100 100 90,4 98,6 98,6 98,6 97,3 90,4 100
R 55,6 55,6 66,7 55,6 55,6 88,9 66,7 66,7 55,6 33,3 0 88,9
Среднее 59 59 59,4 61,4 59,9 64,5 62,1 62,3 58,6 51,6 51,3 71,9
Таблица 8
Наиболее результативные методы прогнозирования
Вид МЦ I, 1+1
С 30 60 90 120 R F
МЦ 2-го порядка C Логистическая регрессия: - _ ехр(qo +q 1 х^... +qdxd) рк 1 + ехр( qo +ql х1 +... +qЛ)
МЦ 1-го порядка 30 Логистическая регрессия: - _ ехр^0+ql Х1 +...+ q,xd) Р 1 + ехр(qo+qx х1 +... + qlxd)
60 Метод опорных векторов: рп_ ^ (X )_^п (^ ,Х >+р)
90 Деревья решений
120 Логистическая регрессия: - _ ехр^0+ql Х1 +...+ q,Xd) Р_ 1 + ехр(qo+ql х1 +... + qlxd)
R
F Нейронная сеть: п Р_^(Я),qrXr + а Г_1
Рисунок 1
Дерево решений для перехода S1 ^ S1 с учетом признаков x1 и х2
Список литературы
1. Thomas L.C. A survey of credit and behavioral scoring: forecasting financial risk of lending to consumers // International Journal of Forecasting. 2000. Vol. 16. Iss. 2. P. 149-172.
2. Thomas L.C., Ho J., Scherer W.T. Time will tell: behavioral scoring and the dynamics of consumer credit assessment // IMA Journal of Management Mathematics. 2001. Vol. 12. Iss. 1. P. 89-103.
3. Grimshaw S., Alexander W. Markov chain models for delinquency: Transition matrix estimation and forecasting // Applied Stochastic Models in Bu siness and Industry. 2011. № 27. Vol. 27. Iss. 3. P. 267-279.
4. Тимофеева Г.А., Тимофеев Н.А. Прогнозирование составляющих кредитного портфеля на основе модели марковской цепи // Автоматика и телемеханика. 2012. № 4. C. 47-65.
5. Diggle P.J, LiangK.Y., Zeger S.L. Analysis of Longitudinal Data. Oxford: Oxford University Press, 2002.
6. Клячкин В.Н., Донцова (Шунина) Ю.С. Сравнительный анализ точности нелинейных моделей при прогнозировании состояния системы на основе марковской цепи // Известия Самарского научного центра Российской академии наук. 2013. Т. 15. № 4. С. 924-927.
7. Чижова А.С. Эконометрическая модель оценки матриц вероятностей перехода кредитных рейтингов // Прикладная эконометрика. 2007. № 3. С. 11-26.
8. Мерков А.Б. Распознавание образов: введение в методы статистического обучения. М.: URSS, 2010. 254 с.
9. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Основы моделирования и первичная обработка данных. М.: Финансы и статистика, 1983. 471 с.
10. Литтл Р. Дж. А., Рубин Д.Б. Статистический анализ данных с пропусками / пер. с англ. М.: Финансы
и статистика, 1990. 336 с.
11. Гринь Н.В. Методологические аспекты построения скоринговых моделей // Экономика, моделирование, прогнозирование: сб. науч. тр. Вып. 6. Минск: НИЭИ Минэкономики РБ, 2012. С. 174180.
12. Pfeifer P.E. Robert L. Modeling customer relationships as Markov Chains. Journal of Interactive Marketing. 2000. № 14. Iss. 2. P. 43-55.
13. Соколов Г.А., Чистякова Н.А. Теория вероятностей. Управляемые цепи Маркова в экономике. М.: ФИЗМАТЛИТ, 2005. 248 с.
14. Уоссермен Ф. Нейрокомпьютерная техника: теория и практика / пер. Ю.А. Зуева, В.А. Точенова. М.: Мир, 1992. 184 с.
15. Вапник В.Н. Восстановление зависимостей по эмпирическим данным. М.: Наука, 1979. 448 с.
16. Вагин В.Н., Головина Е.Ю., Загорянская А.А., ФоминаМ.В. Достоверный и правдоподобный вывод в интеллектуальных системах. М.: ФИЗМАТЛИТ, 2004. 704 с.
17. Thomas L.C. Credit Scoring and its Applications: SIAM Monographs on Mathematical Modeling and Computation / L.C. Thomas, D.B. Edelman, J.N. Crook. SIAM: Philadelphia, USA. 2002. 248 p.
18. Алексеева В.А., Донцова Ю.С., Клячкин В.Н. Восстановление пропущенных наблюдений при классификации объектов // Известия Самарского научного центра Российской академии наук. 2014. Т. 16. № 6. С. 357-359.
Финансовая аналитика: Financial Analytics:
проблемы и решения 41 (2015) 10-21 Science and Experience
ISSN 2311-8768 (Online) Monitoring and Prediction of Banking Risks
ISSN 2073-4484 (Print)
CUSTOMER SOLVENCY PREDICTION METHODS Vladimir N. KLYACHKINa% Yuliya S. SHUNINAb
a Ulyanovsk State Technical University, Ulyanovsk, Russian Federation ydoncova@yandex.ru
b Ulyanovsk State Technical University, Ulyanovsk, Russian Federation v_kl@mail.ru • Corresponding author
Article history:
Received 9 July 2015 Accepted 28 July 2015
Abstract
Importance The article reviews the process of forecasting the solvency of the credit institution's customers. To outline an appropriate strategy for handling various loan balances, it is reasonable to devise more accurate methods for forecasting the solvency of borrowers at the loan repayment stage.
JEL classification: C02, C53, G21 Objectives The research pursues setting up methods, which would adequately reflect each
borrower's tendency of repaying the loan depending on the loan terms, borrower's profile and credit history, and ensuring sufficient accuracy of the borrower's solvency forecast for the following period.
Methods We proposed methods for predicting the borrower's solvency through Markov chains of the 1st and 2nd order that allowed considering the previous status of the credit history, and machine learning methods to evaluate probabilities of the credit account changes, including factors that could possibly influence the ultimate solvency. The approach implies a preliminary analysis of the credit history data and recovers missing indicators.
Results Based on the methods, we propose our own algorithm for forecasting the borrowers' solvency. The efficiency of the approach is illustrated with an example. As for data of credit accounts, we implemented prediction methods and identified the best ones per each change in the status of the credit account. When evaluating the quality of estimates, we found matrices of differences between the real and projected indicators.
Conclusions and Relevance The proposed methods will improve the solvency forecasts for each change in the credit account's status and enable the credit institution to take relevant measures to reduce the anomaly risk
Keywords: lending, debt, loan repayment, Markov chain, machine learning
© Publishing house FINANCE and CREDIT, 2015
References
1. Thomas L.C. A Survey of Credit and Behavioural Scoring: Forecasting Financial Risk of Lending to Consumers. International Journal of Forecasting, 2000, vol. 16, iss. 2, pp. 149-172.
2. Thomas L.C., Ho J., Scherer W.T. Time will Tell: Behavioral Scoring and the Dynamics of Consumer Credit Assessment. IMA Journal of Management Mathematics, 2001, vol. 12, iss. 1, pp. 89-103.
3. Grimshaw S., Alexander W. Markov Chain Models for Delinquency: Transition Matrix Estimation and Forecasting. Applied Stochastic Models in Business and Industry, 2011, vol. 27, iss. 3, pp. 267-279.
4. Timofeeva G.A., Timofeev N.A. Prognozirovanie sostavlyayushchikh kreditnogo portfelya na osnove modeli markovskoi tsepi [Forecasting credit portfolio components with a Markov chain model]. Avtomatika i telemehanika = Automation and Remote Control, 2012, no. 4, pp. 47-65.
5. Diggle P.J., Liang K.Y., Zeger S.L. Analysis of Longitudinal Data. Oxford, Oxford University Press, 2002.
6. Klyachkin V.N., Dontsova Yu.S. Sravnitel'nyi analiz tochnosti nelineinykh modelei pri prognozirovanii sostoyaniya sistemy na osnove markovskoi tsepi [A comparative analysis of the accuracy of nonlinear models in forecasting the condition of system on the basis of the Markov chain]. Izvestiya Samarskogo nauchnogo tsentra Rossiiskoi akademii nauk = Proceedings of Samara Scientific Center of RAS, 2013, vol. 15, no. 4, pp. 924-927.
7. Chizhova A.S. Ekonometricheskaya model' otsenki matrits veroyatnostei perekhoda kreditnykh reitingov [An econometric model for evaluating the probability matrices of changes in credit ratings]. Prikladnaya ekonometrika = Applied Econometrics, 2007, no. 3, pp. 11-26.
8. Merkov A.B. Raspoznavanie obrazov: vvedenie v metody statisticheskogo obucheniya [Pattern recognition: an introduction into statistical learning methods]. Moscow, URSS Publ., 2010, 254 p.
9. Aivazyan S.A., Enyukov I.S., Meshalkin L.D. Prikladnaya statistika. Osnovy modelirovaniya i pervichnaya obrabotka dannykh [Applied statistics. Fundamentals of modeling and primary processing of data]. Moscow, Finansy i statistika Publ., 1983, 471 p.
10. Little R.J.A., Rubin D.B. Statisticheskii analiz dannykh s propuskami [Statistical Analysis with Missing Data]. Moscow, Finansy i statistika Publ., 1990, 336 p.
11. Grin' N.V. Metodologicheskie aspekty postroeniya skoringovykh modelei. V kn.: Ekonomika, modelirovanie, prognozirovanie. Vypusk 6 [Methodological aspects of setting scoring models. In: Economics, modeling, forecasting. Issue 6]. Minsk, R&D Institute of Ministry of Economy of Republic of Belarus Publ., 2012,pp. 174-180.
12. Pfeifer P.E., Carraway R.L. Modeling Customer Relationships as Markov Chains. Journal of Interactive Marketing, 2000, vol. 14, iss. 2, pp. 43-55.
13. Sokolov G.A., Chistyakova N.A. Teoriya veroyatnostei. Upravlyaemye tsepi Markova v ekonomike [Probability theory. Controlled Markov chains in economy]. Moscow, FIZMATLIT Publ., 2005, 248 p.
14. Wasserman P. Neirokomp'yuternaya tekhnika: teoriya ipraktika [Neural Computing: Theory and Practice]. Moscow, Mir Publ., 1992, 184 p.
15. Vapnik V.N. Vosstanovlenie zavisimostei po empiricheskim dannym [Restoring correlations through empirical data]. Moscow, Nauka Publ., 1979, 448 p.
16. Vagin V.N., Golovina E.Yu., Zagoryanskaya A.A., Fomina M.V. Dostovernyi i pravdopodobnyi vyvod v intellektual'nykh sistemakh [Credible and plausible inference in intelligent systems]. Moscow, FIZMATLIT Publ., 2004, 704 p.
17. Thomas L.C., Edelman D.B., Crook J.N. Credit Scoring and its Applications: SIAM Monographs on Mathematical Modeling and Computation. SIAM, Philadelphia, USA, 2002, 248 p.
18. Alekseeva V.A., Dontsova Yu.S., Klyachkin V.N. Vosstanovlenie propushchennykh nablyudenii pri klassifikatsii ob"ektov [Missing observations recovery during objects classification]. Izvestiya Samarskogo nauchnogo tsentra Rossiiskoi akademii nauk = Proceedings of Samara Scientific Center of Russian Academy of Sciences, 2014, vol. 16, no. 6, pp. 357-359.