Научная статья на тему 'ИСПОЛЬЗОВАНИЕ МАРКОВСКИХ МОДЕЛЕЙ СО МНОЖЕСТВОМ СОСТОЯНИЙ ДЛЯ ПРОГНОЗИРОВАНИЯ ВЕРОЯТНОСТИ ДЕФОЛТА ЗАЕМЩИКОВ'

ИСПОЛЬЗОВАНИЕ МАРКОВСКИХ МОДЕЛЕЙ СО МНОЖЕСТВОМ СОСТОЯНИЙ ДЛЯ ПРОГНОЗИРОВАНИЯ ВЕРОЯТНОСТИ ДЕФОЛТА ЗАЕМЩИКОВ Текст научной статьи по специальности «Математика»

CC BY
124
23
Читать
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МОДЕЛИРОВАНИЕ / КРЕДИТНЫЕ РЕЙТИНГИ / ДЕФОЛТ ЗАЕМЩИКА / МОДЕЛЬ МАРКОВА / ЛОГИСТИЧЕСКАЯ РЕГРЕССИЯ

Аннотация научной статьи по математике, автор научной работы — Балаш Владимир Алексеевич, Балаш Ольга Сергеевна, Файзлиев Алексей Раисович

Введение. После кризисов кредиторы осознали важность оценки риска дефолта по портфелям займов в различных экономических условиях. Моделирование оценки кредитного риска происходит преимущественно с использованием внутренних рейтингов банков, основанных на вероятностных моделях дефолтов заемщиков за определенный период времени. Теоретические модели. Рассмотрены три модели. Первая - наивная марковская модель с R состояниями. Приводится матрица переходов. Вторая - марковская модель со множеством состояний с ковариатами. В качестве ковариат предложены макроэкономические показатели. Третья модель - мультиномиальная логит-регрессия. Апробация марковских моделей и мультиномиальной регрессии на симулированных и реальных данных о дефолтах заемщиков. Исследуется возможность использования марковских моделей с несколькими состояниями для предсказания дефолтов заемщиков в финансовых учреждениях с течением времени. Рассматриваются три подхода для моделирования кредитного риска. Первый подход предполагает, что матрица вероятностей переходов постоянна стечением времени, а остатки марковской модели и логистической регрессии учитываются в дальнейшем при прогнозировании на временной горизонт. Второй дополнен моделью Маркова, которая учитывает влияние на миграцию рисков дефолтов, как индивидуальных факторов заемщиков, так и экономической обстановки в стране. Используя ковариаты, модели позволили одновременно оценить скорость перехода и вероятности ошибочной классификации состояний. Рассмотрена модель мультиномиальной логистической регрессии для сравнения результатов, полученных с использованием марковских моделей с несколькими состояниями. Предлагаемые модели тестируются как на реальных, так и на симулированных данных. Выводы. Представленные модели показывают хорошие прогностические результаты с высокой точностью оценки дефолтов. Модели достаточно хорошо воспроизводят структуру сгенерированных данных. Особенностью модели мультиномиальной регрессии в предсказании дефолтов можно считать то, что она хорошо настраивается, а марковские модели оценивают вероятности дефолтов. Для реализации модели было использовано программное обеспечение - пакет R.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
Предварительный просмотр
i Надоели баннеры? Вы всегда можете отключить рекламу.

USING MULTI-STATE MARKOV MODELS TO PREDICT THE PROBABILITY OF BORROWERS’ DEFAULT

Introduction. After the crises, lenders realized the importance of assessing the risk of default on loan portfolios in various economic conditions. Modeling of credit risk assessment occurs mainly using internal ratings of banks based on probabilistic models of defaults of borrowers over a certain period of time. Theoretical models. Three models are considered. The fi rst is a naive Markov model with R states. The transition matrix is given. The second is a Markov model with multiple states with covariates. Macroeconomic indicators are proposed as covariates. The third model is multinomial logit regression. Approbation of Markov models and multinomial regression on simulated and real data of borrowers’ defaults. We investigate the possibility of using multi-state Markov models to predict borrower defaults in fi nancial institutions over time. Three approaches are considered for credit risk modeling. The fi rst approach assumes that the transition probability matrix is constant over time, and the residuals of the Markov model and logistic regression are taken into account further when forecasting over the time horizon. The second one is supplemented by the Markov model, which takes into account the impact of default risks on migration, both individual factors of borrowers and the economic situation in the country. Using covariates, the models made it possible to simultaneously estimate the transition rate and the probability of erroneous classifi cation of states. A multinomial logistic regression model is considered to compare the results obtained using multi-state Markov models. The proposed models are tested both on real and simulated data. Conclusion. The presented models show good predictive results with high accuracy of default estimates. The models reproduce the structure of the generated data quite well. The peculiarity of the multinomial regression model in predicting defaults is its adjustability, and Markov models estimate the probabilities of defaults. To implement the model, software R was used.

Текст научной работы на тему «ИСПОЛЬЗОВАНИЕ МАРКОВСКИХ МОДЕЛЕЙ СО МНОЖЕСТВОМ СОСТОЯНИЙ ДЛЯ ПРОГНОЗИРОВАНИЯ ВЕРОЯТНОСТИ ДЕФОЛТА ЗАЕМЩИКОВ»

Известия Саратовского университета. Новая серия. Серия: Экономика. Управление. Право. 2023. Т. 23, вып. 1. С. 35-41 Izvestiya of Saratov University. Economics. Management. Law, 2023, vol. 23, iss. 1, pp. 35-41

https://eup.sgu.ru https://doi.org/10.18500/1994-2540-2023-23-1-35-41, EDN: GSPTVM

Научная статья УДК 330.4

Использование марковских моделей со множеством состояний для прогнозирования вероятности дефолта заемщиков

В. А. Балаш, О. С. Балаш, А. Р. Файзлиев

Саратовский национальный исследовательский государственный университет имени Н. Г. Чернышевского, Россия, 410012, г. Саратов, ул. Астраханская, д. 83

Балаш Владимир Алексеевич, доктор экономических наук, профессор кафедры дифференциальных уравнений и математической экономики, vladimirbalash@yandex.ru, https://orcid.org/0000-0002-6987-4799

Балаш Ольга Сергеевна, кандидат экономических наук, заведующий кафедрой финансов и кредита, olgabalash@mail.ru, https://orcid. org/0000-0003-0405-1836

Файзлиев Алексей Раисович, кандидат экономических наук, доцент кафедры теории функций и стохастического анализа, faizlievar@sgu.ru, https://orcid.org/0000-0001-6442-4361

Аннотация. Введение. После кризисов кредиторы осознали важность оценки риска дефолта по портфелям займов в различных экономических условиях. Моделирование оценки кредитного риска происходит преимущественно с использованием внутренних рейтингов банков, основанных на вероятностных моделях дефолтов заемщиков за определенный период времени. Теоретические модели. Рассмотрены три модели. Первая - наивная марковская модель с R состояниями. Приводится матрица переходов. Вторая -марковская модель со множеством состояний с ковариатами. В качестве ковариат предложены макроэкономические показатели. Третья модель - мультиномиальная логит-регрессия. Апробация марковских моделей и мультиномиальной регрессии на симулированных и реальных данных о дефолтах заемщиков. Исследуется возможность использования марковских моделей с несколькими состояниями для предсказания дефолтов заемщиков в финансовых учреждениях с течением времени. Рассматриваются три подхода для моделирования кредитного риска. Первый подход предполагает, что матрица вероятностей переходов постоянна с течением времени, а остатки марковской модели и логистической регрессии учитываются в дальнейшем при прогнозировании на временной горизонт. Второй дополнен моделью Маркова, которая учитывает влияние на миграцию рисков дефолтов, как индивидуальных факторов заемщиков, так и экономической обстановки в стране. Используя ковариаты, модели позволили одновременно оценить скорость перехода и вероятности ошибочной классификации состояний. Рассмотрена модель мультиномиальной логистической регрессии для сравнения результатов, полученных с использованием марковских моделей с несколькими состояниями. Предлагаемые модели тестируются как на реальных, так и на симулированных данных. Выводы. Представленные модели показывают хорошие прогностические результаты с высокой точностью оценки дефолтов. Модели достаточно хорошо воспроизводят структуру сгенерированных данных. Особенностью модели мультиномиальной регрессии в предсказании дефолтов можно считать то, что она хорошо настраивается, а марковские модели оценивают вероятности дефолтов. Для реализации модели было использовано программное обеспечение - пакет R.

Ключевые слова: моделирование, кредитные рейтинги, дефолт заемщика, модель Маркова, логистическая регрессия Благодарность: Работа выполнена при поддержке Российского научного фонда (проект № 23-21-00305).

Для цитирования: Балаш В. А., Балаш О. С., Файзлиев А. Р. Использование марковских моделей со множеством состояний для прогнозирования вероятности дефолта заемщиков // Известия Саратовского университета. Новая серия. Серия: Экономика. Управление. Право. 2023. Т. 23, вып. 1. С. 35-41. https://doi.org/10.18500/1994-2540-2023-23-1-35-41, EDN: GSPTVM Статья опубликована на условиях лицензии Creative Commons Attribution 4.0 International (CC-BY 4.0)

Article

Using Multi-state Markov models to predict the probability of borrowers' default

V. A. Balash, O. S. Balash, A. R. Faizliev K

Saratov State University, 83 Astrakhanskaya St., Saratov 410012, Russia Vladimir A. Balash, vladimirbalash@yandex.ru, https://orcid.org/0000-0002-6987-4799 Olga S. Balash, olgabalash@mail.ru, https://orcid.org/0000-0003-0405-1836 Aleksey R. Faizliev, faizlievar@sgu.ru, https://orcid.org/0000-0001-6442-4361

Abstract. Introduction. After the crises, lenders realized the importance of assessing the risk of default on loan portfolios in various economic conditions. Modeling of credit risk assessment occurs mainly using internal ratings of banks based on probabilistic models of defaults of borrowers over a certain period of time. Theoretical models. Three models are considered. The first is a naive Markov model with R states. The transition matrix is given. The second is a Markov model with multiple states with covariates. Macroeconomic indicators are proposed as covariates. The third model is multinomial logit regression. Approbation of Markov models and multinomial regression on simulated and real data of borrowers' defaults. We investigate the possibility of using multi-state Markov models to predict borrower defaults in financial institutions over time. Three approaches are considered for credit risk modeling. The first approach assumes that the transition probability matrix is constant over time, and the residuals of the Markov model and logistic regression are taken into account further when forecasting over the time horizon. The second one is supplemented by the Markov model, which takes into account the impact of default risks on migration, both individual factors of borrowers and the economic situation in the country. Using covariates, the models made it possible to simultaneously estimate the transition rate and the probability of erroneous classification of states. A multinomial logistic regression model is considered to compare the results obtained using multi-state Markov models. The proposed models are tested both on real and simulated data. Conclusion. The presented models show good predictive results with high accuracy of default estimates. The models reproduce the structure of the generated data quite well. The peculiarity of the multinomial regression model in predicting defaults is its adjustability, and Markov models estimate the probabilities of defaults. To implement the model, software R was used. Keywords: modeling, credit ratings, borrower default, Markov model, logistic regression

Acknowledgements: This work was supported by the Russian Science Foundation (project No. 23-21-00305). For citation: Balash V. A., Balash O. S., Faizliev A. R. Using Multi-state Markov models to predict the probability of borrowers' default. Izvestiya of Saratov University. Economics. Management. Law, 2023, vol. 23, iss. 1, pp. 35-41 (in Russian). https://doi.org/10.18500/1994-2540-2023-23-1-35-41, EDN: GSPTVM

This is an open access article distributed under the terms of Creative Commons Attribution 4.0 International License (CC-BY 4.0)

Введение

В настоящее время коммерческими банками России разработано множество подходов к моделированию ожидаемых кредитных убытков. Наиболее распространенным является метод, использующий оценки внешних рейтинговых агентств (International Rating Based approach).

Подход IRB представляет собой математическую модель, оценивающую факторы: PDn s i - вероятность дефолта для счета i в под-портфеле s в момент времени t; LGDi s - убыток при дефолте для счета i в подпортфеле s в момент времени t; EADi s - риск потерь при дефолте для счета i в подпортфеле s в момент времени t; остаточный эффективный срок кредита (Г).

В России в большинстве случаев заемщики не имеют рейтингов международных агентств. Поэтому моделирование оценки кредитного риска происходит преимущественно с использованием внутренних рейтингов банков, которые основаны на вероятностных моделях дефолтов заемщиков за определенный период времени. Такие модели используют комбинацию поведенческих данных (прошлые платежи и историю), а также финансовую и субъективную информацию о клиентах.

Формирование резервов банка также основывается на модели ожидаемых потерь по кредиту (ECL - Expected credit loss). Расчет ожидаемых потерь по кредитному риску рассчитывается как произведение вероятности дефолта, убытка при дефолте и риска потерь.

Если расчет ожидаемых кредитных потерь будет не точным, это станет причиной либо

чрезмерного, либо недостаточного ассигнования капитала на покрытие убытков.

На вероятности дефолта заемщиков оказывают влияние не только их индивидуальные характеристики, но и макроэкономическая ситуация в стране [1]. В условиях кризисов происходит некоторое послабление регуляторных нормативов к оценке ожидаемых кредитных потерь, устанавливаемых МСФО (1РКБ) 9. Однако регуляторы подчеркивают, что банкам необходимо пересмотреть свои методики расчета ожидаемых кредитных убытков в связи со сложившейся экономической ситуацией. В новых реалиях для оценки кредитного риска необходимо учитывать не только индивидуальные характеристики заемщика, существенно ухудшающие качество кредита, но и экономическую ситуацию. Это позволит более точно оценить способность бизнеса и физических лиц выполнять свои обязательства в среднесрочной и долгосрочной перспективе.

Большинство моделей предсказания дефолтов основаны на использовании исторических данных. Это эконометрические модели и модели дискриминантного анализа. Для улучшения качества таких моделей достаточно внесения обновленных прогнозных макроэкономических поправок, а также обновления различных финансово-экономических параметров, связанных с оценкой стоимости обеспечения банков. Использование более точной риск-сегментации кредитного портфеля, а также альтернативных алгоритмов для калибровки наблюдаемых частот дефолтов позволит получить более точные оценки вероятности дефолта.

Теоретические модели

Для оценки кредитного риска применяются статистические методологии, такие как логистические регрессии, дискриминантный анализ, анкетный анализ, деревья решений, байесовский вывод, нейронные сети и цепи Маркова.

Так D. W. Hosmer & S. Lemeshow [2], используя логистическую регрессию, оценивали вероятность перехода со временем из состояния без задолженностей в состояние дефолта. D. W. Hosmer et al. [3], A. T. Paes & A. C. Lima [4], P. Hougaard [5] исследовали несколько возможных состояний в отношениях между клиентами и финансовыми учреждениями. L. С. Thomas [6] изучал возможность применения логистической регрессии для моделирования кредитного риска. В дальнейшем M. M. So & L. С. Thomas [7] использовали цепь Маркова для моделирования переходных вероятностей в логистической модели для оценки риска портфеля кредитных карт. C. H. Jackson [8] оценивал модель Маркова с несколькими состояниями и сравнивал ее эффективность с логистической регрессией.

Банковские кредиты имеют естественную интерпретацию с точки зрения стадий задолженности. Многоуровневые модели, основанные на марковских процессах, представляют собой хороший метод оценки скорости перехода между сроками задолженности.

Наивная марковская модель

Допустим, существует R категорий. Последняя категория R соответствует дефолту. Обозначим P(t) - матрицу переходов за шаг времени т:

Pi2 - VIR \ Р22 ■■■ Vir ' Р32 ■■■ РзД .

, Vr-i,I VR-I,2 ■■■ VR-I,R J \ О О ... 1 '

Как видно из матрицы, дефолт является конечным состоянием и переход из него невозможен.

Поскольку в данном случае мы имеем дело с однородным процессом, то матрица переходов за m шагов определяется перемножением одной и той же матрицы переходов P(t):

Р(г, m) = Р(т) ■ Р(т) ■ ... ■ Р(т).

Для оценивания матрицы переходов могут быть использованы методы когорт или дюрации.

B общем случае под наивной марковской моделью подразумевается марковская модель

с непрерывным временем, переходы в которой могут происходить в любое время. Эти модели определяются интенсивностью переходов Аге(т), которая определяет как время, проведенное в текущем состоянии, так и вероятность следующего состояния.

В моделях с дискретным временем заранее известно, что переходы происходят только в момент времени t, кратные некоторой единице времени, и модель полностью управляется распределениями вероятностей состояния s(t+St) в следующие моменты времени в зависимости от состояния r(t) в текущий момент времени. Тогда вероятности P перехода за h = тт-периодов времени эквивалентны произведению матриц вероятностей перехода: Р(т,Л) = Р1(т)-Р2(т)-^-Рт(т).

Для однородного марковского процесса с непрерывным временем матрица вероятности перехода Pk постоянна во времени для каждого отдельного k. Вероятность состояния s в момент времени t + h при условии нахождения в состоянии r в момент времени t определяется записью (r,s) ячейки матрицы Pk(h) = exp(hQ), где exp() - матричная экспонента, a Q - матрица интенсивности перехода [9].

Модель Маркова со множеством

состояний с ковариатами

Предполагая, что существует непрерывный процесс, лежащий в основе данных, для подгонки матрицы вероятностей перехода P может быть использована модель с несколькими состояниями (Multi-State Models). Тогда подогнанная матрица Pk за одну единицу времени эквивалентна матрице вероятностей перехода модели дискретного времени.

В модели с несколькими состояниями часто представляет интерес, как связаны постоянные или изменяющиеся во времени характеристики индивидуума с их скоростью перехода. Модель Маркова с несколькими состояниями - это удобный способ описания процесса, в котором индивидуум проходит через серию состояний в непрерывном времени. Для нашей задачи таким индивидом является заемщик, у которого с течением времени его кредитный рейтинг (состояние) меняется от срока задолженности. Интенсивность перехода из одного состояния в другое может варьироваться в зависимости от ковариат, что приводит к неоднородной марковской модели. Ковариатами могут выступать как индивидуальные, так и групповые характеристики заемщиков, а также макроэкономические показатели, меняющиеся со временем.

(

Р(т) =

Pu Р21 Р31

Для неоднородных процессов матрица миграции кредитного рейтинга для к-заемщика рассчитывается как произведение переходных матриц по ряду интервалов:

Рк(Ь,Ь + К) =Р(5Й(С + К) = г+п

г=г

Предположим, что заемщик к находится в состоянии Бкф в момент времени Г. Движение по дискретному пространству состояний 1,..,Я определяется интенсивностями переходов ЯГ5(Г,х(Г)) для г, 5 = 1,... ,Я. Они зависят от времени Г и от набора индивидуальных или зависящих от времени объясняющих переменных х(Г). Интенсивность представляет собой мгновенный риск перехода из состояния г в состояние 5 (5 * г) [8]:

Р(5к(С + аО =*|5к(0 =г)

= Ит

Л

где дг5 образуют матрицу Q размером Я*Я, сумма строк которой равна нулю, диагональные

элементы Цг5= - 15^г Яг5.

Матрица Q используется для определения вероятностей. Если ковариаты х(Г) зависят от времени, вклад в вероятность РГ5(йГ) заменяют на Рг5(&, х(Г)), при этом требуется, чтобы значения ковариат были известны в каждый момент наблюдения Г.

Модель мультиномиальной логистической регрессии

Такие модели идеально подходят для прогнозирования матриц кредитной миграции. Модель может использовать эффект независимых переменных и предсказывать вероятности различных возможных результатов. Модель полиномиальной логистической регрессии позволяет предсказывать категориальную зависимую переменную, имеющую более двух уровней.

В модели полиномиальной логистической регрессии с зависимой переменной, имеющей Я категорий, требуется Я-1 логит-функций. Вероятность принадлежности к другим категориям сравнивается с вероятностью принадлежности к некоторой базовой категории.

Предположим, что в кредитном портфеле есть К ковариат, обозначаемых вектором X. Пусть первая категория является базовой, тогда для г = 2,...,Я логит-модели получатся следующим образом:

Р(¥1 = г) 1пР(ург1Гк +

£ А*

^¡к — гги

к=1

где для каждого случая будет Я - 1 прогнозируемых вероятностей, по одному для каждой категории относительно базовой категории. Когда г = 1, получаем 1п(1) = 0 = и ехр(0) = 1.

Апробация марковских моделей и мультиномиальной регрессии на симулированных и реальных данных о дефолтах заемщиков

Для проверки моделей использовались два набора данных по кредитам, один из которых был получен на основе симуляции, другой предоставлен банком. Чтобы более точно оценить риск просрочки платежей, также использовали историческую информацию по заемщикам.

Рассматривались пять состояний заемщиков: 1) нет задолженности; 2) задолженность 1 месяц; 3) задолженность 2 месяца; 4) задолженность 3 месяца; 5) дефолт. Заемщики переходят между соседними состояниями в зависимости от срока задолженности. Возможно улучшить рейтинг, перешагнув через соседние состояния. Переход в дефолт возможен только из предпоследнего состояния. Предполагается, что заемщик всегда начинает свой путь из первого состояния. Он может оставаться в любом состоянии, кроме состояний дефолта и успешного окончания, неограниченное время. Соответственно, дефолт и успешное завершение кредита являются конечными состояниями, и переход из них невозможен.

Нами было сгенерировано 15 тыс. акка-унтов (займов), взятых на срок 12, 24, 36, 48 и 60 месяцев. Временной горизонт составил 61 месяц. Все займы начинаются в состоянии отсутствия задолженности. Предполагается, что досрочное погашение кредита недопустимо.

Также мы располагали реальными данными одного из банков мира. Это месячные данные, относящиеся к периоду с 1 января 2010 г. по 1 января 2016 г. (73 месяца), которые включают 40 тыс. займов, 27 тыс. заемщиков и более 700 тыс. записей. Рейтинг заемщика пересматривается один раз в месяц. Мы не располагали информацией об индивидуальных характеристиках заемщика и самого займа (за исключением срока кредитования), которые, на наш взгляд, улучшили бы качество предлагаемых моделей.

Для реальных данных помимо пяти упомянутых ранее состояний заемщиков было добавлено шестое состояние - успешное погашение кредита. Состояние успешного выхода является конечным. Для симулированных данных введение такого шестого состояния не дало значимого эффекта, а вот для реальных

данных позволило существенно улучшить прогностическую способность модели. Также, поскольку мы располагали сроками, на который брался кредит, была введена фиктивная переменная, соответствующая концу срока кредита (±1 месяц).

Для проведения исследования наша выборка была разделена на обучающую выборку (24 месяца, начиная с 13 по 36) и контрольную (последние 24 месяца из выборки, начиная с 37 по 61).

Предлагаемые нами модели настраиваются и оцениваются на обучающей выборке. Тестирование проводится как на обучающей, так и на контрольной выборках. Для настройки модели была взята именно середина выборки, поскольку в ее начале еще не так много сгенерировалось контрактов. Кроме того, вполне естественно, что в реальности обучающая выборка будет выглядеть именно так, когда одни контакты только начинают свое существование, другие уже длятся некоторое время или подходят к завершению. В ходе тестирования сравниваются накопленные фактические дефолты (их вероятности) с модельными прогнозами. Мы рассматривали все действующие кредитные контракты на конкретную дату (кредитный портфель) и строили множество прогнозных кривых для каждого контракта до конца обучающей выборки. Аналогично производилось тестирование на контрольной выборке. Далее кривые усредняются по всем контрактам, и полученная накопленная вероятность дефолта сравнивается с фактической. Рассматривалось 12 таких тестовых периодов с начала обеих выборок.

Было проведено сравнение наблюдаемой распространенности состояний с ожидаемой для марковских моделей и логистических регрессий на симулированных и реальных данных, включающих скрытые категориальные и макроэкономические переменные.

Мы обнаружили, что предлагаемая модель временной зависимости, а также зависимости интенсивности перехода от ковариат дает хорошее соответствие для выживаемости кредитов, при этом достаточно хорошо различает состояния задолженности. На обучающих данных модель регрессии с пятью категориями значительно превосходит в предсказании дефолтов марковскую модель с пятью состояниями. Модельные кривые дефолтов по модели регрессии с пятью категориями близки к фактическим кривым дефолтов на контрольной выборке, в то время как марковская модель с пятью состоя-

ниями занижает вероятность дефолтов. Также стоит отметить, что к концу обучающей выборки точность марковской модели увеличивается, но мультиномиальная логистическая модель лучше адаптировалась к обучающей выборке.

Основным результатом проведенного исследования в предсказании дефолтов заемщиков на симулированных данных является то, что предлагаемые модели достаточно хорошо воспроизводят структуру сгенерированных данных, включающих в том числе скрытые переменные, соответствующие индивидуальным характеристикам заемщиков и макросоставляющей, изменяющейся во времени.

Далее мы сравнили результаты моделирования марковских моделей и мультиномиальной логистической регрессии с шестью состояниями, используя реальные данные, включающие категориальные (индивидуальные характеристики заемщиков) и макроэкономические показатели. В качестве категориальной переменной была введена фиктивная (бинарная) переменная, отвечающая за погашение кредита в срок. Также в рассматриваемых моделях была добавлена бинарная переменная по сроку выдачи кредита (меньше или больше двух лет).

В качестве макроэкономических показателей мы рассматривали динамику ВВП, уровня инфляции, ставки рефинансирования и курс национальной валюты к доллару США. Необходимо было отобрать наиболее значимые факторы, влияющие на вероятности переходов между состояниями. Проведенное нами предварительное корреляционное исследование влияния макроэкономических факторов на вероятности переходов показало, что наиболее значимой переменной является темп прироста инфляции.

На реальных данных рассматриваемый период был разделен также на обучающую (24 месяца) и контрольную (37 последних месяцев) выборки. Оценивание и тестирование моделей проходило по аналогии с симулированными данными.

Результаты моделирования показали, что примерно до 12 месяцев модели достаточно точно предсказывают выживаемость кредитов. По прошествии времени доля заемщиков, которые, согласно прогнозам, перешли в дефолт, оказывается заниженной моделью, а доля действующих контрактов и находящихся в состоянии «без задолженности» завышается. Введенное нами новое состояние успешного завершения кредита также достаточно хорошо предсказывается, хоть и незначительно занижается вероятность

перехода в него с течением времени. Можно утверждать, что предлагаемая модель временной зависимости, а также зависимости интенсивности перехода от ковариат дает хорошее соответствие для выживаемости кредитов, при этом достаточно хорошо различает состояния задолженности.

На обучающих данных модель мультиномиальной регрессии с шестью категориями значительно превосходит в предсказании дефолтов марковской модели с шестью состояниями. Модельные кривые дефолтов по мультиномиальной модели с шестью категориями близки к фактическим кривым дефолтов на обучающей выборке в большинстве случаях. В то время как марковская модель с шестью состояниями занижает вероятность дефолтов.

Необходимо отметить, что добавление макроэкономических и категориальных переменных в модели позволило существенно улучшить ее обучение. Без учета данных факторов модели имели линейную структуру распространенности состояний, а расхождение в наблюдаемой распространенности состояний и ожидаемой достигало десятки процентов.

Выводы

Данная работа посвящена оптимизации моделей вероятности дефолта, основанных на портфельном анализе. Для проверки модели были использованы два набора данных по кредитам, один предоставлен банком, другой получен на основе симуляции. Мы используем историческую информацию на уровне аккаун-та, чтобы более точно оценить риск просрочки платежей. Тестирование модели на эмпирических данных показало необходимость использования макроэкономических измерений для оценки риска дефолта по кредитному портфелю. Модели показывают, как экономические переменные, такие как ВВП, безработица и индексы цен, влияют как напрямую, изменяя динамику кредитных рейтингов, так и косвенно, влияя на количество займов. Таким образом, было спрогнозировано будущее состояние заемщика на основе текущего состояния, информации о его профиле и предполагаемых сценариях развития экономики страны.

Предлагаемые в работе модели достаточно хорошо воспроизводят структуру сгенерированных нами данных, включающих в том числе скрытые переменные, соответствующие индивидуальным характеристикам заемщиков и макросоставляющей, изменяющейся во времени. Особенностью модели мультиномиальной

регрессии в предсказании дефолтов можно считать то, что она хорошо настраивается (возможно, даже переобучается), а марковские модели достаточно хорошо оценивают вероятности дефолтов на тестовой выборке. В случае реальных данных приходится сталкиваться с проблемой подбора истинных макропеременных, определяющих вероятности переходов между состояниями заемщиков.

Список литературы

1. Антонов А., Сорокин Р. Оптимизация моделей оценки вероятности дефолта в кризисных условиях // Риск-менеджмент в кредитных организациях. 2020. № 2 (38). С. 20-36.

2. Hosmer D. W., Lemeshow S. Applied Logistic Regression. 2nd ed. New York ; Wiley, 2000. 374 p. https://doi. org/10.1002/0471722146

3. Hosmer D. W., Lemeshow S., May S. Applied Survival Analysis: Regression Modeling of Time-to-Event Data. 2nd ed. Hoboken, NJ : John Wiley & Sons, 2008. 392 p.

4. Paes A. T., Lima A. С. A SAS macro for estimating transition probabilities in semiparametric models for recurrent events // Comput Methods Programs Biomed. 2004. Vol. 75, iss. 1. P. 59-65. https://doi.org/10.1016/j. cmpb.2003.08.007

5. Hougaard P. Multi-state models: A review // Lifetime Data Analysis. 1999. Vol. 5, iss. 3. P. 239-264. https:// doi.org/10.1023/a:1009672031531

6. Thomas L. С. Consumer Credit Models: Pricing, Profit and Portfolio. Oxford : Oxford University Press, 2009. 386 p. https://doi.org/10.1093/acprof:oso/ 9780199232130.001.1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7. So M. M. С., Thomas L. С. Modeling and model validation of the impact of the economy on the credit risk of credit card portfolios // The Journal of Risk Model Validation. 2010. Vol. 4, iss. 4. P. 93-126. https://doi. org/10.21314/JRMV.2010.064

8. Jackson С. H. Multi-state modeling with R: The MSM package version 0.6. London : Imperial College. Retrieved in 16 July 2013. URL: https://cran.r-project.org/ web/packages/msm/vignettes/msm-manual.pdf (дата обращения: 01.12.2022).

9. Kalbfleisch J. D., Lawles J. F. The Analysis of Panel Data under a Markov Assumption // Journal of the American Statistical Association. 1985. Vol. 80, № 392. P. 863-871. https://doi.org/10.2307/2288545

References

1. Antonov A., Sorokin R. Optimizing valuation models default probabilities in crisis conditions. Risk-menedzh-ment v kreditnykh organizatsiyakh [Risk Management in a Credit Institution], 2020, no. 2 (38), pp. 20-36 (in Russian).

2. Hosmer D. W., Lemeshow S. Applied Logistic Regression. 2nd ed. New York, Wiley, 2000. 374 p. https://doi. org/10.1002/0471722146

3. Hosmer D. W., Lemeshow S., May S. Applied Survival Analysis: Regression Modeling of Time-To-Event Data. 2nd ed. Hoboken, NJ, John Wiley & Sons, 2008. 392 p.

4. Paes A. T., Lima A. C. A SAS macro for estimating transition probabilities in semiparametric models for recurrent events. Comput Methods Programs Biomed, 2004, vol. 75, iss. 1, pp. 59-65. https://doi.org/10.1016/j. cmpb.2003.08.007

5. Hougaard P. Multi-state models: A review. Lifetime Data Analysis, 1999, vol. 5, iss. 3, pp. 239-264. https://doi. org/10.1023/a:1009672031531

6. Thomas L. C. Consumer Credit Models: Pricing, Profit and Portfolio. Oxford, Oxford Univer-

sity Press, 2009. 386 p. https://doi.org/10.1093/ acprof:oso/9780199232130.001.1

7. So M. M. C., Thomas L. C. Modeling and model validation of the impact of the economy on the credit risk of credit card portfolios. The Journal of Risk Model Validation, 2010, vol. 4, iss. 4, pp. 93-126. https://doi. org/10.21314/JRMV.2010.064

8. Jackson C. H. Multi-state modeling with R: the MSM package version 0.6. London: Imperial College. Retrieved in 16 July 2013. Available at: https://cran.r-project.org/web/packages/msm/vignettes/msm-manual. pdf (accessed 1 December 2022).

9. Kalbfleisch J. D., Lawles J. F. The Analysis of Panel Data under a Markov Assumption. Journal of the American Statistical Association, 1985, vol. 80, no. 392, pp. 863-871. https://doi.org/10.2307/2288545

Поступила в редакцию 10.01.2023; одобрена после рецензирования 15.01.2023; принята к публикации 19.01.2023 The article was submitted 10.01.2023; approved after reviewing 15.01.2023; accepted for publication 19.01.2023

i Надоели баннеры? Вы всегда можете отключить рекламу.