Научная статья на тему 'ОЦЕНКА КРЕДИТОСПОСОБНОСТИ ЗАЕМЩИКА СКОРИНГОВЫМИ МОДЕЛЯМИ'

ОЦЕНКА КРЕДИТОСПОСОБНОСТИ ЗАЕМЩИКА СКОРИНГОВЫМИ МОДЕЛЯМИ Текст научной статьи по специальности «Экономика и бизнес»

CC BY
312
44
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Science Time
Область наук
Ключевые слова
СКОРИНГОВЫЕ МОДЕЛИ / APPLICATION - СКОРИНГ / BEHAVIORAL - СКОРИНГ

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Кочкуров Дмитрий Сергеевич

В сложившейся сегодня экономической ситуации велик риск роста кредитных рисков, связанных с невозвратом кредитов. Одним из способов снижения кредитных рисков является применение скоринговых технологий, позволяющих быстро оценивать кредитоспособность потенциальных заемщиков на основе их личных данных и кредитных историй. В статье были рассмотрены основные виды анализа кредитоспособности заемщика, проведен анализ соответствующих скоринговых моделей, изучены преимущества и недостатки каждой.As of the current economic situation, there is a risk of growth of credit risk associated with the loan defaults. One of the way to reduce the credit risk is the using of scoring-technologies to quickly assess the creditworthiness of potential borrowers on the basis of their personal data and credit histories.The article describes the main types of analysis of the borrower's creditworthiness, the analysis of the relevant scoring models, on the basis of which it was discovered the advantages and disadvantages of each.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «ОЦЕНКА КРЕДИТОСПОСОБНОСТИ ЗАЕМЩИКА СКОРИНГОВЫМИ МОДЕЛЯМИ»



SCIENCE TIME

ОЦЕНКА КРЕДИТОСПОСОБНОСТИ ЗАЕМЩИКА СКОРИНГОВЫМИ МОДЕЛЯМИ

Кочкуров Дмитрий Сергеевич, Крымский федеральный университет им. В.И. Вернадского, г. Симферополь

E-mail: Frost5044@yandex.ru

ASSESSMENT OF SOLVENCY OF THE BORROWER SCORING MODELS

Аннотация. В сложившейся сегодня экономической ситуации велик риск роста кредитных рисков, связанных с невозвратом кредитов. Одним из способов снижения кредитных рисков является применение скоринговых технологий, позволяющих быстро оценивать кредитоспособность потенциальных заемщиков на основе их личных данных и кредитных историй.

В статье были рассмотрены основные виды анализа кредитоспособности заемщика, проведен анализ соответствующих скоринговых моделей, изучены преимущества и недостатки каждой.

Ключевые слова: оценка кредитоспособности, кредитоспособность заемщика, скоринговые модели, Application - скоринг, Behavioral - скоринг.

Abstract.. As of the current economic situation, there is a risk of growth of credit risk associated with the loan defaults. One of the way to reduce the credit risk is the using of scoring-technologies to quickly assess the creditworthiness of potential borrowers on the basis of their personal data and credit histories.

The article describes the main types of analysis of the borrower's creditworthiness, the analysis of the relevant scoring models, on the basis of which it was discovered the advantages and disadvantages of each.

Keywords: assessment of creditworthiness, the creditworthiness of the borrower, scoring models, Application - scoring, Behavioral - scoring.

Постановка проблемы. В настоящее время банковская сфера является неотъемлемой частью экономики. Именно благодаря развитию банковской системы физические и юридические лица могут брать кредиты, развивать

I

SCIENCE TIME

I

экономику и технологии на более выгодных условиях. Однако, вместе с увеличением спроса и предложения на ссудный капитал более остро встает вопрос адекватной оценки кредитоспособности потенциальных заемщиков.

На данный момент для оценки кредитоспособности физических лиц широко применяется кредитный скоринг - математическая модель оценки кредитного риска, которая основываясь на анализе набора характеристик заемщика позволяет определить его способность вернуть кредит. Точность оценки важна, поэтому чаще всего в банках используют несколько скоринговых моделей, охватывающих различные наборы характеристик. Более детальное изучение методов оценки кредитоспособности заемщика и методов сочетания этих моделей позволит рынку заемного капитала обрести необходимую гибкость и надежность.

Анализ последних исследований и публикаций. Ведущее место в направлении исследования и применения анализа кредитоспособности заемщиков принадлежит западным ученым, в частности необходимо отметить следующих ученых: С. А. Брю, Э. Хилла, Дж. К. Гэлбрейта, Э. Дж. Доллан, Дж. М. Кейнса, Р. Коттер, К. Р. Макконелла, Э. Рида, Е. Роде, П. Самуэльсона, Р. Смита, М. Шрайнера, М. Фридмена, Л. Харриса.

Большую ценность представляют собой исследования зарубежных ученых по проблемам кредитования в условиях рыночной экономики. Это научные труды М. Шрайнера, Д. Дюринга, Э. Альтмана и других.

Анализ этих работ выявил необходимость систематизировать существующий процесс принятия окончательного кредитного решения в ситуации противоречий, когда решение скоринговых моделей банка отличаются.

В отечественной литературе рассмотрены лишь отдельные вопросы кредитования. Наиболее известные из них есть работы таких ученых, как С. В. Атласа, М. С. Атлас, Н. И. Валенцева, В. С. Геращенко, В. А. Зайденварга, В. С. Захарова, Ю. И. Кашина, Л. И. Колычева, Р. В. Корнеевой, Л. Н. Красавина, А. И. Лаврушина и других авторов.

Выделение нерешенных ранее частей общей проблемы. По данным Центробанка, доля проблемных кредитов на данный момент составляет около 15 процентов [6], а международные наблюдатели говорят о цифре в два раза большей. Более того, высокий процент невозвратов вызывает повышение процентных ставок по кредитам, что, в конечном счете, отражается на пользователях кредитных продуктов, - снижает доступность кредитов. В данном случае профессионализм управления рисками в сфере розничного кредитования становится невероятно значимым элементом увеличения конкурентоспособности организации в сегменте банковских услуг.

В работе рассмотрены наиболее распространенные скоринговые модели, использующие различные наборы данных. Выработан ряд предложения по

| SCIENCE TIME Щ

выбору оптимальной модели оценки кредитоспособности заемщика.

Цель статьи. Целью работы является анализ скоринговых моделей, используемых для анализ кредитоспособности будущего заемщика, выделение наиболее оптимальной модели для оценки клиента.

Изложение основного материала. Задача кредитного скоринга состоит в автоматизированном принятии решений о выдаче кредитов. В зависимости от типа входных данных о потенциальном заемщике, используемых для анализа кредитоспособности, скоринг делится на 4-х типа.

1. Application-скоринг (кредитный скоринг) - оценка кредитоспособности заемщиков, обратившихся за кредитом по указанным в анкете данным. Это -основной барьер для многих потенциальных заемщиков. Если по результатам этой оценки клиент не набрал необходимое количество баллов, то ему отказывают в кредите или предлагают другие условия. Чаще всего, это повышение процентной ставки или уменьшение суммы кредита.

2. Fraud-скоринг (скоринг мошенничества) - это скоринг, направленный на выявление возможных мошенников среди лиц, претендующих на получение кредита, или уже существующих клиентов-заемщиков. Этот тип скоринга, как правило, используется вместе с application- и behavioral-скорингом для более детального анализа заемщиков. Анализ мошенничества в отечественной практике часто именуется «проверкой благонадежности потенциального заемщика», и, как показывает практика, его актуальность для банковского рынка достаточно велика.

3. Collection-скоринг - определение приоритетных направлений работы с неблагонадежными заемщиками. Т.е., это работа с просроченными задолженностями. В случае задержки выплат по кредиту, банк начинает работать с заемщиком, напоминая ему о необходимости погашения кредита. Чем длиннее задержка с выплатами, тем более настойчиво ведет себя банк. Так продолжается до тех пор, как за дело не возьмутся коллекторские агентства или суд.

4. Behavioral-скоринг (поведенческий скоринг) - динамическая оценка ожидаемого поведения клиента, на основании истории транзакций по его счетам - применяется для предупреждения возникновения задолженности. Методы поведенческого скоринга позволяют быстро и качественно оценить динамику изменений индивидуального кредитного счета заемщика и его кредитного портфеля в целом. Модели, используемые для этой задачи, позволяют спрогнозировать изменение платежеспособности заемщика, определить оптимальные лимиты по кредитной карте и т.д. Например, на основании поведения заемщика за предыдущие пять месяцев можно спрогнозировать его поведение в следующие два месяца. В отечественных банках этот тип скоринга практически не используется, причем не столько в силу отсутствия необходимости, сколько из-за отсутствия комплексных систем, позволяющих

проводить анализ подобного рода [6].

Особого внимания заслуживают методы, используемые в Application- и Behavioral-анализе, которые могут использоваться как отдельно друг от друга, так и во множестве комбинаций:

а) методы статистики (дискретный анализ, линейная регрессия, логистическая регрессия, деревья классификации);

б) методы исследования операций (линейное программирование, нелинейная оптимизация);

в) методы искусственного интеллекта (нейронные сети, экспертные системы, генетические алгоритмы, метод ближайшего соседа, логико-вероятностные методы, байесовские сети).

Использование статистических методов сводится к построению правила классификации, основанной на линейной скоринговой функции. При этом используются различные подходы [8].

Байесовский подход. Предполож им, чт о извест ны следующие функции и величины:

- Рс - доля «хороших» клиентов, Рв = 1 - Рь - доля «плохих» клиентов;

- p(x|G),p(x|B) - вероятность того, что «хороший» и «плохой» клиент дадут ответы х;

- L - потери от того, что «хороший» клиент был классифицирован как «плохой»;

- D - потери от классификации «плохого» клиента как «хорошего».

По формуле полной вероятности можно определить вероятность того, что клиент ответит, и затем по теореме Байеса найти:

т.е. вероятность того, что клиент с соответствующими ответами будет «хорошим» или «плохим».Средние потери в подсчетах на одного клиента составляют:

И являются минимальным при выборе:

Если допустить нормальность распределения величин р(х| с/>г р(х| в) с общей ковариационной матрицей, то можно получить линейное правило:

Такое правило означает, что при каждом выборе ответа х присваивается

«счет» - (Х) по формуле ^О) = ю1х1 + ■■■ + и означает, что содержит достаточно информации для классификации классов клиентов. Таким образом,

размерность задачи уменьшается с п с распределениями р(х|о),р(х|в), до 1 с

распределениями Нахождение правила классификации тогда

сводится к поиску оптимальной границы с из задачи оптимизации:

—► тт.

Множественная регрессия. Другой способ получить линейную функцию скоринга - использовать одну из разновидностей линейной регрессии. В простейшем случае определяется зависимая переменная Y, принимает значение 1 в случае «хорошего» клиента и 0 в случае «плохого», и затем используется метод наименьших квадратов для нахождения весов ; обеспечивает лучшие

предсказания значения у. При использовании линейной регрессии фактически происходит попытка связать вероятность дефолта г со значениями ответа на

вопрос линейной функции р = + н-----1- .

Здесь есть очевидное несоответствие: левая часть представляет собой вероятность и должна измеряться от 0 до 1, тогда как правая может принимать любые значения. Для преодоления этой проблемы значение вероятности заменяется некоторой функцией от нее, так чтобы эта функция была монотонной и принимала все значения [2].

Логистическая регрессия заменяет вероятность дефолта на логарифм шансов дефолта:

т.е., «счет клиента» связывается не с вероятностью дефолта р(в|д:) , а с отношением р(в|д:}/р(си):

Дискриминантный анализ. Используя линейные скоринговые функции, можно оценить вероятность принадлежности клиента тому или иному классу, определив следующее:

I

SCIENCE TIME

I

Далее необходимо выбрать тот класс, которому соответствует наибольший счет. В случае двух классов, это даст тот же ответ, что и линейная регрессия.

Линейное программирование. Пусть есть набор данных, которые включают в себя ответы клиентов на вопросы х1пг — ,х1п для каждого из N

клиентов и индикаторы наличия дефолта ^ . Будем искать с минимизацией

Минимизация происходит по переменным (w1J...JwnJcJali...Jflff) Также возможно минимизировать максимальную ошибку заменив все щ на одну переменную а.

Преимущества метода линейного программирования состоит в возможности включить в программу дополнительные ограничения. Например, если кредитный продукт направлен на людей молодого возраста, можно сделать дополнительное ограничения на соответствующий вес wi > w?, так что скоринговая функция будет отдавать предпочтение людям этого возраста [6]

Генетические алгоритмы предст авляют собой мет од опт имизации, не накладывающие стандартных ограничений на целевую функцию (гладкость, выпуклость и т.д.). При использовании с задачами скоринга суть генетического алгоритма состоит в генерации исходного множества скоринговой функции, с последующим использованием в функции из этого набора операций «скрещивания» и «мутации», а также исключением наименее пригодных функций.

Деревья классификации (рекурсивные алгоритмы разбиения), в отличие от предыдущих методов, не предназначены для построения целевой функции, они последовательно разделяют клиентов на группы согласно одной переменной так, чтобы эти группы максимально возможно отличались по величине кредитного риска.

Метод ближайшего соседа (англ. K-nearest neighbor algorithm, kNN) - метод автоматической классификации объектов. Основным принципом метода ближайших соседей является то, что объект присваивается к тому классу, который является наиболее распространенным среди соседей данного элемента.

ошибки .

I

SCIENCE TIME

I

Клиент классифицируется в зависимости от того, к какому классу относится большинство его соседей по выбранной метрике (рис.1).

Преимущества метода - простота обучения модели: при поступлении новых данных их добавляют к существующим, а по прошествии времени старые данные удаляют, учитывая изменение ситуации со временем.

Недостаток - необходимость полного пересмотра базы данных для классификации нового клиента (что может занимать достаточно много времени в случае больших объемов информации, например, более 105 - 106 записей). Кроме того, выбор хорошей метрики также является нетривиальной задачей, и если проводить его на основе исторических данных, то теряется основное привлекательное свойство алгоритма - отсутствие необходимости предварительного анализа данных и построения модели.

Нейронные сети - это математические модели, а также их программные или аппаратные реализации, построенные по принципу организации и функционирования биологических нейронных сетей - сетей нервных клеток живого организма.

Нейронные сети не программируются в привычном смысле этого слова, они учатся. Возможность обучения - одно из главных преимуществ нейронных сетей перед традиционными алгоритмами. В процессе обучения нейронная сеть способна выявлять сложные зависимости между входными данными и выходными, а также выполнять обобщение. Это означает, что в случае успешного обучения сеть сможет вернуть верный результат на основании данных, которые отсутствовали в обучающей выборке, а также неполных и / или «зашумленных», частично искаженных данных.

Однако, они чаще применяются для скоринга юридических лиц, чем для скоринга физических лиц. Нейронная сеть позволяет обрабатывать прецеденты обучающей выборки с более сложным видом сегментов (рис.2).

Недостатком нейронных сетей является то, что весы связей, определенные

А

А

Рис. 1 Графическое представление метода кКЫ

| SCIENCE TIME Щ

в результате обучения, не имеют никакой интерпретации в терминах кредитного риска, т.е, практически невозможно объяснить предсказания, полученное с помощью нейронной сети, а также провести анализ чувствительности, чтобы выделить наиболее значимые параметры.

Рис. 2 Графическое представление работы нейронной сети

Байесовские сети позволяют представить многомерные распределения р(б|х), р(б |лг) в виде комбинаций нескольких более низкой размерности. При этом в ходе построения модели могут быть учтены причинно-следственные связи.

Преимуществом этого метода является возможность вывода по неполным данным. Если информация о потенциальном заемщике не является полной, то алгоритм вывода обнаружит вероятность дефолта, основываясь только на доступных данных [1].

Логико-вероятностный подход основывается на сочетании методов математической логики и теории вероятности. Этот подход можно рассматривать как специальный вид нелинейной регрессии. В качестве параметров модели здесь выступают вероятности дефолта, связанного с той или иной ответ на вопрос в анкете.

Оценочная величина - вероятность дефолта. Для идентификации значений параметров используется специально адаптированные алгоритмы оптимизации [2].

Для эффективной оценки заемщиков банковское учреждение чаще использует две или более скоринговых моделей. Поэтому часто возникает

| SCIENCE TIME Щ

проблема принятия окончательного решения - в ситуации, когда решение моделей противоречат друг другу.

Существует множество способов определения эффективности моделей (общая точность модели, ошибка I и II рода, ROC-кривая и т.д.). Но они не всегда являются эффективными, поэтому банк чаще использует экспертную оценку.

Однако, у экспертного мнения есть ряд недостатков:

а) у экспертов мало времени на обдумывание ответа;

б) часть экспертной группы может иметь определенное влияние на остальные членов группы (нередко «крикливая меньшинство» может подавить большинство, и те вынуждены будут согласиться с этим предложением, понимая при этом, что аргументы меньшинства ложные);

в) невозможно проверить достоверность оценки не на практике;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

г) влияние личных предпочтений и предвзятого мнения экспертов на принятия решения [4].

Поэтому была разработана модель принятия окончательного решения, исключающая влияние человеческого фактора.

Результаты исследования. Допустим, две скоринговые модели (m = 2), независимо друг от друга принимают решения о предоставлении кредита, которое может находится в одном из двух возможных состояний (у - v2}) с

известными вероятностями pCO'PC^J + p(vz) = 1. Пусть известны вероятности ошибок первого и второго рода личных решений независимых экспертов

Тогда коллективное решение D = m, т = Тд является оптимальным с точки зрения минимума средней вероятности ошибки на множестве возможных ситуаций, а именно:

где vi,i= 172 - функция, показывающая, какое решение (vm) приняла скоринговая модель. Если в ситуации Ф тг коллективное решение D = 1

принимается в пользу v1 при условии

И решение D = 2 в пользу vz при условии

Согласно этому, можно сделать вывод, что при выполнении неравенства в первом случае, кредит предоставляется клиенту, если во втором - банк не предоставляет кредит [3, 4].

| SCIENCE TIME Щ

Модельный пример. Рассмотрим на примере одного банка алгоритм решения поставленной задачи. Для этого возьмем две скоринговые модели, используются в банке, а именно - логистическую модель и метод ближайших соседей, проанализируем их с помощью ROC-анализа, применим модель окончательного принятия коллективного решения.

В банк обратился клиент, желающий получить кредит. Заполнив анкету, мы получили все необходимые данные для оценки его кредитоспособности.

а) возраст - 23 года;

б) пол - мужской;

в) находится в браке - да;

г) количество иждивенцев - один;

д) суммарный доход, год - 500 тыс.руб.;

е) опыт работы - 3 года;

ж) срок проживания в регионе - 23 года;

з) рыночная стоимость недвижимости в собственности - 20 тыс. долларов;

и) запрашиваемая сумма кредита, год - 750 тыс.руб.

Рассмотрим первую скоринговую модель, логистическую модель. Она представлена в виде линейной функции:

1од{-^——) = -2.872 - 0.024^ + 0.79S3js2 - 0.140В;еэ - 1.5141jc4 + 0.0007х5 - 0.0033ж6

где*!- возраст; х2 - пол; - состоит в браке (да / иет);х4- количество иждивенцев; - подтвержденный годовой совокупный доход; х6 опыт работы (лет); х7 - срок проживания в регионе (лет); ~ рыночная стоимость

недвижимости в собственности (тыс. долларов); хч -запрашиваемая сумма кредита, год.

Чтобы получить возможность адекватной оценки, необходимо проранжировать полученные данные и, подставив эти значения в функцию, получим:

log j = -2.S72 - 0.024 ■ 23 + 0.7933 - 0.140В - 1.514 + 0.007 ■ 500 + 0.0033 ■ 3

Если вероятность меньше 0.5, то клиент является кредитоспособным.

Так как в банке используют две скоринговые модели, то необходимо проверить его на второй, методом ближайшего соседа. Для этой модели используют базу данных заемщиков банка и сравнивают клиента с ближайшим из них. С точки зрения математики, эта модель представляет собой выборку, которую можно изобразить на плоскости (рис.3).

Рис. 3 Графическое представление выборки

В результате оценки заемщика скоринговыми моделями получаем противоречие, для решения которой необходимо оценить эффективность каждой из них и принять окончательное решение по этому клиенту.

На основе прошлого опыта построим ROC-кривую для двух моделей и определим их эффективность, специфичность и чувствительность моделей.

Рис. 4 ROC-кривая для: а) модели логистической регрессии; в) модели методом ближайшего соседа

Таблица 1

Эффективность, чувствительность и специфичность моделей

Логистическая модель Метод ближайшего соседа

Эффективность 0,958 0,961

Специфичность (%) 88,6 91,1

Чувствительность (%) 89,7 86,8

Как видно из таблицы обе модели являются эффективными. Поэтому эту проблему необходимо решить благодаря модели принятия окончательного решения. Проверим выполнение неравенства (1):

«

I

SCIENCE TIME

I

0,53* 0,961* [1- 0.958] >0* 0.95B[1- 0.961]

и получим, что 0,214> 0, то есть неравенство (1) выполняется. Отсюда делаем вывод о кредитоспособности заемщика.

Вывод. В связи с нестабильной ситуацией в стране (санкции), одной из тенденций рынка заемного капитала является рост кредитных рисков, связанных с невозвратом кредитов. Это привело к повышению процентных ставок по кредитам, что, в конечном счете, снизило доступность кредитов для населения. Поэтому разработчики систем анализа кредитоспособности клиентов пытаются использовать в своих продуктах все виды моделей, что ведет к осложнению принятия окончательного кредитного решения в случае противоположных оценок.

Наиболее существенным научным результатом, что отражает новизну и теоретическое значение исследования, являются: оценка заемщика на основе нескольких моделей и в случае противоположных решений каждой модели, окончательное решение принимается, основываясь на построенной модели принятия коллективного решения. Кроме этого, полученный результат может быть полезным основой для дальнейших теоретических и практических исследований в данном направлении.

Литература:

1. Churchill GA, Nevin JR, Watson RR: The role of crédit scoring in the loan décision. Crédit World. - March, 1977.; Myers JH, Forgy EW The development of numerical credit evaluation systems // Journal of American Statistical Association. - September, 1963 - 15000 р - ISBN 0-87168-441-1.

2. Челноков В. А. Деньги, кредит, банки: учеб. пособие / В. А. Челноков. - М .: ЮНИТИ: ЮНИТИ-ДАНА, 2005. - 366 с. - Библиогр.: с. 362. - 30000 экз. - ISBN 5-238-00817-1.

3. Жуковская О. А., Файнзильберг Л. С. интервальной обобщение байесовской модели принятия коллективного решения в конфликтных ситуациях // Кибернетика и системный анализ. - 2005. - № 3. - 133-144 с.

4. Жуковская О. А. Интервальные модели принятия коллективных решений в конфликтных ситуациях // Международная конференция «Проблемы управления и приложения ». Минск, 2005.. 32 с. - 1000 экз.- ISBN 5-215-01358-6.

5. Ким Дж. А. Факторный, дискриминантного и кластерный анализ / Дж. О Ким, Ч. У Мюллер. - М .: Финансы и статистика, 1989. - 215 с. - 35000 пр. - ISBN 58135-0145-2.

6. Новостной портал РИА. [Электронный ресурс] Режим доступа: http://ria.ru/ economy/20150226/1049813101.html, свободный. (Дата обращения 26.01.2016 г.).

i Надоели баннеры? Вы всегда можете отключить рекламу.