Научная статья на тему 'К вопросу о разработке статистических моделей вероятности дефолта в условиях дефицита данных'

К вопросу о разработке статистических моделей вероятности дефолта в условиях дефицита данных Текст научной статьи по специальности «Экономика и бизнес»

CC BY
169
35
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БАНК / РЕГУЛИРОВАНИЕ / КАПИТАЛ / РИСК / ДЕФОЛТ / МОДЕЛЬ / ВЫБОРКА / РЕГРЕССИЯ / BANK / REGULATION / CAPITAL / RISK / DEFAULT / MODEL / SAMPLE / REGRESSION

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Лужбин Алексей Анатольевич

В статье рассматриваются подходы к построению статисти-ческих моделей оценки вероятности дефолта, используемых в системах внутренних рейтингов банков в соответствии со стандартами Базель II. Анализируются возможности сниже-ния требований к объему исходных статистических данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

To the question on developing prob-ability of default statistic models in rare events data

The article deals with approaches to construction of statistical probability of default models implemented in internal ratings-based systems according to Basel II standards. Analyzes the possibilities of statistical sample size requirements reduction.

Текст научной работы на тему «К вопросу о разработке статистических моделей вероятности дефолта в условиях дефицита данных»

А. А. ЛУЖБИН

Алексееi Анатольевич ЛУЖБИН — аспирант кафедры исследования операций в экономике им. Ю.А. Львова СПбГЭУ.

В 1998 г. окончил Удмуртский государственный университет. Автор 7 публикаций.

Область научной специализации — математические и инструментальные методы в экономике. ^ ^ ^

К ВОПРОСУ О РАЗРАБОТКЕ СТАТИСТИЧЕСКИХ МОДЕЛЕЙ ВЕРОЯТНОСТИ ДЕФОЛТА В УСЛОВИЯХ ДЕФИЦИТА ДАННЫХ*

Одним из наиболее важных проектов Базельского комитета по банковскому надзору (Basel Committee on Banking Supervision) является соглашение |2|. известное в профессиональной среде под самостоятельным устойчивым термином «Базель II». Данное соглашение предлагает усовершенствованный подход к определению регулятивного капитала, основанный на внутренних моделях рейтин-гования контрагентов, самостоятельно разрабатываемых коммерческими банками (internai ratings-based approach).

В порядке имплементации современных подходов риск-менеджмента Базель II устанавливает тесную взаимосвязь между такими его объектами, как кредитный риск и капитал: кредитный риск рассматривается как фактор определения потребности в капитале. При этом среднестатистические потери банка, выражающие реализованный кредитный риск, определяются, в частности, параметром «вероятность дефолта контрагента» (probability of default, PD), что делает его наиболее релевантным из числа конечных критериев потребности в капитале.

Россия в вопросах реформы банковского регулирования и надзора следует заданному мировым сообществом вектору развития. Согласно последним заявлениям руководителей и принятым нормативным документам Банка России отечественная банковская система должна в скором времени частично перейти на принципы регулирования Базель II. Однако роль системного подхода к оценке кредитных рисков по-прежнему часто недооценивается российскими банками. Более того, развернувшаяся в настоящее время дискуссия внутри российского банковского сообщества показывает, что у значительной части его участников сложилась выжидательная и бездеятельная позиция относительно тактики внедрения международных стандартов Базель II, обусловленная целым рядом факторов, среди которых можно выделить:

• отсутствие или неразвитость методологической основы для разработки и внедрения собственных систем внутренних кредитных рейтингов;

• отсутствие достаточного объема статистики по кредитным сделкам.

В рамках настоящей статьи будет рассмотрен последний из перечисленных аспектов сформулированной выше комплексной проблемы, а именно выработка подхода к снижению требований в части объема исходных данных при разработке статистических моделей вероятности дефолта.

Под статистическими моделями подразумевается один из подходов к определению вероятности дефолта, использующий эконометрические методы для содержательной классификации контрагентов

ГРНТИ 06.35.51 © А.А. Лужбин, 2013

* Публикуется по рекомендации д-ра экон. наук, проф. В.Н. Соколова.

на основе критерия уровня сопряженного с ними кредитного риска. На сегодняшний день отраслевым стандартом среди методов статистического анализа является логистическая регрессия.

Трудность построения модели, обладающей хорошей прогностической способностью в отношении таких редких событий, как дефолт, обусловлена рядом причин, среди которых следует особо выделить неэффективность применяемых подходов к формированию представительной выборочной совокупности исходов по кредитным операциям: при весьма большом объеме выборки исследователи вынужденно используют ограниченный набор объясняющих переменных (предикторов). Редкость отрицательных исходов и вытекающая из этого необходимость большого количества наблюдений, т. е. качественного массива статистических данных, которыми банки, как правило, не располагают, становится, как ранее упоминалось, одним из сдерживающих факторов в рамках освоения отечественными банковскими институтами международных стандартов измерения кредитного риска и капитала.

В научной литературе и наработанной банковской практике содержится ряд подходов к определению минимального объема выборки и числа предикторов в модели. Так называемое «правило двадцати», или 20 EPV (events per predictor variable) [3], — используемое, отметим, в ряде крупных российских банков, — связывает минимальный объем выборки и количество объясняющих переменных модели. В соответствии с данным подходом, во-первых, необходимо использовать не менее 20-30 дефолтов на каждый предиктор, по мере увеличения количества предикторов данное требование смещается в сторону нижней границы диапазона. Во-вторых, пропорция между отрицательными исходами (дефолтами) и положительными исходами в соответствии с лучшей мировой практикой должна составлять «один к двум». При этом выбор пропорции зависит от экономической ситуации: в фазе подъема макроэкономического цикла пропорция может меняться на «один к одному» и, наоборот, в фазе рецессии — до значения «один к четырем». В-третьих, преимущественно используются все отрицательные исходы, а положительные исходы — как заведомо более многочисленные по доступному объему наблюдений — помещаются в выборку путем случайного отбора.

На наш взгляд, неудобство описанного метода состоит в том, что на этапе формирования выборки окончательный набор (сокращенный список) объясняющих переменных (факторов кредитного риска), как правило, неизвестен, поскольку названный этап предшествует фильтрационному анализу дискриминационной способности и мультиколлинеарности факторов. Кроме того, даже при минимальном начальном количестве факторов в модели, равном, скажем, 10, необходимое количество наблюдаемых дефолтов должно составить 200-300 исходов для данного сегмента контрагентов, что видится труднореализуемым требованием в условиях среднего российского банка. Сам подход, при котором произвольно задается некоторое усредненное соотношение положительных и отрицательных исходов без сопутствующих корректировок модели регрессии, не имеет под собой никакого научного обоснования, поскольку выборка в своих пропорциях должна максимально точно воспроизводить генеральную совокупность.

В рамках альтернативного способа определения минимального объема выборки на базе способа отбора в качестве параметров задаются точечная оценка доли изучаемого признака (дефолтов) в генеральной совокупности, уровень надежности и предельная ошибка этой оценки. В [1] принимается исходное допущение о неизвестном объеме генеральной совокупности и повторном отборе в рамках собственно-случайной выборки. Таким образом, может быть использована формула:

_t2-W(l-W) А2

^W

где п — минимальный объем выборки; t — значение стандартного нормального закона распределения в зависимости от выбранного уровня надежности; W — доля дефолтов по исторической выборке; Aw— максимально допустимая предельная ошибка оценки доли.

Далее требуемое количество наблюдений последовательно уменьшается за счет варьирования надежности и предельной ошибки оценки, использования верхней границы интервальной оценки доли дефолтов при одновременной корректировке выборки путем расчета аналитических весов. Однако следует отметить, что результирующее количество требуемых наблюдений остается весьма значительным.

В части обоснованности применения описанного выше способа формирования выборки хотелось бы возразить следующее. Несмотря на то, что авторы рассматривают проблему именно в контексте

прогнозирования исходов банковских кредитных операций [там же], тем не менее они упускают из виду, что под генеральной совокупностью не следует понимать бесконечный потенциально возможный входящий поток аппликантов. Действительно, уровень дефолтности внутренней среды, формируемой входящими в состав портфеля кредитными требованиями, не эквивалентен уровню дефолтности потенциальных контрагентов. И эта неэквивалентность проистекает из особенностей применяемой каждой отдельно взятой кредитной организацией технологии оценки кредитоспособности заемщиков и фильтрации аппликантов. Таким образом, объем генеральной совокупности как общее число состоявшихся кредитных сделок, часть из которых со временем перешла в состояние дефолта, должен быть известен.

Как следствие, в силу приведенных доводов историческая выборка прецедентов может оказаться заведомо нерепрезентативной, а составленная на ее основе эконометрическая модель — нефункциональной. Данный эффект возникает и в случае простого переноса модели с одной операционной банковской площадки на другую (например, в случае коммерческого приобретения модели). По этой причине представляются спорными предложения некоторых исследователей по решению проблемы дефицита статистических данных для построения моделей за счет получения доступа к накопленным базам данных Банка России, Росстата или частных компаний — разработчиков решений в области бизнес-аналитики. Следовательно, коммерческие банки должны самостоятельно разрабатывать внутренние модели с опорой на собственные статистические данные. При этом в зарубежной литературе, касающейся социальных исследований, можно обнаружить и позаимствовать сравнительно простые и нетребовательные к объему исходных данных методы формирования выборки [4].

По нашему мнению, содержательная ценность значительного объема данных наблюдений может оказаться сравнительно небольшой, в связи с чем имеется принципиальная возможность отказаться от обширного сбора статистической информации. Реальное информационное значение отрицательных исходов при использовании метода логистической регрессии превышает аналогичное свойство положительных исходов. При опережающем росте числа положительных исходов после достижения пропорции «один к одному» стандартная ошибка уменьшается медленнее: при обучении модели предельный информационный вклад положительных исходов падает. При этом по имеющимся исследованиям объем выборки от 200 наблюдений может оказаться достаточным для минимизации до приемлемого уровня систематической ошибки при оценке параметров регрессии. Таким образом, выборочная совокупность может формироваться путем включения в нее всех отрицательных исходов и пропорционального количества положительных исходов, отобранных случайным образом (эндогенная стратифицированная выборка), с последующей коррекцией модели регрессии. Такой подход ведет к принципиальному сокращению количества обрабатываемых наблюдений.

Предлагаемый в [ibid.] способ коррекции (prior correction) предполагает обычный расчет MLE-оценки логистической регрессии с использованием метода максимального правдоподобия и последующим внесением коррективы в оценочное значение скалярной константы (уровня отсечки) ß0 на

основе имеющейся информации о доле дефолтов в исходной популяции т (которая может быть приравнена к генеральной выборке в сформулированном выше ее понимании) и доле дефолтов в выборочной совокупности у . Коррекция осуществляется путем вычитания из ß0 фактора систематической ошибки:

5 ]

1 г J

При этом может быть строго доказано, что МЬЕ-оценки весовых коэффициентов при объясняющих переменных функции логистической регрессии остаются статистически надежными.

В рамках проведенного нами исследования было получено эмпирическое подтверждение справедливости указанного подхода. В качестве предмета исследования был избран субпортфель кредитов одного из коммерческих банков Санкт-Петербурга, предоставленных за последние три года наиболее многочисленному клиентскому сегменту — субъектам малого предпринимательства, работающим в сфере оптово-розничной торговли (включая недействующие кредиты). Из 953 кредитов просроченная задолженность свыше 90 дней (дефолт по классификации Базель II) была зафиксирована в 6 %

случаев, из которых пригодными к статистической обработке было признано 50 отрицательных исходов (формуляров данных, занесенных в IT-базу CRM). Пропорция между стратами выборки была выбрана сначала «два к трем», затем — «один к двум» (за счет помещения в выборку дополнительных положительных исходов). Приведенная таблица, построенная с применением пакета статистического анализа STATISTICA™, показывает, что значимых различий между оценками коэффициентов при объясняющих переменных нет, пересчету подверглось только значение константы (intercept).

Таблица

MLE-оценки логистической регрессии для двух выборок

Distribution : BINOMIAL, Link iunction: LOGIT

Effect Modeled probability that Default (0) = 0

«два к трем» «один к двум»

Estimate Standard Error Estimate Standard Error

Intercept -6,18 (-8,53) 2,24 -6,48 (-8,54) 2,25

VARI 2,69 2,95 2,57 2,94

VAR3 -2,81 2,75 -2,89 2,73

VARIO 0,44 0,35 0,50 0,34

VARll 1,56 0,50 1,63 0,50

VAR12 0,65 0,45 0,68 0,45

ЛИТЕРАТУРА

1. Центр статистического анализа. Практика построения модели логистической регрессии. URL: http://www.statmethods.ru/stati/152-modeli-logisticheskoj-regressii.html (дата обращения: 20.03.2013).

2. Basel Committee on Banking Supervision. International Convergence of Capital Measurement and Capital Standards. A Revised Framework. Comprehensive Version. 2006. June.

3. Harrel Jr., FrankE. Regression modeling strategies. New York: Springer, 2001.

4. King G., Zeng L. Logistic Regression in Rare Events Data // Political Analysis. 2001. N 9. P. 137-163.

i Надоели баннеры? Вы всегда можете отключить рекламу.