УДК 336.77
СЕТИ СОЦИАЛЬНЫХ СВЯЗЕЙ КАК ИНСТРУМЕНТ МОДЕЛИРОВАНИЯ РИСКОВ МОШЕННИЧЕСТВА В ЭКСПРЕСС-КРЕДИТОВАНИИ
И. Н. МАСТЯЕВА,
кандидат технических наук, доцент, заведующая кафедрой прикладной математики E-mail: imastyaeva@mesi. ru Московский государственный университет экономики, статистики и информатики (МЭСИ)
Е. Г. СНЕГОВА,
главный специалист управления кредитных рисков розничного бизнеса E-mail: snegovalena@yandex. ru ОАО «МТС-Банк»
Банкам, выдающим экспресс-ссуды, важно уметь управлять возникающими рисками для минимизации неизбежных потерь. Авторами рассматриваются методы управления рисками внутреннего и внешнего мошенничества в экспресс-кредитовании. В качестве инструмента моделирования рисков мошенничества предлагается использовать сети социальных связей заемщиков.
Ключевые слова: розничное кредитование, скоринговая система, экспресс-кредитование, кредитные риски, операционные риски, мошенничество, сети социальных связей.
Введение
В сентябре 2012 г. Центральный банк Российской Федерации объявил, что планирует ужесточить требования к банковским резервам по потребительским кредитам. Это связано с тем, что еще в августе регулятор был насторожен резким ростом потребительского кредитования вместе с недостаточно проработанной оценкой заемщиков и пренебрежительным отношением со стороны некоторых банков к учету рисков [4]. Как заявил руководитель главной инспекции кредитных организаций Банка России В. Сафронов, инспекционные проверки зачастую выявляют непроработанность скоринговых моделей
банков, выдающих экспресс-ссуды. Причина этого явления заключается в том, что построенные карты не учитывают операционных рисков, с которыми банки не сталкивались ранее в таких объемах при классическом кредитовании, поэтому не принимали их во внимание при разработке скоринговых систем.
Экспресс-ссуды рассчитаны в основном на людей с небольшим достатком. Для этого банковского продукта характерны большой объем поступающих кредитных заявлений и небольшой доход в расчете на одного клиента. Чтобы обеспечить доходность по продукту и справиться с высокой конкуренцией на рынке, банк практически полностью перекладывает процесс принятия решений по выдаче быстрых кредитов на автоматизированные системы. В связи с этим в экспресс-ссудах появилась возможность злоупотреблений и получения кредита мошенническим путем как со стороны клиентов, так и сотрудников банков.
Банкам, выдающим экспресс-ссуды, важно уметь управлять возникающими новыми рисками для минимизации неизбежных потерь. В авторском исследовании рассматриваются методы управления рисками мошенничества в экспресс-кредитовании. В качестве инструмента для противодействия
мошенничеству предлагается использовать сеть социальных связей по данным кредитных заявлений. Разработан новый подход при построении скоринговых систем, учитывающий как кредитные, так и операционные риски. Классическая методика создания скоринговой системы дополняется результатами исследования построенной сети социальных связей.
Мошенничество в экспресс-кредитах
По статистике Банка России, в годовом исчислении розничное кредитование в России продолжает стремительно расти. По итогам 2012 г. темп роста составил 40 % против 36 % по итогам 2011 г. По данным отчетности по МСФО, на 01.01.2012 объем потребительских кредитов, выданных 20 крупнейшими по этому показателю российскими банками (на которые приходится 73 % общего портфеля), составил 4,2 трлн руб. [1]. Однако к 01.01.2013 кредитная дисциплина плательщиков ухудшилась, и сейчас почти каждый десятый гражданин, когда-либо пользовавшийся банковскими кредитами, имеет просрочку свыше 60 дней.
Помимо кредитного риска, в экспресс-кредитах существенно влияние операционного риска, который признан наиболее трудным для управления [7]. До недавнего времени операционным рискам не уделялось должного внимания и не существовало однозначного представления о них в экономической литературе [3]. Авторы будут придерживаться определения, которое дано в редакции соглашения по капиталу Базельского комитета по банковскому надзору (Базель II): «Операционный риск определяется как риск убытка в результате неадекватных ошибочных внутренних процессов, действий сотрудников и систем или внешних событий». Таким образом, из определения видно, что к операционному риску относятся как неправомерные действия сотрудников, так и мошеннические действия со стороны потенциальных заемщиков.
Пусть N - число кредитов, выданных за определенный период времени. Из них часть кредитов составляет проблемную задолженность. В структуре проблемной задолженности часть кредитов приходится на долю намеренного невозврата (мошенничества) д2, оставшаяся часть задолженности 1 - д2 возникла вследствие других причин. Таким образом, вероятность наступления потерь в случае операционного риска, связанного с мошенничест-
вом, равна q = д2. Согласно проведенной оценке в 2007 г. на основе показателей 30 крупнейших банков доля мошеннических невозвратов в экспресс-кредитовании значительно выше, чем в других видах розничного кредитования (табл. 1).
Мошенничество с кредитами - одна из основных проблем высокой доли просроченной задолженности в кредитном портфеле экспресс-ссуд. Самый эффективный метод решения проблемы - это умение распознавать случаи мошенничества на этапе принятия решения по кредиту, отказывать в выдаче ссуд таким клиентам и накапливать информацию по поведению заемщиков, в том числе выявленным случаям мошенничества, для использования в системе принятия решений в дальнейшем.
В настоящее время на рынке появляются специализированные сервисы по борьбе с мошенничеством, предоставляемые кредитными бюро. Их работа основана на поиске совпадений с параметрами предыдущих кредитных заявлений и выявлении любых несостыковок в данных, несоответствий между информацией от одного и того же заемщика и обнаружении известных случаев мошенничества. В результате работы сервиса банк получает информацию о сработавших правилах и далее использует полученную информацию по своему усмотрению. Правилом называется алгоритм, согласно которому происходит сверка данных кредитного заявления с историческими заявлениями, которые были загружены в систему ранее.
По аналогии с тем, что разработанные банком скоринговые карты имеют большую различающую способность по сравнению с готовыми [5], более эффективным средством для управления рисками мошенничества является собственная аналитика потока кредитных заявок банка, поиск значимых правил, влияющих на вероятность мошенничества, использование полученных данных в системе принятия решений. Кроме того, использование собственного сервиса противодействия мошенничеству может быть применимо совместно с вне-
Таблица 1 Доля мошеннических невозвратов
в зависимости от вида кредита, %
Вид кредитования Доля мошеннических невозвратов
Ипотека 0,0025
Автокредитование 0,51
Кредиты на неотложные нужды 0,96
Экспресс-кредитование 4,0625
шним сервисом, что способно усилить эффект от их использования.
Работа сервисов по борьбе с мошенничеством основана на анализе сети социальных связей, построенной по данным кредитных заявлений. Рассмотрим подробнее, что собой представляет подобная сеть.
Сети социальных связей
С понятием «социальная сеть» каждый современный пользователь Интернета сталкивается ежедневно на специализированных сайтах, предназначенных для построения, отражения и организации социальных взаимодействий. Однако у этого понятия существует формализованное математическое определение.
Сеть социальных связей (социальная сеть) математически - это граф G N Е), где N = {1, 2,..., п} - конечное множество вершин (агентов), Е -множество ребер, отражающих взаимодействие агентов [2].
Рассмотрим в качестве вершин (агентов) графа кредитные заявления, а в качестве множества ребер -. совпадения в данных кредитного заявления по одному из следующих параметров: ФИО и дата рождения, номер паспорта или иного документа, номер указанного домашнего/мобильного/рабочего телефона, адрес регистрации/проживания, работодатель. Сетью социальных связей первого уровня для кредитного заявления будем называть множество связанных заявлений с данным хотя бы по одному из указанных параметров. Построение социальной сети предоставляет возможность получать и принимать во внимание информацию о связанных заявлениях.
Классическая скорин-говая модель рассматривает данные кредитного заявления, обогащая их информа-
цией, полученной из бюро кредитных историй. Для учета операционных рисков в более раннем исследовании [6] предлагалось обогатить кредитное заявление также данными о торговой точке. Для более качественной оценки на внешнее мошенничество предлагается обогатить заявку также данными связанных заявок.
По данным кредитных заявлений можно построить социальную сеть. Фрагмент социальной сети первого уровня для заявки № 9154 приведен в качестве примера на рис. 1.
При указании типов связей использовались следующие обозначения:
- ФИО + ДР - в заявках совпадают фамилия, имя, отчество и дата рождения; ПАСПОРТ - в заявках совпадает номер паспорта;
МОБ_ТЕЛ - в заявках совпадает номер мобильного телефона;
ДОМ_ТЕЛ - в заявках совпадает номер домашнего телефона;
ТЕЛ_КОНТ_ЛИЦА - в заявках совпадает номер телефона контактного лица; РЕГ_АДР - в заявках совпадает адрес регистрации;
Рис. 1. Пример социальной сети первого уровня для заявки:
- ФАКТ_АДР - в заявках совпадает адрес фактического проживания;
- РАБОТА - в заявках совпадает наименование работодателя;
- РАБ_ТЕЛ - в заявках совпадает номер рабочего телефона.
9154, 1813, 3558, 4553, 5684, 6046, 6625,9141 -номера заявок; ФИО + ДР, ПАСПОРТ, МОБ_ТЕЛ, ДОМ_ТЕЛ, ТЕЛ_КОНТ_ЛИЦА, РЕГ_АДР, ФАКТ_ АДР, РАБОТА, РАБ_ТЕЛ - типы связей
Проанализировав фрагмент построенной сети (рис. 1), можно заметить следующее:
- заявки 9154 и 1813 связаны по признакам ФИО + ДР, МОБ_ТЕЛ, ПАСПОРТ. Это означает, что это один и тот же заемщик. Подозрительным в данном случае является отсутствие совпадений по адресам;
- заявки 9154 и 3558 связаны по признакам ФАКТ_ АДРЕС, ДОМ_ТЕЛ. Это означает, что это разные заемщики, проживающие в одном месте (родственники, квартиросъемщики). Однако в некоторых случаях мошенники используют подставные адреса и телефоны, в этом случае, выявив однажды подставной адрес или телефон, все связанные по этим признакам заявки будут также выявлены;
- заявки 9154 и 5684 связаны по признаку МОБ_ ТЕЛ. Это соответствует подозрительному поведению, поскольку номер мобильного телефона -личная характеристика, но при этом отсутствует совпадение по ФИО + ДР и паспорту;
- заявки 9154 и 4553, 9154 и 6625 связаны по признакам РАБОТА и РАБ_ТЕЛ. Это означает, что заемщики являются сослуживцами;
- заявки 9154 и 6046 связаны по признаку РАБОТА. Это означает, что заемщики являются сослуживцами. Подозрительным является факт несовпадения номера рабочего телефона;
- заявки 9154 и 9141 связаны по признакам ПАСПОРТ, МОБ_ТЕЛ, ТЕЛ_КОНТ_ЛИЦА, РЕГ_АДР, ДОМ_ТЕЛ. Это означает, что это один и тот же заемщик. Подозрительным в данном случае является отсутствие совпадений по ФИО+ДР. Однако это может быть связано с ошибочным написанием ФИО или даты рождения в одной из анкет.
Метод исследования
Для исследования была построена сеть на 50 тыс. заявок, которые сравнивались с 3 млн более ранних заявок.
Если поиск настроен на полное соответствие по ФИО, дате рождения и номеру паспорта (как это реализовано во внешних сервисах по хэш-коду), то могут получиться странные результаты. Например, подозрительным на мошенничество является совпадение но номеру паспорта и отсутствие совпадения по ФИО + ДР (для честного гражданина такая ситуация невозможна). Однако по факту получаем, что такое правило сработало 595 раз на исследуемой выборке. При анализе указанных данных было замечено, что в большинстве случаев данное правило срабатывало, потому что данные одного и того же заемщика вбивались в анкеты по-разному (ошибки, опечатки, замена букв «е» и «ё» и т. п.). Поэтому при поиске соответствий по ФИО + ДР и номеру паспорта необходимо использовать нечеткий поиск с допущением опечатки. В данном случае локальный сервис позволяет сделать это без проблем, поскольку данные находятся во внутренней сети банка и не шифруются. После расчета обновленного правила - совпадение по номеру паспорта и отсутствие совпадения по ФИО + ДР (с учетом возможной опечатки) - получаем, что данное правило сработало только в 77 случаях, которые уже подлежат проверке. В 87 % случаев без нечеткого поиска правило срабатывало бы неверно. Также необходимо принимать это во внимание при поиске по другим параметрам.
Также при исследовании сети целесообразно разделять связанные заявки на две группы: заявки одного и того же заемщика и заявки разных заемщиков.
Будем считать, что две заявки являются заявками одного и того же заемщика, если выполняется одно из условий:
- совпадение ФИО + ДР и номера действующего паспорта;
- совпадение ФИО + ДР и номера мобильного телефона;
- совпадение номера действующего паспорта и номера мобильного телефона.
Таким образом, на рис. 1 пары заявок 9154 и 1813, 9154 и 9141 - принадлежат одному заемщику; остальные пары - разным заемщикам.
В результате исследования выявлено связей по исследуемым заявкам с предыдущими заявками:
- разные персоны - 47 081 различных пар;
- одна и та же персона - 8 117 различных пар. После того как заявки разбиты на две группы,
посчитаем, сколько исследуемых заявок задейство-
вано в парах соответствии между одними и теми же заемщиками, между разными заемщиками. По связям с типом «разная персона» задействовано 29% заявок из выборки. По связям с типом «одна и та же персона» задействовано 13% заявок. Всего в сети с ненулевым первым уровнем участвует 37% исследуемых заявок (по некоторым заявкам обнаружены как связи с типом «та же персона», так и типом «разные персоны»), по
63 % заявок совпадений с предыдущими данными не выявлено (рис. 2).
Проанализируем статистику распределения по типам связей по связанным заявкам между разными персонами. Большинство связей между разными заемщиками установлено по номеру телефона. Совпадение по телефону контактного лица одного заемщика и каким-либо телефоном другого заемщика является самым массовым типом связей (36,7 %), на втором месте совпадение рабочего телефона одного заемщика и основного телефона другого заемщика (35 %), совпадение по адресу наблюдается в 16,9 % заявок. По некоторым из связанных заявок обнаружены несколько связей: как по телефону (телефонам), так и по адресу. Подробнее распределение связей показано в табл. 2.
Таким образом, основное внимание для данной сети следует уделять правилам, основанным на сравнении телефонов, поскольку таких связей отмечено большинство в построенной сети. Также целесообразно рассмотреть правила на основе сравнения указанных адресов. Могут быть построены комбинированные правила, основанные на том, сколько дней прошло от момента подачи последней связанной заявки, каково поведение связанных заявок (платежи без просрочек или с просрочками), были ли обнаружены признаки мошенничества в связанных заявках и т. п. Для связей типа «та же персона» следует проанализировать предыдущие заявки: был ли отказ, какова причина, либо какова платежная дисциплина в случае существующего кредита, не менялись ли существенно персональные данные. Поскольку более трети заявок вовлечено в социальную сеть, это дает существенный прирост
□ Найдены связи только с типом «разные персоны»
□ Найдены связи только с типом «та же персона»
■ Найдены оба вида связей
И Не найдено связей
Рис. 2. Вовлеченность заявок в социальную сеть, %
располагаемой информации при принятии кредитного решения.
Рассмотрим также количество связей с типом «разные заемщики» в разбивке на «плохие» заявки (есть просрочка на дату второго платежа минус один день) и «хорошие» заявки (нет просрочки на дату второго платежа минус один день). В эту статистику попадут только выявленные связи между
Таблица 2
Типы связей для социальной сети (для разных заемщиков) по исследуемым заявкам, %
Тип связи Нахождение
Рабочий телефон заемщика совпадает с домашним телефоном другого заемщика 11,7
Мобильный телефон заемщика совпадает с мобильным телефоном другого заемщика 11,6
Указанный телефон контактного лица участвует в связанной заявке в качестве основного телефона (домашнего или мобильного) 16,9
Совпадения по адресу 13,1
Домашний телефон заемщика совпадает с рабочим телефоном другого заемщика 6,4
Мобильный телефон заемщика совпадает с рабочим телефоном другого заемщика 4,8
Указанный телефон контактного лица участвует в связанной заявке также в качестве телефона контактного лица 10,9
Указанный основной телефон заемщика (домашний или мобильный) является телефоном контактного лица связанной заявки 8,3
Совпадения по нескольким телефонам 7,5
Совпадения мобильных или домашних телефонов 4,8
Совпадения по адресу и одному из телефонов 2,6
Другие связи 1,4
Заявки исследуемой выборки
Связанные заявки (тип - «другой заемщик»)
(хор\-.. —__
4—у 9' 916 свя;
—ч 2 393 свя: .........
&
^ХОРу-—
—у 1 612 свя;
/—ч 1 235 свя: —
81 %) ---\
м
(19%) —4---/
57%) _______V
в
(43%) 4----
Рис. 3. Распределение связей между «хорошими» (ХОР) и «плохими» (ПЛ) заявками
заявками с выданными кредитами. По отказанным заявкам невозможно сказать о факте платежной дисциплины по кредиту. Распределение связей показано на рис. 3.
Из данного распределения видно, что есть корреляция между поведением связанных заявок. Если связь обнаружена с «хорошей» заявкой, то с вероятностью 81 % заявка также является «хорошей», при связи с «плохой» заявкой вероятность того, что исследуемая заявка «хорошая» - только 57 %. Таким образом, данная проверка подтвердила изначальное предположение о том, что заемщики, попавшие в одну сеть социальных связей первого уровня, склонны к одинаковому поведению.
Получаем, что при построении скоринговой системы можно учитывать сеть связанных заявок для данного заемщика, включив в качестве дополнительных объясняющих переменных различные значимые характеристики связанных заявок: поведение заявки, выявленная ранее негативная информация, рассчитанный скоринговый балл связанной заявки
и др. Для этого необходимо перед анализом кредитного заявления выстраивать сеть социальных связей для данного потенциального заемщика и полученные связи использовать для системы принятия решений по заявке. Перечень конкретных факторов определяется индивидуально путем статистического анализа в зависимости от клиентского потока. Какие-то правила могут быть значимы для выбранного продукта в одном банке и быть не существенными для другого банка. Полученная новая скорин-говая модель после включения значимых факторов сетей социальных связей будет учитывать не только кредитные риски, но и риски операционные (риски мошенничества), что позволяет предполагать увеличение качества прогнозной силы системы. На исследуемой выборке при включении факторов социальной сети удалось снизить уровень просроченной задолженности на 7 % по сравнению с предыдущим уровнем благодаря лучшему качеству различающей способности системы.
Однако следует помнить, что построенная сеть - это всего лишь инструмент, позволяющий учитывать связанные заявки. Главное - каким образом будет учтено это влияние, какие аналитик разработает правила для внутренней системы противодействия мошенничеству, насколько грамотно включит их в процесс.
Заключение
Мошенничество - одна из основных проблем в экспресс-кредитовании, с которой сталкиваются банки. Рост количества выдаваемых быстрых ссуд без хорошо проработанной системы, учитывающей факторы как внутреннего, так и внешнего мошенничества, может привести к большому проценту просроченной задолженности, что повлечет прямые убытки банка.
Предлагается использовать сети социальных связей по заявкам для анализа взаимосвязей и встраивания различных факторов сети в скорин-говую систему, позволяющую в автоматическом режиме принимать решение по заявкам с учетом возможного мошенничества. В рассмотренном примере вовлеченность заявок в сеть составила 37 %,
ЭКОНОМИЧЕСКИЙ АНАЛИЗ: жеорпя к ЪР^тжгсх*
что дает основание полагать, что построение сети является хорошим инструментом для обогащения анкеты дополнительными данными с помощью анализа поведения связанных заемщиков и различных правил на несоответствия в данных по связям.
Список литературы
1. Береговая Г., ДоронкинМ., Волков С. Потребительское кредитование в России: опасная гонка // Рейтинговое агентство «Эксперт». URL: http:// raexpert. ru/editions/bulletin/10_10_12/potrebkred_ 2012.pdf
2. Губанов Д. А., Новиков Д. А., Чхартиш-вили А. Г. Социальные сети: модели информационного влияния, управления и противоборства. М.: Физматлит, 2010.
3. Дубков С. В., КузнецоваЮ. А., Дадалко В. А. Методические основы управления операционным
риском коммерческого банка // Банковский вестник. 2011. № 34.
4. Дубров А. М., Лагоша Б. А., Хрусталев Е. Ю. Моделирование рисковых ситуаций в экономике и бизнесе. М.: Финансы и статистика, 1999.
5. Руководство по кредитному скорингу / под ред. Э. Мэйз; пер. с англ. И. М. Тикота; науч. ред. Д. И. Вороненко. Минск: Гревцов Паблишер, 2008 .
6. Снегова Е. Г. Применение метода логистической регрессии для прогнозирования вероятности дефолта при экспресс-кредитовании // Национальные интересы: приоритеты и безопасность. 2013. № 5.
7. Стрелков С. В., Мастяева И. Н. Распределение рискового капитала на основе кооперативных игр // Экономика и математические методы. 2010. Т. 46. Вып. 3.