Научная статья на тему 'Методы идентификации качества клиентов в системах автоматизированного кредитования с помощью визуального скоринга'

Методы идентификации качества клиентов в системах автоматизированного кредитования с помощью визуального скоринга Текст научной статьи по специальности «Экономика и бизнес»

CC BY
921
97
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАШИННОЕ ОБУЧЕНИЕ / РАСПОЗНАВАНИЕ ЛИЦ / КРЕДИТНЫЙ СКОРИНГ / НЕЙРОННЫЕ СЕТИ / ВИЗУАЛЬНЫЙ СКОРИНГ / MACHINE LEARNING / FACE RECOGNITION / CREDIT SCORING / NEURAL NETWORKS / VISUAL SCORING

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Николаев Никита Алексеевич

С развитием микрофинансирования в Российской Федерации всё большую актуальность набирает направление кредитного скоринга. В сложившихся условиях тесной конкуренции и высокой регуляторной нагрузки со стороны Центрального Банка микрофинансовые организации начинают применять всё более нетрадиционные инструменты обогащения данных о заёмщике. Таким инструментом стал визуальный скоринг. В данной статье автор приводит примеры практик визуального скоринга, используемых онлайн МФО, и делится результатами своего исследования, согласно которому допускается гипотеза о возможности наличия связи между чертами лица заёмщика и вероятностью просроченной задолженности по кредиту. Весь анализ и выводы к статье являются результатом применения технологий машинного обучения, глубинного обучения и базовых алгоритмов компьютерного зрения, доступных рядовому пользователю.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHODS FOR IDENTIFYING CUSTOMER QUALITY IN AUTOMATED CREDIT SYSTEMS USING VISUAL SCORING

With the development of microfinance in the Russian Federation, the direction of credit scoring is gaining more and more urgency. In the current conditions of close competition and high regulatory burden on the part of the Central Bank, microfinance organizations are beginning to apply increasingly unconventional tools for enriching data on the borrower. Such a tool became visual scoring. In this article, the author gives examples of the practices of visual scoring used by online MFIs and shares the results of his research, according to which the hypothesis about the possibility of a connection between the features of the borrower's face and the probability of overdue debt on the loan is allowed. All analysis and conclusions to the article are the result of the application of machine learning technologies, in-depth training and basic algorithms of computer vision available to the average user.

Текст научной работы на тему «Методы идентификации качества клиентов в системах автоматизированного кредитования с помощью визуального скоринга»

Ar ТЕОРИЯ И ТЕХНОЛОГИИ СФЕРЫ УСЛУГ

Николаев Н.А.

МЕТОДЫ ИДЕНТИФИКАЦИИ КАЧЕСТВА КЛИЕНТОВ В СИСТЕМАХ АВТОМАТИЗИРОВАННОГО КРЕДИТОВАНИЯ С ПОМОЩЬЮ ВИЗУАЛЬНОГО СКОРИНГА

Аннотация. С развитием микрофинансирования в Российской Федерации всё большую актуальность набирает направление кредитного скоринга. В сложившихся условиях тесной конкуренции и высокой регуляторной нагрузки со стороны Центрального Банка микрофинансовые организации начинают применять всё более нетрадиционные инструменты обогащения данных о заёмщике. Таким инструментом стал визуальный скоринг. В данной статье автор приводит примеры практик визуального скоринга, используемых онлайн МФО, и делится результатами своего исследования, согласно которому допускается гипотеза о возможности наличия связи между чертами лица заёмщика и вероятностью просроченной задолженности по кредиту. Весь анализ и выводы к статье являются результатом применения технологий машинного обучения, глубинного обучения и базовых алгоритмов компьютерного зрения, доступных рядовому пользователю.

Ключевые слова. Машинное обучение, распознавание лиц, кредитный скоринг, нейронные сети, визуальный скоринг

Nikolaev N.A.

METHODS FOR IDENTIFYING CUSTOMER QUALITY IN AUTOMATED CREDIT SYSTEMS USING VISUAL SCORING

Abstract. With the development of microfmance in the Russian Federation, the direction of credit scoring is gaining more and more urgency. In the current conditions of close competition and high regulatory burden on the part of the Central Bank, microfinance organizations are beginning to apply increasingly unconventional tools for enriching data on the borrower. Such a tool became visual scoring. In this article, the author gives examples of the practices of visual scoring used by online MFIs and shares the results of his research, according to which the hypothesis about the possibility of a connection between the features of the borrower's face and the probability of overdue debt on the loan is allowed. All analysis and conclusions to the article are the result of the application of machine learning technologies, in-depth training and basic algorithms of computer vision available to the average user.

Keywords. Machine learning, face recognition, credit scoring, neural networks, visual scoring.

ГРНТИ 06.73.55 © Николаев Н.А., 2017.

Никита Алексеевич Николаев - аспирант Санкт-Петербургского государственного экономического университета.

Контактные данные для связи с автором: 194295, Санкт-Петербург, Художников пр., д. 9/2 (Russia, St. Petersburg, Khudozhnikov av., 9/2). Тел.: +7 (965) 077-77-05. E-mail: nikolae-nikita@yandex.ru.

Введение

В ходе своего рабочего процесса любая кредитная организация неизбежно несет два вида потерь: во-первых, выдача кредита плохому заёмщику, который не вернет кредит, и, во-вторых, невыдача кредита хорошему заёмщику, который бы его вернул [1]. В классическом понимании проблема того, стоит ли выдавать деньги или нет, существует уже несколько тысячелетий, со времен появления ростовщичества в древнем мире. Но в ходе истории не утратила актуальности и, более того, набрала еще большую значимость.

Мы живем во времена четвертой промышленной революции, когда воспользоваться госуслугами и получить заграничный паспорт можно не вставая с дивана, аналогичным образом стала реальностью и оплата коммунальных платежей, заказ доставки еды из любимого ресторана. Так почему же человек не может получить займ онлайн, если по какой-либо причине испытывает финансовые трудности? С появлением поколения людей данного типа появился и новый вид микрофинансирования, а именно, онлайн-займы, которые можно получить в течение пятнадцати минут после подачи заявки на сайте МФО.

Во-первых, в онлайн-займах кредитный инспектор не может очно познакомиться с заёмщиком. Данная проблема сводится к так называемому визуальному скорингу, который состоит из целого ряда опорных пунктов: получение ответов на вопросы «почему он хочет получить кредит», «сколько зарабатывает», «где живет» и др. [3] В ходе данного вида тестирования инспектор проверяет соответствие реальных ответов и заполненных полей в заявке, с другой стороны - оценивает заёмщика на такие факторы, как хронические болезни, алкогольное опьянение. Следующей опорной точкой визуальной оценки заёмщика является внешний вид (одежда) и, наконец, последним опорным пунктом является оценка «привлекательности, доверительности» по лицу, мимике, поведению заёмщика.

Во-вторых, возрастает вероятность мошенничества со стороны клиента. В случае с онлайн-займом компании сложнее проверить подлинность заявителя по заявке на выдачу кредита. Основными рисками считаются: подделка документов и сканов документов, прилагаемых к заявке, обработка чужих оригинальных документов в фотошопе, использование украденных документов. Минимизировать данные риски призван отдельный вид скоринга, а именно fraud scoring или же ско-ринг на мошенничество.

В-третьих, ввиду сжатого периода рассмотрения заявки на выдачу кредита возникает проблема необходимости существования автоматизированной системы рассмотрения заявок и принятия по ним решения. Итак, в случае с онлайн-микрофинансированием компания-кредитор вынуждена максимально автоматизировать бизнес-процессы, в том числе в процессе принятия решения по заявке на получение кредита (скоринг). Беря во внимание факт сжатого временного промежутка на принятие решения, а именно - 15 минут, можно сделать вывод, что процесс скоринга должен работать с помощью модели на базе машинного обучения. Она, с одной стороны, может быстро выдавать ответ на заявку (одобрение или отказ), с другой - заменить кредитных инспекторов, что, несомненно, является преимуществом для бизнеса.

В специфике работы офлайн микрофинансовые организации сталкиваются с теми же трудностями, что и онлайн, но с меньшими рисками мошенничества со стороны клиентов. Сам же ско-ринг призван решать целый ряд задач: увеличение выдачи займов, снижение просроченной задолженности, снижение уровня мошенничества, максимизация прибыли, автоматизация и ускорение процесса обработки заявки на выдачу кредита, уменьшение влияния человеческого фактора при рассмотрении заявки на кредит. Визуальный скоринг в РФ

Вместе с ростом спроса на микрозаймы в последние годы растет и регуляторная нагрузка со стороны Центрального Банка Российской Федерации к качеству кредитного портфеля. Данная комбинация факторов сделала необходимым применение визуального кредитного скоринга. Сама же визуальная оценка заёмщика на сегодняшний день проводится в основном с целью выявления кредитного мошенничества и лишь в небольшом ряде случаев для обогащения аппликативных (анкетных) данных о заёмщике.

Например, ряд онлайн микрофинансовых организаций использует визуальный скоринг при выезде на место жительство заёмщика с целью оценки следующих факторов:

Теория и практика сервиса: экономика, социальная сфера, технологии. 2017. № 3 (33).

39

1. Не является ли данное жилье арендованным лишь для получения микрозайма. Для идентификации данного фрод-фактора используется ряд вопросов. Среди которых выезжающий на объект эксперт может попросить показать зубную щётку потенциального заёмщика или же попросить при входе в квартиру тапочки. Если же клиент затрудняется в ответе или же впадает в ступор - это может являться стоп-фактором для выдачи кредита.

2. Финансовое благосостояние заёмщика. С целью выявления уровня достатка заёмщика эксперт микрофинансовой организации тщательно оценивает гардероб заёмщика. При этом, одежда не должна быть обязательно дорогой, но ей следует быть в надлежащем состоянии (чистой). В квартире должно быть убрано. Эти данные после проверки эксперта попадают в анкету заёмщика на выдачу кредита, которые в дальнейшем используются в аппликативном скоринге. Аналогичным образом производится беглая оценки мебели и техники на месте жительства заёмщика.

3. Лицо заёмщика. При оценке данного параметра выезжающему на объект эксперту необходимо установить расовую принадлежность заёмщика, параметр гигиены (ухода за собой), здоровье заёмщика (визуально), склонность потенциального клиента к употреблению алкоголя или наркотических веществ.

При визуальной оценке заёмщика со стороны офлайн микрофинансовых организаций применяется уже абсолютно другой набор значимых параметров.

Первый. Консультируется ли клиент активно по телефону с каким-либо из лиц по поводу получения микрозайма и заполнения анкеты. Данные об этом дополнительно вносятся в анкету, используются в аппликативном скоринге (скоринге заявки). Очень активные консультации со стороны третьего лица могут быть помехой в получении кредита [5].

Второй. Кто совместно с клиентом зашел в микрофинансовую организацию. Если контингент людей, сопровождающих заёмщика, выглядит весьма сомнительно [5], высока вероятность мошенничества и/или номинального получения микрозайма. Вероятнее всего такому клиенту откажут в выдаче займа.

При этом есть и ряд факторов, в оценке которых онлайн и офлайн микрофинансовые компании сходятся во мнениям. Данные параметры оценивают и одни, и другие: расовую принадлежность, стоимость и аккуратность (чистоту гардероба) заёмщика, склонность субъекта к употреблению алкоголя и/или наркотических веществ [5].

Рынок микрофинансирования от года к году развивается. Такими же темпами растет и интерес к новым методам к визуальной оценки заёмщика. Не секрет, что испокон веков и до середины 19 века существовала такая наука, как физиогномика (с середины 19 века утратила статус науки из-за отсутствия научных методов), согласно которой о человеке многое может рассказать его лицо. Например: сила характера, эмоциональность, общительность, склонность к обману в целях достижения своей личной цели и так далее. Методика исследования

В рамках своей научной работы автор поставил перед собой задачу: выяснить с помощью методов машинного обучения и глубинного обучения - могут ли черты лица (внешность заёмщика) влиять на то, вернет ли он кредит в срок.

Объектом исследования являются данные о заемщиках в микрофинансовых организациях, кредитных потребительских кооперативах и банках, предоставленные Бюро кредитных историй, а также их фотографии, связанные хэш-тегами с соответствующими им кредитными историями.

Внешность заемщиков влияет на принятие решений о предоставлении займа среди кредиторов P2P направления (кредитование между физическими лицами), афроамериканцы больше подвержены дефолту, привлекательным людям (по фото) с большей вероятностью выдают кредит, нежели непривлекательным и так далее [6].

Методы исследования: машинное обучение, искусственные нейронные сети, компьютерное зрение (DLIP), математический классификатор [4].

Проанализировав информацию о 624 421 займах (сумма договора, пол и возраст заёмщика, количество дней просрочки и имя файла с его фотографией), мы получили определенные результаты.

На первом этапе были извлечены определённые числовые характеристики из всех фотографий. Так как фотографии сделаны на абсолютно разном расстоянии, была написана программа, которая

определяет лицо, вырезает его, определяет глаза заемщика и приводит фотографию к разрешению, удобному для анализа.

Затем, используя преобученную модель, основанную на методе комитета регрессионных деревьев, методами градиентного бустинга для каждого лица были найдены 64 точки, соответствующие границам различных частей лица (глаза, рот, нос, брови, подбородок, виски). После этого была проанализирована информация: расстояние между глазами, ширина носа, высота носа, ширина рта, расстояние от носа до подбородка, расстояние от носа до рта, среднее расстояние от носа до глаз, ширина глаз [6] и еще более двух тысяч измерений.

Была написана программа, которая анализирует данные платежеспособности, анализирует черты лица в относительных размерах. То есть, абсолютные величины анализировать нельзя, ввиду того, что фотографии всегда производятся на разном расстоянии от заемщика и анализировать черты лица можно только исходя из базовых признаков: овал лица и уровень глаз. Таким образом, стало возможной идентификация черт лица, влияющих на своевременную выплату, дефолт, просрочку.

Следующий этап - машинное обучение модели. Необходимо было сделать модель самообучаемой, чтобы она, получив в свое распоряжение новые фотографии заемщиков и скоринговые данные, формировала новые, более правильные прогнозы по заемщику [4]. Результаты

Различные варианты моделей машинного для включения биометрических данных в скоринг предоставляют различные варианты точности классификации. При этом наибольшую точность показывает именно CNN (нейронные сети). Точность классификации при использовании таких данных как пол, возраст, фотография даёт AUC на уровне 0,74, что свидетельствует о средней точности классификации. При этом, включение отдельно биометрии (скоринг по фото) предоставляет AUC на уровне 0,63 - низкая точность, но отличается от случайного предсказания (0,5) [2].

При включении биометрии в скоринг при наличии большего числа данных: кредитная история, социальные сети, анкетные данные, rtb-данные, значимость биометрических переменных очень сильно снижается и может давать прирост AUC в пределах 0,01. Для качественного источника данных прирост AUC может составлять от 0,05 и выше [4].

Таким образом, использование биометрических данных в аппликативном скоринге отлично подходит для микрофинансовых организаций, которые имеют лишь небольшой набор данных о заёмщике для принятия решения по заявке. В случае же наличия данных по кредитной истории, большого объема анкетных данных и т.д., включением лицевых черт в скоринг компании лучше пренебречь ввиду небольшого прироста точности от исходной модели и высокой трудоёмкости процесса.

ЛИТЕРАТУРА

1. Обзор ключевых показателей микрофинансовых институтов за 2-й квартал 2017 года / Центральный Банк РФ. М., 22 с.

2. Эйтшгтон В.Н., Анохин С.А. Прогнозирование банкротства: основные методики и проблемы. М.: ИНФРА-М, 2007. 124 с.

3. Serrano-Cinca C. A social and environmental approach to microfinance credit scoring. University of Bucara-manga, Colombia. 75 p.

4. Kraus A. Recent Methods from Statistics and Machine Learning for Credit Scoring. Cuvillier Verlag, 2014. 166 p.

5. Augsburg B., Fouillet C. Profit empowerment: The microfinance institutions mission drift. University of Oxford, 2013. 233 p.

6. Ravinna E. Love & Loans. The Effect of Beauty and Personal Characteristics in Credit Markets. Columbia business school, 2012. 79 p.

i Надоели баннеры? Вы всегда можете отключить рекламу.