Научная статья на тему 'Социальный скоринг'

Социальный скоринг Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1427
558
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КЛАССИФИКАЦИЯ КЛИЕНТА / СОЦИАЛЬНЫЙ СКОРИНГ / ПРОФАЙЛ СОЦИАЛЬНОЙ СЕТИ / ЛОГИСТИЧЕСКАЯ РЕГРЕССИЯ / CLASSIFICATION OF THE CLIENT / SOCIAL SCORING / PROFILES OF SOCIAL NETWORKS / LOGISTIC REGRESSION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Скиба Сергей Александрович, Лойко Валерий Иванович

В статье рассматривается новый подход к классификации клиента методом кредитного скоринга на основе данных из профайлов социальных сетей. Данный подход объясняет взаимодействие с социальной сетью, как новым источником данных в кредитном процессе. При анализе были задействованы статистические методы обработки данных и соответствующий им математические аппарат. Описание данного подхода ведется в рамках проведенного эксперимента

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Скиба Сергей Александрович, Лойко Валерий Иванович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SOCIAL SCORING

The new approach to the classification of the client by a method of credit scoring on the basis of the profiles of social networks is considered in the article. The approach illustrates interaction with social networks as new data source in credit process. Statistical methods of data processing and corresponding to them mathematical tools were involved in the analysis. The description of this approach is kept within the made experiment

Текст научной работы на тему «Социальный скоринг»

УДК 336.27:519.23

СОЦИАЛЬНЫЙ СКОРИНГ

Скиба Сергей Александрович аспирант

Лойко Валерий Иванович заслуженный деятель науки РФ, д.т.н., профессор

Кубанский государственный аграрный университет, Краснодар, Россия

В статье рассматривается новый подход к классификации клиента методом кредитного скоринга на основе данных из профайлов социальных сетей. Данный подход объясняет взаимодействие с социальной сетью, как новым источником данных в кредитном процессе. При анализе были задействованы статистические методы обработки данных и соответствующий им математические аппарат. Описание данного подхода ведется в рамках проведенного эксперимента

Ключевые слова: КЛАССИФИКАЦИЯ КЛИЕНТА, СОЦИАЛЬНЫЙ СКОРИНГ, ПРОФАЙЛ СОЦИАЛЬНОЙ СЕТИ, ЛОГИСТИЧЕСКАЯ РЕГРЕССИЯ

UDC 336.27:519.23

SOCIAL SCORING

Skiba Sergey Aleksandrovich postgraduate student

Foiko Valery Ivanovich

Honoured Science Worker of Russian Federation, Dr.Sci.Tech., professor

Kuban State Agrarian University, Krasnodar, Russia

The new approach to the classification of the client by a method of credit scoring on the basis of the profiles of social networks is considered in the article. The approach illustrates interaction with social networks as new data source in credit process. Statistical methods of data processing and corresponding to them mathematical tools were involved in the analysis. The description of this approach is kept within the made experiment

Keywords: CFASSIFICATION OF THE CFIENT, SOCIAF SCORING, PROFIFES OF SOCIAF NETWORKS, FOGISTIC REGRESSION

Введение

На сегодняшний день многие кредитные организации стремятся понять, кем в действительности является их клиент, какие на самом деле он преследует цели при обращении за кредитом и каковы его потребности в настоящий момент времени.

Эффективно исследуя эти три вопроса, кредитная организация с успехом может качественно реализовать задачи выдачи кредита, сопровождения кредита, наращивания кредитного портфеля за счет имеющихся и новых клиентов.

Несмотря на то, что, даже, используя дорогие и мощные кредитно-скоринговые системы, грамотно выстроенные бизнес-процессы, обладая хорошей методологией, кредитные организации не всегда получают информацию, достаточную для принятия верных решений в процессе потребительского кредитования. И причиной этому служит то, что качество и количество данных не достаточно высоко для выявления в

них нужной и желаемой информации. Большинство кредитных организаций ограничиваются тем, что собирают информацию только из традиционно установленных и широко признанных источников: анкет-заявлений, бюро

кредитных историй, справочников служб безопасности и других внутренних и внешних списков. Все это зачастую не позволяет провести глубокий и точный анализа клиента по причине того, что данные полученные со слов клиента не всегда могут иметь достоверность; данных, полученных из внешних источников, бывает не достаточно для принятия решения; служба безопасности, как правило, не раскрывает полученную при проверки информацию, ограничиваясь лишь результатом проведенной экспертизы.

Изучая сложившуюся ситуацию, встал вопрос о необходимости выявления таких источников данных, где клиент сам мог бы рассказать о себе, причем без необходимости заведомого искажения информации, а также, чтобы эти источники были доступными и могли законно использоваться кредитными организациями.

В связи с тем, что популярные социальные сети весьма задействованы в повседневной жизни большинством людей, было предложено рассмотреть их в качестве новых нетривиальных источников данных. При взаимодействии пользователей в социальной сети неизбежен обмен типами ресурсов или потоков (капитала, информации, технологий, изображений, звуков, символов и т.д.) вокруг которых построено все общество. Сознательно или нет, пользователи предоставляют материал для оценки рисков, сообщая массу информации — начиная от смены семейного положения или работодателя и заканчивая сведениями о покупках или месте отдыха. Все это отлично иллюстрирует возможную кредитоспособность человека.

На основании изученной информации была вынесено решение о формировании рабочей группы для разработки программы по взаимодействию с социальными сетями, как новыми источниками данных. Подобная разработка способна

модифицировать имеющуюся кредитно-скоринговую систему и, тем самым, позволит снизить кредитный риск. Проект получил название «Социальный скоринг», а в рамках его реализации, перед нами были поставлены следующие задачи:

1) Определить социальные сети, которые будут задействованы в процессе извлечения данных по профайлу клиента.

2) Найти способы и методы извлечения данных.

3) Определить доступность и ценность данных.

4) Провести трансформацию данных.

5) Решить задачу анализа.

Дальнейшее разъяснение проекта изложено по всем приведенным выше пунктам.

Источник данных - социальные сети

В рамках выбора социальной сети, в качестве нового источника данных необходимо руководствоваться такими критериями как: популярность социальной сети среди клиентов кредитной организации, доступность получения данных, набор предоставляемых данных и качество самих данных.

Востребованность той или иной социальной сети была определена как экспертным методом, так и на основе статистики, полученной из карточек клиентов. Доступность получения данных проверялась на основе размещенной информации об АР1 на страницах сайтов социальных сетей [9]. Качество данных проверялось в течение реализации проекта и основывалось на заключениях экспертов-аналитиков.

Руководствуясь данными критериями, в период реализации проекта, было выявлено, что самым привлекательным источником данных является социальная сеть «В контакте», так как предоставляет широкий спектр данных, и при этом является популярной социальной сетью среди наших клиентов. Таким образом, используя данную социальную сеть, появляется высокая вероятность получения

дополнительных данных по клиентам.

Следующим выбором, в качестве источника данных, стала социальная сеть «РасеЬоок», которая уступает по популярности среди клиентов, но, тем не менее, по массиву получаемых данных приближена к «В контакте». Следовательно, по определенной категории людей всегда есть возможность получить хороший дополнительный набор данных.

Так как проект ориентирован на российского потребителя, еще одним источником данных была рассмотрена социальная сеть «Одноклассники», которая достаточно популярно используется среди клиентов, но относительно получаемого объема данных сильно уступает двум предыдущим.

Определившись со списком задействованных социальных сетей, следующим шагом стала необходимость определить, каким образом будут получены данные по клиентам.

Способы и методы извлечения данных

Для того чтобы начать процесс получения данных по клиенту, необходимо реализовать три составляющие: во-первых, запросить администрацию социальной сети о предоставлении доступа к рабочей области, во-вторых, разработать приложение, которое будет способствовать извлечению данных и, наконец, определить программу стимулирования пользователя разрешить доступ к извлечению его персональных данных.

Каждая социальная сеть предоставляет разработчику, после соответствующей регистрации, доступ к рабочей области, где может быть разработано приложение и введено в опытно-промышленную эксплуатацию.

Выбирая разработчика приложения, следует учитывать тот факт, что список доступных данных, как и сами методы извлечения, может меняться, и это влечет за собой немедленное обновление функционала программы. Следовательно, понадобится постоянное сопровождение приложения. Таким образом,

предпочтительнее иметь собственную команду программистов, нежели отдавать разработку на аутсорсинг.

Так как метод извлечения данных ориентирован на онлайн-аудиторию, следовательно, посредником между клиентом и приложением может выступать онлайн-заявка на кредит, с возможностью последующей авторизацией через приложение.

В качестве стимулирования клиента к действию по авторизации были предложены следующие маркетинговые ходы:

- Понижение процентной ставки;

- Снижение времени обработки заявки;

- Повышение максимальной суммы и срока по кредиту.

На рисунке 1 приведена форма онлайн-заявки на кредит и запрос на получение доступа к данным профайла пользователя социальной сети «В контакте».

Заявка на потребительский кредит

Сумма кредита: С

О

25000

2000 р.

£0000 р.

Срок кредита: [б месяцев

Фамилия, имя, Иванов Иван Иванович отчество:

Дата рождения: 01.01.1989

Если вы хотите ускорить решение по заявке, авторизуитесь через одну или несколько социальных сетей:

ч

В контакте

] С

РасеЬоок

Авторизация в социальной сети "В контакте" успешно пройдена.

контакте

доступ к Вш<пу

Доступ ■ дапимм профили ■ обмисто статусном строям

Прмножомо будут доступны В«іМ Л

Доступ ■ омсау Ил—ж друзей Припокеччо будет доступа оуюж Вес*** друдеЯ

Доступ к фотографіям

Прилохбччо будут доступ»» Ваий ботогдо**

Доступ к аудмозалосом ■ ямдаоэалмсам

ГТрипоясемо будут доступг» Вам* аудмомписм и оидеоэагеюч

О

Доступ и мметяамм докумемам

ГрмпоЖ^**С> будут доступні &4ЦА* ннгии И ДО*У*в"Т*

Доступ в группам

полуют доступ * Вал»* гріігт»іи

Отправить

Рисунок 1 - Форма заявки и авторизация через приложение социальной сети «В

контакте»

Пользователю предоставляется возможность авторизоваться через несколько социальных сетей в рамках одной заявки.

Метод извлечения данных был определен исходя из возможностей, предоставляемых социальными сетями. Так как каждая социальная сеть специфична по своей структуре, независима и не связана с остальными: имеет разное ограниченное время доступа, методы извлечения и набор извлекаемых данных, следовательно, потребовалась разработка трех приложений под каждую социальную сеть отдельно.

Запрос и извлечение данных реализован по открытому протоколу авторизации ОАиШ 2.0, по причине того, что данный протокол позволяет обращаться к данным профайла в автономном режиме в течение разрешенного времени, даже после закрытия пользователем браузера или ухода со страницы заявки. Таким образом, при получении большого массива данных, нет необходимости задерживать пользователя на форме заявки до момента завершения загрузки данных.

Предоставленный социальной сетью доступ к среде разработки приложения позволяет моментально проводить тестирование, определять доступность и ценность данных, выявлять и устранять замечания, а в случае необходимости, переопределять функциональные требования и вносить соответствующие изменения.

Доступность и ценность данных

В процессе разработки приложения необходимо учитывать некоторые факторы, которые существенно влияют на процесс взаимодействия с новыми источниками данных.

Во-первых, не все данные профайла, указанные в документации АР1 социальных сетей, как доступные, получается задействовать в действительности. Это обуславливается тем, что администрация социальной сети закрывает доступ к данным

или вносит определенные корректировки без своевременного отражения этих изменений в документации и какого-либо оповещения об этом самих разработчиков приложения. При этом нам приходилось как можно чаще отслеживать подобного рода изменения, чтобы фиксировать их в уже сформированном наборе получаемых данных. Во-вторых, необходимо учитывать производительность приложения при написании алгоритма, так как социальные сети ограничивают срок доступа к извлечению данных. Как правило, доступ предоставляется до суток в зависимости от политики социальной сети.

Учитывая описанные ограничения доступности данных, так же приходится принимать во внимания факторы, влияющие на ценность данных. В процессе эксперимента нами были выявлены наиболее часто встречающиеся факторы, искажающие качество данных. Во-первых, встречается недостоверная или противоречивая информация. К примеру, это могут быть недействительные контактные данные, фамилия и имя, дата рождения, образование, место работы и др. Во-вторых, зачастую указывается неполная информация. Так же примером может выступать дата рождения, указанная без года или какое-либо поле имеет пустое значение. Такие данные предлагается либо обогащать за счет указанной информации в карточки клиента, либо исключать, но предварительно используя алгоритм верификации данных (к примеру, соответствие номера телефона маске семизначного ввода и др.).

Трансформация данных

Массив извлекаемых данных характеризуется набором свойств, которые могут повлиять на эффективность работы модели и снизить достоверность результатов анализа. Факторами, ухудшающими качество данных, могут являться дубликаты, противоречия, шумы, аномальные значения, пропуски т.д. Данные могут быть разброшены, неупорядочены, представлены в форматах, с которыми не работает тот или иной алгоритм. Трансформация данных, то есть их преобразование к

определенному представлению, формату и виду, оптимальному с точки зрения решаемой задачи, призвана решить эту проблему [3].

Процессу трансформации отводится достаточно большое количество времени в проекте. Так как качество данных имеет определяющее значение на эффективность результата, именно поэтому, большое внимание уделялось обследованию получаемых данных и их преобразованию. В эксперименте к данным применялись следующие методы трансформации:

- Квантование (разбиение диапазона возможных значений числового признака на конечное количество интервалов);

- Группировка (обобщение нужной информации, объединение ее в минимально необходимое количество полей и значений);

- Настройка набора данных (преобразование типов данных, имен, названий и меток полей);

- Вычисляемые значения (расчет новых данных на основе полученных данных);

- Нормализация и кодирование (преобразование данных к числовому виду);

- Слияние (обогащение данных одной совокупности данными из другой совокупности);

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- Подстановка значений (замена одних значений другими).

В процессе обработки и анализа данных по профайлам определялись наиболее качественные, пригодные к использованию, показатели. Список показателей определялся исходя из специфики решаемой задачи.

В данной статье рассматривается трансформация с точки зрения анализ данных алгоритмами аналитической системы, не затрагивая преобразование данных в процессе ETL (extraction, transforming, loading) [3]. Этому процессу стоит посвятить отдельную тему и рассмотреть его с технической стороны. Хочу заметить лишь то, что структура хранилища предполагала консолидацию данных из всех

задействованных социальных сетей, учитывая тот факт, что один клиент мог авторизоваться в каждой из указанных социальных сетей.

В таблице 1 представлен список из нескольких, наиболее значимых показателей, которые были выявлены при работе с извлеченными данными и которые применялись при решении задач анализа.

В данной таблице кратко описаны методы трансформации, которые были применены к данным, и ожидаемый результат.

Таблица 1. Список переменных, подвергшихся трансформации

Наименовани е поля Социальная сеть Метод Результат

В К ок FB

Пол 1 1 1 Подстановка значений Перевод всех значений к общему виду "мужской", "женский".

Дата рождение 1 1 1 Настройка набора данных Перевод поля в строковый тип данных. Принимает одно из значений "указана полностью ", "указана не полностью", "нет данных".

Вычисляемые значения

Совпадение личных данных 1 1 1 Вычисляемые значения Принимает значение положительное -"true", если Фамилия и Имя заявки совпадает с Фамилией и Именем в социальной сети, иначе "false".

О себе 1 1 1 Вычисляемые значения Рассчитывается количество символов, указанных пользователем о себе. Переводится поле в строковый тип данных и формируется список возможных принимаемых значений: "нет данных", "до

Настройка набора данных 250 символов", "от 250 до 700" и "свыше 700".

Квантование

Количество друзей 1 1 1 Вычисляемые значения Подсчитывается количество всех доступных друзей пользователя.

Настройка набора данных Перевод в строковый тип данных и формируется список возможных принимаемых значений "до 100", "от 100 до 500", "свыше 500".

Квантование

Наличие категорий друзей 1 1 1 Вычисляемые значения Проверяется, заведены ли пользователем списки, разбивающие друзей по категориям. К примеру "коллеги", "близки друзья" и т.д. Если подтверждается наличие таких списков, поле принимает значение "true", иначе - "false".

Указано учебное заведение 1 0 1 Вычисляемые значения Если имеется информация об учебном заведении (школа, колледж, вуз и т.д.), поле принимает значение "true", иначе - "false".

Статус отношений 1 0 1 Подстановка значений Перевод всех значений к общему виду "нет данных", "не женат/не замужем", "в отношениях", "помолвлен(а)", "женат/замужем".

Указано место работы 1 0 1 Вычисляемые значения Если пользователем указана информация о месте работы , поле принимает значение "true", иначе - "false".

Указаны интересы 1 0 1 Вычисляемые значения Если пользователем указал информацию о личных интересах (спорт, книги, музыка и т.д.) , поле принимает значение "true", иначе - "false".

Количество видео 1 0 1 Вычисляемые значения Определяется количество видео файлов в аккаунте пользователя.

Настройка набора данных Переводится поля в строковый тип данных.

Квантование Формируется список возможных значений: "не указано", "до 50", "свыше 50".

Количество аудио 1 0 1 Вычисляемые значения Определяется количество аудио файлов в аккаунте пользователя.

Настройка набора данных Переводится поля в строковый тип данных.

Квантование Формируется список возможных значений: "не указано", "до 100", "свыше 100".

Количество фотографий 1 0 1 Вычисляемые значения Определяется количество фотографий в альбомах пользователя.

Настройка набора данных Переводится поля в строковый тип данных.

Квантование Формируется список возможных значений: "не указано", "до 5", "от 5 до 50", "свыше 50".

Указаны политические взгляды 0 0 1 Вычисляемые значения Если пользователем указал информацию о политических взглядах поле принимает значение "true", иначе -"false".

Указаны религиозные взгляды 0 0 1 Вычисляемые значения Если пользователем указал информацию о религиозных взглядах поле принимает значение "true", иначе -"false".

Присутствие в публичных группах 1 0 1 Вычисляемые значения Если имеется информация о присутствии пользователя в каких-либо публичных группах, поле принимает значение "true", иначе -"false".

Срок регистрации пользователя 1 1 1 Вычисляемые значения Вычисляется дата первой записи на странички пользователя и, на основании этой даты, формируется список возможных значений "менее 3 месяцев", "от 3 месяцев до года", "более года".

Поле «Социальная сеть» указывает на присутствие данных в определенной социальной сети. Поле «Метод» демонстрирует методы, применяемые к данным на этапе трансформации. В процессе преобразования к одному полю могли быть применены несколько методов трансформации. Поле «Результат» объясняет результат преобразования данных. Все представленные поля являются предикторами при решении задач анализа.

Решение задачи анализа

В рамках проекта «Социальный скоринг» была поставлена задача классификации клиента по типу платежеспособности с помощью статистических моделей. В основе задачи заложено понимание, что люди со схожими социально-демографическими характеристиками, привычками, статусом, стилем жизни, социальными ролями обладают схожим поведением.

Так как предполагалось построение модели на исторической совокупности данных, которая была бы способна предсказать поведение нового клиента в будущем на основе оценки его профайла в социальной сети и отнести его в определенную категорию качества, был рассмотрен метод скоринга с использованием статистического инструмента - логистическая регрессия. Логистическая регрессия позволяет не только отнести клиента к определенному классу, но также определить «степень уверенности» классификации, т.е. количественно оценить степень принадлежности клиента к определенной категории [10].

Первые результаты наблюдения были получены спустя год, за который была сформирована генеральную совокупность из 1068 заявок, имеющих статус «Кредит выдан» и состоящих из клиентов, прошедших авторизацию через социальную сеть РасеЬоок. В качестве входных параметров были использованы показатели, приведенные в таблице 1. Стоит отметить, что список сформирован из максимального числа уникальных значимых переменных под воздействием корреляционного и

факторного анализа.

Выходная зависимая переменная бинарного типа была определена, основываясь на оценке жизненного цикла кредита. Положительное значение «0» - переменная принимала в том случае, если у клиента за весь срок пользования кредитом не возникала просрочка 60+ в течение первых 8 месяцев, в таком случае клиент является «хороший», иначе переменная принимала значение «1» - «плохой» клиент [2].

Первый опыт проведения социального скоринга над договорами с жизненным циклом не менее 8 месяцев объясняется следующей ситуацией. Во-первых, данные в профайле социальных сетях достаточно быстро подвергаются изменениям, во-вторых, за первые 4 месяца было собрано достаточное для анализа количество записей, и наконец, необходимость постоянного отслеживания качества модели, определения эффективности ее работы, фиксирования результатов и осуществления корректировки и переобучения.

Ниже в таблице 2 представлены сводные сведения характеризующие процесс построения модели классификации.

Таблица 2. Сводные сведения модели классификации

Наименование характеристики Описание

Продукт - Потребительский.

Период наблюдения - 12 месяцев.

Окно наблюдения - 8 месяцев.

Размер генеральной совокупности - 1068 записей.

Источник данных - Социальная сеть БасеЬоок.

Количество клиентов со статусом «хороший» - 1011 (94,7%).

Количество клиентов со статусом «плохой» - 57 (5,3%).

Количество входящий переменных - 17.

Модель классификации и регрессии - Логистическая регрессия.

Вся генеральная совокупность была поделена на обучающее и тестовое множество в процентном соотношении 75/25 соответственно.

По результатам анализа модель на тестовом множестве смогла верно

классифицировать клиентов в 79% случаях.

В качестве графика, позволяющего оценить качество бинарной классификации, была построена ROC-кривая, которая отображает соотношение между долей верных положительных классификаций от общего числа положительных классификаций (называемой чувствительностью алгоритма классификации, Se) с долей ошибочных положительных классификаций от общего числа отрицательных классификаций (называемой специфичностью алгоритма классификации, Sp) [10]. Идеальная модель обладает 100% специфичность и чувствительностью. Однако на практике добиться этого невозможно, более того, невозможно одновременно повысить и чувствительность, и специфичность модели. Тем не менее, при решении задачи, с помощью нахождения оптимального порога отсечения (optimal cut-off value) был установлен компромисс, при котором оба показателя получают максимально возможные для себя значения: Sp = 80,8 и Se=81,7. Результаты анализа отражает график ROC-кривой, приведенный на рисунке 2.

ROC-кривая AUC: 0,89; KS: 62,70 Событие = О

Рисунок 2 - ROC-кривая На рисунке 2 ось X представляет собой координаты специфичности (Specificity,

Sp), ось Y отражает чувствительность (Sensitivity, Se). Обе координаты выражены в процентах от 1 до 100.

Для идеального классификатора график ROC-кривой проходит через верхний левый угол, где доля истинно положительных случаев составляет 100% или 1.0 (идеальная чувствительность), а доля ложно положительных примеров равна нулю. Поэтому чем ближе кривая к верхнему левому углу, тем выше предсказательная способность модели. Наоборот, чем меньше изгиб кривой и чем ближе она расположена к диагональной прямой, тем менее эффективна модель. Диагональная линия соответствует "бесполезному" классификатору, т.е. полной неразличимости двух классов [10].

Количественную интерпретацию ROC-кривой даёт показатель AUC (площадь под ROC-кривой), который представляет собой площадь, ограниченную ROC-кривой и осью доли ложных положительных классификаций. Считается, что чем выше показатель AUC, тем качественнее классификатор. В эксперименте с классификацией коэффициент AUC равен 0,89, это значение объясняет очень хорошие прогностические силы модели [10].

Выводы

Социальный скоринг в потребительском кредитовании по своему происхождению очень схож с аппликационным скорингом (application scoring), но есть существенное отличие в обрабатываемых данных. Аппликационным скорингом оценивается не заемщик, а его ответы на вопросы, указанные в анкете-заявлении. Многие полученные таким образом характеристики могут оказаться недостоверными или небрежно заполненными. Очень часто клиенты не придают особого значения различным «не существенным» вопросам. Также зачастую у клиента возникает желание завысить свои определяющие характеристики, чтобы повысить степень доверия кредитной организации на получение ссуды. Еще одним интересным фактом служит причины мошеннических действий, когда клиент умышленно искажает

информацию о себе и своих намерениях.

Но в повседневной жизни заемщик может иметь совсем разные цели, интересы и желания, не связанные с получением ссуды в кредитной организации. Использование такого источника информации, как социальная сеть, дает преимущество оценить клиента и его поведение более объективно в течение продолжительного времени, не учитывая его конкретные намерения в текущий момент.

Кроме того, как показала практика, заемщики, которые предоставляли доступ к данным по профайлу, оказывались более ответственными и платежеспособными, чем заемщики, отказавшиеся от авторизации через приложение.

Таким образом, эксперимент показал, что использование социальных сетей имеет ряд преимуществ в потребительском кредитовании при задачах прогнозирования поведения клиента и классификации его к определенной группе с точки зрения платежеспособности.

Данная модель должна оказаться полезной кредитно-финансовым организациям, в которых основным или сопутствующим инструментом в принятии решения по кредитной заявке является скоринговая оценка клиента. Многие кредитные учреждения могут использовать социальный скоринг как инструмент для обогащения информации по заемщику дополнительными сведениями. А также использование профайла пользователя позволяет выстроить еще один интерактивный канал взаимодействия с клиентом.

Список литературы

1. Ишина И.В. Скоринг - модель оценки кредитного риска // Аудит и

финансовый анализ. 2007. № 4.

2. Мэйз Э. Руководство по кредитному скорингу. - Минск. Издательство

«ГревцовПаблишер», 2008 - 464 с.

3. Паклин Н.Б., Орешков В.И. Бизнес-аналитика: от данных к знаниям. Учеб. пособие. — 2-е изд., испр. - СПб.: Питер, 2013.

4. В. А. Филиппов. Интеллектуальный анализ данных: методы и средства. Издательство «Едиториал УРСС», 2001. - 52 с.

5. Сазанов В.М. Социальные сети и технологии (Интеллектуальный Интернет). - Москва. 2010-214 с.

6. Барановская Т. П., Лойко В. И, Семенов М. И., Трубилин А. И. Информационные системы и технологии в экономике. Издательство «Финансы и статистика», 2006. - 416 с.

7. Скиба С.А., Лойко В.И Современный подход к оценке платежеспособности клиента при кредитовании//Научный журнал КубГАУ, №81(07), 2012 года. С 1-11.

8. Скиба С.А. Коллекторский скоринг, как инструмент управления дебиторской задолженностью//Наука Кубани. 2013. С 1-10.

9. Graph API Facebook. [Электронный ресурс.] Режим доступа: http s: //devel oper s. faceb ook. com/docs/reference/api/

10. Логистическая регрессия и ROC-анализ - математический аппарат. [Электронный ресурс.] Режим доступа: http://www.basegroup.ru/library/analysis/regression/logistic/

References

1. Ishina I. V. Skoring - model' ocenki kreditnogo riska // Audit i

finansovyj analiz. 2007. № 4.

2. Mjejz Je. Rukovodstvo po kreditnomu skoringu. - Minsk. Izdatel'stvo

«GrevcovPablisher», 2008 - 464 s.

3. Paklin N.B., Oreshkov V.I. Biznes-analitika: ot dannyh k znanijam. Ucheb. posobie. — 2-e izd., ispr. - SPb.: Piter, 2013.

4. V. A. Filippov. Intellektual'nyj analiz dannyh: metody i sredstva. Izdatel'stvo «Editorial URSS», 2001.-52 s.

5. Sazanov V.M. Social'nye seti i tehnologii (Intellektual'nyj Internet). - Moskva. 2010 - 214 s.

6. Baranovskaja T. P., Lojko V. I., Semenov М. I., Trubilin A. I. Informacionnye sistemy i tehnologii v jekonomike. Izdatel'stvo «Finansy i statistika», 2006. - 416 s.

7. Skiba S.A., Lojko V.I. Sovremennyj podhod k ocenke platezhesposobnosti klienta pri kreditovanii //Nauchnyj zhumal KubGAU, №81(07), 2012 goda. S 1-11.

8. Skiba S.A. Kollektorskii skoring, kak instrument upravleniia debitorskoi zadolzhennost'iu // Nauka Kubani. 2013. S 1-10.

9. Graph API Facebook. [Jelektronnyj resurs.] Rezhim dostupa: https: //devel oper s. faceb ook. com/docs/reference/api/

10. Logisticheskaja regressija i ROC-analiz - matematicheskij apparat. [Jelektronnyj resurs.] Rezhim dostupa: http://www.basegroup.ru/library/analysis/regression/logistic/

i Надоели баннеры? Вы всегда можете отключить рекламу.