Научная статья на тему 'РАЗРАБОТКА МОДЕЛИ СОЦИАЛЬНОГО СКОРИНГА НА ПРИМЕРЕ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ХАРАКТЕРИСТИК НАСЕЛЕНИЯ'

РАЗРАБОТКА МОДЕЛИ СОЦИАЛЬНОГО СКОРИНГА НА ПРИМЕРЕ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ХАРАКТЕРИСТИК НАСЕЛЕНИЯ Текст научной статьи по специальности «Экономика и бизнес»

CC BY
5
5
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
социальный скоринг / логистическая регрессия / социальные сети / ROC-анализ / социальный профиль / social scoring / logistic regression / social networks / ROC analysis / social profile

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Кудрявцева Т.Ю., Королёва Е.В., Ефимов Е.А.

Деятельность банковского сектора в финансовой системе государства является важным фактором повышения социально-экономического развития. Потребительское кредитование является драйвером спроса на товары и услуги. Направление оценки кредитоспособности заемщиков – физических лиц достаточно хорошо функционирует в настоящее время, существует множество методик и подходов, однако наравне с этим существуют и проблемы, недочеты, которые нужно устранять. Для обеспечения непрерывного оборота капитала в экономике одной из основных задач банков является снижение объема проблемной задолженности. Целью исследования является разработка модели социального скоринга с использованием современных подходов к обработке и анализу Big data. Научной новизной исследования является разработка авторской модели оценки социально-экономических характеристик населения на основании данных из социальных сетей посредством построения логистической регрессии. Практическая значимость исследования заключается в том, что разработанная модель может использоваться кредитными организациями в качестве дополнительного инструмента к стандартной методике скорингового анализа кредитоспособности физических лиц.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE ELABORATION OF A SOCIAL SCORING MODEL USING THE EXAMPLE OF SOCIAL AND ECONOMIC CHARACTERISTICS OF RESIDENTS

The activities of the banking sector in the financial system of the state are an important factor in increasing socio-economic development. Consumer lending is a driver of demand for goods and services. The direction of assessing the creditworthiness of individual borrowers is functioning quite well at present; there are many methods and approaches, however, along with this, there are also problems and shortcomings that need to be eliminated. To ensure the continuous circulation of capital in the economy, one of the main tasks of banks is to reduce the volume of problem debt. The purpose of the study is to develop a social scoring model using modern approaches to processing and analyzing Big data. The scientific novelty of the study is the development of the author’s model for assessing the socio-economic characteristics of the population based on data from social networks through the construction of logistic regression. The practical significance of the study lies in the fact that the developed model can be used by credit institutions as an additional tool to the standard methodology for scoring analysis of the creditworthiness of individuals.

Текст научной работы на тему «РАЗРАБОТКА МОДЕЛИ СОЦИАЛЬНОГО СКОРИНГА НА ПРИМЕРЕ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ХАРАКТЕРИСТИК НАСЕЛЕНИЯ»

УДК 338.242.2 JEL C23, О16

РАЗРАБОТКА МОДЕЛИ СОЦИАЛЬНОГО СКОРИНГА НА ПРИМЕРЕ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ХАРАКТЕРИСТИК НАСЕЛЕНИЯ

Кудрявцева Т.Ю. д-р экон. наук, профессор, профессор Высшей инженерно-экономической школы, ORCID 0000-0003-1403-3447, e-mail: kudryavtseva_tyu@spbstu.ru, Санкт-Петербургский Политехнический Университет Петра Великого, г. Санкт-Петербург, Российская Федерация.

Королёва Е.В. канд. экон. наук, доцент, доцент Высшей инженерно-экономической школы, ORCID 0000-0003-2640-5906, e-mail: koroleva_ev@spbstu.ru, Санкт-Петербургский Политехнический Университет Петра Великого, г. Санкт-Петербург, Российская Федерация.

Ефимов Е.А. аспирант Высшей инженерно-экономической школы, ORCID 00000001-8177-1082, e-mail: evg.efimov97@gmail.com, Санкт-Петербургский Политехнический Университет Петра Великого, г. Санкт-Петербург, Российская Федерация.

Аннотация. Деятельность банковского сектора в финансовой системе государства является важным фактором повышения социально-экономического развития. Потребительское кредитование является драйвером спроса на товары и услуги. Направление оценки кредитоспособности заемщиков - физических лиц достаточно хорошо функционирует в настоящее время, существует множество методик и подходов, однако наравне с этим существуют и проблемы, недочеты, которые нужно устранять. Для обеспечения непрерывного оборота капитала в экономике одной из основных задач банков является снижение объема проблемной задолженности. Целью исследования является разработка модели социального скоринга с использованием современных

подходов к обработке и анализу Big data. Научной новизной исследования является разработка авторской модели оценки социально-экономических характеристик населения на основании данных из социальных сетей посредством построения логистической регрессии. Практическая значимость исследования заключается в том, что разработанная модель может использоваться кредитными организациями в качестве дополнительного инструмента к стандартной методике скорингового анализа кредитоспособности физических лиц.

Ключевые слова: социальный ско-ринг, логистическая регрессия, социальные сети, ROC-анализ, социальный профиль.

THE ELABORATION OF A SOCIAL SCORING MODEL USING THE EXAMPLE OF SOCIAL AND ECONOMIC CHARACTERISTICS

OF RESIDENTS

Kudryavtseva T.Yu. Doctor of Economic Sciences, Professor, Professor of the Higher School of Engineering and Economics, ORCID 0000-0003-1403-3447, e-mail: kudrya-vtseva_tyu@spbstu.ru, Peter the Great St. Petersburg Polytechnic University, St. Petersburg, Russian Federation.

© Т.Ю. Кудрявцева, Е.В. Королёва, Е.А. Ефимов, 2024

Koroleva E.V. Candidate of Economic Sciences, Associate Professor, Associate Professor of the Higher School of Engineering and Economics, ORCID 0000-0003-2640-5906, email: koroleva_ev@spbstu.ru, Peter the Great St. Petersburg Polytechnic University, St. Petersburg, Russian Federation.

Efimov E.A. postgraduate student of the Higher School of Engineering and Economics, ORCID 0000-0001-8177-1082, e-mail: evg.efimov97@gmail.com, Peter the Great St. Petersburg Polytechnic University, St. Petersburg, Russian Federation.

Abstract. The activities of the banking sector in the financial system of the state are an important factor in increasing socio-economic development. Consumer lending is a driver of demand for goods and services. The direction of assessing the creditworthiness of individual borrowers is functioning quite well at present; there are many methods and approaches, however, along with this, there are also problems and shortcomings that need to be eliminated. To ensure the continuous circulation of capital in the economy, one of the main tasks of banks is to reduce the volume of problem debt. The purpose of the study is to develop a social scoring model using modern approaches to processing and analyzing Big data. The scientific novelty of the study is the development of the author's model for assessing the socio-economic characteristics of the population based on data from social networks through the construction of logistic regression. The practical significance of the study lies in the fact that the developed model can be used by credit institutions as an additional tool to the standard methodology for scoring analysis of the cre-ditworthiness of individuals.

Keywords: social scoring, logistic regression, social networks, ROC analysis, social profile.

► Введение. Внедрение технологий анализа больших данных предоставляет возможность повышения эффективности деятельности банков и предприятий в целом за счет извлечения новых знаний из существующих наборов данных.

Основная проблема банковского кредитного процесса заключается в присущей ему неопределенности. Не имея полной информации о потенциальных заемщиках и изменениях внешней среды, банкам приходится практически ежедневно сталкиваться с кредитным риском [1]. Развитие информационных технологий и информационных систем позволяет решать практически неограниченное количество задач, связанных с принятием решений в условиях неопределенности. Наиболее часто для оценки кредитоспособности заемщика используются: статистические методы; дерево решений; генетические алгоритмы; нейронные сети [2].

► Обзор литературы. Исследования, изучающие кредитное качество, обычно сосредотачивались на проблемных кредитах как индикаторе для измерения качества кредитного портфеля. Подходы к оценке обычно основаны на эконо-метрических и статистических методах анализа, где исходные данные для анализа являются детерминированными, а зависимости в основном описываются линейными уравнениями [3-5]. При описании больших данных или сложных нелинейных связей часто используются стохастические нечеткие методы машинного обучения [6]. Поскольку существует целый комплекс различных мер риска, оптимизация управления рисками чаще всего сводится к решению задачи многокритериальной оптимизации. Например, часто решается задача одновременной минимизации математического ожидания потерь и стандартного отклонения потерь.

Для мониторинга платежеспособности клиента кредитные организации традиционно используют скоринговые модели и анализируют предыдущие кредитные истории клиентов для составления рейтинга заемщика и определения вероятности погашения кредита и вероятности дефолта потенциального заемщика [7]. Основные проблемы, решаемые в научных исследованиях и связанные со скори-нговыми моделями при принятии решений, можно объединить в две группы.

Первая группа проблем связана с подбором адекватного по сложности инструментария, с идентификацией и обоснованием факторов, включаемых в модель. Известные модели оценки кредитного риска используют статистический подход и основаны на обработке эмпирических данных, но эти модели отличаются методами и алгоритмами аппроксимации зависимостей, такими как нейронные сети, нечеткие и гибридные алгоритмы, эконометрические методы [8].

Остальные проблемы связаны с разработкой комплексных систем автоматизированного сбора, обработки и хранения информации о заемщиках, с развитием систем поддержки принятия инвестиционных решений [9]. Когда количество заемщиков растет, одним из главных требований является скорость принятия решений.

Современные подходы к анализу физических лиц на предмет одобрения выдачи кредитного продукта в основном предполагают использование следующих источников информации: анкета клиента, документы, подтверждающие сумму полученного дохода ретроспективно, отчет из Бюро кредитных историй.

На основе профилей потенциальных заемщиков в социальных сетях можно

Ю персональных данных: Федеральный закон РФ от 27 июля 2006 года .№ 152-ФЗ [Электронный ресурс] // КонсультантПлюс. URL:

сгенерировать огромное количество переменных, которые так или иначе будут оказывать влияние на благонадежность клиентов. Одним из направлений анализа социальных сетей может быть определение сообществ и групп, где состоит потенциальный заемщик и его окружение. Участие в группах асоциального характера может существенно снизить вероятность получения положительного решение по кредитной заявке [10].

С законодательной точки зрения данные социальных сетей попадают под ФЗ «О персональных данных», который устанавливает, что персональными данными считается любая информация, относящаяся прямо или косвенно к определяемому физическому лицу. Закон диктует процедуру обработки и хранения персональных данных и предусматривает обязательное получение у клиентов согласия на обработку данных. Но при этом закон разрешает использование публично доступных данных. Так как условия использования социальных сетей предупреждают пользователей, что данные, публикуемые ими, являются публичными, Российская судебная практика разрешает сбор и анализ этих данных1.

Таким образом, на основе полученных данных можно будет сформировать социальный профиль потенциального заемщика.

Анализ литературы по теме разработки модели социального скоринга показал, что данная проблема актуальна и интересует современных исследователей. Так, например, Бучневой А.В. было проведено исследование информации о пользователях социальной сети ВКонтакте. Были выгружены данные о 40000 пользователей, которые включали в себя: пол, дату рождения, количество друзей,

https://www. consultant.ru/document/cons_doc_LAW 61801/

группы и так далее. Далее была проведена кластеризация с целью определения благонадежности заемщика, которая основывалась на базовых принципах и требованиях к кредитуемым лицам [11].

В связи с развитием российской экономики и банковского сектора в частности, в котором решения должны приниматься на высочайшей скорости, использование моделей социального скоринга может стать инструментом для поддержания конкурентоспособности и эффективности деятельности. Полученная информация может использоваться при формировании социального рейтинга каждого гражданина. В современных условиях система, подобная внедренной в Китае, могла бы заработать и в России [12].

Научной новизной исследования является разработка авторской модели оценки социально-экономических характеристик населения на основании данных из социальных сетей посредством построения логистической регрессии и сопоставления полученных прогнозных значений с реальными данными.

Основная гипотеза исследования -информация, полученная из профилей физических лиц в социальных сетях, оказывает влияние на благонадежность заемщика.

Цель работы - разработка модели социального скоринга с использованием современных подходов к обработке и анализу Big data.

► Данные и методы. Авторы использовали такие методы исследования, как наблюдение, изучение и обобщение сведений, систематизация, группировка данных, моделирование, регрессионный анализ. Для обработки информации использовался язык программирования Python, библиотека vk.api, программный дистрибутив Stata, Excel.

Определение уровня надежности клиента в отношении своевременного по-

гашения кредита является одним из ключевых элементов оценки кредитного риска. Это делается на основе анализа кредитной истории и скоринга, исходя из характеристик клиента. Информацию о том, как клиент погасил и продолжает погашать свои взносы, часто предоставляют кредитные бюро. В то время как сама оценка клиентов основана на моделях кредитного скоринга.

При выдаче кредита учитываются многие факторы. К ним относятся характеристики заемщика (место в обществе), их экономическое положение, сумма запрашиваемого кредита, его цель (т.е. что должно финансироваться за счет кредита). Разнообразие этих факторов означает, что риск оценивается с использованием элементов количественного и качественного анализа.

Для разработки авторской модели социального скоринга использовалась логистическая регрессия.

В качестве потенциальных заемщиков были выбраны подписчики группы регионального банка в социальной сети «ВКонтакте». Для загрузки использовалась свободно распространяемая библиотека vk_api и язык программирования Python. В случае, если страница потенциальных заемщиков закрыта или не использовалась сроком более одного года, информация в выборку не включается.

На этапе сбора данных была сформирована необходимая информация для дальнейшего анализа о 8145 пользователях. Для построения логистической регрессии необходимо задать зависимую переменную, которая будет характеризовать благонадежность заемщика. Данная переменная будет бинарной: 1 - благонадежный клиент, 0 - неблагонадежный клиент. Информация о благонадежности будет использоваться на основе реальных данных, полученных в региональном банке. Из 8145 пользователей у 4377 имеется кредитная история в банке, поэтому данные об

этих подписчиках будут использоваться при построении модели.

Исходя из полученных данных, 81% пользователей являются благонадежными заемщиками, т.е. ими не допускались просрочки по кредитам и реструктуризации.

► Результаты исследования. Перед построением модели необходимо сформировать гипотезы исследования:

1. Информация, полученная из профилей физических лиц в социальных сетях, оказывает влияние на благонадежность заемщика (основная гипотеза исследования).

2. Соответствие региону присутствия Банка оказывает положительное влияние на благонадежность заемщика, так как подразумевается, что клиент хорошо знаком с банком, знает требования кредитных продуктов.

3. Наличие высшего образования, знание иностранных языков и указанные в профиле любимые книги оказывают положительное влияние на благонадежность заемщика, так как предполагается, что образованные физические лица не склонны к нарушению взятых на себя обязательств

[13].

4. Наличие в профиле личных контактов, ссылок на страницы членов семьи, указание места работы, заполненная графа «Главное в людях» оказывают положительное влияние на благонадежность заемщика, так как показывают открытость физического лица [14].

5. Если в графе «интересы» указано следующее: бизнес, инвестиции, предпринимательство, коммерция, промышленность, хозяйство, экономика, финансы, маркетинг, путешествия, спорт, здоровье, то наличие данной информации оказывает положительное влияние на благонадежность заемщика [15].

6. Указанная в профиле информация о военной службе оказывает положительное влияние на благонадежность заемщика, так как многие банки не предоставляют кредиты мужской части населения, не имеющей военный билет [16].

7. Если в графе «Главное в жизни» указано «развлечение и отдых», то такая информация оказывает негативное влияние на благонадежность заемщика [17].

8. Положительное отношение к курению и алкоголю оказывает негативное влияние на благонадежность заемщика, т.к. подразумевается, что в таком случае человек не следит за своим здоровьем, что, в свою очередь, в дальнейшем может привести к невыполнению взятых на себя обязательств [18].

9. Наличие подписок, посвященных путешествиям, оказывает положительное влияние на благонадежность заемщика, так как подразумевает наличие свободных денежных средств и стабильные источники дохода [19].

10. Наличие в подписках групп, посвященных аренде жилья, оказывают негативное влияние на благонадежность заемщика, так как подразумевают отсутствие собственного жилья и возможную впоследствии закредитованность при покупке собственной квартиры по ипотечной программе [20].

11. Подписки, посвященные ставкам на спорт, оказывают негативное влияние на благонадежность заемщика, так как показывают склонность физического лица к высокому риску и азартности. Данные факторы априори понижают кредитный рейтинг заемщика.

12. Подписки, посвященные привлечению займов, оказывают негативное влияние на кредитоспособность заемщика, так как предполагается, что клиент может пользоваться услугами микрофинансовых организаций в связи с отсутствием стабильного заработка [21].

13. Подписки, посвященные сомнительному заработку, оказывают негативное влияние на благонадежность заемщика, так как показывают потенциальное отсутствие стабильного источника дохода [22].

14. Наличие в подписках групп, посвященных саморазвитию, оказывают положительное влияние на благонадежность заемщика, так как показывают, что физическое лицо стремится к дальнейшему обучению и росту [23].

15. Наличие в подписках групп, посвященных криптовалюте, оказывает негативное влияние на благонадежность заемщика, так как существует вероятность склонности к высокому риску [24].

16. Наличие в подписках групп, посвященных здоровью, оказывает положи-

тельное влияние на благонадежность заемщика, так как показывает, что человек следит за своим физическим состоянием, что, в свою очередь, снижает риск смерти и невозврата кредита [25].

17. Подписки, посвященные покупке и продаже дешевых товаров, оказывают негативное влияние на благонадежность заемщика, так как показывают желание человека сэкономить, что в дальнейшем может привести к невозврату кредита [26].

Далее, сформировав гипотезы, с помощью программного дистрибутива STATA 16 необходимо построить модель и проанализировать ее пригодность для использования.

В табл. 1 представлены переменные и их обозначения.

Таблица 1 - Переменные модели

Название Обозначение

Возраст age users mark

Соответствие региону присутствия Банка city mark

Наличие высшего образования education mark

Знание языков language mark

Наличие семьи family flag mark

Контакты contact flag mark

Любимые книги books mark

Интересы interes mark

Место работы works flag mark

Информация о военной службе military int mark

Главное в жизни life main mark

Главное в людях people main mark

Отношение к курению smoking mark

Отношение к алкоголю alcohol mark

Наличие групп, посвященных путешествиям sub 15

Наличие групп, посвященных аренде жилья sub 16

Подписки, посвященные ставкам на спорт sub 17

Подписки, посвященные привлечению займов sub 18

Подписки, посвященные сомнительному заработку sub 19

Наличие групп, посвященных саморазвитию sub 20

Наличие групп, посвященных криптовалюте sub 21

Наличие групп, посвященных здоровью sub 22

Подписки, посвященные покупке и продаже дешевых товаров sub 23

Благонадежность клиента y 1

На рис. 1 представлена первоначальная регрессионная модель. Модель получилась значима, Prob > chi2 менее 0,05 -это вероятность получения статистики хи-квадрат при условии, что нулевая гипотеза верна. Другими словами, это вероятность получения статистики хи-квадрат (3617,70), если на самом деле независимые переменные, взятые вместе, не влияют на зависимую переменную. Это p-значение, которое сравнивается с критическим значением 0,05 или 0,01, чтобы

определить, является ли общая модель статистически значимой. В этом случае модель статистически значима, поскольку р-значение меньше 0,0000. Pseudo R2 -0,84 - Статистика г-квадрата, которая измеряет изменчивость зависимой переменной, которая объясняется моделью линейной регрессии, не может быть вычислена для моделей логистической регрессии. Псевдостатистика г-квадрата имеет свойства, аналогичные истинной статистике г-квадрата.

Logistic regression

Lag likelihood = -340.03358

Number of obs LR chi2(23) Prob > chi2 Pseudo R2

4j 377 3617.70 0.0030 0.8418

у_1 Coef. Std. Err, z P>|z| [95* Conf, Interval]

а ge_u s е г s_ma rk .0260649 .2047844 0 13 0 899 -.3753052 .4274351

city_mark .2370892 .2616144 0 91 0 365 -.2756656 .7498441

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

еdисation_mark -1.001777 .3451455 -2 90 0 004 -1.67825 -.3253045

language_mark .1910759 .5632676 0 34 0 734 -.9129082 1.29506

fа mily_f1а g_ma rk .7810641 .345746 2 26 0 024 .1034144 1.458714

con t а сt_f1а g_ma rk -.2871369 .2169805 -1 32 0 186 -.7124109 .138137

books_mark -.2793769 .3639225 -0 77 0 443 -.9926518 .4338981

interesmark .6195198 .5965241 1 04 0 299 -.5496459 1.788686

worksfla g_ma rk -.0217468 .3849404 -0 06 0 955 -.7762161 .7327225

iri 1 it a ry_in t_ma rk -.5674966 .4018788 -1 41 0 158 -1.355165 .2201714

1i fe_ma i n_mark .3267167 .5093396 0 64 0 521 -.6715705 1.325004

pe ople_ma in_ma rk -.2635668 .497639 -0 53 0 596 -1.238921 .7117878

smoking_mark -3.980776 .5551451 -7 17 0 000 -5.06884 -2.892712

alcohol_mark -2.788695 .5958009 -4 68 0 000 -3.956444 -1.620947

sub_15 B.11756 .5101158 15 91 0 000 7.117752 9.117369

sub_16 -4.402471 .3370815 -13 06 0 000 -5.063139 -3.741803

sub_17 -5.938099 .3851813 -15 42 0 000 -6.69304 -5.183158

sub_18 -2.831411 .3744972 -7 56 0 000 -3.565412 -2.09741

sub_19 -2.935691 .3528729 -8 32 0 000 -3.627309 -2.244073

sub_20 8.944121 .5528209 16 18 0 000 7.860612 10.02763

sub_21 -4.942666 .3542857 -13 95 0 000 -5.637053 -4.248279

sub_22 8.110437 .504027 16 09 0 000 7.122562 9.098311

sub_23 -5.635212 .3629504 -15 53 0 000 -6.346581 -4.923842

_cons -.7901874 .3821446 -2 07 0 039 -1.539177 -.0411977

Рисунок 1 - Logit модель

Далее путем последовательного ис- На рис. 2 представлена итоговая мо-

ключения из модели незначимых коэффи- дель логистической регрессии. циентов, получаем итоговую модель.

Logistic regression

Log likelihood = -345.31534

Number of obs LR сh12(12) Prob > chi2 Pseudo R2

4j 377 3607.13 0.9000 0.8393

у_1 Coef. Std. Err. z P>|z| [95Ж Conf. Interval]

education mark -.7143456 .2713204 -2. 63 0.008 -1.246124 -.1825673

snoking_mark -3.99837 .4963739 -8. 06 0.000 -4.971245 -3.025495

alcohol mark -2.877832 .5964881 -4. 82 0.000 -4.046927 -1.708736

sub_15 7.998599 .500861 15 97 0.000 7.01693 8.980269

sub_16 -4.321019 .331619 -13. 03 0.000 -4.97098 -3.671058

sub_17 -5.853412 .3781363 -15 48 0.000 -6.594546 -5.112279

sub_18 -2.S42498 .3671446 -7. 74 0.000 -3.562088 -2.122908

sub_19 -2.953039 .3475343 -8. 50 0.000 -3.634193 -2.271884

sub_20 8.829939 .5416248 16 30 0.000 7.768374 9.891504

sub_21 -4.890187 .3484381 -14. 03 0.000 -5.573113 -4.207261

sub_22 8.041959 .4970554 16 IS 0.000 7.06774S 9.01617

sub_23 -5.567785 .3579998 -15 55 0.000 -6.269452 -4.866118

cons -.6558527 .2946194 -2. 23 0.026 -1.233296 -.0784093

Рисунок 2 - Итоговая logit модель

После обработки модели она осталась значимой: произошло незначительное уменьшение Pseudo однако все коэффициенты независимых переменных значимы (Р-значение больше 0,05).

После построения логистической регрессии автором была доказана статистическая значимость модели и полученных коэффициентов. Далее представлено полученное уравнение регрессии:

у = -0,656 — 0,714educationmark — 3,998smokingmark —

2,878alcoholmark + 7,999sub — 4,321sub16 — 5,853sub17 --2,843sub18

2,953sub19 + 8,83sub20 — 4,89sub21 + 8,042sub22 — —5,568sub23

Подставив значения объясняющих переменных, получаем значение зависимой переменной, однако множественная регрессия не учитывает, что объясняемая переменная является бинарной. Это приведет к таким результатам модели, что предсказанные значения будут больше 1 и меньше 0, но такие значения бессмысленны для интерпретации результата. Поэтому необходимо иначе сформу-

лировать задачу регрессии: вместо предсказания бинарной переменной, мы предсказываем непрерывную переменную со значениями на отрезке [0,1] при любых значениях независимых переменных. Это достигается применением следующего логистического преобразования: _ 1

Р ~ (1 + е-У)

где р - вероятность того, что, в нашем случае, заемщик окажется благонадежным, то есть вероятность наступления нужного события.

Подставив все значения рассчитанной ранее зависимой переменной по 4377 наблюдениям, были получены вероятности признания заемщика благонадежным.

На данном этапе следует отметить, что основная гипотеза исследования подтвердилась: информация, полученная из профилей физических лиц в социальных сетях, оказывает влияние на благонадежность заемщика. Также подтвердились следующие гипотезы, касающиеся подписок заемщиков в социальных сетях:

наличие подписок, посвященных путешествиям, саморазвитию, здоровью оказывают положительное влияние на благонадежность заемщика;

наличие в подписках групп, посвященных аренде жилья, ставкам на спорт, привлечению займов, сомнительному заработку, криптовалюте, покупке и продаже дешевых товаров оказывают негативное влияние на благонадежность заемщика.

Более того, подтвердилась гипотеза о негативном влиянии на кредитоспособность положительное отношение заемщиков к курению и алкоголю.

Стоит отметить, что наличие высшего образования также оказывает негативное влияние на благонадежность заемщика. Данный факт может быть обусловлен тем, что некоторые заемщики могут учиться на платном отделении (основная группа респондентов в возрасте от 18 до 35 лет - 28%), что влечет к дополнительным расходам и потенциальном отсутствии источника погашения кредита.

Следующим шагом является определение порогового значения, которое покажет при пересечении какой отметки полученных вероятностей, действительно можно считать заемщика благонадежным. Подбор такого значения будет осуществляться посредством построения ROC-кри-вой.

Для построения ROC-кривой будет использоваться надстройка Excel «AtteStat».

На рис. 3 представлена полученная ROC-кривая.

ROC-кривая

Г

S

*

0 10 20 30 40 50 60 70 80 90 100 1 - Sp, %

Рисунок 3 - ROC-кривая

Максимум чувствительности и специфичности достигается в точке 0,95. В ней чувствительность равна 97,6%, что означает, что 97,6% благонадежных заемщика будут выявлены классификатором. Специфичность равна 95,5%, следовательно, 4,5% недобросовестных заемщиков получат одобрение в выдаче кредита. Путем изменения точки порога банк сможет регулировать кредитный риск. Если

Площадь под ЯОС-кривой близка к максимальному значению (1), что свидетельствует о высоком качестве приведенного классификатора.

После определения оптимального порогового значения (0,95), представим

Исходя из полученных результатов, построенная ранее модель правильно предсказала, что 3094 пользователя являются благонадежными заемщиками, 838 пользователей являются неблагонадежными. При этом 437 пользователей были отнесены к неблагонадежным заемщикам, что оказалось неверным, и 8 пользователей были отнесены к благонадежным заемщикам, и это оказалось не так. Выбранное пороговое значение приводит к значительному снижению кредитного риска, однако в условиях стабильной экономической ситуации порог может быть понижен на усмотрение лиц, принимающих кредитное решение.

стратегия подразумевает более жесткий отбор заемщиков, необходимо выбрать порог, соответствующий наибольшей специфичности, например, 0,98-1. В этом случае модель оценивает кредитный риск на минимальном уровне. В табл. 2 представлены итоговые значения ЯОС-анализа.

количество положительных, ложно-положительных, отрицательных, ложно-отрицательных результатов логистической регрессии. Данные представлены в табл. 3.

► Выводы и дальнейшая дискуссия. В условиях жесткой конкуренции на рынке банковских услуг факторами, определяющими конкурентные преимущества, являются сокращение времени принятия решений, снижение требований к документам заемщика, снижение требований к обеспеченности кредита. Все это требует современных и высокоэффективных инструментов и методов, которые позволят снизить кредитные риски и повысить эффективность финансового учреждения. Более того, в настоящее время вопрос разработки дополнительных механизмов к оценке кредитоспособности потенциальных заемщиков актуален как

Таблица 2 - Результаты ROC-анализа

Наименование Значение

Площадь под ЯОС кривой 0,985988

Оптимальный порог отсечения 0,95

Чувствительность, % 97,59275

Специфичность, % 95,50827

Таблица 3 - Исходы

Фактические данные

Модель положительно отрицательно

положительно 3094 8

отрицательно 437 838

никогда. Рост просроченной задолженности, дополнительная нагрузка на капитал банков в связи с изменяемыми макропоправками, которые приводят к наращиванию резервов, заставляют анализировать потенциальные кредитные сделки с использованием всех возможных методов оценки. Информация о социально-экономических характеристиках населения, полученная из социальных сетей, может послужить дополнительным индикатором при принятии решения об одобрении выдачи кредита.

Построенная логистическая регрессионная модель оказалась значима:

► Литература

1. Роуз П.С. Банковский менеджмент: Предоставление фин. услуг: Пер. с англ. Москва : Акад. нар. хоз-ва : Дело, 1995. 743 с.

2. Водопьянова В. А., Бородай Е. А. Анализ методов оценки кредитоспособности юридических лиц, используемых российскими банками // Азимут научных исследований: экономика и управление. 2020. Т. 9. №. 4 (33). C. 8386.

3. Pestova A., Mamonov M. Macroeco-nomic and bank-specific determinants of credit risk: Evidence from Russia // Economic Education and Research Consortium. Working Paper No. 13/10E. 2013. 53 p.

4. Chernikova L., Faizova G., Egorova E., Kozhevnikova N. Functioning and development of retail banking in Russia // Mediterranean Journal of Social Sciences. 2015. Vol. 6. №. 6. P. 274-274.DOI: 10.5901/mjss.2015.v6n6s4p274.

5. Kjosevski J., Petkovski M. Non-performing loans in Baltic States: determinants and macro-economic effects // Baltic Journal of Economics. 2017. Vol. 17. №. 1. P. 25-44.

6. Leo M., Sharma S., Maddulety K. Machine learning in banking risk management: A literature review // Risks. 2019. Vol. 7. №. 1. P. 29.

7. Niu B., Ren J., Li X. Credit scoring using machine learning by combing social network information: Evidence from peer-to-peer lending // Information. 2019. Vol. 10. №. 12. P. 397. DOI: 10.3390/info10120397.

8. Orlando G., Pelosi R. Non-performing loans for Italian companies: When time matters. an

71% пользователей оказались благонадежными заемщиками, 20% - неблагонадежными. При этом около 10% пользователей были ошибочно отнесены к неблагонадежным заемщикам, и менее 1% пользователей были неверно отнесены к благонадежным заемщикам.

Полученная модель, построенная на основе данных социальной сети «ВКонта-кте», значима, и может быть использована для построения социального портрета заемщика, а также в целях социального ско-ринга для принятия различных управленческих решение как бизнесом, так и государством.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

► References

1. Rose P.S. (1995). Bank Management. Producing and Selling Financial Services. Moscow: Delo. [In Russian]

2. Vodopyanova V. A., Boroday E. A. (2020). Analysis of methods for assessing the creditworthiness of legal entities used by Russian banks. Azimuth of scientific research: economics and management, 4 (33), 83-86. [In Russian]

3. Pestova A., Mamonov M. (2013). Mac-roeconomic and bank-specific determinants of credit risk: Evidence from Russia. Economic Education and Research Consortium. Working Paper No. 13/10E, 53 p.

4. Chernikova L., Faizova G., Egorova E., Kozhevnikova N. (2015). Functioning and development of retail banking in Russia. Mediterranean Journal of Social Sciences, 6 , 274-274. http://doi.org/ 10.5901/mjss.2015.v6n6s4p274.

5. Kjosevski J., Petkovski M. (2017). Non-performing loans in the Baltic States: determinants and macroeconomic effects. Baltic Journal of Economics, 1, 25-44.

6. Leo M., Sharma S., Maddulety K. (2019). Machine learning in banking risk management: A literature review. Risks, 1, 29.

7. Niu B., Ren J., Li X. (2019). Credit scoring machine learning by combining social network information: Evidence from peer-to-peer lending. Information, 12, 397. http://doi.org/ 10.3390/info 10120397.

8. Orlando G., Pelosi R. (2020). Non-performing loans for Italian companies: When time matters. an empirical research on estimating

empirical research on estimating probability to default and loss given default // International Journal of Financial Studies. 2020. Vol. 8. №. 4. P. 68. D01:10.3390/ijfs8040068

9. Berger A.N., Sedunov J. Bank liquidity creation and real economic output // Journal of Banking & Finance. 2017. Vol. 81. P. 1-19. D0I:10.1016/j.jbankfin.2017.04.005.

10. Полещук Я.А. Уловки соцсетей // Банковское обозрение. 2014. №2. С. 46-52.

11. Бучнева А.В. Анализ профилей пользователей социальных сетей // Хроноэконо-мика. 2018. №3 (11). C. 66-70.

12. Науменко Т.В., Секретарева К.Н. Китайская система социального кредита: антиутопия или фактор общественного благополучия? //Журнал исследований социальной политики. 2022. Т. 20. №. 3. С. 419-432.

13. Воронин С.М., Совертека З.К., Бере-зин А.Д., Ларин А.И. Кредитный скоринг, реализованный с помощью машинного обучения // Столыпинский вестник. 2022. Т. 4. №. 10. С. 5640-5648.

14. Исмаилов И.М., Истомина Ю.В. Современные тенденции развития кредитных бюро в России // Весенние дни науки: сборник докладов Международной конференции студентов и молодых ученых. Екатеринбург: Издательский Дом «Ажур», 2023. С. 1160-1165.

15. Проняева Л.И., Щеголев А.В., Давыд-кин И.Г. Финансовое обеспечение деятельности субъектов малого предпринимательства // Вестник Академии знаний. 2022. №. 6 (53). С. 369-375.

16. Рувинский Р.З. Правовые аспекты внедрения системы социального кредита в современное публичное управление: монография. Н.Новгород: НИУ РАНХиГС, 2022. 264 с.

17. Миронов С.В., Шарафутдинов А.Г. Расчет чистых активов в оценочной деятельности // Современные научные исследования: теория, методология, практика: Сборник научных статей по материалам IX Международной научно-практической конференции. Ч.2. Уфа: Общество с ограниченной ответственностью "Научно-издательский центр "Вестник науки", 2022. С. 93-99.

18. Гнатик Е.Н. Мир в эпоху одержимости безопасностью: риски, ограничения, возможности // Человечество в новой реальности: глобальные биотехнологические вызовы: Сборник статей / Отв. редактор Г.Л. Белкина.

probability to default and loss given default. International Journal of Financial Studies, 4, 68. http://doi.org/10.3390/ijfs8040068

9. Berger A.N., Sedunov J. (2017). Bank liquidity creation and real economic output. Journal of Banking & Finance, 81, 1-19. http://doi.org/10.1016/jjbankfin.2017.04.005.

10. Poleshchuk Y.A. (2014). Tricks of social networks. Banking review, 2, 46-52. [In Russian]

11. Buchneva A.V. (2018). Analysis of user profiles of social networks. Chronoeconom-ics, 3 (11), 66-70. [In Russian]

12. Naumenko T.V., Sekretareva K.N. (2022). Chinese social credit system: dystopia or a factor of public well-being?. Journal of Social Policy Research, 3, 419-432. [In Russian]

13. Voronin S.M., Soverteka Z.K., Berezin A.D., Larin A.I. (2022). Credit scoring implemented using machine learning. Stolypinsky Bulletin, 10, 5640-5648. [In Russian]

14. Ismailov I.M., Istomina Yu.V. (2023). Modern trends in the development of credit bureaus in Russia. Spring Days of Science: collection of reports of the International Conference of Students and Young Scientists. Ekaterinburg: Publishing House "Azhur".[In Russian]

15. Pronyaeva L.I., Shchegolev A.V., Da-vydkin I.G. (2022). Financial support for the activities of small businesses. Bulletin of the Academy of Knowledge, 6 (53), 369-375. [In Russian]

16. Ruvinsky R.Z. (2022). Legal aspects of introducing the social credit system into modern public administration. Nizhny Novgorod: National Research University RANEPA. [In Russian]

17. Mironov S.V., Sharafutdinov A.G. (2022). Calculation of net assets in valuation activities. Modern scientific research: theory, methodology, practice: Collection of scientific articles based on the materials of the IX International Scientific and Practical Conference. Part 2. Ufa: Limited Liability Company "Scientific Publishing Center "Bulletin of Science".[In Russian]

18. Gnatik E. N. (2022). The world in the era of obsession with security: risks, limitations, opportunities. Humanity in the new reality: global biotechnological challenges: Collection of articles. Moscow: Kanon+.[In Russian]

Редактор-составитель М.И. Фролова. Москва : Канон+, 2022. С. 262-273.

19. Герасименко А.В. Современные подходы к оценке клиента в российских банках // Инновационная наука. 2022. №. 2-1. С. 41-43.

20. Космарский А.А., Картавцев В.В. Цифровые технологии репутации в городской повседневности: между капитализмом платформ и государственным социальным рейтингом // Городские исследования и практики. 2022. Т. 7. №. 1. С. 65-74.

21. Овчинникова А.В., Зимин С.Д. Аспекты эффективного функционирования государственных МФО в контексте устойчивого развития региональной экономики // Развитие территориальных социально-экономических систем: вопросы теории и практики. 2023. С. 57-61.

22. Юсупова О.А., Федотов М.Ю. Профиль заемщика в социальных сетях и его оценка банком при выдаче кредита // Вызовы современности и стратегии развития общества в условиях новой реальности. 2022. С. 267-273.

23. Комарова О.М. Экономическое обоснование эффективности использования системы социального рейтинга, как формы государственного контроля над обществом // Управленческий учет. 2022. №. 4. С. 48-54.

24. Ярощук А.Б. Современные банковские технологии и их влияние на развитие финансово-кредитной системы РФ // Научная деятельность в условиях цифровизации: Теоретический и практический аспекты: сборник статей Национальной (Всероссийской) научно-практической конференции с международным участием. Ч.1. Уфа: Общество с ограниченной ответственностью "Омега Сайнс", 2023. С. 89-93.

25. Лазаров А.А. Право на доступ к информации при применении системы социального кредитования (социального скоринга) // Вестник Университета имени О. Е. Кутафина. 2022. №. 4 (92). С. 136-142.

26. Осеев В.А., Клеменов Д.А. Внедрение банками цифровых технологий для преодоления финансовых дисбалансов в современных условиях // Вопросы инновационной экономики. 2023. Т. 13. № 2. С. 837-848. Б01: 10. 18334Мпес.13.2.117881.

19. Gerasimenko A.V. (2022). Modern approaches to client assessment in Russian banks. Innovative science, 2-1, 41-43. [In Russian]

20. Kosmarsky A.A., Kartavtsev V. V.

(2022). Digital technologies of reputation in urban everyday life: between platform capitalism and state social rating. Urban Research and Practice, 1, 65-74. [In Russian]

21. Ovchinnikova A.V., Zimin S.D.

(2023). Aspects of the effective functioning of state microfinance organizations in the context of sustainable development of the regional economy. Development of territorial social and economic systems: questions of theory and practice, 57-61. [In Russian]

22. Yusupova O.A., Fedotov M.Yu. (2022). Borrower's profile in social networks and its assessment by the bank when issuing a loan. Challenges of modernity and strategies for the development of society in the new reality, 267273. [In Russian]

23. Komarova O.M. (2022). Economic justification for the effectiveness of using the social rating system as a form of state control over society. Management accounting, 4, 48-54. [In Russian]

24. Yaroshchuk A.B. (2023). Modern banking technologies and their influence on the development of the financial and credit system of the Russian Federation. Scientific activity in the conditions of digitalization: Theoretical and practical aspects: collection ofarticles of the National (All-Russian) scientific and practical conference with international participation. Part 1. Ufa: Limited Liability Company "Omega Sci-ence".[In Russian]

25. Lazarov A.A. (2022). The right to access information when applying the social credit system (social scoring). Bulletin of the O. E. Kutafin University, 4 (92), 136-142. [In Russian]

26. Oseev V.A., Klemenov D A. (2023). Introduction of digital technologies by banks to overcome financial imbalances in modern conditions. Issues of innovative economics, 2, 837848. [In Russian] http://doi.org/10.18334/ vinec.13.2.117881.

Статья поступила в редакцию 11.01.24

i Надоели баннеры? Вы всегда можете отключить рекламу.