Научная статья на тему 'Анализ возможностей автоматизации выявления недобросовестных микрофинансовых организаций на основе методов машинного обучения'

Анализ возможностей автоматизации выявления недобросовестных микрофинансовых организаций на основе методов машинного обучения Текст научной статьи по специальности «Экономика и бизнес»

CC BY
242
46
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Финансы: теория и практика
Scopus
ВАК
RSCI
Область наук
Ключевые слова
микрофинансовые организации / финансовый мониторинг / методы машинного обучения / алгоритмы классификации / microfinance organizations / financial monitoring / machine learning methods / classification algorithms

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Юлия Михайловна Бекетнова

Микрофинансирование является одним из способов борьбы с бедностью, в связи с чем имеет высокую социальную значимость. Сфера микрофинансирования в России активно развивается. Но вовлеченность микрофинансовых организаций (МФО) в незаконные финансовые операции, связанные с мошенничеством, деятельностью нелегальных кредиторов, легализацией доходов, полученных преступным путем, существенно ограничивают их потенциал и негативно влияют на динамику развития. Цель исследования состоит в изучении возможностей автоматизации процесса выявления недобросовестных участников рынка микрофинансирования на основе методов и алгоритмов машинного обучения для оперативного выявления и пресечения противоправной деятельности контролирующими органами. Автор приводит распространенные мошеннические схемы с участием микрофинансовых организаций, в том числе схему обналичивания материнского капитала, мошенническую схему кредитования под залог недвижимости. Проведен сравнительный анализ результатов, полученных методами классификации — методом логистической регрессии, деревьев решений (алгоритмы двухклассовый лес решений, Adaboost), методом опорных векторов (алгоритм двухклассовая машина опорных векторов), нейросетевыми методами (алгоритм двухклассовой нейронной сети), Байесовскими сетями (алгоритм двухклассовой сети Байеса). Наиболее точные результаты показала двухклассовая машина опорных векторов. Анализ проведен на основе данных о микрофинансовых организациях, публикуемых Банком России, самими МФО, порталом banki.ru. Автор делает вывод о том, что приведенные результаты исследования могут быть использованы Банком России и Росфинмониторингом для автоматизации выявления недобросовестных микрофинансовых организаций.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Юлия Михайловна Бекетнова

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Analysis of Possibilities to Automate Detection of Unscrupulous Microfinance Organizations Based on Machine Learning Methods

Microfinance is a way to fight poverty, and therefore is of high social significance. The microfinance sector in Russia is progressing. However, the engagement of microfinance organizations in illegal financial transactions associated with fraud, illegal creditors, money laundering, significantly limits their potential and has negative impact on their development. The aim of the paper is to study the possibilities to automate detection of unscrupulous microfinance organizations based on machine learning methods in order to promptly identify and suppress illegal activities by regulatory authorities. The author cites common fraudulent schemes involving microfinance organizations, including a scheme for cashing out maternity capital, a fraudulent lending scheme against real estate. The author carried out a comparative analysis of the results obtained by classification methods — the logistic regression method, decision trees (algorithms of two-class decision forest, Adaboost), support vector machine (algorithm of two-class support vector machine), neural network methods (algorithm of two-class neural network), Bayesian networks (algorithm of two-class Bayes network). The two-class support vector machine provided the most accurate results. The author analysed the data on microfinance institutions published by the Bank of Russia, the MFOs themselves, and banki.ru. The author concludes that the research results can be of further use by the Bank of Russia and Rosfinmonitoring to automate detection of unscrupulous microfinance organizations.

Текст научной работы на тему «Анализ возможностей автоматизации выявления недобросовестных микрофинансовых организаций на основе методов машинного обучения»

ОРИГИНАЛЬНАЯ СТАТЬЯ

DOI: 10.26794/2587-5671-2020-24-6-38-50 УДК 336.7(045) JEL E58, G21, C53

(СО ]

Анализ возможностей автоматизации выявления недобросовестных микрофинансовых организаций на основе методов машинного обучения

Ю. М.Бекетнова

Финансовый университет, Москва, Россия https://orcid.org/0000-0002-1005-6265

BY 4.0

АННОТАЦИЯ

Микрофинансирование является одним из способов борьбы с бедностью, в связи с чем имеет высокую социальную значимость. Сфера микрофинансирования в России активно развивается. Но вовлеченность микрофинансовых организаций (МФО) в незаконные финансовые операции, связанные с мошенничеством, деятельностью нелегальных кредиторов, легализацией доходов, полученных преступным путем, существенно ограничивают их потенциал и негативно влияют на динамику развития. Цель исследования состоит в изучении возможностей автоматизации процесса выявления недобросовестных участников рынка микрофинансирования на основе методов и алгоритмов машинного обучения для оперативного выявления и пресечения противоправной деятельности контролирующими органами. Автор приводит распространенные мошеннические схемы с участием микрофинансовых организаций, в том числе схему обналичивания материнского капитала, мошенническую схему кредитования под залог недвижимости. Проведен сравнительный анализ результатов, полученных методами классификации - методом логистической регрессии, деревьев решений (алгоритмы двухклассовый лес решений, Adaboost), методом опорных векторов (алгоритм двухклассовая машина опорных векторов), нейросетевыми методами (алгоритм двухклассовой нейронной сети), Байесовскими сетями (алгоритм двухклассовой сети Байеса). Наиболее точные результаты показала двухклассовая машина опорных векторов. Анализ проведен на основе данных о микрофинансовых организациях, публикуемых Банком России, самими МФО, порталом banki.ru. Автор делает вывод о том, что приведенные результаты исследования могут быть использованы Банком России и Росфинмониторингом для автоматизации выявления недобросовестных микрофинансовых организаций.

Ключевые слова: микрофинансовые организации; финансовый мониторинг; методы машинного обучения; алгоритмы классификации

Для цитирования: Бекетнова Ю. М. Анализ возможностей автоматизации выявления недобросовестных микрофинансовых организаций на основе методов машинного обучения. Финансы: теория и практика. 2020;24(6):38-50. DOI: 10.26794/2587-5671-2020-24-6-38-50

ORIGINAL PAPER

Analysis of Possibilities to Automate Detection of unscrupulous Microfinance Organizations Based on Machine Learning Methods

Yu. M. beketnova

Financial University, Moscow, Russia https://orcid.org/0000-0002-1005-6265

ABSTRACT

Microfinance is a way to fight poverty, and therefore is of high social significance. The microfinance sector in Russia is progressing. However, the engagement of microfinance organizations in illegal financial transactions associated with fraud, illegal creditors, money laundering, significantly limits their potential and has negative impact on their

© Бекетнова Ю. М., 2020

development. The aim of the paper is to study the possibilities to automate detection of unscrupulous microfinance organizations based on machine learning methods in order to promptly identify and suppress illegal activities by regulatory authorities. The author cites common fraudulent schemes involving microfinance organizations, including a scheme for cashing out maternity capital, a fraudulent lending scheme against real estate. The author carried out a comparative analysis of the results obtained by classification methods - the logistic regression method, decision trees (algorithms of two-class decision forest, Adaboost), support vector machine (algorithm of two-class support vector machine), neural network methods (algorithm of two-class neural network), Bayesian networks (algorithm of two-class Bayes network). The two-class support vector machine provided the most accurate results. The author analysed the data on microfinance institutions published by the Bank of Russia, the MFOs themselves, and banki.ru. The author concludes that the research results can be of further use by the Bank of Russia and Rosfinmonitoring to automate detection of unscrupulous microfinance organizations. Keywords: microfinance organizations; financial monitoring; machine learning methods; classification algorithms

For citation: Beketnova Yu. M. Analysis of possibilities to automate detection of unscrupulous microfinance organizations based on machine learning methods. Finance: Theory and Practice. 2020;24(6):38-50. (In Russ.). DOI: 10.26794/25875671-2020-24-6-38-50

ВВЕДЕНИЕ

Микрофинансовые организации — это финансовые компании, которые предоставляют небольшие кредиты слоям общества, не охваченным банковскими услугами, или группам населения с низким уровнем дохода. МФО предоставляют микрокредиты, услуги по страхованию, депозиты и другие услуги. Эти организации распространены в России, Азии, Европе, Африке и многих других странах.

Как отмечено в статье А. С. Сорокина и В. А. Шилова, микрофинансирование является одним из способов борьбы с бедностью, в связи с чем имеет высокую социальную значимость [1]. Сфера микрофинансирования в России активно развивается, что находит свое отражение, в частности, в исследованиях Е. Б. Макаровой [2], Н. Б. Балашева [3], В. А. Цветкова [4] и других авторов [5-7].

В то же время, как доказано в статье Ю. С. Евлахо-вой [8], вовлеченность микрофинансовых организаций в незаконные финансовые операции, связанные с мошенничеством, деятельностью нелегальных кредиторов, легализацией доходов, существенно ограничивают потенциал МФО и негативно влияют на динамику их развития.

О высоком риске использования МФО в схемах легализации преступных доходов указывается и в Публичном отчете Росфинмониторинга «Национальная оценка рисков легализации (отмывания) преступных доходов. Основные выводы»1.

1 Росфинмониторинг. Национальная оценка рисков легализации (отмывания) преступных доходов. Основные выводы. 2017-2018. Публичный отчет Росфинмониторинга. 2018. URL: http://www.fedsfm.ru/content/files/documents/20 18/%D0%BE%D1%86%D0%B5%D0%BD%D0%BA%D0%B0%20 %D1%80%D0%B8%D1%81%D0%BA%D0%BE%D0%B2%20 %D0%BE%D0%B4_5.pdf (дата обращения: 22.07.2020).

Уязвимость сектора микрофинансовых организаций отчасти обусловлена относительной простотой регистрации данных организаций, а также спецификой работы микрофинансовых организаций, в частности возможностью на законных основаниях привлекать средства юридических лиц, перераспределяя их между физическими лицами.

Банк России совместно с правоохранительными органами, Генеральной прокуратурой и Федеральной службой по финансовому мониторингу последовательно занимается очищением финансового сектора от недобросовестных организаций.

Высокая вероятность дефолта клиента — основной риск, заложенный в работу микрофинансовых организаций. Залог их успешного функционирования — выдавать как можно больше средств с минимальным дефолтом и наименьшими издержками.

Основные схемы легализации преступного дохода с участием МФО имеют два направления:

• покушение на активы, которые принадлежат финансовым организациям и входят в оборот их основной деятельности;

• покушение на активы, которые принадлежат инвесторам и привлекаются финансовыми организациями для того, чтобы в дальнейшем организовать их хищение.

Основными уязвимостями к отмыванию преступных доходов с привлечением микрофинансовых организаций служат правовая и финансовая неосведомленность граждан, а также недостаточное количество необходимых для эффективной борьбы с мошенниками ресурсов у большинства участников микрофинансового рынка.

Собственники и менеджмент финансовой организации могут совершать преступления, связанные с посягательством на активы, принадлежащие инвесторам и привлекаемые финансовыми учре-

ждениями. Операции по выводу активов могут маскировать под стандартные процедуры по выдаче займов и привлечению фондов.

На первом этапе вывода активов чаще всего компанией предоставляется фальсифицированная отчетность, в которой либо уменьшены реальные объемы привлеченных ресурсов, либо увеличены объемы предоставленных микрозаймов, чтобы формально соблюсти установленные нормативы и не оказаться исключенной из реестра.

АНАЛИЗ МОШЕННИЧЕСКИХ СХЕМ С УЧАСТИЕМ МФО

В работе С. Е. Волкова, И. Н. Лоскутова [9] приведены некоторые мошеннические схемы с участием микрофинансовых организаций:

1. Услуги посредников. Схема заключается в том, что будущему клиенту МФО навязывают услуги посредничества, якобы обеспечивающие гарантию предоставления ему заемных средств. За эту услугу компания-посредник взимает комиссию до 50% от суммы займа. Компания-посредник может заключать с клиентом договор, по которому тот обязан внести единовременный «регистрационный платеж» в размере от 5 до 20% от суммы кредита. Также мошенники могут потребовать оплатить проверку кредитной истории клиента, нотариальные услуги, сделать взнос за членство в кредитном кооперативе и пр. Такое «посредничество» на самом деле не обеспечивает клиенту гарантию предоставления заемных средств микрофинансовой организацией, возврат взносов не предусматривается.

2. Кредитная лестница. Схема заключается в том, что клиенту, якобы для подтверждения его платежеспособности, выдают небольшие суммы заемных средств под высокий процент, после погашения очередного займа сумму следующего увеличивают, а процент уменьшают, и так далее пока не наберется желаемая для клиента сумма. Однако после выплаты клиентом предпоследнего займа мошенник исчезает. Жертва в итоге выплачивает высокие проценты, так и не получив желаемой суммы займа.

3. Деятельность нелегальных кредиторов при предоставлении микрозаймов онлайн. В онлайн-заявках на получение микрозайма на сайтах МФО необходимо заполнить анкету, которая может быть использована мошенниками для сбора персональных данных клиентов. Попадая на такой сайт, потенциальный заемщик регистрируется и заполняет анкету с личными

данными. После отправки заявки жертва получает сообщение с отказом в займе и предложением обратиться повторно. В это время контактные данные зарегистрированного лица используются мошенниками для оформления кредита в настоящих микрофинансовых компаниях, выдающих деньги онлайн [9].

Рассмотрим другие известные мошеннические схемы и схемы легализации доходов с участием микрофинансовых организаций.

Схема обналичивания материнского капитала. По оценкам экспертов в схемы по предоставлению теневых услуг по обналичиванию материнского капитала могут быть вовлечены сотни компаний. Их бизнес заключается в том, чтобы находить неблагополучные семьи, получившие сертификат на рождение ребенка, и оказывать им услуги по обналичиванию этих средств.

Гражданам оформляют фальшивую покупку жилья, как правило, непригодного для проживания или у своих же родственников (рис. 1). Затем под эту сделку выдают кредит в микрофинансовой организации и погашают его сертификатом. Семьи получают часть маткапитала наличными, а остальное перечисляется посредникам-кредиторам.

Схема мошенничества, связанная с кредитованием под недвижимость. Физическое лицо нуждается в получении кредита, но в банках ему отказывают или предлагают кредит по высокой ставке. Он обращается в микрофинансовую организацию, которая финансируется частными инвесторами или банками. Заемщик получает деньги, и вместе с другими документами ему на подпись дают закладную на его квартиру.

Когда клиент нарушает условия кредитования, кредитор забирает квартиру по закладной. Микрофинансовая организация продает квартиру подставному лицу (холдеру), а тот, когда уляжется скандал, перепродает ее добросовестному покупателю.

АНАЛИЗ ДИНАМИКИ РЕГИСТРАЦИИ И ЛИКВИДАЦИИ МФО

Банк России при выявлении недобросовестных участников рынка микрофинансирования, вовлеченных в проведение сомнительных операций, исключает их из Реестра. По состоянию на 27 июля 2020 г. в России зарегистрировано 1618 микрофинансовых организаций2.'

По количеству МФО, зарегистрированных на территории, лидером является город Москва (табл. 1),

2 Сайт Банка России. URL: https://www.cbr.ru/microfinance/ registry/ (дата обращения: 27.07.2020).

Погашение кредита сертификатом

Hill

МФО

Выдача кредита

и

Получение сертификата

/ *

Граждане

I

Сертификат на мат.кап.

I

Фиктивная покупка жилья

Недвижимость

Рис. 1 /Fig. 1. Схема обналичивания материнского капитала через МФО / Maternity capital cashing scheme through MFOs

Источник/Source: составлено автором/compiled by the author.

также в десятку входят Новосибирская область, город Санкт-Петербург, Иркутская область и др.

В пересчете на 1 млн человек населения, проживающего на территории региона (по данным Росста-та на 1 января 2020 г.3), в числе лидеров оказались Республика Алтай, Архангельская и Костромская области и др. (табл. 2), Москва на 21-м месте.

Рассмотрим динамику исключения МФО из Реестра и образования новых микрофинансовых организаций в разрезе регионов. Для этого соотнесем количество организаций, исключенных из реестра за все время, и количество действующих МФО. В лидерах рейтинга находятся Чеченская Республика — на одну действующую микрофинансовую организацию приходится более 36 исключенных их Реестра, Ямало-Ненецкий автономный округ, Ярославская область, Республика Дагестан и др. Москва находится на 12-м месте, на одну действующую микрофинансовую организацию приходится почти 8 исключенных из Реестра (табл. 3).

Рассмотрим теперь среднюю продолжительность работы микрофинансовых организаций до исключения их из Реестра (табл. 4).

Наименьшая продолжительность работы МФО до исключения из Реестра — в Республике Ингушетия — 14 месяцев. В Чеченской Республике этот срок чуть

Таблица 1 / Table 1 Топ-10 регионов по количеству МФО / Top-10 regions by number of MFOs

Регион / Region Количество МФО / Number of MFOs

Москва 226

Новосибирская область 61

Санкт-Петербург 59

Иркутская область 53

Архангельская область 44

Красноярский край 44

Ростовская область 44

Самарская область 43

Краснодарский край 42

Республика Башкортостан 42

3 Сайт Росстата. URL: http://www.statdata.ru/largest_regions_ russia (дата обращения:27.07.2020).

Источник/Source: составлено автором на основе данных Банка России / compiled by the author based on data from the Bank of Russia.

дольше — 15 месяцев, вместе с тем, на одну действующую МФО приходится более 36 исключенных из Реестра, таким образом, прослеживается высокая нестабильность микрофинансовых организаций в этом регионе.

Таблица 2/ Table 2

Топ-10 регионов по количеству МФО на 1 млн чел. / Top-10 regions by number of MFOs per 1 million people

№ Регион / Region Количество МФО / Number of MFOs Население / Population Количество МФО на 1 млн чел. / Number of MFOs per 1 million people

1 Республика Алтай 9 220181 40,88

2 Архангельская область 44 1 136535 38,71

3 Костромская область 22 633385 34,73

4 Республика Саха (Якутия) 28 971996 28,81

5 Республика Северная Осетия - Алания 19 696837 27,27

6 Еврейская автономная область 4 158305 25,27

7 Республика Хакасия 13 534262 24,33

8 Томская область 26 1079271 24,09

9 Амурская область 19 790044 24,05

10 Удмуртская Республика 36 1500955 23,98

21 Москва 226 12 615 279 17,91

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Источник/Source: составлено автором на основе данных Банка России / compiled by the author based on data from the Bank of Russia.

Таблица 3/ Table 3

Топ-10 регионов по отношению количества исключенных из реестра МФО к действующим / Top 10 regions by the number of MFOs excluded from the register to the existing ones

№ Регион / Region Количество исключенных из реестра МФО / Number of MFOs excluded from the register Количество МФО / Number of MFOs Отношение количества исключенных к количеству действующих / The ratio of the excluded MFOs to the existing MFOs

1 Чеченская Республика 145 4 36,25

2 Ямало-Ненецкий автономный округ 16 1 16,00

3 Ярославская область 79 6 13,17

4 Республика Дагестан 51 4 12,75

5 Псковская область 12 1 12,00

6 Саратовская область 70 7 10,00

7 Волгоградская область 99 10 9,90

8 Республика Татарстан 335 36 9,31

9 Омская область 123 14 8,79

10 Кабардино-Балкарская Республика 25 3 8,33

12 Москва 1734 226 7,67

Источник/Source: составлено автором на основе данных Банка России / compiled by the author based on data from the Bank of Russia.

Таблица 4/ Table 4

Топ-10 регионов с наименьшей средней продолжительностью работы / Top 10 regions with the lowest average operating time

Регион / Region Средняя продолжительность работы МФО (в месяцах) / Average work duration of an MFO (months) Количество исключенных из реестра МФО / Number of MFOs excluded from the register Количество МФО / Number of MFOs Отношение количества исключенных к количеству действующих / The ratio of the excluded MFOs to the existing MFOs

Республика Ингушетия 14 3 1 3,00

Чеченская Республика 15 145 4 36,25

Псковская область 20 12 1 12,00

Республика Алтай 21 28 9 3,11

Саратовская область 21 70 7 10,00

Республика Карелия 22 17 5 3,40

Калужская область 22 20 8 2,50

Москва 22 1734 226 7,67

Курганская область 23 24 5 4,80

Тверская область 23 29 5 5,80

Источник/Source: составлено автором на основе данных Банка России / compiled by the author based on data from the Bank of Russia.

Наиболее высокая средняя продолжительность работы микрофинансовых организаций до исключения из Реестра в Кабардино-Балкарской Республике — 3,5 года. Около трех лет этот срок составляет в Сахалинской и Калининградской областях (табл. 5).

В этих регионах, а также в Приморском крае, Астраханской области на фоне небольших значений отношения количества исключенных из Реестра МФО к числу действующих организаций можно говорить о высокой стабильности сферы микрофинансирования.

ДАННЫЕ И МЕТОДЫ

Исключение микрофинансовой организации из Реестра по решению Банка России может свидетельствовать о ее вовлеченности в теневые финансовые схемы. Автоматизация процесса выявления недобросовестных участников рынка микрофинансирования на основе методов машинного обучения позволит контролирующим органам оперативно выявлять и пресекать противоправную деятельность, тем самым способствуя

обеспечению стабильности микрофинансового сектора.

Исследуем вероятность исключения МФО из реестра. Для проведения исследования выгружены данные с официального сайта Банка России4. Также были собраны данные отчетности микрофинансовых организаций, которые МФО обязаны публиковать на своих сайтах. Информация об организациях и отчетность дополнена рейтингом, который формируется сайтом banki.ru на основе отзывов клиентов микрофинансовых организаций.

Для каждой организации были выгружены следующие показатели:

• наименование организации;

• дата регистрации;

• дата исключения из Реестра;

• период деятельности в месяцах;

• регион;

• город;

4 Сайт Банка России. URL: https://www.cbr.ru/microfinance/ registry/ (дата обращения: 27.07.2020).

Таблица 5/ Table 5

Топ-10 регионов с наибольшей средней продолжительностью работы / Top 10 regions with the greatest average operating time

Регион / Region Средняя продолжительность работы МФО (в месяцах) / Average work duration of an MFO (months) Количество исключенных из реестра МФО / Number of MFOs excluded from the register Количество МФО / Number of MFOs Отношение количества исключенных к количеству действующих / The ratio of the excluded MFOs to the existing MFOs

Кабардино-Балкарская Республика 42 25 3 8,33

Сахалинская область 35 29 10 2,90

Калининградская область 35 44 11 4,00

Тульская область 34 56 10 5,60

Карачаево-Черкесская Республика 34 3 2 1,50

Ленинградская область 33 28 7 4,00

Приморский край 33 114 35 3,26

Республика Калмыкия 33 6 3 2,00

Астраханская область 33 55 11 5,00

Республика Северная Осетия -Алания 32 20 19 1,05

Источник/Source: составлено автором на основе данных Банка России / compiled by the author based on data from the Bank of Russia.

• профиль деятельности;

• рейтинг;

• размер уставного капитала по состоянию на конец года;

• размер долгосрочных финансовых обязательств;

• балансовая стоимость чистых активов по состоянию на конец года;

• балансовая стоимость активов;

• размер чистых процентных доходов;

• размер чистой прибыли;

• года представленной отчетности;

• сколько лет назад была представлена последняя отчетность;

• количество учредителей — физических и юридических лиц;

• информация о нахождении учредителей, руководителей и МФО в разных регионах;

• информация о юридических лицах-учредителях в офшорах.

Информация по названным показателям была собрана в разбивке по годам за период с 01.01.2015 по 09.05.2020 г. В итоговой выборке оказались 100 микрофинансовых организаций, из которых 50 за указанный период были исключены из реестра МФО.

В качестве индикатора устойчивости МФО введена логическая переменная «В реестре», для которой определены два состояния:

• 0 — организация исключена из реестра;

• 1 — организация находится в реестре.

Следовательно, итоговая база показателей состоит из 100 организаций, 19 показателей (перечисле-

ны выше), собранных за 64 месяца, и результирующего столбца «В реестре», в котором содержится информация об исключении МФО из реестра.

Задачу выявления недобросовестных участников рынка микрофинансирования можно рассматривать как задачу бинарной классификации. Рассмотрим традиционные методы и основанные на них современные алгоритмы, позволяющие решать задачи классификации в сфере финансового мониторинга.

Логистическая регрессия

Логистическая регрессия является хорошо изученным и широко применяемым в статистике методом. В современных исследованиях, освещенных в публикациях [10-12], логистическая регрессия применяется в комбинации с другими методами или для сравнения с ними [13, 14].

Деревья решений

Деревья решений обладают рядом преимуществ при решении задач классификации:

• эффективны в вычислениях и использовании компьютерной памяти, что делает их пригодными для работы с большими объемами данных;

• выбор функций интегрирован в процессы обучения и классификации;

• являются непараметрическими моделями, что позволяет обрабатывать данные с различным распределением.

К недостаткам данных алгоритмов можно отнести то, что результаты могут обладать вариативностью и невоспроизводимостью при изменении выборки.

Для устранения недостатков деревьев решений применяют их ансамбли. Ансамбли основаны на общем принципе, позволяющем получить лучшие результаты, комбинируя несколько связанных моделей. Как правило, ансамблевые модели обеспечивают более высокую точность по сравнению с отдельными деревьями решений.

Существует много различных способов ансам-блирования деревьев решений. Two-class decision forest и алгоритм Adaboost продемонстрировали наибольшую эффективность при решении задач финансового мониторинга.

Применение комбинированных методов для решения практических задач широко распространено. Характерными примерами могут служить работы [15-17].

Метод опорных векторов

Алгоритм предложен в 1963 г. Владимиром Вап-ником и Алексеем Червоненкисом. Алгоритм

двухклассовой машины опорных векторов (Two-class Support Vector Mashine) создает модель двоичной классификации с использованием алгоритма машины опорных векторов. Двухклассовая машина опорных векторов является алгоритмом обучения с учителем, обучается на размеченных данных.

Нейронные сети

Существует большое число различных моделей на основе нейронных сетей. В целях решения задач финансового мониторинга рассмотрим алгоритм двухклассовой нейронной сети.

Классификация с использованием нейронных сетей является методом обучения с учителем, поэтому для него требуется набор данных с тегами, который включает столбец меток. Алгоритм двухклассовой нейронной сети (Two-class neural network) используется для предсказания бинарных результатов, например, есть ли у пациента определенное заболевание, может ли машина выйти из строя в течение определенного периода времени или является ли тот или иной объект финансового мониторинга девиантным.

Байесовские сети

Байесовские сети применяются в основном для решения диагностических задач. Например, их часто используют в медицине, кредитном скорин-ге [18-20] и в других задачах, требующих оценки рисков.

Алгоритм двухклассовой сети Байеса (Two-class Bayes Point Machine) использует байесовский подход к линейной классификации, он эффективно аппроксимирует теоретически оптимальное байесовское среднее для линейных классификаторов (с точки зрения эффективности обобщения), выбирая один «средний» классификатор, точку Байеса. Являясь байесовской классификационной моделью, данный алгоритм не склонен к переобучению.

РЕЗУЛЬТАТЫ КЛАССИФИКАЦИИ

Продемонстрируем классификацию МФО по подготовленным данным на примере применения алгоритма Two-Class Logistic Regression. Схема машинного обучения представлена на рис. 2.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

На рис. 3 представлена ROC-кривая и показатели точности для данной модели. Так, показатель AUC для построенной модели равен 0,824.

Сравним результаты экспериментов, проведенных с различными моделями классификаций (табл. 6).

Можно сделать вывод, что из рассмотренных алгоритмов классификации наиболее точные

Рис. 2 /Fig. 2. Модель классификации Two-Class Logistic Regression / Two-Class Logistic Regression Classification Model

Источник/Source: составлено автором/compiled by the author.

Рис. 3 / Fig. 3. ROC-кривая и показатели точности для модели логрегрессии / ROC Curve and Accuracy Ratings for the Loregression Model

Источник/Source: составлено автором/compiled by the author.

Таблица 6/ Table 6

Показатели АУС для алгоритмов классификации / AuC indicators for classification algorithms

Модель классификации / Classification model

Two-Class Logistic Regression Two-Class Decision Forest Two-Class Boosted Decision Tree Two-Class Neural Network Two-Class Support Vector Machine Two-Class Bayes Point Machine

Значение AUC 0,824 0,796 0,688 0,833 0,873 0,855

Источник/Source: составлено автором / compiled by the author.

Mo^e/ib K/iaccnc|)MKau,WM Two-Class Support Vector Machine

^ Split Data V

IZII Two-Class Support Vector M... v/

Рис. 4/Fig. 4. Модель классификации Two-Class Support Vector Machine / Two-Class Support Vector Machine Classification Model

Источник/Source: составлено автором/compiled by the author.

результаты показал алгоритм Two-Class Support Vector Machine, значение AUC составило 0,873 (рис. 4, 5).

ВЫВОДЫ

Рынок микрофинансирования активно развивается в России и имеет высокую социальную значимость — краткосрочные займы могут стать серьезным подспорьем для гражданина в моменты, когда необходимо быстро восстановить финансовый баланс.

В то же время высок риск вовлечения микрофинансовых организаций в незаконные финансовые операции, мошенничество и отмывание доходов.

Автоматизация процесса выявления недобросовестных участников рынка микрофинансирования на основе методов машинного обучения позволит контролирующим органам оперативно выявлять и пресекать противоправную деятельность.

Сравнительный анализ результатов обработки данных о деятельности микрофинансовых организаций методами классификации — логистическая

Рис. 5 / Fig. 5. ROC-кривая и показатели точности для модели метода опорных векторов / ROC curve and accuracy ratios for support vector machine

Источник/Source: составлено автором / compiled by the author.

регрессия, деревьев решений (алгоритмы двух-классовый лес решений, Adaboost), метод опорных векторов (алгоритм двухклассовая машина опорных векторов), нейросетевыми методами (алгоритм двухклассовой нейронной сети), Байесовские сети (алгоритм двухклассовой сети Байеса), показал,

что наиболее точные результаты демонстрирует двухклассовая машина опорных векторов. Приведенные результаты исследования могут использоваться Банком России и Росфинмониторингом для автоматизации выявления недобросовестных микрофинансовых организаций.

СПИСОК ИСТОЧНИКОВ

1. Сорокин А. С., Шилов В. А. Многомерный статистический анализ структуры рынка микрофинансирования в России. Интернет-журнал Науковедение. 2016;8(1):10. DOI: 10.15862/10EVN 116

2. Макарова Е. Б. Особенности микрофинансирования в России. Вестник Волгоградского государственного университета. Серия 3: Экономика. Экология. 2017;19(4):80-86. DOI: 10.15688^то^и3.2017.4.9

3. Балашев Н. Б., Баркинхоева М. Х. Тенденции развития микрофинансового рынка в РФ. Экономика и бизнес: теория и практика. 2019;(10-1):27-31. DOI: 10.24411/2411-0450-2019-11207

4. Цветков В. А., Дудин М. Н., Сайфиева С. Н. Проблемы и перспективы развития микрофинансовых организаций в Российской Федерации. Финансы: теория и практика. 2019;23(3):96-111. DOI: 10.26794/25875671-2019-23-3-96-111.

5. Ордынская М. Е., Силина Т. А. Доступность микрофинансовых услуг для субъектов малого бизнеса (на материалах Республики Адыгея). Вестник Адыгейского государственного университета. Серия 5: Экономика. 2018;(3):213-224.

6. Черных С. И. Микрофинансовые организации в отечественной финансово-кредитной системе: проблемы роста. Вестник Института экономики Российской академии наук. 2017;(2):139-146.

7. Ершова И. В., Тарасенко О. А. Малое и среднее предпринимательство: трансформация российской системы кредитования и микрофинансирования. Вестник Пермского университета. Юридические науки. 2018;(39):99-124. DOI: 10.17072/1995-4190-2018-39-99-124

8. Евлахова Ю. С. Российские микрофинансовые организации: динамика развития и проблема вовлеченности в незаконные финансовые операции. Финансы и кредит. 2018;24(7):1637-1648. DOI: 10.24891/ ^.24.7.1637

9. Волков С. Е., Лоскутов И. Н. Мошенничество в области микрофинансов. М.: РАЕН; 2016. 20 с.

10. Pavlidis N. G., Tasoulis D. K., Adams N. M., Hand D. J. Adaptive consumer credit classification. Journal of the Operational Research Society. 2012;63(12):1645-1654. DOI: 10.1057/jors.2012.15

11. Yap B. W., Ong S. H., Husain N. H.M. Using data mining to improve assessment of credit worthiness via credit scoring models. Expert Systems with Applications. 2011;38(10):13274-13283. DOI: 10.1016/j.eswa.2011.04.147

12. Khemais Z., Nesrine D., Mohamed M. Credit scoring and default risk prediction: A comparative study between discriminant analysis and logistic regression. International Journal of Economics and Finance. 2016;8(4):39. DOI: 10.5539/ijef.v8n4p39

13. Li Z., Tian Y., Li K., Yang W. Reject inference in credit scoring using support vector machines. SSRNElectronic Journal. 2016. DOI: 10.2139/ssrn.2740856

14. Louzada F., Anacleto-Junior O., Candolo C., Mazucheli J. Poly-bagging predictors for classification modelling for credit scoring. Expert Systems with Applications. 2011;38(10):12717-12720. DOI: 10.1016/j. eswa.2011.04.059

15. Vukovic S., Delibasic B., Uzelac A., Suknovic M. A case-based reasoning model that uses preference theory functions for credit scoring. Expert Systems with Applications. 2012;39(9):8389-8395. DOI: 10.1016/j. eswa.2012.01.181

16. Marqués A. I., García V., Sánchez J. S. Two-level classifier ensembles for credit risk assessment. Expert Systems with Applications. 2012;39(12):10916-10922. DOI: 10.1016/j.eswa.2012.03.033

17. Akkoç S. An empirical comparison of conventional techniques, neural networks and the three-stage hybrid Adaptive Neuro Fuzzy Inference System (ANFIS) model for credit scoring analysis: The case of Turkish credit card data. European Journal of Operational Research. 2012;222(1):168-178. DOI: 10.1016/j.ejor.2012.04.009

18. Wu W.-W. Improving classification accuracy and causal knowledge for better credit decisions. International Journal of Neural Systems. 2011;21(4):297-309. DOI: 10.1142/S 0129065711002845

19. Zhu H., Beling P. A., Overstreet G. A. A Bayesian framework for the combination of classifier outputs. Journal of the Operational Research Society. 2002;53(7):719-727. DOI: 10.1057/palgrave.jors.2601262

20. Эскиндаров М. А., Соловьева В. И., ред. Парадигмы цифровой экономики: Технологии искусственного интеллекта в финансах и финтехе. М.: Когито-Центр; 2019. 325 с.

REFERENCES

1. Sorokin A. S., Shilov V. A. Multivariate statistical analysis of the structure of the microfinance market in Russia. Internet-zhurnalNaukovedenie. 2016;8(1):10. (In Russ.). DOI: 10.15862/10EVN 116

2. Makarova E. B. Features of microfinancing in Russia. Vestnik Volgogradskogo gosudarstvennogo universiteta. Seriya 3: Ekonomika. Ekologiya = Science Journal of VolSU. Global Economic System. 2017;19(4):80-86. (In Russ.). DOI: 10.15688/jvolsu3.2017.4.9

3. Balashev N. B., Barkinkhoeva M. Kh. Development trends of the microfinance market in the Russian Federation. Ekonomika i biznes: teoriya i praktika = Economy and Business: Theory and Practice. 2019;(10-1):27-31. (In Russ.). DOI: 10.24411/2411-0450-2019-11207

4. Tsvetkov V. A., Dudin M. N., Saifieva S. N. Problems and prospects for the development of microfinance organizations in the Russian Federation. Finansy: teoriya i praktika = Finance: Theory and Practice. 2019;23(3):96-111. (In Russ.). DOI: 10.26794/2587-5671-2019-23-3-96-111

5. Ordynskaya M. E., Silina T. A. Availability of microfinance services for small businesses (based on materials from the Republic of Adygea). Vestnik Adygeiskogo gosudarstvennogo universiteta. Seriya 5: Ekonomika = Bulletin of the Adyghe State University. Series: Economics. 2018;(3):213-224. (In Russ.).

6. Chernykh S. I. Microfinance organizations in the domestic financial and credit system: Problems of development. Vestnik Instituta ekonomiki Rossiiskoi akademii nauk = Bulletin of the Institute of Economics of the Russian Academy of Sciences. 2017;(2):139-146. (In Russ.).

7. Ershova I. V., Tarasenko O. A. Small and medium-sized enterprises: Transformation of the Russian crediting and microfinancing system. Vestnik permskogo universiteta. Yuridicheskie nauki = Perm University Herald. Juridical Sciences. 2018;(39):99-124. (In Russ.). DOI: 10.17072/1995-4190-2018-39-99-124

8. Evlakhova Yu. S. Russian microfinance organizations: Dynamics of development and the problem of involvement in illegal financial transactions. Finansy i kredit = Finance and Credit. 2018;24(7):1637-1648. (In Russ.). DOI: 10.24891/fc.24.7.1637

9. Volkov S. E., Loskutov I. N. Fraud in microfinance sphere. Moscow: Russian Academy of Natural Sciences; 2016. 20 p. (In Russ.).

10. Pavlidis N. G., Tasoulis D. K., Adams N. M., Hand D. J. Adaptive consumer credit classification. Journal of the Operational Research Society. 2012;63(12):1645-1654. DOI: 10.1057/jors.2012.15

11. Yap B. W., Ong S. H., Husain N. H.M. Using data mining to improve assessment of credit worthiness via credit scoring models. Expert Systems with Applications. 2011;38(10):13274-13283. DOI: 10.1016/j.eswa.2011.04.147

12. Khemais Z., Nesrine D., Mohamed M. Credit scoring and default risk prediction: A comparative study between discriminant analysis and logistic regression. International Journal of Economics and Finance. 2016;8(4):39. DOI: 10.5539/ijef.v8n4p39

13. Li Z., Tian Y., Li K., Yang W. Reject inference in credit scoring using support vector machines. SSRNElectronic Journal. 2016. DOI: 10.2139/ssrn.2740856

14. Louzada F., Anacleto-Junior O., Candolo C., Mazucheli J. Poly-bagging predictors for classification modelling for credit scoring. Expert Systems with Applications. 2011;38(10):12717-12720. DOI: 10.1016/j. eswa.2011.04.059

15. Vukovic S., Delibasic B., Uzelac A., Suknovic M. A case-based reasoning model that uses preference theory functions for credit scoring. Expert Systems with Applications. 2012;39(9):8389-8395. DOI: 10.1016/j. eswa.2012.01.181

16. Marqués A. I., García V., Sánchez J. S. Two-level classifier ensembles for credit risk assessment. Expert Systems with Applications. 2012;39(12):10916-10922. DOI: 10.1016/j.eswa.2012.03.033

17. Akkoç S. An empirical comparison of conventional techniques, neural networks and the three-stage hybrid Adaptive Neuro Fuzzy Inference System (ANFIS) model for credit scoring analysis: The case of Turkish credit card data. European Journal of Operational Research. 2012;222(1):168-178. DOI: 10.1016/j.ejor.2012.04.009

18. Wu W.-W. Improving classification accuracy and causal knowledge for better credit decisions. International Journal of Neural Systems. 2011;21(4):297-309. DOI: 10.1142/S 0129065711002845

19. Zhu H., Beling P. A., Overstreet G. A. A Bayesian framework for the combination of classifier outputs. Journal of the Operational Research Society. 2002;53(7):719-727. DOI: 10.1057/palgrave.jors.2601262

20. Eskindarov M. A., Solov'eva V.I., eds. Paradigms of the digital economy: Artificial intelligence technologies in finance and fintech. Moscow: Cogito-Center; 2019. 325 p. (In Russ.).

ИНФОРМАЦИЯ ОБ АВТОРЕ / ABOUT THE AUTHOR

Юлия Михайловна Бекетнова — кандидат технических наук, доцент факультета прикладной математики и информационных технологий, Финансовый университет, Москва, Россия

Yuliya M. Beketnova — Cand. Sci. (Eng.), Assoc. Prof., Faculty of Applied Mathematics and Information Technology, Financial University, Moscow, Russia [email protected]

Статья поступила в редакцию 10.08.2020; после рецензирования 24.08.2020; принята к публикации 12.09.2020. Автор прочитала и одобрила окончательный вариант рукописи.

The article was submitted on 10.08.2020; revised on 24.08.2020 and accepted for publication on 12.09.2020. The author read and approved the final version of the manuscript.

i Надоели баннеры? Вы всегда можете отключить рекламу.