Научная статья на тему 'ИССЛЕДОВАНИЕ МЕТОДОВ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ РАСПОЗНАВАНИЯ МОШЕННИЧЕСКИХ ТРАНЗАКЦИЙ'

ИССЛЕДОВАНИЕ МЕТОДОВ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ РАСПОЗНАВАНИЯ МОШЕННИЧЕСКИХ ТРАНЗАКЦИЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
искусственный интеллект / машинное обучение / нейронные сети / мошенничество мошеннические транзакции / обнаружение мошенничества / глубокое обучение / прогнозирование мошенничества / кибербезопасность / artificial intelligence / machine learning / neural networks / fraud / fraudulent transactions / fraud detection / deep learning / fraud prediction / cybersecurity

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Палагутина Варвара Дмитриевна, Верещагин Михаил Дмитриевич

Статья посвящена разработке методов искусственного интеллекта для распознавания мошеннических транзакций. Выполнено сравнение результатов машинного обучения и нейронных сетей, рассмотрен вопрос применения.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Палагутина Варвара Дмитриевна, Верещагин Михаил Дмитриевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

RESEARCH ON ARTIFICIAL INTELLIGENCE METHODS FOR FRAUDULENT TRANSACTION DETECTION

The article is devoted to the development of artificial intelligence methods for recognizing fraudulent transactions. The results of machine learning and neural networks are compared, and the issue of application is considered.

Текст научной работы на тему «ИССЛЕДОВАНИЕ МЕТОДОВ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ РАСПОЗНАВАНИЯ МОШЕННИЧЕСКИХ ТРАНЗАКЦИЙ»

Палагутина Варвара Дмитриевна

Балтийский федеральный университет имени И. Канта Научный руководитель: Верещагин Михаил Дмитриевич

Балтийский федеральный университет имени И. Канта

г. Калининград, РФ

ИССЛЕДОВАНИЕ МЕТОДОВ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ РАСПОЗНАВАНИЯ

МОШЕННИЧЕСКИХ ТРАНЗАКЦИЙ

Аннотация

Статья посвящена разработке методов искусственного интеллекта для распознавания мошеннических транзакций. Выполнено сравнение результатов машинного обучения и нейронных сетей, рассмотрен вопрос применения.

Ключевые слова

искусственный интеллект, машинное обучение, нейронные сети, мошенничество мошеннические транзакции, обнаружение мошенничества, глубокое обучение, прогнозирование мошенничества, кибербезопасность

Palagutina Varvara D.,

Immanuel Kant Baltic Federal University Kaliningrad, Russia Supervisor: Vereshchagin Mikhail D.,

Immanuel Kant Baltic Federal University Kaliningrad, Russia

RESEARCH ON ARTIFICIAL INTELLIGENCE METHODS FOR FRAUDULENT TRANSACTION DETECTION

Abstract

The article is devoted to the development of artificial intelligence methods for recognizing fraudulent transactions. The results of machine learning and neural networks are compared, and the issue of application is considered.

Keywords:

artificial intelligence, machine learning, neural networks, fraud, fraudulent transactions, fraud detection, deep learning, fraud prediction, cybersecurity

Задача распознавания мошеннических транзакций является очень актуальной в данное время. Только в рамках одного банка РФ — Сбербанка по данным на 2023 год было сохранено более 5.9 млрд рублей клиентов [1, с. 81]. А в сумме благодаря системам антифрода (от англ. anti-fraud — борьба с мошенничеством) [2] в Сбере было сохранено более 276 млрд рублей [1, с. 197]. Количество операций с каждым годом растет, также растет уровень и сложность действий мошенников, поэтому максимально важно развивать системы противодействия мошенникам, используя современные технологии. Также данные системы необходимо использовать не только в банковском секторе, но и в электронной коммерции, финансовом секторе.

В данный момент большинство антифрод систем построено при помощи машинного обучения [3], так как данные технологии достаточно неплохо выявляют мошеннические транзакции, легко интерпретируемы, и требуют меньше ресурсов, чем нейронные сети. В последние годы благодаря

активному развитию интерпретаторов, таких как: LIME, SHAP, Integrated Gradients, Grad-CAM, DeepLIFT, Anchors, интерпретируемость результатов работы нейронных сетей существенно повысилась, а потому в рамках данной работы мы будем исследовать и нейросетевые методы.

Для исследования применились различные популярные методы машинного обучения, такие как: логистическая регрессия, деревья решений, случайной лес, а также нейронные сети различных конфигураций. Наибольшую эффективность среди не нейросетевых методов показал метод XGBoost [4]. Архитектура используемой нейронной сети будет представлена в статье далее.

Для обучения возьмем дата-сет с kaggle (Рис. 1) с искусственно смоделированными данными с параметрами: сумма транзакции, место и время ее совершения, информация о том, использовался ли чип и была ли транзакция отмечена как подозрительная. Обработаем данные и сбалансируем, чтобы при обучении использовалась равномерная выборка для более корректного обучения.

User Card Year Month Day Time Amount Use Chip Merchant Name MerchantCity Merchant State Zip MCC Errors? Is Fraud?

0 2002 0 1 06:21 $134.09 Swipe Transaction 3527213246127876953 La Verne CA 917500 5300 NaN No

0 2002 9 - 06:42 $38.48 Swipe Transaction -727612092139916043 Monterey Park CA 917540 5411 NaN No

0 2002 8 2 06:22 $120.34 Swipe Transaction -727612092139916043 Monterey Park CA 91754 0 5411 NaN No

0 2002 9 2 17:45 $128.95 Swipe Transaction 3414527459579108770 Monterey Park CA 91754 0 5651 NaN No

0 2002 S 3 06:23 $104.71 Swipe Transaction 5817218446178736267 La Verne CA 917500 5912 NaN No

Рисунок - Начальные значения дата-сета Источник: разработано автором

Для XGBoost воспользуемся классом XGBClassifier из библиотеки XGBoost и для дополнительного улучшения значения используем GridSearchCV из scikit-learn для подбора гиперпараметров.

Построим и обучим нейронную сеть типа MLPClassifier (Multi-layer Perceptron) многослойный перцептрон (в дальнейшем MLP-модель), показывающую высокую эффективность в задачах бинарной классификации [5]. Были исследованы различные архитектуры (по количеству слоев и нейронов). Наилучший результат был получен для MLP-модели, состоящей из 3х слоев (50, 25 и 10 нейронов, соответственно) с функцией активации на скрытых слоях ReLU, а на выходном Sigmoid, с регуляризатором L2 (0.00001) и оптимизатором Adam.

В качестве метрики была выбрана ROC AUC [6], она позволяет оценить производительность моделей и является отличной метрикой для оценки бинарных классификаций. Сравним результаты обучения XGBoost (Рис. 2) и MLP-модели (Рис. 3) при помощи построения графиков ROC. По ним видно, что MLP-модель дает несколько хуже результаты, чем XGBoost, однако уступает совсем не сильно. Однако оба графика показывают отличные результаты распознавания мошеннических действий, что доказывает эффективность используемых методов.

Рисунок 2 - График ROC для XGBoost Источник: разработано автором

Рисунок 3 - График ROC для MLP-модели Источник: разработано автором

Также можно убедиться в качестве моделей построив графики обучения для MLP-модели (Рис. 4) и XGBoost (Рис. 5). По данным графикам можно сделать вывод, что MLP-модель достигает максимум своей производительности на 10 эпохе и после почти не улучшается, из чего можно сделать вывод, что в целом обучение можно было остановить и раньше. XGBoost стабилизируется только на 60 эпохе. Также графики показывают отсутствие переобучения, что еще раз подтверждает эффективность построенных моделей.

Рисунок 4 - График обучения MLP-модели Источник: разработано автором

Рисунок 5 - График обучения для XGBoost Источник: разработано автором

По итогам сравнения можно сделать вывод, что в данный момент при построении антифрод-систем все также лучше использовать методы машинного обучения. Нейронные сети уступают по качеству обучения, для их обучения затрачивается гораздо больше ресурсов и времени, а также интерпретация результатов затруднена и выполняется гораздо сложнее, чем для методов машинного обучения, в частности используемого ранее XGBooost.

В качестве дальнейшего изучения данной темы и улучшения результатов предсказания можно дополнительно изучить различные конфигурации ранее рассмотренных моделей. Также можно попробовать воспользоваться другой, на данный момент менее изученной, архитектурой нейронной сети: Kolmogorov-Arnold Networks (KAN) [7]. Данная архитектура представляет собой перспективную альтернативу MLP, и может также дать еще более качественные результаты для нашей задачи. Список использованной литературы:

1. ПАО Сбербанк. Годовой отчет за 2023 год [Электронный ресурс]. — Москва: ПАО Сбербанк, 2024. — 356 с. — Режим доступа: https://www.sberbank.com/common/img/ uploaded/_new_site/com/ gosa2024/sber-ar-2023-ru.pdf — 24.05.2024

2. Как устроен антифрод и почему с мошенниками так сложно бороться [Электронный ресурс] // РБК. Тренды. — Режим доступа: https://trends.rbc.ru/trends/industry/6167ff259a7947f4c6908e46?from=copy - 28.05.2024

3. Srokosz M., Bobyk, A., Ksiezopolski, B., Wydra, M. Machine-Learning-Based Scoring System for Antifraud CISIRTs in Banking Environment //Electronics. - 2023. - Т. 12. - №. 1. - С. 251.

4. Wang C., Deng C., Wang S. Imbalance-XGBoost: leveraging weighted and focal losses for binary label-imbalanced classification with XGBoost //Pattern Recognition Letters. - 2020. - Т. 136. - С. 190-197.

5. Бинарная классификация с использованием нейронной сети scikit [Электронный ресурс] // ЛАБОРАТОРИЯ НАУКИ О ДАННЫХ — Режим доступа: https://visualstudiomagazine.com/ articles/2023/ 06/15/scikit-neural-network.aspx - 28.05.2024

6. Разбираемся в ROC и AUC [Электронный ресурс] // Хабр — Режим доступа: https://habr.com/ru/companies/otus/articles/809147/ - 28.05.2024

7. Ziming Liu, Yixuan Wang, Sachin Vaidya, Fabian Ruehle, James Halverson, Marlin Soljacic, Thomas Y. Hou, Max Tegmark. KAN: Kolmogorov-Arnold Networks // arXiv. 2024. С. 1-15.

© Палагутина В.Д., 2024

i Надоели баннеры? Вы всегда можете отключить рекламу.