ИСПОЛЬЗОВАНИЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В DLP-СИСТЕМАХ

Артюшкина Елена Сергеевна; Скакун Олеся Олеговна; Гузь Анастасия Руслановна

Научная статья

УДК 004

doi: 10.47576/2949-1908_2023_2_123

ИСПОЛЬЗОВАНИЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В DLP-СИСТЕМАХ

Артюшкина Елена Сергеевна

Поволжский государственный университет телекоммуникаций и информатики, Самара, Россия, lenkan_94@mail.ru

Скакун Олеся Олеговна

Поволжский государственный университет телекоммуникаций и информатики, Самара, Россия, skakunolesya777@gmail.com

Гузь Анастасия Руслановна

Поволжский государственный университет телекоммуникаций и информатики, Самара, Россия, a_guz01@mail.ru

Аннотация. В статье описываются система DLP и ее возможности, определяется взаимодействие с искусственным интеллектом. Отмечается актуальность использования искусственного интеллекта в Data Leak Prevention (DLP) системах. Используя возможности искусственного интеллекта в анализе данных, организации могут повысить свою способность обнаруживать, предотвращать и смягчать последствия утечки данных. Обозревается применение искусственного интеллекта в DLP-системах. Рассматриваются преимущества его использования в системах безопасности, их недостатки, дальнейшие перспективы развития.

Ключевые слова: искусственный интеллект; Data Leak Prevention; BigData.

Для цитирования: Артюшкина Е. С., Скакун О. О., Гузь А. Р. Использование искусственного интеллекта в DLP-системах // Прикладные экономические исследования. 2023. № 2. С. 123-129. https://doi.org/10.47576/2949-1908_2023_2_123.

Original article

USING ARTIFICIAL INTELLIGENCE IN DLP SYSTEMS Artyushkina Elena S.

Volga State University of Telecommunications and Informatics, Samara, Russia, lenkan_94@mail. ru

Skakun Olesya O.

Volga State University of Telecommunications and Informatics,

Samara, Russia, skakunolesya777@gmail.com

Guz Anastasia R.

Volga State University of Telecommunications and Informatics,

Samara, Russia, a_guz01@mail.ru

Abstract. The article describes the DLP system and its capabilities, determines the interaction with artificial intelligence. The relevance of the use of artificial intelligence in Data Leak Prevention (DLP) systems is noted. By leveraging the capabilities of artificial intelligence in data analysis, organizations can enhance their ability to detect, prevent, and mitigate the effects of data leaks. The application of artificial intelligence in DLP systems is reviewed. The advantages of its use in security systems, their disadvantages, and further prospects for development in DLP systems are considered.

Keywords: Artificial Intelligence; Data Leak Prevention; BigData.

For citation: Artyushkina E. S., Skakun O. O., Guz A. R. Using artificial intelligence in DLP systems. Applied economic research, 2023, no. 2, pp. 123-129. https://doi.org/10.47576/2949-1908_2023_2_123.

На сегодняшний день защита конфиденциальной информации и данных стала первостепенной задачей для компаний, государств и частных лиц. Распространенность утечек и взломов данных выявила острую необходимость в надежных и эффективных системах предотвращения утечек данных. DLP-система - программный продукт, защищающий от утечек конфиденциальных данных. Такие системы создают цифровой купол безопасности вокруг компании и анализируют все исходящую, а иногда и входящую информацию. Контроль охватывает не только интернет-трафик, но и ряд других информационных потоков: документы на внешних устройствах, документы, которые распечатываются или отправляются на мобильные устройства через Bluetooth и т. д. [1]

Для решений проблем утечек данных применение искусственного интеллекта стало передовым решением. Используя его возможности, организации могут повысить способность обнаруживать, предотвращать и смягчать последствия утечек данных самым эффективным образом.

Традиционные методы DLP часто опираются на ручной мониторинг, правила и реактивные меры, которых недостаточно в современном динамичном мире угроз. Ис-

кусственный интеллект предлагает перспективный подход, используя алгоритмы машинного обучения, передовую аналитику и возможности автоматизации для обнаружения и реагирования на утечки данных в режиме реального времени.

Британская компания Surfshark, занимающаяся кибербезопасностью, опубликовала аналитику за 2022 г., где перечислены страны с наибольшим количеством утечек данных (рис. 1). На пять стран приходится наибольшее количество утечек - почти две трети (63,5 %). В 2021 г. Россия занимала 4-е место, теперь поднявшись на 1-е с третью всех утечек за 2022 г. В 2022 г. произошла утечка 104,8 млн российских аккаунтов, что в три раза больше по сравнению с 36 млн в 2021 г.

Третье по величине нарушение в России произошло в сети медицинских лабораторий Gemotest, где были выявлены около 6 млн учетных записей, что составило 6 % от общего числа нарушений в России в 2022 г. [2]

Инструменты на базе искусственного интеллекта могут просматривать объемные данные для выявления нетипичного поведения и быстрого выявления вредоносных действий. Автоматизация некоторых процессов, таких как перенаправление трафика с уязви-

113,6

104,8

20,1

23,5

Россия ■ Китай иСША «Франция ■ Индонезия ■ Другие страны Рисунок 1 - Рейтинг стран с наибольшим количеством утечек данных (млн)

мого сервера, может помочь быстрее реагировать на атаки.

Также, по сравнению с обычными решениями безопасности, системы на основе искусственного интеллекта более точны и эффективны. Он может сканировать множество устройств на предмет уязвимостей по сравнению с людьми, выполняющими ту же операцию.

Благодаря своей способности быстро и точно обрабатывать огромные объемы данных, искусственный интеллект сокращает время для реагирования на проблемы безопасности и снижает стоимость защиты от онлайн-атак. Технологии, основанные на искусственном интеллекте, позволяют обнаруживать и предотвращать вредоносные действия путем анализа и сопоставления различных данных. Эти инновационные решения легко масштабируется, что позволяет повысить уровень безопасности без необходимых больших инвестиций в оборудование или увеличение персонала.

Развертывание искусственного интеллекта поможет обнаружить все формы атак, определять их приоритетность и предотвращать. Он подходит для борьбы с различными опасностями благодаря своим возможностям самообучения [3].

Однако использование искусственного интеллекта в системе безопасности также обладает и слабыми сторонами. Основным функционалом искусственного интеллекта в выявлении утечек является способность выявлять сходства между документами или возможность определять, стоит ли отправлять конкретный документ определенному лицу. Шаблоны компаний, например счета-фактуры, бывают очень схожи при каждой отправке и обладают лишь незначительными различиями, которые обычно не улавливаются искусственным интеллектом. Это один из минусов, который, как правило, позволит пользователю отправить вложение. Но даже когда искусственный интеллект обнаружит проблему, которую стоит отметить, он предупредит команду администрирования, а не пользователя.

Хранение данных искусственного интеллекта также может быть очень трудоемким. Это связано с тем, что каждое письмо должно отправляться во внешнюю систему, за пределы сайта, для анализа. Многие компании, особенно на уровне предприятия, недовольны тем, что их конфиденциальные данные передаются в другое место. Последнее, чего они хотят, это чтобы данные хранились за пределами сайта, даже если это просто

для анализа. Таким образом, искусственный интеллект добавляет ненужный элемент риска к конфиденциальным материалам [4].

Продолжая обсуждение проблем взаимодействия между искусственным интеллектом и людьми в системах предотвращения утечек данных (DLP), следует отметить несколько аспектов:

1. Сложность восприятия и объяснения решений искусственного интеллекта. Искусственный интеллект, особенно основанный на глубоком обучении, может представлять сложности в понимании принятых им решений. Часто он работает на основе сложных алгоритмов, которые трудно интерпретировать и объяснить людям. Это создает проблемы в области доверия и прозрачности, поскольку пользователи и организации хотят понимать, как принимаются решения и почему.

2. Роль человека в процессе DLP. Вопреки автоматизации и автономии искусственного интеллекта, роль человека в системах DLP остается критически важной. Люди обладают уникальными контекстуальными знаниями, этическими соображениями и способностью принимать окончательные решения. Необходимо установить четкий баланс между автоматизацией и участием человека, чтобы обеспечить надежность и эффективность системы DLP.

3. Проблемы ложных срабатываний и пропусков. Системы DLP, основанные на искусственном интеллекте, могут столкнуться с проблемами ложных срабатываний (когда система считает нормальное действие как утечку) и пропусков (когда система не обнаруживает настоящую утечку). Это может быть вызвано сложностью анализа контекста и ситуаций, а также изменчивостью вида и характера утечек данных. Работа над улучшением точности и надежности системы DLP является важной задачей.

4. Культурные и этические аспекты. Вне-

дрение систем DLP, использующих искусственный интеллект, подразумевает учет культурных и этических нюансов. Различные страны и организации могут иметь разные нормы и ограничения в отношении сбора, анализа и использования данных. Важно учитывать эти различия и обезопаситься от нарушений приватности и неправомерного использования данных. Также существуют этические вопросы, связанные с принятием решений искусственным интеллектом, особенно в случаях, когда автоматизированная система может принимать меры по блокировке или ограничению доступа к данным без прямого вмешательства человека.

5. Обучение и обновление моделей искусственного интеллекта. Искусственный интеллект требует обучения и постоянного обновления моделей, чтобы быть эффективным в обнаружении новых угроз и утечек данных. Это требует доступа к актуальным данным, анализа и адаптации моделей, а также внедрения новых алгоритмов и методов. Этот процесс может быть сложным и требует высокой квалификации специалистов, чтобы гарантировать точность и надежность системы DLP.

6. Развитие систем в соответствии с изменяющимся угрозами. Угрозы в области информационной безопасности постоянно эволюционируют, и системы DLP должны быть готовы к новым видам атак и утечек данных. Искусственный интеллект может помочь в обнаружении новых угроз и аномалий, но требуется постоянное обновление и развитие системы, чтобы оставаться эффективным и защищать от новых видов угроз [5].

Нейронные сети широко применяются в системах предотвращения утечек данных (DLP) для обнаружения аномалий и идентификации потенциальных утечек. Вот несколько способов, как нейронные сети могут быть использованы в DLP:

Таблица 1 - Использование нейронных сетей в DLP

Нейронные сети могут быть обучены на основе нормального поведения системы или пользователей, чтобы выявлять аномалии или необычные паттерны, которые могут указывать на потенциальные утечки данных. Модель нейронной сети может выявлять аномалии в реальном времени, сравнивая текущие данные с обученными шаблонами.

Распознавание образцов Нейронные сети могут быть использованы для распознавания образцов или характеристик, связанных с утечками данных. Например, нейронная сеть может быть обучена для обнаружения подозрительных активностей, таких как необычные запросы к базе данных или несанкционированный доступ к конфиденциальным файлам

Классификация утечек Нейронные сети могут использоваться для классификации типов утечек данных. После обнаружения потенциальной утечки, модель нейронной сети может определить ее характеристики и классифицировать ее, помогая сотрудникам службы безопасности принять соответствующие меры

Анализ поведения Нейронные сети могут быть обучены на основе исторических данных о поведении пользователей и системы, чтобы распознавать подозрительные или необычные действия. Это может включать анализ сеансов входа в систему, активности сети или использования ресурсов, чтобы выявить потенциальные утечки данных

Прогнозирование рисков Нейронные сети могут использоваться для прогнозирования рисков утечек данных на основе анализа различных факторов, таких как контекст события, характеристики пользователя или системы, история утечек и другие параметры. Это позволяет принимать меры по предотвращению утечек данных до их возникновения

Важно отметить, что применение нейронных сетей в системах DLP требует как технических навыков по обучению моделей, так и понимания основных принципов безопасности и конкретных контекстуальных факторов, связанных с данными и организацией. Также необходимо учитывать этические аспекты, связанные с обработкой и использованием данных пользователей.

Возможности и перспективы дальнейшего развития применения нейронных сетей в системах предотвращения утечек данных (DLP) весьма обширны. Некоторые из них включают:

1. Улучшение точности обнаружения утечек. С постоянным развитием алгоритмов и архитектур нейронных сетей можно ожидать улучшения точности обнаружения утечек данных. Это может быть достигнуто путем более глубокого и сложного моделирования аномалий и паттернов, а также использованием современных методов глубокого обучения, таких как генеративные модели и архитектуры Transformer.

2. Адаптивность и обучение в реальном времени. Системы DLP могут развиваться в сторону более адаптивных и самообучающихся моделей нейронных сетей. Это означает, что модели могут обучаться и адаптироваться в реальном времени, учитывая изменяющуюся природу угроз и новые паттерны утечек данных.

3. Интеграция с другими методами безопасности. Нейронные сети могут стать одной из составляющих комплексных систем безопасности, работая вместе с другими методами обнаружения и предотвращения

утечек данных. Это может включать интеграцию с системами управления доступом, мониторингом событий и аудитом, что позволит создать комплексный подход к безопасности данных.

4. Расширение области применения. Нейронные сети могут быть применены в различных сферах и отраслях, где безопасность данных имеет особое значение. Это может включать банковскую и финансовую сферу, здравоохранение, электронную коммерцию и многие другие. Перспективы включают адаптацию и оптимизацию моделей для конкретных отраслей и обеспечение более точной и эффективной защиты данных.

5. Учет этических и правовых аспектов. С развитием применения нейронных сетей в DLP становится все более важным учитывать этические и правовые аспекты. Это включает соблюдение приватности данных, прозрачность и объяснимость принимаемых решений, а также ответственное использование данных. В будущем ожидается разработка стандартов и нормативных актов, которые регулируют применение нейронных сетей в системах DLP с учетом этических и правовых аспектов.

6. Развитие интерпретируемости нейронных сетей: Одной из важных задач для применения нейронных сетей в DLP является разработка методов интерпретируемости. Пользователи и организации заинтересованы в понимании принимаемых решений и объяснении, какие факторы и признаки были использованы нейронной сетью для обнаружения утечек данных. Развитие методов интерпретируемости поможет повысить до-

верие к системам ДПЛ и обеспечить прозрач -ность в их работе.

7. Применение мультимодальных нейронных сетей. В будущем возможно применение мультимодальных нейронных сетей в системах DLR Это позволит использовать несколько источников данных, таких как текстовые данные, аудио- и видеозаписи, сенсорные данные и другие, для более точного обнаружения и предотвращения утечек данных. Мультимодальные нейронные сети смогут анализировать и объединять информацию из различных источников, улучшая общую эффективность систем DLR

8. Использование федеративного обучения. Федеративное обучение является методом обучения нейронных сетей на распределенных данных без их централизованной передачи. В контексте систем DLP федера-

тивное обучение позволяет обучать модели на данных, которые находятся у различных пользователей или организаций, сохраняя приватность и конфиденциальность данных. Это может быть особенно полезно при разработке общих моделей для предотвращения утечек данных в масштабе индустрии или общества.

Таким образом, развитие и применение нейронных сетей в системах предотвращения утечек данных представляет значительные перспективы для улучшения безопасности и защиты информации. Однако необходимо учитывать проблемы взаимодействия между искусственным интеллектом и людьми, а также этические аспекты, чтобы создать надежные и эффективные системы DLR

Список источников

1. DLP-системы. Что такое DLP-система и как она работает? URL: https://searchinform.com/ infosec-blog/2019/04/14/dlp-systems-what-is-a-dlp-system-and-how-does-it-work/ (дата обращения: 04.05.2023).

2. Статистика нарушений данных в 2021 и 2022 годах. URL: https://surfshark.com/blog/data-breach-recap-2022 (дата обращения: 04.05.2023).

3. Преимущества и риски внедрения искусственного интеллекта в защиту данных. URL: https://www.aisangam.com/blog/the-benefits-and-risks-of-implementing-ai-in-data-security/ (дата обращения: 04.05.2023).

4. Предотвращение потери данных: искусственный интеллект против человеческого понимания. URL: https://www.thehrdirector.com/features/crisis-management/data-loss-prevention-artificial-intelligence-vs-human-insight/ (дата обращения: 04.05.2023).

5. Шаньгин В. Ф. Информационная безопасность и защита информации. М. : ДМК-Пресс, 2017. 702 с.

References

1. DLP systems. What is a DLP system and how does it work? URL: https://searchinform.com/ infosec-blog/2019/04/14/dlp-systems-what-is-a-dlp-system-and-how-does-it-work / (accessed: 04.05.2023).

2. Statistics of data breaches in 2021 and 2022. URL: https://surfshark.com/blog/data-breach-recap-2022 (accessed: 05/04/2023).

3. Advantages and risks of implementing artificial intelligence in data protection. URL: https:// www.aisangam.com/blog/the-benefits-and-risks-of-implementing-ai-in-data-security (accessed: 05/04/2023).

4. Data loss prevention: Artificial intelligence versus human understanding. URL: https://www. thehrdirector.com/features/crisis-management/data-loss-prevention-artificial-intelligence-vs-human-insight (date of reference: 04.05.2023).

5. Shangin V. F. Information security and information protection. Moscow: DMK-Press, 2017. 702 p.

Сведения об авторах

АРТЮШКИНА ЕЛЕНА СЕРГЕЕВНА - ассистент кафедры информационных систем и технологий, Поволжский государственный университет телекоммуникаций и информатики, Самара, Россия, lenkan_94@mail.ru

СКАКУН ОЛЕСЯ ОЛЕГОВНА - студент, Поволжский государственный университет телекоммуникаций и информатики, Самара, Россия, skakunolesya777@gmail.com ГУЗЬ АНАСТАСИЯ РУСЛАНОВНА - студент, Поволжский государственный университет телекоммуникаций и информатики, Самара, Россия, a_guz01@mail.ru

Information about the authors

ARTYUSHKINA ELENA S. - Assistant of the Department of Information Systems and Technologies, Volga State University of Telecommunications and Informatics, Samara, Russia, lenkan_94@mail.ru

SKAKUN OLESYA O. - Student, Volga State University of Telecommunications and Informatics, Samara, Russia, skakunolesya777@gmail.com

GUZ ANASTASIA R. - Student, Volga State University of Telecommunications and Informatics, Samara, Russia, a_guz01@mail.ru

ИСПОЛЬЗОВАНИЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В DLP-СИСТЕМАХ Текст научной статьи по специальности «Компьютерные и информационные науки»

USING ARTIFICIAL INTELLIGENCE IN DLP SYSTEMS

Текст научной работы на тему «ИСПОЛЬЗОВАНИЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В DLP-СИСТЕМАХ»