Научная статья на тему 'ХАРАКТЕРИСТИКА МЕТОДОВ БОРЬБЫ СО СПАМОМ'

ХАРАКТЕРИСТИКА МЕТОДОВ БОРЬБЫ СО СПАМОМ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
29
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
спам / методы предотвращения распространения / методы обнаружения. / spam / spread prevention methods / detection methods

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Н.А. Байкалова, А.В. Пугач, В.В. Золотарев

В данной статье приведена характеристика нескольких популярных методов борьбы со спамом и выявлены их преимущества и недостатки.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Н.А. Байкалова, А.В. Пугач, В.В. Золотарев

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DESCRIPTION OF ANTI-SPAM METHODS

This article describes several well-known methods for preventing the spread of spam and identifies their advantages and disadvantages.

Текст научной работы на тему «ХАРАКТЕРИСТИКА МЕТОДОВ БОРЬБЫ СО СПАМОМ»

УДК 004.94

ХАРАКТЕРИСТИКА МЕТОДОВ БОРЬБЫ СО СПАМОМ

Н.А. Байкалова, А.В. Пугач Научный руководитель - В.В. Золотарев

Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

Е-mail: natalia03baikalova@gmail.com

В данной статье приведена характеристика нескольких популярных методов борьбы со спамом и выявлены их преимущества и недостатки.

Ключевые слова: спам, методы предотвращения распространения, методы обнаружения.

DESCRIPTION OF ANTI-SPAM METHODS

N.A. Baikalova, A.V. Pughach Scientific supervisor - V.V. Zolotarev

Reshetnev Siberian State University of Science and Technology 31, Krasnoyarskii rabochii prospekt, Krasnoyarsk, 660037, Russian Federation Е-mail: natalia03baikalova@gmail.com

This article describes several well-known methods for preventing the spread of spam and identifies their advantages and disadvantages.

Keywords: spam, spread prevention methods, detection methods.

Одно из важнейших свойств Интернета - его роль в передаче и хранении информации. Сегодня по всему миру миллионы устройств и их пользователи имеют доступ к Интернету и используют его для этих целей. Эффективными средствами обмена и хранения информации является электронная почта, веб-страницы и неразрывно связанные с ними поисковые системы.

Спам заметно усложняет пользование этими сервисами. Неудобство, доставляемое им, варьируется от навязчивых писем, мешающих просмотру легитимной почты, до полноценных атак, перегружающих инфраструктуры компаний и клиентских сервисов, затрудняющих или и вовсе останавливающих их работу. При помощи спамовых сообщений также распространяются вредоносные программы, осуществляется хищение денежных средств, кража личных данных пользователей [1].

Затруднительным также является тот факт, что не все пользователи Интернета могут различать легитимную почту и спам, что делает их уязвимыми для таких атак. Для предотвращения негативных последствий применяются методы, определяющие спамовые сообщения и ограничивающие их от конечного пользователя, чем обеспечивают его безопасность в виртуальной среде [2].

Данная тема является актуальной, так как злоумышленники находят способы обмануть существующие методы и создают новые способы распространения спама, из-за чего необходимо совершенствовать методы борьбы со спамом и находить новые. Для этого

Актуальные проблемы авиации и космонавтики - 2022. Том 2

необходимо разбираться в существующих методах и понимать, с какими аспектами спама они работают.

Спам представляет собой анонимную незапрошенную массовую рассылку, которая обладает следующими свойствами и особенностями:

1) Распределенность - значительная часть спам-сообщений распространяется через оборудование у конечных пользователей путём использования уязвимостей в пользовательском программном обеспечении, вредоносных программ, уязвимостей в беспроводных сетях;

2) Персонализация - уникальность существенной доли спам-сообщений. Это свойство может выражаться во внесении в сообщение случайных последовательностей символов, обычно невидимых для читателя, или персональных обращениях;

3) Маскировка под легальные письма. Это касается как технической информации сообщения - спамеры делают её максимально похожей на легальные сообщения, что позволяет спаму проходить через формальные фильтры, так и непосредственного содержания сообщения;

4) Необходимость быть легко читаемым. Основной объем текста должен быть получен в составе сообщения в привычном для пользователя виде, вызывая доверие в своей легитимности;

5) Обеспечение уникальности автоматическим путем - возможность добавления макетов сообщений при помощи программы случайным образом, не допуская их повторений.

Все методы борьбы со спамом можно разделить на две категории: предотвращения, стремящиеся к ограничению отправки и доступа к адресату (САРТСНА, черные списки, серые списки), и идентификации, направленные на обработку полученных сообщений и последующей их классификации (метод наивного Байеса, проверка интернет-заголовков, контроль массовости) [3].

Методы борьбы со спамом

Предотвращение отправления

Предотвращение получения

Контентная фильтрация

Другие методы

Рис. 1. Классификация методов борьбы со спамом.

Рассмотрим методы каждой категории, выявим их особенности, преимущества и недостатки.

САРТСНА - полностью автоматизированный публичный тест Тьюринга для различения компьютеров и людей. Имеет несколько реализаций, большинство из которых роботы уже умеют проходить. Основная особенность последней версии данного метода заключается в рассмотрении движения курсора мыши. Любое такое движение, созданное человеком, содержит определенную степень случайности, представляющую собой мелкие неосознанные движения, которым боту подражать сложно, что позволяет предотвратить отправление спама [4]. Однако и новейшую версию этого метода возможно обмануть.

Черные списки представляют собой набор 1Р-адресов почтовых сервисов, которые уже были использованы спамерами для рассылки. Для пополнения списка используется обратная

связь пользователей и результаты иных методов борьбы со спамом, что позволяет сформировать репутацию, в зависимости от которой адрес может попасть в этот список [3]. Недостаток этого метода состоит в том, что для попадания в список с адреса уже должен распространяться спам, который может нанести вред.

Серые списки представляют собой временный отказ в приеме сообщения из неизвестного системе источника с кодом ошибки 4хх, который понимают все почтовые системы. Совершается повторная отправка легитимной почты, чего не делают программы, рассылающие спам. Недостатком такого метода является задержка в доставке сообщений, которая может варьироваться от 15 минут до нескольких дней в случае плохо настроенных систем отправителя [5].

Контроль массовости - это выявление абсолютно идентичных, или же имеющих незначительные отличия сообщений в потоке почты. При срабатывании технологии, замеченная массовая рассылка будет блокирована, однако стоит отметить, что не каждая такая рассылка будет являться спамом [1].

При использовании проверки интернет-заголовков за основу берется единый стандарт RFC, определяющий формат заголовков, которым спам не всегда соответствует. Однако спамеры все чаще обращают внимание на корректность написания заголовка, из-за чего данный метод не будет достаточно эффективен при использовании в одиночку [2].

Метод наивного Байеса - один из методов машинного обучения. Он широко применяется как в коммерческих, так и в open source фильтрах. Для его реализации необходимо выбрать набор данных, подготовленный с помощью методов обработки естественного языка, на котором алгоритм будет учиться и тестироваться. Далее происходит выделение признаков, которые будут в совокупности влиять на общую вероятностную оценку того, является ли проверяемое сообщение спамом. Данный метод показывает достаточно высокие результаты в распознавании, что является его главным достоинством [6].

Таким образом, все рассмотренные методы обладают некоторыми недостатками и не показывают идеальную точность результатов. Поэтому в борьбе со спамом стоит применять несколько методов сразу, что позволит добиться лучших результатов. Более того, каждый метод работает с определённой стороной проблемы и берёт во внимание конкретные её особенности, а совокупность этих методов помогает более полно рассматривать спам, беря в учёт и технические аспекты, невидимые обычному пользователю, и само содержание спама.

Библиографические ссылки

1. Распределённые методы обнаружения спама: обзор существующих решений, анализ перспектив (1 часть) [Электронный ресурс]. URL: https://securelist.ru/raspredelenny-e-metody-obnaruzheniya-s/260/ (дата обращения 01.04.2022)

2. What is Spam: The Essential Guide to Detecting and Preventing Spam [Электронный ресурс]. URL: https://www.avast.eom/c-spam#topic-3 (дата обращения 02.04.2022)

3. Методы борьбы со спамом [Электронный ресурс]. URL: https://encyclopedia. kaspersky.ru/knowledge/spam-protection-technologies/ (дата обращения 30.03.2022)

4. How CAPTCHAs work | What does CAPTCHA mean? [Электронный ресурс]. URL: https://www.cloudflare.com/learning/bots/how-captchas-work/ (дата обращения 30.03.2022)

5. John R. Levine, Experience with Greylisting [Электронный ресурс].ШГ: https://www. taugh.com/greylist.pdf (дата обращения 02.04.2022)

6. Sie Huai Gan, How To Design A Spam Filtering System with Machine Learning Algorithm [Электронный ресурс]. URL: https://towardsdatascience.com/email-spam-detection-1-2-b0e06a5c0472 (дата обращения 04.04.2022)

© Байкалова Н. А, Пугач А.В, 2022

i Надоели баннеры? Вы всегда можете отключить рекламу.