УДК 004.94
ХАРАКТЕРИСТИКА МЕТОДОВ БОРЬБЫ СО СПАМОМ
Н.А. Байкалова, А.В. Пугач Научный руководитель - В.В. Золотарев
Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31
Е-mail: natalia03baikalova@gmail.com
В данной статье приведена характеристика нескольких популярных методов борьбы со спамом и выявлены их преимущества и недостатки.
Ключевые слова: спам, методы предотвращения распространения, методы обнаружения.
DESCRIPTION OF ANTI-SPAM METHODS
N.A. Baikalova, A.V. Pughach Scientific supervisor - V.V. Zolotarev
Reshetnev Siberian State University of Science and Technology 31, Krasnoyarskii rabochii prospekt, Krasnoyarsk, 660037, Russian Federation Е-mail: natalia03baikalova@gmail.com
This article describes several well-known methods for preventing the spread of spam and identifies their advantages and disadvantages.
Keywords: spam, spread prevention methods, detection methods.
Одно из важнейших свойств Интернета - его роль в передаче и хранении информации. Сегодня по всему миру миллионы устройств и их пользователи имеют доступ к Интернету и используют его для этих целей. Эффективными средствами обмена и хранения информации является электронная почта, веб-страницы и неразрывно связанные с ними поисковые системы.
Спам заметно усложняет пользование этими сервисами. Неудобство, доставляемое им, варьируется от навязчивых писем, мешающих просмотру легитимной почты, до полноценных атак, перегружающих инфраструктуры компаний и клиентских сервисов, затрудняющих или и вовсе останавливающих их работу. При помощи спамовых сообщений также распространяются вредоносные программы, осуществляется хищение денежных средств, кража личных данных пользователей [1].
Затруднительным также является тот факт, что не все пользователи Интернета могут различать легитимную почту и спам, что делает их уязвимыми для таких атак. Для предотвращения негативных последствий применяются методы, определяющие спамовые сообщения и ограничивающие их от конечного пользователя, чем обеспечивают его безопасность в виртуальной среде [2].
Данная тема является актуальной, так как злоумышленники находят способы обмануть существующие методы и создают новые способы распространения спама, из-за чего необходимо совершенствовать методы борьбы со спамом и находить новые. Для этого
Актуальные проблемы авиации и космонавтики - 2022. Том 2
необходимо разбираться в существующих методах и понимать, с какими аспектами спама они работают.
Спам представляет собой анонимную незапрошенную массовую рассылку, которая обладает следующими свойствами и особенностями:
1) Распределенность - значительная часть спам-сообщений распространяется через оборудование у конечных пользователей путём использования уязвимостей в пользовательском программном обеспечении, вредоносных программ, уязвимостей в беспроводных сетях;
2) Персонализация - уникальность существенной доли спам-сообщений. Это свойство может выражаться во внесении в сообщение случайных последовательностей символов, обычно невидимых для читателя, или персональных обращениях;
3) Маскировка под легальные письма. Это касается как технической информации сообщения - спамеры делают её максимально похожей на легальные сообщения, что позволяет спаму проходить через формальные фильтры, так и непосредственного содержания сообщения;
4) Необходимость быть легко читаемым. Основной объем текста должен быть получен в составе сообщения в привычном для пользователя виде, вызывая доверие в своей легитимности;
5) Обеспечение уникальности автоматическим путем - возможность добавления макетов сообщений при помощи программы случайным образом, не допуская их повторений.
Все методы борьбы со спамом можно разделить на две категории: предотвращения, стремящиеся к ограничению отправки и доступа к адресату (САРТСНА, черные списки, серые списки), и идентификации, направленные на обработку полученных сообщений и последующей их классификации (метод наивного Байеса, проверка интернет-заголовков, контроль массовости) [3].
Методы борьбы со спамом
Предотвращение отправления
Предотвращение получения
Контентная фильтрация
Другие методы
Рис. 1. Классификация методов борьбы со спамом.
Рассмотрим методы каждой категории, выявим их особенности, преимущества и недостатки.
САРТСНА - полностью автоматизированный публичный тест Тьюринга для различения компьютеров и людей. Имеет несколько реализаций, большинство из которых роботы уже умеют проходить. Основная особенность последней версии данного метода заключается в рассмотрении движения курсора мыши. Любое такое движение, созданное человеком, содержит определенную степень случайности, представляющую собой мелкие неосознанные движения, которым боту подражать сложно, что позволяет предотвратить отправление спама [4]. Однако и новейшую версию этого метода возможно обмануть.
Черные списки представляют собой набор 1Р-адресов почтовых сервисов, которые уже были использованы спамерами для рассылки. Для пополнения списка используется обратная
связь пользователей и результаты иных методов борьбы со спамом, что позволяет сформировать репутацию, в зависимости от которой адрес может попасть в этот список [3]. Недостаток этого метода состоит в том, что для попадания в список с адреса уже должен распространяться спам, который может нанести вред.
Серые списки представляют собой временный отказ в приеме сообщения из неизвестного системе источника с кодом ошибки 4хх, который понимают все почтовые системы. Совершается повторная отправка легитимной почты, чего не делают программы, рассылающие спам. Недостатком такого метода является задержка в доставке сообщений, которая может варьироваться от 15 минут до нескольких дней в случае плохо настроенных систем отправителя [5].
Контроль массовости - это выявление абсолютно идентичных, или же имеющих незначительные отличия сообщений в потоке почты. При срабатывании технологии, замеченная массовая рассылка будет блокирована, однако стоит отметить, что не каждая такая рассылка будет являться спамом [1].
При использовании проверки интернет-заголовков за основу берется единый стандарт RFC, определяющий формат заголовков, которым спам не всегда соответствует. Однако спамеры все чаще обращают внимание на корректность написания заголовка, из-за чего данный метод не будет достаточно эффективен при использовании в одиночку [2].
Метод наивного Байеса - один из методов машинного обучения. Он широко применяется как в коммерческих, так и в open source фильтрах. Для его реализации необходимо выбрать набор данных, подготовленный с помощью методов обработки естественного языка, на котором алгоритм будет учиться и тестироваться. Далее происходит выделение признаков, которые будут в совокупности влиять на общую вероятностную оценку того, является ли проверяемое сообщение спамом. Данный метод показывает достаточно высокие результаты в распознавании, что является его главным достоинством [6].
Таким образом, все рассмотренные методы обладают некоторыми недостатками и не показывают идеальную точность результатов. Поэтому в борьбе со спамом стоит применять несколько методов сразу, что позволит добиться лучших результатов. Более того, каждый метод работает с определённой стороной проблемы и берёт во внимание конкретные её особенности, а совокупность этих методов помогает более полно рассматривать спам, беря в учёт и технические аспекты, невидимые обычному пользователю, и само содержание спама.
Библиографические ссылки
1. Распределённые методы обнаружения спама: обзор существующих решений, анализ перспектив (1 часть) [Электронный ресурс]. URL: https://securelist.ru/raspredelenny-e-metody-obnaruzheniya-s/260/ (дата обращения 01.04.2022)
2. What is Spam: The Essential Guide to Detecting and Preventing Spam [Электронный ресурс]. URL: https://www.avast.eom/c-spam#topic-3 (дата обращения 02.04.2022)
3. Методы борьбы со спамом [Электронный ресурс]. URL: https://encyclopedia. kaspersky.ru/knowledge/spam-protection-technologies/ (дата обращения 30.03.2022)
4. How CAPTCHAs work | What does CAPTCHA mean? [Электронный ресурс]. URL: https://www.cloudflare.com/learning/bots/how-captchas-work/ (дата обращения 30.03.2022)
5. John R. Levine, Experience with Greylisting [Электронный ресурс].ШГ: https://www. taugh.com/greylist.pdf (дата обращения 02.04.2022)
6. Sie Huai Gan, How To Design A Spam Filtering System with Machine Learning Algorithm [Электронный ресурс]. URL: https://towardsdatascience.com/email-spam-detection-1-2-b0e06a5c0472 (дата обращения 04.04.2022)
© Байкалова Н. А, Пугач А.В, 2022