Научная статья на тему 'НЕЙРОСЕТЕВЫЕ МЕТОДЫ ОБЕСПЕЧЕНИЯ ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ ЦИФРОВОЙ ЭКОНОМИКИ'

НЕЙРОСЕТЕВЫЕ МЕТОДЫ ОБЕСПЕЧЕНИЯ ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ ЦИФРОВОЙ ЭКОНОМИКИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
109
27
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФОРМАЦИОННАЯ СИСТЕМА / ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ / МАШИННОЕ ОБУЧЕНИЕ / НЕЙРОННЫЕ СЕТИ / КЛАССИФИКАЦИЯ / АНАЛИЗ ПРОГРАММ / INFORMATION SYSTEM / INFORMATION TECHNOLOGY / MACHINE LEARNING / NEURAL NETWORKS / CLASSIFICATION / PROGRAM ANALYSIS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ревунов Сергей Евгеньевич, Бархатова Оксана Михайловна, Долгова Дарья Сергеевна

В исследовании применены методы классификации нейросетевых алгоритмов, элементы статического анализа кода и анализа поведения программ в виртуальной среде предприятия. Новизна предлагаемого решения состоит в использовании классификационных признаков, полученных как статическим анализом кода, так и анализом поведения программы на виртуальном устройстве. Предложенный подход устраняет недостатки существующих решений обеспечения безопасности цифровой экономики.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ревунов Сергей Евгеньевич, Бархатова Оксана Михайловна, Долгова Дарья Сергеевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

NEURAL NETWORK METHODS OF ENSURING INFORMATION SECURITY OF THE DIGITAL ECONOMY

The study uses methods for classifying neural network algorithms, elements of static code analysis and analysis of program behavior in a virtual enterprise environment. The novelty of the proposed solution lies in the use of classification features obtained both by static analysis of the code and by the analysis of program behavior on a virtual device. The proposed approach eliminates the shortcomings of existing solutions for ensuring the security of the digital economy.

Текст научной работы на тему «НЕЙРОСЕТЕВЫЕ МЕТОДЫ ОБЕСПЕЧЕНИЯ ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ ЦИФРОВОЙ ЭКОНОМИКИ»

НЕЙРОСЕТЕВЫЕ МЕТОДЫ ОБЕСПЕЧЕНИЯ ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ ЦИФРОВОЙ

ЭКОНОМИКИ

DOI: 10.47581/2020/10.23.PS85/IE/5.48.013 Ревунов Сергей Евгеньевич, канд. физ.-мат. наук, доцент (e-mail: revunov@inbox.ru) Бархатова Оксана Михайловна, канд. физ.-мат. наук, доцент (e-mail: o.barkhatova@inbox.ru) Долгова Дарья Сергеевна, студент (e-mail: ddolgova99@gmail.com)

Нижегородский государственный педагогический университет имени Козьмы Минина - Мининский университет, г.Нижний Новгород, Россия

В исследовании применены методы классификации нейросетевых алгоритмов, элементы статического анализа кода и анализа поведения программ в виртуальной среде предприятия. Новизна предлагаемого решения состоит в использовании классификационных признаков, полученных как статическим анализом кода, так и анализом поведения программы на виртуальном устройстве. Предложенный подход устраняет недостатки существующих решений обеспечения безопасности цифровой экономики.

Ключевые слова: информационная система, информационные технологии, машинное обучение, нейронные сети, классификация, анализ программ

Распространение компьютерных систем, объединение их в коммуникационные сети усиливает возможности цифровой экономики и вместе с тем, повышает риск электронного проникновения в них. Проблема компьютерной преступности в сферах цифровой экономики во всех странах мира, независимо от их географического положения, вызывает необходимость привлечения все большего внимания и сил общественности для организации борьбы с данным видом преступлений. Особенно широкий размах получили преступления в автоматизированных банковских системах и в электронной коммерции. По зарубежным данным, потери банков в результате компьютерных преступлений ежегодно составляют многие миллиарды долларов. Компьютерные преступления с каждым днем дают о себе знать все более и более, а защита государства и общества от них превратилась в суперзадачу для компетентных органов.

Каждый сбой работы компьютерной сети — это не только «моральный» ущерб для работников предприятия и сетевых администраторов. По мере развития технологий электронных платежей, «безбумажного» документооборота и других, серьезный сбой локальных сетей может просто парализовать работу целых корпораций и банков, что приводит к ощутимым материальным потерям [1]. Не случайно, что защита данных в компьютерных сетях становится одной из самых острых проблем на сегодняшний день. Одной из основных причин, связанных с компьютерами, является недоста-

точная образованность в области безопасности. Только наличие некоторых знаний в области безопасности может прекратить инциденты и ошибки, обеспечить эффективное применение мер защиты, предотвратить преступление или своевременно обнаружить подозреваемого.

Мобильные операционные системы в настоящее время занимают лидирующие позиции на рынке носимых устройств и при этом постоянно растет и количество вредоносных программ на этих системах. Поскольку современная цифровая экономика всё чаще обращается к мобильным платформам, безопасность этой среды приобретает первостепенную важность. Так, мобильные вирусы способны шпионить за пользователями, использоваться для получения незаконных доходов, например, отправлять платные SMS, получать доступ к мобильному банку или шифровать данные пользователя с целью вымогательства. Помимо этих угроз, существуют и другие проблемы, связанные с недостаточной проверкой приложений, при скачивании которых пользователи устанавливают себе вредоносное программное обеспечение, замаскированное, например, под игры. Более того, пользователи с целью экономии часто прибегают к сторонним источникам программ, например, торрентам, где приложения и вовсе могут не проверяться. Пользователи также подвергаются утечкам персональных данных, скрытым загрузкам на веб-сайтах и другим опасностям. Меры противодействия скрытой установке вредоносного кода могут быть различными. С увеличением разнообразия назначения и объемов данных популярными стали методы машинного обучения и непосредственно искусственные нейронные сети [2], которые, в частности, позволяют решать задачи распознавания образов, классификации и анализа скрытых закономерностей в данных. Рассмотрим подробнее задачу обнаружения вредоносного кода как задачу классификации, решение которой преследует цель повышения вероятности обнаружения вредоносных программ.

Математические алгоритмы нейронных сетей по своей реализации близки к биологическим прототипам. Это определяется не только их строением и принципом работы, но и особенностями «настройки» таких систем. Искусственные нейронные сети (ИНС), как вычислительные системы, не программируются в привычном смысле этого слова, а обучаются, т.е. настраиваются в процессе функционирования. Возможность обучения - одно из главных преимуществ нейронных сетей перед традиционными алгоритмами. Технически обучение заключается в поиске оптимальных коэффициентов связей между нейронами. В процессе обучения нейронная сеть учится выявлять сложные зависимости между входными и выходными данными, а также выполнять обобщение. Это значит, что, в случае успешного обучения, ИНС сможет дать верный результат на основании данных, которые отсутствовали в обучающей выборке, а также неполных и/или «зашумлен-ных», частично искаженных данных.

Построенная по принципу организации и функционирования сетей нервных клеток живого организма, ИНС представляет собой систему со-

единённых и взаимодействующих простых процессоров - искусственных нейронов. Такие процессоры предельно просты. Каждый из них имеет дело только с сигналами, которые он периодически получает, и сигналами, которые он периодически посылает другим процессорам. Тем не менее, будучи соединёнными в сеть с управляемым взаимодействием, такие локально простые вычислительные единицы вместе способны решать довольно сложные задачи.

Нейросетевой подход имеет ряд неоспоримых преимуществ перед другими математическими методами. Представим примеры задач, решение которых требует такого альтернативного подхода. Во-первых, это класс задач, не поддающихся адекватной формализации традиционными аналитическими методами, поскольку выбранная модель не учитывает все особенности описываемого процесса. Во-вторых, это формализуемые задачи, но в настоящее время математический аппарат для их решения отсутствует. В-третьих, это формализуемые задачи с существующим математическим аппаратом для их решения, но реализация вычислений с его помощью не удовлетворяет требованиям по затрачиваемым вычислительным ресурсам. Для таких задач приходится существенно упрощать аналитический или математический алгоритм, что заведомо снизит качество решения, или применять нейросетевой подход. Главным достоинством метода ИНС является возможность получения неявной модели системы без построения ее конкретного физического представления, используя только достаточно большие массивы экспериментальных данных [3].

Применяемая в настоящем исследовании самоорганизующаяся карта (Self-organizing Map) - это т.н. «соревновательная» нейронная сеть с обучением без учителя, выполняющая задачу визуализации и кластеризации. Идея сети предложена выдающимся финским учёным в области искусственных нейронных сетей и машинного обучения, профессором Тойво Ко-хоненом. Так же ему принадлежит разработка широко известного «слоя Кохонена» как элемента самоорганизующейся карты. Предложенные им алгоритмы обучения и архитектуры ИНС послужили основой для большого количества исследований в области нейронных сетей. Любая самоорганизующаяся карта является методом проецирования многомерного пространства в пространство с более низкой размерностью (чаще всего, двумерное). Часто в литературе можно встретить термин «модель Кохонена», под которым подразумевается архитектура и алгоритмы обучения самоорганизующихся карт и их модификаций.

Кроме решения задач классификации, подобные модифицированные нейросети применяются также для решения задач моделирования и прогноза. Самоорганизующаяся карта состоит из компонент, называемых узлами. Данная сеть обучается без учителя на основе самоорганизации. По мере обучения вектора весов нейронов стремятся к центрам кластеров -групп векторов обучающей выборки. Количество узлов сети (количество классов) задаётся аналитиком. Каждый из узлов описывается двумя векто-

рами. Первый - вектор веса, имеющий такую же размерность, что и входные данные. Второй - координаты узла на карте. Обычно узлы располагают в вершинах регулярной решётки с квадратными или шестиугольными ячейками. Изначально известна размерность входных данных, по ней некоторым образом строится первоначальный вариант карты.

В процессе обучения векторы веса узлов приближаются к входным данным. Для каждого наблюдения выбирается наиболее похожий по вектору веса узел, и значение его вектора веса приближается к наблюдению. Также к наблюдению приближаются векторы веса нескольких узлов, расположенных рядом, таким образом, если во множестве входных данных два наблюдения были схожи, на карте им будут соответствовать близкие узлы. Циклический процесс обучения, перебирающий входные данные, заканчивается по достижении картой допустимой (заранее заданной аналитиком) погрешности, или по совершении заданного количества итераций. Модель Кохонена выполняет обобщение предъявляемой информации [4]. В результате работы ИНС получается образ, представляющий собой карту распределения векторов из обучающей выборки. Таким образом, в модели Кохонена выполняется решение задачи нахождения кластеров в пространстве входных образов. На этапе решения информационных задач сеть относит новый предъявленный образ к одному из сформированных кластеров, указывая тем самым категорию, к которой он принадлежит.

На этапе тонкой подстройки размер окрестности не меняется, а параметр скорости обучения корректируется по заранее определенному алгоритму. Малое значение окрестности и медленное уменьшение параметра скорости обучения хорошо настраивают сеть при сохранении размещения, найденного на предыдущем шаге. Как и в случае слоя Кохонена, веса нейронов карты будут упорядочиваться так, чтобы при равномерной плотности распределения точек векторов входа они так же были бы распределены равномерно [5]. Одно из важнейших свойств обученной сети Кохонена - способность к обобщению. Вектор каждого из нейронов сети заменяет группу соответствующих ему классифицируемых векторов. Это позволяет использовать данный вид сети в области сжатия или шифрования данных.

Рассмотренные здесь алгоритмы могут быть применены к нейросетевой классификации разрешений для каждой программы на компьютере или мобильном устройстве и таким образом, можно определить функции, которые программе разрешено выполнять. Из всего списка возможных разрешений нейросеть может выделить наиболее важные и более свойственные вредоносным программам. По списку обрабатываемых широковещательных намерений можно определить, какие события на устройстве отслеживает программа: подключение к сети интернет, получение БМБ-сообщения, входящий или исходящий вызов, включение устройства и другие. Получатели широковещательных намерений используются многими вредоносными приложениями, например, для перехвата БМБ-сообщений,

подтверждающих покупку с банковской карты, или для ожидания события подключения к сети интернету для передачи украденных личных данных.

При этом при разработке подобных алгоритмов возникает вопрос о необходимых и достаточных свойствах искусственной нейронной сети для решения задач такого рода. Так как проблема синтеза адекватной кибернетической системы сильно зависит от решаемой задачи, дать какие-либо рекомендации затруднительно. Многие характерные для нейросетей задачи, например, распознавания образов, выполнения функциональных преобразований при обработке сигналов, прогнозирования, идентификации сложных систем или управления процессами, сводятся к простой математической постановке. Необходимо построить такое отображение X^Y, чтобы на каждый возможный входной сигнал X формировался правильный выходной сигнал Y. Отображение задается конечным набором пар «вход-известный выход». Число этих пар, выступающих в качестве обучающих примеров, существенно меньше общего числа возможных сочетаний значений входных и выходных сигналов. Другими словами, большая часть прикладных задач может быть сведена к реализации некоторого сложного функционального многомерного преобразования. В результате отображения X^Y необходимо обеспечить формирование правильных выходных сигналов в соответствии со всеми примерами обучающей выборки и со всеми возможными входными сигналами, которые не вошли в обучающую выборку. Второе требование в значительной степени усложняет задачу формирования обучающего множества. В общем виде эта задача еще не решена, однако во всех известных случаях может быть найдено частное решение.

Проблема создания нейросетевой архитектуры для каждой конкретной задачи частично решается с помощью теории ИНС, позволяющей проводить некий предварительный анализ структуры нейронной сети. Центральной теоремой основ обучения нейросетей является теорема о представлении непрерывных функций нескольких переменных в виде суперпозиции непрерывных функций одного переменного и сложения. Это теорема Колмогорова-Арнольда. Она гласит, что построение многомерного отображения X^Y, отвечает представлению его с помощью математических операций над не более чем двумя переменными. В результате многолетней научной дискуссии между А.Н. Колмогоровым и В.И. Арнольдом был получен ряд важных теоретических результатов, опровергающих тезис непредставимости функции многих переменных функциями меньшего числа переменных. Этот тезис соответствует 13 проблеме из списка 23 кардинальных проблем математики, представленный Дэвидом Гильбертом на II Международном Конгрессе математиков в Париже в 1900 г. Таким образом, нейросетевые методы обеспечения информационной безопасности цифровой экономики стоят на пути решения важных математических проблем и при этом имеют в перспективе значимые прикладные результаты.

Список литературы

1. Ревунов С.Е., Бархатова О.М., Долгова Д.С. Современные возможности развития одаренных детей с помощью ИКТ // Инновационная экономика: перспективы развития и совершенствования, №3 (45), 2020, 112-117

2. Бархатов Н.А., Ревунова Е.А., Ундалова И. С. Инноватика дистанционных методов обучения как фактор роста экономических показателей ВУЗа // Инновационная экономика: перспективы развития и совершенствования. 2019, №2(36). С. 128-131

3. Ревунов С.Е., Бархатова О.М., Долгова Д.С. Экономическая эффективность инновационных методик дистанционного образования // Инновационная экономика: перспективы развития и совершенствования. 2019, №2(36). С. 391-396

4. Бархатов Н.А., Ревунова Е.А., Ундалова И. С. Дистанционные методы обучения дисциплинам физико-математического профиля в технологическом образовании // В сборнике: Проблемы, опыт работы и перспективы развития технологического образования Сборник трудов научно-практической конференции. Ответственный редактор Л.Н. Анисимова. 2019. С. 14-17.

5. Ревунов С.Е., Бархатова О.М., Долгова Д.С. Инновационные методики дистанционного образования при обучении физике и технологии // В сборнике: Проблемы, опыт работы и перспективы развития технологического образования Сборник трудов научно-практической конференции. Ответственный редактор Л.Н. Анисимова. 2019. С. 7681.

Revunov Sergey Evgenievich,

(e-mail: revunov@inbox.ru) Barkhatova Oksana Mikhailovna, (e-mail: o.barkhatova@inbox.ru) DolgovaDaria Sergeevna, student (e-mail: ddolgova99@gmail.com)

KozmaMinin Nizhny Novgorod State Pedagogical University - Minin University, Russia NEURAL NETWORK METHODS OF ENSURING INFORMATION SECURITY OF THE DIGITAL ECONOMY

Abstract. The study uses methods for classifying neural network algorithms, elements of static code analysis and analysis of program behavior in a virtual enterprise environment. The novelty of the proposed solution lies in the use of classification features obtained both by static analysis of the code and by the analysis of program behavior on a virtual device. The proposed approach eliminates the shortcomings of existing solutions for ensuring the security of the digital economy.

Keywords: information system, information technology, machine learning, neural networks, classification, program analysis

i Надоели баннеры? Вы всегда можете отключить рекламу.