Верификация недостоверных параметров модели обнаружения вредоносной информации

Котенко Игорь Витальевич; Паращук Игорь Борисович

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

DOI: 10.24143/2072-9502-2019-2-7-18 УДК 004.056.53

ВЕРИФИКАЦИЯ НЕДОСТОВЕРНЫХ ПАРАМЕТРОВ МОДЕЛИ ОБНАРУЖЕНИЯ ВРЕДОНОСНОЙ ИНФОРМАЦИИ1

И. В. Котенко, И. Б. Паращук

Санкт-Петербургский институт информатики и автоматизации Российской академии наук, Санкт-Петербург, Российская Федерация

Объектом исследования является процесс обнаружения вредоносной информации в социальных сетях и глобальной сети. Предложен подход к верификации (определению) параметров математической модели случайного процесса обнаружения вредоносной информации с недостоверно, неточно (противоречиво) заданными исходными данными. Подход основан на использовании стохастических уравнений состояния и наблюдения, базирующихся на управляемых цепях Маркова в конечных разностях. При этом верификация ключевых параметров математической модели такого типа - элементов матрицы одношаговых переходных вероятностей - осуществляется путем использования экстраполирующей нейронной сети. Это позволяет учесть и компенсировать недостоверность исходных данных, присущую случайным процессам поиска и обнаружения вредоносной информации, а также повысить достоверность принятия решений по оцениванию и категоризации цифрового сетевого контента для обнаружения и противодействия информации такого класса.

Ключевые слова: математическая модель, вредоносная информация, параметр модели, нейронная сеть, матрица связей, вероятности перехода, состояние параметра, оценивание.

Для цитирования: Котенко И. В., Паращук И. Б. Верификация недостоверных параметров модели обнаружения вредоносной информации // Вестник Астраханского государственного технического университета. Серия: Управление, вычислительная техника и информатика. 2019. № 2. С. 7-18. DOI: 10.24143/2072-9502-2019-2-7-18.

Введение

Математические модели сложных процессов, в том числе и процесса обнаружения вредоносной информации (ВИ), нуждаются в большом количестве априорных (исходных) данных об этих процессах. Именно эти данные лежат в основе параметров адекватных математических моделей такого класса. При этом под параметрами модели процесса принято понимать физические величины (их количественные или качественные данные, значения), характеризующие те или иные существенные свойства этого процесса, описываемые в рамках модели. Вместе с тем в подавляющем числе случаев эти данные являются слабо формализуемыми, качественными, экспертными, неточными (противоречивыми). Это связано с многообразием аспектов ВИ, циркулирующей в социальных сетях и сети Интернет [1, 2]. В последние годы для обработки таких данных, наряду с иными методами, все чаще используются экстраполирующие нейронные сети (ЭНС), способные с высокой точностью аппроксимировать слабо формализуемые, зачастую недостоверные, неточные (противоречивые) данные, приводя их к виду, пригодному для достоверного и адекватного моделирования сложных процессов [3].

Моделирование процесса обнаружения ВИ осуществляется в интересах построения интеллектуальных систем аналитической обработки цифрового сетевого контента, предназначенных

1 Работа выполнена при финансовой поддержке Российского научного фонда (проект 18-11-00302 в СПИИРАН).

для поиска и противодействия нежелательной, противоправной, а в целом - вредоносной информации. Применение ЭНС для верификации, определения параметров математической модели процесса обнаружения ВИ целесообразно и актуально. Это позволит адекватно математически описать эти параметры с точки зрения качественных и количественных субъективных оценок. При этом должны быть определены весовые коэффициенты (синаптические веса) и весовые отношения, должны быть формализованы, определены неточные (противоречивые) данные с помощью ЭНС-верификации. Качество верификации, определения параметров математической модели процесса обнаружения ВИ растет по мере увеличения объема накопленных данных и знаний [3, 4]. Использование ЭНС позволяет автоматически накапливать эмпирические знания о свойствах процесса обнаружения ВИ и принимать решения, опираясь на накопленные данные и знания.

Анализ релевантных работ

Приложения ЭНС используются в таких задачах верификации [3, 4], где традиционные вероятностные и иные методы определения параметров модели малоэффективны в силу неопределенности, например из-за неполноты и противоречивости данных параметров. Но различия в уровнях неопределенности не позволяют однозначно верифицировать реальные признаки ВИ, что затрудняет прямое применение данных методов для этого класса задач.

В статье [5] рассмотрена адаптивная экстраполяция состояний процессов с использованием рекуррентных нейронных сетей. Но такой подход требует рассмотрения вспомогательных параметров экстраполяции, а это не всегда возможно. В интересах идентификации и верификации состояния нелинейных объектов моделирования иногда используют многослойные нейронные сети [6, 7]. Но они не гарантируют высокой точности определения параметров, точности их идентификации и верификации. В работе [8] изложен расширенный подход к нейросетевой идентификации и верификации. Но этот комплекс методов, иногда называемый нейрокомпь-ютингом, применим для моделирования квазистационарных процессов, что сужает область его применения. Работы [9, 10] посвящены способу, который позволяет моделировать сложные процессы с использованием нейро-нечетких схем анализа с нечеткими связями. Но этот способ очень сложный для математического описания и трудоемкий. Для нашего случая, когда необходимо верифицировать параметры математической модели процесса поиска ВИ, определение недостоверно, неточно (противоречиво) заданных исходных данных для моделирования этого случайного процесса сводится к тривиальной задаче классификации. Это задача классификации параметров математической модели с помощью экстраполирующего нейросетевого алгоритма. Этот подход известен, прост и используется в задачах распознавания и верификации параметров телекоммуникационных сетей [11].

Теоретическая часть

Процедуру экстраполирующей нейросетевой верификации рассмотрим на примере определения ключевых параметров математической модели процесса поиска ВИ - значений элементов

матрицы одношаговых переходных вероятностей (ОПВ) Р(?, t +1, с) для различных состояний параметра данного процесса. Состояние параметра - понятие, обозначающее множество устойчивых значений этого параметра. Их может быть несколько либо большое множество. Состояние параметра характеризуется тем, что описывает переменные свойства этого параметра, при этом состояние какого-либо параметра процесса устойчиво до тех пор, пока процесс не реализуется, ведь сам процесс - это последовательная смена состояний параметров, его описывающих.

В основу аналитических моделей смены состояний процесса обнаружения ВИ положено описание свойств данного процесса в математических терминах. Из анализа возможных подходов к моделированию стохастических процессов такого класса следует, что наиболее общим математическим языком описания процесса обнаружения ВИ как объекта исследования является язык теории множеств и функциональных пространств. В нашей статье рассмотрен подход к верификации параметров математической модели такого процесса как к формализованному описанию движения процесса обнаружения ВИ в пространстве состояний, причем данное движение является функцией времени (дискретного). Известные работы [12, 13], посвященные синтезу математических моделей для дискретных по состоянию и непрерывных по времени случайных

процессов, позволяют формулировать унифицированные модели процесса обнаружения ВИ на основе управляемых цепей Маркова в форме разностных стохастических уравнений. Это связано с рядом факторов. Аналитическое описание процесса обнаружения ВИ, аналитическая взаимосвязь отдельных показателей ВИ в общем случае динамического, вероятностного, нелинейного и нестационарного процесса обнаружения связаны с необходимостью задания многомерных функций либо плотностей распределения вероятностей значений параметров (показателей) процесса обнаружения ВИ на интервале функционирования. Математическое описание, с учетом расширения размерности, в этом случае затруднительно. Вместе с тем марковские модели процессов обладают высокой универсальностью. При этом сочетание теории марковских процессов с теорией переменных состояния открывает широкие возможности для исследования, причем применение марковских моделей к реальным процессам, происходящим в сложных системах, обладает целым рядом преимуществ. Это возможность представления в рамках марковских процессов как дискретных, так и непрерывных процессов, которые характеризуются как гауссовскими, так и негауссовскими распределениями вероятностей, с учетом как линейного, так и нелинейного характера их изменения. Кроме того, путем расширения связности («памяти») процесса и его размерности (например, переход к вложенным цепям Маркова) заведомо немарковские процессы могут быть математически корректно сведены к более сложным марковским.

Можно рассматривать возможность построения аналитических, вероятностно-временных моделей смены состояний параметров процесса обнаружения ВИ как математических моделей смены состояний показателей ВИ на основе марковских последовательностей. Это означает, что можно добиться требуемой степени адекватности вероятностно-временных свойств процесса обнаружения ВИ при сокращении размерности их математического описания. Для построения аналитической, вероятностно-временной модели в интересах верификации параметров процесса обнаружения ВИ, учитывающей динамический и вероятностный характер, нестационарность этого процесса, воспользуемся аппаратом управляемых цепей Маркова, описываемых в форме разностных стохастических уравнений. В работах [12, 13] доказано, что все известные классы марковских случайных процессов могут быть сведены к эквивалентным им (с точностью до допустимой ошибки моделирования по времени и по состоянию) цепям Маркова. Опишем множество состояний параметров процесса обнаружения ВИ с помощью аппарата управляемых цепей Маркова, представленных в виде разностных стохастических уравнений, и аппарата теории переменных состояния. Тогда разностные стохастические уравнения (уравнения состояния и наблюдения), описывающие динамику смены дискретных состояний любого /-го недостоверно, неточно (противоречиво) заданного параметра процесса обнаружения ВИ (например, для девяти состояний), в форме управляемых цепей Маркова будут иметь вид

д/ ^ +1) = С! ^ +1) К ?. ^ +1);

^ ^ +1) = t +1, с) ^) + АКд. ^ +1);

^ +1) = Н^ (д. ^ +1)) йь ^ + 1) + ^ + 1),

где д. ^ +1) - вектор недостоверно, неточно (противоречиво) заданных значений /-го параметра процесса обнаружения ВИ; С1 ^ +1)- ^-мерная (в нашем случае N = 9) транспонированная матрица-строка возможных недостоверно, неточно (противоречиво) заданных значений/-го параметра процесса обнаружения ВИ; К^. ^ +1) - вспомогательный вектор-индикатор состояния

/-го недостоверно, неточно (противоречиво) заданного параметра процесса обнаружения ВИ; Нд. (д.^ +1)) - девятимерная матрица недостоверных (неточных, противоречивых) наблюдений

за динамикой смены состояний процесса обнаружения ВИ д. ); АКд ^ +1) - вектор значений

приращения индикаторов состояния параметра процесса обнаружения ВИ; Кд ^) - значение

карты для каждого из возможных состояний. Эти состояния традиционно задаются специальными матрицами связей. Матрица связей (матрица синаптических весов) состоит из элементов, определяющих важность, «вес» связи, идущей от каждого /-го к каждомуу-му (в нашем примере от 1-го ко 2-му, ... , 9-му) элементу ЭНС. Так, для девяти состояний параметра процесса обнаружения ВИ матрица связей имеет вид

К ^) =

КМ) ^) ^) . • k18(t) ^ )

k 21^) k 2М ) МО . • k 2^ ) k29 ( )

k з^ ) kз2(t) kзз(t) . • k зМ ) k39(t)

k 4М) k 42^ ) k 4М ) . • k 4^ ) k 49^ )

kg^t) ^) ^м)

^М) км)

По входным векторам, характеризующим зависимость переходных вероятностей в строке матрицы ОПВ, формируются элементы этих матриц связей. Элементы матрицы связей формируются на первом этапе обучения ЭНС на основе мнений эксперта, поступающих на входной слой нейронной сети. При этом ЭНС - типовая двухслойная нейронная сеть с прямым распространением информации. В соответствии с этапами верификации (определения) элементов

матрицы ОПВ Pq' t +1, с) с помощью экстраполирующего нейросетевого алгоритма каждый

элемент характеризует одну строку матрицы ОПВ. Этот элемент описывает корреляционную зависимость вероятности перехода из одного состояния в другое, взаимосвязь у-й вероятности перехода и /-й вероятности перехода на ^м такте (шаге) процесса обнаружения ВИ.

Экспериментальная часть

Рассмотрим на конкретном примере процедуру верификации (определения) ключевого параметра математической модели - элементов матрицы ОПВ. Физическая сущность примера заключается в задании условных исходных данных (начальных векторов, характеризующих мнения экспертов) и пошаговых вычислениях верифицированных значений вероятностей перехода параметра процесса обнаружения ВИ из состояния в состояние. Значений, в которых неточно (противоречиво) сформулированные исходные данные (знания) о механизме и условиях перехода параметра процесса обнаружения ВИ из состояния в состояние, путем корректных математических нейросетевых процедур модифицированы к виду, пригодному для параметрического контент-анализа на наличие ВИ. Именно поэтому в качестве примера, для проверки и демонстрации работоспособности алгоритма нейросетевой верификации, взяты условные значения количества возможных состояний и количества экспертов (девять) и начальные значения элементов вектора, характеризующего мнения этих экспертов.

Первый этап эксперимента - формирование матрицы связей. Для девяти состояний параметра процесса обнаружения ВИ должны быть заданы 9 матриц весов. При формировании первой строки матрицы ОПВ осуществляется верификация (определение) вероятности перехода из первого состояния во второе, третье, четвертое, пятое, шестое, седьмое, восьмое, девятое состояние и вероятности остаться в первом состоянии. В этом случае вектор, характеризующий мнение первого эксперта о зависимости переходных вероятностей в первой строке матрицы ОПВ, записывается как

X = (1, о, 1, -1, -1, о, о, 1, -1).

(1)

Выражение (1) - формальная запись логико-математического утверждения «Возрастание вероятности нахождения в первом состоянии и вероятности остаться в немрп(0 приводит к повышению вероятности перехода из первого в третье состояние р1з(0 и к повышению вероятности перехода из первого в восьмое состояние р18(0. Это приводит к понижению вероятности перехода из первого в четвертое рм(0, пятое рн(0 и из первого в девятое состояния р19(0.

А по влиянию изменений вероятности перехода из первого во второе p12(t), шестое p16(t) и седьмое pi7(t) состояния мнение эксперта отсутствует». Если положительному значению элемента

вектора X1 соответствует положительное значение другого элемента вектора X1, эту взаимосвязь между ними обозначают как положительную. Взаимосвязь обозначают отрицательной, если положительному значению элемента вектора X1 соответствует отрицательное значение другого элемента этого вектора. Количественная характеристика взаимосвязи представляет собой сумму по модулю всех значений, описывающих взаимосвязь переходных вероятностей в матрице ОПВ. Приняв выражение (1) за исходное условие для работы экстраполирующего нейросетевого алгоритма, можно получить когнитивную карту для ЭНС и соответствующую ей матрицу связей, характеризующую, например, мнение первого эксперта о возможной взаимосвязи вероятностей перехода параметра процесса обнаружения ВИ из состояния в состояние

Ki(t) =

0 0 2 -2 -2 0 0 2 -2

0 0 0 0 0 0 0 0 0

2 0 0 -2 -2 0 2 0 0

- 2 0 -2 0 2 0 0 -2 2

-2 0 -2 2 0 0 -2 2 0

0 0 0 0 0 0 0 0 0

0 0 2 -2 -2 0 0 2 -2

-2 0 -2 0 2 0 0 -2 2

Элементы этой матрицы получены на основе анализа мнения первого эксперта о зависимостях вероятностей перехода параметра процесса обнаружения ВИ из какого-либо состояния в любое другое состояние. Они характеризуют, например, для первой строки матрицы

[0, 0, 2, -2, -2, 0, 0, 2, -2], что положительному значению 1-го и 8-го элементов вектора соответствует неопределенный «вес» вероятности остаться в первом состоянии, невысокий положительный «вес» = 2 (из 9 возможных) вероятности перейти в 3-е и 8-е состояния; отрицательному значению 4-го, 5-го и 9-го элементов вектора Х1 соответствует невысокий отрицательный «вес» = -2 (из -9 возможных) вероятности перейти из 1-го в 4-е, в 5-е и в 9-е состояния, а по 2-му, 6-му и 7-му состоянию мнение первого эксперта неопределенное. Цифра может изменяться от -9 до 9 (9 - число экспертов и состояний), показывая «глубину» положительной или отрицательной взаимосвязи состояний, «вес убежденности» эксперта.

Когнитивные карты и матрицы связей К2(х), К3(х), ..., К9(х), характеризующие мнение восьми других привлекаемых экспертов, определяются аналогично. Работа ЭНС предусматривает, что когнитивные карты экспертов объединяются в суммарную когнитивную карту. Эти когнитивная карта и матрица весов объединяют в себе коллективное мнение всех привлекаемых экспертов о корреляционных зависимостях вероятностей перехода параметра процесса обнаружения ВИ из состояния в состояние, суммарная матрица описывается выражением

J

Gx(t) = 2К (х),

где J = 9 - количество экспертов (отдельных матриц связей), принимающих участие в верификации (определении) элементов матрицы ОПВ и характера связей между ними. Объединенная матрица отражает противоречивые мнения всех экспертов о корреляционных зависимостях вероятностей перехода параметра процесса обнаружения ВИ из состояния в состояние. Поэтому она содержит не только элементы 1 и -1, но и 0. Это позволяет более полно отражать причинно-следственные зависимости между состояниями параметра процесса обнаружения ВИ.

Объединенные когнитивные карты и матрицы весов для остальных строк матрицы ОПВ t +1, с) определяются аналогично. Нейросетевая верификация на основе ЭНС включает

ряд этапов. Блок-схема нейросетевого алгоритма верификации значений вероятностей перехода параметра процесса обнаружения ВИ из состояния в состояние предложена на рис. 2.

Начало

1. Ввод исходных данных X (0, C(t) и формирование K (t)

2. Активизация входного слоя ЭНС

aj (0) = yj, У] = 19

3. Начальная инициализация нейронов второго слоя ЭНС

, ] е [1,. 9] 0, ] « [1,...,9]

4. Приведение нейронов входного слоя к состоянию нейронов второго слоя

а] (р = Ь] (t), У] = 19

5. Вычисление состояний нейронов выходного слоя

Ь] (t +1) = ¡(£ Ь] (t) к] (0)

1

7. Суммирование значений весовых коэффициентов

(¡¡У] ]) У] = 179

1=1

8. Смещение (сдвиг) весовых коэффициентов

9 _

¡¡(ЕЬ(t) ¿г«), У]=1,9

1=1

9. Вычисление верифицированных значений матрицы переходов

Р1Ш Р12(0, ■■■, Р19(0

11. Вывод результатов: верифицированные значения переходных вероятностей /

Конец

Рис. 2. Блок-схема нейросетевого алгоритма верификации значений элементов девяти строк матрицы ОПВ

Рассмотрим подробно этапы верификации (определения) ключевого параметра математической модели - элементов матрицы ОПВ - с помощью обычной двухслойной ЭНС [6, 7]. Данный экстраполирующий нейросетевой алгоритм верификации предназначен для определения значений параметров моделирования и экстраполяции в интересах оценивания эффективности обнаружения ВИ.

Вначале выполняется активизация входного слоя ЭНС, т. е. приведение нейронов входного слоя в начальные состояния. Затем происходит начальная инициализация нейронов второго слоя, затем приведение нейронов входного слоя ЭНС к состоянию нейронов второго слоя:

X] = У] , У] = 1, 9. Затем следует вычисление новых состояний нейронов второго слоя для всех

] е [1, к, 9] по формуле

5 _

У]^ +1) = ¡(£У]^) )), У] = 1, 9, (2)

1=1

где £ - ступенчатая функция активации. Повторение вычислений (2) продолжается до тех пор, пока ЭНС не достигнет стабильного состояния. Проверка (достигла или не достигла ЭНС стабильного состояния) осуществляется путем сравнения состояний нейронов второго слоя на предшествующем х-м и очередном (X + 1)-м такте. При достижении ЭНС стабильного состояния происходит суммирование значений весовых коэффициентов

7 (£ [ у, ]). (3)

]=1

Элементы вектора (3) характеризуют верифицированные весовые коэффициенты корреляционной связи значений вероятностей переходов параметра процесса обнаружения ВИ для одной строки матрицы ОПВ. Корреляционная суммарная матрица весов формируется на их основе.

Очередной шаг нейросетевой верификации - вычисление значений вероятностей перехода параметра процесса обнаружения ВИ из первого состояния во второе Рг2(х), третье Ргз(х), четвертое Рм(0, пятое Р15(0, шестое р16(х), седьмое р17(х), восьмое рг8(х), девятое р19(х) состояние и вероятности остаться в первом состоянии рц(х). Для этого используется квадратичная метрика, применяемая к смещенным значениям суммарных весовых коэффициентов [11]. Итоговый шаг нейросетевой верификации - повторение выполнения шагов алгоритма до тех пор, пока не будут определены элементы во всех остальных ,-х строках матрицы ОПВ. При этом выходной вектор второго слоя на каждом х-м такте работы ЭНС последовательно принимает ряд значений состояний. Эти состояния определяются на основе выражения (2) и для нашего примера будут равны

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7,(1) = £([0, 0, 2, - 6, 2, 0, 0, 2, - 2]) = [1,0,1, - 1,1,0, 0, 1, - 1];

У1 (2) = £([10, - 4, 2, - 4, - 4, 4, 2, 4, - 4]) = [1, - 1,1, - 1, -1,1,1,1, - 1];

7(5) = £([6,10, 6, - 20, -12,10, 6,10, - 10]) = [1, - 1,1, - 1, -1,1,1,1, - 1].

Пример показывает, что ЭНС достигает стабильного состояния уже на 4-м шаге. Аналогичным образом получаем выходные векторы 2-го слоя ЭНС для входных векторов, которые характеризуют корреляционные зависимости между вероятностью нахождения в первом состоянии, и возможностью остаться в нем и вероятностями перехода из 1-го в 3-е, в 4-е, в 5-е, 6-е, 7-е, 8-е и 9-е состояния. Выходные векторы 2-го слоя ЭНС содержат элементы

72(4) = £([6,10, 6, - 20, -12,10, -12,10, 6]) = [1,1,1, -1, -1,1, -1,1,1];

73(5) = £([6,10, 6, - 20, - 12,10, -12,10, 6]) = [1,1,1, -1, -1,1, -1,1,1];

74(3) = £([-6, -10, - 6,20,12, -10,10, 6, -12]) = [-1, -1, -1,1, 1, -1,1,1, -1]; 75(4) = #([-6, - 10, - 6, 20,12, - 10,10, 6, - 12]) = [-1, - 1, - 1,1, 1, - 1,1,1, - 1];

76(4) = £([6,10, 6, - 20, - 12,10, -12,10, 6]) = [1,1,1, - 1, - 1,1, -1,1,1];

77(5) = £([-6, - 10, - 6, 20,12, - 10,10, 6, - 12]) = [-1, -1, - 1,1, 1, - 1,1,1, -1];

78(4) = £([6,10, 6, - 20, - 12,10, -12,10, 6]) = [1,1,1, -1, - 1,1, - 1,1,1];

79(3) = £([6,10, 6, - 20, -12,10, -12,10, 6]) = [1,1,1, - 1, - 1,1, - 1,1,1].

Данные результаты характеризуют суммарную предпочтительность преобладания значений одной вероятности перехода параметра процесса обнаружения ВИ из состояния в состояние по отношению к другой. Тогда значения элементов суммарного вектора весовых коэффициентов равны

71 = ([12,20,12, - 40, - 24, 20, - 30, 68, - 6]).

Этап нормировки в задаче верификации (определения) ключевого параметра математической модели - элементов матрицы ОПВ - с помощью ЭНС является обязательным. Он позволяет избавиться от отрицательных значений весов, сохраняя их пропорциональную зависимость. В итоге получаем значения вероятностей перехода заданного ,-го параметра (д) обнаружения ВИ из состояния в состояние. Это вероятности перехода параметра д процесса обнаружения ВИ из первого состояния во второе р12(х), третье р13(х), четвертое р14(х), пятое р15(х), шестое р16(х), седьмое рп(0, восьмое р\8(Х), девятое состояние р\9(х) и вероятность остаться в первом состоянии Рп(0, т. е. элементы первой строки матрицы ОПВ в (X, X +1, с):

Рп (X) = Уп /(Уп + У21 + У31 + У421 + У521 + У621 + у?21 + у821 + У91) = 0,074;

Р12(х) = У22 /(У12 + У22 + У32 + У42 + У522 + у62 + У22 + У22 + Уи ) = 0,П4;

Р13(Х) = У323 /(Ув + У23 + У323 + У43 + У53 + У623 + У73 + У83 + У923 ) = 0,074;

Ри(х) = У44 /(Ум + У224 + У 34 + У424 + У 54 + у64 + У 74 + У 84 + У 94) = 0,015;

Р15 (Х) = У525 /(У2 + У25 + У35 + У2 + У55 + У625 + У725 + Ум + У925 ) = 0,041;

Р16(х) = У626 /( У2 + У 26 + У326 + У426 + У 56 + У626 + у 76 + у 86 + У 96) =0,114

Р17(Х) = У'77 /(Уп + У27 + У3*7 + У47 + У527 + У627 + У727 + У87 + У927) = 0,034

Р18 (Х) = У88 /(У2 + У228 + У38 + У428 + У528 + У628 + У728 + У828 + У928 ) = 0,44 Р19(Х) = У929 /(У2 + У29 + У39 + У49 + У529 + У629 + У729 + У829 + У929 ) = 0,°94.

Остальные значения ключевого параметра математической модели - значения вероятностей перехода недостоверно, неточно (противоречиво) заданного параметра д процесса обнаружения ВИ (т. е. элементы второй, третьей, четвертой, пятой, шестой, седьмой, восьмой и девятой

строк матрицы ОПВ , (X, X +1, с)) - могут быть верифицированы (определены) аналогично.

Заключение

Таким образом, предложен подход к определению параметров математической модели случайного процесса обнаружения ВИ с недостоверно, неточно (противоречиво) заданными исходными данными. Этот подход основан на использовании стохастических уравнений состояния и наблюдения, базирующихся на управляемых цепях Маркова в конечных разностях.

Общая идея работы - использовать совместно экспертные подходы и нейронную сеть для снижения уровня неопределенности при формировании элементов матрицы ОПВ в интересах моделирования процесса обнаружения ВИ для прогнозирования состава и значений элементов данных матриц по имеющимся априорным данным.

При этом верификация (определение) ключевых параметров математической модели такого типа - элементов матрицы одношаговых переходных вероятностей - осуществляется путем использования экстраполирующей нейронной сети. Это позволяет учесть и компенсировать недостоверность исходных данных, присущую случайным процессам обнаружения вредоносной информации, а также повысить достоверность принятия решений по оцениванию и категоризации цифрового сетевого контента для обнаружения и противодействия информации такого класса.

СПИСОК ЛИТЕРА ТУРЫ

1. Kotenko I. V., Saenko I. B., Chechulin A. A., Desnitsky V. A., Vitkova L. A., Pronoza A. A. Monitoring and counteraction to malicious influences in the information space of social networks // Proceedings The 10th Social Informatics conference (SocInfo2018) (Saint-Petersburg, September 25-28, 2018). Saint-Petersburg, 2018. Part II. Lecture Notes in Computer Science. V. 11186, Springer. P. 159-167.

2. Kotenko I. V., Saenko I. B., Chechulin A. A. Protection against information in eSociety: using Data Mining methods to counteract unwanted and malicious data // Digital Transformation and Global Society. Second International Conference, DTGS 2017 (Saint-Petersburg, June 21-23, 2017). Revised Selected Papers. Communications in Computer and Information Science (CCIS). Saint-Petersburg, 2017. V. 745. P. 170-184.

3. Kosko B. Neural Networks and Fuzzy Systems: A Dynamical Systems Approach to Machine Intelligence. Englewood Cliffs: Prentice-Hall, 1992. 346 p.

4. Kriesel D. A Brief Introduction to Neural Networks. Cambridge: Cambridge Press, 2010. 226 p.

5. Parlos A. G., Menon S. K., Atiya A. F. An algorithmic approach to adaptive state filtering using recurrent neural networks // IEEE Trans. Neural Networks. 2001. V. 12. N. 6. P. 1411-1432.

6. Rojas R. Neural Networks. Berlin: Springer-Verlag, 1996. 453 p.

7. Muller B., Reinhardt J., StricklandM. T. Neural networks: an introduction. Springer, 1995. 306 p.

8. Anderson J. A., Rosenfeld E. Neurocomputing: Foundation of Research. Cambridge, Mass: MIT Press, 1988. 267 p.

9. Nesteruk G. Ph., Kupriyanov M. C. Neural-fuzzy systems with fuzzy links // Proc. of the VI-th Int. Conference SCM'2003. Saint-Petersburg: StPSETU «LETI», 2003. V. 1. P. 341-344.

10. Kotenko I. V., Parashchuk I. B., Omar T. K. Neuro-fuzzy models in tasks of intelligent data processing for detection and counteraction of inappropriate, dubious and harmful information // 2nd International Scientific-Practical Conference Fuzzy Technologies in the Industry (FTI 2018) (Ulyanovsk, October 23-25, 2018). Ulyanovsk, 2018. P. 116-125.

11. Parashchuk I. B. System Formation Algorithm of Communication Network Quality Factors using Artificial Neural Networks // 1st IEEE International Conference on Circuits and System for Communications (ICCSC'02). Saint-Petersburg: SPbGTU, 2002. P. 263-266.

12. Stewart N. E., Thomas G. K. Markov processes // Probability and Mathematical Statistics. New York: John Wiley & Sons Inc., 1986. P. 214-234.

13. Bini D., Latouche G., Meini B. Numerical Methods for Structured Markov Chains. New York: Oxford University Press, 2005. 215 p.

Статья поступила в редакцию 13.02.2019

ИНФОРМАЦИЯ ОБ АВТОРАХ

Котенко Игорь Витальевич - Россия, 199178, Санкт-Петербург; Санкт-Петербургский институт информатики и автоматизации Российской академии наук; д-р техн. наук, профессор; зав. лабораторией проблем компьютерной безопасности; ivkote@comsec.spb.ru.

Паращук Игорь Борисович - Россия, 199178, Санкт-Петербург; Санкт-Петербургский институт информатики и автоматизации Российской академии наук; д-р техн. наук, профессор; ведущий научный сотрудник лаборатории проблем компьютерной безопасности; shchuk@rambler.ru.

VERIFICATION OF UNRELIABLE PARAMETERS OF THE MALICIOUS INFORMATION DETECTION MODEL

I. V. Kotenko, I. B. Parashchuk

Saint-Petersburg Institute of Informatics and Automation, Russian Academy of Sciences, Saint-Petersburg, Russian Federation

Abstract. The object of research is the process of detecting harmful information in the social networks and global network. There has been proposed the approach to verifying the parameters of a mathematical model of a random process of detecting malicious information with the unreliable, inaccurately (contradictory) given initial data. The approach is based on using stochastic equations of state and observation that are based on controlled Markov chains in finite differences. At the same time, verification of key parameters of a mathematical model of this type - elements of a matrix of one-step transition probabilities - is performed by using an extrapolating neural network. This allows to take into account and compensate the inaccuracy of the original data inherent in random processes of searching and detecting malicious information, as well as to increase the accuracy of decision-making on the assessment and categorization of digital network content to detect and counter information of this class.

Key words: mathematical model, malicious data, model parameter, neural network, matrix of lonks, transition probabilities, parameter condition, estimation.

For citation: Kotenko I. V., Parashchuk I. B. Verification of unreliable parameters of the malicious information detection model. Vestnik of Astrakhan State Technical University. Series: Management, Computer Science and Informatics. 2019;2:7-18. (In Russ.) DOI: 10.24143/20729502-2019-2-7-18.

REFERENCES

1. Kotenko I. V., Saenko I. B., Chechulin A. A., Desnitsky V. A., Vitkova L. A., Pronoza A. A. Monitoring and counteraction to malicious influences in the information space of social networks. Proceedings The 10th Social Informatics conference (SocInfo2018) (Saint-Petersburg, September 25-28, 2018). Saint-Petersburg, 2018. Part II. Lecture Notes in Computer Science. Vol. 11186, Springer. Pp. 159-167.

2. Kotenko I. V., Saenko I. B., Chechulin A. A. Protection against information in eSociety: using Data Mining methods to counteract unwanted and malicious data. Digital Transformation and Global Society. Second International Conference, DTGS 2017 (Saint-Petersburg, June 21-23, 2017). Revised Selected Papers. Communications in Computer and Information Science (CCIS). Saint-Petersburg, 2017. Vol. 745. Pp. 170-184.

3. Kosko B. Neural Networks and Fuzzy Systems: A Dynamical Systems Approach to Machine Intelligence. Englewood Cliffs, Prentice-Hall, 1992. 346 p.

4. Kriesel D. A Brief Introduction to Neural Networks. Cambridge, Cambridge Press, 2010. 226 p.

5. Parlos A. G., Menon S. K., Atiya A. F. An algorithmic approach to adaptive state filtering using recurrent neural networks. IEEE Trans. Neural Networks, 2001, vol. 12, no. 6, pp. 1411-1432.

6. Rojas R. Neural Networks. Berlin, Springer-Verlag, 1996. 453 p.

7. Muller B., Reinhardt J., Strickland M. T. Neural networks: an introduction. Springer, 1995. 306 p.

8. Anderson J. A., Rosenfeld E. Neurocomputing: Foundation of Research. Cambridge, Mass, MIT Press, 1988. 267 p.

9. Nesteruk G. Ph., Kupriyanov M. C. Neural-fuzzy systems with fuzzy links. Proceedings of the VI-th International Conference SCM'2003. Saint-Petersburg, StPSETU «LETI», 2003. Vol. 1. Pp. 341-344.

10. Kotenko I. V., Parashchuk I. B., Omar T. K. Neuro-fuzzy models in tasks of intelligent data processing for detection and counteraction of inappropriate, dubious and harmful information. 2nd International Scientific-Practical Conference Fuzzy Technologies in the Industry (FTI 2018) (Ulyanovsk, October 23-25, 2018). Ulyanovsk, 2018. Pp. 116-125.

11. Parashchuk I. B. System Formation Algorithm of Communication Network Quality Factors using Artificial Neural Networks. 1st IEEE International Conference on Circuits and System for Communications (ICCSC'02). Saint-Petersburg, SPbGTU, 2002. Pp. 263-266.

12. Stewart N. E., Thomas G. K. Markov processes. Probability and Mathematical Statistics. New York, John Wiley & Sons Inc., 1986. Pp. 214-234.

13. Bini D., Latouche G., Meini B. Numerical Methods for Structured Markov Chains. New York, Oxford University Press, 2005. 215 p.

The article submitted to the editors 13.02.2019

INFORMATION ABOÜT AUTHORS

Kotenko Igor Vitalievich - Russia, 199178, Saint-Petersburg; St. Petersburg Institute of Informatics and Automation of the Russian Academy of Sciences; Doctor of Technical Sciences, Professor; Head of the Laboratory of Computer Security Problems; ivkote@comsec.spb.ru.

Parashchuk Igor Borisovich - Russia, 199178, Saint-Petersburg; St. Petersburg Institute of Informatics and Automation of the Russian Academy of Sciences; Doctor of Technical Sciences, Professor; Leading Researcher of the Laboratory of Computer Security Problems; shchuk@rambler.ru.

Верификация недостоверных параметров модели обнаружения вредоносной информации Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Котенко Игорь Витальевич, Паращук Игорь Борисович

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Котенко Игорь Витальевич, Паращук Игорь Борисович

VERIFICATION OF UNRELIABLE PARAMETERS OF THE MALICIOUS INFORMATION DETECTION MODEL

Текст научной работы на тему «Верификация недостоверных параметров модели обнаружения вредоносной информации»