Научная статья на тему 'МЕТОДИКА ПРЕВЕНТИВНОЙ ИДЕНТИФИКАЦИИ СОСТОЯНИЯ ОБЪЕКТОВ МОНИТОРИНГА НА ОСНОВЕ СИМВОЛЬНОГО ПРЕДСТАВЛЕНИЯ ВРЕМЕННЫХ РЯДОВ ИХ МЕТРИК'

МЕТОДИКА ПРЕВЕНТИВНОЙ ИДЕНТИФИКАЦИИ СОСТОЯНИЯ ОБЪЕКТОВ МОНИТОРИНГА НА ОСНОВЕ СИМВОЛЬНОГО ПРЕДСТАВЛЕНИЯ ВРЕМЕННЫХ РЯДОВ ИХ МЕТРИК Текст научной статьи по специальности «Математика»

CC BY
90
19
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЕРВЕР МОНИТОРИНГА / ИДЕНТИФИКАЦИЯ ТЕХНИЧЕСКОГО СОСТОЯНИЯ / ОСОБЫЙ РЕЖИМ МОНИТОРИНГА / ВРЕМЕННЫЕ РЯДЫ / ПРЕВЕНТИВНАЯ ИДЕНТИФИКАЦИЯ

Аннотация научной статьи по математике, автор научной работы — Аллакин В. В.

Введение: на основе анализа методов оценки временных рядов наблюдаемых параметров устройств информационно телекоммуникационных сетей общего пользования разработать методику превентивной идентификации состояния объектов мониторинга, используя символьное представление временных рядов их метрик. Цель исследования: определить обобщенные универсальные характеристики временного ряда, по которым возможно оценить разнообразие наблюдаемых значений метрик, относящихся к определенной области состояния объекта мониторинга (классу его технического состояния). Результаты: превентивная идентификация аномального состояния сетевого элемента осуществляется путем выявления "запрещенных" кодовых слогов на кодовом слове, описывающем наблюдаемый временной ряд метрики. Данный подход к обработке временных рядов заимствован из символической динамики, применяемый в биоинформатике при анализе сложных нуклеотидных геномных последовательностей. В качестве обобщенной универсальной характеристики временного ряда использована энтропия кодовых слов, описывающая временной ряд, закодированный методом символического представления данных наблюдаемых метрик. Разработан алгоритм методики превентивной идентификации аномальной ситуации на временном ряду его параметров, состоящий из четырех этапов: на первом этапе осуществляется символьное кодирование временного ряда по возможным значениям параметров; на втором - производится оценка энтропии кодового слова, описывающего временной ряд наблюдаемой метрики; на третьем - обучается классификатор состояний объекта измерения на основе энтропии сдвигов; на четвертом - классифицируется состояние по тестовой выборке измерений, в которых измеряемая характеристика описывается своим законом распределения вероятностей сдвигов. Практическая значимость: при обнаружении аномального функционального состояния сетевого элемента осуществляется переход к особому режиму мониторинга, когда скважность опроса сервером мониторинга сетевого элемента значительно увеличивается с целью своевременного принятия превентивных управляющих воздействий на сетевую инфраструктуру и недопущения пропуска отказа (наступления аварии). Обсуждение: методика позволит в последующем сформировать порядок работы сервера мониторинга для идентификации функционального состояния сетевого элемента и информационно-телекоммуникационной сети общего пользования в целом.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Аллакин В. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE METHOD OF PREVENTIVE IDENTIFICATION OF THE STATE OF MONITORING OBJECTS BASED ON THE SYMBOLIC REPRESENTATION OF TIME SERIES OF THEIR METRICS

Introduction: based on the analysis of methods for estimating time series of observed parameters of devices of public information and telecommunications networks, to develop a method for preventive identification of the state of monitoring objects using a symbolic representation of time series of their metrics. Purpose: of the study is to determine the generalized universal characteristics of the time series, according to which it is possible to evaluate the variety of observed values of metrics related to a certain area of the state of the monitoring object (the class of its technical condition). Results: preventive identification of the abnormal state of the network element is carried out by identifying "forbidden" code syllables on the code word describing the observed time series of the metric. This approach to time series processing is borrowed from symbolic dynamics, which is used in bioinformatics when analyzing complex nucleotide genomic sequences. As a generalized universal characteristic of the time series, the entropy of code words is used, describing the time series encoded by the method of symbolic representation of the data of the observed metrics. An algorithm of the method of preventive identification of an abnormal situation on a time series of its parameters is developed, consisting of four stages: at the first stage, the time series is symbolically encoded according to possible parameter values; at the second, the entropy of the code word describing the time series of the observed metric is estimated; at the third, the classifier of the states of the measurement object is trained based on the entropy of shifts; at the fourth stage, the state is classified according to a test sample of measurements, in which the measured characteristic is described by its law of probability distribution of shifts. Practical relevance: when an abnormal functional state of a network element is detected, a transition to a special monitoring mode is carried out, when the frequency of polling by the monitoring server of the network element is significantly increased in order to timely take preventive control actions on the network infrastructure and prevent failure (the occurrence of an accident). Discussion: the methodology will allow to form the order of operation of the monitoring server in the future to identify the functional state of the network element and the public information and telecommunications network as a whole.

Текст научной работы на тему «МЕТОДИКА ПРЕВЕНТИВНОЙ ИДЕНТИФИКАЦИИ СОСТОЯНИЯ ОБЪЕКТОВ МОНИТОРИНГА НА ОСНОВЕ СИМВОЛЬНОГО ПРЕДСТАВЛЕНИЯ ВРЕМЕННЫХ РЯДОВ ИХ МЕТРИК»

Vol. 13. No. 5-2021, H&ES RESEARCH

RF TECHNOLOGY AND COMMUNICATION

doi: 10.36724/2409-5419-2021-13-5-13-28

МЕТОДИКА ПРЕВЕНТИВНОМ ИДЕНТИФИКАЦИИ СОСТОЯНИЯ ОБЪЕКТОВ МОНИТОРИНГА НА ОСНОВЕ СИМВОЛЬНОГО ПРЕДСТАВЛЕНИЯ ВРЕМЕННЫХ РЯДОВ ИХ МЕТРИК

АЛЛАКИН

Владимир Васильевич1

Сведения об авторе:

1 аспирант, Федеральное государственное бюджетное образовательное учреждение высшего образования "Государственный университет морского и речного флота имени адмирала С.О. Макарова". г Санкт-Петербург, Россия, [email protected]

АННОТАЦИЯ

Введение: на основе анализа методов оценки временных рядов наблюдаемых параметров устройств информационно-телекоммуникационных сетей общего пользования разработать методику превентивной идентификации состояния объектов мониторинга, используя символьное представление временных рядов их метрик. Цель исследования: определить обобщенные универсальные характеристики временного ряда, по которым возможно оценить разнообразие наблюдаемых значений метрик, относящихся к определенной области состояния объекта мониторинга (классу его технического состояния). Результаты: превентивная идентификация аномального состояния сетевого элемента осуществляется путем выявления "запрещенных" кодовых слогов на кодовом слове, описывающем наблюдаемый временной ряд метрики. Данный подход к обработке временных рядов заимствован из символической динамики, применяемый в биоинформатике при анализе сложных нуклеотидных геномных последовательностей. В качестве обобщенной универсальной характеристики временного ряда использована энтропия кодовых слов, описывающая временной ряд, закодированный методом символического представления данных наблюдаемых метрик. Разработан алгоритм методики превентивной идентификации аномальной ситуации на временном ряду его параметров, состоящий из четырех этапов: на первом этапе осуществляется символьное кодирование временного ряда по возможным значениям параметров; на втором - производится оценка энтропии кодового слова, описывающего временной ряд наблюдаемой метрики; на третьем - обучается классификатор состояний объекта измерения на основе энтропии сдвигов; на четвертом - классифицируется состояние по тестовой выборке измерений, в которых измеряемая характеристика описывается своим законом распределения вероятностей сдвигов. Практическая значимость: при обнаружении аномального функционального состояния сетевого элемента осуществляется переход к особому режиму мониторинга, когда скважность опроса сервером мониторинга сетевого элемента значительно увеличивается с целью своевременного принятия превентивных управляющих воздействий на сетевую инфраструктуру и недопущения пропуска отказа (наступления аварии). Обсуждение: методика позволит в последующем сформировать порядок работы сервера мониторинга для идентификации функционального состояния сетевого элемента и информационно-телекоммуникационной сети общего пользования в целом.

КЛЮЧЕВЫЕ СЛОВА: сервер мониторинга, идентификация технического состояния, особый режим мониторинга, временные ряды, превентивная идентификация.

Для цитирования: Аллакин В.В. Методика превентивной идентификации состояния объектов мониторинга на основе символьного представления временных рядов их метрик // Наукоемкие технологии в космических исследованиях Земли. 2021. Т. 13. № 5. С. 13-28. doi: 10.36724/2409-5419-2021-13-5-13-28

НАУКОЕМКИЕ ТЕХНОЛОГИИ В КОСМИЧЕСКИХ ИССЛЕДОВАНИЯХ ЗЕМЛИ, Т. 13. № 5-2021

РАДИОТЕХНИКА И СВЯЗЬ

Введение

Изменение большого числа контролируемых характеристик информационно-телекоммуникационных сетей (ИТКС) общего пользования (ФЗ № 126 «О связи», 2003) и ее основных элементов (серверов, узлов коммутации, периферийных устройств, каналов передачи данных) носит характер случайного процесса [1, 2], представляемого временными рядами. При этом статистический характер принятия решений о функциональном состоянии сетевого элемента и ИТКС в целом особенно хорошо прослеживается с ростом размерности объекта и увеличением скважности его опроса серверами мониторинга, что существенно влияет на увеличение количества обрабатываемой измерительной информации (ИИ). А учитывая тот факт, что наблюдение за сетевыми объектами мониторинга осуществляется практически на протяжении всего их жизненного цикла, то задачи обработки временных рядов в современных подсистемах мониторинга справедливо относят к задачам анализа больших данных (Big Data) [2, 3].

Временной ряд случайного потока отказов, влияющего на показатели надёжностных характеристик сетевых устройств ИТКС, можно представить случайным процессом [4], в основе которого всегда лежит математическая модель. При этом большинство моделей предполагают, что прогнозирование случайного процесса общего вида основано как на аддитивном представлении случайного процесса в виде суммы декомпозиций трендовой, периодической (циклической) и стохастической компонент, рис. 1, так и на мультипликативном их представлении, т. е. произведении данных компонент:

тренд случайного процесса (рис. 1, а) - некоторая детерминированная компонента, не содержащая периодических составляющих, кроме, тех, периоды которых заведомо больше интервала временного окна наблюдения случайного процесса;

ЬЩ&Ш^www

Рис. 1. Основные разновидности случайных процессов, представляемые временными рядами

периодическая (циклическая) компонента (рис. 1, Ь) -определяется как совокупность неслучайных гармонических колебаний, периоды которых заведомо меньше, чем интервал временного окна наблюдения случайного процесса;

случайная компонента (рис. 1, с) - центрированный случайный процесс.

В современных системах мониторинга ИТКС общего пользования (ОП) динамика объекта мониторинга (сетевого устройства, канала, сети) представляется как последовательность переходов между их стационарными состояниями. Примеры можно увидеть в ГОСТ 27.002-2015 по надежности, в соответствие с которым к основным видам состояния технических устройств (с точки зрения их надежности) относят: исправное, неисправное, работоспособное, предотказное, неработоспособное и предельное состояния. Это не противоречит рекомендациям Международного союза электросвязи (Ree. ITU-T М.3703), где вводятся следующие виды состояний: «неопределенное» (Undefined, U); «норма» (Normal, N); «незначительное нарушение» (Minor, Г); «значительное нарушение» (Major, J); «критическое» (Critical, С); «авария» (Fault, F).

В связи с этим, основная задача системы мониторинга состоит в оперативном событийном уведомлении лица принимающего решение (ЛПР) о смене состояния сети ИТКС ОП или ее сетевых элементов. Как правило, в конечной интерпретации ЛПР, таких основных состояний всего два «норма» -сетевой элемент выполняет свои функции и «авария» - сетевой элемент не может выполнять свои функции. Остальные состояния служат для уведомления ЛПР о направлении динамики процесса - от «нормы» к «аварии» и от «аварии» к «норме».

Рассматривая поведенческий подход [5] к мониторингу ИТКС ОП, необходимо отметить, что независимо от отечественной или международной классификации видов состояний технических устройств, в итоге, их интерпретация сводится к двум основным: «норма» и «авария». Динамика переходных процессов от «нормы» (N) к «аварии» (F) редко характеризуется явной последовательностью событий N—I — J - С- F через «незначительное нарушение» (1), «значительное нарушение» (J) и «критическое» (С). Обычно, в журнале регистрации событий наблюдается переходные процессы с колебаниями, при которых вполне возможен как временный возврат на менее критическое состояние, так и резкие скачки «через» состояние, или через несколько состояний (например: N-I-J-C-F, N-J-C-F, N-C-F, или даже NF), которые не были идентифицированы по причине малой скважности опроса сетевого элемента сервером мониторинга.

Решение вопроса периодичности опроса объектов мониторинга подсистемой контроля является самостоятельной оптимизационной задачей, но, в то же время, полученное ее решение не будет универсальным на множестве контролируемых метрик для разнородных сетевых элементов различных ИТКС. Каждый производитель старается решить данную задачу для своего оборудования самостоятельно. Так, для временных рядов, характеризующихся трендом случайного процесса (рис. 1 а), наиболее используемым в подсистемах мониторинга, является триггерный механизм идентификации технического состояния (например, активно используемый в Cisco) и позволяющий устранить дублирование событий в журнале в случае колебаний измеримой характеристики вблизи порога (т. н. эффект «дребезга нуля»). Метод заключается в назначении пары пороговых значений «возрастающего» и «убывающего» порогов. Событие генерируется, когда превышается «возрастающий» порог. Как только этот порог пре-

Vol. 13. No. 5-2021, H&ES RESEARCH

RF TECHNOLOGY AND COMMUNICATION

вышен, событие не генерируется снова, пока не будет пересечен «убывающий» порог. Наглядно метод гистерезиса показан на рис. 2.

Поскольку начальное состояние было настроено на срабатывание при повышении «возрастающего» порога, в точке А сигнал тревоги не генерируется. По мере того, как значение измерения увеличивается до уровня выше «возрастающего» порога, сигнал тревоги генерируется в точке Б. Никаких сигналов в точках Е, Е, О, Н или I не генерируется до тех пор, пока не будет сгенерирован сигнал о пересечении «убывающего» порога (точка 1). И снова в точке К не будет генерироваться никаких дополнительных сигналов тревоги, пока не произойдет пересечение «возрастающего» порога в точке Ь. В итоге, без гистерезиса было бы сгенерировано 12 аварийных сигналов, с гистерезисом генерируются только три. Зачатую, сокращение генерации аварийных сигналов бывает более значительным. Однако данный механизм гистерезиса не приводит к надежной идентификации направления динамики процесса. Нужен поиск новых подходов к решению такого класса задач.

Рис. 2. Применение триггерного механизма для сокращения числа событий вследствие эффекта «дребезга нуля»

Рассмотрим временной ряд с использованием символьного представления, описанного в [6] и применяемого в разделе символической динамики из теории динамических систем, когда для описания последовательностей измерений состояния системы пользуются символами некоторого заданного алфавита. Такой подход наиболее эффективен в описании и исследовании детерминированных систем, в которых из-за ограничений возможностей измерения возникает сходство со случайным процессом. При этом описание временного ряда и динамики его изменения возможно в терминах топологических аналогов марковских процессов, т. е. с помощью матриц возможных переходов ме^ду классами технического состояния (ТС) системы. Непосредственно для такого описания необходимо задать алфавит, который бы наиболее подходил для представления разбиения пространства ее состояний на области, которые бы соответствовали измеряемым значениям параметров (метрик). Данная оценка была заимствована теорией символической динамики из биоинформатики, где активно используется для оценки сложности нуклеотидных геномных последовательностей [7], например, очень длинных последовательностей ДНК [8]. Причем вполне естественно оценивать сложную бесконечную допустимую последовательность числом различных

конечных слов, входящих в нее. Тогда задача определения вторичной структуры временного ряда (структуры локальных конфигураций) [9] формулируется как задача преобразования слов в алфавите метрик в слова над алфавитом локальных конфигураций, используя метод скользящего окна (кодов определенных слогов в кодовых словах) [10]. При этом количественная оценка временного ряда производится с помощью топологической энтропии или метрической энтропии по Колмогорову.

Постановка задачи. При заданном алфавите X классов технических состояний (А - исправное, В - неисправное, С -работоспособное, D - предотказное, Е - неработоспособное, F - предельное) сетевого элемента, рассмотрим временной ряд его метрики произвольной природы T = f, ti), i = 1, n} ,

где fi - значение характеристики наблюдаемого процесса (изменение метрики параметра сетевого устройства) в момент времени ti, n - число наблюдений (временных отсчетов).

Необходимо определить обобщенные универсальные характеристики данного временного ряда, по которым возможно оценить разнообразие наблюдаемых значений параметров (метрик), относящихся к определенной области состояния объекта мониторинга (классу его технического состояния).

Для решения задачи на первом этапе осуществляем символьное кодирование временного ряда по возможным значениям параметров; на втором - производим оценку энтропии кодового слова, описывающего временной ряд наблюдаемой метрики; на третьем - обучаем классификатор состояний объекта измерения на основе энтропии сдвигов; на четвертом - классифицируем состояния по тестовой выборке измерений, в которых измеряемая характеристика описывается своим законом распределения вероятностей сдвигов.

Анализ временного ряда по значениям метрик

Необходимость универсализации разнородных временных рядов в пространстве их кластеризации налагает требования к их обобщенным универсальным характеристикам, определенные значения которых интерпретируются координатами точки, которая представляет рассматриваемый временной ряд в таком пространстве. В то же время сложности универсализации связаны с тем, что различные временные ряды имеют разную точность измерений, т. е. число значащих цифр в значении характеристики наблюдаемого процесса fi, а также вариацию этих значений на различных интервалах времени ti, что видно из рис. 3.

Для универсализации временных рядов в [6] предлагается масштабирование значений наблюдаемой функции f, а также построение исходя из этого строки символов, которые отражали бы динамику их числовых значений. Для этого определяется размах варьирования значений рассматриваемого временного ряда: V=ymax-ymm, где где ymm = min f, ymax = max f, на

i=1, n i=l n

котором вводится разбиение yi, i = 1,m диапазона |yi,ym], приЧёМ yi — ymin, Ут = Утах-

Однако, поскольку значения f временного ряда могут попадать и на границу разбиений, то правильнее рассматривать диапазон [у„у,+1) = {y\y,<y <у*ь i = 1,т-1}.

НАУКОЕМКИЕ ТЕХНОЛОГИИ В КОСМИЧЕСКИХ ИССЛЕДОВАНИЯХ ЗЕМЛИ, Т. 13. № 5-2021

РАДИОТЕХНИКА И СВЯЗЬ

В данном случае определение числа разбиений к (к = т-\) всего диапазона наблюдения значений параметра (метрики) на сегменты, а также определение их внутренних границ является самостоятельной оптимизационной задачей [10] с применением бикритериального метода построения гистограмм, которая уже была решена в [11]. Число разбиений к диапазона наблюдения параметра, полученных данным методом и определяет мощность алфавита описания.

а) б)

Рис. 3. Символьное представление временного ряда наблюдаемого параметра: а) с медленным; Ь) лавинообразным нарастанием аварийной ситуации (отказа)

Например, на рис. 3 приведено разбиение размаха временного ряда на символы А, В, С, Б, Е, ^ выбранного алфавита Е (здесь символы алфавита Е соответствуют прописным символам латинского алфавита). При этом последний элемент разбиения (на рис. 3 обозначен как «Р»), очевидно также будет являться сегментом. Данными символами обозначаются разбиения значений наблюдаемой величины в порядке их возрастания. Так символ <А» - имя разбиения наименьших значений (по видам состояния соответствует исправному ТС сетевого элемента, когда все параметры имеют номинальные значения), а «£» - соответствующее аварии (отказу), «Р» - предельному, когда дальнейшая эксплуатация опасна или нецелесообразна. Если измерения параметра (метрики) ведется в дискретное время, то описание значений временного ряда символами разбиений есть слово над алфавитом Е в строке. Прохождением по временному ряду получается кодирование (представление) его строкой символов. Причем числовое значение £ кодируется символом разбиения (сегмента), в котором оно находится: для рис. За) - {АААВВВСО...}; для рис. 3 Ъ) - {ААВЕ...}. Если наблюдаемый процесс описывается резким увеличением значений параметра (наблюдаемой величины), равно как и резким спадом за один временной интервал относительно нормального тренда его изменения (последовательного перехода из одного разбиения (сегмента) в другой), то получаемые кодовые слова, характеризующие временной ряд не будут содержать некоторых слогов. Так, кодовое слово временного ряда показанного на рис. 3 Ь) не содержит слога «СБ». Данная ситуация идентифицируется как лавинообразный процесс развития аварии (отказа).

Такой подход позволяет осуществить интервальный анализ временного ряда, где в качестве интервала может рассматриваться «скользящее окно», последовательно сдвигающееся вдоль временного ряда и отслеживающее появление аномальных предаварийных ситуаций, или отказов, путем сравнения просматриваемых в «скользящем окне» слогов в наблюдаемом кодовом слове-строке временного ряда с «запрещенными» кодовыми слогами, идентифицирующими аномальное состояние.

При этом временной ряд, имеющий п временных отсчетов (наблюдений), будет представлен в виде кодового слова-строки из п символов над алфавитом Е, а ширину «скользящего окна» можно подобрать оптимальным образом (для конкретной метрики индивидуально), учитывая физические процессы развития аномальных ситуаций и отказов в различных сетевых элементах, при различных режимах и условиях функционирования. Так, на рисунке 3 а) ширина скользящего окна анализа равна т = Ъ. Поскольку процессу возникновения отказа сетевого элемента, как правило, предшествуют во времени изменения значений параметров (метрик) с трендом выхода их за пределы эксплуатационных и профилактических допусков [12], то в ходе производственных испытаний и опытной эксплуатации технических устройств нарабатывается база «запрещенных» слогов кодовых слов, используемая в пространстве сдвигов «скользящего окна» путем сравнения с наблюдаемым результатом. Таким образом, выявление «запрещенных» слогов в кодовом слове-строке временного ряда может лечь в основу метода прогнозирования наступления аварии или отказа.

Для решения задачи масштабирования в [9] предложен диапазон значений временного ряда, который может быть как с равномерным разбиением, так и с вычислением длины и числа разбиений на основе аппарата математической статистики (при решении задач мониторинга - аппарата теории надежности). Для временных рядов конкретных контролируемых параметров данный вопрос индивидуален и зависит не только от номинальных величин параметра, но также от эксплуатационных и профилактических допусков на них [12]. Число разбиений при оценке функциональной надежности сетевых элементов, как правило, соответствует видам их ТС.

Как было отмечено выше, с точки зрения функциональной надежности эксплуатанта в большей степени интересует переход из работоспособного в неработоспособное («Авария» или «Отказ») состояние через промежуточное - предотказное ТС. Учитывая это, разбиение, соответствующее предотказному ТС может уточняться для каждого сетевого элемента или его измеряемого параметра. Очевидно, что различные временные ряды могут содержать не равные количества наблюдаемых значений. В рассматриваемом подходе символьного кодирования это означает, что описание временного ряда будет представлено словами-строками различной длины в заданном фиксированном алфавите. В связи с чем, в [10] осуществлен переход от оценки абсолютной сложности строки по Колмогорову (от длины сжатой строки) к ее относительной оценке через коэффициент сжатия [13,14].

Анализ временного ряда по тенденциям изменения

метрик

В ряде случаев для подсистемы мониторинга функциональной безопасности (надежности) интерес представляет не реальное изменение временного ряда в следующий дискрет времени, а изменение его тенденции. Сама по себе задача определения рациональных порогов идентификации в изменении тенденций достаточно сложна, поскольку необходимо определиться с критерием положительной тенденции или ее отсутствием (0,5 %, 1 %, 2 %...?).

При этом необходима либо специальная предварительная обработка исходных данных временных рядов, либо примене-

Vol. 13. No. 5-2021, H&ES RESEARCH

RF TECHNOLOGY AND COMMUNICATION

ние метода экспертных оценок, что, во втором случае носит субъективный характер и не является математически обоснованным. Само по себе использование метода символьного кодирования значений временного ряда уже можно интерпретировать как предварительную обработку, а поскольку используемый в [9] бикритериальный метод построения разбиений гарантирует, что доверительный интервал для выборочного среднего в каждом разбиении будет не шире самого разбиения, то локализация значений, кодируемых одним символом алфавита Е, является статистически достоверной. Из чего можно заключить, что, используя метод символьного кодирования, изменение символа заданного для временного ряда алфавита Е в следующий временной интервал и есть квалификация тенденции, в то время как изменение значения параметра, не выводящее его за полосу ширины разбиения - отсутствие какой-либо тенденции.

Продемонстрируем символьное описание временного ряда изменения значений параметра по тенденциям (рис. 4).

Рис. 4. Символьное описание временного ряда по тенденции изменения значения метрики

Для кодирования по тенденциям представленного на данном рисунке временного ряда используем алфавит = {-, 0, +}, в котором символом «0» обозначено отсутствие тенденции в значении последующего временного интервала. Тогда при кодировании временного ряда в ранее определенном алфавите Е3нач = {А, В, С, Д Е} (по значениям) кодовое слово будет иметь вид: {СОБОСВАВ}, а при кодировании того же временного ряда по тенденциям с использованием алфавита кодовое слово будет выглядеть {0 + 00---+}, предполагая, что первый символ кода тенденции всегда имеет значение «0» (отсутствие тенденции).

С точки зрения теории надежности для подсистемы мониторинга важно, чтобы значения наблюдаемых параметров сетевых элементов находились при определенных режимах функционирования в стабильном состоянии (отсутствие тенденций). Для динамических систем с постоянно изменяющимися режимами работы (недогруженный, перегруженный и пр.) и изменением обрабатываемой нагрузки в символах кодовых слов, описывающие временные ряды наблюдаемых параметров всегда будут присутствовать тенденции. Для выявления разрушительных тенденций, вызывающих переход сетевого элемента из работоспособного состояния в состояние отказа (аварийное состояние) необходимо определить запрещенные полуслова (слоги) в описываемом временной ряд слове-строке. Как правило, аварий-

ному режиму функционирования предшествует некоторый временной интервал, соответствующий предотказному состоянию, характеризуемый повышенным риском возникновения отказа.

Предотказное состояние может быть связано с воздействиями на сетевой элемент многих внешних (ошибки персонала, условия эксплуатации, воздействия естественного и искусственного характера и пр.) и внутренних (производственные дефекты, программные сбои, перегруженные режимы работы и пр.) факторов. При этом задачей подсистемы мониторинга является своевременное обнаружение предот-казного состояния сетевого устройства с целью оперативного (превентивного) принятия мер для недопущения развития отказа (аварии). С этих позиций применение метода символьного кодирования как по значениям временных рядов, так и по тенденциям, позволяет заблаговременно обнаружить «запрещенную» комбинацию полуслов (слогов) в кодовом слове, описывающем временной ряд значений контролируемых параметров. Тогда обнаружение развития отказа возможно по выявлению в кодовом слове временного ряда слогов, идентифицирующих стремительно развивающуюся тенденцию в сторону разбиения, характеризующего аварийной состояние объекта контроля (ОК) (для рассматриваемого примера рис. 3 и 4 - разбиение «Е»). Так, при символьном кодировании значений временного ряда на рис. 3 а) факт перехода из режима нормального функционирования (символ разбиения - «А») к предотказному состоянию (символ разбиения «D») интерпретируется слогом «BCD» в слове-строке {AAABBBCD...}, а на рис. 3 Ь) переход к отказу - слогом «АВЕ» в слове {ААВЕ}.

При кодировании временного ряда по тенденциям аномальное состояние (поведение) системы (сетевого устройства) может идентифицироваться слогами типа {+ +}, {+ + +}, или {--}, {---}.

Соответственно подсистема мониторинга должна в ходе обработки кодового слова временного ряда выявлять подобные «запрещенные» комбинации слогов, характеризующие наступление предотказного состояния или отказа системы. Факт перехода объекта мониторинга в критическое состояние должен выявляться заранее для принятия превентивного управляющего воздействия. Такой реакцией подсистемы мониторинга на наступление предотказного ТС может быть управляющее воздействие на сеть (сетевой элемент) или перевода системы мониторинга в особый режим мониторинга.

В работе предлагается в качестве особого режима мониторинга использовать увеличение скважности опросов сервером мониторинга сетевого элемента по значениям наблюдаемых метрик, когда при выявлении наступления его предотказного состояния по агрегированной предварительно собранной статистике о сетевом устройстве для недопущения развития аварийной ситуации частота опроса объекта мониторинга увеличивается, например, в 10 раз, т. е. вместо 1 раза в 5 минут, опрос осуществляют каждые 30 секунд или еще чаще.

Предметом данного исследования является алгоритм и метод выявления нестационарных состояний объекта, на котором проводят измерение. При этом в работе сформулированы и решаются следующие задачи:

НАУКОЕМКИЕ ТЕХНОЛОГИИ В КОСМИЧЕСКИХ ИССЛЕДОВАНИЯХ ЗЕМЛИ, Т. 13. № 5-2021

РАДИОТЕХНИКА И СВЯЗЬ

символьное кодирования значении временного ряда и способ кодирования участков (ячеек) временного ряда вектором оценок энтропии сдвигов;

метод обучения классификатора состояний объекта измерения на основе энтропии сдвигов;

метода классификации состояния по тестовой выборке измерений, в которых измеряемая характеристика описывается своим распределением вероятностей сдвигов.

Оценка энтропии кодового слова, описывающего временной ряд наблюдаемой метрики

Для выявления в кодовом слове-строке анализируемого временного ряда «запрещенных» слогов, идентифицирующих развитие аварии воспользуемся оценкой энтропии слов [10].

При этом оценку энтропии кодовых слов описывающего временной ряд наблюдаемого параметра осуществляют в следующем порядке [10]. Сначала фиксируют длину слога т и алфавит Е. Множество различных слогов на выбранном алфавите составит Е™ Соответственно мощность этого множества М= |Ет| составляет общее число слогов. Если обозначить & -мощность алфавита, то М=К". Для фиксированной длины

слогов т вводится произвольная их нумерация / = 1, М , а также счетчики числа слогов с^ В ходе анализа временного ряда Т длиной п, происходит сдвиг временного окна шириной т на один интервал [4 4т]- Таким образом, имеется п — т + 1 позиций временного окна, для каждой из которых идентифицируется слог, полученный в окне. Если в текущей позиции окна шириной т наблюдается слог, имеющий в принятой нумерации номер / = 1, М , то значение счётчика числа слогов с^ возрастает на единицу. Тогда по полученным значениям счётчика ci осуществляется оценка энтропии слов по выражению

С„

-V м

: 1=1

1оё п

(1)

чи - т +1) ^п - т + 4

Использование в качестве основания алгоритма мощности различных слогов М автоматически нормирует значение энтропии слов Ст. Ситуация, когда С(т) = 0 означает, что все слоги длиной т одинаковы и состоят из одного и того же слога или при длине слога совпадающим с длиной наблюдаемого кодового слова, т. е. т = п, мы имеем только один слог. А случай, когда С(т) = 1, соответствует одинаковой частоте встречаемости всех возможных слогов из Ет в наблюдаемом кодовом слове-строке (частота символов алфавита одинакова в исходном кодовом слове).

В результате оценки энтропии слов можно построить функцию С(т) = Ст, с аргументом т (1 <т<п), которая вычисляется при фиксированном да по анализируемому временному ряду в соответствие в выражением (1) и увеличением на единицу ширины окна на области определения да от 1 до п.

В соответствии с терминами символической динамики [15], функция С(т) есть оценка энтропии сдвигов.

Проведем для каждой ячейки процедуру вычисления энтропии сдвигов последовательно с возрастающей шириной окна т= 1, ..., В результате получим вектор энтропийной характеристики ячейки и,-: А = (С1,С2,...,Ст).

Влияние закона распределения параметров

временного ряда на прогнозирование отказа

При анализе методов обработки временных рядов нужно помнить, что основным правилом, определяющим выбор конкретного математического аппарата для их анализа при контроле параметров сетевого оборудования, является степень неоднородности объектов мониторинга [16]. В [17] такая степень неоднородности определяется по шкале (например, от 0 до 1, в сторону увеличения неоднородности). Наиболее подходящий математический аппарат, в зависимости от степени неоднородности, определяется, например, методом экспертных оценок (в частности, метод бинарных сравнений). В целом обоснование степени важности сетевого элемента в распределенной сети определяется на основе положений теории важности критериев:

для однотипных сетевых элементов степень неоднородности ограничена значениями от 0 до 0,6. Это объясняется высокой степенью унификации, «схожести» контролируемых сетевых элементов, а также фиксируемым потоком измерительной информации, характеризуемым свойствами однородности. Процесс изменения ТС в однотипных сетевых элементах более плавный, что способствует относительно высокой эффективности процессов обучения и обобщения, например, при использовании искусственных нейронных сетей (ИНС). Здесь процедура оценивания ТС основана на методах экспертных оценок, статистических методах распознавания, метрических методах, методах статистических решений (Неймана-Пирсона, минимакса), а также ИНС [16, 17];

для неоднотипных сетевых элементов (например, периферийного оборудования), отличающихся импульсным, нестационарным характером потока измерительной информации с пуассоновским законом распределения или законом распределения Вейбула («рваный» сигнал, получаемый с большим разбросом), поступающего от объекта мониторинга (при степени неоднородности от 0,7 до 1), наиболее применим метод дискретных вейвлет-преобразований (ДВП), а также метод последовательного анализаВальда [16,17].

Для моделирования односторонней задержки каналов связи используются следующие распределения вероятностей непрерывных случайных величин [6]:

Гамма-распределение. Гамма-распределение асимметрично и определено только для неотрицательных действительных чисел. Оно использует два параметра: параметр формы а>0 и параметр масштаба Р > 0. Варьирование а изменяет форму функции плотности, в то время как варьирование Р соответствует изменению единиц измерения (например, от микросекунд до миллисекунд) при неизменной форме функции плотности. Исследования показали [18], что гамма-распределение во многих ситуациях адекватно приближает задержки маршрутизации.

Распределение Рэлея. Распределение Рэлея является простой альтернативой гамма-распределению, которое принимает только один параметр - с2. Эта потеря в степени свободы оправдана тем, что рэлеевское распределение по-прежнему показывает аналогичное поведение во многих случаях хотя является довольно грубым приближением к реальному поведению задержки маршрутизации.

Vol. 13. No. 5-2021, H&ES RESEARCH

RF TECHNOLOGY AND COMMUNICATION

Основное преимущество его использования состоит в меньшей вычислительной сложности определения параметра.

Смещенное гамма-распределение. Как только оценены параметры гамма-распределения, моделирующего задержку маршрутизации, можно промоделировать поведение полной задержки, включающей также внутреннюю задержку (передачи пакетов по физической среде) с. Для этого гамма-распределение должно быть дополнено третьим параметром с> 0, которая сдвигает пик распределение на с единиц вправо. Это линейное преобразование приводит к распределению, называемому смещенным гамма-распределением. Внутренняя задержка с независима от состояния маршрутизаторов на пути, которые, в свою очередь, моделируется посредством параметров аир.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Смещенное распределение Рэлея. Так же, как смещенное гамма-распределение, смещенное распределение Рэлея является обобщением с дополнительным параметром с> 0, учитывающим внутреннюю задержку.

Функции плотности указанных распределений вероятностей вместе с их математическим ожиданием и дисперсией и графиками функций плотности с несколькими выбранными параметрами, приведены в таблице 1.

Таким образом, проведенный выше качественный обзор научно-методического аппарата анализа временных рядов показал, что каждый из рассмотренных методов имеет свои достоинства и недостатки. В силу наличия временных рядов с регулярными периодическими компонентами в различных сферах науки, решение задачи их прогнозирования является важной и актуальной научно-технической задачей, что подтверждает необходимость формирования самостоятельной методики прогнозирования (превентивной идентификации) аномальной ситуации во временном ряду метрик сетевых элементов распределенной ИТКС, позволяющей в явном виде учесть эти компоненты и отвечающей следующим свойствам:

- инвариантности относительно обрабатываемых метрик разнородных сетевых элементов ИТКС в рамках выбранного класса прогнозируемых процессов;

- учета взаимосвязи сечений не только на интервале периодичности случайного процесса, но также для тренда и его случайной компоненты (центрированного случайного процесса);

- возможности регуляризации временного ряда по небольшому числу параметров.

- наличия теоретически обоснованного алгоритма оптимизации.

Метод обучения классификатора состояний объекта

мониторинга на основе энтропии сдвигов

В основе предложенного метода лежит предположение, что любая ячейка исходного временного ряда принадлежит ко всем формируемым состояниям Ск, к = 1,М, но с разной вероятностью. Тогда задача будет заключаться в «подгонке» распределений «смеси состояний» к данным ячеек, а затем в определении вероятностей принадлежности измеренного вектора наблюдения к каждому состоянию.

Построим гистограмму энтропии для каждой компоненты введенного ранее вектора к. По оси х изменяется величина энтропии от 0 до 1, а по оси у - количество ячеек с данной величиной энтропии. Количество интервалов энтропии положим равным Е.

Будем считать, что каждая гистограмма (для каждой компоненты к = (СЬ С2,...,Ст) ) представляет собой смесь функций Гаусса

Р{Ь |б) = 2 *=1 • N {к я, ),

где п коэффициенты участия компонентов функций Гаусса в смеси, удовлетворяющие свойству £пц= 1- Таким образом, р(И) представляет собой плотность распределения вероятностей энтропии сдвигов. Для указанной плотности рассмотрим логарифмическую функцию правдоподобия:

Ц6) = 1п[пМ |0)) = 1п^П Е Ч ■ NК>] =

= Е Ч ■ N (А, ц t, а-)

где 0 6 {жк, у*, с2к}, к 6 {1,..., К}.

Для максимизации функции продифференцируем ее по параметру

Для краткости положим фк (h,) = N(ht | с2к),

dL(Q)

=z

1

--ъ

фк (h)

к=1

•Ф* Oh)

1

5ФkOhl дф к Oh)

£%А(К)

к=1

д 1п(ф, Ъ))

L к

фк <Л)

к=1

Значение 31пфА(х,)/9цА представляет собой производную логарифмической функции правдоподобия функции Гаусса и может быть использовано для установления параметров несмешанной модели. Наибольшие сложности при нахожде-

нии максимума вызывают сомножители

Ф к (Хг ) Фк (хг )

к

также

зависящие от переменных.

Введем скрытую переменную гЕ{1,...,К}, указывающую, что данная точка А пришла из к-то гауссиана. Тогда определим,

р{г = к) = жк ,

р(h\z = к) = KkN(ht ,) ,

p(h) = ZP (h\z = к )=Z KkN (ht L, a2k).

к=1 к=\

Это разлагает гауссову смесь на скрытую переменную г и параметры модели 9, которые позволяют выяснить, из какого гауссова значения была получена каждая точка данных. При этом вероятность получения точки из к-то гауссиана равна

р (к, 2 = к; 9)

р (z = k\h, е) =

2 р (к z = к-, е)'

НАУКОЕМКИЕ ТЕХНОЛОГИИ В КОСМИЧЕСКИХ ИССЛЕДОВАНИЯХ ЗЕМЛИ, Т. 13. № 5-2021

РАДИОТЕХНИКА И СВЯЗЬ

Таблица 1

Распределения вероятностей, используемые для моделирования поведения односторонней задержки

Распределение

Функция плотности

Область значений

Математическое ожидание

Дисперсия

Гамма-

распределение

[0, да)

а

~п2

Распределение Рэлея

х • ехр(-

52=^0.0 32=10.0 ■ 52=4.0

2 <7 '

[О, да)

4-п

Смещенное гамма-

распределение

[О, да)

а

— + с

Р

Смещенное

распределение

Рэлея

52=30.0, с=5.а ■ з2=4_0, с=5.а ■

. I 0 х — с а ), х > с

К(х с2,с)= 1 1

О, х < с

[О, да)

+ с

4-п

Vol. 13. No. 5-2021, H&ES RESEARCH

RF TECHNOLOGY AND COMMUNICATION

Указанная величина может выступать весовым коэффициентом в рассмотренной производной функции правдоподобия. Если мы знаем z, т. е. из какого гауссовского значения получены данные, нам больше не нужно суммировать по всем К гаус-сианам (X р(х, z)), чтобы максимизировать предельную вероятность. Вместо этого рассматриваем на каждом подмножестве х, исходящем из к-то гауссиана, и можем оценить Qk как arg max £ In р (hi; Qk) V/ (zi = к).

e* *

Если мы знаем, по какой гауссовой компоненте была получена точка данных (скрытая переменная z), то мы можем максимизировать логарифмическую вероятность и получить оценки параметров модели. В свою очередь, если известны параметры модели, можно вычислить апостериорную вероятность z, которая позволит оценить, из какого гауссова значения пришла каждая точка данных. Вместо того, чтобы одновременно вычислять оптимальную скрытую переменную z и параметр модели 9, мы по очереди будем оптимизировать каждую из них, до нахождения точной оценки. Указанные соображения позволяют использовать для разделения смеси распределений энтропии сдвигов ЕМ-алгоритм [19], состоящий из следующих двух шагов:

Е-шаг. На каждом Е-шаге вычислим текущие вероятности принадлежности точек А к-й компоненте распределения вероятностей энтропии по формуле:

4N [k\v-ic = )

' (/гг Ц,а2к)

М-шаг. На каждом М шаге вычисляются новые оценки параметров щ, а2к путем максимизации нижней оценки Q(Q) приведенной выше логарифмической функции правдоподобия ¿(9), полученной из условия выпуклости ¿(9) путем применения неравенства Иенсена с подстановкой соответствующих параметров, вычисленных на предыдущем шаге.

б (0; ) = £ Ъч ь (щ ■ ^ |ц*, ^)).

Найдя частные производные указанного выражения:

8Q (0; 0') DQ (0; 0') 8Q (0; 0')

Ф к

- = 0

dai

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

= 0.

джи

= 0.

получим выражения для обновления текущих значений:

£ «г,

, , 2 ¿ikh _ м_

2 4

2(i+1) _ ¿=i

I *£)(ь

V (О

Z zik

1=1 ¿=1 Результирующее правило обновления для %к идентично для любого типа смешанных моделей и может быть определенно как:

1 £ Ъ

%к Ч =-,

п г=1 п

где Nk - ненормализованный вес компонента fc Nk = ^ z,

ik

i=1

Тогда Л+1) = М

п , ,

ъ 4]

Классификация состояния сетевого устройства

После определения параметров распределения вероятностей для каждого из состояний Ск, к = 1,М для оперативной оценки текущего состояния объекта измерений можно использовать теорему Байеса.

Допустим, в процессе измерения была получена выборка Х=(х\,х2, ...,хп). К указанной выборке производится добавление «хвоста», - I измерений, полученных на предыдущих шагах. К полученной в результате выборке Х=(х\,х2,...,х1, ..., Х1+п) применяется процедура разбивки на ограниченное число ячеек и^ с вычислением в каждой из них вектора энтропии сдвигов И(и,), рассмотренного выше.

В результате полученный набор векторов энтропии сдвигов по каждой их проекции (обозначим ее как случайную величину Н) проверяется на принадлежность к каждому из состояний на основании апостериорных вероятностей Р(С=к\И).

Формально правило классификации может быть выражено

как:

Н ~ Си о

к = argmax Р (С = i\H).

Иными словами, X принадлежит к классу Ск, если апостериорная вероятность Р(С=к\Н) максимальна.

Предполагая, что п измерений выборки X независимы и распределены одинаково получаем вероятности принадлежности выборки Н=(к 1,..., Ьп) состояниям Ск.

Р(Н\С = к) = ПN(ht ,а2к) _

Априорные вероятности Р(С = к) для М состояний Ск, к = 1,М, будем полагать одинаковыми:

Р (С = к ) =

J_

м

Вероятность Р(С = к\Н) того, что, полученная проекция энтропии Н была произведена к-й компонентой можно определить через теорему Байеса:

Р (С - к\Н ЬР (Я1С = к)Р (С = к) - Р (Я1С = к )Р (С = к) ^ 1 ' Р (Н) 2 Р {н\с = ' )-Р (с = ' )•

Полученный в результате набор вероятностей принадлежности состояниям при помощи логических правил принятия решений используется для генерации событий оператору системы мониторинга.

Для исследования качества процесса классификации состояния сетевого устройства по предложенному алгоритму на основе статистики энтропии сдвигов был поставлен эксперимент на основе упомянутого набора данных недельной загрузки процессора сервера виртуализации.

Результаты эксперимента показаны в табл. 2. Здесь для фиксированного интервала (50) точек наблюдения временного ряда (синий цвет на левых рисунках табл. 2) и окон вычисления энтропии размером 2, 3, 5 и7 была вычислена статистика энтропии сдвигов (красный и зеленый цвет на левых рисунках табл. 2), в виде гистограмм (правые рисунки табл. 2), которые аппроксимированы тремя нормальными распределениями ЕМ-алгоритмом, описанном выше, со следующими значениями параметров математического ожидания (т) и дисперсии (Б):

-для ширины скользящего окна - 2: т: 0; 1.23; 2.29, Б: 0.13; 0.09; 0;

НАУКОЕМКИЕ ТЕХНОЛОГИИ В КОСМИЧЕСКИХ ИССЛЕДОВАНИЯХ ЗЕМЛИ, Т. 13. № 5-2021 РАДИОТЕХНИКА И СВЯЗЬ

Результаты эксперимента

Таблица 2

- для ширины скользящего окна - 3; т: 0; 1.58; 2.48, Б: 10"6; 0.15; 0.12;

- для ширины скользящего окна -5: т: 0.02; 1.70; 2.41, Б: 0.07; 0.003; 0.12;

- для ширины скользящего окна - 7: т: 0.01; 2.13; 2.63, Б: 10"5; 0.01; 0.1. Таким образом, как видно из таблицы 2, наиболее четкое разделение состояний (без нагрузки, переходное состояние, перегрузка) наблюдается для энтропийных окон шириной 2 иЗ.

С возрастанием размера скользящего окна качество аппроксимации визуально ухудшается, что затрудняет процесс классификации состояния сетевого устройства.

Описанный подход с классификацией состояния элементов телекоммуникационной сети неплохо работает в случае возможности выделения классов поведений. Это было продемонстрировано для односторонней задержки [20], когда компонента, связанная с маршрутизацией (ожидание в очередях), включается в общее выражение задержки лишь при средних и высоких нагрузках. В меньшей степени этот метод может быть использован для оценки состояния загрузки вычислительных ресурсов, в частности процессора. Хотя и здесь имеет место задержка, связанная с переключением контекста вычисления, но она более связана с организацией вычислительного процесса, чем с режимом нагрузки.

Vol. 13. No. 5-2021, H&ES RESEARCH

RF TECHNOLOGY AND COMMUNICATION

В этом случае требуется предварительный этап уточнения числа состояний и соответствующих им распределений. Это продемонстрировано на рисунках табл. 2, где приведена попытка аппроксимации гистограммы статистики недельной загрузки процессора сервера виртуализации двумя и тремя нормальными распределениями по смешанной гауссовской модели £М-алгоритмом.

Последовательность действий на этапе обучения классификатора с использованием процедуры £М-алгоритма, а также при выполнении этапа классификации состояния сетевого элемента представлено на рисунке 5. Данные этапы включаются в общую методику превентивной идентификации аномального состояния сетевого элемента на временных рядах его метрик.

Алгоритм превентивной идентификации аномального состояния сетевого элемента на временных рядах его метрик

Исходя из рассмотренных методов анализа временных рядов предложен алгоритм превентивной идентификации аномального состояния сетевого элемента на временных рядах его метрик.

Блок-схема алгоритма состоит из четырех этапов: предварительного этапа, этапа кодирования временных рядов, этапа идентификации состояния сетевого элемента и завершающего этапа (рис. 6).

Предварительный этап

Ввод исходных данных: о составе ИТКС; структуре ее децентрализованной подсистемы мониторинга (матрица тяготений серверов мониторинга к сетевым элементам); наблюдаемых параметрах сетевых элементов; величинах эксплуатационных допусков на параметры сетевых элементов, а также значениях профилактических допусков на них для различных режимов функционирования и условий эксплуатации сетевых элементов [12]; режимах мониторинга (активный, пассивный) и периодичности опроса сервером мониторинга сетевых элементов; значениях ошибок первого и второго рода (а - «ложной тревоги» и р - «пропуск отказа», соответственно); классах (видах) технического состояния сетевого элемента; используемых протоколах сбора измерительной информации и др.

С

¿1*

Начало

У обучения

)

Ввод исходных данных

7

Этап

классификатора

Л

Генерация различной тестовой

нагрузки для разных видов трафика: данные, речь, видео

Задание перечня возможных состояний соединения (канала, маршрута, пути)

_4_? _

Создание эталонных обучающих выоорокдля каждого изсостоя-ний (на основе эталонной нагрузки на соединение). Для каждой тестовой нагрузки формируют множество п последовательных значений задержки У и вектор задержек маршрутизации X

Построение гистограммы обучающей выборки для каждого состояния

Аппроксимация гистограммы на основе £М-алгоритма (определение параметров распределения вероятностей (ПРВ) для каждого состояния)

р. 7_

Инициализация. Набор параметров 0к компонентов сети (к=1,...Д инициализируются допусками дк"

V

Е-шаг. На основе промежуточного вектора параметров модели 0, делается вывод о вероятности принадлежности каждой точки данных к-му компоненту сети пъ

Шаг ожидания (Е-шаг)

число компонентов Ы,

Р(С=к)=1/Ы, их параметры цъ, с/, вектор измеренных значений X.

Як - априорная вероятность того, что С = к (т.е. скрытый параметр смешанной модели, или степень участия распределений в смеси) = После каждой итерации Е-и М- шагов оценивают функцию правдоподобияЦв). При выполнении критерия Ь(в )>£ сходимости, возвращается матрица _ параметров 8=(81,82,^,8^)7'

1гк - априорная вероятность

после наблюдения я, созданного компонентом к

Шагмаксимизации (М-шаг)

Вычисление параметров 8к каждого к-го компонента на основе полученных на £-шаге весов Ик

(+1)

Цк - математическое ожидание к распределению смешанной модели

2(?+1)

О/с - среднеквадратическое отклонение распределения

смешанной модели Результирующее правило обновления для %к идентично для любого типа смешанных моделей, где п - ненормали-1_ зованный вес компонента к Оценку параметров производят на основе метода максимального правдоподобия

Этап классификации вида состояния

1-16

Инициализация: число компонентов сети N, их параметры оИ ,

1—17

P(C = i)=-

N

1-18

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ДЯ|С = к) = Ш№ьак2)

Р(С = Щ) =

PiHCzi: Р(С=i)

дн =

PiH\C = tiy Р(С = i)

!дя|С = о-дс = о

20

Вы rafc Я&уНьЭЯШ мВнито-7 ¿ринга нЯтабло од^ркшад^я

с

Окончание

э

Рис. 5. Обучение классификатора с использованием ЕМ-алгоритма и определение вида состояния

НАУКОЕМКИЕ ТЕХНОЛОГИИ В КОСМИЧЕСКИХ ИССЛЕДОВАНИЯХ ЗЕМЛИ, Т. 13. № 5-2021

РАДИОТЕХНИКА И СВЯЗЬ

С

Начало

г

э

Предварительный этап

Ввод исходных данных ^^

т

— 2

Первоначальное назначение серверам мониторинга сетевых

элементов в соответствии с матрицей тяготения из расчета охвата каждого из них не менее чем 2 серверами мониторинга

— 3-

Определение мощности алфавита кодирования £ временного ряда с разбиением диапазона размаха варьируемых значения метрик на сегменты,

соответствующие видам ТС сетевых элементов, закрепляемые за символами кода

Выбор размера скользящего окна-^-

_5.

Введение запрещенных слогов на наблюдаемом кодовом слове, приводящих к отказу сетевого элемента

1тап кодирования временных рядов

I

Динамическое взятие/снятие серверами мониторинга сетевых элементов на мониторинг в случае изменения структуры сети, ее деградации и восстановления

1—8--

Преобразование потока измерительной информации, поступающей от сетевого элемента на сервер мониторинга во временной ряд

Символьное кодирование по значениям наблюдаемых метрик временного ряда по заранее -установленному алфавиту £ нач I и получение кодового слова

,—11-

Символьное кодирование по тенденциям изменения значений метрик временного ряда по заранее установленному

алфавиту £тенд и получение кодового слова по тенденциям

■12

Еленка энтропии кодового слова методом скользящего окна

13)

Этап идентификации гтт 13.

вида ТС

Сравнение текущего слога вре-менного ряда, наблюдаемого в скользящем окне с запрещенными слогами кодового слова из распределенной БД

Прогноз наступления предотказного ТС сетевого элемента по тенденциям

Прогноз наступления

предотказного ТС сетевого элемента по динамике изменения значений метрик

¡Т17 V

№ -

Отправка значении прогнозов

наступления предотказного ТС на взаимодействующие серверы

мониторинга ИТКС, наблюдающие сетевой элемент

--

Обработка прогнозной информации полученной от взаимодействующих серверов мониторинга, закрепленных за

наблюдаемым сетевым элементом, методом сравнения

^Ид*

Идентификация ТС сет. элемента]

1—20

Завершающий этап

Формирование сигнала об отказе (предотказном ТС) сетевого элемента, или его

нормальном функционировании после процедуры восстановления

— 21-

Выработка решения на подключение резерва или на изменение конфигурации сети

1—22-

Отображение сигнала об отказе

(предотказном ТС) сетевого элемента или его нормальном

функционировании после процедур восстановления на мониторе сервера мониторинга (коллективном табло) подсистемы мониторинга ситуационного центра ведомства

1—23

Актуализация базы данных (базы знаний) подсистемы мониторинга ИТКС

Вывод на печать протокола мониторинга

С

Окончание

3

Рис. 6. Блок-схема алгоритма превентивной идентификации аномального состояния сетевого элемента

на временных рядах его метрик

Первоначальное назначение серверам мониторинга сетевых элементов для наблюдения их ТС (мониторинга) в соответствии с матрицей тяготения серверов к сетевым элементам из расчета охвата каждого сетевого элемента не менее чем двумя серверами мониторинга.

Определение мощности алфавита кодирования временного ряда с разбиением диапазона размаха варьируемых значений

метрики на сегменты, соответствующие классам (видам) технического состояния сетевых элементов, закрепляемые за символами кода. Соотнесение классов (видов) ТС с символами выбранного алфавита Е кодирования временного ряда.

Выбор размера скользящего окна. Для каждого эксплуатационного параметра отдельного сетевого элемента данный выбор индивидуален. Важно ширину скользящего окна иметь

Vol. 13. No. 5-2021, H&ES RESEARCH

RF TECHNOLOGY AND COMMUNICATION

таковой, чтобы не пропустить нарастание аварийной ситуации в различных режимах и условиях эксплуатации сетевого элемента, а также минимизировать ошибки первого рода (а) «ложный отказ» и второго рода (Р) «пропуск отказа». Выбор размера скользящего окна, как правило, осуществляется на этапе испытаний или подконтрольной эксплуатации сетевого элемента.

Введение запрещенных слогов на наблюдаемом кодовом слове-строке, приводящих к отказу. Первоначально состав запрещенных слогов определяется в ходе испытаний и подконтрольной эксплуатации для различных режимов функционирования и условий эксплуатации сетевого оборудования, а в последующем - в соответствии нарабатываемой статистикой на основных этапах жизненного цикла ИТКС. Поэтому этапу испытаний и подконтрольной эксплуатации должно уделяться важное значение.

Запись и хранение запрещенных слогов для каждой контролируемой метрики каждого сетевого элемента в распределенной базе данных (базе знаний - БЗ) ИТКС, их обновление и репликация в соответствии с надежностью функционирования ИТКС и статистикой эксплуатации сетевых элементов на основных этапах их жизненного цикла.

Этап кодирования временных рядов

Динамическое взятие/снятие серверами мониторинга сетевых элементов на мониторинг в случае изменения структуры сети, ее деградации или восстановления, из расчета охвата каждого сетевого элемента не менее чем двумя серверами мониторинга Такое динамическое распределение одновременно должно модифицироваться любым из участвующих серверов для поддержки выполнения условия обес-м твх

печения ^ т > ^ минимального количества серверов мо-

I=1

ниторинга (не менее двух) на одно сетевое устройство.

Преобразование потока ИИ, поступающей от сетевого элемента в сервер мониторинга во временном ряду, а также выбор вида временного ряда и типа средств его визуализации.

Выбор метода обработки временного ряда - символьное кодирование по значениям или символьное кодирование по тенденциям.

Символьное кодирование значении наблюдаемых метрик временного ряда в соответствие с символами ранее установленного алфавита Езнач и получение кодовых слов-строк по значениям.

Символьное кодирование по тенденциям изменения значений метрик временного ряда символами ранее установленного алфавита £теНд. и получение кодовых слов-строк по тенденциям.

Оценка энтропии кодового слова. Изначально позиционированное в начале наблюдаемого кодового слова-строки длиной п, скользящее окно шириной т сдвигается каждый раз на один символ (временной такт) Для каждого его п-т + \ положения распознается слог кодового слова, полученный в скользящем окне. Если в текущей позиции скользящего окна шириной т наблюдается слог, имеющий номер I в принятой нумерации, то значение счетчика с^ увеличивается на единицу. Расчет оценки энтропии слов Ст проводится по выражению (1).

Этап идентификации состояния сетевого элемента

Сравнение текущего слога временного ряда, наблюдаемого в скользящем окне с запрещенными слогами кодового слова, записанными в распределенной базе данных (базе знаний), предполагает поиск (фильтрацию) запрещенных слогов в наблюдаемом кодовом слове-строке временного ряда.

Выбор метода прогноза наступления предотказного ТС сетевого элемента.

Прогноз наступления предотказного состояния сетевого элемента по тенденциям их изменения (выявление опасных тенденций). В случае идентификации опасных трендов развития аварии необходимо увеличить частоту опроса сетевого элемента с целью не допустить пропуска отказа и минимизировать ошибку второго рода р.

В данном алгоритме процедура увеличения скважности опроса сетевого элемента серверов мониторинга при выявлении предотказного технического состояния не представлена, решается программно отдельным блоком алгоритма.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Прогноз наступления предотказного состояния сетевого элемента по динамике изменения значений метрик в наблюдаемых слогах ключевых слов анализируемого ряда временного ряда. В случае идентификации предотказного состояния сетевого элемента доступная измерительная информация (величины значений наблюдаемой метрики) сверяется не только с эксплуатационным допуском на параметр, но и с профилактическим допуском, зависящим от конкретного режима функционирования и условий эксплуатации сетевого элемента.

Отправка значений прогнозов наступления предотказного состояния на серверы мониторинга, взаимодействующие в ИТКС и наблюдающие сетевой элемент. При этом если на сервере мониторинга, спрогнозировавшим предотказное состояние доступна измерительная информация инструментального контроля, то на взаимодействующие серверы мониторинга передается только прогнозное значение в виде символьной записи (типа {+ + +}, или {ABE}).

Обработка прогнозной информации, полученной на шагах прогноза и поступающей от взаимодействующих серверов мониторинга ИТКС, закрепленных за наблюдаемым сетевым элементом, методом сравнения (с использованием мажоритарного принципа и пр.), а также сопоставления действующих режимов его функционирования и условий эксплуатации (выявление причин наступления предотказного состояния).

Идентификация технического состояния сетевого элемента по конечному символу текущего слога наблюдаемого кодового слова временного ряда.

Завершающий этап

Формирование сигнала об отказе, предотказном ТС или иной аномалии сетевого элемента, или его нормальном функционировании после процедур восстановления (устранения отказа).

Выработка решения на подключение резерва или на изменение конфигурации сети в связи с отказом/восстановлением сетевого элемента. Для повышения оперативности данный шаг выполняется параллельно с предыдущим.

Отображение сигнала об отказе (предотказном ТС) сетевого элемента или его нормальном функционировании после процедур восстановления (устранения отказа) на мониторе сер-

НАУКОЕМКИЕ ТЕХНОЛОГИИ В КОСМИЧЕСКИХ ИССЛЕДОВАНИЯХ ЗЕМЛИ, Т. 13. № 5-2021

РАДИОТЕХНИКА И СВЯЗЬ

вера мониторинга (коллективном табло) подсистемы мониторинга.

Актуализация базы данных (базы знаний) о ТС сетевых элементов ИТКС, обновление структуры сети в связи с последними изменениями (отказом, резервирование, восстановлением), динамическое перезакрепление серверов мониторинга за сетевыми элементами в связи с динамикой изменения ТС ИТКС (изменение матрицы тяготения серверов мониторинга и сетевых элементов), уточнение исходных данных, обновление и репликация распределенной БД ИТКС.

Вывод на печать протоколов мониторинга.

Модельный пример

Описанный в методике подход с классификацией состояния элементов телекоммуникационной сети неплохо работает в случае возможности выделения классов поведений. Это было продемонстрировано для односторонней задержки [20], когда компонента, связанная с маршрутизацией (ожидание в очередях), включается в общее выражение задержки лишь при средних и высоких нагрузках. В меньшей степени этот метод может быть использован для оценки состояния загрузки вычислительных ресурсов, в частности процессора. Хотя и здесь имеет место задержка, связанная с переключением контекста вычисления, но она более связана с организацией вычислительного процесса, чем с режимом нагрузки. В этом случае требуется предварительный этап уточнения числа состояний и соответствующих им распределений. Это было продемонстрировано в ходе выполненного эксперимента, результаты которого приведены на рисунках 7и8.

Г \

_4 / \

р

Л Л

Рис. 7. Аппроксимация гистограммы загрузки процессора двумя нормальными распределениями

Рис. 8. Аппроксимация гистограммы загрузки процессора тремя нормальными распределениями

Проведя анализ аппроксимации гистограмм загрузки процессора несколькими распределениями выбранных параметров, можно сделать вывод, что наиболее информативна аппроксимация гистограмм наблюдаемых параметров (метрик) сетевых устройств, с двумя нормальными распределениями.

Эксперимент проводился на гистограммах статистики недельной загрузки процессора сервера виртуализации двумя и тремя нормальными распределениями по смешанной гауссовской модели £М-алгоритмом. Гистограммы были получены на том же наборе данных, что было использовано для установления оптимальной величины окна для расчета энтропии сдвигов.

Как следует из рисунков, предобработка данных энтропией сдвигов позволяет «разнести» распределения, моделирующие состояния, что обеспечивает более точную их классификацию. При этом хорошо видно, что две компоненты обеспечивают более точную классификацию технического состояния сетевого устройства (рис. 7), нежели три (рис. 8). Эксперимент проводился на параметрах загрузки процессора (тактах).

Заключение

В работе предложен подход к формированию методики прогнозирования аномальных ситуаций по результатам мониторинга функционального состояния сетевых элементов ИТКС ОП. При этом превентивная идентификация аномального состояния сетевого элемента осуществляется путем выявления «запрещенных» кодовых комбинаций при наблюдении временных рядов, обработанных заимствованными из биоинформатики методами символической динамики, используемыми ранее в процессе анализа сложных нуклеотидных геномных последовательностей, а также введение особого режима мониторинга, когда при идентификации предотказного ТС скважность опроса сервером мониторинга сетевого элемента значительно увеличивается с целью своевременного принятия превентивных управляющих воздействий на сетевую инфраструктуру для недопущения пропуска отказа сетевого элемента или наступления аварии.

В основу предложенного алгоритма заложен метод символического представления временных рядов, на базе которого дана оценка энтропии кодовых слов, описывающих временной ряд наблюдаемой метрики функционирующего сетевого элемента и разработан алгоритм методики идентификации аномальной ситуации на временном ряду его параметров, состоящий из четырех этапов: предварительного этапа, этапа кодирования временных рядов, этапа идентификации вида технического состояния сетевого элемента и завершающего этапа. Данный алгоритм позволит в последующем сформировать порядок функционирования сервера мониторинга для идентификации аномалий в работе ИТКС ОП.

Литература

1. Легкое К. Е., Буренин А. Н. Модели и методы оперативного мониторинга информационных подсистем перспективных автоматизированных систем управления II Информация и космос. 2016. № 4. С. 46-60.

Vol. 13. No. 5-2021, H&ES RESEARCH

RF TECHNOLOGY AND COMMUNICATION

2. Легкое К. Е. Модели и методы мониторинга параметров, характеризующих состояние инфокоммуникационной системы специального назначения // T-Comm: Телекоммуникации и транспорт. 2016. Т. 10. № 1.С. 11-18.

3. Буренин А. Н., Легкое К. Е., Емельянов А. В. Основные положения системного анализа и подход к построению модели информационной подсистемы инфокоммуникационной подсистемы специального назначения // Системы синхронизации, формирования и обработки сигналов. 2016. Т. 7. № 3. С. 17-23.

А. Игнатов H.A. Прогнозирование временных рядов с регулярными циклическими компонентами с помощью модели периодически коррелированных случайных процессов // Научные труды: Институт народнохозяйственного прогнозирования РАН, 2011. С. 461-477.

5. СухопаровМ.Е., ЛебедевИ.С. Модели анализа функционального состояния элементов устройств сетей и телекоммуника-ций«Индустрии4.0». СПб.: Политех-Пресс,2020. 121 с.

6. Васильев И. В., Забродин О.В., Яшин А. И. Автоматизированный программный комплекс оценки качества обслуживания в телекоммуникационной сети // Техника средств связи. 2018. № 3 (143). С. 56-61.

7. Витяев Е. Е., Дергилев А. И., Чадаева И. В., Васикин Ю. Ю., СпщинаА.М., Кулакова Е. В., Вишневский О. В., ОрловЮ. Л. Поиск регулярных контекстных сигналов в геномной ДНК / Сб. научи. трудов конференции «Информатика-2016» (Москва, 24-29 апреля 2016 г.). М.: Национальный исследовательский ядерный университет "МИФИ", 2016. С. 52-62.

8. Математические методы для анализа последовательностей ДНК. М.: Мир, 1999. 349 с.

9. УльяновМ. В., СметанинЮ.Г. Об одном характеристическом функционале слов над конечным алфавитом // Информационные технологии. 2017. Т.23. № 5. С.333-341.

10. СедякинИ., УльяновМ. В. Эффективный по времени алгоритм расчета обобщенной энтропии двумерных слов методом скользящего окна // Современные информационные технологии и ИТ-образование. 2018. Т. 14. № 3. С. 560-566.

11. ПетрушинВ. Н., УльяновМ. В. Бикритериальный метод построения гистограмм II Информационные технологии и вычислительные системы. 2012. № 4. С. 22-31.

12. Абрамов О. В. Планирование профилактических коррекций параметров технических устройств и систем II Информатика и системы управления. 2017. № 3 (53). С. 55-66.

13. ГрабустП. Способы оценок сходства временных рядов II Научные труды Международной НТК «Теория вероятностей, случайные процессы, математическая статистика и приложения» (Минск, БГУ, 15-19 сентября 2008 г.). Минск: Белорусский государственный университет, 2008. С. 23-24.

14. СметанинЮ.Г., УльяновМ. В., ПестоваА.С. Энтропийный подход к построению меры символьного разнообразия и его применение к кластеризации геномов растений II Математическая биологияи биоинформатика. 2016. Т. 11. № 1. С. 114-126.

15. LindD., Marcus В. An introduction to symbolic dynamics and coding. Cambridge, UK: Cambridge University Press, 1995. 495 p.

16 ВинограденкоА.М. Методология интеллектуального контроля технического состояния автоматизированной системы связи специального назначения. Монография. - СПб.: Наукоемкие технологии, 2020,- 180с.

17. ПодиноескийВ.В. Идеи и методы теории важности критериев в многокритериальных задачах принятия решений. М.: Наука, 2019. 103 с.

18. HolleczekT. Statistical Analysis of IP Performance Metrics in International Research and Educational Networks. Nuremberg. 2008. Pp. 105-114.

19. КоролевВ.Ю., Шевцова ^.ЛБайесовские методы анализа больших данных. М.: ООО «МАКС Пресс», 2020. 140 с.

Ю.АллакинВ. В. Анализ методов оценки временных рядов сервером мониторинга информационно-телекоммуникационной сети общего пользования//Техника средств связи. 2021. №2 (154). С. 60-80.

И.АллакинВ.В., БудкоН.П., ВасильевН. В. Общие принципы функционирования и требования к построению структур перспективных систем мониторинга распределенных информационно-телекоммуникационных сетей II Системы управления, связи и безопасности. 2021. № 3. С. 125-227. DOI: 10.24412/2410-9916-2021-4-125-227.

THE METHOD OF PREVENTIVE IDENTIFICATION OF THE STATE OF MONITORING OBJECTS BASED ON THE SYMBOLIC REPRESENTATION OF TIME SERIES OF THEIR METRICS

VLADIMIR V. ALLAKIN KEYWORDS: monitoring server, identification of technical condition,

St. Petersburg, Russia, [email protected] special monitoring mode, time series, preventive identification.

ABSTRAd

Introduction: based on the analysis of methods for estimating time series of observed parameters of devices of public information and telecommunications networks, to develop a method for preventive identification of the state of monitoring objects using a symbolic representation of time series of their metrics. Purpose: of the study is to determine the generalized universal characteristics of the time series, according to which it is possible to evaluate the variety of observed values of metrics related to a certain area of the state of the monitoring object (the class of its technical condition). Results: preventive identification of the abnormal state of the network element is carried out by identifying "forbidden" code syllables on the code word describing the observed time series of the metric. This approach to time series processing is borrowed from symbolic dynamics, which is used in bioinformatics when analyzing complex nucleotide genomic sequences. As a generalized universal characteristic of the time series, the entropy of code words is used, describing the time series encoded by the method of symbolic representation of the data of the observed metrics. An algorithm of the method

of preventive identification of an abnormal situation on a time series of its parameters is developed, consisting of four stages: at the first stage, the time series is symbolically encoded according to possible parameter values; at the second, the entropy of the code word describing the time series of the observed metric is estimated; at the third, the classifier of the states of the measurement object is trained based on the entropy of shifts; at the fourth stage, the state is classified according to a test sample of measurements, in which the measured characteristic is described by its law of probability distribution of shifts. Practical relevance: when an abnormal functional state of a network element is detected, a transition to a special monitoring mode is carried out, when the frequency of polling by the monitoring server of the network element is significantly increased in order to timely take preventive control actions on the network infrastructure and prevent failure (the occurrence of an accident). Discussion: the methodology will allow to form the order of operation of the monitoring server in the future to identify the functional state of the network element and the public information and telecommunications network as a whole.

НАУКОЕМКИЕ ТЕХНОЛОГИИ В КОСМИЧЕСКИХ ИССЛЕДОВАНИЯХ ЗЕМЛИ, Т. 13. № 5-2021

РАДИОТЕХНИКА И СВЯЗЬ

REFERENCES

1. Legkov K. E., Burenin A. N. (2016). Models and methods for monitoring of information subsystems of prospective automated control systems. Information and Space. No. 4. Pp.46-60. (in Russian).

2. Legkov K. E. (2016). Models and methods of monitoring parameters characterizing the state of the infocommunication systems a special purpose. T-Comm. Vol. 10. No.1, pp. 11-18. (in Russian).

3. Burenin A. N., Legkov K. E., Emelyanov A. V. (2016). The main provisions of system analysis and an approach to building a model of an information subsystem of a special purpose infocommunication subsystem. Synchronization systems, signal generation and processing. Vol. 7. No. 3. Pp. 17-23. (in Russian).

4. Ignatov N. A. (2011). Prognozirovanie vremennyh ryadov s reg-ulyarnymi ciklicheskimi komponentami s pomoshch'yu modeli peri-odicheski korrelirovannyh sluchajnyh processov [Prediction of time series with regular cyclical components using the model of a periodically correlated random processes]. Nauchnye trudy: Institut narodno-hozyajstvennogo prognozirovaniya RAN [Scientific works: Institute of National Economic Forecasting of the Russian Academy of Sciences]. Pp. 461-477. (In Russian)

5. Suhoparov M. E., Lebedev I. S. (2020). Modeli analiza funkcional'nogo sostoyaniya elementov ustrojstv setej i telekommu-nikacij "Industrii 4.0" [Model analysis of the functional state of the elements of the devices, networks and telecommunications Industry 4.0]. St. Petersburg: Polytechnic Press. 121 p. (In Russian)

6. Vasiliev N. V., Zabrodin O. V., Yashin A. I. (2018). Avtomatizirovannyj programmnyj kompleks ocenki kachestva obsluzhivaniya v telekommunikacionnoj seti [Automated software package for assessing the quality of service in a telecommunications network]. Means of Communication Equipment. No. 3 (143). pp. 5661. (In Russian)

7. Vityaev E. E., Dergilev A. I., Chadaeva I. V., Vasikin Yu. Yu.. Spitsina A. M., Kulakova E. V., Vishnevsky O. V., Orlov Yu. L. (2016). Poisk regulyarny'kh kontekstny'kh signalov v genomnoj DNK [Search for regular contextual signals in genomic DNA]. Collection of scientific proceedings of the conference "Informatics-2016" (Moscow, April 2429, 2016). Moscow. Naczional'ny'j issledovatel'skij yaderny'j univer-sitet "MIFI" [National Research Nuclear University "MEPhI"]. Pp. 5262. (In Russian)

8. Matematicheskie metody dlya analiza posledovatel'nostej DNK [Mathematical methods for analyzing DNA sequences]. Moscow. Mir Publ., 1999. 349 p. (In Russian)

9. Ulyanov M. V., Smetanin Yu. G. (2017). Ob odnom kharakteris-ticheskom funkczionale slov nad konechnym alfavitom [On one characteristic functional of words over a finite alphabet]. Information technologies. Vol. 23. No. 5. Pp. 333-341. (In Russian)

10. Sidyakin I., Ulyanov M. V. (2018). E'ffektivny'j po vremeni algo-ritm rascheta obobshhennoj e'ntropii dvumerny'kh slov metodom skol'zyashhego okna [Time-efficient algorithm for calculating the generalized entropy of two-dimensional words by the sliding window method]. Sovremenny'e informaczionny'e tekhnologiiiIT-obrazovanie [Modern information technologies and IT education]. Vol. 14. No. 3. Pp. 560-566. (In Russian)

11. Petrushin V. N., Ulyanov M. V. (2012). Bikriterial'nyj metod postroeniya gistogramm [Bicriteria method of constructing histograms]. Informatsionnye tekhnologii i vychislitelnye sistemy. No. 4. Pp. 22-31. (In Russian)

12. Abramov O. V. (2017). Planirovanie profilakticheskikh korrekcz-ij parametrov tekhnicheskikh ustrojstv i sistem [Planning of preventive corrections of parameters of technical devices and systems]. Informatics and control systems. No. 3 (53). Pp. 55-66.

13. Grobust P. (2008). Sposoby ocenok skhodstva vremennyh ryadov [Methods of evaluations of the similarity of time series]. Nauchnye trudy Mezhdunarodnoj NTK "Teoriya veroyatnostej, slucha-jnye processy, matematicheskaya statistika i prilozheniya" [Proceedings of the International NTK "Theory of probability, stochastic processes, mathematical statistics and applications", Minsk. BGU, 15-19 September 2008]. Minsk. Belarusian state University. Pp. 23-24. (In Russian)

14. Smetanin Yu. G., Ulyanov M. V., Pestova A. S. (2016). E'ntropi-jny j podkhod k postroeniyu mery simvol'nogo raznoobraziya i ego primenenie k klasterizaczii genomov rastenij [Entropic approach to constructing a measure of symbolic diversity and its application to clustering of plant genomes]. Mathematical biology and bioinformat-ics. Vol. 11. No. 1. Pp. 114-126. (In Russian)

15. Lind D., Marcus B. (1995). An introduction to symbolic dynamics and coding. Cambridge, UK: Cambridge University Press. 495 p.

16. Vinogradenko A. M. (2020). Metodologiya intellektual'nogo kontrolya tekhnicheskogo sostoyaniya avtomatizirovannoj sistemy svyazi special'nogo naznacheniya [Methodology of intelligent control of the technical condition of an automated special-purpose communication system]. St. Petersburg: Naukoemkie tekhnologii Publ., 180 p. (In Russian)

17. Podinovsky V. V. (2019). Idei i metody teorii vazhnosti kriteriev v mnogokriterial'nyh zadachah prinyatiya reshenij [Ideas and methods of the theory of the importance of criteria in multi-criteria decision-making problems]. Moscow: Nauka Publ. 103 p. (In Russian)

18. Holleczek T. (2008). Statistical Analysis of IP Performance Metrics in International Research and Educational Networks. Nuremberg. Pp. 105-114.

19. Korolev V. Yu. (2007). EM-algoritm, ego modifikacii i ih prime-nenie k zadache razdeleniya smesej veroyatnostnyh raspredelenij [EM-algorithm, its modifications and their application to the problem of separation of mixtures of probability distributions]. Moscow. IPIRAN Publ. 94 p. (in Rus).

20. Allakin V. V. (2021). Analysis of methods for estimating time series by the monitoring server of a public information and telecommunications network. Means of Communication Equipment. No. 2 (154). Pp. 62-82. (In Russian)

21. Allakin V. V., Budko N. P., Vasiliev N. V. (2021). A general approach to the construction of advanced monitoring systems for distributed information and telecommunications networks. Systems of Control, Communication and Security. No. 3. Pp. 125-227. DOI: 10.24412/2410-9916-2021-4-125-227. (In Russian)

INFORMATION ABOUT AUTHOR:

Vladimir V. Allakin, postgraduate student, Federal State Budgetary Educational Institution of Higher Education "Admiral S. O. Makarov State University of the Sea and River Fleet", St. Petersburg, Russia, [email protected]

For citation: Allakin V.V. The method of preventive identification of the state of monitoring objects based on the symbolic representation of time series of their metrics. H&ESResearch. 2021. Vol. 13. No. 5. Pp. 13-28. doi: 10.36724/2409-5419-2021-13-5-13-28 (In Rus)

i Надоели баннеры? Вы всегда можете отключить рекламу.