Постановка задачи на превентивную идентификацию вида технического состояния элементов сетевых инфраструктур
Аллакин Владимир Васильевич
соискатель ученой степени кандидата технических наук, независимый специалист, Ленинградская обл., Всеволожский район, пос. Бугры, Россия, [email protected]
АННОТАЦИЯ_
Введение: работа посвящена обоснованию и математическому представлению задачи превентивной идентификации вида технического состояния элементов информационно-телекоммуникационной сети общего пользования. Постановка задачи: на основе анализа научно-методического аппарата оценки временных рядов наблюдаемых метрик параметров сетевых элементов и особенностей современных информационно-телекоммуникационных систем и сетей осуществить постановку задачи на разработку методики превентивной идентификации состояния сетевых устройств с целью повышения оперативности процедуры мониторинга, обеспечения достоверности ее результатов и точности методами предиктивной (предсказательной) аналитики. Методы: методы символьного представления временных рядов., методы структурного анализа, методы предикативной аналитики, методы теории классификации, методы кластерного анализа. Результаты: осуществлена вербальная и математическая постановка задачи на исследование, а также общая задача декомпозирована на частные задачи: моделирование процесса идентификации технического состояния устройств информационно-телекоммуникационных сетей подсистемой сетевого мониторинга; разработка методики превентивной идентификации состояния объектов мониторинга на основе символьного представления временных рядов их метрик; формирование научно-технических предложений по реализации методики превентивной идентификации технического состояния устройств информационно-телекоммуникационных сетей общего пользования. Практическая значимость: анализ методов оценки временных рядов позволил выработать подход к построению алгоритма функционирования сервера мониторинга для идентификации аномалий в работе информационно-телекоммуникационной сети общего пользования. Обсуждение: предложенная процедура превентивной идентификации аномального состояния сетевого элемента путем выявления «запрещенных» кодовых комбинаций при наблюдении временных рядов, а также введение особого режима мониторинга позволяет своевременно обнаружить и не допустить пропуска отказа сетевого элемента или наступления аварии.
КЛЮЧЕВЫЕ СЛОВА: анализ временных рядов; техническое состояние; превентивная идентификация вида состояния; измерительная информация; особый режим мониторинга.
Введение
Одним из способов повышения эффективности функционирования гетерогенных межведомственных географически распределенных информационно-телекоммуникационных сетей (ИТКС) общего пользования (ОП) [1] является возможность проведения мероприятий по управлению связью на основе актуального знания о техническом состоянии (ТС) сетевых элементов (устройств, каналов, маршрутов, подсетей) в реальном масштабе времени для своевременной переконфигурации сети с целью недопущения ее аварии (отказа).
Благодаря предиктивной аналитике [2] можно оценить состояние сетевого оборудования в процессе его функционирования под нагрузкой (при обслуживании различных видов трафика) дистанционно, без понижения его степени готовности (для проведения инструментальных видов контроля в ходе технического обслуживания), а также без привлечения дополнительных ресурсов контрольно-диагностического оборудования и обслуживающего персонала.
Для прогнозирования выхода из строя сетевого оборудования и составления оптимального графика его загрузки первоначально рассматривались статистические подходы. Однако использование статистических методов теории надежности по выходу из строя оборудования обеспечивает низкую точность [3]. Повышение точности возможно если знать характер функции распределения возникновения аварийных ситуаций и причину отказов, что требует обработки больших объемов статистической информации (работа с так называемыми большими данными - Big Data). Сегодня наиболее часто применяются методы регрессии для прогнозирования значений критически важных параметров сетевого оборудования, а также методы машинного обучения при решении задач классификации и прогнозирования времени возникновения отказа (аварии) на основе изменения значения параметров и вероятностно-временных характеристик (ВВХ) информационного обмена, а также данных статистики об отказах.
Определение объема ретроспективных данных, необходимых для обучения моделей классификации видов технического состояния сетевых устройств становится отдельной задачей и зависит от динамики изменения условий эксплуатации и состояния самого оборудования. При этом число статистически собранных значений (n) по каждой метрике параметров и ВВХ подконтрольного сетевого оборудования становится мерой алгоритма построения моделей, выбор значений которых необходимо осуществлять на основе максимизации значения их качества.
Нередко параметрами, которые подвергают мониторингу, выступают сигналы, поступающие с датчиков (сенсоров), размещённых программно в сетевом оборудовании в виде интеллектуальных агентов (ИА) [4]. Как правило для наблюдения за состоянием технически сложного сетевого устройства одного датчика оказывается недостаточно. Поэтому метрики значений контролируемых параметров, получаемые в различные интервалы времени в виде временных рядов, и поступающих с разных датчиков (от разных ИА), дополняют друг друга.
В связи с этим необходимо объединение данных с метриками наблюдаемых параметров, полученных с одного сетевого устройства, но разными серверами мониторинга. Для чего необходимо разработать метод определения (идентификации) видов ТС по результатам аппроксимации результатов анализа временных рядов основными законами распределения, а задачу предсказания аварии (отказа) рассматривать, как задачу классификации, в которой должна использоваться вероятностная модель идентификации основных видов ТС сетевых устройств («работоспособное», «предотказное», «неработоспособное», или «норма» (Normal, N); «критическое» (Critical, C); «авария» (Fault, F)).
Правила разграничения наблюдаемых процессов контроля сетевого оборудования
Объединение результатов мониторинга сетевого устройства, полученных от нескольких серверов мониторинга, позволяет учитывать не только разные аспекты работы оборудования сетевой инфраструктуры, но и, как известно из практики машинного обучения, ведет к повышению качества идентификации [5].
Тогда правило разграничения (распределения) наблюдаемых системой мониторинга процессов, в соответствии с законами распределения, характеризуется количеством зон мониторинга, сложностью и другими особенностями рассматриваемых сетевых элементов, и определяемых, например:
• для стационарного характера потока измерительной информации (ИИ) - нормальным (гауссовским) законом распределения, гамма-распределением, равномерным распределением;
• для нестационарного характера потока ИИ - экспоненциальным, Вейбула, Парето, пуассоновским законами распределения и биномиальным (дискретным) распределением.
Таким образом, процесс обработки ИИ основан на работе с n числом распределений, равным или меньше числа зон мониторинга, а, соответственно, и числа подконтрольного сетевого оборудования. В связи с этим, распределение квазистационарных наблюдаемых процессов на выделенных временных «окнах мониторинга», осуществляется как распределение распределений в рамках отдельного интервала времени при контроле сетевого оборудования на k уровнях разукрупнения ИТКС, характеризуемые на начальном, среднем и окончательном интервале этого временного окна.
Данные значения будут меняться их сдвигом времени наблюдения по мере появления новых значений. Такое преобразование увеличивает размерность процедуры анализа временного ряда до n, что приводит к увеличению требований к вычислительным ресурсам.
Другим параметром алгоритма идентификации становиться величина сдвига m (m > 1) окна наблюдения. Задача сводиться к выбору метода классификации для модели каждого из заданных видов ТС разнотипного сетевого оборудования.
Для обучения модели идентификации видов ТС необходимо формирование набора данных (набора статистики), что можно сделать если разбить имеющиеся в наличие данные на группы, соответствующие основным видам ТС, например: работоспособное (норма), пре-дотказное (критическое) и неработоспособное (авария) состояния. Эти наборы дополнительно необходимо нарезать частями по n значений. Для оптимизации работы модели наборы данных, соответствующих нормальному и аварийному состоянию, должны быть симметричны (содержать одинаковое количество наборов данных), поскольку при работе с несимметричными выборками без использования специальных алгоритмов ухудшается качество работы классификатора.
Учет скорости развития аварийной ситуации в наблюдаемых зонах мониторинга должно влиять на скважность опроса и приоритетность сетевого оборудования [6]. Чем выше скорость изменения метрики наблюдаемого параметра, тем выше должен быть приоритет обслуживания сетевого устройства, а также необходимо повышение частоты опроса, пропорциональное изменяющейся динамике отклоняющегося от нормы значения метрики наблюдаемого параметра.
Применение методов идентификации к результатам анализа временных рядов, снимаемым с разных датчиков (ИА) обеспечивает разные, существенно отличающиеся значения площади под ROC-кривой для одних методов (receiver operating characteristic - рабочая характеристика, или график, позволяющий оценить качество бинарной классификации, известный как кривая ошибок) [7]. Это вызвано тем, что могут возникать разные аварийные ситуации, лучше улавливаемые разными датчиками. Поэтому можно ожидать, что построение композиции моделей, работающих с данными датчиков, получаемых от разных серверов мониторинга (т. н. «контроль в окружении» - концепция «Индустрия 4,0») [8] обеспечит
улучшение работы идентификатора и в общем повысит стабильность работы модели. Для объединения моделей можно складывать вероятности наступления событий по формуле для сложения вероятностей совместных событий. Тогда решение задачи идентификации аварийного режима работы сводиться к решению задачи максимизации значения
J = а^шах ^ Г (Мв),
п,ш,к В
где D - множество оцениваемых характеристик (датчиков), F - метрика, М - метод классификации из множества рассматриваемых методов.
Несмотря на то, что к каждому случаю возникновения аварийных режимов работы на ИТКС необходимо подходить индивидуально (на каждом сетевом устройстве) - чем точнее будет происходить идентификация аномалии [9], тем раньше во времени возможно определить возникновение аварии и, тем самым, система поддержки принятия решения (СППР) или автоматизированная система управления связью (АСУС) получит больше времени для переконфигурации сети (включение резерва или перемаршрутизация).
Таким образом для каждого сетевого устройства будет сопоставлена своя функция плотности вероятности той или иной метрики, которая по мере появления новых данных (новых режимов работы, нагрузок, видов трафика) будет уточняться и совместно с переобучением (дообучением) алгоритма идентификации аварийной ситуации на ИТКС при появлении новых данных реализовывать принцип адаптивности модели. Представленный подход к процедуре мониторинга делает актуальным разработку методики превентивной идентификации вида ТС сетевых устройств на основе анализа временных рядов их метрик.
Степень разработанности темы
Процесс функционирования подсистемы мониторинга ТС сетевых элементов как подсистемы территориально распределенной ИТКС ОП [1] с учетом обработки больших данных в межведомственных единых информационно-управляющих пространствах, предполагает использование подходов и методов мониторинга (контроля), способствующих повышению оперативности СППР, а также обладающих функциями обучения и адаптации в динамично меняющейся среде под воздействием внешних (ошибки персонала, условия эксплуатации, воздействия естественного и искусственного характера и пр.) и внутренних (производственные дефекты, программные сбои, перегруженные режимы работы и пр.) дестабилизирующий факторов (ДФ), что позволит достичь своевременной идентификации вида ТС объекта контроля (ОК) в аварийных ситуациях и эффективного управления связью в создавшихся условиях.
Анализ развития интеллектуальных методов в различных смежных областях науки и техники показывает отличия данных подходов от распространенных в настоящее время адаптивных, за счет возможности накапливания и использования знаний, данных и правил в процессе эксплуатации объектов наблюдения. Для исследуемых подсистем мониторинга ТС сетевых устройств ИТКС интеллектуальный подход потенциально характеризуются большей оперативностью, критичностью к аварийным ситуациям, обеспечиваемой классификационной схемой, возможностью аккумулирования и обновления совокупности знаний о наблюдаемом состоянии ОК путем использования правил применения различных методов оценивания их ТС, а также отсутствием ограничений (например, по масштабу мониторинга), свойственных адаптивной системе. На базе этого показано, что модели и методы интеллектуального мониторинга, которые учитывали бы вышеописанные свойства современных и перспективных межведомственных ИТКС, в настоящее время отсутствуют. В связи с этим, возникает необходимость разработки новых интеллектуальных подходов, моделей и методов идентификации ТС сетевых устройств, позволяющих компенсировать «временной раз-
рыв», техническую и технологическую отсталость современного состояния средств мониторинга от эволюционирующих ИТКС.
В существующих сегодня научных направлениях по развитию теории контроля ТС сложных динамических систем, а именно научные школы О. В. Абрамова, Е. М. Антонюка, Л. Г. Евланова, Г. И. Козырева, В. Е. Кузнецова, В. И. Курносова, С. П. Ксенза, А. М. Лихачёва, А. В. Назарова, Ф. Л. Черноусько, В. В. Федоренко и других видных отечественных и зарубежных ученых, ведется поиск решения научных задач как в теории контроля, так и на стыке других теорий, что однако не обеспечивает прироста эффективности на межведомственной, территориально распределенной ИТКС с учетом стремительной эволюции информационно-телекоммуникационных технологий и сетевого оборудования новых поколений (5G, технологии «Индустрия-4.0» и др.) из-за динамичности изменения их структур и других особенностей.
Аналогичные подходы в других областях знаний не учитывают особенности развивающихся систем связи в новых условиях функционирования сетевого оборудования, однако могут быть применимы к решению задачи контроля в этих условиях и способствовать взаимоувязыванию физической природы процесса мониторинга на межведомственных ИТКС, при соответствующем применении известных математических аппаратов (теорий динамических систем, случайных процессов, контроля, классификации и др.) с обеспечением требований к системам мониторинга по оперативности, достоверности и точности.
С точки зрения решения оптимизационных задач, задача мониторинга ТС территориально распределенных сетевых инфраструктур в гетерогенном (разнородном по принципам построения, технологиям доставки и/или защиты информации, и/или программно -аппаратным средствам [1]), межведомственном пространстве может быть отнесена к классу задач оптимизации сложных систем. Спектр научных работ в этой области достаточно обширен, в частности данными вопросами занимались: Р. Беллман, Е. И. Варакин, Ф. П. Васильев, Г. Зойтендейк, В. Н. Калинин, И. В. Кузьмин, Л. С. Понтрягин, Б. А. Резников и другие. Однако анализ научно-методического аппарата (НМА), изложенных в их работах и анализ особенностей процессов функционирования систем контроля в при воздействии ДФ на ОК, показывает, что приведенные в них модели и методы не в полной мере пригодны для решения задачи оптимизации подсистем мониторинга ТС сетевых элементов межведомственных ИТКС ОП.
Известные работы по адаптивным системам контроля [10] ТС средств связи, функционирующих в условиях воздействия ДФ, характеризуются с точки зрения относительно большого временного интервала, в рамках которого система идентифицирует и осуществляет управляющее воздействие (изменяет параметры наблюдаемого процесса), что во время стремительных процессов развития информационных технологий не соответствует требованиям по оперативности перспективных систем контроля (мониторинга) реального времени.
Существующие в настоящее время технологии распределенного искусственного интеллекта (РИИ) [11] позволяют расширить круг решаемых задач, найти альтернативные подходы в других областях науки, снизить некоторые ограничения в процессах мониторинга ТС межведомственных ИТКС. Исследования в области теории искусственного интеллекта связаны с работами А. Ньюэлла, Г. Саймона, Дж. Шоу. В дальнейшем эти работы развивались многими российскими и зарубежными исследователями, такими как М. М. Бонгард, М. А. Гаврилов, Л. А. Демидова, В. П. Корячко, И. В. Котенко, В. И. Мирошников, Д. А. Поспелов, С. А. Прохоров, А. Н. Пылькин, И. Б. Саенко, М. Л. Целин, А. И. Яшин и другие. На сегодняшнем этапе развития науки применение интеллектуального подхода, предполагающего машинное обучение, технологии создания экспертных систем, представления знаний, интеллектуального анализа данных, технологии поиска и распознавания образов, мультиа-гентных систем и др., позволит значительно расширить возможности существующих систем мониторинга, достичь результатов, которые раньше считались невозможными [10,12-14].
В связи с вышеизложенным, целью исследования является повышение эффективности процедуры мониторинга функционального состояния сетевых элементов за счет оперативности (превентивной идентификации перехода из работоспособного в предотказное и неработоспособное состояния методами предиктивной аналитики), направленных на недопущение аварийной ситуации, а также ее достоверности (снижения степени неопределенности при идентификации их вида ТС, оценивая распределение энтропии значений сетевых метрик основными законами распределения) и точности, при минимизации ошибок первого и второго рода.
При такой целевой установке к объекту исследования можно отнести подсистему сетевого мониторинга с ее ключевым элементом - сервером мониторинга, а под объектом мониторинга понимать сетевые устройства, функционирующие в ИТКС ОП и характеризующиеся работоспособным, неработоспособным и предотказным техническими состояниями.
Предмет исследования - методы анализа временных рядов значений метрик наблюдаемых параметров сетевых устройств, а применительно к объекту мониторинга - научно-методический аппарат выявления нестационарных состояний объектов мониторинга,
Тогда научная задача заключается в разработке метода превентивной идентификации состояния сетевых устройств с целью повышения оперативности процедуры мониторинга, обеспечения достоверности ее результатов и точности методами предиктивной (предсказа-тельной)аналитики.
Постановка задачи на разработку методики превентивной идентификации технического состояния сетевых устройств
В настоящее время высокий динамизм изменения сетевых инфраструктур, вызванный пульсирующим характером трафика, существенным отличием режимов работы и условий функционирования элементов на глобально распределенных ИТКС ОП, включенных в единое информационное пространство России, а также воздействием на них случайных и преднамеренных, внешних и внутренних ДФ, в том числе воздействующих и из киберпростран-ства, диктует ужесточение требований по поддержанию ИТКС и его сетевых устройств в работоспособном состоянии на всех этапах эксплуатации. Это вызвано прежде всего тем, что информационно-телекоммуникационные сети справедливо относят к системам с высокой степенью доступности и непрерывным режимом функционирования, когда должна быть обеспечена безотказность работы сетевого оборудования круглосуточно, 7 дней в неделю, 365 дней в году. Поэтому каждая минута простоя как для клиентов, так и для телеком-оператора влечет существенные репутационные и финансовые издержки. Все это актуализирует для телекоммуникационной отрасли задачу обеспечения надежности функционирования сетевых элементов и устройств на каждом из логических уровней ИТКС.
Одним из безальтернативных подходов при решении данной задачи является построение автоматизированных систем мониторинга ИТКС, способных в режиме реального времени осуществлять наблюдение за функциональным состоянием сетевых элементов с целью не только оперативного выявления, но и превентивного предупреждения оператора об идентификации критических и аномальных ситуаций с последующим недопущением отказа или своевременной переконфигурацией сети.
Одним из таких подходов, повышающим оперативность проведения цикла мониторинга ТС видится в применении понятийного аппарата экспресс-диагностирования сложных технических систем (СТС). Так в соответствии с ГОСТ 20911-89 (Техническая диагностика. Термины и определения) под экспресс-диагностированием понимается «диагностирование по ограниченному числу параметров за заранее установленное время». При этом к задачам технического диагностирования относят: контроль ТС, поиск места и определение причин отказа (неисправности), а также прогнозирование ТС. Слово «экспресс» в данном словосочетании означает, прежде всего, повышение оперативности в проведении процедуры кон-
троля ТС, а непосредственно контроль ТС - «проверку соответствия значений параметров объекта требованиям нормативно-технической документации (НТД) и определение на этой основе одного из заданных видов ТС в данный момент времени». При этом для СТС различают виды контроля: контроль готовности, проводимый непосредственно перед использованием ОК по назначению или периодически в режимах ожидания использования, хранения или транспортирования с целью определения его готовности к решению функциональных задач, а также контроль функционирования, осуществляемый при использовании ОК по назначению с целью своевременного обнаружения факта перехода его в неработоспособное ТС.
Для эффективной эксплуатации ИТКС, как системы постоянной готовности необходимо знание соответствия значений параметров ОК требуемым, а также его вида ТС в реальном масштабе времени, или близкому к нему (режим мягкого реального времени). С данной точки зрения, для эксплуатанта ИТКС важно иметь оценки результатов контроля функционирования в масштабе реального времени, с целью недопущения развития предаварийной ситуации в аварию и своевременного обнаружения факта изменения вида ТС ОК. Особенно это критично для сетевого оборудования, функционирующего в автоматическом режиме на значительных удалениях от диспетчерского пункта управления без постоянного присутствия инженерно-технического персонала, способного своевременно предотвратить развитие пре-даварийной ситуации. На таких автономных, необслуживаемых объектах сетевых инфраструктур (регенерационные пункты, автономные ретрансляторы и подстанции и пр.) необходимо наличие развитых встроенных подсистем контроля и дистанционного доведения до оператора (системы поддержки принятия решения - СППР [15]) результатов контроля при оперативном управлении ТС и предотвращения развития негативных событий, заключающихся в перерастании предотказного технического состояния в неработоспособное.
Обеспечение превентивного (своевременного) предотвращения развития аварийной ситуации возможно только проведением непрерывного либо периодического функционального контроля, что можно рассматривать по определению, соответственно, как мониторинг или контроллинг [16]. В тоже время, проведение метрологических мероприятий полного (инструментального) контроля всех параметров сетевого оборудования в соответствии с НТД либо сокращенного контроля ограниченного числа его параметров предусмотрено исключительно при проведении процедур контроля готовности (при различных видах технического обслуживания: ежедневное, ежемесячное, годовое (ЕТО, ТО-1, ТО-2). В процессе же контроля функционирования ОК проведение постоянного мониторинга и периодического контроллинга всех эксплуатационных параметров неприемлемо с точки зрения огромных финансовых затрат и низкой оперативности цикла проведения (продолжительности) полного контроля, а также использования результатов такого контроля на фоне быстротечности развития аварии (отказа), в условиях случайных и намеренных воздействий [17,18]. Таким образом, необходим поиск новых способов проведения функционального контроля и такой его разновидности, как мониторинга реального времени, удовлетворяющего всевозрастающим требованиям по оперативности мероприятий поддержания готовности сетевых устройств ИТКС ОП к применению по назначению в условиях воздействия ДФ.
Исходя из изложенного, научной задачей исследования является разработка методики М превентивной идентификации состояния сетевых устройств s с целью повышения оперативности цикла мониторинга Тс.т. в случае увеличения вероятности отказа Рotk при обеспечения достоверности D(a, в) её результатов и точности (с учётом ошибок контроля первого а и второго в рода) методами предиктивной (предсказательной) аналитики:
M :(S,Y, Z, Q) — min T
5 = 1, S;
Y = Y(0. ,3rf ),0 >0rf >0 ,E . >Erf >E ;
\ dop' dop f" min dop max ' min dop max'
Z с Zdop, (Zdop > 2),
Q ( Prbt, Potk ) :
Prbt о [ f (x)(Normal\ f (x)(^), f (x)(Ga™) ],
Pft О [f (x)™), f (x)(Pareto\ f (x)(Poisso"\ f (x)(&p), f (x)(Binomia')],
D (a, ß) > Ddop, a—a mm,ß —ßmin, P,t >Pd°p ^ T = TIt —> min.
otk otk c.m. |
где s - сетевое устройство (объект мониторинга), s=(1, S ) ;
Y - множество контролируемых параметров сетевого устройства в соответствии с НТД, Ys - множество (Ys* - рациональный выбор) параметров, наблюдаемых сервером мониторинга s-го сетевого устройства, Ys □ Y, при этом на каждый из параметров устанавливают эксплуатационные ©dop (в соответствие с режимом функционирования) ©min > ©dop > ©max и профилактические Hdop [19-21] (в соответствие с внешними условиями эксплуатации) Hmin > Hdop > Hmax допуски Y(©dop, Hdop);
Z - параметры системы мониторинга, выражающиеся в числе серверов мониторинга (различных логических уровней ИТКС), наблюдаемых за каждым сетевым устройством, для перспективной подсистемы мониторинга таких серверов должно быть не менее двух - Z > Zdop (Zdop > 2);
Q - показатели качества подсистемы мониторинга в виде основных законов распределения случайной величины метрик контролируемого параметра д(х) с правилом разграничения наблюдаемых процессов, соответствующим: для стационарного характера параметров потока ИИ (метрик), когда вероятность работоспособного состояния (rbt) ОК (нормальное ТС - Prbt) описывается нормальным (гауссовским) fi^fNormal), равномерным f^XEqual) и гамма-распределением f^XGamma): Prbt ^ [f^CNormal), f^XEqual), f^XGamma)], а для нестационарного характера параметров потока ИИ (критического (аварийного) состояния -Potk) описывается распределениями Вейбулла f^^e^ull), Парето f^XPareto), пуассонов-ским f^XPoisson), экспоненциальным f^XExp.) и биномиальным (дискретным) f^XBinomial) распределением: Prbt ^ [f^^e^ull),
f^XPareto), f^XPoisson), f^XExp.), f^XBinomial)]. При этом в случае превышения Potk своего допустимого значения (т. е. при переходе из работоспособного ТС в предотказное) период опроса Т сетевых элементов сервером мониторинга должна сократиться для повышения оперативности и своевременного принятия превентивного решения на ситуационное управление ИТКС по её переконфигурации и недопущению дрейфа в сторону отказа (аварии);
Tc.m. - период процедуры (цикла) мониторинга, зависящая от скважности опроса сервером мониторинга сетевых элементов, когда при уменьшении периода их опроса Т = ti - t(i-1) и постоянной величине продолжительности самой проверки т = const (мониторинга), время цикла мониторинга уменьшается Тс^. = Т/т ^ min при ограничении на обеспечение D(a, ß) - достоверности результатов мониторинга (идентификации вида ТС сетевого элемента) и минимальных ошибках первого а ^ amin и второго рода ß ^ ßmin (точность). Причем сокращать период опроса сетевых элементов необходимо только в том случае, если сервер мониторинга идентифицировал переход его из работоспособного ТС в предотказное , для недопущения в дальнейшем развития отказа. Также возможно применения величины обратной скважности опроса 1/rc.m. = Т/т , характеризующей коэффициент наполнения рабочего цик-
ла мониторинга в процентном соотношении (%). Если он равен 100 % (единице), то это означает, что мониторинг продолжается непрерывно.
Заключение
Для достижения цели исследования общая задача декомпозирована на частные задачи:
1. Mоделирование процесса идентификации технического состояния устройств информационно-телекоммуникационных сетей подсистемой сетевого мониторинга.
2. Разработка методики превентивной идентификации состояния объектов мониторинга на основе символьного представления временных рядов их метрик.
3. Формирование научно-технических предложений по реализации методики превентивной идентификации технического состояния устройств информационно-телекоммуникационных сетей общего пользования.
Литература
1. Будко П. А., Кулешов И. А., Курносов В. И., Мирошников В. И. Инфокоммуникационные сети: энциклопедия. Кн. 4. Гетерогенные сети связи: принципы построения, методы синтеза, эффективность, цена, качество. M.: Наука, 2020. б83 с.
2. Мыльников Л. А., Ефимов Н. А. Идентификация аварийного режима работы динамического оборудования на основе данных вибродиагностики и методов машинного обучения II Mатематиче-ские методы в технике и технологиях. 2020. Т. 4. C. 9-13.
3. Дуля И. С. Применение методов глубокого обучения к задаче кластеризации временных рядов II Аллея Науки. 2021. № 5. Том 1. С. 974-978.
4. Клюкин В.Э., Плотников В.Ю. Решение маршрутных задач в нестационарном пространстве дискретных состояний на основе интеллектуальных агентов II Современные тенденции развития науки и технологий. 201б. № 11-3. С. 5б-58.
5. Ribeiro M. H., Coelho L. S. Ensemble approach based on bagging, boosting and stacking for short-term prediction in agribusiness time series. Appl. Soft Comput. 2020. V. 86. Pp. 1-17.
6. АнтонюкЕ. М., АнтонюкП. Е., Варшавский И. Е., ОрловаН. В. Системы автоматического контроля с приоритетным обслуживанием каналов II Приборы. 2019. № 10 (232). С. 44-47
7. Mason S. J., Graham N. E. Areas beneath the relative operating characteristics (ROC) and relative operating levels (ROL) curves: Statistical significance and interpretation. Quarterly Journal of the Royal Meteorological Society. 2002. No. 128. P. 2145-2166.
8. Сухопаров М. Е., Лебедев И. С. Mодели анализа функционального состояния элементов устройств сетей и телекоммуникаций «Индустрии 4.0». СПб.: Политех-Пресс, 2020. 121 с.
9. Geiger А., Liu D., Alnegheimish S., Cuesta-Infante A., Veeramachaneni K. TadGAN: Time Series Anomaly Detection Using Generative Adversarial Networks (англ.) // arXiv:2009.07769v3 [cs.LG] 14.11.2020. URL: https://arxiv.org/pdf/2009.07769.pdf (дата обращения 14.11.2020).
10. Легков К. Е., Буренин А. Н. Mодели и методы оперативного мониторинга информационных подсистем перспективных автоматизированных систем управления II Информация и космос. 201б. № 4. С. 46-60.
11. Пальчевский Е. В., Христодуло О. И., Павлов С. В., Соколова А. В. Анализ ретроспективных данных с применением технологий искусственного интеллекта для прогнозирования угроз в сложных распределённых системах II Вестник компьютерных и информационных технологий. 2021. Т. 18. № 2 (200). С. 39-45.
12. Легков К. Е. Mодели и методы мониторинга параметров, характеризующих состояние инфо-коммуникационной системы специального назначения II T-Comm: Телекоммуникации и транспорт. 201б. Т. 10. № 1. С. 11-18.
13. Буренин А. Н., Легков К. Е., Емельянов А. В. Основные положения системного анализа и подход к построению модели информационной подсистемы инфокоммуникационной подсистемы специального назначения II Системы синхронизации, формирования и обработки сигналов. 201б. Т. 7. № 3. С. 17-23.
14. Васильев Н. В., Забродин О. В., Яшин А. И. Автоматизированный программный комплекс оценки качества обслуживания в телекоммуникационной сети II Техника средств связи. 201S. № 3 (143). С. 5б-61.
15. Допира Р. В., Потапов А. Н., Брежнев Д. Ю., Гетманчук А. В., Семин М. В. Оценка эффективности методического и алгоритмического обеспечения системы поддержки принятия решений специального назначения // Программные продукты и системы. 2019. № 2. С. 273-282.
16. Макаренко С. И. Справочник научных терминов и обозначений. СПб.: Наукоемкие технологии, 2019. 254 с
17. Макаренко С. И. Информационное оружие в технической сфере: терминология, классификация, примеры // Системы управления, связи и безопаснсти. 2016. № 3. С. 292-376. URL: http://sccs.intelgr.com/archive/2016-03/11-Makarenko.pdf (дата обращения 15.10.2021).
18. Бейер Б, Джоунс К, Петофф Д., Мёрфи Н. Р. Site Reliability Engineering. Надёжность и безопасность как в Google. Санкт-Петербург: Питер, 2021. 592 с.
19. Абрамов О. В., Лагунова А. Д. Об использовании эвристических алгоритмов в задачах оптимального параметрического синтеза // Информатика и системы управления. 2021. №2(68). С. 34-46.
20. Абрамов О. В. Прогнозирование состояния и планирование эксплуатации систем ответственного назначения // Надежность и качество сложных систем. 2020. № 3 (31). С. 5-14.
21. Абрамов О. В. О выборе стратегии оптимального параметрического синтеза в САПР // Надежность и качество сложных систем. 2021. № 2. С. 5-12.
SETTING THE TASK OF PREVENTIVE IDENTIFICATION OF THE TYPE OF TECHNICAL CONDITION OF NETWORK INFRASTRUCTURE ELEMENTS
VLADIMIR V. ALLAKIN
Doctoral Student. Independent Expert
Leningrad region, Vsevolozhsky district, vil. Buhry, [email protected]
ABSTRACT
Introduction: the paper is devoted to the substantiation and mathematical representation of the problem of preventive identification of the type of technical condition of elements of a public information and telecommunication network. Problem statement: based on the analysis of the scientific and methodological apparatus for assessing the time series of the observed metrics of the parameters of network elements and the features of modern information and telecommunication systems and networks, to carry out the task of developing a methodology for preventive identification of the state of network devices in order to increase the efficiency of the monitoring procedure, ensure the reliability of its results and accuracy by methods of predictive (predictive) analytics. Methods: methods of symbolic representation of time series., methods of structural analysis, methods of predicative analytics, methods of classification theory, methods of cluster analysis. Results: the verbal and mathematical formulation of the research task was carried out, as well as the general task was decomposed into particular tasks: modeling the process of identifying the technical condition of information and telecommunication network devices by the network monitoring subsystem; development of a methodology for preventive identification of the condition of monitoring objects based on a symbolic representation of time series of their metrics; formation of scientific and technical proposals for the implementation of a methodology for preventive identification of the technical condition of devices of public information and telecommunication networks. Practical significance: the analysis of time series estimation methods allowed us to develop an approach to constructing an algorithm for the functioning of a monitoring server to identify anomalies in the operation of a public information and telecommunications network. Discussion: the proposed procedure for the preventive identification of the abnormal state of the network element by identifying "prohibited" code combinations during the observation of time series, as well as the introduction of a special monitoring mode allows timely detection and prevention of the failure of the network element or the occurrence of an accident.
Keywords: time series analysis; technical condition; preventive identification of the type of condition; measurement information; special monitoring mode.
REFERENCES
1. Budko P.A., Kuleshov I.A., Kurnosov V.I., Miroshnikov V.I. Infokommunikacionnye seti: jenciklopedija. Kn. 4. Geterogennye seti
svjazi: principy postroenija, metody sinteza, jeffektivnost', cena, kachestvo [Infocommunication networks: an encyclopedia. Book 4. Heterogeneous communication networks: principles of construction, methods of synthesis, efficiency, price, quality]. M.: Nauka, 2020. 683 p. (In Rus).
2. Myl'nikov L.A., Efimov N.A. Detection of the dynamic equipment fault mode based on vibration diagnosis data and machine
learning methods/ Mathematical methods in engineering and technology. Matematicheskie metody v tehnike i tehnologijah. [Mathematical methods in engineering and technology]. 2020. Vol. 4. C. 9-13. (In Rus).
3. Dulja I.S. Application of deep learning methods to the task of clustering time series. Alleja Nauki [Alley of Science Publ.]. 2021.
No. 5. Vol. 1. Pp. 974-978. (In Rus).
4. Kljukin V.Je., Plotnikov V.Ju. Solving route problems in a non-stationary space of discrete states based on intelligent agents.
Sovremennye tendencii razvitiya nauki i tekhnologij [Modern trends in the development of science and technology]. 2016. No. 11-3. Pp. 56-58. (In Rus).
5. Ribeiro M.H., Coelho L.S. Ensemble approach based on bagging, boosting and stacking for short-term prediction in agribusi-
ness time series. Appl. Soft Comput. 2020. V. 86. Pp. 1-17.
6. Antonjuk E.M., Antonjuk P.E., Varshavskij I.E., Orlova N.V. Automatic control systems with priority channel maintenance. Pribo-
ry [Instrumentation]. 2019. No. 10 (232). Pp. 44-47. (In Rus).
7. Mason S.J., Graham N.E. Areas beneath the relative operating characteristics (ROC) and relative operating levels (ROL)
curves: Statistical significance and interpretation. Quarterly Journal of the Royal Meteorological Society. 2002. No. 128. Pp. 2145-2166.
8. Suhoparov M. E., Lebedev I. S. Modeli analiza funkcional'nogo sostoyaniya elementov ustrojstv setej i telekommunikacij «In-
dustry 4.0» [Model analysis of the functional state of the elements of the devices, networks and telecommunications Industry 4.0].
St. Petersburg: Polytechnic Press, 2020. 121 p. (In Rus).
9. Geiger А., Liu D., Alnegheimish S., Cuesta-Infante A., Veeramachaneni K. TadGAN: Time Series Anomaly Detection Using
Generative Adversarial Networks. arXiv:2009.07769v3 [cs.LG] 14.11.2020. URL: https://arxiv.org/pdf/2009.07769.pdf (accessed 01 November 2021).
10. Legkov K. Е., Burenin A. N. Models and methods for monitoring of information subsystems of prospective automated control systems. Information and Space. 2016. No. 4. Pp.46-60. (In Rus).
11. Palchevsky E.V., Khristodulo O.I., Pavlov S.V., Sokolova A.V. Analysis of historical data using artificial intelligence technologies for predicting threats in complex distributed systems. Vestnik kompjuternyh i informacionnykh tehnologii. 2021. Vol. 18. No. 2 (200). Pp. 39-45. (In Rus).
12. Legkov K. E. Models and methods of monitoring parameters characterizing the state of the infocommunication systems a special purpose. T-Comm. 2016. Vol. 10. No.1, pр. 11-18. (In Rus).
13. Burenin A. N., Legkov K. E., Emelyanov A. V. The main provisions of system analysis and an approach to building a model of an information subsystem of a special purpose infocommunication subsystem. Synchronization systems, signal generation and processing. 2016. Vol. 7. No. 3. Pp. 17-23. (In Rus).
14. Vasiliev N. V., Zabrodin O. V., Yashin A. I. Automated software package for assessing the quality of service in a telecommunications network. Means of Communication Equipment. 2018. No. 3 (143). pp. 56-61. (In Rus).
15. Dopira R.V., Potapov A.N., Brezhnev D.Ju., Getmanchuk A.V., Semin M.V. Efficiency evaluation of methodical and algorithmic support of a special purpose decision support system. Programmnye produkty isistemy. 2019. No. 2. Pp. 273-282. (In Rus).
16. Makarenko S. I. Spravochnik nauchnyh terminov i oboznachenij [Handbook of scientific terms and designations]. St. Petersburg, Naukoemkie tekhnologii Publ., 2019. 254 p. (In Rus).
17. Makarenko S. I. Information Weapon in Technical Area - Terminology, Classification and Examples. Systems of Control, Communication and Security, 2016, no. 3, pp. 292-376 Available at: http://sccs.intelgr.com/archive/2016-03/11-Makarenko.pdf (accessed 15 October 2021) (In Rus).
18. Bejer B., Dzhouns K., Petoff D., Mjorfi N.R.. Site Reliability Engineering. Nadjozhnost i bezopasnost kak v Google. [Site Reliability Engineering. Reliability and security as in Google]. Sankt-Peterburg. Piter, 2021. 592 p. (In Rus).
19. Abramov O. V., Lagunova A. D. On the use of heuristic algorithms in optimal parametric synthesis problems. Informatika i sistemy upravlenija [Information science and control systems]. 2021. № 2 (68). Pp. 34-46. (In Rus).
20. Abramov O. V. Forecasting the state and planning the operation of systems of responsible purpose. Nadezhnost' i kachestvo slozhnyh system [Reliability & Quality of Complex Systems]. 2020. No. 3 (31). Pp. 5-14. (In Rus).
21. Abramov O. V. On the choice of optimal parametric synthesis strategy in CAD. Nadezhnost' i kachestvo slozhnyh system [Reliability & Quality of Complex Systems]. 2021. No. 2. Pp. 5-12. (In Rus).