Научная статья УДК 004.896
DOI: 10.14529/йо240305
ИНТЕЛЛЕКТУАЛЬНАЯ ТЕХНОЛОГИЯ ОЦЕНКИ ОСТАТОЧНОГО РЕСУРСА СЛОЖНЫХ ТЕХНИЧЕСКИХ СИСТЕМ
В.Н. Ефанов1, [email protected], https://orcid.org/0000-0002-5917-2910 Н.С. Иванова1, [email protected], https://orcid.org/0009-0004-2194-2723 В.Г. Разумов2, [email protected]
Уфимский университет науки и технологий, Уфа, Россия 2 ООО «СИНТЕР», Челябинск, Россия
Аннотация. Задача оценки остаточного ресурса сложных технических систем становится в последнее время все более актуальной. Для достоверной оценки этого показателя требуется обрабатывать большие массивы данных о текущем состоянии исследуемой системы. При этом задача реконструкции модели развития процессов деградации, приводящих к возникновению отказов, требует решения целого ряда проблем. В связи с этим возникает необходимость применения интеллектуальных методов обработки данных, к числу которых относятся методы анализа аномалий временных рядов. Цель исследования: разработка метода выявления контекстных аномалий временных рядов, позволяющего определить степень развития процессов деградации, которые приводят к возникновению отказов. Методы. Установлена аналогия между методами машинного обучения в контролируемом, полуконтролируемом и неконтролируемом режимах и группами методов обнаружения аномалий, различающихся в зависимости от степени доступности меток, которые характеризуют свойства и признаки соответствующих временных рядов, что позволило с единых позиций оценить особенности простых и сложных аномалий. Результаты. Разработан спектральный метод анализа контекстных аномалий временных рядов, который, в отличие от известных спектральных методов, предусматривающих частотный анализ временных рядов, использует специальный базис экспоненциальных функций; изложена методика расчета спектральных коэффициентов исследуемых временных рядов, на основе которых вычисляется обобщенный атрибут, позволяющий отнести исследуемый случай к нормальной или аномальной группе. Заключение. Предложенный метод оценки остаточного ресурса сложных технических систем на основе анализа аномалий временных рядов позволяет своевременно выявлять возникновение и развитие процессов деградации, приводящих к возникновению отказов, что повышает надежность и безопасность технических систем, а также снижает затраты и время на их обслуживание.
Ключевые слова: сложные технические системы, остаточный ресурс, аномалии временных рядов, спектральный метод, газотурбинный двигатель
Для цитирования: Ефанов В.Н., Иванова Н.С., Разумов В.Г. Интеллектуальная технология оценки остаточного ресурса сложных технических систем // Вестник ЮУрГУ. Серия «Компьютерные технологии, управление, радиоэлектроника». 2024. Т. 24, № 3. С. 54-66. DOI: 10.14529/^0-240305
© Ефанов В.Н., Иванова Н.С., Разумов В.Г., 2024
Original article
DOI: 10.14529/ctcr240305
INTELLIGENT TECHNOLOGY FOR ASSESSING THE REMAINING USEFUL LIFE OF COMPLEX TECHNICAL SYSTEMS
V.N. Efanov1, [email protected], https://orcid.org/0000-0002-5917-2910 N.S. Ivanova1, [email protected], https://orcid.org/0009-0004-2194-2723 V.G. Razumov2, [email protected] Ufa University of Science and Technology, Ufa, Russia 2 LLC SINTER, Chelyabinsk, Russia
Abstract. The task of estimating the residual life of complex technical systems has recently become increasingly important. For the pre-trustworthy estimation of this indicator it is required to process large arrays of data on the current state of the system under study. At the same time the task of reconstruction of the model of degradation processes development leading to the occurrence of failures requires solving a number of problems. In this regard, there is a need to use intelligent methods of data processing, which include methods of time series anomaly analysis. Purpose of the study: development of a method for detecting contextual anomalies of time series, allowing to determine the degree of development of degradation processes that lead to the occurrence of failures. Methods. An analogy was established between machine learning methods in supervised, semi-supervised and unsupervised modes and groups of anomaly detection methods differing depending on the degree of availability of labels that characterize the properties and attributes of the corresponding time series, which made it possible to evaluate the features of simple and complex anomalies from unified positions. Results. A spectral method for the analysis of contextual anomalies of time series has been developed, which, in contrast to the known spectral methods involving frequency analysis of time series, uses a special basis of exponential functions; the methodology for calculating the spectral coefficients of the investigated time series, on the basis of which a generalized attribute is calculated, allowing to attribute the investigated case to a normal or anomalous group, is outlined. Conclusion. The proposed method of estimating the residual life of complex technical systems based on the analysis of time series anomalies allows timely detection of the occurrence and development of degradation processes leading to the occurrence of failures, which increases the reliability and safety of technical systems, as well as reduces costs and time for their maintenance.
Keywords: complex technical systems, residual resource, time series anomalies, spectral method, gas turbine engine
For citation: Efanov V.N., Ivanova N.S., Razumov V.G. Intelligent technology for assessing the remaining useful life of complex technical systems. Bulletin of the South Ural State University. Ser. Computer Technologies, Automatic Control, Radio Electronics. 2024;24(3): 54-66. (In Russ.) DOI: 10.14529/ctcr240305
Введение
Интеллектуальные технологии, позволяющие оценивать состояние сложных технических систем, приобретают в последнее время все более важное значение. Это связано с использованием концепции безопасной эксплуатации объектов по их техническому состоянию, которая предусматривает сравнение фактических значений параметров технического состояния во время эксплуатации с их предельно допустимыми значениями и последующее определение по результатам такого сравнения остаточного ресурса объекта. Остаточный ресурс - это важный показатель, используемый во многих промышленных системах и определяемый как суммарная наработка объекта от момента контроля его технического состояния до перехода в предельное состояние [1]. Его точный прогноз позволяет заранее планировать проведение технического обслуживания и планово-предупредительного ремонта, что является важной гарантией повышения надежности и безопасности объекта, а также снижает затраты и время на его обслуживание. Для сбора исчерпывающей информации о состоянии сложной технической системы используется множество датчиков разнообразных физических параметров, которые выдают большие массивы данных, как правило, в виде временных рядов. Временной ряд обычно рассматривается как последовательность значений некоторой физической величины, регистрируемых через некоторые, часто постоянные,
промежутки времени. Учитывая возможности современных цифровых технологий обработки больших данных, методы, основанные на данных, считаются предпочтительными для оценки остаточного ресурса технических систем.
Однако эта задача требует решения целого ряда проблем. Первая из этих проблем, имеющая концептуальный характер, связана с возможностью реконструкции на основе временных рядов модели развития процессов деградации, приводящих к возникновению отказов. Дело в том, что в состав сложных технических систем входят разнообразные механические, электрические, гидравлические и пневматические узлы и устройства. Во время эксплуатации детали и конструкции деформируются, изнашиваются, поражаются коррозией и эрозией, в них образуются трещины, изменяются структура и механические свойства материалов.
При этом деградационные процессы, приводящие к трещинам и другим подобным дефектам, имеют нестационарный и распределенный характер. Чтобы определить возможность конечномерного описания распределенной динамической системы, используемые временные ряды должны обеспечить возможность найти наименьшее количество переменных состояния исследуемой системы. Это число, получившее название размерность вложения, позволяет адекватно оценивать систему, поведение которой описывают эти временные ряды. Такая возможность обусловлена свойствами временных рядов - их числом и количеством членов в каждом из них.
В работах [2-4] приводится алгоритм Грассбергера - Прокаччиа, позволяющий аналитически оценить величину размерности вложения. Наряду с этим методом, который не позволяет работать с достаточно короткими временными рядами и требует значительных вычислительных затрат, на практике широко используются эмпирические методы определения величины размерности вложения. При этом в качестве размерности вложения принимается такое значение, начиная с которого прекращается качественное изменение оценки технического состояния. В этих же работах приводятся рекомендации по выбору числа и размерности временных рядов, которые свидетельствуют о том, что оценить пространство состояний заданной размерности можно только с помощью многомерных временных рядов с числом членов, превышающим десятки тысяч.
Такая задача является непростой даже при использовании цифровых технологий обработки больших данных. Дело в том, что большие данные обладают рядом особенностей, которые не свойственны традиционным наборам данных. К числу таких особенностей относятся: накопление шума, ложная корреляция и случайная эндогенность. Ошибки накапливаются, когда необходимо одновременно оценивать много параметров. Случайная эндогенность возникает, когда появляется зависимость между правильными данными и случайными ошибками модели. Но в нашем случае особо важную роль играет ложная корреляция. Как отмечалось выше, для контроля состояния сложных технических систем используется несколько датчиков. Чтобы получить исчерпывающую информацию о состоянии исследуемого объекта, часто прибегают к объединению данных с нескольких датчиков. При этом объединение похожих, но относящихся к различным состояниям данных может привести к неверной оценке действительного состояния системы.
Отмеченные свойства экспериментальных рядов, получаемых в результате непрерывных длительных наблюдений, требуют применения специальных приемов и методов при обработке и анализе данных. Используемый при этом класс методов искусственного интеллекта, которые позволяют улучшить результаты принятия решений в слабоструктурированных ситуациях путем обучения на известных данных, относится к разряду методов машинного обучения. При этом методы машинного обучения делятся на несколько характерных групп в зависимости от того, какие данные они используют.
Неконтролируемое обучение использует немаркированные данные. Это, как правило, необработанные данные, которые формируются на основе исходной информации о состоянии исследуемого технического объекта, поступающей от разнообразных датчиков физических параметров. Специфика неконтролируемого обучения заключается в том, что информация о состоянии технического объекта, которое необходимо оценить, отсутствует в обучающих данных. При этом обучение происходит только на основе известных значений входных параметров. Система машинного обучения сама должна найти способ обучения. Это создает менее прогнозируемую среду для контроля технического состояния, поскольку отсутствует информация об ожидаемых результатах обучения.
В свою очередь, контролируемое обучение использует маркированные данные. Маркированными считают наборы данных, относительно которых выявлен или установлен какой-либо ха-
рактерный признак. Применительно к задаче оценки технического состояния такими признаками могут служить возможные отказы технических объектов. Это означает, что маркированные данные содержат не только информацию о входных параметрах для системы машинного обучения, но и целевое значение выходных переменных, которое нужно получить в ходе обучения. Маркирование данных производится на основе экспертной оценки специалистов в соответствующей предметной области. При этом оценка оказывается тем более достоверной, чем сильнее отличаются признаки, характеризующие различные состояния технического объекта. Такая ситуация возникает, если в объекте превалирует какой-то один тип отказа или различные типы отказов разнесены во времени. Однако на практике чаще всего предпосылки для различных отказов возникают одновременно. Это обуславливает неопределенность в оценке проблемных областей, что может привести к неправильной классификации технического состояния.
Такие ошибки могут повлечь за собой неустранимую погрешность в обучающих данных, с которой не справится ни один алгоритм машинного обучения. В этом случае более продуктивным может оказаться подход, позволяющий своевременно выявить нарушение нормального режима работы объекта с последующей детализацией его технического состояния. С этой целью предлагается методика, основанная на анализе аномалий временных рядов.
1. Анализ аномалий временных рядов
Обнаружение аномалий является важной проблемой для многих прикладных областей. В связи с этим предлагается множество методов поиска аномалий [5-16], которые были специально разработаны для определенных областей применения. Общим для большинства этих методов является определение области, представляющей нормальное поведение, и поиск объектов, которые не соответствуют ожидаемому нормальному поведению. Однако такой очевидный подход сталкивается с целым рядом проблем. В первую очередь это связано с тем, что бывает крайне трудно определить область, которая будет охватывать все возможные варианты нормального поведения сложных технических систем. Особенно в ситуациях, когда нормальное поведение объекта может меняться и может не соответствовать текущему представлению о нормальном поведении. Кроме того, границы области нормального поведения часто бывают размытыми и нечеткими, а сами области нормального и аномального поведения могут перекрываться. Помимо этого, на точность обнаружения аномалий сильно влияет шум в данных, который часто похож на реальные аномалии и поэтому его трудно выявить и удалить.
С учетом существующих особенностей областей нормального и аномального поведения принято различать простые и сложные аномалии.
К простым относятся точечные аномалии, когда наблюдается резкое отклонение значений наблюдаемых параметров в отдельных точках. Такие «выбросы» легко обнаружить, установив допустимый диапазон изменения наблюдаемых параметров.
В свою очередь, к сложным аномалиям относятся коллективные или групповые аномалии и аномалии контекста,
В коллективных аномалиях аномально ведет себя некоторый набор экземпляров данных. При этом отдельные экземпляры данных из этого набора могут не быть аномалиями сами по себе, но их появление в совокупности является аномальным.
Контекстуальной или условной аномалией называют ситуацию, когда данный временной ряд считается аномальным в определенных условиях, в то время как временной ряд с аналогичными свойствами признается нормальным в других условиях. При этом понятие контекстуальной аномалии определяется характерными особенностями временных рядов, которые могут быть описаны с помощью некоторой совокупности атрибутов. В качестве атрибутов могут использоваться характеристики, свойства, признаки соответствующего набора данных. Для обнаружения контекстуальных аномалий необходимо установить, являются значения атрибутов нормальными или аномальными для данного контекста.
Таким образом, обнаружение контекстуальных аномалий базируется на использовании маркированных данных. Метки в этом случае определяют, является ли соответствующий экземпляр данных нормальным или аномальным. В зависимости от степени доступности меток методы обнаружения аномалий делятся на три группы, аналогично тому, как подразделяются методы машинного обучения [17-23].
Обнаружение аномалий в контролируемом режиме. Эти методы предполагают наличие обучающего набора данных, который содержит помеченные экземпляры для нормальных и аномальных классов. К этой группе относятся методы на основе классификации и на основе правил. Методы обнаружения аномалий на основе классификации предполагают, что существует классификатор, который может различать нормальные и аномальные классы в заданном пространстве признаков. В результате такой классификатор на этапе тестирования относит исследуемый экземпляр к числу нормальных или аномальных. В свою очередь методы обнаружения аномалий на основе правил разрабатывают правила, которые отражают нормальное поведение системы. Тестируемый экземпляр, который не подпадает ни под одно из таких правил, считается аномалией. Методы, которые работают в контролируемом режиме, обладают всеми недостатками методов, использующих маркированные данные. Во-первых, получение точных и достоверных меток для широкого круга аномалий является сложной задачей. Кроме того, аномальных экземпляров гораздо меньше, чем нормальных. Это приводит к несбалансированности обучающих выборок.
Обнаружение аномалий в полуконтролируемом режиме. Методы, которые работают в полуконтролируемом режиме, предполагают, что в обучающих данных есть метки только для нормального класса. При этом выявление аномалий в исследуемых экземплярах данных заключается в предположении, что нормальные экземпляры находятся в плотном окружении, в то время как аномалии возникают вдали от нормальных экземпляров. В качестве оценки аномалии используется либо расстояние исследуемого экземпляра данных до его ближайших соседей, либо относительная плотность его окружения. В первом случае методы обнаружения аномалии делятся на две категории: оценка аномальности исследуемого экземпляра данных находится как сумма его расстояний до заданного числа ближайших соседей или как количество ближайших соседей, которые находятся на расстоянии, не более заданного, от данного экземпляра данных. Методы обнаружения аномалий на основе плотности оценивают плотность окружения каждого экземпляра данных. Экземпляр, находящийся в районе с низкой плотностью, объявляется аномальным, а экземпляр, находящийся в плотном районе, - нормальным.
Эффективность этих методов во многом зависит от выбранной метрики, оценивающей расстояние между каждой парой экземпляров данных. Метрика должна надежно различать нормальные и аномальные экземпляры. Выбор такой метрики часто оказывается сложной задачей. Еще одна особенность рассмотренных методов заключается в том, что могут возникать ситуации, когда есть нормальные экземпляры, у которых недостаточно близких соседей, или есть аномалии, у которых достаточно близких соседей. В этом случае процент ошибок оказывается высоким. Вычислительная сложность полуконтролируемых методов также является значительной проблемой, поскольку они предусматривают вычисление расстояния между каждым тестовым экземпляром и всеми экземплярами, принадлежащими либо к самим тестовым данным, либо к обучающим данным.
Обнаружение аномалий в неконтролируемом режиме. Методы этой группы не требуют обучающих данных, и поэтому они широко используются на практике. Однако эти методы действуют эффективно, если в исследуемых данных нормальные случаи встречаются гораздо чаще, чем аномалии. Если это предположение не верно, то такие методы допускают большое количество ошибок. В основе методов обнаружения аномалий в неконтролируемом режиме лежит принцип кластеризации.
Этот подход предусматривает распределение всех нормальных наборов данных между определенным количеством кластеров, в то время как для аномальных наборов такие кластеры не определены. Следовательно, достаточно установить, относится представленный экземпляр данных к какому-либо кластеру или нет. Если исследуемый экземпляр не относится ни к одному из кластеров, он объявляется аномальным. При этом может использоваться какой-либо из известных алгоритмов кластеризации. Недостатком таких методов является то, что они не оптимизированы для поиска аномалий, поскольку основной целью алгоритма кластеризации является поиск кластеров. В связи с этим при поиске аномалий было предложено несколько модификаций алгоритма кластеризации. Одна из таких модификаций использует то обстоятельство, что нормальные экземпляры данных лежат рядом с ядром ближайшего кластера, в то время как аномалии нахо-
дятся далеко от ядра такого кластера. Однако если аномалии в данных сами по себе образуют кластеры, эти методы не смогут их обнаружить. Для решения этой проблемы была предложена модификация, которая предусматривает, что нормальные экземпляры данных принадлежат к большим и плотным кластерам, а аномалии - к маленьким или разреженным кластерам.
Недостатки методов обнаружения аномалий на основе кластеризации связаны также с погрешностями алгоритмов кластеризации, которые не различают особенностей в кластерной структуре нормальных и аномальных экземпляров. С учетом того, что алгоритм кластеризации должен отнести каждый экземпляр исследуемых данных к какому-либо кластеру, это приводит к тому, что аномалии часто относятся к кластеру большего размера. В результате такие данные будут рассматриваться как нормальные экземпляры.
Анализ рассмотренных методов обнаружения аномалий позволяет оценить те из них, которые наиболее приспособлены для работы с контекстными аномалиями. В целом их можно разделить на следующие группы.
Первая группа методов позволяет решать проблему обнаружения контекстуальных аномалий в ситуациях, когда в рамках данного контекста встречаются только отдельные экземпляры данных, которые являются аномальными. В этом случае для поиска контекстуальных аномалий предлагается использовать алгоритмы обнаружения точечных аномалий, адаптированные к условиям данного контекста.
Вторая группа методов моделирует структуру данных и использует эту модель для обнаружения аномалий. Общая методика обнаружения аномалий в этой группе методов сводится к следующему. На основе обучающих данных строится модель, которая может предсказать ожидаемое поведение в заданном контексте. Если ожидаемое поведение значительно отличается от наблюдаемого, то это считается аномалией. Обычно эта методика используется при выявлении аномалий во временных рядах. В частности, было разработано несколько методов моделирования временных рядов на основе регрессии. При этом любое наблюдение проверяется на аномальность путем сравнения с ковариационной матрицей авторегрессионного процесса. Если наблюдение выходит за пределы моделируемой ошибки для процесса, оно объявляется аномалией.
В третью группу входят методы, основанные на информационном содержании набора данных. В этом случае исходят из предположения, что аномалии вызывают нарушения в информационном содержании набора данных. Информационно-теоретические методы анализируют информационное содержание набора данных, используя различные информационно-теоретические меры, такие как сложность, энтропия и т. д. Очевидным преимуществом этих методов является то, что они не делают никаких предположений об исходных значениях концептуальных атрибутов в исследуемых данных.
Особое место занимает группа спектральных методов обнаружения аномалий. Эти методы используют то обстоятельство, что исходные данные могут быть преобразованы таким образом, чтобы атрибуты нормальных и аномальных экземпляров существенно отличались друг от друга. Это может потребовать преобразования временных рядов в функциональные зависимости, определенные в других метрических пространствах. Характерным примером таких преобразований является отображение периодических временных рядов в частотную область. Такое преобразование будет обладать еще одним преимуществом, если временные ряды будут вложены в пространство более низкой размерности. Все это определяет основную задачу, которая стоит перед спектральными методами обнаружения аномалий. Суть этой задачи заключается в поиске таких пространств, в которых аномальные экземпляры могут быть легко идентифицированы. Спектральные методы автоматически выполняют сокращение размерности и, следовательно, подходят для работы с наборами данных высокой размерности. Дело в том, что при разложении временной зависимости в спектральный ряд, достаточно сохранять информацию только о коэффициентах такого ряда. Более того, такие разложения могут служить для нормализации экспериментальных временных рядов. Данные, полученные от различных датчиков, могут иметь разную длину и быть измеренными в различные моменты времени. Данные, восстановленные по их спектральным характеристикам, всегда будут иметь одинаковый формат.
Рассмотрим метод анализа аномалий временных рядов, основанный на их разложении в спектральный ряд по специальному базису экспоненциальных функций.
2. Разработка и исследование спектрального метода анализа аномалий временных рядов
Обычно когда говорят о спектральном анализе временных рядов, то предполагается их описание в частотной области. Однако корректным такой подход является только в случае периодических и стационарных временных рядов. Применительно к сложным динамическим системам эти условия часто не выполняются. В связи с этим в качестве базиса спектрального разложения предлагается использовать пространство на основе линейно-независимых функций
ук (t) = ехр(-(к - 1)р») , р> 0, к = 1, 2, ... Дальнейшая процедура формирования базиса спектрального разложения предусматривает построение системы функций следующего вида:
I
Ф1 = 'Ук (»), I = 1,2,г -1, (1)
к=1
здесь ряд коэффициентов принимает следующее значение Хи = 1, а остальные, при I ф к , определяются из системы уравнений:
да
(Ф1; Фг) = | р (»)ф (»)фг (») Л = 0, г = 2,3,...; I = 1,2,..., г -1. (2)
о
При выполнении условий (2) функции (1) становятся ортогональными с весом р(») = ехр(-а»), а > 0 . Это означает, что в полученном спектральном базисе может быть разложена любая функция, скорость роста которой не превышает экспоненты с показателем а > 0 .
В работах [24, 25] приводится формула Родрига, которая позволяет в общем виде найти решение системы уравнений (2):
Фг+1 .„.»"•'-•
> (1 _ e-pt)
(3)
__. ер°' е"р(5+' Г (1 -
I!
Здесь используется параметр следующего вида 5 = (а - Р)/Р .
Если в формуле (3) продифференцировать выражение в квадратных скобках I раз по аргументу е_р» , то искомые функции (1) можно представить в следующем виде:
(») V( г(к+1+5+1У(5+21+1)Р -р*»
ф1+1 ^("1} к!(1 - к)!Г(к+5 + 1) е Р,
где Г(х) - интеграл Эйлера второго рода (гамма-функция).
В результате получаем аналитическое выражение для коэффициентов спектральных функций (1):
. (-1)к+1 г(к +I + 5 + 1У(5 +21 + 1)р (4)
к!(1 - к)!Г(к + 5 +1) . ()
Сформированная система спектральных функций позволяет описывать временные зависимости, полученные в ходе мониторинга исследуемых объектов, в виде следующего ряда:
ч
у (»)=Е а1 -Ф1 (»), (5)
1=1
где аг - коэффициенты спектрального разложения, которые можно рассматривать как коэффициенты соответствующего ортогонального ряда:
да
а1 =| Р (»). У (»).ф1 (») Л». (6)
0
Что касается сходимости предложенного спектрального разложения, то в отличие от обычных ортогональных рядов, которые гарантируют сходимость только в смысле среднеквадратиче-ского отклонения, оно обеспечивает сильную, равномерную сходимость. Это следует из соотно-
Ефанов В.Н., Иванова Н.С., Интеллектуальная технология оценки
Разумов В.Г. остаточного ресурса сложных технических систем
шений, приведенных в [24, 25], которые показывают, что при росте числа членов ряда к нулю стремится абсолютная погрешность подобной аппроксимации
у ((а1 ф1 (')
I=1
< со9 (5 + 9)л/5 + 29 -11Ф9+1 (*)|
(5 + 2д -1)(5 + 2д)^5 + 2д +1 • дг+у
Таким образом, задача аппроксимации временных зависимостей предложенным спектральным описанием является корректной как по Адамару, так и по Тихонову.
Следует отметить, что использование спектральной аппроксимации (5) позволяет исследовать временные ряды с одинаковым числом членов и рассчитанные в одни и те же моменты времени. Как отмечалось ранее, в реальных условиях эксплуатации и даже при стендовых испытаниях для измерения различных физических параметров используют датчики с разными метрологическими характеристиками. Это не позволяет получить временные ряды одного формата. Для нормирования экспериментально полученных временных рядов предлагается сначала разложить эти временные зависимости по системе спектральных функций, как это было описано выше. Затем, используя полученные разложения, можно вычислить необходимое количество членов временного ряда, необходимых для оценки состояния объекта, причем с заданными характеристиками. После этого можно использовать это описание для нахождения значений контекстных атрибутов.
Поскольку экспериментально снятые временные характеристики исследуемых систем представлены в виде многомерных временных рядов Dk = |ук (ti , к = 1,N, то формула (5) приобретает вид
ак V Ук ) Р (^ ) Ф' ) + Ук +1) Р (^+1 ) Ф ] (^+1 ) t ) , = ^ (7)
а -2--(ti+l-ti), ] =1,9 (7)
4 ^ ] 1=1 2
Полученные спектральные коэффициенты являются атрибутами исследуемых временных рядов. Для оценки состояния контролируемого объекта необходимо определить степень близости атрибутов анализируемого случая к соответствующим атрибутам нормальных экземпляров данных. Это достаточно стандартная задача нахождения расстояния в пространстве параметров. Для ее решения в настоящее время используется большое количество разнообразных метрик, наиболее популярными из которых считаются евклидова, манхэттенская и равномерная метрики, а также метрика Минковского. Причем если в ходе исследования удается получить репрезентативные выборки маркированных данных, соответствующих типовым отказам контролируемого объекта, то такой подход можно будет использовать не только для выявления аномалий, но и для диагностики неисправностей.
Мы будем использовать метрику, аналогичную евклидовой:
9 2 _
Н[°к] = Е(ак) , к = 1,N. (8)
]=1
Предлагаемый метод анализа аномалий временных рядов реализуется в два этапа. На первом этапе проводится расчет спектральных коэффициентов по формуле (7).
На втором этапе вычисляется обобщенный атрибут исследуемого случая (8). Если отклонение этой величины от значений, соответствующих нормальному процессу, выходит за пределы допустимой ошибки, то такой случай объявляется аномалией.
Проиллюстрируем предложенный метод на примере оценки технического состояния газотурбинного двигателя.
3. Оценка технического состояния газотурбинного двигателя
В табл. 1 представлены экспериментально снятые зависимости частоты вращения ротора турбокомпрессора для исправного двигателя (к = 1) и при наличии расцентровки ротора турбокомпрессора (к = 2).
Таблица 1
Временные ряды для частоты вращения ротора турбокомпрессора
Table 1
Time series for turbocharger rotor speed
t, с 0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8 2,0
Di 0 0,161 0,297 0,410 0,460 0,537 0,621 0,681 0,733 0,776 0,795
d2 0 0,327 0,547 0,695 0,747 0,831 0,887 0,924 0,948 0,962 0,971
Обе эти временные последовательности являются аналогичными в контексте динамики протекающих процессов. Рассмотрим, позволят ли контекстные атрибуты (7) и (8) выявить аномалию в работе двигателя. Для этого рассчитаем значения этих атрибутов. Результаты расчетов сведены в табл. 2.
Таблица 2
Контекстные атрибуты временных рядов
Table 2
Contextual attributes of time series
} 1 2 3 4 5
a) 0,44444 0,27494 0,01846 0,00632 0,00235
0,642864 0,293001 0,063044 0,002520 0,0000021
H [ A] 0,19753 0,27312 0,27346 0,27350 0,27350
h [ D2 ] 0,413274 0,499124 0,503098 0,503105 0,503105
Как следует из приведенных данных, метрика (8) практически перестала изменяться при пяти членах спектрального ряда. Следовательно, этого числа достаточно для спектрального разложения временных рядов с требуемой точностью. При этом величина метрики для второго временного ряда практически в два раза превышает аналогичную величину для первого ряда. Это свидетельствует об аномалии в работе двигателя.
Заключение
В работе предложен новый подход к оценке состояния сложных технических систем на основе анализа аномалий временных рядов. Такой анализ позволяет выявить тенденции изменения состояний контролируемого объекта, в том числе связанные с появлением и развитием дефектов. Для этого необходимо, чтобы полученные экспериментальные зависимости отвечали достаточно жестким требованиям к числу и размерности временных рядов, позволяющих достоверно оценивать состояние контролируемого объекта. Необходимость обработки больших массивов данных потребовала применения специальных методов искусственного интеллекта, которые позволяют улучшить результаты принятия решений в слабоструктурированных ситуациях путем обучения на известных данных. Используемые при этом методы машинного обучения предусматривают определение областей, представляющих нормальное поведение, и обеспечивают поиск объектов, которые не соответствуют ожидаемому нормальному поведению.
Проведенный в работе анализ методов обнаружения аномалий в различных режимах позволил оценить те из них, которые оказались наиболее приспособленными для работы с контекстными аномалиями. К их числу относятся спектральные методы обнаружения аномалий. Эти методы используют подпространства более низкой размерности, в котором атрибуты нормальных и аномальных экземпляров существенно отличаются друг от друга. Предложен метод анализа аномалий временных рядов, основанный на их разложении в спектральный ряд по специальному базису экспоненциальных функций. Показано, что предложенная компактная форма описания временных рядов в среде ортогональных функций обеспечивает равномерную сходимость, что гарантирует достоверность оценки состояния контролируемого объекта. Необходимо отметить, что предложенный метод позволяет выявлять аномалии не только в полуконтролируемом, но и в неконтролируемом режиме. Рассмотренный пример оценки состояния газотурбинного двигателя с
возможным дефектом ротора турбокомпрессора подтверждает, что предложенная методика позволяет получать правильный диагноз.
Список литературы
1. ГОСТ 27.002-2015. Надежность в технике. Термины и определения: национальный стандарт Российской Федерации: дата введения 2016-06-21. Федеральное агентство по техническому регулированию и метрологии. Изд. официальное. М: Стандартинформ, 2015. 28 с.
2. Истомин И.А., Котляров О.Л., Лоскутов А.Ю. К проблеме обработки временных рядов: расширение возможностей метода локальной аппроксимации посредством сингулярного спектрального анализа // Теоретическая и математическая физика. 2005. Т. 142, № 1. С. 148-159. DOI: 10.4213/tmf1771
3. Лоскутов А.Ю., Козлов А.А., Хаханов Ю.М. Энтропия и прогноз временных рядов в теории динамических систем // Известия высших учебных заведений. Прикладная нелинейная динамика. 2009. Т. 17, № 4. С. 98-113. DOI: 10.18500/0869-6632-2009-17-4-98-113
4. Efanov V.N., Ivanova N.S. Expert System for Assessing the Technical Status of Gas Turbine Engines Using the Knowledge Base of Temporal Precedents // Russian Aeronautics. 2023. Vol. 66, no. 1. P. 64-71. DOI: 10.3103/S1068799823010099
5. A GPU Algorithm for Detecting Contextual Outliers in Multiple Concurrent Data Streams /
A. Borah, L. Gruenwald, E. Leal, E. Panjei // Proceedings of 2021 IEEE International Conference on Big Data (Big Data). Orlando, FL, USA, 2021. P. 2737-2742. DOI: 10.1109/BigData52589.2021.9671460
6. Trajectory Outlier Detection on Trajectory Data Streams / K. Cao, Y. Liu, G. Meng et al. // IEEE Access. 2020. Vol. 8. P. 34187-34196. DOI: 10.1109/ACCESS.2020.2974521
7. A Framework for Local Outlier Detection from Spatio-Temporal Trajectory Datasets / X. Cai,
B. Aydin, A. Ji, R. Angryk // Proceedings of 2020 25th International Conference on Pattern Recognition (ICPR). Milan, Italy, 2021. P. 5682-5689. DOI: 10.1109/ICPR48806.2021.9412274
8. Telemetry Data-based Spacecraft Anomaly Detection Using Generative Adversarial Networks / Y. Song, J. Yu, D. Tang et al. // Proceedings of 2020 International Conference on Sensing, Measurement & Data Analytics in the era of Artificial Intelligence (ICSMD). Xi'an, China, 2020. P. 297-301. DOI: 10.1109/ICSMD50554.2020.9261736
9. Haj-Hassan A., Habib C., Nassar J. Real-time Spatio-Temporal based Outlier Detection Framework for Wireless Body Sensor Networks // Proceedings of 2020 IEEE International Conference on Advanced Networks and Telecommunications Systems (ANTS). New Delhi, India, 2020. P. 1-6. DOI: 10.1109/ANTS50601.2020.9342827
10. STAD: Spatio-Temporal Anomaly Detection Mechanism for Mobile Network Management / A. Dridi, C. Boucetta, S.E. Hammami et al. // IEEE Transactions on Network and Service Management.
2021. Vol. 18, no. 1. P. 894-906. DOI: 10.1109/TNSM.2020.3048131
11. An Efficient Outlier Detection and Classification Clustering-Based Approach for WSN / M. Al Samara, I. Bennis, A. Abouaissa, P. Lorenz // Proceedings of 2021 IEEE Global Communications Conference (GLOBECOM). Madrid, Spain, 2021. P. 1-6. DOI: 10.1109/GLOBECOM46510.2021.9685756
12. A Novel Outlier Detection Model for Vibration Signals Using Transformer Networks / R. Zhang, Q. Zhou, L. Tian et al. // IEEE Access. 2022. Vol. 10. P. 57234-57241. DOI: 10.1109/ACCESS.2022.3178373
13. An Unsupervised TCN-based Outlier Detection for Time Series with Seasonality and Trend / R. Mo, Y. Pei, N. Venkatarayalu et al. // Proceedings of 2021 IEEE VTS 17th Asia Pacific Wireless Communications Symposium (APWCS). Osaka, Japan, 2021. P. 1-5. DOI: 10.1109/APWCS50173.2021.9548759
14. STLP-OD: Spatial and Temporal Label Propagation for Traffic Outlier Detection / J. Pu, Y. Wang, X. Liu, X. Zhang // IEEE Access. 2019. Vol. 7. P. 63036-63044. DOI: 10.1109/ACCESS.2019.2916853
15. Fitters W., Cuzzocrea A., Hassani M. Enhancing LSTM Prediction of Vehicle Traffic Flow Data via Outlier Correlations // Proceedings of 2021 IEEE 45th Annual Computers, Software, and Applications Conference (COMPSAC). Madrid, Spain, 2021. P. 210-217. DOI: 10.1109/TOMPSAC51774.2021.00039
16. Romero M., Estevez P.A. Outlier Detection based on Transformations for Astronomical Time Series // Proceedings of 2022 International Joint Conference on Neural Networks (IJCNN). Padua, Italy,
2022. P. 1-8. DOI: 10.1109/IJCNN55064.2022.9892590
17. Zhang H., Li Z. Anomaly Detection Approach for Urban Sensing Based on Credibility and Time-Series Analysis Optimization Model // IEEE Access. 2019. Vol. 7. P. 49102-49110. DOI: 10.1109/ACCESS.2019.2909967
18. Anomaly Detection and Classification in Multispectral Time Series Based on Hidden Markov Models / K.M. Leon-Lopez, F. Mouret, H. Arguello, J.-Y. Tourneret // IEEE Transactions on Geosci-ence and Remote Sensing. 2022. Vol. 60. P. 1-11. Art no. 5402311. DOI: 10.1109/TGRS.2021.3101127
19. DIM Moving Target Detection using Spatio-Temporal Anomaly Detection for Hyperspectral Image Sequences / Li Y., Wang J., Liu X. et al. // Proceedings of 2018 IEEE International Geoscience and Remote Sensing Symposium. Valencia, Spain, 2018. P. 7086-7089. DOI: 10.1109/IGARSS.2018.8517601
20. Lee J., Jeon C.-R., Kang S.-J. Performance Comparison of Soiling Detection Using Anomaly Detection Methodology // Proceedings of 2022 19th International SoC Design Conference (ISOCC). Gangneung-si, Korea, Republic of, 2022. P. 229-230. DOI: 10.1109/ISOCC56007.2022.10031428
21. Hyperspectral Anomaly Detection With Multiscale Attribute and Edge-Preserving Filters / S. Li, K. Zhang, Q. Hao et al. // IEEE Geoscience and Remote Sensing Letters. 2018. Vol. 15, no. 10. P. 1605-1609. DOI: 10.1109/LGRS.2018.2853705
22. Lee C., Kim J., Kang S.-J. Semi-supervised Anomaly Detection with Reinforcement Learning // Proceedings of 2022 37th International Technical Conference on Circuits/Systems, Computers and Communications (ITC-CSCC). Phuket, Thailand, 2022. P. 933-936. DOI: 10.1109/ITC-CSCC55581.2022.9895028
23. Karim S.M.A., Ranjan N., Shah D. A Scalable Approach to Time Series Anomaly Detection & Failure Analysis for Industrial Systems // Proceedings of 2020 10th Annual Computing and Communication Workshop and Conference (CCWC). Las Vegas, NV, USA, 2020. P. 0678-0683. DOI: 10.1109/CCWC47524.2020.9031262
24. Суетин П.К. Классические ортогональные многочлены. М.: Физматлит, 2007. 480 с.
25. Никифоров А.Ф, Суслов С.К. Классические ортогональные полиномы. М.: Знание, 1985. 32 с.
References
1. GOST 27.002-2015. [Reliability in engineering. Terms and definitions: national standard of the Russian Federation: date of introduction 2016-06-21. Federal agency on technical regulation and metrology. Ed. official]. Moscow: Standartinform; 2015. 28 р. (In Russ.)
2. Istomin I.A., Kotlyarov O.L., Loskutov A.Yu. [On the problem of time series processing: extending the possibilities of the local approximation method by means of singular spectral analysis]. Theoretical and Mathematical Physics. 2005;142(1):148-159. (In Russ.) DOI: 10.4213/tmf1771
3. Loskutov A.Yu., Kozlov A.A., Khakhanov Yu.M. Entropy and forecast of time series in the theory of dynamical systems. Izvestiya vysshikh uchebnykh zavedeniy. Applied nonlinear dynamics. 2009;17(4):98-113. (In Russ.) DOI: 10.18500/0869-6632-2009-17-4-98-113
4. Efanov V.N., Ivanova N.S. Expert System for Assessing the Technical Status of Gas Turbine Engines Using the Knowledge Base of Temporal Precedents. Russian Aeronautics. 2023;66(1):64-71. DOI: 10.3103/S1068799823010099
5. Borah А., Gruenwald L., Leal E., Panjei E. A GPU Algorithm for Detecting Contextual Outliers in Multiple Concurrent Data Streams. In: Proceedings of 2021 IEEE International Conference on Big Data (Big Data). Orlando, FL, USA; 2021. P. 2737-2742. DOI: 10.1109/BigData52589.2021.9671460
6. Cao К., Liu Y., Meng G., Liu H., Miao A., Xu J. Trajectory Outlier Detection on Trajectory Data Streams. IEEE Access. 2020;8:34187-34196. DOI: 10.1109/ACCESS.2020.2974521
7. Cai Х., Aydin B., Ji A., Angryk R. A Framework for Local Outlier Detection from SpatioTemporal Trajectory Datasets. In: Proceedings of 2020 25th International Conference on Pattern Recognition (ICPR). Milan, Italy; 2021. P. 5682-5689. DOI: 10.1109/ICPR48806.2021.9412274
8. Song Y., Yu J., Tang D., Han D., Wang S. Telemetry Data-based Spacecraft Anomaly Detection Using Generative Adversarial Networks. In: Proceedings of2020 International Conference on Sensing, Measurement & Data Analytics in the era of Artificial Intelligence (ICSMD). Xi'an, China; 2020. P. 297-301. DOI: 10.1109/ICSMD50554.2020.9261736
9. Haj-Hassan A., Habib C., Nassar J. Real-time Spatio-Temporal based Outlier Detection Framework for Wireless Body Sensor Networks. In: Proceedings of 2020 IEEE International Conference on
Advanced Networks and Telecommunications Systems (ANTS). New Delhi, India; 2020. P. 1-6. DOI: 10.1109/ANTS50601.2020.9342827
10. Dridi A., Boucetta C., Hammami S.E., Afifi H., Moungla H. STAD: Spatio-Temporal Anomaly Detection Mechanism for Mobile Network Management. IEEE Transactions on Network and Service Management. 2021;18(1):894-906. DOI: 10.1109/TNSM.2020.3048131
11. Al Samara M., Bennis I., Abouaissa A., Lorenz P. An Efficient Outlier Detection and Classification Clustering-Based Approach for WSN. In: Proceedings of2021 IEEE Global Communications Conference (GLOBECOM). Madrid, Spain; 2021. P. 1-6. DOI: 10.1109/GLOBECOM46510.2021.9685756
12. Zhang R., Zhou Q., Tian L., Bai L., Zhang L. A Novel Outlier Detection Model for Vibration Signals Using Transformer Networks. IEEE Access. 2022;10:57234-57241. DOI: 10.1109/ACCESS.2022.3178373
13. Mo R., Pei Y., Venkatarayalu N., Nathaniel P., Premkumar A.B., Sun S. An Unsupervised TCN-based Outlier Detection for Time Series with Seasonality and Trend. In: Proceedings of 2021 IEEE VTS 17th Asia Pacific Wireless Communications Symposium (APWCS). Osaka, Japan; 2021. P. 1-5. DOI: 10.1109/APWCS50173.2021.9548759
14. Pu J., Wang Y., Liu X., Zhang X. STLP-OD: Spatial and Temporal Label Propagation for Traffic Outlier Detection. IEEE Access. 2019;7:63036-63044. DOI: 10.1109/ACCESS.2019.2916853
15. Fitters W., Cuzzocrea A., Hassani M. Enhancing LSTM Prediction of Vehicle Traffic Flow Data via Outlier Correlations. In: Proceedings of 2021 IEEE 45th Annual Computers, Software, and Applications Conference (COMPSAC). Madrid, Spain; 2021. P. 210-217. DOI: 10.1109/COMPSAC51774.2021.00039
16. Romero M., Estevez P.A. Outlier Detection based on Transformations for Astronomical Time Series. In: Proceedings of 2022 International Joint Conference on Neural Networks (IJCNN). Padua, Italy; 2022. P. 1-8. DOI: 10.1109/IJCNN55064.2022.9892590
17. Zhang H., Li Z. Anomaly Detection Approach for Urban Sensing Based on Credibility and Time-Series Analysis Optimization Model. IEEE Access. 2019;7:49102-49110. DOI: 10.1109/ACCESS.2019.2909967
18. Leon-Lopez K.M., Mouret F., Arguello H., Tourneret J.-Y. Anomaly Detection and Classification in Multispectral Time Series Based on Hidden Markov Models. IEEE Transactions on Geoscience andRemote Sensing. 2022;60:1-11. Art no. 5402311. DOI: 10.1109/TGRS.2021.3101127
19. Li Y., Wang J., Liu X., Xian N., Xie C. DIM Moving Target Detection using SpatioTemporal Anomaly Detection for Hyperspectral Image Sequences. In: Proceedings of 2018 IEEE International Geoscience and Remote Sensing Symposium. Valencia, Spain; 2018. P. 7086-7089. DOI: 10.1109/IGARSS.2018.8517601
20. Lee J., Jeon C.-R., Kang S.-J. Performance Comparison of Soiling Detection Using Anomaly Detection Methodology. In: Proceedings of 2022 19th International SoC Design Conference (ISOCC). Gangneung-si, Korea, Republic of; 2022. P. 229-230. DOI: 10.1109/ISOCC56007.2022.10031428
21. Li S., Zhang K., Hao Q., Duan P., Kang X. Hyperspectral Anomaly Detection with Multi-scale Attribute and Edge-Preserving Filters. IEEE Geoscience and Remote Sensing Letters. 2018;15(10): 1605-1609. DOI: 10.1109/LGRS.2018.2853705
22. Lee C., Kim J., Kang S.-J. Semi-supervised Anomaly Detection with Reinforcement Learning. In: Proceedings of 2022 37th International Technical Conference on Circuits/Systems, Computers and Communications (ITC-CSCC). Phuket, Thailand; 2022. P. 933-936. DOI: 10.1109/ITC-CSCC55581.2022.9895028
23. Karim S.M.A., Ranjan N., Shah D. A Scalable Approach to Time Series Anomaly Detection & Failure Analysis for Industrial Systems. In: Proceedings of 2020 10th Annual Computing and Communication Workshop and Conference (CCWC). Las Vegas, NV, USA; 2020. P. 0678-0683. DOI: 10.1109/CCWC47524.2020.9031262
24. Suetin P.K. Klassicheskie ortogonal'nye mnogochleny [Classical orthogonal polynomials]. Moscow: Fizmatlit Publ.; 2007. 480 p. (In Russ.)
25. Nikiforov A.F, Suslov S.K. Klassicheskie ortogonal'nye polinomy [Classical orthogonal polynomials]. Moscow: Znanie Publ.; 1985. 32 p. (In Russ.)
Информация об авторах
Ефанов Владимир Николаевич, д-р техн. наук, проф., проф. кафедры электронной инженерии, Уфимский университет науки и технологий, Уфа, Россия; [email protected].
Иванова Наталья Сергеевна, аспирант кафедры электронной инженерии, Уфимский университет науки и технологий, Уфа, Россия; [email protected].
Разумов Владимир Геннадьевич, инженер-проектировщик, ООО «СИНТЕР», Челябинск, Россия; [email protected].
Information about the authors
Vladimir N. Efanov, Dr. Sci. (Eng.), Prof., Prof. of the Department of Electronic Engineering, Ufa University of Science and Technology, Ufa, Russia, [email protected].
Natalya S. Ivanova, Postgraduate student of the Department of Electronic Engineering, Уфимский университет науки и технологий, Уфа, Россия; [email protected].
Vladimir G. Razumov, Design engineer, LLC SINTER, Chelyabinsk, Russia; wisewolf7778@ gmail.com.
Статья поступила в редакцию 26.11.2023
The article was submitted 26.11.2023