Научная статья на тему 'ОБОСНОВАНИЕ ВЫБОРА МЕТОДА И КРИТЕРИЯ КЛАСТЕРИЗАЦИИ ДЛЯ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ПРИ УПРАВЛЕНИИ ПОЛЕТОМ КОСМИЧЕСКИХ АППАРАТОВ'

ОБОСНОВАНИЕ ВЫБОРА МЕТОДА И КРИТЕРИЯ КЛАСТЕРИЗАЦИИ ДЛЯ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ПРИ УПРАВЛЕНИИ ПОЛЕТОМ КОСМИЧЕСКИХ АППАРАТОВ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
187
60
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
управление космическим полетом / система контроля / интеллектуальный анализ / кластеризация / нештатная ситуация / space flight control / control system / data mining / clustering / off-nominal situation

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Соловьев Сергей Владимирович

В статье исследуются методы интеллектуального анализа телеметрической информации космических аппаратов. Кратко дано текущее состояние и основные недостатки процесса контроля при осуществлении управления полетом космических аппаратов. Устранение недостатков предлагается осуществить внедрением процедур интеллектуализации в части анализа телеметрической информации. На основе методов кластерного анализа данных предложен способ автоматического определения момента возникновения аномалий в состоянии космических аппаратов, которые являются предвестниками нештатных ситуаций. Изложена принципиальная схема работы интеллектуальной системы контроля, построенная на базе использования метода кластерного анализа телеметрической информации космических аппаратов. Обоснованы условия выбора метода и критерия кластеризации с учетом целей, преследуемых при решении задач контроля при управлении полетом космических аппаратов. Приведено математическое описание методов и критериев кластеризации, выбранных для дальнейшей практической апробации. Для апробации предлагаемого метода анализа для различных методов и критериев кластеризации проведены расчеты с использованием архивной телеметрической информации. С точки зрения времени заблаговременного обнаружения аномалии в состоянии для отдельной составной части космических аппаратов делается выбор метода и критерия кластеризации для проведения дальнейших исследований и опытных работ.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Соловьев Сергей Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

JUSTIFICATION OF THE CHOICE OF THE METHOD AND CRITERION OF CLUSTERING FOR INTELLIGENT ANALYSIS IN FLIGHT CONTROL SPACECRAFT

The article examines the methods of intelligent analysis of telemetric information of spacecraft. The current state and main shortcomings of the control process during the spacecraft flight control are briefly given. It is proposed to eliminate the shortcomings by introducing intellectualization procedures in terms of telemetric information analysis. Based on the methods of cluster data analysis, a method is proposed for automatically determining the moment of occurrence of anomalies in the state of a spacecraft, which are precursors of off-nominal situations. A schematic diagram of the operation of an intelligent control system based on the use of the method of cluster analysis of the spacecraft telemetric information is presented. The conditions for choosing the method and criterion for clustering are substantiated, taking into account the goals pursued in solving control problems during flight control of the spacecraft. A mathematical description of the clustering methods and criteria selected for further practical testing is given. To test the proposed method of analysis for various methods and criteria of clustering, calculations were performed using archived telemetric information. From the point of view of the time of early detection of the anomaly in the state for a separate component of the spacecraft, the choice of the method and criterion of clustering is made for further research and experimental work.

Текст научной работы на тему «ОБОСНОВАНИЕ ВЫБОРА МЕТОДА И КРИТЕРИЯ КЛАСТЕРИЗАЦИИ ДЛЯ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ПРИ УПРАВЛЕНИИ ПОЛЕТОМ КОСМИЧЕСКИХ АППАРАТОВ»

РАКЕТНО-КОСМИЧЕСКАЯ ТЕХНИКА

УДК 629.78

Б01 10.26732/^12020.3.03

ОБОСНОВАНИЕ ВЫБОРА МЕТОДА И КРИТЕРИЯ КЛАСТЕРИЗАЦИИ ДЛЯ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ПРИ УПРАВЛЕНИИ ПОЛЕТОМ КОСМИЧЕСКИХ АППАРАТОВ

С. В. Соловьёв

Московский государственный технический университет имени Н. Э. Баумана

(национальный исследовательский университет), г. Москва, Российская Федерация

В статье исследуются методы интеллектуального анализа телеметрической информации космических аппаратов. Кратко дано текущее состояние и основные недостатки процесса контроля при осуществлении управления полетом космических аппаратов. Устранение недостатков предлагается осуществить внедрением процедур интеллектуализации в части анализа телеметрической информации. На основе методов кластерного анализа данных предложен способ автоматического определения момента возникновения аномалий в состоянии космических аппаратов, которые являются предвестниками нештатных ситуаций. Изложена принципиальная схема работы интеллектуальной системы контроля, построенная на базе использования метода кластерного анализа телеметрической информации космических аппаратов. Обоснованы условия выбора метода и критерия кластеризации с учетом целей, преследуемых при решении задач контроля при управлении полетом космических аппаратов. Приведено математическое описание методов и критериев кластеризации, выбранных для дальнейшей практической апробации. Для апробации предлагаемого метода анализа для различных методов и критериев кластеризации проведены расчеты с использованием архивной телеметрической информации. С точки зрения времени заблаговременного обнаружения аномалии в состоянии для отдельной составной части космических аппаратов делается выбор метода и критерия кластеризации для проведения дальнейших

исследований и опытных работ.

Ключевые слова: управление космическим полетом, система контроля, интеллектуальный анализ, кластеризация, нештатная ситуация.

Введение

Управление полетом космических аппаратов (КА) включает в качестве обязательной функции осуществление контроля. Результат контроля достигается за счет анализа параметров состояния КА. Реализация процесса контроля при управлении полетом КА в настоящее время имеет ряд недостатков [1], в том числе:

• ограниченная автоматизация процесса контроля в части анализа телеметрической информации (ТМИ) КА, на уровне метода «допускового контроля» и отдельных специализированных алгоритмов;

Н [email protected] © Ассоциация «ТП «НИСС», 2020

• существующие системы контроля определяют факт возникновения нештатных ситуаций (Н111С) только при превышении значений контролируемых параметров заданных допустимых уровней;

• конечное определение результатов анализа выполняется специалистом и зависит от его квалификации, что, рано или поздно, может привести к проявлению «человеческого фактора» и потенциальной ошибке.

Альтернативным вариантом анализа ТМИ КА, разрешающего выше обозначенные недостатки, является интеллектуальный метод кластерного анализа данных. Предлагаемый метод позволяет не только осуществлять контроль текущего состояния, но и определять момент возникновения предвестников НШС, и, тем самым, прогнозировать появление НШС

1. Анализ текущего состояния технологии анализа ТМИ при управлении полетом

На практике при управлении полетом КА технология анализа ТМИ имеет некоторые особенности.

Анализ ТМИ, поступающей от КА, осуществляется с использованием так называемого метода «допускового контроля» [2], при котором производится определение величины телеметрических параметров (ТМП) и сравнение их с предельны-152 ми или планируемыми величинами. В результате формируется результат анализа о состоянии и функционировании КА и его составных частей. Предельные величины ТМП содержатся в эксплуатационной документации на КА и устанавливаются при разработке КА.

Также используются отдельные специализированные алгоритмы автоматизированного контроля ТМИ, которые строятся на основе очевидных физических зависимостей, свойственных той или конкретной конструкции составной части КА. Данные методы хотя и позволяют осуществить анализ технического состояния КА, имеют перечисленные выше недостатки, проявление которых может возникнуть в описанных ниже ситуациях.

Во-первых, характерной особенностью контроля полета современных КА является наличие большого количества взаимосвязей между параметрами состояния КА и, как следствие, их взаимовлияние. Это диктует необходимость использования в ходе полета КА сложных методов и алгоритмов комплексной оценки параметров состояния и анализа их отклонений от нормы.

Необходимо обратить внимание и на такой вид отклонения состояния КА от номинального или запланированного, при котором все контролируемые величины ТМП находятся в допустимых пределах, но комбинация текущих фактических величин некоторых из них является аномальной, что с течением времени может привести к выходу их величин за установленные предельные уровни, то есть к появлению НТТТС Это происходит, например, когда на КА идут одновременно два процесса, но не наступила стадия их развития, приводящая к выходу каких-либо величин ТМП за допустимые границы. Обнаружение, локализация и идентификации подобных аномалий являются предметом отдельных исследований [1].

Во-вторых, становится очевидным, что современные методы анализа ТМИ хотя и позволяют обнаружить факт возникновения НТТТС, делают это только в момент выхода контролируемого ТМП за допустимые пределы. Таким образом, при использовании данных алгоритмов, от запаса располагаемого времени на парирование НТТТС утра-

Том 4

чивается временной интервал между моментом времени появления аномалии (возникновения предвестника НТС) и моментом времени ее обнаружения [2].

В-третьих, контроль состояния КА оператором предполагает постоянное выполнение однотипных простых операций и непрерывной концентрации внимания в условиях поступления слабо изменяющихся значений контролируемых параметров. При возникновении такого состояния снижается внимание человека, увеличивается нагрузка, возрастает возможность принятия неверных решений, что является особенно опасным для пилотируемых КА. Уменьшается надежность человека в человеко-машинной системе, притупляется его бдительность. Данные обстоятельства приводят к возникновению так называемого «человеческого фактора».

На основании вышесказанного становится очевидным, что необходимо создавать методы, позволяющие автоматизировать процесс анализа ТМИ в системе контроля функционирования КА. При этом задачи, решамые оператором, смещаются в область анализа причин нежелательных процессов и аномалий при их обнаружении.

2. Метод кластерного анализа для решения задач автоматизации и интеллектуализации процесса анализа ТМИ КА

В основу построения системы контроля в части решения задач анализа ТМИ КА должны быть заложены принципы автоматизации и интеллектуализации. Их реализация связана с созданием методов анализа, сводящих к минимуму участие оператора управления полетом КА.

На сегодняшний день разработано большое количество математических методов, позволяющих выявить в большом объеме данных ранее не обнаруженных, спорадических, но практически пригодных знаний, которые могут быть использованы при управлении различными процессами, в том числе в технической сфере. Совокупность данных методов носит название «интеллектуальный анализ данных».

В данной работе изложено исследование применения одного из методов интеллектуализации контроля - кластерного анализа [3], направленного на определение момента возникновения аномалий как предвестников НТТТС, позволяющего автоматически и заблаговременно определять ее потенциальное возникновение.

К преимуществам предлагаемого метода кластерного анализа по сравнению с использующимися методами анализа можно отнести следующее:

• отсутствие необходимости в знании предварительно заданных параметров состояния КА;

• автоматическое установление и отслеживание взаимосвязи между всеми возможными ТМП, содержащимися в ТМИ КА;

• универсальность в части контроля состояния различных составных частей КА или конструктивно различных КА;

• заблаговременность определения момента возникновения аномалии;

• учет информации о предыдущих характерных наблюдаемых номинальных состояниях КА.

3. Предложение по применению перспективного интеллектуального метода заблаговременного определения аномалии как предвестников НШС

Данные, которые передаются в составе ТМИ КА, содержат ТМП состояния КА. Часть этих ТМП измеряются датчиками, входящими в состав системы бортовых измерений и необходимы для осуществления управления полетом КА как средствами бортового комплекса управления КА, так и наземными средствами управления. Поскольку указанные ТМП передаются на землю «порционно» в составе телеметрического кадра или пакета, то будем их использовать для создания кластеров и последующего анализа. При этом значения ТМП, сформированные на борту КА в одно и то же время, будут образовывать многомерный вектор состояния. Таким образом, под вектором технического состояния КА или его составной части (далее просто вектор) будем понимать многомерный вектор Рт, образованный значениями ТМП р, на определенный момент времени tm:

* = *т ■ Рт Р2>."> Рг ,-Рп } 1 ^ * ^ П

где п - количество ТМП, описывающих функционирование системы.

Процедурам кластеризации мы будем подвергать получаемые векторы.

С точки зрения применения кластерного анализа, как метода анализа состояния функционирования КА, можно выделить два этапа: обучение и анализ (рис. 1).

1. На этапе обучения выполняется создание модели номинального функционирования КА по ТМИ, полученной на этапе штатного функционирования КА.

Величины ТМП, по которым осуществляется контроль составной части КА, формируют вектор в многомерном пространстве, привязанный к шкале времени. Эти векторы кластеризуют, т. е. разделяют на группы. Таким образом, в многомерном векторном пространстве формируются области. Если при этом любыми другими способами анализа не зафиксировано отклонений или НТТТС, то эти области соответствуют номинальному

функционированию КА. Эти области называются номинальными рабочими областями и сохраняются в базе знаний номинального функционирования.

2. На этапе анализа производится анализ состояния КА.

В режиме реального времени поступает текущая ТМИ, из значений параметров которой образуются векторы. Для каждого такого вектора определяется отклонение от ближайшего номинального кластера, полученного на этапе обучения. Формируется специальный параметр А, для которого его отрицательное значение будет соответствовать номинальному функционированию КА, а положительное значение - случаю нахождения вектора вне границ номинальной области функционирования:

Л = Р(хг, хк )-Р

тах 'к ■

где

Р(Х, Хк ) =

1е Хке )2 , е = 1, п значение ев-

клидова расстояния от текущего вектора до центра ближайшего для него кластера, р ™х - значение расстояния между ^ым центром кластера (центроидом) и наиболее удаленным вектором от ^го центроида, относящегося к ^му кластеру, т. е. радиус ^го кластера.

Рис. 1. Принципиальная схема работы интеллектуальной системы контроля на основе метода кластерного анализа

153

е=1

Вектор, соответствующий номинальному функционированию, т. е. вошедший в соответствующий кластер, в дальнейшем добавляется к номинальной базе данных, таким образом уточняя ранее построенную модель номинального функционирования КА. Если анализируемый вектор не соответствуют норме, фиксируется отклонение и происходит предупреждение оператора о возникновении аномалии.

4. Формулирование условий выбора методов и критериев 154 кластеризации

В процессе орбитального полета КА постоянному контролю подвергаются все виды параметров состояния КА и его составных частей. Комплексная оценка состояния и функционирования КА должна дать ответ с высокой степенью достоверности на следующие вопросы [2]:

• возможно ли реализовать запланированную программу полета КА;

• соответствует ли запланированной программе полета состояние КА и его составных частей;

• адекватны ли реакции составных частей КА на формируемые управляющие воздействия как от бортового комплекса управления, так и от наземного комплекса управления;

• устойчив ли информационный обмен между наземным комплексом управления и КА;

• соответствуют ли технические характеристики КА заданным требованиям.

Контролю должны подлежать все процессы и составные части КА с учетом внешних воздействующих факторов и ограничений на процесс орбитального полета КА. Высшим приоритетом в процессе контроля при управлении полетом является задача обеспечения безопасности экипажа пилотируемого КА и безопасности автоматического КА [2].

При определении условий выбора методов и критериев кластеризации необходимо учитывать, в первую очередь, цели, которые преследуются при решении задач контроля при управлении полетом КА. С учетом этих задач, а также необходимости в осуществлении анализа в режиме реального времени непрерывно в течение всего периода орбитального полета, условия выбора можно сформулировать следующим образом:

• способность определять аномалии и НШС, не рассмотренные в документации и не прогнозируемые аналитически;

• адекватность результатов, т. е. в процессе анализа ТМИ должны получаться достоверные данные, соответствующие реальному функционированию КА и его составных частей;

• решение задачи анализа ТМИ в масштабе времени, максимально близкому к реальному;

Том 4

• высокая чувствительность, т. е. максимально возможное заблаговременное определение предвестника возникновения НШС или какого-либо проявления аномалии или отклонения в функционировании или состоянии составных частей КА;

• автоматическая реализация процесса анализа, при котором оператор непосредственно не участвует, а получает только результат работы предлагаемого метода.

В соответствии с вышеобозначенными условиями для дальнейшего сравнения аналитически были выбраны три метода кластеризации: метод k-средних (k-means), метод нечеткой кластеризации с-средних (fuzzy c-means) и метод распространения близости (affinity propagation [AP]). Основными причинами такого выбора были стремление попробовать с одной стороны различные методы, а с другой стороны относительно простые, т. е. способные работать с ТМИ, поступающей в режиме реального времени.

5. Математическое описание методов кластеризации

Метод k-средних (k-means) [6]. Алгоритм разделительной кластеризации, реализует разнесение векторов на предварительно определенное число кластеров k посредством следующих итерационных действий:

1. Первичное спорадическое разнесение, задать точность 5 для завершения алгоритма, номер итерации l = 0 и определить случайным образом количество кластеров k.

2. Расчет центроидов кластеров осуществляется как:

Z ui1

m,

(О _ i1

С ' =

1 < i< k, 1 <j<d,

Z ■

j=1

(i-i)

где mj - ]-й исходный вектор, а - количество исходных векторов.

3. Для уменьшения квадрата ошибок пересчитать матрицу разбиения:

u а 1 =■

1 при d m, , c (11= min d m, , c 91 I

4 J ' 1<k<c 4 J '

4. Сравнить выполняется, заве

0 в остальных случаях

и(> - и(-1> | | < 5. Если условие зшить процесс, если нет - перейти к действию 2 с номером итерации I = I + 1.

При каждом повторении выполняется уточнение границ кластеров и перемещение центроидов кластеров. Происходит уменьшение расстояния между векторами внутри кластеров.

Алгоритм завершается при условии, что границы кластеров и расположение центроидов

перестанут перемещаться при повторении действий. Это означает, что векторы распределены по кластерам.

Метод k-means является простым вычислительным алгоритмом кластеризации. Нашел применение для самых разнообразных типов данных. Метод признан достаточно эффективным, даже с учетом многочисленных пересчетов. Однако существуют и недостатки, к которым относится неопределенность выбора начального положения центроидов кластеров и спорадический принцип начального определения числа кластеров, для чего нужна априорная информация об исходных данных. Также к минусам можно отнести большую чувствительность алгоритма к значительным отклонениям векторов, что, как минимум, затормозит работу на большом количестве данных. Он плохо работает в случае несферических кластеров, кластеров разных размеров и плотностей, также может находить «лишние кластеры» в случае, если было задано большое значение k.

Метод нечеткой кластеризации с-средних (fuzzy c-means) [6]. Наиболее известный метод нечеткой кластеризации - алгоритм с-средних. Метод определяет плотные кластеры, как правило, формы многомерной сферы. Метод также реализует последовательные итерационные действия:

1. Начальная инициализация - выбрать количество кластеров 2 <c < d, параметр остановки 5, коэффициент нечеткости we(1; +да), задать случайно выбранными значениями матрицу разбиения.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. Расчет положения центроидов кластеров:

m.

ДО - j=1 ci ~ d

zk11У

1 < i < c, 1 < j < d.

j=i

3. Определение квадратов расстояний от вектора до всех центроидов кластеров:

ё2А т,с«)=(с« - mJ Ул(о<р - т^),

где матрица A задает метод вычисления расстояния между векторами.

4. Пересчет матрицы разбиения:

u1=

1

fdj (mj, с«)

dA ( mj, с<*1)

z

для всех 1 < I < c, 1 <у < d. С выполнением условия

с <3

ич Ф; 4 Е ич= 1; 0 <Е и» <й ■ ¿=1 ]=1

5. Сравнить ||| ) - и-1) | | < 5. Если условие выполняется, алгоритм кончается, в противном

случае - перейти к действию 2 с номером итерации l = l + 1.

Метод нечеткой кластеризации позволяет решить проблему для векторов, которые могут попасть на границу двух кластеров - им задают величину принадлежности, равную 0,5 [7]. Основной недостаток данного метода состоит в работе с векторами, удаленными от центроидов всех кластеров. Такие векторы сложно отнести к какому-либо из кластеров, однако присвоение малой степени принадлежности не решает проблему, поскольку сумма их степеней принадлежностей такая же, как и для векторов, близких к центроидам кластеров, 155 т. е. равна единице.

Одним из параметров алгоритма кластеризации является коэффициент нечеткости w. Чем больше w, тем конечная матрица разбиения U становится более размытой, и при w ^ да она примет вид U = [1/c], что говорит о том, что векторы могут быть отнесены ко всем кластерам, и, соответственно, метод не выполнил свою основную задачу по определению похожести векторов, сделав их одинаково похожими.

Метод распространения близости (affinity propagation) [8]. Еще один пример алгоритма кластеризации представлен на рис. 4. В отличие от алгоритма k-средних, данный метод не требует заранее определять число кластеров, на которое будут разбиты исходные векторы. Основная идея алгоритма заключается в том, что векторы разделяются по группам на основе того, как они «общаются», или насколько они похожи друг на друга.

Вводятся матрицы схожести S, ответственности R и доступности A. Для заполнения элементов матрицы схожести S вводят какую-нибудь метрику «похожести», определяющуюся тем, что s(xi, Xj) > s(xi, xk) если вектор xi больше похоже на вектор Xj, чем на xk. Простым примером такой похожести будет отрицательное евклидово расстоя-

(х > xj )=

ние s \х,, х , j = -IX - x j.,

Однако для 1 =у необходимо, чтобы s(xi, ху) Ф 0. Фактически, существует несколько возможных стратегий для того, чтобы определить матрицу схожести вектора с самим собой:

s(i, г) = -X или s(i, г) = -Medianj ])) .

Далее необходимо заполнить матрицу ответственности Я и матрицу доступности A. Сначала эти матрицы инициализируются нулями. После этого данные матрицы обновляются по очереди по правилам:

ri,k = s(x,, xj)- maxjfl,,k + , xk)}

-maxv

k *k

(1)

0, rkk +

z

m{i,k}

maxio, r

i0, rik )

i Ф k, (2)

k =1

ai.k= т1П

2 max(0' ).

(3)

Расчет элементов матриц A и R по формулам (1)- (3) повторяется несколько раз (количество итераций T устанавливается пользователем), после чего векторам c присваиваются номера кластеров в соответствии со следующим правилом:

С = argmax (a,к + гг,к) .

При обновлении матриц R и A используется присваивание с экспоненциальным сглаживанием с коэффициентом 0,5 < а < 1:

Ri] = а- R[i] + (1 -а)- R[i -1].

Том 4

где N - количество векторов в исходном наборе, k - количество кластеров, B - матрица внутренней дисперсии (сумма квадратов расстояний между центроидами и средним по всем векторам), W - матрица внешней дисперсии (сумма квадратов расстояний между всеми векторами и ближайшим центроидом).

Данный индекс характеризует компактность кластеров и их удаленность друг от друга.

3. Индекс Дэвиса-Болдина (Davies-Bouldin Index) [10]:

1 k

DBI = - Y k^-t

(

max

i* j

s + s

\

j

d„

6. Математическое описание критериев кластеризации

Процедура разбиения анализируемых данных на кластеры должна подчиняться определенным правилам или критериям. В первую очередь, критерий кластеризации основывается на минимизации (или максимизации) показателя качества. Для задач интеллектуального анализа данных и опытной апробации на архивной ТМИ, с учетом выше обозначенных условий, были выбраны следующие критерии:

1. Силуэтный коэффициент (Silhouette Coefficient [SC]) [8]:

b - a

s = -

(a,b)'

тах^а.

где а - среднее расстояние между вектором и всеми другими векторами этого кластера, Ь - среднее расстояние между вектором и другими векторами ближайшего кластера.

Величина 5 изменяется в пределах от —1 до +1. Значение «—1» означает неправильную кластеризацию (все векторы расположены в центрах некоторого другого кластера), величина «+1» соответствует наилучшему разбиению на кластеры (все векторы расположены точно в центрах их кластеров), величина «0» означает, что векторы расположены в среднем на одинаковом расстоянии от центра кластера их принадлежности до центра соседнего кластера.

Таким образом, чем выше значение силуэтного коэффициента (ближе к +1), тем лучше данное решение распределяет объекты по кластерам. Значение силуэтного коэффициента обычно делится на три интервала:

• плохое качество разделения: от —1 до 0,2;

• среднее качество разделения: от 0,2 до 0,5;

• хорошее качество разделения: от 0,5 до 1.

2. Индекс Калинского-Харабаза (СаИткл-

Harabaz Index) [9]:

CHI =

B N - k

W k -1

где к - количество кластеров, si - среднее расстояние между каждым вектором кластера i и центроидом этого кластера, - расстояние между центроидами кластеров i и].

Индекс Дэвиса-Болдина характеризует величину среднего разброса кластеров. При его уменьшении растет расстояние между кластерами и уменьшаются их размеры.

6. Апробация

Исходными данными для апробации способа автоматического определения момента возникновения аномалий в состоянии КА является архивная ТМИ от составной части транспортного пилотируемого корабля (ТПК) типа «Союз». Контроль состояния и функционирования данной составной части ТПК осуществляется по показаниям 8 ТМП, которые измеряются датчиками температуры (4 шт.) и давления (4 шт.).

Для этапа обучения построены многомерные векторы, привязанные к шкале времени и содержащие 4 значения температуры (Т58, Т60, Т62, Т63) и 4 значения давления (ДБН1, ДБН2, ДПР1, ДПР2). Применена архивная ТМИ, полученная при полете ТПК, происходившего без каких-либо аномалий и отклонений в работе данной составной части.

Для этапа анализа использована архивная ТМИ, полученная при полете ТПК, в работе составной части которого было зафиксировано аномальное поведение. Рассматриваются все возможные совокупности методов (к-средних, с-средних, АР) и критериев ^С, СН1, DBI) кластеризации. Определяется совокупность, которая позволит раньше всего определить аномалию в функционировании рассматриваемой системы. Результаты работы предлагаемого метода представлены ниже.

На рис. 2 момент обнаружения аномалии определяется как переход значения параметра А из области отрицательных значений в область положительных.

157

Рис. 2. Зависимость параметра Ааном для векторов, соответствующих аномальной работе составной части ТПК, полученная при использовании метода к-средних и критерия 8С фВГ)

Рис. 3. Зависимость параметра Ааном для векторов, соответствующих аномальной работе составной части ТПК, полученная при использовании метода с-средних и критерия 8С

Даном

Фактическое

обнаружение аномалии

|б/13 и 01/07/13 01/08/13 01/09/13 01/10/13 01/11/13

Рис. 4. Зависимость параметра Ааном для векторов, соответствующих аномальной работе составной части ТПК, полученная при использовании метода АР и критерия DBI

158

В табл. 1 представлены итоговые значения времен обнаружения аномалии.

Таблица 1

Итоговые значения времен обнаружения аномалии

k-средних с-средних AP

SC (ASC) 15.08.2013 21:10:44.322 06.08.2013 23:41:00.394 Аномалия не обнаружена

CHI (ACHI) 25.07.2013 05:20:49.586 19.08.2013 10:05:10.148 Аномалия не обнаружена

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

DBI (ADBI) 15.08.2013 21:10:44.322 27.07.2013 03:41:10.171 Аномалия не обнаружена

^средних с-средних AP

SC (ASC) 53 дня 16 часов 24 минуты 62 дня 13 часов 54 минуты -

CHI (ACHI) 75 дней 8 часов 14 минут 50 дней 3 часа 30 минут -

DBI (Adbi) 53 дня 16 часов 24 минуты 73 дня 9 часов 54 минуты -

Том 4

необходимо располагаться ближе к ней, чем при использовании методов ^средних и с-средних, т. к. для данных двух методов количество получившихся кластеров k меньше, следовательно, размеры номинальных областей больше.

Для систем контроля, работающих в режиме реального метода, существенным является вычислительная сложность алгоритмического аппарата методов анализа. В табл. 3 представлена вычислительная сложность используемых методов и критериев.

Таблица 3

Вычислительная сложность используемых методов и критериев

Фактическое время обнаружения аномалии соответствует 08.10.2013 13:34:49.987. В табл. 2 представлены данные в интервале времени между временем обнаружении аномалии автоматизированным методом и фактически зафиксированным при реальном полете.

Таблица 2

Интервалы времен обнаружения аномалии

Метод Сложность метода Критерий Сложность критерия

k-средних O(nkdi) SC O(n2d)

с-средних O(nk2di) CHI O(kd)

AP O(n2i) DBI O(k2d)

При применении всех рассматриваемых методов кластеризации, кроме метода АР, удалось обнаружить аномалию раньше, чем при фактическом времени ее обнаружения. Анализируя результаты, полученные при применении метода АР, параметр Ааном практически на протяжении всего полета был положительным, т. е. рассматриваемая система с точки зрения используемого метода анализа по параметру А постоянно находилась в аномальном состоянии, что не соответствовало действительности. Причина такого поведения Ааном для метода АР, вероятнее всего, связана со слишком большим количеством кластеров k, получаемом при применении данного метода. В результате получается завышение количества кластеров, т. е. происходит разделение сформированных кластеров на более мелкие по размеру кластеры, из-за чего уменьшаются размеры номинальных областей. Тогда вновь анализируемому вектору, в случае использования метода АР, для попадания в номинальную область

В табл. 3 n - количество векторов, d - размерность векторов, k - количество кластеров, i - количество итераций, необходимых для сходимости алгоритма.

Сравнивая используемые методы кластеризации, можно отметить, что вычислительная сложность метода AP является квадратичной, т. к. зависит от квадрата количества входных данных n, в то время как сложность методов k-средних и с-средних является линейной по отношению к количеству входных данных n. Сравнивая метод k-средних с методом с-средних можно отметить, что сложность второго в k раз больше, чем у первого. Несмотря на то, что при получившихся оптимальных значениях количества кластеров k (табл. 3) их сложность является сопоставимой, при отыскании оптимальных параметров метода с-средних необходимо, помимо количества кластеров, варьировать значение коэффициента нечеткости w, что увеличивает вычислительную сложность при использовании данного метода.

Таким образом, выбор методов кластеризации с точки зрения вычислительных затрат при их использовании стоит осуществлять в следующем порядке: k-средних, с-средних, AP.

Сравнивая используемые критерии кластеризации, можно отметить, что вычислительная сложность критерия SC является квадратичной, т. к. зависит от квадрата количества входных данных n. Сложность критериев CHI и DBI не зависит от n, т. е. их вычислительная сложность существенно меньше, чем у SC. Сравнивая критерий CHI с критерием DBI, можно отметить, что сложность DBI в k раз больше, чем у CHI. Однако, при получившихся оптимальных значениях количества кластеров k (табл. 3), их сложность является сопоставимой.

Заключение

Рассмотрение текущего состояния технологии анализа ТМИ при управлении полетом КА показывает, что современные методы имеют ряд существенных недостатков. Следствием этого является необходимость создания методов, позволяющих автоматизировать процесс контроля функционирования КА и интеллектуализировать процедуры анализа ТМИ. В качестве применения одного из методов интеллектуализации контроля предлагается кластерный анализ данных, позволяющий автоматически и заблаговременно определять момент возникновения аномалий в состоянии КА и его составных частей, что является предвестником НШС. Основным преимуществом использования данного метода является способность выявить в большом объеме дан-

ных ранее не обнаруженных, спорадических, но практически пригодных знаний, которые могут быть использованы для обеспечения дальнейшего процесса управления полетом КА. Ключевым моментом кластерного анализа является «определение похожести» векторов, поэтому, исходя из практических задач, решаемых в процессе анализа ТМИ при управлении полетом КА, сформулированы условия выбора метода и критерия кластеризации.

Использование совокупности метода k-средних и критерия CHI позволило обнаружить момент возникновения аномалии раньше всего. Исходя из сформулированных условий выбора метода и критерия кластеризации, для заданных исходных данных предпочтительной является совокупность метода кластеризации k-средних и критерия кластеризации CHI.

159

Список литературы

[1] Соловьев С. В. Мишурова Н. В. Анализ текущего состояния процесса контроля при управлении полетом космических аппаратов // Инженерный журнал: наука и инновации. 2016. вып. 3 (51). [Электронный ресурс]. URL: http://engjournal.ru/catalog/arse/adb/1474.html. doi: 10.18698/2308-6033-2016-3-1474.

[2] Соловьев В. А., Лысенко Л. Н., Любинский В. E. Управление космическими полетами. Ч. 2. М. : Изд-во МГТУ им. Н. Э. Баумана, 2010. 426 с.

[3] Барсегян А. А., Куприянов М. С., Степаненко В. В., Холод И. И. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP. 2-е изд. СПб. : Изд-во БХВ-Петербург, 2007. 384 с.

[4] Кластеризация данных при помощи нечетких отношений в Data Mining [Электронный ресурс]. URL: https:// ami.nstu.ru/~vms/lecture/data_mining/fuzzy.htm (дата обращения 08.12.2019).

[5] Соловьев В. А., Любинский В. Е., Жук Е. И. Текущее состояние и перспективы развития системы управления полетами космических аппаратов // Пилотируемые полеты в космос. 2012. № 1 (3). С. 15-26.

[6] Ведерникова М. М., Скурский Ю. А., Спирин А. И. Контроль работы сложных технических систем. Средства информационной поддержки // Труды XVII междунар. конф. «Проблемы управления и моделирования в сложных системах». 2015. С. 115-125.

[7] Frey B. J., Dueck D. Clustering by Passing Messages Between Data Points // Science. 2007. vol. 315. issue 5814. pp. 972-976. doi: 10.1126/science.1136800.

[8] Rousseeuw P. J. Silhouettes: a Graphical Aid to the Interpretation and Validation of Cluster Analysis // Computational and Applied Mathematics. 1987. vol. 20. issue 1. pp. 53-65. doi: 10.1016/0377-0427(87)90125-7.

[9] Calinski T., Harabasz J. A dendrite method for cluster analysis // Communications in Statistics. 1974. vol. 3. issue 1. pp. 1-27. doi: 10.1080/03610927408827101.

[10] Davies D. L., Bouldin D. W. A Cluster Separation Measure // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1979. vol. PAMI-1. issue 2. pp. 224-227. doi: 10.1109/TPAMI.1979.4766909.

JUSTIFICATION OF THE CHOICE OF THE METHOD AND CRITERION OF CLUSTERING FOR INTELLIGENT ANALYSIS IN FLIGHT CONTROL SPACECRAFT

S. V. Soloviev

Bauman Moscow State Technical University, Moscow, Russian Federation

The article examines the methods of intelligent analysis of telemetric information of spacecraft. The current state and main shortcomings of the control process during the spacecraft flight

Том 4

control are briefly given. It is proposed to eliminate the shortcomings by introducing intel-lectualization procedures in terms of telemetric information analysis. Based on the methods of cluster data analysis, a method is proposed for automatically determining the moment of occurrence of anomalies in the state of a spacecraft, which are precursors of off-nominal situations. A schematic diagram of the operation of an intelligent control system based on the use of the method of cluster analysis of the spacecraft telemetric information is presented. The conditions for choosing the method and criterion for clustering are substantiated, taking into account the goals pursued in solving control problems during flight control of the spacecraft. A mathematical description of the clustering methods and criteria selected for further practical testing is given. To test the proposed method of analysis for various methods and criteria of clustering, calculations were performed using archived telemetric information. From the point of view of the time of early detection of the anomaly in the state for a separate component of 160 the spacecraft, the choice of the method and criterion of clustering is made for further research

and experimental work.

Keywords: space flight control, control system, data mining, clustering, off-nominal situation.

References

[1] Soloviev S. V., Mishurova N. V. Analiz tekushchego sostoyaniya processa kontrolya pri upravlenii poletom kosmicheskih apparatov [Analysis of the current state of the control process during spacecraft flight control] // Engineering Journal: Science and Innovation, 2016, issue 3 (51). Available at.: http://engjournal.ru/catalog/arse/ adb/1474.html. doi: 10.18698/2308-6033-2016-3-1474. (In Russian)

[2] Soloviev V A., Lysenko L. N., Lyubinsky V E. Upravlenie kosmicheskimipoletami [Space flight control]. Moscow, Publishing house of MSTU im. N. E. Bauman, 2010, 426 p. (In Russian)

[3] Barsegyan A. A., Kupriyanov M. S., Stepanenko V. V., Kholod I. I. Tekhnologii analiza dannyh: Data Mining, Visual Mining, Text Mining, OLAP [Data analysis technologies: Data Mining, Visual Mining, Text Mining, OLAP]. St. Petersburg, Publishing house BHV-Petersburg, 2007, 384 p. (In Russian)

[4] Klasterizaciya dannyh pri pomoshchi nechetkih otnoshenij v Data Mining [Data Clustering Using Fuzzy Relationships in Data Mining]. Available at: https://ami.nstu.ru/~vms/lecture/data_mining/fuzzy.htm (accessed 08.12.2019). (In Russian)

[5] Soloviev V A., Lyubinsky V E., Zhuk E. I. Tekushchee sostoyanie iperspektivy razvitiya sistemy upravleniyapoletami kosmicheskih apparatov [Current state and development prospects of the spacecraft flight control system] // Manned Spaceflight, 2012, no. 1 (3), pp. 15-26. (In Russian)

[6] Vedernikova M. M., Skursky Yu. A., Spirin A. I. Kontrol' raboty slozhnyh tekhnicheskih sistem. Sredstva informacionnoj podderzhki [Control of the work of complex technical systems. Information support tools]. Proceedings of the XVII International Conference «Problems of Control and Modeling in Complex Systems», 2015, pp. 115-125. (In Russian)

[7] Frey B. J., Dueck D. Clustering by Passing Messages Between Data Points // Science, 2007, vol. 315, issue 5814, pp. 972-976. doi: 10.1126/science.1136800.

[8] Rousseeuw P. J. Silhouettes: a Graphical Aid to the Interpretation and Validation of Cluster Analysis // Computational and Applied Mathematics, 1987, vol. 20, issue 1, pp. 53-65. doi: 10.1016/0377-0427(87)90125-7.

[9] Calinski T., Harabasz J. A dendrite method for cluster analysis // Communications in Statistics, 1974, vol. 3, issue 1, pp. 1-27. doi: 10.1080/03610927408827101.

[10] Davies D. L., Bouldin D. W. A Cluster Separation Measure // IEEE Transactions on Pattern Analysis and Machine Intelligence, 1979, vol. PAMI-1, issue 2, pp. 224-227. doi: 10.1109/TPAMI.1979.4766909.

Сведения об авторе

Соловьев Сергей Владимирович - кандидат технических наук, доцент кафедры СМ-3 МГТУ им. Н. Э. Баумана. Окончил МГТУ им. Н. Э. Баумана в 1993 году. Область научных интересов: управление космическим полетом, интеллектуальные методы анализа информации.

i Надоели баннеры? Вы всегда можете отключить рекламу.