ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И СИСТЕМЫ
УДК 681.326
В. И. Сеньченков
ПРОЦЕДУРА ОБУЧЕНИЯ ПРИ РАЗРАБОТКЕ МОДЕЛЕЙ КОНТРОЛЯ ТЕХНИЧЕСКОГО СОСТОЯНИЯ СЛОЖНЫХ СИСТЕМ
Рассматриваются известные процедуры обучения при построении математических моделей систем как объектов контроля технического состояния. Предложена новая процедура группировки обучающих образов и ранжирования групп, позволяющая ускорить сходимость процесса обучения. Проанализированы особенности и преимущества обучения с применением ортонормированного тригонометрического базиса в моделях контроля правильности функционирования сложных систем.
Ключевые слова: процедура обучения, техническое состояние, обучающая выборка, рекуррентное соотношение, группировка и ранжирование, ортонорми-рованный базис.
Введение. При разработке математических моделей контроля технического состояния сложных систем следует учитывать, что априори заданная информация об исследуемой системе в общем случае является неполной и неоднородной. Поэтому необходимо применять методы, которые позволяют преодолевать факторы неполноты и неоднородности информации и в целом адекватно отображать свойства системы как объекта контроля (ОК) технического состояния.
В работах [1, 2] предложен новый подход к преобразованию траекторий выходных процессов ОК на основе теории пространств измеримых функций и интеграла Лебега. В результате преобразования траектории формируется вектор Y<n>, координаты которого представляют собой числа, используемые в качестве контролируемых признаков. Этот вектор называется наблюдаемым состоянием системы [1].
Целью настоящей статьи является усовершенствование известных процедур обучения [3, 4] при формировании изображений видов технического состояния ОК. Под изображением понимается формальное представление вида технического состояния как составной части математической модели ОК.
Постановка задачи обучения. Пусть задан перечень всех видов технического состояния ОК
0 = [д | г = 1т}; (1)
определен состав контролируемых признаков
Y<и>= [У} | 7 = ~п}; (2)
сформирована ограниченная по объему обучающая выборка реализаций наблюдаемых состояний, принадлежность которых каждому виду технического состояния ОК известна:
¡У<п>к\к = 1, N Че 7 1-
{к\к = 1, N2 }е 72-
(3)
У<п>к \ к = 1, ^ 7т
где У1 (/ = 1, т ) — подмножество наблюдаемых состояний, принадлежащих /-му виду технического состояния ОК; N — мощность множества элементов, принадлежащих подмножеству 7<п>. Каждое из подмножеств У1 с топологической точки зрения представляет собой область в и-мерном евклидовом пространстве 7.
На основе исходных данных (1)—(3) требуется построить изображения т —
Е/ = (ец, е12,. ., ет) (1 = 1, т), которые наилучшим образом (например, в смысле достоверности распознавания текущего технического состояния ОК) отражают свойства соответствующих видов технического состояния qi (/ = 1, т ).
Теоретические основы обучающей процедуры. Как уже отмечалось, обучающая выборка (3) в общем случае является неоднородной и ограниченной по объему. Следовательно, для обучения необходимо использовать методы непараметрической статистики [5], которые позволяют обрабатывать неоднородную статистическую информацию в малом объеме. Данная задача может быть решена методом стохастической аппроксимации с использованием итеративного градиентного поиска.
Для каждого подмножества У1 аппроксимируется разделяющая гиперплоскость И/ в и-мерном евклидовом пространстве 7. Поскольку неизвестное изображение Е/ является
опорной точкой подмножества 71 и может считаться неизменным, параметр И/ допустимо трактовать как непрерывную функцию:
И = И (У<п>), И/ е С(У), (4)
где С(У) — множество непрерывных функций, заданных в пространстве 7.
В дальнейшем И/ называется разделяющей функцией. Предполагается, что она неизвестна, но обеспечивает максимальную точность при распознавании текущих технических состояний. Поэтому следует выбрать класс аппроксимирующих функций И(Е/, У<п>), с помощью которых ищется наилучшее приближение к разделяющей функции. Мера отклонения аппроксимирующих функций от аппроксимируемой определяется как математическое ожидание случайной выпуклой функции Н от разности И - И(Е/, У) :
ЦЕ/) = М[Н(И/ -И(Е/,У))]. (5)
*
Наилучшая аппроксимация соответствует получению такого вектора Е/ = Е/, при котором достигается точная нижняя граница функционала (5):
ЦЕ*) = М {М[Н(И/ - И(Е/,У))]},
Rn
— и-мерное вещественное пространство.
Следует иметь в виду, что плотность распределения случайной функции Н() неизвестна, поэтому неизвестно и ее математическое ожидание. По этой причине функционал (5) не может быть задан в явном виде. Единственная возможность определения искомого вектора
Процедура обучения при разработке моделей контроля технического состояния сложных систем 5 * /-
Еу состоит в том, чтобы воспользоваться отдельными реализациями, полученными в процессе использования векторов У из обучающей выборки.
Процедура обучения значительно упрощается, если применять разложение аппроксимирующей функции по ортогональному или ортонормированному базису О(У) = (У) | ] = 1, п} , согласно выражению
И(Ег, У) = Е]0 (У) = £ eljgj (У). (6)
7=1
С учетом соотношения (6) выражение для функционала (5) принимает вид
ЦЕу) = М [Н(Н - ЕТ0 (У))]. (7)
Далее базис О(У) называется О -преобразованием вектора У .
Так как выражение функционала (7) неизвестно, для поиска его точной нижней границы используются измеренные градиенты реализаций. Условие экстремума (7) может быть записано в виде уравнения
§гаё Ь(Е1) = М ^гаё #(Н - Е[ О (У))] = 0, (8)
где
(дЦЕ,) дВД) дЬ(Е1)> Вгаё Ь(Е) = —^,—^ ,...,—
I де11 де12 де1п )
(дИ (Еу) дН (Еу) дН (Еу) ^
де11 ' де12 де1п )
§гаё #(•) = д(-)
--частная производная по координате е1,-.
деч
Если функционал Ь(Еу) выпуклый и имеет единственный экстремум, то соотношение
(8) представляет собой необходимое и достаточное условие существования данного экстре*
мума. В этом случае корень уравнения (8) дает оптимальное значение вектора Еу = Еу . В работе [4] показано, что если использовать квадратичную меру отклонения аппроксимирующей функции от аппроксимируемой
Н(Еу, У) = (Ну - ЕТО (У))2,
а в качестве вектор-функции О (У) выбрать полную систему ортонормированных функций gj (У) (7 = 1, п), то минимизация функционала (8) обеспечивается посредством использования в процессе обучения алгоритма Роббинса—Монро. Данный алгоритм применительно к рассматриваемой задаче может быть представлен в виде рекуррентного соотношения
Еу (к) = Е} (к -1) - ак [Еу (к -1) - О(У(к))], (9)
где ак (к = 1,2,...) — элемент последовательности положительных чисел, удовлетворяющий следующим условиям:
<ю <ю
Нт ак = а £ ак = ^ Е а2 < ю .
к=1 к=1
Примером такой последовательности является гармонический ряд
{1/к} = {1,1/2,1/3,...}. (10)
С учетом (10) рекуррентное соотношение принимает вид
Е/ (к) = Е/ (к -1) - к-Щ- (к -1) - 0(У(к))], (11)
к
а для каждой координаты е^ вектора Е/ соотношение представляется как
ег] (к) = ег] (к -1) -(к -1) - gi (У (к))]. (12)
Процедура группировки образов и ранжирования групп. В известных нам работах не поднимается вопрос о том, каков должен быть порядок использования обучающих образов из выборки (3). Однако опыт разработки математического обеспечения контроля технического состояния показывает, что указанный фактор в значительной степени определяет скорость
*
сходимости процесса обучения к оптимальному вектору Е/ . В связи с этим предлагается
процедура группировки обучающих образов и ранжирования полученных групп с целью определения очередности их использования в процессе обучения.
Таким образом, 71 — подмножество обучающих образов, принадлежность которых /-му виду технического состояния ОК известна [см. (3)]. В данном подмножестве выделяется
группа 71/ , которая включает наибольшее количество неразличимых между собой элементов.
Один из этих элементов У<п>1, принадлежащих 71 после G -преобразования принимается в
качестве вектора начального приближения: G (У/ (0)) = Е/ (0). Элементы считаются неразличимыми, если их одноименные координаты отличаются друг от друга на значения, сопоставимые с погрешностью регистрации соответствующих траекторий в контрольных точках ОК.
Во вторую группу 72/ входит не больше неразличимых элементов, чем в первую, и не меньше,
чем в остальные. В третьей группе 73/ количество неразличимых между собой элементов не больше, чем во второй, и не меньше, чем в остальных. Аналогичным образом формируются все остальные группы.
Если через J обозначить индексное множество обучающих образов (\ J \ = N, где \ J \ — мощность множества J ), относящихся к /-му виду технического состояния, то результаты их группировки и ранжирования полученных групп можно представить следующим образом:
У = (Ук)ке^, Jl £ J, \4\ = N, N < N;
72' = (Ук)ш2, J2 £ J \ Jl, \ J2 \ = N2, N2 < N1; 73 = (Ук)kеJ3, Jз £ J \ Jl ^ J2, \Jз\ = N3, N3 < N2; (13)
р-1
Ур = (Ук )кеУр , Jp £ J \ и Jl, \ Jp \ = К, ^р < ^р_1.
I=1
Порядок использования групп в процессе обучения совпадает с их номером (рангом), а последовательность применения обучающих образов в рамках одной и той же группы произвольна. Указанные действия выполняются для каждого подмножества 71 (/ = 1, т) из обучающей выборки (3).
Обучение с группировкой и ранжированием обеспечивает максимальное влияние на формирование изображений тех образов, которые наиболее характерны для соответствующих видов технического состояния ОК. Данное утверждение объясняется тем, что коэффициент 1/ к в соотношениях (11) и (12) на предыдущем шаге обучения больше, чем на последующем. Поэтому каждый предыдущий образ более значим, чем последующий.
Процедура обучения при разработке моделей контроля технического состояния сложных систем 7
По мере увеличения числа шагов изображение Е,- стремится к своему оптимальному
*
значению Е,- с вероятностью, равной единице [4]:
Р
11ш(Е, (к) - Е,-) = 0
к ^<х>
= 1.
Каждый из векторов Е, может трактоваться и как точка в п-мерном евклидовом пространстве У, и как набор весовых коэффициентов уравнения гиперплоскости, отделяющей данное подмножество У1 от других подмножеств в пространстве У. Очевидно, что каждая координата е^ (1 = 1, т, ] = 1, п ) отражает степень сходства наблюдаемых состояний по у-му
контролируемому признаку.
Обучение в моделях контроля функционирования. Контроль технического состояния системы включает контроль функционирования и поиск отказов. Рассмотрим особенности построения процедуры обучения в моделях контроля правильности функционирования.
Степень априорной неопределенности информации о режимах нормальной работы ОК в общем случае позволяет найти допустимые интервалы изменения контролируемых признаков
(] = 1, п ), где ун, У/ — предельно допустимое нижнее и верхнее значение /-го контролируемого признака соответственно. Сведения о допустимых интервалах позволяют значительно снизить размерность моделей.
Основная задача состоит в том, чтобы сформировать полную ортонормированную систему функций gj (У) (' = 1, п). В известных работах предлагаются различные варианты таких систем, но не принимаются во внимание тригонометрические базисы. Однако, как показывает анализ, именно такие базисы обладают рядом преимуществ. Ниже рассматривается ортонормированный тригонометрический базис
( . Л ( . Л
ун; Ув
0,5;
1
(у; - Ун )0,5
Бт
2пк
-в-н У'
V Уз - У;
1
(ув - ун )0,5
СОБ
2пк
-в—н У'
Vув- У' .
к = 1, 2,...,
(15)
начальные элементы которого являются основой построения системы функций gj (У)
(' = 1, п). Такой базис существует в пространстве С2(У) непрерывных функций, квадратично интегрируемых по Риману [6].
Каждая из функций gr (У) ( г = 1, п ) определяется следующим образом:
( . Л
gr (У) =
1
(ув - УН )0
-81П
2пк
в ¿у' V ув - ун
, если к = 0,5(' +1),
г,' = 1(2)п -1, п — четно; г,' = 1(2)п, п — нечетно; ( . Л
1
-СОБ
2пк
(16)
в Л V ув - ун
если к = 0,5
(у' - у')
г,' = 2(2)п, п — четно; г,' = 2(2)п -1, п — нечетно,
й (1, если г = /; т/-
где о„' = <Л' — символ Кронекера.
г/ (0, если г Ф / г г
(0, если г Ф /
Использование приведенных соотношений и обеспечивает ортонормированность системы { gj (У), / = 1, п }. Ее ортогональность следует из того, что каждая функция gj (У)
формируется на основе только одного элемента базиса (15). Влияние других элементов исключается введением в соотношения (16) символа Кронекера. Нормированность данной
системы непосредственно вытекает из того, что нормированным является базис (15). Совместно с (п + 1)-м элементом 0,5 система { gJ■ (У), у = 1, п } образует в (п +1)-мерном подпространстве, содержащемся в пространстве С2 (У), полную ортонормированную систему. Так как первый элемент 0,5 базиса (15) не зависит от состояния ОК, его можно не учитывать и считать, что функция G -преобразования имеет размерность п :
^<п>(У<п>) = (й(У),g2(У), ..., gn (У)) .
В этом случае система функций gj (У) (у = 1, п) рассматривается как ортонормирован-
ный базис в п -мерном подпространстве, содержащемся в пространстве С2 (У).
В результате обучения на основе соотношений (11), (12) получаются значения координат е^ (/ = 1,т, у = 1, п) вектора Е/, по модулю близкие к единице. Тригонометрические функции в базисе (15) ограничивают результат преобразования любых вещественных чисел интервалом [-1, 1]. Наличие при этих функциях сомножителей (у® - Уу )-°'5, модуль которых может быть больше единицы, допускает некоторую размытость значений еу относительно
указанного выше интервала. Но эта размытость незначительна, что является преимуществом тригонометрического базиса по сравнению с другими, например, ортонормированным базисом Лежандра, который также содержится в пространстве С2 (У). Ограниченность координат
е/у значительно упрощает алгоритмическую реализацию процесса обучения, а также вычислительные операции при контроле технического состояния.
Заключение. Развитие методов математического описания систем как объектов контроля технического состояния представляет собой важнейшую задачу, решение которой необходимо для повышения достоверности определения функциональной пригодности данных объектов.
СПИСОК ЛИТЕРАТУРЫ
1. Сеньченков В. И. Формирование множества контролируемых признаков системы на основе метрической теории и функционального анализа // Изв. вузов. Приборостроение. 2005. Т. 48, № 7. С. 3—9.
2. Сеньченков В. И. Математическое обеспечение контроля технического состояния мехатронных комплексов // Авиакосмическое приборостроение. 2005. № 10. С. 27—32.
3. Васильев В. И. Распознающие системы: Справочник. Киев: Наукова думка, 1983.
4. ЦыпкинЯ. З. Адаптация и обучение в автоматических системах. М.: Наука, 1968.
5. Тарасенко Ф. П. Непараметрическая статистика. Томск: Изд-во ТГУ, 1976.
6. Треногин В. А. Функциональный анализ. М.: Наука, 1980.
Сведения об авторе
Валентин Иванович Сеньченков — д-р техн. наук, профессор; Военно-космическая академия им. А. Ф. Можайского, кафедра специальных технических систем космических комплексов, Санкт-Петербург; E-mail: [email protected]
Рекомендована кафедрой Поступила в редакцию
специальных технических систем 24.04.09 г.
космических комплексов