Научная статья на тему 'СИСТЕМА ДИАГНОСТИКИ НА БАЗЕ НЕЛИНЕЙНОГО МЕТОДА ГЛАВНЫХ КОМПОНЕНТ И ДИСКРИМИНАНТНОГО АНАЛИЗА ФИШЕРА'

СИСТЕМА ДИАГНОСТИКИ НА БАЗЕ НЕЛИНЕЙНОГО МЕТОДА ГЛАВНЫХ КОМПОНЕНТ И ДИСКРИМИНАНТНОГО АНАЛИЗА ФИШЕРА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
152
21
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЛИНЕЙНЫЙ МЕТОД ГЛАВНЫХ КОМПОНЕНТ / ДИСКРИМИНАНТНЫЙ АНАЛИЗ ФИШЕРА / ДИАГНОСТИКА ТЕХНОЛОГИЧЕСКИХ ПРОЦЕССОВ / NON-LINEAR PRINCIPAL COMPONENT ANALYSIS / FISHER DISCRIMINANT ANALYSIS / DIAGNOSTICS OF TECHNOLOGICAL PROCESSES

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Галиаскаров Марат Рамилевич, Русинов Леон Абрамович

Нелинейный дискриминантный анализ (НДА) предполага- ет, как и в случае нелинейного метода главных компонент (НМГК), предварительный переход в линеаризующее про- странство большой размерности и затем использование обычного линейного дискриминантного анализа (ЛДА). Одна- ко применение НДА в онлайновом режиме дает низкий про- цент правильных определений причин нештатных ситуа- ций, особенно в случае медленно развивающихся нарушений, из-за сильного размытия классов. Для увеличения процента правильных определений предлагается использовать комби- нированный метод диагностики. Непрерывный мониторинг процесса проводить на базе НМГК, а идентификацию неш- татной ситуации осуществлять в окрестностях точки об- наружения, используя ЛДА и, при этом, запуская его только после обнаружения факта ее возникновения. Эти меры по- зволяют значительно повысить процент правильных клас- сификаций. Эффективность метода показана на примере диагностики медленно развивающихся нештатных ситуа- ций, вызванных отложениями кокса на внутренних поверхно- стях оборудования установки пиролиза углеводородов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Галиаскаров Марат Рамилевич, Русинов Леон Абрамович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE SYSTEM OF DIAGNOSTICS BASED ON NONLINEAR METHOD OF PRINCIPAL COMPONENTS AND FISHER DISCRIMINANT ANALYSIS

Nonlinear discriminant analysis (NDA) assumes a preliminary conversion of the original data into a feature space of large dimension, as it is done in the method of nonlinear principal component analysis (NPCA) followed by a conventional linear discriminant analysis (LDA). However, the use of the NDA in the on-line mode gives a low percentage of correct classifications, especially in the case of incipient faults due to a strong blurring of classes. To increase the percentage of correct definitions, a combined method of diagnosis is offered. The continuous monitoring of the process is carried out by NPCA and the identification of an abnormal situation is produced in the vicinity of the point of its detection by using LDA that starts to work only after the fault detection. These measures can significantly increase the percentage of correct classifications. The effectiveness of the method is demonstrated by using, as an example, diagnostics of slow-developing abnormal situations caused by deposition of coke on internal surfaces of equipment in pyrolysis of hydrocarbons.

Текст научной работы на тему «СИСТЕМА ДИАГНОСТИКИ НА БАЗЕ НЕЛИНЕЙНОГО МЕТОДА ГЛАВНЫХ КОМПОНЕНТ И ДИСКРИМИНАНТНОГО АНАЛИЗА ФИШЕРА»

УДК 6

Marat R. Galiaskarov, Leon A. Rusinov

THE SYSTEM OF DIAGNOSTICS BASED ON NONLINEAR METHOD OF PRINCIPAL COMPONENTS AND FISHER DISCRIMINANT ANALYSIS

St Petersburg State Institute of Technology (Technical University), Moskovsky Pr., 26, St Petersburg, 190013, Russia e-mail: lrusinov@yandex.ru

Nonlinear discriminant analysis (NDA) assumes a preliminary conversion of the original data into a feature space of large dimension, as it is done in the method of nonlinear principal component analysis (NPCA) followed by a conventional linear discriminant analysis (LDA). However, the use of the NDA in the on-line mode gives a low percentage of correct classifications, especially in the case of incipient faults due to a strong blurring of classes. To increase the percentage of correct definitions, a combined method of diagnosis is offered. The continuous monitoring of the process is carried out by NPCA and the identification of an abnormal situation is produced in the vicinity of the point of its detection by using LDA that starts to work only after the fault detection. These measures can significantly increase the percentage of correct classifications. The effectiveness of the method is demonstrated by using, as an example, diagnostics of slow-developing abnormal situations caused by deposition of coke on internal surfaces of equipment in pyrolysis of hydrocarbons.

Keywords: Non-linear principal component analysis, Fisher discriminant analysis, diagnostics of technological processes

.518.5

М.Р. Галиаскаров1, Л.А. Русинов2

СИСТЕМА ДИАГНОСТИКИ НА БАЗЕ НЕЛИНЕЙНОГО МЕТОДА ГЛАВНЫХ КОМПОНЕНТ И ДИСКРИМИНАНТНОГО АНАЛИЗА ФИШЕРА

Санкт-Петербургский государственный технологический институт (технический университет), Московский пр. 26, Санкт-Петербург, 190013, Россия e-mail: lrusinov@yandex.ru

Нелинейный дискриминантный анализ (НДА) предполагает, как и в случае нелинейного метода главных компонент (НМГК), предварительный переход в линеаризующее пространство большой размерности и затем использование обычного линейного дискриминантного анализа (ЛДА). Однако применение НДА в онлайновом режиме дает низкий процент правильных определений причин нештатных ситуаций, особенно в случае медленно развивающихся нарушений, из-за сильного размытия классов. Для увеличения процента правильных определений предлагается использовать комбинированный метод диагностики. Непрерывный мониторинг процесса проводить на базе НМГК, а идентификацию нештатной ситуации осуществлять в окрестностях точки обнаружения, используя ЛДА и, при этом, запуская его только после обнаружения факта ее возникновения. Эти меры позволяют значительно повысить процент правильных классификаций. Эффективность метода показана на примере диагностики медленно развивающихся нештатных ситуаций, вызванных отложениями кокса на внутренних поверхностях оборудования установки пиролиза углеводородов.

Ключевые слова: нелинейный метод главных компонент, дискриминантный анализ Фишера, диагностика технологических процессов

DOI 10.15217^п1998984-9.2016.33.91

Введение

Большинство технологических процессов в химической и смежных областях промышленности являются нелинейными и потенциально опасными (ПОТП). Использование традиционных методов диагностики таких процессов не обеспечивает раннее обнаружение и уверенную идентификацию нарушений (особенно в случае наличия нарушений с существенно разными скоростями развития).

Раннее обнаружение нарушений, в то время, когда они, как правило, ещё обратимы, позволит не доводить процесс до срабатывания систем защиты, и, таким образом, избежать материальных потерь и снизить нагрузку на окружающую среду.

Большинство ПОТП нелинейны по своей природе и не имеют достаточно адекватных математических описаний (или они сложны), особенно в предаварийных и нештатных режимах. Вследствие этого значительная часть работ, посвященных вопросам мониторинга

состояния ПОТП, базируется на статистических методах контроля, к которым, например, относятся многомерные карты Шухарта [1, 2]. Однако, при применении таких карт возникают сложности их построения для задач большой размерности с существенной взаимной корреляцией между переменными.

Для снижения размерности обычно используют метод главных компонент (МГК). При этом формируется МГК-модель, описывающая нормальное состояния процесса, и далее строится многомерная карта Шухарта, но уже в пространстве главных компонент, либо проводится мониторинг состояния процесса контролем статистик Т2 и Q [3]. Т.к. карта Шухарта фактически использует статистику Т2, контролирующую отклонения процесса, объясняемые МГК-моделью, то второй метод предпочтительнее, т.к. позволяет контролировать любые отклонения процесса.

Учитывая, что большинство ПОТП характеризуется существенной нелинейностью, можно предположить, что даже допустимые небольшие (штатные) отклонения контролируемого процесса

1 Галиаскаров Марат Рамилевич, аспирант, каф. автоматизации процессов химической промышленности, e-mail: gm.lamdeamon@gmail.com Marat R. Galiaskarov, Post-graduate Student, Department of Chemical Engineering Control

2 Русинов Леон Абрамович, д-р техн. наук, профессор, зав. каф. автоматизации процессов химической промышленности, e-mail: lrusinov@yandex. ru

Leon A. Rusinov, Dr Sci (Eng), Professor, Head of the Department of Chemical Engineering Control Дата поступления - 14 декабря 2015 года

от нормального состояния могут привести к ложным срабатываниям системы мониторинга. Во многих работах было показано, что нелинейный МГК (в частности, керн-МГК) обеспечивает обнаружение развивающихся нарушений при значительно меньшем числе ложных срабатываний по сравнению с линейным МГК (см. например, [4-7]). Важно отметить, что вычислительные процедуры, связанные с керн-МГК, хорошо разработаны и достаточно экономичны.

Однако, если и линейный и нелинейный МГК позволяют легко осуществить обнаружение нарушения, то определить с помощью МГК-модели причину, вызвавшую это нарушение на ПОТП, оказалось затруднительно [8-10]. Объясняется это тем, что идентификация нарушения производится по величине вкладов переменных в обнаружившую нарушение статистику. Это хорошо работает, если нарушение связано с изменением одной переменной, например, с отказом датчика, хотя часто и в этом случае оно может влиять (распространяться) и на другие переменные, что существенно затрудняет идентификацию. Поэтому для идентификации нарушения и определения причин его возникновения применяются иные подходы, в частности, линейный дискриминантный анализ Фишера (ЛДА) [11, 12]. ЛДА имеет преимущества перед МГК, т.к. направлен не только на представление данных в пространстве меньшей размерности, но на их разделение по классам (группам), где каждый класс отражает состояние ПОТП в момент возникновения конкретного нарушения.

Однако, при диагностике многомерных и, особенно, нелинейных ПОТП метод ЛДА работает плохо. Поэтому его часто дополняют различными предварительными операциями, например, проводят предварительную кластеризацию данных с процесса [13], ранжируют переменные по информативности [14, 15] и т.п., или используют нелинейный вариант дискриминантного анализа (НДА) [16-18].

НДА аналогично нелинейному МГК предполагает предварительный переход в так называемое линеаризующее пространство (feature space) большой размерности [19] за счет нелинейного преобразования исходных данных. Далее к преобразованным таким образом данным применяют обычный ЛДА. Как и в случае реализации мониторинга нелинейных ПОТП на базе керн-МГК, использование НДА принципиально обеспечивает лучшие результаты дискриминации нарушений по сравнению с ЛДА. Однако, НДА требует достаточно больших затрат вычислительных мощностей, поэтому в данной работе для мониторинга и диагностики потенциально опасных технологических процессов рассматривается комбинированный вариант совместного использования ЛДА с керн-МГК.

Попытки использования керн-МГК с ЛДА предпринимались и ранее [20, 21], однако фактически реализовывался керн-НДА, т.к. работа лДа велась параллельно с керн-МГК независимо от обнаружения нарушения. Это размывало классы и снижало качество дискриминации. В данной статье предложено начинать работу ЛДА в момент обнаружения нештатной ситуации. Тогда классы получаются более компактными с меньшими величинами разброса относительно центроидов.

Материал статьи сгруппирован следующим образом. Вначале приведено краткое описание нелинейного метода главных компонент (точнее - керн-МГК) и организация мониторинга ПОТП на его базе. Далее дано описание линейного дискриминантного анализа Фишера, представлен комбинированный алгоритм диагностики на основе керн-МГК и ЛДА. Затем приведены результаты экспериментального исследования работы метода на ПОТП пиролиза углеводородного сырья.

Нелинейный метод главных компонент (НМГК).

Основная идея НМГК состоит в первоначальном отображении входного пространства размерности m в так называемое линеаризующее пространство (feature space) Fh большой размерности h с помощью нелинейного преобразования (Xje^m^Ф(Xj)eFh), а затем в вычислении главных компонент уже в пространстве F [7, 18, 19].

Выборочная ковариация данных в пространстве F будет иметь вид:

(1)

Предполагается, что исходные данные центрированы ££=1ф(л) = 0; ф - нелинейная функция, которая отображает входные векторы из входного пространства ^ в пространство Р

Аналогично линейному МГК главные компоненты находятся, как собственные векторы veF ковариационной матрицы С вместе с собственными числами Л (вектор V, соответствующий наибольшему Л становится первой главной компонентой)

Av = CFv = -Sjli < Ф(^)7^ > Ф(х,-)

(2)

где Л - собственные числа (Л > 0) матрицы Ср, < ф(х])т,у > - скалярное произведение Ф(^) на V. Из (2) следует, что собственные векторы V могут быть представлены линейными комбинациями преобразованных значений входных данных. Так как <ф(х])г,у> - скаляр, то все значения V с Л Ф 0 лежат в интервале [ФОДФОп)] и существуют коэффициенты а, такие что

(3)

Умножая на Ф(^) слева обе части выражения (2) с учетом выражения (3), получим:

Ла = - Ка

(4)

где К - матрица скалярных произведений с элементами

К;7с =< Ф(х))г;Ф(хк) >

Для центрирования матрицы К используется выражение:

К = К - КЕ - ЕК - ЕКЕ

(5)

где каждый элемент матрицы Е равен п-1.

Далее преобразование данных в линеаризующем пространстве F будет эквивалентно нахождению собственных векторов (а1, а2,...,ап) с собственными числами (Л1 > Л2 >...> Лп). Размерность задачи можно снизить посредством использования только первых q собственных векторов.

Тогда проекции (счета) ^ = [и,...^] текущего вектора данных с процесса х на главные компоненты получаются проекцией отображения Ф(х) вектора х на собственные векторы Vr в пространстве F:

Для решения уравнения (4) и при вычислении счетов можно избежать явного выполнения нелинейного отображения и расчета скалярных произведений в линеаризующем пространстве вычислением скалярных произведений в исходном пространстве, используя для нелинейного отображения исходных данных в линеаризующее пространство керн-функции к(х,у) [7, 19]:

к(х,у)=<Ф(х)Т,Ф(у)>

(7)

функции:

Наиболее часто используются следующие керн-

- полиномиальное ядро к(х,у)=<х,у>6=(хт у+г)6

(8)

при превышении статистикой Т2 порога Ст.

Обнаружение нарушения статистикой Q происходит при выполнении неравенства [4, 18]:

(2 = к(хг,хг) - г]

(14),

сигмоидное ядро (гиперболический тангенс)

к(х,уИап1п(Ро<х,у>+Р1) (9)

Гауссово ядро (радиальное базисное ядро)

к(х,у) = ехр(^) (10)

где г, 6 во, 01, а - должны быть априорно специфицированы пользователем.

Тогда выражение (6) для расчета счетов (проекций) текущего (нового) вектора данных примет вид:

т = <*; *(*/.*)

(11)

Для определения количества главных компонент q, как и в случае линейного МГК, обычно используется критерий, определяющий долю общей дисперсии исходных данных, объясняемую МГК-моделью, или долю суммы учитываемых МГК-моделью собственных чисел Л по отношению к сумме всех собственных чисел матрицы. Если эта доля при q учтенных в модели компонент достигает 90 % и более, то считается, что модель достаточно адекватно описывает корреляционные связи переменных в процессе и остальные компоненты в модели можно не учитывать.

Описанное преобразование обеспечивает только получение нелинейных главных компонент и напрямую не дает методов для восстановления данных в первоначальном пространстве. С этим связана основная проблема использования НМГК для мониторинга и диагностики.

Мониторинг состояния процесса на базе НМГК

Мониторинг состояния процесса на базе линейного МГК производится посредством контроля двух статистик: Т2-статистики (контролируются отклонения процесса, объясняемые МГК-моделью) и Q-статистики, представляющей фактически невязки модели (контролируются нарушения, не учтенные МГК-моделью). Каждая из статистик сравнивается с соответствующим пороговым значением, которое определяется по МГК-модели, сформированной на данных, полученных при нормальном состоянии контролируемого ПОТП. При превышении порога хотя бы одной из статистик принимается гипотеза о возникновении на процессе нештатной ситуации [3, 6].

Мониторинг на основе НМГК подобен мониторингу на базе линейного МГК в том, что статистики Т2 и Q интерпретируются в обоих методах одинаковым образом.

Статистика Т2 определяется как сумма нормализованных квадратичных счетов, тогда условие обнаружения нарушения на ПОТП будет:

т2 = к1...дл-1к1...^]т>с

(12)

где счета ъ [г = 1...^] рассчитываются по (11), л1 -диагональная матрица из инверсий собственных чисел, соответствующих учитываемым в модели главным компонентам. Пороговое значение Ст определяется с учетом распределения статистики Т2, которое может быть аппроксимировано распределением Фишера:

п-а

а,(п-а),а

(13)

где п - число выборок данных с процесса в обучающем массиве, q - число главных компонент в модели, а -уровень значимости. Обнаружение нарушения происходит

Учитывая, что распределение статистики Q может быть аппроксимировано распределением х2 , то для Сд получим [7]:

Со = ©Сь:

(15)

2а:

где g = — - весовой параметр, Ь = — - число степеней

свободы, а и Ь - оцененные средние и дисперсия Q-статистики. Так как параметры д и h получаются непосредственно из моментов выборочного распределения данных нормального режима работы процесса, то взвешенное х2-распределение работает хорошо даже в случаях, когда распределение невязок не соответствует нормальному.

Дискриминантный анализ Фишера

Основная идея метода - нахождение таких векторов (направлений) V, разделяющих классы (в нашем случае - нештатные ситуации, нарушения на контролируемом процессе), при котором критерий Фишера имеет максимальное значение [8,11,12]:

шах

ут5ьУ

(16)

где Бь, Sw - матрицы межклассового и внутри классового разброса данных соответственно. Для обучения данные, включающие представителей всех классов, группируются в матрицу х е жпхт, строки которой образованы выборками данных с процесса, а столбцы -переменными. Определим матрицу Б| внутреннего разброса данных в классе /:

(17)

где х, - строки матрицы Х, соответствующие классу /, X - средний вектор (центроид) класса ¡. Тогда матрица внутриклассового разброса будет:

(18)

где с - количество классов, представленных в обучающем массиве (известных нештатных ситуаций на ПОТП). Матрица межклассового разброса определится как:

= Е/=1 Щ (XI - х) (х1 - х)т

(19)

центроид всех

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где п, число наблюдений в классе /, данных обучающего массива.

Максимум критерия (16) обеспечивается нахождением собственных векторов w матрицы (Б^Бь) (предполагается, что матрица Sw не вырождена):

(20)

где Л собственные значения матрицы. Так как важно только направление векторов \л/, а знак и значение не важны, то обычно принимают 1М| = 1.

Для определения, к какому классу / относится новый вектор данных хн=(х1,х2,...,хт)т, можно воспользоваться расстоянием Махаланобиса MD или Евклида 6 (что проще) между ним и центроидами классов: минимальное расстояние до центроида /-го класса соответствует отнесению вектора хн к этому классу (диагностике /-го нарушения)

тшГсЬ = (х - х0г (х - х0)^н (21)

Структура системы диагностики

Как уже отмечалось ранее для диагностики нарушений используется двухуровневый вариант работы: обнаружение нарушений производится НМГК, после фиксации факта обнаружения нештатной ситуации производится ее идентификация методом ЛДА (рисунок 1). Это позволило снизить размерность при работе ЛДА, получить более компактные группы классов, что особенно важно при диагностике медленно развивающиеся нарушений.

Рисунок 1. Последовательность операций в системе диагностики.

На предварительном этапе (производится off-line) формируется обучающий массив, включающий данные, относящиеся к нормальной работе процесса, и данные, снятые с процесса или полученные по модели и отражающие нештатные ситуации с известными нарушениями. На этом массиве строится НМГК-модель с использованием априорно выбранного ядра (керн-функции). Построение модели предполагает определение главных компонент и их числа q, используемого в модели, а также пороговых значений Ct и Cq для статистик Т2 и Q. По матрице счетов НМГК-модели с помощью ЛДА определяются дискриминирующие направления и вычисляются центроиды выделенных классов. На этом предварительный этап заканчивается: система диагностики переходит в режим работы on-line.

Полученная очередная выборка данных с процесса проецируется на главные компоненты и вычисляются текущие значения статистик Т2 и Q, которые сравниваются с пороговыми значениями CT и CQ. Цикл повторяется до момента уверенного превышения текущими значениями статистик Т2 и Q их пороговых значений, что считается обнаружением факта возникновения нештатной ситуации.

Обнаружение нарушения инициирует включение ЛДА. Производится вычисление расстояний между центроидами каждого класса и вектором счетов новой выборки по (21). Минимальное расстояние от /-го класса указывает на принадлежность нарушения к этому классу.

Экспериментальное исследование метода

Исследование метода проводилось на данных с процесса пиролиза сырьевых углеводородов (прямогонный бензин, этан, бутан-пропан) в трубчатых печах с целью получения пиролизного газа, который представляет собой сложную смесь углеводородов [22]. Процесс характеризуется большим числом различных, часто одновременно возникающих или функционально между собой связанных нештатных ситуаций.

Вся линия получения продуктов пиролиза включает непосредственно печь, две стадии закалки пиролизного газа и систему получения пара высокого давления для производственных нужд завода. Трудно определяемыми нештатными ситуациями являются ситуации, вызванные нарушениями работы установки из-за отложения кокса на внутренних поверхностях оборудования, что приводит к медленному изменению свойств объекта диагностирования. Поэтому для оценки качества работы предлагаемого метода

были выбраны три медленно развивающиеся ситуации этого типа (В, С и D) и одна штатная ситуация, соответствующая нормальной работе процесса (ситуация А):

Ситуация В - «коксование змеевика первой радиантной секции» характеризуется ростом давления Рвх1 на входе в первую радиантную секцию и ростом температуры ТВыХ1 на выходе из нее, причем динамика по первому параметру опережает отклонение второго из-за маскирующего эффекта системы регулирования.

Ситуация С - аналогична ситуации В, но для змеевика второй радиантной секции, также рост параметров

Рвх2 и Твых2.

Ситуация D - усиленное коксообразование в трубном пространстве закалочно-испарительных аппаратов (ЗИА), характеризуется ростом давления пирогаза Рвзид1 на входе ЗИА и температуры ТВЗИА1 на выходе ЗИА.

Для построения НМГК-модели были сформированы 2 массива данных при нормальной работе процесса, на которые при имитации нештатных ситуаций накладывались соответствующие динамические возмущения. Обучающий массив включает 200 выборок данных с 15 переменными; тестовый массив состоит из 100 выборок. Дискретность опроса составляла 1 мин. Эксплуатационные пороги устанавливались по результатам экспертного опроса.

В качестве ядра НМГК использовалось полиномиальное ядро (8) с параметрами г = 10 и d = 1. При определении достаточного числа главных компонент q в модели использовался 90 %-ный порог, т.е. отношение остаточной дисперсии к исходной было принято равным 0,1. Это достигалось при 10 главных компонентах (д = 10). Далее были определены пороги Ст и для статистик Т2 и Q.

Имитационное моделирование нештатных ситуаций с расчетом получения динамики развития близкой к реальной, выполнено посредством наложения возмущений на определяющие ситуации переменные: Рвх1, Твых1, Рвх2, Твых2, Рвзиа1, Твзиа1. Все возмущения вводились, начиная с 10-шага.

На рисунке 2 отображены тренды Q и Т2-статистик при моделировании ситуации В, обнаруживших ситуацию на 109-м и 40-м шагах соответственно. Статистика, обнаружившая нарушение первой (в данном случае - Т2) запускает ЛЛА. „„О

Рисунок 2. Тренды Q и Т2-статистик при развитии нештатной ситуации В.

Аналогично налагались возмущения на переменные РВХ2 и ТВых2 при моделировании ситуации С. Однако здесь статистика Q сработала почти в два раза быстрее (рисунок 3).

500

сч=190

I

10 20 30 40 50 60 70 80 90 100

120 100 80 60 40 20

Ст2 =47

у*

20

40

60

80

100

При исследовании работы ЛДА в пространстве главных компонент НМГК, начиная с момента обнаружения нештатной ситуации, вычислялись по (11) счета (проекции) выборок входных переменных, подвергшихся керн-преобразованию. Эти выборки использовались для формирования обучающих и тестовых массивов для ЛДА. На рисунке 5 показаны в координатах первых главных компонент дискриминирующие направления w, полученные решением сингулярного уравнения (20).

Рисунок 3. Тренды Q и Т2-статистик при развитии нештатной ситуации С.

Развитие ситуации D было еще более медленным (выход возмущенных переменных Рвзиа1 и Твзид1 за пороговые значения задавался на 195-м и 187-м шагах соответственно). На рисунке 4 показаны тренды Q и Т2-статистик. Здесь первой обнаружила нештатную ситуацию статистика <3 на 16-м шаге.

О

1500 -'--

1000

Рисунок 5. Дискриминирующие линии, разделяющие все три класса нештатных ситуаций (крестиками показаны

точки обучающего массива, залитыми кружками - точки тестового массива, треугольниками - центроиды классов)

При этом одна пара массивов содержала выборки от начала развития ситуации и до полного ее развития, вторая пара массивов - от усредненного момента обнаружения ситуации одной из статистик, первой обнаружившей ситуацию, и до полного ее развития и, наконец, третья пара массивов содержала выборки, соответствующие ±20 % области вокруг моментов обнаружения соответствующих ситуаций.

Ниже приведена таблица корректности классификации нештатных ситуаций предложенным методом по расстоянию от вектора тестовых выборок до центроидов классов (таблица).

Таблица. Корректность работы метода.

Метод диагностики Массивы для обучения и тестировани % правильных определений

Нелинейный дискриминантный анализ (полиномиальное ядро) Первая пара массивов 35,2

НМГК+ЛДА *) Вторая пара массивов 83,6

Предлагаемый метод Третья пара массивов 99,9

Рисунок 4. Тренды Q и Т2-статистик при развитии нештатной ситуации D.

Примечание:* Анализ ведется с момента обнаружения нарушения, но продолжается до полного развития нарушений

Из данных таблицы видно, что эффективность дискриминации нештатных ситуаций существенно зависит от размытости классов. Поэтому для увеличения процента правильных определений целесообразно блокировать работу фильтра после нескольких определений ситуации на последовательных шагах (опросах ПОТП).

Чтобы показать эффективность предлагаемого метода по сравнению с линейной комбинацией (МГК+Л-ДА), было проведено аналогичное исследование этого метода на тех же данных. Сравнительная эффективность МГК и НМГК по обнаружению нештатных ситуаций исследовалась ранее (см. [6]) и показала примерно равную эффективность. Однако разделительная способность

линейного комбинированного метода оказалась значительно хуже (рисунок 6). Как видно из рисунка, классы существенно перекрываются и линейно не могут быть разделены.

Рисунок 6. Распределение классов при использованием

линейного комбинированного метода (МГК+ЛДА).

Заключение

Линейный дискриминантный анализ Фишера (ЛДА) широко используется в задачах распознавания образов и только относительно недавно он начал применяться в системах диагностики технологических процессов для идентификации нештатных ситуаций. Однако большинство технологических процессов в химической промышленности нелинейны и применение ЛДА здесь не позволяет получить высокие результаты.

Применение в этих случаях нелинейного дис-криминантного анализа (НДА) не обеспечивает высокого процента правильных классификаций, особенно при диагностике постепенно развивающихся нарушений из-за большой размытости классов. Это вызвано тем, что НДА фактически представляет собой комбинацию нелинейного метода главных компонент (НМГК) и ЛДА, работающих одновременно независимо от наличия или отсутствия нештатных ситуаций на контролируемом ПОТП.

В данной работе предложено проводить мониторинг процесса посредством НМГК, а запускать ЛДА только при обнаружении нарушения и после нескольких последовательных успешных определений блокировать его работу. Это предотвращает дальнейшее размывание классов, если оператор по какой-либо причине не предпримет никаких действий, чтобы вернуть процесс в нормальное функционирование, а нештатная ситуация будет продолжать развиваться. Такие меры позволили значительно увеличить процент правильных классификаций в наиболее сложном случае - возникновении развивающихся (постепенных) нарушений.

Литература

1 Царев, Ю.В., Тростин А.Н. Статистические методы контроля и управления качеством. Контрольные карты: учеб.-метод. пособие. г. Иваново: ИГХТУ, 2006 160 с.

2. Bersimis S., Psarakis S., Panaretos J. Multivariate Statistical Process Control Charts: An Overview // Qual. Reli-ab. Engng. Int. 2007. V. 23. P. 517-543.

3. Рудакова И.В., Русинов Л.А., Куркина В.В. Мониторинг и диагностика состояния технологических процессов // Известия Орел ГТУ. 2006. № 1(2). С. 184-189.

4. Cho J., Lee J.M., Choi S.W., Lee D., Lee I.B. Fault

identification for process monitoring using kernel principal component analysis // Chem. Engng Sci. 2005. V. 60. P. 279-288.

5. Sun R., Tsung F., Qu L. Evolving kernel principal component analysis for fault diagnosis // Computers & Industrial Engng. 2007. V. 53. P. 361-371.

6. Галиаскаров М.Р., Рудакова И.В., Русинов Л.А Сравнительный анализ характеристик мониторинга технологического процесса с использованием линейного и нелинейного метода главных компонент // Известия СПбТИ(ТУ). 2013. № 22(48). С. 106-110.

7. Lee J., Yoo Ch.Y., Choi S.W, Vanrolleghem P.A., Lee I.B.. Nonlinear process monitoring using kernel principal component analysis // Chemical Engng Sci. 2004. V. 59. P. 223-234.

8. Wang S., Cui J. Sensor-fault detection, diagnosis and estimation for centrifugal chiller systems using principal-component analysis // Applied Energy. 2005. V. 82. P. 197-213.

9. Venkatasubramanian V., Rengaswamy R., Yin K., Kavuri S.N A review of process fault detection and diagnosis // Computers and Chemical Engng. 2003. V. 27. P. 293-311.

10. Rusinov L.A., Rudakova I.V., Kurkina ^V Real time diagnostics of technological processes and field equipment // Chemometrics and intelligent laboratory systems. 2007. V. 88. P. 18-25.

11. Chuang L.H., Russell E.L., Braatz R.D. Fault diagnosis in chemical processes using Fisher discriminant analysis, discriminant partial least squares, and principal component analysis // Chemometrics and Intelligent Laboratory Systems. 2000. V. 50. P. 243-252.

12. Zhou, Y. Process monitoring based on classification tree and discriminant analysis / Y.Zhou, J.Hahn, M.S.Mannan //Reliability Engng and System Safety, 2006. -V.91 - P.546-555

13. He Q.P, Qin S.J., Wang J. A New Fault Diagnosis Method Using Fault Directions in Fisher Discriminant Analysis // AIChE J. 2005. V. 51. P. 555-571.

14. Verron S., Tiplica T., Kobi A. Fault detection and identification with a new feature selection based on mutual information // Journal of Process Control. 2008. V. 18. P. 479-490.

15. He X.B., Wang W., Yang Y.P., Yang Y.H. Variable-weighted Fisher discriminant analysis for process fault diagnosis // J. of Process Control. 2009. V. 19. P. 923-931.

16. Cho H.W., Identification of contributing variables using kernel-based discriminant modeling and reconstruction // Expert Systems with Applications. 2007. V. 33. P. 274-285.

17. Zhu Z.B., Song Z.H. Fault diagnosis based on imbalance modified kernel Fisher discriminant analysis // Chemical Engng Research and Design. 2010. V. 88. P. 936-951.

18. Choi S.W, Leeb Ch., Leeb J-M., Parke J.H., Lee I-B. Fault detection and identification of nonlinear processes based on kernel PCA // Chemometrics and Intelligent Laboratory Systems. 2005. V. 75. P. 55- 67.

19. Schölkopf B., Smola A.J., Müller K.-R. Nonlinear component analysis as a kernel eigenvalue problem. // Neural Computation. 1998. V. 10. P. 1299-1319.

20. Cui P., Li J., Wang G. Improved kernel principal component analysis for fault detection // Expert Systems with Applications. 2008. V. 34 P. 1210-1219.

21. Yang J., Frangi A.F., Yang J., Zhang^ D., Jin Z. KPCA Plus LDA: A Complete Kernel Fisher Discriminant Framework for Feature Extraction and Recognition // IEEE transactions on pattern analysis and machine intelligence, 2005. V. 27. № 2. Р. 230-244.

22. Масальский К.Е. Пиролизные установки (проектирование и эксплуатация). М.: Энергия, 1968. 145 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.