Научная статья на тему 'МОНИТОРИНГ И ДИАГНОСТИКА СОСТОЯНИЯ ТЕХНОЛОГИЧЕСКИХ ПРОЦЕССОВ'

МОНИТОРИНГ И ДИАГНОСТИКА СОСТОЯНИЯ ТЕХНОЛОГИЧЕСКИХ ПРОЦЕССОВ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
303
60
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕХНИЧЕСКАЯ ДИАГНОСТИКА / СТАТИСТИЧЕСКИЙ КОНТРОЛЬ ПРОЦЕССА / ЭКСПЕРТНЫЕ СИСТЕМЫ В ДИАГНОСТИКЕ / НЕЙРОННЫЕ СЕТИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Русинов Леон Абрамович, Рудакова Ирина Викторовна, Куркина Виктория Вадимовна

Рассмотрены методы непрерывного мониторинга и диагностики состояния сложных многопараметрических химико-технологических процессов с использованием метода главных компонент (МГК). Благодаря применению МГК достигается ортогонализация и уменьшение размерности исходной задачи. Обнаружение факта возникновения нештатной ситуации производится на базе МГК-модели процесса контролем двух статистик Т2 и Q. Определение причин возникновения нештатной ситуации предложено производить по двухуровневым диагностическим моделям: фреймово-продукционной, синтезируемой на базе экспертной информации, или нейросетевой. Приводятся примеры работы предложенных методов

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Русинов Леон Абрамович, Рудакова Ирина Викторовна, Куркина Виктория Вадимовна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «МОНИТОРИНГ И ДИАГНОСТИКА СОСТОЯНИЯ ТЕХНОЛОГИЧЕСКИХ ПРОЦЕССОВ»

II. ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ, АВТОМАТИЗАЦИЯ И СИСТЕМЫ УПРАВЛЕНИЯ

УДК 66.096.2.001.57

Л.А.Русинов1, И.В.Рудакова2, В.В.Куркина3

МОНИТОРИНГ

И ДИАГНОСТИКА СОСТОЯНИЯ

ТЕХНОЛОГИЧЕСКИХ

ПРОЦЕССОВ

Санкт-Петербургский государственный технологический институт (технический университет) 190013, Санкт-Петербург, Московский пр., д. 26

Рассмотрены методы непрерывного мониторинга и диагностики состояния сложных многопараметрических химико-технологических процессов с использованием метода главных компонент (МГК). Благодаря применению МГК достигается ортогонализация и уменьшение размерности исходной задачи. Обнаружение факта возникновения нештатной ситуации производится на базе МГК-модели процесса контролем двух статистик Т2 и (. Определение причин возникновения нештатной ситуации предложено производить по двухуровневым диагностическим моделям: фреймово-продукционной, синтезируемой на базе экспертной информации, или нейросетевой. Приводятся примеры работы предложенных методов.

Ключевые слова: техническая диагностика; статистический контроль процесса; экспертные системы в диагностике; нейронные сети

Введение.

Требования к системе мониторинга

и диагностики.

Большинство технологических процессов в химической промышленности относятся к разряду потенциально опасных (ПОТП). Отсюда возникает необходимость непрерывного мониторинга ПОТП и диагностики его состояния. Острота проблемы объясняется тем, что стремление к интенсификации ПОТП часто приводит к необходимости работы у границ допустимых безопасных зон и даже в предаварийных зонах, где, как правило, выше интенсивность и степень конверсии. В то же время обязательные в таких случаях системы защиты, ухудшают качественные и количественные (в том числе экономические) показатели процесса, т.к. их срабатывание обычно сопровождается сбросом реакционной массы, необратимым подавлением реакции и т.п. действиями, приводящими к существенным потерям [1-3]. Поэтому важно обнаружить отклонения процесса от нормального режима на ранних стадиях развития, когда они еще обратимы, и не доводить до порога срабатывания системы защиты.

Проблема диагностики состояния ПОТП усугубляется тем, что как правило, ПОТП характеризуются высоким уровнем неопределенностей, большими неконтролируемыми возмущениями, существенной внутренней нелинейностью и часто плохой наблюдаемостью (рисунок 1). Очень часто они не имеют математических описаний. На рисунке 1 показано также расположение системы мониторинга и диагностики в иерархии автоматизированной системы управления ПОТП.

Рисунок 1. Расположение системы мониторинга и диагностики в иерархии АСУТП.

Независимо от применяемых методов можно сформулировать основные требования, которым должна удовлетворять система диагностики [1]. Прежде всего, это возможность раннего обнаружения нарушения, что необходимо, во-первых, для возврата контролируемого процесса в регламентные рамки, т.к. на ранних стадиях возникающие нештатные ситуации, как правило, обратимы. Во-вторых, оператору представляется больше времени для принятия соответствующих действий по пресечению развития нештатной ситуации и, таким образом, возможность не допустить развитие ситуации до порогов срабатывания системы защиты.

Очень важно обеспечить высокую степень глубины диагностики, под которой понимается способность диагностической системы различать причины близких по характеру проявления нарушений (так называемые конкурирующие ситуации).

1 Русинов Леон Абрамович, д-р техн. наук, профессор, кафедра автоматизации процессов химической промышленности, e-mail: lrusinov@yandex.ru

Рудакова Ирина Викторовна, канд. техн. наук, доцент, кафедра автоматизации процессов химической промышленности, e-mail: rudakova@ws01.sapr.pu.ru

Куркина Виктория Вадимовна, канд. техн. наук, доцент, кафедра автоматизации процессов химической промышленности, e-mail: Victoria.kurkina@gmail.com

Дата поступления - 15 апреля 2010 года

Необходимо также, чтобы система диагностики была ро-бастна по отношению к шумам и неопределенностям. Учитывая, что для моделирования нештатной ситуации может быть очень мало информации, можно предположить, что будут известны и учтены в диагностической модели не все возможные нештатные ситуации или они будут смоделированы недостаточно адекватно. Тем не менее, желательно, чтобы система определяла ситуацию, неучтенную в модели, как новую, а не указывала на одну из известных.

При нормальном протекании технологического процесса возможны изменения его параметров при варьировании параметров исходного сырья, настроек технологии и аппаратуры, изменении производительности и т.п. Отсюда вытекает требование адаптируемости системы диагностики к таким изменениям.

Немаловажное значение имеет также способность системы объяснить построенный диагноз. Это свойство важно для оператора, т.к. позволяет ему осознанно следовать рекомендациям системы при принятии оперативных решений.

Наконец, большое значение имеет способность системы диагностировать множественные нарушения. Эта проблема усугубляется тем, что нарушения часто взаимно реагируют и их совместный образ, особенно в нелинейных процессах, не соответствует простому наложению индивидуальных образов этих нарушений. В то же время попытка заложить в модель образы возможных комбинаций нарушений может вылиться в серьезную проблему из-за большой размерности получаемой модели.

Процедуры диагностики. Виды диагностических моделей

Нештатные ситуации, которые могут возникнуть в ходе процесса, связаны с нарушениями двух видов: собственно нарушениями в самом процессе и отказами полевой аппаратуры (датчиков и регулирующих органов) [2, 4]. При этом они могут быть внезапными, возникающими в непредсказуемые моменты времени, и постепенно развивающимися.

Процедура диагностики нарушений, вызывающих нештатную ситуацию на ПОТП, включает обнаружение факта возникновения нарушения, его локализацию, т.е. определение участка процесса, где возникло нарушение и, наконец, идентификацию возникшей нештатной ситуации - определение причин, вызвавших нарушение [1, 5, 6].

Процедуры диагностики и мониторинга производятся на основе моделей, связывающих в том или ином виде некоторые наблюдаемые характеристики процесса (диагностические показатели, симптомы) с причинами, вызвавшими отклонение процесса от регламентных рамок. Такие модели получили название диагностических. Их основное отличие от обычных моделей состоит в том, что они описывают анормальные состояния процесса, нештатные и, естественно, нежелательные ситуации, в которые попадает процесс. В качестве диагностических могут в некоторых случаях использоваться и обычные модели процесса, но обычно они не могут обеспечить требуемую глубину диагностики.

Можно выделить три группы типов диагностических моделей (ДМ), используемых при построении систем диагностики (рисунок 2) [1, 4].

Рисунок 2. Классификация диагностических моделей (ГПСС - граф причинно-следственных связей; НСГ - направленный сигнальный граф; МГК - метод главных компонент)

Это - модели, учитывающие количественные связи между переменными, учитывающие только качественные соот-

ношения между ними, и модели, строящиеся на массивах зарегистрированных значений переменных процесса во время его работы.

Не останавливаясь на достоинствах и недостатках первых двух категорий моделей, рассмотрим более подробно третий тип, основным преимуществом которого является отсутствие требований знания химизма контролируемого процесса. Здесь диагностическая модель строится на основании только текущей информации, поступающей с процесса. Очень важно, что не требуется наличия априорных глубоких знаний о процессе, а лишь наличие эмпирических (опытных) знаний, которыми обладают эксперты, или больших выборок текущей информации о значениях параметров и переменных процесса. Именно это свойство и обеспечило этому типу моделей большое внимание исследователей [1, 6].

Из методов этой группы наиболее популярны экспертные системы (ЭС). Разработка ЭС требует сбора знаний о возможном поведении контролируемого процесса и возможных нештатных ситуациях, которые могут возникнуть в течение работы процесса. Эти знания получают от экспертов, знающих процесс и имеющих опыт работы на этом процессе. Обычно знания носят качественный характер, в лучшем случае - полуколичественный со значительным уровнем неопределенности и нечеткости. Эти знания представляются в той или иной форме и группируются в базе знаний ЭС [7].

Основными преимуществами ЭС являются относительная легкость разработки, прозрачность вывода и возможность получения достаточно достоверных результатов в условиях неопределенности. Это объясняет их большое распространение в диагностических системах [1, 3, 5].

Второй подход из качественных методов, использующих текущую информацию с процесса - это анализ трендов переменных (рисунок 2). Однако, более часто на практике используется статистический контроль состояния процесса при его мониторинге, т.к. раннее обнаружение возникшей нештатной ситуации даже важнее во многих случаях, чем детальная диагностика состояния процесса. При этом наиболее эффективен многопараметрический контроль, например с использованием метода главных компонент [1, 3, 4], который более подробно рассмотрен ниже.

Способность нейронных сетей к классификации информации позволила использовать ДМ на их основе в системах диагностики состояния технологических процессов. Исследования по применению нейронных сетей в ДМ шли по двум направлениям. Первое относилось к выбору наиболее удачной архитектуры сети, что в основном касалось оценки возможностей сетей с различными функциями активации нейронов: сигмоидальной, гиперболического тангенса, сетей с радиальными базисными функциями и т.п. Здесь опубликовано наибольшее количество работ, в том числе и для диагностики химико-технологических процессов [1, 6, 8]. Второе направление касалось алгоритмов обучения. Здесь наибольшее распространение получили алгоритмы обучения с учителем.

Анализ состояния проблемы показал, что не существует единого метода, использующего один тип диагностической модели, который удовлетворил бы всем требованиям к системе диагностики. В то же время, методы на базе рассмотренных выше моделей могут дополнять друг друга при выполнении различных операций, необходимых для построения диагноза. Поэтому системы диагностики, использующие комбинированные принципы работы, показали наибольшую эффективность.

Непрерывный мониторинг состояния ПОТП

Наличие случайных возмущений на реальных процессах, влияющих на их поведение, предопределяет использование статистических методов контроля состояния ПОТП при организации его мониторинга. Данные с процесса могут рассматриваться как статистические временные ряды, полученные при единичной реализации основного стохастиче-

ского процесса, который, как правило, считается стационарным и эргодическим. Когда процесс находится в норме, наблюдения имеют некоторые вероятностные распределения, соответствующие нормальному режиму работы. При нарушениях в ходе процесса параметры распределений отклоняются от номинальных значений. Соответственно, мониторинг состояния процесса может быть позиционирован как проблема обнаружения изменений в параметрах стохастической системы.

При использовании статистического подхода и работе в режиме реального времени измерения переменных производятся последовательно через равные временные интервалы и диагноз строится на основании выборок из этих измерений, полученных вплоть до текущего момента. Решение о наличии нарушения может приниматься прямо по значениям измерений: x(t)= [xi(t), X2(t),..., Xn(t)]TeRn, где Rn - критическая область (например, карты Шьюхарта [9]). Однако, более часто строится некоторая статистика g(t) как функция вектора измерений переменных процесса x(t) и решение о наличии нарушения принимается при превышении значением этой статистики g(t) некоторого порога C. Качество работы обнаружителя нарушений (время обнаружения, число пропусков нарушений и, наоборот, число ложных тревог) существенно зависит от выбора статистики g(t) и значения порога.

Современные сложные технологические процессы характеризуются большим числом переменных, коррелированных между собой. В этом случае эффективны многомерные статистические методы, они учитывают корреляционную картину на процессе и позволяют выявить ее изменения. Примером таких методов служит метод главных компонент (МГК, в английской терминологии - РСА) [10].

Применение МГК при мониторинге

Главной особенностью МГК является преобразование выборки исходных коррелированных переменных в выборку новых некоррелированных переменных значительно (иногда более чем на порядок) меньшей размерности. Линейное преобразование, используемое в МГК, имеет вид:

X = TPT или T = XP (1),

где X [nxp] - матрица данных из n выборок измерений с p переменными, нормированными к нулевому среднему и единичной дисперсии. Матрицу P [pxp] называют матрицей нагрузки, она же является матрицей собственных векторов ковариационной матрицы ХХТ исходных данных и новым базисом, преобразующим матрицу X в матрицу Т. Матрица Т [nxp] имеет размерность исходной матрицы Х и называется матрицей счетов (score matrix) или матрицей проекций исходных данных в подпространство главных компонент. Из (1) следует, что каждый элемент ti является скалярным произведением xi на соответствующую строку в P. Другими словами, j-й элемент вектора ti есть проекция xi на j-ю строку матрицы P. Далее главные компоненты будем обозначать аббревиатурой ГК.

Таким образом, МГК делает одно строгое, но мощное допущение: линейность. Хотя сложные системы почти всегда нелинейны и часто их главные качественные особенности -прямое следствие их нелинейности, но локально линейные аппроксимации обычно обеспечивают хорошее приближение, т.к. нелинейные члены высоких порядков обычно стремятся к нулю на уровне малых возмущений.

МГК представляет собой ортогональное линейное преобразование исходных данных к новой системе координат такой, что самая большая дисперсия при проекции данных по любой координате новой системы оказывается на первой координате (названной первой главной компонентой), вторая самая большая дисперсия - на второй координате, и так далее. МГК может использоваться для сокращения размерности в массиве данных, сохраняя те его особенности, которые вносят наибольший вклад в его дисперсию за счет учета компонент более низкого порядка, и игнорируя компоненты более высоких порядков, относя их к шуму.

Главные компоненты могут быть вычислены разными способами. В [10] приводится итерационный алгоритм NI-

PALS, однако, чаще на практике применяют вычисление главных компонент, разлагая ковариационную матрицу XXT по собственным векторам. Т.к. МГК масштабно зависимый метод, то исходные данные нормируются не только к нулевому среднему, но и к единичной дисперсии.

Произвольную матрицу Х [mxn] можно разложить на две ортонормированные матрицы и одну диагональную в следующей форме

X=UZVT (2),

где U={u1, u2, ..., up} - множество собственных векторов матрицы XXT; диагональная матрица Z={oi, i = 1, 2, ■ ■ ■ , p}, oi - корни из собственных значений матрицы XTX (элементы матрицы Z упорядочены по убыванию: o1 > o2 > op > 0); V={v1,v2, ...,vp} - множество собственных векторов матрицы XTX.

Сравнивая выражения (1) и (2) можно видеть, что матрица главных компонент может быть получена, если положить P=V , а матрица проекций T=UI.

МГК модель процесса должна строиться на данных, вариации которых вызваны причинами, не нарушающими его регламентное течение, т.е. когда процесс находится в стационарном состоянии. Новые измерения сопоставляются с этой моделью нормального состояния процесса. Новая многомерная выборка измерений переменных Хн проецируется в подпространство главных компонент, определенное матрицей Р для получения вектора счетов (проекций):

(3),

н q н

где Pq - первые q столбцов в матрице Р, которая определяет базис ГК.

Для мониторинга процесса строятся две статистики T2 и Q. Для них известны пороговые значения, если переменные, входящие в матрицу Х, принадлежат генеральной совокупности, т.е. распределены нормально с нулевым средним и неизменившейся ковариационной матрицей S. Если корреляционные связи между переменными процесса изменяются, чем обычно сопровождается возникновение нештатной ситуации, то та или иная статистика превышает пороговое значение. Первая статистика (пропорциональна квадрату расстояния Махаланобиса) имеет вид:

П =tk(TqTTq)-1ti (4),

где k - индекс координаты в базисе главных компонент. Статистика T2k в (4) является квадратичной формой, фактически определяющей расстояние по координате k от данного вектора до центра массива данных, по которым строилась модель МГК. Учитывая, что в модели используется q главных компонент, это расстояние будет равно:

(5),

¿->k=i 2 sk

где s2k -дисперсия tk.

Для единичной выборки с новыми измерениями переменных x, (рх1) и оценке матрицы S по n выборок последних значений переменных распределение статистики Т2 аппроксимируется распределением Фишера с q, (n-q) степенями свободы, что при уровне значимости а дает для контрольного порога Ст значение:

(6)

п(п -q) n-q

Таким образом, если выполняется неравенство:

Тг2 <СТ (7),

то вариация выборки (вектора) новых измерений x, лежит в пределах гиперэллипса допустимых вариаций в ходе процесса, т.е. объясняется моделью МГК, построенной на массиве исходных данных Х. Если неравенство (7) нарушается, то фиксируется факт обнаружения нештатной ситуации.

Если возникает новая ситуация, которой не было в исходной модели МГК, ее вектор попадает в подпро-

странство невязок. Этот тип событий может быть обнаружен с помощью Q-статистики (иногда ее называют стандартной ошибкой предсказания - SPE), измеряющей вариации в этом подпространстве. Статистика Q представляет собой Евклидово расстояние от рабочей точки процесса до гиперплоскости, сформированной учитываемыми в модели ГК:

Q = ете = (x-x)>-i) = (8),

где е = (1-Р Рг)х - невязки выборки х, j - индекс

^ Ч q '

переменной в выборке.

Выражение (8) подтверждает указанный выше факт возможности обнаружения статистикой Q новых событий, которых не было в массиве, по которому была синтезирована модель МГК. Однако, если число ГК в модели будет велико, то, как следует из (8), статистика Q не сможет быть эффективным критерием для обнаружения нештатных ситуаций [11].

Учитывая, что число собственных векторов матрицы S, учитываемых в модели и связанных с подпространством ГК, равно q, то собственных векторов, связанных с подпространством невязок будет (p-q). Соответственно к ним будут относиться (р-q) меньших собственных чисел Aj матрицы S, j = q+1, ..., p. Тогда контрольный порог для статистики Q может быть определен по выражению [4, 12]:

(9Х

Q а'

a ; b - 1 + (e2h0(h0 -1)/).

где e2 = ho =(1 - 2а0/зе|;

0з-It i tf; < ; '-X;

Za - значение а-процентной точки нормального распределения, Ai, i= q+1,..., p - собственные значения, которые объясняют вариации опорных данных в подпространстве невязок, вместо всех p собственных значений.

Если при поступлении новой выборки измерений Xi вычисленное значение статистики Q превысит пороговое значение Cq, т.е. нарушится неравенство:

Q * CQ (10)

то так же, как и в случае со статистикой T2 (неравенство (7)), фиксируется факт возникновения нештатной ситуации.

Статистики Q и T2 взаимно дополняют друг друга: если хотя бы одна из них превысит свое пороговое значение, то это свидетельствует о нарушении нормального протекания контролируемого процесса.

Различные методы обнаружения неисправностей, основанные на МГК, отличаются подходами к синтезу модели. В обычном варианте МГК-модель создается по выборке данных, соответствующих нормальному ходу процесса, сформированной однажды и используемой далее без изменения [1, 11]. Этот вариант подходит для стационарных непрерывных процессов с параметрами, неизменными во времени. Большая часть химических процессов не удовлетворяет этим требованиям. Поэтому были разработаны другие варианты методов мониторинга такие, как "движущийся" МГК (moving PCA). Здесь формируется начальное временное окно из N измерений данных процесса, не содержащих нарушения, на основе этой информации строится МГК-модель и вычисляются пороговые значения для статистик T2 и Q. Затем формируется следующее окно и т.д. [1, 4, 12, 13].

Процедура мониторинга в случае применения «движущегося» МГК будет иметь следующий вид:

1.Формирование начальной матрицы данных Х0к (k=0) из N строк (измерений) и р столбцов (значений переменных) при нормальных условиях работы процесса. Нормирование матрицы на нулевое среднее и еди-

ничную дисперсию. Проверка на наличие выбросов, например, с использованием медианного фильтра.

2.Формирование МГК-модели вычислением нагрузок Pik и счетов Tik, алгоритмом NIPALS или нахождением собственных векторов корреляционной матрицы исходного массива и определение числа компонент q, учитываемых моделью (например, по доле дисперсии исходных данных, объясняемых этими q компонентами, учитываемыми в модели). Вычисление пороговых значений Cq и Ст для статистик Q и Т2 по (6) и (9).

3.Получение нового вектора наблюдений хк+1, его центрирование на старое значение среднего, нормирование на старое СКО и запоминание. Далее вычисление статистик Q и Т2 по (5) и (8) и сравнение их с пороговыми значениями, вычисленными в п.2.

4. Если в течение r (1<r<N) последовательных шагов какая-либо из статистик превышает пороговое значение, то нарушение считается обнаруженным. Если в течение N шагов превышения пороговых значений не происходит, то из запомненных N векторов {Xk+i, ..., xk+N} формируется новая матрица Хи производится возврат к шагу 2.

Локализация нарушений

Как уже отмечалось, если контролируемый процесс достаточно сложный, характеризуется десятками переменных, то для облегчения локализации нарушения (определения участка процесса, где произошло нарушение), целесообразно провести декомпозицию процесса. Это позволяет выделить более простые структурные единицы, что упрощает построение модели. При этом основным требованием при выделении таких структурных единиц является обеспечение максимальной их автономности.

Декомпозицию можно проводить, используя различные подходы для выделения структурных единиц [14]:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

•Функциональный подход - выделение достаточно независимых друг от друга структур (участков, групп, единиц оборудования), выполняющих определенные функции, независимо от их топологии и времени функционирования.

•Территориальный подход - выделение участков процесса по их расположению в пространстве с учетом топологии процесса.

•Временной подход - целесообразен для периодических технологических процессов. Для непрерывных процессов также можно использовать временной принцип в случае, когда в них применяется резервирование или изменение комбинации работающего оборудования в зависимости от нагрузки.

Для достижения эффективности декомпозиции ее целесообразно производить, применяя комбинацию указанных методов. В результате такой декомпозиции выявляется многоуровневая структура объекта, которая используется при построении ДМ и вводит иерархичность в ее структуру.

Фактически тогда обнаружение аномальной ситуации производится для каждой структурной единицы отдельно.

Идентификация нештатных ситуаций

Идентификация нештатных ситуаций в МГК-про-странстве. Собственно идентификация нарушений в случае использования МГК выполняется по величине вклада переменной в дефектную статистику, сравнивая его с вкладом этой переменной в ту же статистику при нормальном ходе процесса [4,11, 15]. В случае отказа датчика или регулирующего органа этот метод работает эффективно, но если ситуация усложняется и сопровождается изменением многих переменных, эффективность метода становится неочевидной. Это можно видеть по графикам рисунка 3, где представлены динамика изменения вкладов переменных при развитии одной из нештатных ситуаций на процессе пиролиза [16].

Рисунок 3. Пример динамики изменения вкладов переменных в дефектную статистику при развитии нештатной ситуации (процесс пиролиза).

В [13] предлагается проводить идентификацию, вычисляя индекс М, характеризующий изменения Ьтого главного компонента. Недостатком этого метода идентификации в МГК-пространстве является необходимость иметь в базе диагностической модели (ДМ) множество МГК моделей для аномальных ситуаций. К сожалению это редко доступно, так как возможности выполнения активного эксперимента на реальных процессах очень проблематичны, а ждать пока в ходе пассивного эксперимента произойдет та или другая нештатная ситуация и собрать необходимую статистику -еще более проблематично, т.к. это может потребовать неопределенно большого времени.

В то же время эксперты на основе их опыта и знания процесса могут описывать ситуации даже на параметрическом уровне и, таким образом, ранжировать симптомы по их важности, что позволяет увеличивать глубину диагностики.

Идентификация нештатных ситуаций на базе экспертной ДМ. Основная сложность при использовании экспертных ДМ состоит в том, что параметры нештатных ситуаций при различных реализациях не совпадают в точности и можно оценивать лишь степень их близости. При этом эксперты все-таки чаще определяют значения параметров нечеткими значениями типа «очень большой», «средний» и т.п.

Для формализации такой информации проводится фаззификация параметров нештатных ситуаций, например, сравнением их значений с некоторыми шкалами. Пример такой шкалы приведен в таблице. Величина функции принадлежности ^(и) определяется сравнением значения симптома (например, параметров технологического процесса, заранее преобразованных в безразмерную форму и масштабируемых в интервале [0,1]) с этой шкалой [16].

Таблица. Типовая шкала для количественного представления нечеткости

Нечеткое значение Интервал

Очень сильно высокий 0.90 - 1.00

Сильно высокий 0.80 - 0.89

Высокий 0.70 - 0.79

Повышенный 0.55 - 0.69

Средний (нормально) 0.45 - 0.54

Пониженный 0.30 - 0.44

Низкий 0.20 - 0.29

Сильно низкий 0.10 - 0.19

Очень сильно низкий 0.00 - 0.09

Ситуация в этом случае представляется нечетким множеством А(и ), являющимся подмножеством универсального множества 0, включающего в качестве элементов все возможные условия и, (и ,еЦ), степени проявления которых в данной ситуации (функций принадлежности ^(и,)) входят в левые части базы правил в ДМ. Тогда ситуация для каждого продукционного правила будет описываться в ДМ вектором

Б* =&*, Б2*,... б*), элементы которого 5*=^Б*(и *) отражают, по мнению экспертов, «идеальное» для данного нарушения проявление симптомов. Наблюдаемая на процессе текущая (реальная) ситуация описывается вектором Б= (51, 52,... 5з), образованным наблюдаемыми значениями симптомов. При выполнении всех условий левой части (наличии на объекте всех симптомов, учитываемых данным правилом), правило срабатывает. Тогда считается, что ситуация, описываемая правилом, имеет место и должны быть реализованы управления, содержащиеся в правой части этого правила. На практике часто соответствие векторов Б* и 5 неполное и можно говорить о какой-то степени уверенности в выводе СР<1.

Для идентификации ситуации нужно произвести сравнение вектора ситуации, наблюдаемой в данный момент на процессе, с векторами описаний аномальных ситуаций, включенных в условные части правил ДМ.

Для определения степени близости ситуаций могут использоваться различные критерии [17, 18]. Из них после сравнительного исследования были выделены два наиболее эффективных[19].

1. Критерий БМ1. Модифицированный критерий с Евклидовым расстоянием.

БМ^*)- 1

где л^у

1 + с1(8,8*)

ЪМ,-*,))

(11),

J - число параметров в

предусловии правила, у] - весовые коэффициенты, определяемые, например, из ранжировок симптомов, представленных экспертами [18].

2.Критерий БМ4. Скалярное произведение векторов Б и Б*.

(12)

Весовые коэффициенты у] позволяют подчеркнуть значимость того или иного симптома для распознавания данной ситуации.

Экспертную ДМ предлагается строить в виде двух уровневой фреймово-продукционной структуры [14, 18]. Каждая выделенная при декомпозиции структурная единица процесса в диагностической модели описывается отдельным корневым фреймом (рисунок 4), объединяющим общую информацию о ситуациях на этом участке сложного процесса.

Рисунок 4. Структура фреймов экспертной диагностической модели.

Структура фрейма /ГК, описывающего /-ю стадию, может быть представлена следующим образом:

РгК={Ит, А/г, Мог,, 1т, БЬ^СГ, Мех/}

(13),

где в скобках приведены названия слотов: ЫКЪ - имя фрейма (участка процесса, к которому он относится); А/г/ -

список диагностических параметров (атрибутов), используемых для диагностики нештатные ситуаций на данном участке процесса; Ыог-, - наблюдаемый вектор диагностических показателей, рассчитываемый по данным из базы дан-нык SCADA-системы; 1т, - матрица со значениями эксплута-ционных порогов Лу.1 для основных диагностических показателей (используется для быстрого обнаружения группы ситуаций, которые имеют общие основные симптомы - конкурирующих ситуаций, и вывода на дочерний фрейм, где сгруппированы продукционные правила для распознавания конкретной причины); БЬ - статус корневого фрейма (условие инициализации фрейма: Б/=1, если хотя бы один из показателей б5.1 в матрице слота 1т выходит за пороговое значение Лу ,), N¿1 - список возможные групп ситуаций (имена дочерних фреймов /ТД); N6)^1 - указатель на фрейм перехода по сети (рассмотрение ситуаций на следующем участке процесса).

Нештатные ситуации, которые могут возникнуть в выще-ленных при декомпозиции участках процесса описываются дочерними фреймами, подчиненными корневому. Дочерний фрейм представляется следующим образом:

Ргй^ЫйГьЫЯР^ьБЪь^СР,, Отц,аадц,ЯбСц,Ягодц,Соп1)} (14),

где, как и ранее, в скобках приведены названия слотов фрейма /гйц

В слотах фрейма содержится следующая информация: N1 - название /й группы конкурирующих нештатные ситуаций, имеющих несколько общих симптомов, или одной нештатной ситуации, но вызываемой различными причинами;

- указатель имени корневого фрейма /ЯК, с которым связан данный фрейм и значения атрибутов которого он наследует; А/гц - совокупности симптомов (диагностических показателей), обуславливающих активизацию настоящего фрейма (соответствует строке матрицы в слоте 1т, корневого фрейма /ЯК), и дополнительных симптомов, связанные с вызывающими данную ситуацию конкретными нарушениями и позволяющих их идентифицировать. Статус рассматриваемого фрейма определяется по результатам сканирования матрицы для поиска нештатных ситуаций, находящейся в слоте 1т, соответствующего корневого фрейма. Статус может иметь следующие значения: БЬд=вы-явленный, всвможны/й и невы/явленны/й.

Ц/ - матрица весовых коэффициентов диагностических показателей ум, оценивающих их значимость (по мнению экспертов) при идентификации данной причины; Спро-цедура расчета степени уверенности в диагнозе (оценка степени близости текущей ситуации, наблюдаемой на процессе, к ее образу, декларированному в правилах диагностической модели); йтц - база продукционные правил Я/.^, связывающих нарушения с основными и дополнительными симптомами в рамках нештатной макроситуации, определяемой фреймом /гБ^. Слоты йвдц, Я&сц и Ягод, фрейма /гйц содержат соответственно причины ситуаций ¿д, рекомендации по их устранению Ящ и прогнозы /дих развития; Бр - вектор степеней опасности нарушений.

В результате процедура идентификации нарушений будет выглядеть следующим образом:

1. После обнаружения факта нарушения активируется корневой фрейм DM, в структурной единице которого произошло нарушение. При этом нечеткий вектор симптомов, соответствующих текущей ситуации, сравнивается с векторами таблицы причинно-следственных связей и активируется соответствующий дочерний фрейм DM.

2. По одному из вышеприведенные критериев оценки близости ситуаций производится сравнение текущей и опорные ситуаций из правил в дочернем фрейме с учетом весовых коэффициентов из соответствующей матрицы.

3. Результаты сравнения (значения критериев) сравниваются с пороговыми значениями, определяемыми эмпирически. И цикл повторяется до тех пор, пока не произойдет превышения порога в нескольких последовательных циклах.

Значения оценок близости конкурирующих ситуаций, сгруппированные в дочернем фрейме, характеризуют сте-

пень уверенности CF системы диагностики в том, что данное нарушение имеет место. Эти значения выдаются оператору с рекомендациями по действиям для устранения распознанной нештатной ситуации из правые частей правил.

Рисунок 5. Пример обнаружения и идентификации нештатной ситуации с использованием экспертной ДМ.

На рисунке 5 приведен пример моделирования нештатной ситуации, возникающей в ходе процесса пиролиза, а именно «перегрев первого радиантного змеевика». Эта ситуация может вызываться следующими причинами: Рг1 -коксообразование в радиантной секции; Рг2 - снижение количества бензина в змеевике; Рг3 - коксообразование в трубном пространстве закалочного аппарата; Рг4 - нарушение режима работа котла утилизатора. Развитие ситуации началось на 100-м шаге. Из двух, показанные на рисунке трендов статистик, порогового значение первой достигла Т2- статистика на 134 шаге и с этого момента начался анализ трендов изменения критериев близости текущей ситуации к образам этой ситуации при возникновении ее от разные указанных причин., записанным в продукционные правилах дочернего фрейма. На 743 шаге идентифицирована причина Рг2. Такое запаздывание по отношению к моменту обнаружения объясняется медленным развитием одного из симптомов, определяющих ситуацию.

Идентификация нештатных ситуаций на базе нейросете-войДМ. Изучение использования экспертные систем в диагностике, проводившееся в течение достаточно длительного времени, выявило ряд недостатков. В частности, возникают проблемы с назначением значений диагностических параметров в условной части правил, весовых коэффициентов и порогов для работы критериев близости и т.д. [6,12-14].

В то же время от таких проблем свободен нейросетевой подход [1, 16, 17]. Нейронные сети нелинейны по своей природе. Нейросетевой подход особенно приложим для процессов, у которых точные математические модели являются либо слишком сложными или их получение слишком трудоемко, в частности при диагностике состояний ПОТП [1, 6, 8]. Недостатком этого подхода является трудность идентификации новых ситуаций, которые не были учтены в обучающем массиве или для которых не было предусмотрено выеодного нейрона в структуре сети. Другими недостатками являются трудности с множественными нарушениями, недопустимые времена обучения и т.п. Далее обсуждаются методы преодоления этих трудностей.

Способность нейронные сетей к классификации информации позволила использовать их для диагностики состояния технологических процессов. Исследования по применению нейронных сетей в диагностике шли по двум направлениям. Первое относилось к выбору наиболее удачной архитектуры сети, что в основном касалось оценки возможностей сетей с различными преобразующими функциями: сиг-моидальной, гиперболического тангенса, сетей с радиальными функциями и т.п. Здесь опубликовано наибольшее количество работ, в том числе и для диагностики химико-технологических процессов [1, 8, 20, 21]. Второе направление

касалось алгоритмов обучения. Здесь наибольшее распространение получили алгоритмы обучения с учителем.

Наибольшее распространение получили два типа нейронных сетей: сети прямого распространения (feedforward networks - FFN) и сети с радиальными базисными функциями RBFN. Используемые в системах диагностики сети FFN обычно имеют три слоя. В качестве функций активации для входного и (реже) выходного слоев применяют сигмоиду и гиперболический тангенс. Во входном и иногда выходном слоях используют линейные нейроны.

Сети RBFN - трехслойные с нелинейными функциями активации только в скрытом слое. Сети используют функции активации вида 9(n)=exp(-n2), из которых наиболее популярна Гауссова. Центры базисных функций обычно назначаются при кластеризации состояний процесса. В то же время в стандартных FFN функции сигмоиды или гиперболического тангенса определены во всем диапазоне.

Хотя RBFN показали несколько лучшие результаты по сравнению с FFN, этот выигрыш не так значителен, особенно если учесть существенно возрастающие трудности при увеличении размерности проблемы [22, 23].

Качество и время обучения сети зависит от сложности проблемы. Большинство ПОТП описываются сотнями переменных. Это приводит к недопустимо большим временам обучения и низкой надежности работы самой сети [8]. Поскольку, как правило, контролируемые процессы дрейфуют во времени, требуется периодическое переобучение нейронной сети. Естественно, что даже с учетом значительного повышения быстродействия современных компьютеров такие затраты времени на обучение сети недопустимы.

Снижение размерности может быть достигнуто различными способами. Прежде всего, это переход в пространство главных компонент. Другой метод снижения размерности сетей - введение иерархии. Это требует проведения декомпозиции процесса, но зато выигрыш весьма существенен. Особенно эффективно применение обоих методов одновременно.

Структура такой двух уровневой нейросетевой ДМ приведена на рисунке 6. Задача локализации нарушения возлагается на сеть верхнего уровня (NN-HL). На ее входы подаются только те переменные, которые характерны для ситуаций данного структурного блока или, как показано на рисунке 6, проекции переменных процесса на векторы главных компонент.

теми переменными, которые связаны с данным структурным блоком, выявленным при декомпозиции ПОТП, и, естественно, не велики.

Этот подход позволяет существенно снизить время переобучения, которое потребовалось бы для единой большой сети. Т.к. переобучение в основном касается только сетей нижнего уровня, а размерность у них значительно меньше по сравнению с сетью верхнего уровня, это приводит к дополнительному снижению временных затрат. Кроме того, если возникнет новая ситуация, сеть верхнего уровня локализует ее. И хотя NN Б1 могут не суметь диагностировать ее причину, некоторая полезная информация о месте ее возникновения будет получена [23, 24].

Третий подход к снижению размерности связан с динамическими сетями, на входы которых подаются не только текущие значения переменных, но и их предыдущие значения. В этом случае исходные переменные заменяются коэффициентами регрессионных полиномов, которые аппроксимируют тренды исходных переменных. Дополнительным преимуществом этого метода является сглаживание исходных данных и некоторое снижение уровня шумов [25].

На рисунке 7 приведены тренды выходных нейронов RBFN сети верхнего уровня и FFN сети нижнего уровня при диагностике той же нештатной ситуации, вызванной опять причиной Рг2, что и на рис.5. Видно, что нейросетевая Дм позволяет также уверенно идентифицировать ситуацию, как и экспертная ДМ. Однако по скорости обнаружения нарушения такая ДМ проигрывает, но на этапе идентификации уверенно в два раза быстрее распознает причину. Тренды изменения выходов нейронов сети нижнего уровня по конкурирующим причинам 1,3,4 лежат в диапазоне [-0,99 , -1] и на рисунке не показаны.

Рисунок 6. Предлагаемая структура нейросетевой ДМ.

Идентификация ситуации производится сетями нижнего уровня (NN-51). Каждая сеть нижнего уровня определяет причины, вызвавшие ту или иную нештатную ситуацию. Их размерности определяются только

Рисунок 7. Тренды выходных нейронов нейросетевой ДМ (обнаружение нарушение - сеть RBFN верхнего уровня; идентификация ситуации - сеть FFN нижнего уровня)

Выводы

• Хемометрические методы эффективны для мониторинга и диагностики технологических процессов в химической и родственных областях промышленности.

• Использование метода главных компонент (МГК) значительно упрощает организацию мониторинга, позволяя проводить его, контролируя всего две статистики: T2 и Q.

• Идентификацию нештатных ситуаций наиболее эффективно проводить с помощью иерархических экспертной фреймово-продукционной или нейросете-вой диагностических моделей.

Литература

1. Venkatasubramanian V., Rengaswamy R., Yin K, Kavuri S.N. A review of process fault detection and diagnosis // Computers and Chemical Engineering. 2003. V. 27. P. 293-311

2. Русинов Л.А., Куркина В.В., Севергин М.В., Бенуа С.В. Диагностика и мониторинг процессов химических технологий // Экологическая химия 1996. Т. 5, N3. С. 210-216.

3. Qian Y., LiX., Jiang Y., Wen Y. An expert system for real-time fault diagnosis of complex chemical processes // Expert Systems with applications. 2003. V. 24. P. 425-432.

4. Yang Q. Model-based and data driven fault diagnosis methods with applications to process monitoring. Thesis for the degree of Doctor of Philosophy, Case Western Reserve University, 2004. 203 pp.

5. Kramer M.A., Fjellheim R. Fault diagnosis and computer-aided diagnostic advisors // AIChE. 1996. V. 92. P. 12-24

6. Iserman R. Supervision, fault-detection and fault-diagnosis methods - an introduction. Control Eng. Practice. 1997. V. 5 N5. P. 639-652.

7. ЗмитровичА.И. Интеллектуальные информационные системы. Минск: «ТетраСистемс», 1997. 368 с.

8. Hoskins J.C., Kaliyur K.M., Himmelblau D.M. Fault diagnosis in complex chemical plants using artificial neural networks // AIChE J. 1991. V. 37. P. 137-141.

9. ХиммельблауД. Обнаружение и диагностика неполадок в химических и нефтехимических процессах. Л.: Химия, 1983, 352 с.

10. Esbensen K.H.. Multivariate data analysis - in practice, CAMO, Oslo, 2000. 598 p.

11. Narasimhan S., Gudi R. Monitoring and fault diagnosis // Proc. CEP Workshop on Multivariate Data Analysis Techniques & Applications. 2005 July 22 P. 13-26.

12. Luo R., Misra M., Himmelblau D. V. Sensor fault detection via multiscale analysis and dynamic PCA.// Ind.En-g.Chem.Res. 1999. V. 38. P. 1489-1495.

13. Segawa T., Kano M., Ohno H., Hasebe S., Hashimoto /.Identification of fault situations by using historical data sets/ // Proc. of Int. Symp. on Design Operation and Control of Next Generation Chemical Plants, (PSE Asia 2000), 6-8 Dec.2000, Kyoto, Japan. P. 345-350.

14. Русинов Л.А., Куркина В.В., Севергин М.В., Бенуа С.В. Диагностика и мониторинг процессов химических технологий // Экологическая химия. 1996. Т. 5, №3. С. 210-216.

15. Wang S., Cui J. Sensor-fault detection, diagnosis and estimation for centrifugal chiller systems using principal-component analysis method // Applied Energy. 2005. V. 82 P. 197-213.

16. Rusinov L.A., Rudakova I.V., Kurkina V.V. Real time diagnostics of technological processes and field equipment // Chemometrics and intelligent laboratory systems. 2007. V. 88. P. 18-25.

17. Yeung D.S., Tsang E.C. Weighted fuzzy production rules // Fuzzy sets and systems. 1997. V. 88. P. 299-313.

18. Русинов Л.А, Рудакова И.В. Оперативное управление процессом получения полиэтилена высокого давления. //Автоматизация и современные технологии. 2003. № 7. С. 30 -36.

19. Рудакова И.В., Куркина В.В., Русинов Л.А. Алгоритмическое обеспечение систем диагностики для режима обнаружения нештатных ситуаций на контролируемом объекте // ЖПХ РАН. СПб., 2003. 17с. Деп. в ВИНИТИ 06.02.03, № 237-В2003.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

20. Watanabe K., Matsura I., Abe M., Kubota M., Himmelblau D.M. Incipient fault diagnosis of chemical processes via artificial neural networks. // J. of American Institute of Chemical Engineers.1989. V. 35. №11. Р. 1803-1812.

21. Venkatasubramanian V., McAvoy T.J. Special issue on neural network applications in chemical engineering. // Computers and Chemical Engineering. 1992. V. 16. №4. P. R5-R6.

22. Ruiz D. Fault diagnosis in chemical plants integrated to the information system. Thesis for the degree of Doctor of the Universitat Politecnica de Catalunya. Barcelona, 2001. 226 p.

23. Rusinov L.A., Rudakova I.V., Remizova O.A., Kurki-na V.V. Faults diagnosis in chemical processes with application of hierarchical neural networks // Chemometrics and Intelligent Laboratory Systems, 2009. V. 97. P. 98103.

24. Becraft W.R., Lee P.L. Integration of neural networks and expert systems for process fault diagnosis Comput. and Chem Eng., 1993. V. 17. P. 1001-1014.

25. Zhou Y., Hahn J., Mannam M.S. Fault detection and classification in chemical processes based on neural networks with feature extraction // ISA Trans. 2003. V. 42. P. 651-664

i Надоели баннеры? Вы всегда можете отключить рекламу.