II. ИНФОРМАЦИОННЫЕ СИСТЕМЫ. АВТОМАТИЗАЦИЯ И СИСТЕМЫ УПРАВЛЕНИЯ
УДК 658.5.011:681.3 А.А. Мусаев1, А.В. Гайков2
ПРЕДВАРИТЕЛЬНЫЙ АНАЛИЗ ИСХОДНЫХ ДАННЫХ МОНИТОРИНГА НЕФТЕПЕРЕРАБОТКИ
Введение
Применение средств оптимизации управления сложными динамическими системами (сДс) предполагает наличие математических моделей, для построения и коррекции которых используются ряды наблюдений, полученные в процессе мониторинга за изменением их состояния. Однако на практике качество полученного «информационного сырья» оказывается недостаточным для формирования адекватных математических моделей.
В большинстве случаев алгоритмы прогнозирования и принятия решений базируются на математических методах, применение которых ограничено набором условий. Данные условия обычно относятся к статистическим и динамическим свойствам исходных данных. При невыполнении этих условий соответствующие алгоритмы оптимизации в лучшем случае не обеспечивают формирование эффективных решений, а при некоторых обстоятельствах, вообще приводят к ложным выводам. В связи с этим применению формализованных методов управления должен предшествовать комплексный анализ свойств информационных потоков и их предварительная обработка. Отсюда непосредственно вытекает рассмотренная ниже задача разработки программного модуля (ПМ), обеспечивающего решение указанных задач.
Кроме того, ПМ должен обеспечивать решение таких важных для управления задач, как
- оперативное преобразование потока измерительной информации в совокупность параметров, допускающих наглядную интерпретацию протекающих процессов;
- выявление скрытой информации, описывающей взаимосвязи и взаимовлияния параметров установки и внешней среды;
Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, Санкт-Петербург, пер. Гривцова, д. 14 Санкт-Петербургский государственный технологический институт (технический университет), Санкт-Петербург, Московский пр. 26
В настоящей работе рассматривается программный модуль предобработки, ориентированный на задачи анализа данных, полученных в процессе мониторинга состояния технологического процесса первичной переработки нефти, позволяющий получить дополнительную информацию о статистических и динамических свойствах контролируемых процессов.
Ключевые слова: программный модуль, нефтепереработка, предварительный анализ, прогнозирование, скрытые аномалии.
- агрегирование, сжатие и визуализация многомерных взаимосвязанных процессов;
- обнаружение аномальных наблюдений и скрытых несоответствий и т.п.
Концептуальные основы построения подобных модулей и их применения были подробно описаны в [1]. В настоящей статье рассмотрен конкретный пример реализации ПМ предобработки, ориентированного на задачи анализа данных, полученных в процессе мониторинга состояния технологического процесса (ТП) первичной переработки нефти.
Техническая реализация ПМ может осуществляться в самых разнообразных формах - от программных продуктов, интегрируемых в качестве аналитических надстроек в АСУ, до программных приложений БД. В целом, ПМ предобработки следует рассматривать как функциональный элемент системы поддержки принятия решений, предназначенный для повышения эффективности формируемых управлений.
Функциональная структура ПМ приведена на рисунке 1.
Результаты мониторинга состояния установки и ее выходных параметров поступают в БД в виде временной последовательности многомерных данных. Содержащиеся в БД сведения могут не в полной мере отвечать требованиям системы обработки данных. В связи с этим возникает необходимость использования модуля предварительной обработки данных, включающая в себя такие функции, как обнаружение и обработка пропусков в БД, выявление мультиколлинеарности в исходных данных, сглаживание временных рядов наблюдений и другие.
1 Мусаев Андрей Александрович, студент Санкт-Петербургского национального исследовательского университета информационных технологий, механики и оптики, е-таП: amusayev1990@gmail.com
2 Гайков Андрей Владимирович, канд. техн. наук, доцент каф. системного анализа, зам. декана ф-та информационных технологий и управления Санкт-Петербургского государственного технологического института (технического университета). е-таИ: av489@yandex.ru
Дата поступления - 26 марта 2014 года
Текущие данные
БД мониторинга
1нга
программный интерфейс пользователя
Формир ование задания
Выбор параметров
Вывод результатов
Загрузка и формирование исходных и обучающих данных
Дескриптивный анализ
Анализ динамики изменений
Выявление взаимосвязей
Анализ аномалий
Анализ отклонений
Корреляционный анализ
Компонентный анализ
Анализ несоответствий
н
я
н
I
3
S -
Рисунок 1. Функциональная структура модуля предобработки
Выбор загружаемого массива, используемых функциональностей и параметров исследования осуществляется средствами разработанного программного интерфейса пользователя. Сюда же, в графические окна интерфейса включаются выводы результатов, отвечающих выбранной задаче (функциональности). Внешний вид интерфейса приведен на рисунке 2.
Решение задач осуществляется последовательно. При каждом обращении к программе выбирается одна конкретная задача, в соответствии с которой задание передается соответствующей процедуре, отвечающей за реализацию данной функциональности.
Выбор основных функциональностей осуществляется в два этапа. Сначала, в блоке выбора «Вид исследований» выбирается либо задача анализа отдельных параметров, либо задача анализа групп параметров. В зависимости от этого выбора активизируется левая или правая половина блока выбора решаемых задач «Основные функциональности», на котором и производится окончательной выбор частной задачи исследований. При этом в случае необходимости, активизируется одно из окон блока выбора параметров анализа «Опции», позволяющего уточнить используемые константы. Всего таких окон три:
- окно выбора уровня доверия (используется при решении задач дескриптивного анализа, обнаружения аномальных наблюдений и корреляционных несоответствий);
- окно выбора уровня значимости корреляционных связей (используется при решении задачи выявления факторов, имеющих значимые корреляционные связи с исследуемым параметром);
- окно выбора порядка полиномиальной аппроксимирующей модели (используется при решении задачи параметрической идентификации динамики изменения исследуемого параметра).
Рисунок 2. Внешний вид интерфейса ПМ предобработки данных
Задание на исследование, выбранные параметры и имя файла с массивами исходных данных вводятся в программу кнопкой «Ввод». При этом соответствующие значения высвечиваются для контроля на дисплее монитора. В случае если введенные данные соответствуют выбору пользователя, кнопкой «Старт» осуществляется запуск основной программы исследования, осуществляющей решение поставленной задачи. Соответствующие результаты выводятся в окнах «Результаты анализа» интерфейса. При этом левое окно обеспечивает графический, а правое - текстовый вывод результатов предобработки.
Применение модуля предобработки данных
ПМ может использоваться автономно, на любом рабочем компьютере с современными версиями операционной среды Windows. При этом исходные массивы данных передаются либо в текстовом формате, либо в формате электронных таблиц MS Ехсе1.
Обращение к основной программе ПМ осуществляется через интерфейс (см. рисунок 2). В качестве примеров
применения ПМ рассмотрим две функциональности: выявление аномальных наблюдений в БД ретроспективных данных и задачу визуализации многомерного состояния методом компонентного анализа. Оба примера предобработки данных осуществлены на основе данных, полученных в процессе мониторинга состояния промышленной технологической установки атмосферной перегонки (ректификации) нефти.
Обнаружение аномальных измерений
При решении задач статистического анализа данных наличие в выборке аномальных измерений может привести к существенной потере в точности формируемых оценок и прогнозов. В связи с этим в ПМ предусмотрена функция, позволяющая обнаруживать и устранять аномальные наблюдения.
Для гауссовского распределения погрешностей наблюдений в качестве решающего правила при решении задачи обнаружения аномальных наблюдений можно использовать простейший подход, основанный на попадании наблюдений за пределы доверительного интервала
. При этом вероятность того, что наблюдения лежат в пределах данного интервала обычно выбирается из числового ряда 0,95, 0,99, 0,999, 0,997. Пренебрегая вероятностью соответствующей ошибки, можно рассматривать все наблюдения, не попадающие в 4е, как аномальные. Аналогичные результаты дает подход, основанный на проверке статистических гипотез. Одним из распространенных решающих правил является критерий выявления аномальных наблюдений на основе статистики вида:
п
¿1
Здесь Х(„) - «подозрительное» наблюдение, х и э - выборочные оценки среднего, построенные по выборке объема п.
В качестве примера на рисунке 3 представлен график наблюдений изменения давления в колонне К1 установки АТ6 [4]. Звездочками обозначены наблюдения, которые в соответствии с представленным решающим правилом отнесены к категории аномальных для уровня доверия а = 0.95.
Рисунок 3. Результаты обнаружения аномальных наблюдений в ряду наблюдений за параметром «Давление в колонне К1»
Компонентный анализ
Для решения задачи визуализации многомерных процессов (порядка т > 3) часто используется технологии
обработки данных на основе линейной формы ук = ^_1а>х>
(к < 3, т.к. такое ограничение допускает визуализацию данных), отвечающие условию максимального сохранения информации, содержащейся в массиве наблюдений X. Один из вариантов решения обеспечивается методом главных компонентов [3], в соответствии с которым коэффициенты указанной линейной формы представляют собой собственные векторы 5, отвечающие наибольшим собственным числам {Л j = 1.....т} ковариационной
матрицы S массива исходных данных X. Для нахождения собственных чисел осуществляется решение характеристического уравнения ^ -Л|| = 0 , где I - единичная матрица. В качестве примера на рисунке 4 приведено представление значений 12-мерного вектора управления технологической установкой АТ6 (установка атмосферной перегонки нефти) в трехмерном пространстве главных компонент.
Заметим, что весовые характеристики представлений отдельных групп наблюдений обеспечивают возможность учета их дисперсионных и корреляционных свойств. Это позволяет обнаруживать аномальные векторные наблюдения, содержащие корреляционные несоответствия внутри исследуемой группы. Иными словами, возникает возможность идентифицировать скрытые аномалии (или векторные наблюдения с деформированными корреляционными связями). При этом в качестве критерия аномальности можно использовать вышеописанные правила обнаружения больших отклонений, применяя их в обобщенном пространстве последовательно по каждой главной компоненте.
Рисунок 4. Представление вектора управления установкой АТ6 в пространстве главных компонент
Выводы
Разработанный в настоящей работе ПМ позволяет получить дополнительную информацию о статистических и динамических свойствах контролируемых процессов, взаимосвязях отдельных параметров, получить интегрированное представление об изменении состояния отдельных функциональных групп параметров управления, состояния и выхода. Полученная информация, в свою очередь, дает возможность повысить качество формируемых управлений и получить необходимые сведения для формирования оптимизирующих управлений.
Литература
1. Бахтадзе Н.Н. Виртуальные анализаторы (идентификационный подход) // Автоматика и телемеханика. 2004. № 11. С. 3-24.
2. Сархан А.Е., Гринберг Б.Г. Введение в теорию порядковых статистик / пер. с англ. под ред. А.Я. Боярского. М.: Статистика, 1970. 414 с.
3. Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Классификация и снижение размерности / под ред. Айвазяна С.А. М.: Финансы и статистика, 1989. 607 с.
4. Баннов П.Г. Процессы переработки нефти М.: ЦНИИТЭнефтехим, 2000. 224 с.