Научная статья на тему 'ПРЕДВАРИТЕЛЬНЫЙ АНАЛИЗ ИСХОДНЫХ ДАННЫХ МОНИТОРИНГА НЕФТЕПЕРЕРАБОТКИ'

ПРЕДВАРИТЕЛЬНЫЙ АНАЛИЗ ИСХОДНЫХ ДАННЫХ МОНИТОРИНГА НЕФТЕПЕРЕРАБОТКИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
40
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОГРАММНЫЙ МОДУЛЬ / SOFTWARE MODULE / НЕФТЕПЕРЕРАБОТКА / ПРЕДВАРИТЕЛЬНЫЙ АНАЛИЗ / PRELIMINARY ANALYSIS / ПРОГНОЗИРОВАНИЕ / PREDICTION / СКРЫТЫЕ АНОМАЛИИ / HIDDEN ANOMALIES / OIL REFINING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Мусаев Андрей Александрович, Гайков Андрей Владимирович

В настоящей работе рассматривается программный модуль предобработки, ориентированный на задачи анализа данных, полученных в процессе мониторинга состояния технологического процесса первичной переработки нефти, позволяющий получить дополнительную информацию о статистических и динамических свойствах контролируемых процессов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Мусаев Андрей Александрович, Гайков Андрей Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PRELIMINARY ANALYSIS OF INITIAL DATA MONITORING OIL

The paper deals with preprocessing software module, task-based on analysis of data obtained in the process of monitoring the status of the process of primary oil refining, provides additional information on the statistical and dynamical properties of the controlled processes.

Текст научной работы на тему «ПРЕДВАРИТЕЛЬНЫЙ АНАЛИЗ ИСХОДНЫХ ДАННЫХ МОНИТОРИНГА НЕФТЕПЕРЕРАБОТКИ»

II. ИНФОРМАЦИОННЫЕ СИСТЕМЫ. АВТОМАТИЗАЦИЯ И СИСТЕМЫ УПРАВЛЕНИЯ

УДК 658.5.011:681.3 А.А. Мусаев1, А.В. Гайков2

ПРЕДВАРИТЕЛЬНЫЙ АНАЛИЗ ИСХОДНЫХ ДАННЫХ МОНИТОРИНГА НЕФТЕПЕРЕРАБОТКИ

Введение

Применение средств оптимизации управления сложными динамическими системами (сДс) предполагает наличие математических моделей, для построения и коррекции которых используются ряды наблюдений, полученные в процессе мониторинга за изменением их состояния. Однако на практике качество полученного «информационного сырья» оказывается недостаточным для формирования адекватных математических моделей.

В большинстве случаев алгоритмы прогнозирования и принятия решений базируются на математических методах, применение которых ограничено набором условий. Данные условия обычно относятся к статистическим и динамическим свойствам исходных данных. При невыполнении этих условий соответствующие алгоритмы оптимизации в лучшем случае не обеспечивают формирование эффективных решений, а при некоторых обстоятельствах, вообще приводят к ложным выводам. В связи с этим применению формализованных методов управления должен предшествовать комплексный анализ свойств информационных потоков и их предварительная обработка. Отсюда непосредственно вытекает рассмотренная ниже задача разработки программного модуля (ПМ), обеспечивающего решение указанных задач.

Кроме того, ПМ должен обеспечивать решение таких важных для управления задач, как

- оперативное преобразование потока измерительной информации в совокупность параметров, допускающих наглядную интерпретацию протекающих процессов;

- выявление скрытой информации, описывающей взаимосвязи и взаимовлияния параметров установки и внешней среды;

Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, Санкт-Петербург, пер. Гривцова, д. 14 Санкт-Петербургский государственный технологический институт (технический университет), Санкт-Петербург, Московский пр. 26

В настоящей работе рассматривается программный модуль предобработки, ориентированный на задачи анализа данных, полученных в процессе мониторинга состояния технологического процесса первичной переработки нефти, позволяющий получить дополнительную информацию о статистических и динамических свойствах контролируемых процессов.

Ключевые слова: программный модуль, нефтепереработка, предварительный анализ, прогнозирование, скрытые аномалии.

- агрегирование, сжатие и визуализация многомерных взаимосвязанных процессов;

- обнаружение аномальных наблюдений и скрытых несоответствий и т.п.

Концептуальные основы построения подобных модулей и их применения были подробно описаны в [1]. В настоящей статье рассмотрен конкретный пример реализации ПМ предобработки, ориентированного на задачи анализа данных, полученных в процессе мониторинга состояния технологического процесса (ТП) первичной переработки нефти.

Техническая реализация ПМ может осуществляться в самых разнообразных формах - от программных продуктов, интегрируемых в качестве аналитических надстроек в АСУ, до программных приложений БД. В целом, ПМ предобработки следует рассматривать как функциональный элемент системы поддержки принятия решений, предназначенный для повышения эффективности формируемых управлений.

Функциональная структура ПМ приведена на рисунке 1.

Результаты мониторинга состояния установки и ее выходных параметров поступают в БД в виде временной последовательности многомерных данных. Содержащиеся в БД сведения могут не в полной мере отвечать требованиям системы обработки данных. В связи с этим возникает необходимость использования модуля предварительной обработки данных, включающая в себя такие функции, как обнаружение и обработка пропусков в БД, выявление мультиколлинеарности в исходных данных, сглаживание временных рядов наблюдений и другие.

1 Мусаев Андрей Александрович, студент Санкт-Петербургского национального исследовательского университета информационных технологий, механики и оптики, е-таП: amusayev1990@gmail.com

2 Гайков Андрей Владимирович, канд. техн. наук, доцент каф. системного анализа, зам. декана ф-та информационных технологий и управления Санкт-Петербургского государственного технологического института (технического университета). е-таИ: av489@yandex.ru

Дата поступления - 26 марта 2014 года

Текущие данные

БД мониторинга

1нга

программный интерфейс пользователя

Формир ование задания

Выбор параметров

Вывод результатов

Загрузка и формирование исходных и обучающих данных

Дескриптивный анализ

Анализ динамики изменений

Выявление взаимосвязей

Анализ аномалий

Анализ отклонений

Корреляционный анализ

Компонентный анализ

Анализ несоответствий

н

я

н

I

3

S -

Рисунок 1. Функциональная структура модуля предобработки

Выбор загружаемого массива, используемых функциональностей и параметров исследования осуществляется средствами разработанного программного интерфейса пользователя. Сюда же, в графические окна интерфейса включаются выводы результатов, отвечающих выбранной задаче (функциональности). Внешний вид интерфейса приведен на рисунке 2.

Решение задач осуществляется последовательно. При каждом обращении к программе выбирается одна конкретная задача, в соответствии с которой задание передается соответствующей процедуре, отвечающей за реализацию данной функциональности.

Выбор основных функциональностей осуществляется в два этапа. Сначала, в блоке выбора «Вид исследований» выбирается либо задача анализа отдельных параметров, либо задача анализа групп параметров. В зависимости от этого выбора активизируется левая или правая половина блока выбора решаемых задач «Основные функциональности», на котором и производится окончательной выбор частной задачи исследований. При этом в случае необходимости, активизируется одно из окон блока выбора параметров анализа «Опции», позволяющего уточнить используемые константы. Всего таких окон три:

- окно выбора уровня доверия (используется при решении задач дескриптивного анализа, обнаружения аномальных наблюдений и корреляционных несоответствий);

- окно выбора уровня значимости корреляционных связей (используется при решении задачи выявления факторов, имеющих значимые корреляционные связи с исследуемым параметром);

- окно выбора порядка полиномиальной аппроксимирующей модели (используется при решении задачи параметрической идентификации динамики изменения исследуемого параметра).

Рисунок 2. Внешний вид интерфейса ПМ предобработки данных

Задание на исследование, выбранные параметры и имя файла с массивами исходных данных вводятся в программу кнопкой «Ввод». При этом соответствующие значения высвечиваются для контроля на дисплее монитора. В случае если введенные данные соответствуют выбору пользователя, кнопкой «Старт» осуществляется запуск основной программы исследования, осуществляющей решение поставленной задачи. Соответствующие результаты выводятся в окнах «Результаты анализа» интерфейса. При этом левое окно обеспечивает графический, а правое - текстовый вывод результатов предобработки.

Применение модуля предобработки данных

ПМ может использоваться автономно, на любом рабочем компьютере с современными версиями операционной среды Windows. При этом исходные массивы данных передаются либо в текстовом формате, либо в формате электронных таблиц MS Ехсе1.

Обращение к основной программе ПМ осуществляется через интерфейс (см. рисунок 2). В качестве примеров

применения ПМ рассмотрим две функциональности: выявление аномальных наблюдений в БД ретроспективных данных и задачу визуализации многомерного состояния методом компонентного анализа. Оба примера предобработки данных осуществлены на основе данных, полученных в процессе мониторинга состояния промышленной технологической установки атмосферной перегонки (ректификации) нефти.

Обнаружение аномальных измерений

При решении задач статистического анализа данных наличие в выборке аномальных измерений может привести к существенной потере в точности формируемых оценок и прогнозов. В связи с этим в ПМ предусмотрена функция, позволяющая обнаруживать и устранять аномальные наблюдения.

Для гауссовского распределения погрешностей наблюдений в качестве решающего правила при решении задачи обнаружения аномальных наблюдений можно использовать простейший подход, основанный на попадании наблюдений за пределы доверительного интервала

. При этом вероятность того, что наблюдения лежат в пределах данного интервала обычно выбирается из числового ряда 0,95, 0,99, 0,999, 0,997. Пренебрегая вероятностью соответствующей ошибки, можно рассматривать все наблюдения, не попадающие в 4е, как аномальные. Аналогичные результаты дает подход, основанный на проверке статистических гипотез. Одним из распространенных решающих правил является критерий выявления аномальных наблюдений на основе статистики вида:

п

¿1

Здесь Х(„) - «подозрительное» наблюдение, х и э - выборочные оценки среднего, построенные по выборке объема п.

В качестве примера на рисунке 3 представлен график наблюдений изменения давления в колонне К1 установки АТ6 [4]. Звездочками обозначены наблюдения, которые в соответствии с представленным решающим правилом отнесены к категории аномальных для уровня доверия а = 0.95.

Рисунок 3. Результаты обнаружения аномальных наблюдений в ряду наблюдений за параметром «Давление в колонне К1»

Компонентный анализ

Для решения задачи визуализации многомерных процессов (порядка т > 3) часто используется технологии

обработки данных на основе линейной формы ук = ^_1а>х>

(к < 3, т.к. такое ограничение допускает визуализацию данных), отвечающие условию максимального сохранения информации, содержащейся в массиве наблюдений X. Один из вариантов решения обеспечивается методом главных компонентов [3], в соответствии с которым коэффициенты указанной линейной формы представляют собой собственные векторы 5, отвечающие наибольшим собственным числам {Л j = 1.....т} ковариационной

матрицы S массива исходных данных X. Для нахождения собственных чисел осуществляется решение характеристического уравнения ^ -Л|| = 0 , где I - единичная матрица. В качестве примера на рисунке 4 приведено представление значений 12-мерного вектора управления технологической установкой АТ6 (установка атмосферной перегонки нефти) в трехмерном пространстве главных компонент.

Заметим, что весовые характеристики представлений отдельных групп наблюдений обеспечивают возможность учета их дисперсионных и корреляционных свойств. Это позволяет обнаруживать аномальные векторные наблюдения, содержащие корреляционные несоответствия внутри исследуемой группы. Иными словами, возникает возможность идентифицировать скрытые аномалии (или векторные наблюдения с деформированными корреляционными связями). При этом в качестве критерия аномальности можно использовать вышеописанные правила обнаружения больших отклонений, применяя их в обобщенном пространстве последовательно по каждой главной компоненте.

Рисунок 4. Представление вектора управления установкой АТ6 в пространстве главных компонент

Выводы

Разработанный в настоящей работе ПМ позволяет получить дополнительную информацию о статистических и динамических свойствах контролируемых процессов, взаимосвязях отдельных параметров, получить интегрированное представление об изменении состояния отдельных функциональных групп параметров управления, состояния и выхода. Полученная информация, в свою очередь, дает возможность повысить качество формируемых управлений и получить необходимые сведения для формирования оптимизирующих управлений.

Литература

1. Бахтадзе Н.Н. Виртуальные анализаторы (идентификационный подход) // Автоматика и телемеханика. 2004. № 11. С. 3-24.

2. Сархан А.Е., Гринберг Б.Г. Введение в теорию порядковых статистик / пер. с англ. под ред. А.Я. Боярского. М.: Статистика, 1970. 414 с.

3. Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Классификация и снижение размерности / под ред. Айвазяна С.А. М.: Финансы и статистика, 1989. 607 с.

4. Баннов П.Г. Процессы переработки нефти М.: ЦНИИТЭнефтехим, 2000. 224 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.