Научная статья на тему 'Представление и обработка знаний в информационных автоматизированных системах интеллектуальных месторождений'

Представление и обработка знаний в информационных автоматизированных системах интеллектуальных месторождений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
398
95
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕФТЕГАЗОВАЯ ОТРАСЛЬ / ИНТЕЛЛЕКТУАЛЬНОЕ МЕСТОРОЖДЕНИЕ / БАЗА ЗНАНИЙ / ФОРМАЛЬНАЯ СИСТЕМА / ТОПОЛОГИЧЕСКАЯ БУЛЕВА АЛГЕБРА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Мазаков Е.Б.

Эффективное управление в нефтегазовой отрасли связано с повышением степени автоматизации, дальнейшим совершенствованием информационных систем и технологий в рамках концепции «интеллектуального месторождения». Сложность построения автоматизированных интеллектуальных информационных систем связана с разработкой моделей представления и обработки нечетких, неполных знаний (данных). Рассматривается подход к построению базы знаний с использованием теории категорий, аксиоматических формальных теорий и аппарата топологической булевой алгебры. Показана возможность обрабатывать нечеткую информацию и осуществлять логический вывод в рамках дедуктивных формальных систем.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Представление и обработка знаний в информационных автоматизированных системах интеллектуальных месторождений»

УДК 665.633

Е.Б.МАЗАКОВ, канд. техн. наук, доцент, miadsp@rambler.ru Национальный минерально-сырьевой университет «Горный», Санкт-Петербург

E.B.MAZAKOV, PhD in eng. sc., associate professor, miadsp@rambler.ru National Mineral Resources University (Mining University), Saint Petersburg

ПРЕДСТАВЛЕНИЕ И ОБРАБОТКА ЗНАНИЙ В ИНФОРМАЦИОННЫХ АВТОМАТИЗИРОВАННЫХ СИСТЕМАХ ИНТЕЛЛЕКТУАЛЬНЫХ МЕСТОРОЖДЕНИЙ

Эффективное управление в нефтегазовой отрасли связано с повышением степени автоматизации, дальнейшим совершенствованием информационных систем и технологий в рамках концепции «интеллектуального месторождения». Сложность построения автоматизированных интеллектуальных информационных систем связана с разработкой моделей представления и обработки нечетких, неполных знаний (данных).

Рассматривается подход к построению базы знаний с использованием теории категорий, аксиоматических формальных теорий и аппарата топологической булевой алгебры. Показана возможность обрабатывать нечеткую информацию и осуществлять логический вывод в рамках дедуктивных формальных систем.

Ключевые слова: нефтегазовая отрасль, интеллектуальное месторождение, база знаний, формальная система, топологическая булева алгебра.

REPRESENTATION AND PROCESSING OF KNOWLEDGE IN INFORMATION AUTOMATED SYSTEMS

OF INTELLIGENT FIELD

Effective management in the oil and gas industry is associated with an increased degree of automation, the further improvement of the information systems and technologies in the framework of the concept of «intelligent field». Complexity of construction of automated intelligent information systems associated with the working out of models of representation and processing of incomplete knowledge (data).

We consider an approach to the construction of a knowledge base using category theory, axiomatic formal theories and the topological Boolean algebra. The possibility to handle fuzzy information and implement the logical conclusion in the framework of the formal deductive systems.

Key words: oil and gas industry, intellectual field, knowledge base, formal system, topo-logical Boolean algebra.

Информационные системы и технологии служат основой развития стратегически важных отраслей минерально-сырьевого комплекса, роста их эффективности за счет повышения уровня автоматизации управления разработкой, оперативного принятия решений, оценки и минимизации рисков.

В настоящее время спрос на финансово-логистические модули ERP-систем, на-

блюдавшийся в предыдущие годы, в частности в нефтегазовом секторе, прошел [2]. Практически на всех крупных предприятиях отрасли уже осуществляются проекты по внедрению ERP-решений, и сегодня речь идет о расширении их функциональных возможностей, разработке новых модулей, связанных с управлением человеческими ресурсами, активами, сбытом и т.д.

256 _

ISSN 0135-3500. Записки Горного института. T.20S

В то же время все большую актуальность приобретают автоматизация различных технологических процессов, а также обеспечение взаимодействия между управленческими системами верхнего уровня (класса ERP) и системами автоматизации технологических процессов (АСУТП). Поэтому возникает активный спрос на системы промежуточного уровня (MES-системы), обеспечивающие эту взаимосвязь, интеграцию ключевых ИТ-решений, внедренных на различных предприятиях. Кроме того, увеличивается спрос на различные аналитические системы, прежде всего решения на базе OLAP-технологий (интеллектуальный анализ данных), позволяющих обрабатывать большие объемы данных по различным срезам на уровне централизованного сбора и обработки информации в рамках всей распределенной структуры управления.

Для объединения существующих информационных технологий в России и в мире начинают внедрять концепцию (технологию) интеллектуальных месторождений в практику управления процессами разработки и эксплуатации месторождений нефти и газа. В различных источниках наряду с термином интеллектуальное месторождение используются понятия умное производство, интеллектуальная скважина и др. (табл.1).

Под интеллектуальным нефтегазовым месторождением следует понимать систему автоматического (автоматизированного) управления операциями по добыче нефти и газа, предусматривающую непрерывную в

реальном масштабе времени оптимизацию интегральной модели месторождения и модели управления добычей, гарантирующей оптимальное управление на всех уровнях при контроле целей предприятия.

Необходимыми условиями существования интеллектуального месторождения являются формализованность информационной модели месторождения, наличие аппарата управления, максимально точные интерфейсы обратной связи, интерфейсы для оптимизации процессов, моделей и критериев. В структуре интеллектуального месторождения можно выделить уровни иерархии (табл.2) и их взаимодействие (см. рисунок).

Обработка информации и управление интеллектуальными месторождениями имеет следующие особенности:

• разнообразие решаемых задач (ин-формационно-посковых, расчетных, аналитических, логических, или интеллектуальных, телекоммуникационных и др.);

• значительный объем первичных измерений и результатов моделирования (до десятков терабайт);

• большое количество не всегда синхронизированных между собой моделей специального математического и программного обеспечения;

• функционирование в условиях неопределенности и неполноты информации.

Как показывает анализ, традиционные подходы к разработке математического и программного обеспечения автоматизированных информационных систем по обра-

Таблица 1

Объекты интеллектуальных месторождений

Компания Объект в РФ Технология

Shell Салымские месторождения Умное месторождение (Smart Field)

Chevron - Интеллектуальное месторождение (i-field)

BP - Месторождение будущего (Field of the future)

Роснефть Приобское месторождение Месторождение на ладони

Газпром Сахалин-2 Умное месторождение (Smart Field)

ТНК-BP Самотлорское, Ваньеганское, Уватские месторождения Интеллектуальное месторождение (i-field)

Татнефть НГДУ «Альметьевнефть» »

Лукойл Западная Курна-2 »

Кокуйское месторождение Интеллектуальный куст скважин

Таблица 2

Уровни иерархии интеллектуального месторождения

Уровень иерархии

Процесс

Задачи

Оперативного управления

АСУТП

Аппаратный

Геологическое моделирование

Фильтрационное моделирование и адаптация по истории разработки

Моделирование неопределенности и анализ рисков

База данных для мониторинга моделей

Мониторинг разработки месторождения Мониторинг и анализ моделей

Сбор, передача, обработка и хранение в реальном времени информации от датчиков Диагностика и контроль в режиме реального времени

Управление активными устройствами и автоматическое регулирование

Многофазные расходомеры Детекторы

Забойные датчики давления и температуры Системы совместно-раздельной эксплуатации

Уточнение начальных запасов, построение карт, кубов и разрезов, проектирование скважин Интеграция данных добычи в фильтрационную модель, прогноз технологических показателей, оптимизация

Оценка принимаемых рисков и оптимизация мероприятий по снижению рисков

Хранение, систематизация, экспорт, контроль и объединение геолого-геофизических данных, данных разработки и моделей. Обеспечение доступа к данным Анализ разработки месторождения, построения карт, схем, графиков технологических показателей Анализ соответствия модели и текущей ситуации, поиск и оценка мероприятий на основе моделей, интегрированная интерпретация

Надежное резервирование, беспроводные технологии, масштабируемость

Обеспечение корректности работы датчиков, отслеживание и анализ сбоев

Реализация сложных стратегий на основе алгоритмов оптимального управления

Точное измерение воды, нефти и газа Контроль механических примесей и оптимизация режимов скважин

Точное измерение забойных давлений

Оперативная и обратимая изоляция интервалов в

скважинах

ботке информации, не дает требуемых результатов [1, 3]. Ряд последних исследований по системам обработки информации (данных, знаний) показывает, что существующие методы представления и обработки знаний основываются на теоретико-множественном подходе, который ограничивает возможности манипулирования знаниями, по следующим причинам.

• элементы математических множеств не оцениваются по присутствию. В реальности присутствие объектов множеств может меняться в зависимости от состояния предметной области;

• предметы как элементы множества и сами множества являются статичными (не меняющимися с течением времени), что мало оправдано при рассмотрении реальных физических объектов.

Теория категорий, развивающаяся в последнее время как альтернатива теории

множеств, обладает более широкими возможностями описания реальных, а не математических объектов. Среди основных преимуществ теории категорий можно выделить широкую трактовку категории и ее объектов как свойств, процессов, состояний и явлений. Объектами категорий могут являться не только множества, но и другие математические абстракции (универсальные алгебры, их частные примеры и др.). Универсальный формализм категорий позволяет с единых позиций описывать внешне различные объекты. Морфизмы категорий обозначают морфизмы вложения (включения в класс), функциональные отображения одних объектов в (на) другие, а это позволяет выразить любые связи между объектами.

Каждому морфизму категории К ставится в соответствие синтаксическая конструкция вида [ц,:У^Х], где ц - имя мор-физма; У - оригинал 01^ ц,; Х - образ 1т ц,.

258 _

ISSN 0135-3500. Записки Горного института. Т.208

г

Оборудование и АСУТП

АСУТП

Автоматизированное (автоматическое) управление

БД АСУТП

I. I-*

База данных

Информационная система оперативного управления

Совместный анализ данных

Мониторинг

моделей, разработки месторождений

Структура и взаимодействие уровней интеллектуального месторождения

Предполагается, что все объекты представляются как совокупности морфизмов.

Исходя из изложенного, предлагается категорная модель знаний (КМ3). Под КМ3 понимается совокупность формализованных описаний объектов и закономерностей проблемной области, а также эвристик, воспроизводящих целенаправленную мыслительную деятельность эксперта по обработке информации и принятию решения. Вся реальная предметная область представляется в виде объектов. Объект служит для моделирования знаний эксперта об отдельном фрагменте решаемой задачи в виде структур, наиболее полно сохраняющих семантику предметной области (ПО).

Каждая из категорий отражает определенный аспект знаний о концептах (интен-сионал, состояние, пространство, время и т. п.). Полное описание концепта можно представить в виде произведения категорий

Ка^Ка^ ... Ка1:„.

Состав категории меняется в зависимости от рассматриваемого «возможного мира» ю,. Множества возможных миров ю связаны между собой отношением доступности Я мира Ю1 после юк. При этом пара (ю, К) бу-

дет представлять метазнания о проблемной области.

Необходимо заметить, что в качестве информации, характеризующей объект, могут выступать признаки, являющиеся, в свою очередь, концептами. Объекты, существенные признаки которых являются в свою очередь концептами, в дальнейшем будем именовать составными объектами (СО), а объекты, описанные только через индивидуальные признаки - терминальными объектами (ТО). Таким образом, СО могут состоять из признаков, терминальных объектов и других составных объектов.

Для формализации знаний целесообразно использовать семиотический подход. При этом семиотическая модель ПО строится на базе формальной системы логического типа (логического исчисления). В ряде исследований показано, что для описания объектов реальности наиболее целесообразно использование исчисления, построенного на базе логики присутствия и имеющего следующие особенности [3, 4]:

• понятие свойства принимается в качестве первичного, что согласуется с тео-ретико-категорным подходом к построению КМЗ;

• логические операции представлены операциями топологической булевой алгебры < п, и, —, I, С >, где и - неисклю-чающее ИЛИ по присутствию; п - соединение по присутствию; ^ - релевантное логическое следование по присутствию; - - дополнение по присутствию; I, С - взятие внутренности и замыкания соответственно.

• присутствие объекта определяется с использованием констант исчисления, обозначающих присутствие Рг, отсутствие Аь, неопределенность ип, противоречие Сп.

В соответствии с категорной моделью знаний объекты категорий могут быть составными и терминальными. В зависимости от уровня детализации имеющихся знаний составной объект может стать терминальным, а терминальный - составным. Это зависит от того, на каком уровне получены исходные данные: от датчиков или заданы экспертом.

В исчислении присутствия любой объект описывается через некоторые признаки ц1, существенные для описания объекта в мире ю, согласно теории ограничений, ресурсов, планирования и др. Основу исчисления составляет понятие присутствия объекта в мире ю, принимающее одно из двух значений присутствия и Щ(ю,). Первое означает присутствие объекта в мире Юj согласно теории, второе - его отсутствие.

Так как объекты имеют материальную основу и характеризуются набором признаков (свойств), то формула любого произвольного объекта через признаки на языке алгебры будет представлена в виде

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

к п,

* = и П Ц у ,

,=1]=1

где Ц] - некоторое свойство или его дополнение по присутствию; к и п - соответственно количество наборов признаков и число признаков В каждом наборе.

Особенности управления в сложных организационно-технических системах, связанные прежде всего с неопределенностью, приводят к тому, что часть признаков может быть недоступна для регистрации, поэтому их можно разделить на два класса: доступ-

ные для системы пу и недоступные Ъ,у. Тогда формула терминального объекта примет вид

N (р Л (т Л

* = и П П] П и ^ I,

i= 1

v=°

V r=0

где P¡ + mi = n, i = I, N . При этом ^i0 и ni0

обозначают для всех i= I,N.

Если считать значения присутствия признаков "t,ir неизвестными, то придавая каждому из них значения S(rai) и N(©i) во всех возможных комбинациях и исключая из формулы элементы, для которых m

П ^1r = N(ю), получим множество формул

r=0

yz, каждая из которых может рассматриваться как окрестность исходной формулы. На множестве yz можно ввести отношение частичного порядка и выделить наибольшую нижнюю и наименьшую верхнюю грани, которые принимаются соответственно в качестве внутренности (Iz) и замыкания (Cz) формулы ф е \yz.

Необходимо заметить, что оценки (val) присутствия объекта z (val z, val —i z) для произвольной формулы фz выражаются различными формулами Iz, Сz, I — z, С — z, которые могут принимать значение £(ю) или N(ю) и являются внутренними константами исчисления присутствия. В соответствии с этим объекту z ставится в соответствие вектор

условий присутствия z = < I z, Сz, I—z, С—z >, оценки которого принимают значения из совокупности

Pr = (S, N, S, N - присутствует; Ab = (N, S, N, S) - отсутствует; Un= (N, S, S, N) - неопределено; Сп = (S, S, S, S) - противоречиво.

val z =

Если I интерпретировать как оператор необходимости Ь, а С как оператор возможности N то исчисление присутствия может быть отнесено к модальной логике Льюиса. Тогда, например, условие «необходимо * и возможно г» соответствует достоверному присутствию объекта *; «необходимо —I г и

260 _

ISSN 0135-3500. Записки Горного института. Т.208

возможно —12» - достоверному отсутствию объекта 2 ; «возможно 2 и возможно — 2» -неопределенности; «необходимо 2 и необходимо — 2 » - противоречию и т. д.

Строгое описание взаимодействия объектов предметной области можно осуществить в рамках формальных теорий. Такая теория состоит из множества локальных теорий, каждая из которых имеет ограниченную область применения. Опишем формальные теории более подробно.

В исчислении присутствия объект описывается через подобъекты (существенные признаки объекта). Для формирования теории объекта описание через подобъекты замещается морфизмами в данный объект. Совокупность этих морфизмов образует покрытие объекта и

ф = {ф1 :и1 ^ и, \1 е I}

и называется решетом над объектом и.

Для категории К можно задать семейство решет С(Ц), по одному для каждого объекта из этой категории, т.е. объекты и могут, в свою очередь, иметь покрытие некоторым семейством морфизмов ф. Так как композиции морфизмов также образуют покрывающее семейство для и, то совокупность таких решет для категории К образует так называемую топологию Гротендика, а категория вместе с такой топологией называется сайтом (местом). Топология Гротендика определяется для так называемых малых категорий, морфизмы (объекты) которых составляют множества. Каждому мор-физму и объекту в теории ставятся в соответствие классы или частные примеры конкретных или абстрактных понятий и отношений предметной области. Такое определение решета равносильно представлению объектов категории и представимыми функторами, т.е. множествами морфизмов ИошА(и, и), I е I.

Представимые функторы составляют основу для формирования пучков теорий над сайтом. Это позволяет объединять локальные теории отдельных объектов в глобальную теорию реальности. В связи с тем, что каждая категория отражает отдельный

аспект знаний о предметной области (процессы, состояния и т.д.), теория объекта Т(ОЬ\) определяется над сайтом из произведения категорий

Т(ОЬ1) = Ка^К^ ... КаЪ.

Динамика поведения объекта в физической (абстрактной) реальности находит свое отражение в теории объекта через изменение оценок присутствия морфизмов, связанных с данным объектом. С этой целью вводится понятие дифференциала присутствия морфизма (ДИМ).

Под дифференциалом присутствия морфизма понимается синтаксическая кон-

л п

струкция вида АарЦ1, принимающая при

интерпретации значение £(ю) или Ш(ю) и означающая изменение значения присутствия морфизма с а на Р в результате элементарного шага некоторого процесса, который определяется порядком дифференциала п. Тогда а и Р принимают одно из значений множества констант исчисления рг, АЬ, ип, Сп, Q}, где Q означает, что операция по определению значения присутствия переменной еще не выполнялась. Можно считать, что Q выражает полную априорную неопределенность в отличие от ип, соответствующего апостериорной неопределенности, т.е. отсутствию информации, установленному в результате анализа имеющиеся данных.

Порядок ДПМ п = 1, если теория описывает одно состояние реальности, не содержащее изменений морфизмов (статика). Если изменение является результатом шага логического вывода, то п = 2. При п = 3 изменение присутствия морфизма получено в результате изменения теории объекта.

Правила построения формул теорий объектов можно определить на основе свойств алгебры дифференциалов присутствия морфизмов с операцией композиции •:

К п, и, —, •}.

При необходимости алгебра ДПМ может быть дополнена операцией Ф альтернативного присутствия.

В общем случае аксиома теории может быть представлена как конъюнкция по присутствию в виде

АагРг Ц П Апа2РzЦгП ...П А^пЦп П А^ Ц0,

пРи а0 ^

где А^ Цг (г = I, N) играют роль посылок

аксиомы; А^^ Ц0 - роль следствия.

Рассмотренная категория моноида с указанной определенным образом топологией образует пучок теорий над сайтом, называемый топосом Гротендика.

Предложенный подход к построению модели представления знаний позволяет описывать взаимодействие различных объектов (программных модулей, неструктурированных данных и др.) через входящие и исходящие из них морфизмы, строить многоуровневые иерархические теории, осуществлять объединение теорий объектов одного уровня с другим и таким образом строить глобальную теорию предметной области, что обеспечивает решение задач обработки знаний и неструктурированных данных, интерпретации результатов сложного анализа и моделирования.

ЛИТЕРАТУРА

1. Беспалов А.П. Умные технологии для умного управления // Современные информационные технологии в нефтяной и газовой промышленности: 41-я науч.-практ. конф. Сочи, 2012.

2. Болотник Д.Н. Технологии интеллектуального месторождения и некоторые примеры элементов данной технологии // Современные информационные технологии в нефтяной и газовой промышленности: 41-я науч.-практ. конф. Сочи, 2012.

3. Модели и алгоритмы концептуального проектирования автоматизированных систем управления / Под ред. С.Г.Чекинова. М., 2004. 324 с.

4. Теоретические основы автоматизации процессов выработки решений в системах управления / В.Е.Ярушек, В.П.Прохоров, Б.Н.Судаков, А.В.Мишин. Харьков, 1993. 443 с.

REFERENCES

1. Bespalov A.P. Smart technologies for smart management // Modern information technologies in the oil and the gas industry: 41st Scientific Conference. Sochi, 2012.

2. Bolotnik D.N. Intelligent technology field and some examples of the elements of the technology // Modern information technologies in the oil and gas industry: 41st Annual Scientific Conference. Sochi, 2012.

3. Models and algorithms for the conceptual design of the automated control systems / Ed. S.G.Chekinova. Moscow, 2004. 324 p.

4. Yarushek V.E., Prokhorov V.P., Sudakov B.N., Mishin A. V. Theoretical Foundations of automated decision-making processes in the control systems. Kharkov, 1993. 443 p.

262 _

ISSN G135-35GG. Записки Горного института. T.2GS

i Надоели баннеры? Вы всегда можете отключить рекламу.