Научная статья на тему 'Представление и обработка знаний в гибридных информационных автоматизированных системах'

Представление и обработка знаний в гибридных информационных автоматизированных системах Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
111
44
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕФТЕГАЗОВАЯ ОТРАСЛЬ / ИНТЕЛЛЕКТУАЛЬНОЕ МЕСТОРОЖДЕНИЕ / БАЗА ЗНАНИЙ / ФОРМАЛЬНАЯ СИСТЕМА / ТОПОЛОГИЧЕСКАЯ БУЛЕВА АЛГЕБРА / OIL AND GAS INDUSTRY / INTELLECTUAL FIELD / KNOWLEDGE BASE / FORMAL SYSTEM / TOPOLOGICAL BOOLEAN ALGEBRA

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Мазаков Евгений Борисович

Рассматривается подход к построению базы знаний с использованием теории категорий, аксиоматических формальных теорий и аппарата топологической булевой алгебры. Показана возможность обрабатывать нечеткую информацию и осуществлять логический вывод в рамках дедуктивных формальных систем.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Мазаков Евгений Борисович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

REPRESENTATION AND PROCESSING KNOWLEDGE IN HYBRID AUTOMATED INFORMATION SYSTEMS

The approach to construction of the knowledge base with use of the theory of categories, axiomatic formal theories and the device topological Boolean algebra is considered. The possibility to process fuzzy information and carry out the logical conclusion in the formal deductive systems.

Текст научной работы на тему «Представление и обработка знаний в гибридных информационных автоматизированных системах»

ПРЕДСТАВЛЕНИЕ И ОБРАБОТКА ЗНАНИЙ В ГИБРИДНЫХ

ИНФОРМАЦИОННЫХ АВТОМАТИЗИРОВАННЫХ СИСТЕМАХ

МазаковЕвгений Борисович

канд. техн. наук, зав. кафедрой информационных систем и вычислительной техники, доцент Национального минерально-сырьевого университета

«Горный», г. Санкт-Петербург E-mail: miadsp@rambler. ru

REPRESENTATION AND PROCESSINGKNOWLEDGE IN HYBRIDAUTOMATEDINFORMATIONSYSTEMS

Evgeny Mazakov

Candidate of Science, Head of Information Systemsand Computer Engineering, associate professor of nationalresources Mineral University, Sankt-Peterburg

АННОТАЦИЯ

Рассматривается подход к построению базы знаний с использованием теории категорий, аксиоматических формальных теорий и аппарата топологической булевой алгебры. Показана возможность обрабатывать нечеткую информацию и осуществлять логический вывод в рамках дедуктивных формальных систем.

ABSTRACT

The approach to construction of the knowledge base with use of the theory of categories, axiomatic formal theories and the device topological Boolean algebra is considered. The possibility to process fuzzy information and carry out the logical conclusion in the formal deductive systems.

Ключевые слова : нефтегазовая отрасль, интеллектуальное месторождение, база знаний, формальная система, топологическая булева алгебра.

Keywords: oil and gas industry, intellectual field, knowledge base, formal system, topological boolean algebra.

Информационные системы и технологии служат основой развития стратегически важных отраслей минерально-сырьевого комплекса для

повышения эффективности за счет повышения уровня автоматизации управления разработкой, оперативного принятия решений, оценки и минимизации рисков.

В настоящее время спрос [3] на финансово-логистические модули ERP -систем, наблюдавшийся в предыдущие годы, в частности в нефтегазовом секторе, прошел. Практически на всех крупных предприятиях отрасли уже осуществляются проекты по внедрению ERP-решений, и сегодня речь идето расширении их функциональных возможностей, разработке новых модулей, связанных с управлением человеческими ресурсами, активами, сбытом и т. д. В то же время, все большую актуальность приобретают автоматизация различных технологических процессов, а также обеспечение взаимодействия между управленческими системами верхнего уровня (класса ERP) и системами автоматизации технологических процессов (АСУТП). В связи с чем возник активный спрос на системы промежуточного уровня (MES -системы), обеспечивающие эту взаимосвязь, интеграции ключевых ИТ-решений, внедренных на различных предприятиях.

Кроме того, увеличивается спрос на различные аналитические системы, прежде всего решения на базе OLAP -технологий (интеллектуальный анализ данных), позволяющих обрабатывать большие объемы данных по различным срезам на уровне централизованного сбора и обработки информации в рамках всей распределенной структуры управления.

Для объединения существующих информационных технологий в России и в мире (табл. 1) начинают внедрять концепцию (технологию) «интеллектуальное месторождение». В различных источниках наряду с термином «интеллектуальное месторождение» используются понятия «умное производство», «интеллектуальная скважина» и др.

Таблица 1.

Объекты интеллектуальных месторождений

Компания Объект в РФ Название технологии

Shell Салымские Умное месторождение (Smart Field)

месторождения

Chevron Интеллектуальное месторождение (i-field)

BP Месторождение будущего (Field of the future)

Роснефть Приобское месторождение Месторождение на ладони

Газпром Сахалин-2 Умное месторождение (Smart Field)

ТНК-BP Самотлорское, Ваньеганское, Уватские месторождения Интеллектуальное месторождение (i-field)

ОАО «Татнефть» НГДУ Альметьевнефть Интеллектуальное месторождение (i-field)

НК ЛУКОЙЛ Западная Курна -2 Интеллектуальное месторождение (i-field)

Кокуйское месторождение Интеллектуальный куст скважин

Под интеллектуальным нефтегазовым месторождением следует понимать [1] систему автоматического (автоматизированного) управления операциями по добыче нефти и газа, предусматривающую непрерывную в реальном масштабе времени оптимизацию интегральной модели месторождения и модели управления добычей, гарантирующей оптимальное управление на всех уровнях при контроле целей предприятия.

Необходимыми условиями существования интеллектуального месторождения является: формализованность информационной модели месторождения, наличие аппарата управления, максимально точные интерфейсы обратной связи, интерфейсы для оптимизации процессов, моделей и критериев. В структуре интеллектуального месторождения можно выделить уровни иерархии (табл. 2) и их взаимодействие (рис. 1).

Таблица 2.

Уровни иерархии интеллектуального месторождения

Уровни иерархии Процессы Задачи

Оперативно го Геологическое моделирование Уточнение начальных запасов, построение карт, кубов и разрезов, проектирование

управления скважин

Фильтрационное моделирование и адаптация по истории разработки Интеграция данных добычи в фильтрационную модель, прогноз технологических показателей, оптимизация

Моделирование неопределенности и анализ рисков Оценка принимаемых рисков и оптимизация мероприятий по снижению рисков

База данных для мониторинга моделей Хранение, систематизация, экпорт, контроль и объединение геолого -геофизических данных, данных разработки и моделей. Обеспечения доступа к данным.

Мониторинг разработки месторождения Анализ разработки месторождения, построения карт, схем, графиков технологических показателей

Мониторинг и анализ моделей Анализ соответствия модели текущей ситуации, поиск и оценка мероприятий на основе моделей, интегрированная интерпретация

АСУ-ТП Сбор, передача, обработка и хранение realtime информации от датчиков Надежное резервирование, беспроводные технологии, масштабируемость

Диагностика и контроль в режиме реального времени Обеспечение корректности работы датчиков, отслеживание и анализ сбоев

Управление активными устройствами и автоматическое регулирование Реализация сложных стратегий на основе алгоритмов оптимального управления

Аппаратны й уровень Многофазные расходомеры Точное измерение воды, нефти и газа

Детекторы Контроль механических примесей и оптимизация режимов скважин

Забойные датчики давления и температуры Точное измерение забойных давлений

Системы совместно - раздельной эксплуатации Оперативная и обратимая изоляция интервалов в скважинах

Обработка информации и управление интеллектуальными месторождениями осуществляется с использованием гибридных автоматизированных информационных систем (ГАИС), которые имеют следующие особенности:

решаются различные по содержанию и применяемым методам задачи — информационно -поисковые, расчетные, аналитические, логические (интеллектуальные), телекоммуникационные и др.;

значительный объем как первичных измерений, так и результатов моделирования (может составлять десятки теробайт);

большое количество, не всегда синхронизированных между собой, моделей, специального математического и программного обеспечения;

функционирование происходит в условиях неопределенности и неполноты информации.

Оборудование и АСУ-ТП

Автоматизи рованные измерения

-оД

Ручной ввод данных

Автоматизированное (автоматическое) ¡4 управление ■

АСУ-ТП

БД АСУ-ТП

База данных

Информационная система оперативного управления

/

1-1

)

База знаний

Совместный анализ данных

Мониторинг

моделей, разработки месторождений

Подготовка данных

Оперативная оптимизация

Рисунок 1.Структура и взаимодействие уровней интеллектуального

месторождения

Как показывает анализ [2, с. 288], традиционные подходы к разработке математического и программного обеспечения ГАИС по обработке информации, в том числе и технологии «интеллектуальных месторождений», не дают требуемых результатов.

Ряд последних исследований по системам обработки информации (данных, знаний) показывают, что существующие методы представления и обработки знаний основывались на теоретико -множественном подходе, который ограничивает возможности по манипулированию знаниями. Это связано со следующими причинами.

1. Элементы математических множеств не оцениваются по присутствию. В реальности присутствие объектов множеств может меняться в зависимости от состояния предметной области.

2. Предметы, как элементы множества, и сами множества являются статичными (не меняющимися с течением времени), что теряет свое значение при рассмотрении реальных физических объектов.

Теория категорий, развивающаяся в последнее время, является альтернативной теории множеств, обладает более широкими возможностями по описанию реальных, а не математических объектов. Среди основных преимуществ теории категорий можно выделить следующие.

1. Широкая трактовка категории и ее объектов как свойств, процессов, состояний и явлений. Объектами категорий могут являться не только множества, но и другие математические абстракции (универсальные алгебры, их частные примеры и др.). Категория представляет универсальный формализм, позволяющий с единых позиций описывать внешне различные объекты.

2. Морфизмы категорий обозначают морфизмы вложения (включения в класс), функциональные отображения одних объектов в (на) другие, а это позволяет выразить любые связи между объектами.

Каждому морфизму категории Kat ставится в соответствие синтаксическая конструкция вида

ц : У ^ X

' I ?

где: ц — имя морфизма,

Y — оригинал Orig ц,

Х — образ Гтац. Предполагается, что все объекты представляются совокупностями морфизмов.

Исходя из изложенного, предлагается категорная модель знаний (КМ3). Под КМ3 понимается совокупность формализованных описаний объектов и закономерностей проблемной области, а также эвристик, воспроизводящих целенаправленную мыслительную деятельность эксперта по обработке информации и принятия решения.

Вся реальная предметная область представляется в виде объектов. Объект служит для моделирования знаний эксперта об отдельном фрагменте решаемой задачи в виде структур, наиболее полно сохраняющих семантику ПО.

Каждая из категорий отражает определенный аспект знаний о концептах (интенсионал, состояние, пространство, время и т. п.). Полное описание концепта можно представить в виде произведения категорий

Кагх х КШ2 х • • • х Кагп.

Состав категории меняется в зависимости от рассматриваемого «возможного мира» ю^ Множества возможных миров связаны между собой отношением доступности При этом пара (ю, К) будет представлять метазнания о проблемной области.

Необходимо заметить, что в качестве информации, характеризующей объект, могут выступать признаки, являющиеся в свою очередь концептами. Объекты, существенные признаки которых являются в свою очередь концептами, в дальнейшем будем именовать составными объектами (СО), а объекты, описанные только через индивидуальные признаки — терминальными объектами (ТО). Таким образом, СО могут состоять из признаков, терминальных объектов и других составных объектов.

Для формализации знаний целесообразно использовать семиотический подход. При этом семиотическая модель ПО строится на базе формальной системы логического типа (логического исчисления). В ряде исследований [4, с. 112] показано, что для описания объектов реальности наиболее целесообразным является использование исчисления, построенного на базе логики присутствия и имеющее следующие особенности.

1. В данном исчислении понятие свойства принимается в качестве первичного, а это согласуется с теоретико -категорным подходом к построению КМЗ.

2. Логические операции представлены операциями топологической булевой алгебры

<ил-ч=>,лс>,(1)

где: и — неисключающее «ИЛИ» по присутствию, П — соединение по присутствию,

^ — релевантное логическое следование по присутствию, — — дополнение по присутствию, I и С — взятие внутренности и замыкания.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3. Присутствие объекта определяется с использованием констант исчисления, обозначающих присутствие Рг, отсутствие Аь, неопределенность Цп, противоречие Сп.

В соответствии с категорной моделью знаний объекты категорий могут быть двух типов составные и терминальные. В зависимости от уровня детализации имеющихся знаний составной объект может стать терминальным, а терминальный — составным. Это зависит от того, на каком уровне получены исходные данные от датчиков или заданы экспертом.

В исчислении присутствия любой объект описывается через некоторые признаки существенные для описания объекта в мире ю; согласно теории Тк. Основу исчисления составляет понятие присутствия объекта в мире ю,

принимающее одно из двух значений присутствия 8(ю1,Тк)и К(ю!,Тк).Первое обозначает присутствие объекта в мире согласно теории Тк, второе — его отсутствие.

Так как объекты имеют материальную основу и характеризуются набором признаков (свойств), то формула любого произвольного объекта будет представляться через признаки на языке алгебры (1) в виде

к

* = ип ц , (2)

г =1 J=1

где: ^ означает некоторое свойство или его дополнение по присутствию;

к, п — соответственно, количество наборов признаков и число признаков В каждом наборе.

Особенности управления в сложных организационно -технических системах, связанные, прежде всего, с неопределенностью приводят к тому, что часть признаков могут быть недоступны для регистрации, поэтому их можно разделить на два класса; доступные для системы п и недоступные — Тогда формула терминального объекта примет вид

N Р т

*=и (П»» )П (Ш,) (3)

г=1 »=0 г=0

где: Р! +т! = пь г = I, N. При этом и п0 обозначают Б(ю, Т) для всех г = I, N.

Если считать значения присутствия признаков ^ неизвестными, то придавая каждому из них значения 8(®! Т^и К(ю1,Т1) во всех возможных

тг

комбинациях и исключая из (3) элементы, для которых П^ = N (а, Т), получим

г=0

множество формул каждая из которых может рассматриваться как окрестность исходной формулы. На множестве можно ввести отношение частичного порядка и выделить наибольшую нижнюю и наименьшую верхнюю

грани, которые принимаются, соответственно, в качестве внутренности Iz и замыкания Cz формулы .

Необходимо заметить, что оценки (val) присутствия объекта z- valz, val® z для произвольной формулы ф z выражаются различными формулами — Iz, Cz, I —z., С — z, которые могут принимать одно из значений: S(®, Тг) или N(®, Тг) и являются внутренними константами исчисления присутствия.

В соответствии с этим объекту z ставится в соответствие вектор условий

присутствия z = <Iz, Cz, I—z., С — z>, оценки которого принимают значения из следующей совокупности

P = (S, N, S, N) - присутствует

A = (N, S, N, S) — отсутствует valz =

U n=i N, S, S, N) — неопределено Сп =( S, S, S, S) — противоречиво

Если I интерпретировать как оператор необходимости Ь, а С-возможности N то исчисление присутствия может быть отнесено к модальной логике Льюиса. Тогда, например, условие «необходимо ъ и возможно 7» соответствует достоверному присутствию объекта ъ; «необходимо — ъ и возможно — ъ» — достоверному отсутствии» объекта ъ; «возможно ъ и возможно — ъ» — неопределенности; «необходимо ъ и необходимо — ъ» - противоречию и т. д.

Строгое описание взаимодействия объектов предметной области возможно осуществить в рамках формальных теорий, (такая теория состоит из множества локальных теорий, каждая из которых имеет ограниченную область применения. Опишем формальные теории более подробно.

В исчислении присутствия объект описывается через подобъекты (существенные признаки объекта). Для формирования теории объекта описание через подобъекты замещается морфизмами в данный объект. Совокупность этих морфизмов образует покрытие объекта Ц

Ф = {фх ^ и,\г е I}

и называется решетом над объектом и.

Для категории К можно задать семейство решет С(И), по одному для каждого объекта из этой категории, т. е. объекты И1 могут в свою очередь иметь покрытие некоторым семейством морфизмов ф. Так как композиции морфизмов также образуют покрывающее семейство для И, то совокупность таких решет для категории К образует так называемую топологию Гротендика, а категория вместе с такой топологией называется сайтом (местом). Топология Гротендика определяется для так называемых малых категорий, морфизмы (объекты) которых составляют множества. Каждому морфизму и объекту в теории ставятся в соответствие классы или частные примеры конкретных или абстрактных понятий и отношений предметной области. Такое определение решета равносильно представлению объектов категории И представимыми функторами, т. е. множествами морфизмов Ношк(ИьИ), ¿е I.

Представимые функторы составляют основу для формирования пучков теорий над сайтом. Это позволяет объединять локальные теории отдельных объектов в глобальную теорию реальности. В связи с тем, что каждая категория отражает отдельный аспект знаний о предметной области (процессы, состояния и т. д.), то теория объекта Т(ОЬ1) определяется над сайтом из произведения категорий

Т(ОЬ1) = Ка^ х Ка12 х ... х Ка^ .

Динамика поведения объекта в физической (абстрактной) реальности находит свое отражение в теории объекта через изменение оценок присутствия морфизмов, связанных с данным объектом. С этой целью вводится понятие дифференциала присутствия морфизма (ДПМ).

Под дифференциалом присутствия морфизма понимается синтаксическая конструкция вида

АпаР ,

принимающая при интерпретации одно из двух значений — 8(ю,Т;), К(ю,Т^ и означает изменение значения присутствия морфизма с а на в в результате элементарного шага некоторого процесса, который определяется порядком дифференциала п. При этом а ив принимают одно из значений множества констант исчисления

{Рг,АЬ,Ш,Сп,0},

где Р означает, что операция по определению значения присутствия переменной еще не выполнялась. Можно считать, что Р выражает полную априорную неопределенность в отличие от Цп, соответствующего апостериорной неопределенности, то есть отсутствию информации, установленному в результате анализа имеющиеся данных.

Порядок ДПМ п=1 описывает состояние реальности, не содержащее изменений морфизмов (статика). Если изменение является результатом шага логического вывода, то п=2. При п=3 изменение присутствия морфизма получено в результате изменения теории объекта.

Правила построения формул теорий объектов можно определить на основе свойств алгебры дифференциалов присутствия морфизмов с операцией композиции • .

К П, и, -•}

При необходимости алгебра ДПМ может быть дополнена операцией ® альтернативного присутствия.

В общем случае аксиома теории может быть представлена как конъюнкция по присутствию в виде

д^янп-гк*яnн при«0 * д»,

где: А;н (i= I, играют роль посылок аксиомы, А рн роль следствия.

Предложенный подход к построению модели представления знаний позволяет описывать взаимодействие различных объектов (программных модулей, неструктурированных данных и др.) через входящие и исходящие из них морфизмы, строить многоуровневые иерархические теории, осуществлять объединение теорий объектов одного уровня с другим и таким образом строить глобальную теорию предметной области, что обеспечивает решение задач обработки знаний в ГАИС, осуществлять интерпретацию результатов сложного анализа и моделирования.

Список литературы:

1. Беспалов А.П. Умные технологии для умного управления.41-я научно-практическая конференция «Современные информационные технологии в нефтяной и газовой промышленности». [Электронный ресурс] — режим доступа. — URL: https://sites. google.com/site/41it2012/ (дата обращения 10.07.13).

2. Богданов Д.В. Модели и алгоритмы концептуального проектирования автоматизированных систем управления/ Под ред. С.Г. Чекинова. М.: Компания Спутник+, 2004. — 324 с.

3. Болотник Д.Н.. Технологии интеллектуального месторождения и некоторые примеры элементов данной технологии. 41-я научно-практическая конференция «Современные информационные технологии в нефтяной и газовой промышленности. [Электронный ресурс] — режим

доступа. — URL: http s://sites.google.com/s ite/41it2012/ho me/1/06 (дата обращения 10.07.13). 4. Ярушек В.Е. «Теоретические основы автоматизации процессов выработки решений в системах управления». Харьков, 1993 г., — 443 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.