Научная статья на тему 'Использование онтологии при прогнозировании развития предприятия'

Использование онтологии при прогнозировании развития предприятия Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
72
49
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Использование онтологии при прогнозировании развития предприятия»

УДК 681.3-002.51.6

ИСПОЛЬЗОВАНИЕ ОНТОЛОГИИ ПРИ ПРОГНОЗИРОВАНИИ РАЗВИТИЯ ПРЕДПРИЯТИЯ

Н.И. Тюков, д.т.н.

(Уфимский государственный авиационный технический университет, Кумертауский филиал);

В.В. Извозчикова, к.т.н. (Оренбургский государственный университет, 1лга[email protected] ); И.В. Матвейкин, к.т.н. (Оренбургский государственный аграрный университет, [email protected])

В основу предлагаемого в статье подхода положен метод анализа иерархий, который состоит в декомпозиции задач прогнозирования на подзадачи и дальнейшей обработке последовательности суждений экспертов. При этом имена объектов и имена атрибутов рассматриваются как идентификаторы задач и учитываемых факторов при выработке прогноза.

Ключевые слова: онтологии, прогнозирование, декомпозиция, иерархии, эксперт, объект, атрибут, аспект, домен.

Современные онтологии играют решающую роль в модели описания знаний экспертов в системах, основанных на управлении знаниями. Обычно онтологии состоят из экземпляров, понятий, атрибутов и отношений, поэтому основной задачей при построении онтологии при прогнозировании развития предприятия является выделение имен объектов, имен их атрибутов и отношений.

В основу решения данной задачи положен метод анализа иерархий, который состоит в декомпозиции задач прогнозирования на подзадачи и дальнейшей обработке последовательности суждений экспертов. Декомпозиция производится таким образом, что каждый атрибут объекта нижнего уровня может выступать в качестве критерия для атрибута объекта высшего уровня, при этом имена объектов и имена атрибутов рассматриваются как идентификаторы задач и учитываемых факторов при выработке прогноза.

Для декомпозиции постановок задач на постановки подзадач необходима семантическая интерпретация вербальных знаний экспертов в области прогнозирования развития предприятия с целью выделения имен объектов и имен их атрибутов.

В настоящее время выделение объектов и их атрибутов из текста естественного языка не может осуществляться автоматически, эта задача возлагается на инженера знаний и экспертов [1].

Под семантической информацией будем понимать выраженные знаками сведения о выделенной стороне (сторонах) объекта (объектов).

Решение задачи выделения имен объектов и имен атрибутов из семантической информации, предоставляемой экспертами, может рассматриваться как преобразование первичной семантической информации (ответов экспертов) во вторичную (имена объектов и имена атрибутов) посредством сжатия первичной семантической информации. Процесс сжатия сводится к тому, что выделенные аспекты модели раскрываются кон-

кретным содержанием первичной семантической информации.

Тогда формально такое преобразование может быть представлено отношением первичной семантической информации 8р к вторичной семантической информации Бу, используя знак семантического преобразования Бт.

Бр и Бу содержат аспекты (категории), отображающие полноту представления семантической информации. В математической интепрета-ции аспект - это произвольной длины кортеж знаков (букв, слов, символов и др.). Так, кортежем длины п является запись вида Р=<Ьь Ь2, ..., Ь„>, где Ьх, Ьп - первая и последняя компоненты соответственно.

Для аспектов определены свойства:

Р={Ьер/ЩЬ)}, (1)

где ЩЬ) - отношение «быть упорядоченным по местам».

При этом УЬ(ЬеР), {(2(Ь;Ид(Ь)}, где <3(Ь) -отношение «быть одинаковым».

В информационном плане аспект является элементом слова С VI), ЬеР-»ЬеС.

Слово С характеризует объект, его свойства и отношения. В семантическом плане слово состоит из аспектов, и всегда существует их оптимальное число в слове, которое оценивается объемом сведений, необходимых для описания объекта в рамках решаемой задачи прогнозирования. Аспекты в слове выражаются знаками естественного языка.

Слово можно представить кортежем С=<Р,, р2,..., Р„1>, где т - длина слова.

При этом для слова выполняются следующие соотношения:

С={сеС, с->Ы(с)}, Ус (сеС), (<3(сМ<3(с)}. (2)

Слово можно записать в виде С={Р, Б}, где Р=<Р1, р2, ..., Р/> - кортеж знаков длины I, характеризующий посредством знаков признаковую составляющую слова; 8=<«х, «2, ..., «т> - кортеж

знаков длины т, характеризующий смысловую составляющую слова.

Процесс выделения имен объектов и имен их атрибутов состоит из этапов получения первичной семантической информации и сжатия семантической информации. Обе задачи решаются при взаимодействии экспертов в области прогнозирования стратегического развития предприятия и инженера знаний.

Рассмотрим специфическую семантическую операцию, связанную с созданием первичной семантической информации об объекте.

Методологической основой выполнения семантической операции, связанной с получением ответов экспертов, адекватной объекту познания, является выполнение следующих требований: необходимы наличие конкретного задания и устранение противоречий между многомерным планом содержания и одномерным планом выражения.

При декомпозиции постановок задач на постановки подзадач наиболее приемлемыми способами общения инженера знаний и экспертов являются постановка вопросов и уточнение понимания.

Наличие конкретного задания интерпретируем как правильную постановку вопроса экспертам и выполнение ими дополнительного задания.

Применительно к текстовой форме представления семантической информации план содержания (или семантика) представляет собой внутреннюю, смысловую сторону объекта, а план выражения (или синтаксис) является внешней, формальной стороной предложения. Совпадение плана содержания с планом выражения (адекватность) возможно в суждениях, состоящих из объекта и атрибута, выражающих однозначную мысль, фиксируемую простым нераспространенным предложением.

С учетом этого к первичной семантической информации предъявляем следующие требования:

П=<Сх, С2, Ск> С1={Р/,

где Р/=<р>, (3)

8т=<«>, (4)

П - предложение.

То есть ответы экспертов должны состоять из таких слов, признаковая и смысловая части которых являлись бы одноместными кортежами аспектов.

Для удовлетворения требованиям (3), (4) вопросы экспертам формулируются по одному из типов:

• от чего зависит <имя атрибута> <имя объекта^

• чем определяется <имя атрибута> <имя объекта>,

а дополнительное задание заключается в требовании упорядочить факторы (все 01) по степени влияния на значения атрибута объекта, имена ко-

торых содержатся в вопросе. Таким образом устанавливаются отношения предпочтения

Сх>С2>...>Ск, (5)

а следовательно, выполняется требование (3).

Такая постановка вопросов позволяет выбрать из множества объектов предметной области соответствующие заданию, наложить определенные ограничения на множества атрибутов, характеризующих объект, отделить в ограниченном множестве существенные признаки от несущественных.

Вторичная семантическая информация отражает посредством знаков результаты аналитико-синтетического и логического преобразований первичной семантической информации и является моделью первичной.

Получение вторичной семантической информации неизбежно связано с разрушением структуры первичной семантической информации и построением новой, отличной от первой.

При сжатии первичной семантической информации используем модельный способ, для которого характерно строгое формализованное задание, его общими понятиями являются объекты, атрибуты и домены [2].

При построении формальной модели вводится ограничение на количество аспектов в слове вторичной семантической информации, которое должно равняться двум, так как из первичной семантической информации необходимо выделять пары <имя объекта, имя атрибута>.

Разделение категорий на объекты и атрибуты не всегда может быть очевидным, поэтому для выделения атрибутов из текстов естественного языка используем их основные свойства:

- наличие конечного множества возможных значений атрибута;

- возможность упорядочения результатов измерений;

- измеряемость значений хотя бы по одному из показателей и др.

Введение домена в качестве избыточной семантической информации необходимо для уточнения имен объектов и имен атрибутов в связи с неоднозначностью естественного языка. Домен дает возможность конкретизировать имена объектов и имена атрибутов, которые в ответах экспертов могут только подразумеваться или выражаться общими понятиями, и представляет собой множество знаков.

Семантическая интерпретация знака - это слово, состоящее из имени объекта и имени атрибута, которые являются элементами концептуальной схемы предметной области, то есть возможно установление взаимно однозначного соответствия:

объскт<-»атрибут<-> значение.

V ((1еОот) 3 <о, а>, (<о, а^еЫа).

Таким образом, получена система семантических уравнений для данной первичной семантической информации

ov Raav Rdomd,,

xi У1 1

о^ Raa„ Rdomd,

У 2

Raav Rdomd„, i 11

(6)

где Rdom - отношение «иметь значение»; Ох1, ау1 - имена неизвестных объектов и их атрибутов.

Определить домен предлагается экспертам в предположении, что признаковая часть слова является именем атрибута, а смысловая - именем объекта. Далее решается система семантических уравнений (6) с использованием интерпретации посредством соответствующего слова из (5) и с использованием свойств (1), (2). Из-за неопределенности и неоднозначности естественного языка такая интерпретация может оказаться невозможной. Поэтому с помощью экспертов вводятся дополнительные аспекты, которые при построении первичной семантической информации могли только подразумеваться. Таким образом осуществляется конкретизация первичной семантической информации.

Элементы di, имеющие одну и ту же интерпретацию, объединяются во множества и образуют домен для <ох1, ау1>. Сжатие семантической информации осуществляется для каждого фактора, входящего в первичную семантическую информацию. В результате из первичной семантической информации выделяется множество имен объектов и имен их атрибутов. Для выделенных объектов и атрибутов повторяется процедура построения отношения предпочтения (5).

Введение понятия домена в формальную модель целесообразно и потому, что значения доме-

нов в дальнейшем будут использоваться при построении полной модели предметной области стратегического управления предприятием.

Результатом выполнения методики является таблица, содержащая колонки: эксперт, имя объекта, имя атрибута, домен.

В колонке эксперт указывается идентификатор эксперта, предоставившего соответствующую первичную семантическую информацию; в колонке имя объекта - имена выделенных объектов; в колонке имя атрибута - соответствующие имена атрибутов; в колонку домен заносится значение домена соответствующего атрибута объекта.

После завершения к-го шага декомпозиции выделенные факторы ранжируются по важности методом парных сравнений [3].

Концептуальная схема предметной области, основанная на выделении имен объектов, имен их атрибутов и отношений, является достаточно обобщенной, поэтому не может быть моделью решения задач прогнозирования развития предприятия. Тем не менее, она описывает факты зависимости значений атрибутов одних объектов от значений атрибутов других, а построенная на ее основе модель дает возможность автоматизировать процесс формирования полной модели предметной области управления стратегическим развитием предприятия.

Литература

1. Попов Э.В. Экспертные системы: решение неформализованных задач в диалоге с ЭВМ. М.: Наука, 1987.

2. Поспелов Д.А. Моделирование рассуждений: опыт и анализ мыслительной деятельности. М.: Радио и связь, 1989.

3. Рабочая книга по прогнозированию. М.: Мысль, 1982.

О

X

УДК 004.89

ПОЛУАВТОМАТИЧЕСКОЕ СЕМАНТИЧЕСКОЕ АННОТИРОВАНИЕ МУЛЬТИМЕДИАРЕСУРСОВ

Б.П. Тюхов, к.т.н.; С.В. Новиков (Московский государственный институт электроники и математики (технический университет), [email protected])

В данной работе предлагается методика для автоматизации аннотирования аудиовизуальных мультимедийных ресурсов на примере изображений. Производятся уточнение, актуализация и расширение набора утверждений об изображении и/или набора извлеченных визуальных свойств за счет использования технологий Semantic Web и распределенных БЗ, представленных в RDF и OWL. Показано, как можно использовать при этом начальное извлечение аудиовизуальных свойств и их связывание с высокоуровневыми концептами для преодоления семантической пропасти.

Ключевые слова: Semantic Web, онтологии, аудиовизуальные свойства, семантическая пропасть, автоматическая аннотация.

В связи с быстрым ростом количества цифровых аудиовизуальных данных повышаются требования к уровню сложности систем поиска и

управления мультимедиаресурсами. Для мультимедийных данных наличие и качество аннотаций достаточно критичны, поскольку без качествен-

i Надоели баннеры? Вы всегда можете отключить рекламу.