Научная статья на тему 'Онтологический анализ предметных областей моделирования'

Онтологический анализ предметных областей моделирования Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1493
217
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Смирнов С. В.

Объектом исследования является фаза концептуализации при моделировании сложных систем, в результате которой конструируется онтология актуальной предметной области в объектно-ориентированной форме. Предлагается метод анализа эксперимен тальных данных, устанавливающий связь между классическим прикладным анализом данных и анализо м формальных понятий. При этом модифицируются правила формирования начального протокола исследования (таблицы "объектысвойства"), вводится способ измерения структурных отноше ний между изучаемыми объектами, рассматриваются различные аспекты автоматизации конструирования структуры классов объектов (понятий) предметной области. Статья завершается обзо ром нашего инструментария для поддержки онтологического анализа.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Смирнов С. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ONTOLOGICAL ANALYSIS OF MODELING DOMAINS

This article describes a conceptualizations phase in systems modeling which result is ontology of the modeling domain in the object-oriented form. The offered data analysis method bridges the gap between a data mining and formal concept analysis. Formation of the initial protocol of research (table "objectsproperties") at first is specified. In particular the special description of relations between objects is added. This table will automatically be transformed to a formal context. Then the class structure model with interclass relations can be identified during formal concept analysis. The article ends by review our toolkit for support of ontological analysis.

Текст научной работы на тему «Онтологический анализ предметных областей моделирования»

УПРАВЛЕНИЕ И МОДЕЛИРОВАНИЕ В СЛОЖНЫХ СИСТЕМАХ

УДК 681.51

ОНТОЛОГИЧЕСКИЙ АНАЛИЗ ПРЕДМЕТНЫХ ОБЛАСТЕЙ МОДЕЛИРОВАНИЯ

© 2001 С.В. Смирнов Институт проблем управления сложными системами РАН, г. Самара

Объектом исследования является фаза концептуализации при моделировании сложных систем, в результате которой конструируется онтология актуальной предметной области в объектно-ориентированной форме. Предлагается метод анализа экспериментальных данных, устанавливающий связь между классическим прикладным анализом данных и анализом формальных понятий. При этом модифицируются правила формирования начального протокола исследования (таблицы "объекты-свойства"), вводится способ измерения структурных отношений между изучаемыми объектами, рассматриваются различные аспекты автоматизации конструирования структуры классов объектов (понятий) предметной области. Статья завершается обзором нашего инструментария для поддержки онтологического анализа.

Введение

Научные исследования, связанные с анализом и управлением сложными системами (производственными, социальными, экологическими и др.), актуальны, несмотря на большое число работ в этом направлении. Отчасти это объясняется тем, что, по мнению академика Н.Н. Моисеева "идеи фон Берта-ланфи, несмотря на их широкую рекламу, не внесли каких-либо методологических и конструктивных методов в анализ сложных систем. Новые механизмы не были раскрыты...", а математические приемы исследования в целом опирались на традиционные методы анализа сложных систем [1]. Вместе с тем определенные возможности решения этих проблем появились благодаря новым информационным технологиям, развивающимся в русле научного направления, обозначаемого как искусственный интеллект [2]. Конкретно мы выделяем здесь системы моделирования, базирующиеся на знаниях, и формальныге онтологии, с построением которых в настоящее время связывается организация системы знаний о различных предметных областях и их целевого повторного использования [3-6].

Применение онтологического подхода в задачах компьютерного моделирования сложных систем начинается с аналитической работы по выделению и объединению релевантных инфологических и функциональных аспектов моделируемой системы в соответ-

ствующей онтологии. Фундаментальным вопросом такого онтологического анализа [7] является "объективация", выделение процесса конструирования онтологии предметной области (ПрО) моделирования из зоны интуиции экспертов-аналитиков.

Современные методологии структурного анализа и проектирования СЛБЕ-инстру-ментов [8], различные технологии инженерии знаний [4] в общем случае не предлагают систематической процедуры или формализма, позволяющего "вывести" структуру понятий и отношений ПрО из доступных о ней данных, в частности, экспериментальных данных, получаемых в результате широко понимаемого измерения объектов исследуемой реальности. В этом смысле конструктивный выход обнаруживается в относительно новой ветви теории решеток - анализе формальных понятий (АФП) [9]. Однако известные нам работы на эту тему (библиография имеется в [7]) по сути дела ограничиваются адаптацией результатов математической теории для построения таксономической модели классов объектов в ПрО, в меньшей степени исследуют вопросы "объективного" формирования необходимых для этого первичных формаль-ныгх контекстов (ФК) исследуемой ПрО и совсем обходят проблему описания структурных отношений между объектами ПрО (что никак не менее важно, чем та же таксономия классов). Известно, что наибольший

опыт автоматического обнаружения скрытых закономерностей в первичном экспериментальном или статистическом материале накоплен в прикладном анализе данных [10]. Здесь исходная структура данных - таблица "объект-свойство " (ТОС), обобщает упоминавшийся ФК, но используемые подходы к решению задач (в том числе и задач таксономии) основываются на принципах, которые весьма далеки от отправных положений АФП. При этом неоспоримое достоинство ТОС состоит в том, что они давно стали "общепринятым" и однозначно понимаемым способом отображения свойств наблюдаемого мира.

В данной статье отражен опыт установления связи между классическим прикладным анализом данных и анализом формальных понятий. Во-первых, в качестве исходных данных для онтологического анализа ПрО предлагается использовать двумерную ТОС, обобщая процесс ее формирования и вводя специальный способ измерения структурных отношений между эмпирическими объектами ПрО. Далее описывается формальное преобразование исходной ТОС в ФК и анализируется пригодность полученного ФК для автоматического конструирования понятий и отношений ПрО, приводятся результаты статистического моделирования этого процесса. В заключение кратко очерчивается разработанный инструментарий для проведения онтологического анализа, и делаются общие выводы.

Исходные данные о предметной области

Согласно господствующей познавательной парадигме для абстрагирования любой ПрО первичными и атомарными признаются категории "объектов" и отношений между объектами.

Отсюда формально ПрО как "эмпирическая система с отношениями" есть двойка (D, R), где D - множество объектов ПрО, R -множество отношений между объектами (достаточно ограничиться исследованием бинарных отношений), D Ф 0, R Ф 0. Принимается, что схожие в определенном смысле объекты ПрО образуют непересекающиеся

классыы. D = и. .„D., D.nD.= 0, i Ф j,

l € iX i l J ’ J ’

i,j € iX- непустое множество индексов, например, iX= {1, 2,...,_p0}; дополнительно можно указать на PD(x) - априори неизвестное распределение объектов по классам. Далее полагают, что межобъектные отношения проявляются вследствие наличия у объектов ПрО определяющих имманентных свойств; множество всех таких различных свойств в ПрО суть Pr = {pr}. € x гдеJX - непустое множество индексов, например, jX= {1,2, ..., q0}. Закономерным итогом такого взгляда становится вывод, что исходным эмпирическим материалом для абстрактного представления ПрО служит ТОС.

В соответствии с традицией строки эмпирической ТОС соответствуют объектам, которые попали в поле зрения исследователя при зондировании ПрО. На генезис столбцов зафиксируем следующую точку зрения.

Состав свойств (столбцов) ТОС отражает априорную оснащенность исследователя измерительныгми процедурами (от чувственного восприятия до приборных измерений с обработкой наблюдений [11]). Всякая подобная процедура характеризуется, во-первых, указанием на множество возможных результатов ее применения к "захватываемому" для изучения объекту ПрО и, во-вторых, способом упорядочивания результатов измерений и правилами оперирования этими результатами. Можно говорить, что состав измерительных процедур отражает наличие у исследователя набора PH априорныгх гипотез (P-гипотез), каждая из которых предполагает существование определенного измеримого свойства у эмпирических объектов и, как следствие, определенных отношений между данными объектами. Таким образом, для построения ТОС исследователь должен располагать измерительной системой с отношениями MS = {(mpj, Sstj, Rst.)}j = 1 s, где Sstj -априори известное, или стандартное, непустое множество символов, Rstj= {rstjk}k = 1 u

- конечный набор бинарных отношений на символах Sstj, а mp. - априори доступная измерительная процедура: mp:. D ® Sst

Согласно теории измерений и следующему ей прикладному анализу данных, если $x, y € D : (mp.(x), mpJ(y)) € rstJk, то в ПрО

отмечается существование эмпирического отношения j € R, для "отображения" которого используются компонента ms. € MS. Применительно к ТОС это означает заполнение j-го столбца символами из Sst., в отношении rstjk между которыми оказываются представленными проявления эмпирического отношения r... В целом это означает кон-

Jk

статацию состоятельности в исследуемой ПрО P-гипотезы ph. € PH, которой соответствует j-я компонента системы MS: ph. ~ ms..

Утверждение 2.1. Традиционный прикладной анализ данных исходит из состоятельности всех априорных P-гипотез, т.е. каждое соответствие mpj полагается всюду определенным.

В самом деле, все классические задачи анализа данных в общей формулировке являются исключительно задачами предсказания элементов ТОС [10] (например, пропущенного значения свойства), тогда как вопрос о существовании свойства у рассматриваемого объекта не ставится. Следовательно, ТОС представляет ПрО как однородное поле объектов. В этих условиях решение задач классификации, или таксономии, объектов ПрО возможно только после введения какого-либо критерия отбора, что эквивалентно расширению состава свойств в ТОС [10]. С нашей позиции, это означает введение новой P-гипотезы, формулирующей условия выделения классов объектов. Причем данная гипотеза, в свою очередь, полагается состоятельной для рассматриваемой ПрО в целом, т.е. однородность эмпирических объектов принципиально сохраняется. Кроме того, содержание подобных гипотез требует при означивании элементов вновь вводимого столбца ТОС консолидации информации обо всех объектах в ТОС (или подмножестве этих объектов в ходе динамической таксономии), а это означает решение качественно иной задачи - собственно задачи анализа данныгх, чем рассматриваемая нами задача формирования исходныгх данныгх о ПрО. Отмеченные обстюятельства, разумеется, не ставят под сомнение подобные методы решения задач таксономии, но стимулируют изменение подхода к формированию исходной ТОС, а затем и поиск альтернативного пути к конструированию струк-

туры классов эмпирических объектов.

Представляется реалистичным, что при формировании ТОС всякое измерение может дать специальныгй результат "None": None £ Uj = 1 sSst.. Такой результат может свидетельствовать, например, о том, что анализируемый объект и измерительная процедура семантически не сочетаются (ср. "синяя температура" [11]; разумеется, поэтические образы, например, оксюмороны, выходят за рамки предпринимаемого нами анализа), либо о том, что измеряемая величина лежит за порогами чувствительности, вне динамического диапазона измерительного прибора [12]. Формально это означает указание на частичную определенность соответствия mp. и полную у mpj*: D ® Sstj и None, которое и следует принимать как рабочее для системы MS.

Выдача измерительной процедурой значения None означает несостоятельность соответствующей априорной P-гипотезы о ПрО. Эта несостоятельность может оказаться "полной" (у всех исследованных объектов ПрО данное свойство имеет значение None) либо частичной (по меньшей мере для одного из изученных объектов зафиксирован результат рассматриваемого измерения, отличный от None). Второй случай более информативен и прямо указывает на неоднородность эмпирических объектов, обнаруживает существование в ПрО классов объектов.

Утверждение 2.2. Система MS в рассматривавшемся до сих пор представлении непригодна для измерения структурных отношений между объектами исследуемой ПрО.

Действительно, структурные отношения проявляются в наличии у объектов ПрО свойств ссыглочного типа [13]. Значениями таких свойств являются ссылки на собственно эмпирические объекты, а не элементы некоторого априори заданного множества символов. Другими словами, измерение таких свойств возможно, когда $j € {1, 2,., s}: Sst. = D, а это невозможно в силу априорной неопределенности D. Более того, поскольку эмпирические объекты неоднородны, то существует априори неизвестная типология рассматриваемых объектных ссылок (в общем случае необходимо было бы иметь "i € iX

$j € {1, 2,., s}: Sst. = D ), а у самих объектов

j i

следует ожидать различий в способности вступать в структурные отношения. Таким образом, априори в распоряжении исследователя остается единственно набор выражений, денотатами которых являются известные ему абстрактныге взаимосвязи между объектами ("отец", "находиться в" и т.п.), что в структуре MS определяет лишь компоненты Rstj.

В этой ситуации мы предлагаем при формировании ТОС фиксировать фактыг "одностороннего" участия эмпирического объекта в структурных отношениях, указываемых априорны ми гипотезами SH о наличии тех или иных абстрактных взаимосвязей между объектами ПрО (S-гипотезами, SH n PH = 0).

Поставим в соответствие каждой S-гипотезе shk € SH две компоненты системы MS

- shk ~ (ms., msj+1), такие, что Sstj. = Sstj+1 = N+ и None, Rstj = {ИмяОтношения} и Rstj+1 = {~ИмяОтношения}. Денотат символа Имя-Отношения - бинарное отношение между объектами, о существовании которого в исследуемой ПрО говорит избранная S-гипотеза, а ~ИьяОтношения - биективный образ этого символа (при условии синтеза последнего по правилам написания идентификаторов). Измерительная процедура mpj дает отличный от None результат только в том случае, когда исследуемый объект ПрО участвует в отношении ИмяОтношения в качестве 1 -го аргумента, а доставляемое при этом положительное натуральное число показывает кратность именно такого участия изучаемого объекта в рассматриваемом отношении. Аналогично действует процедура mpj+1*, задача которой - регистрация данных об участии эмпирического объекта в отношении ИмяОтношения в качестве 2-го аргумента. Устанавливаемые подобным измерением способности объектов ПрО вступать в различные взаимосвязи резонно называть валентностями [14] соответствующих видов.

Концептуальная объектно-признаковая модель предметной области

Введенные дополнения к классическому пониманию этапа формирования исходных данных о ПрО, дают возможность путем простых преобразований полученной ТОС вы-

делить классы эмпирических объектов, отражающие разнородность этих объектов и по составу измеримых свойств (в общем случае к ним относят и функциональныге способности объектов [15]), и по способностям вступать в структурные отношения.

Подлежащая обработке эмпирическая ТОС имеет размерность rxs, где r= |D*| -объем выборки D*cD, s = |SHи PH| - размерность измерительной системы MS. Сначала путем замены None-значений нулями, а всех прочих - единицами исходная ТОС преобразуется в матрицу инцидентности "объек-тыг-свойства ". Содержащейся в этой матрице информации оказывается достаточно для построения концептуальной объектно-признаковой модели ПрО. Соответствующий алгоритм подробно описан в [7]; в целом он базируется на добавлении и удалении определенных строк и столбцов в матрице инцидентности для достижения целей из следующего набора:

• выделение классов объектов (путем сохранения одного экземпляра из каждого множества совпадающих строк);

• исключение из модели полностью несостоятельных P-гипотез (удаление "нулевых" столбцов);

• исключение из модели полностью несостоятельных S-гипотез (удаление соответствующих пар "нулевых" столбцов);

• констатация существования класса неопознанных объектов (добавление специальной P-гипотезы и, следовательно, добавление нового специально конструируемого столбца);

• констатация существования некоторого особенного класса объектов (несмотря на то, что в выборке D* объекты этого класса отсутствуют) в силу "одностороннего" подтверждения S-гипотезы (добавление новой специально конструируемой строки).

В результате подобных преобразований получаем матрицу инцидентности размерно-стиpxq, 1 <p< r+|SH|, 1 < q < s+1. Она определяет соответствие ZcGxM, где G -множество эмпирически обнаруженных классов объектов (т.е. первичныгх понятий в спецификации ПрО), а M - множество признаков, соответствующих компонентам априори

доступной измерительной системы (включая, быть может, дополнительный компонент для неопознанных объектов); очевидно, что с ф 0, мф 0, 1ф 0.

Объектно-признаковая модель (С, М, I) реализует в описании ПрО три из четырех ключевых форм абстракции семантического моделирования [16]. Классификация воплощается в наличии и составе С. Агрегирование обнаруживает себя в том, что агрегатом является образ элемента g е С относительно I: {т | т е М, gIm}. Ассоциации объектов ПрО отражаются семантикой подмножества М, составленного валентностями.

Указанные формы абстрагирования лежат в основе реляционного подхода к моделированию мира, нашедшего, например, широкое признание в теории и практике баз данных. Онтологический подход дополнительно актуализирует абстракцию обобщения. Посредством этой абстракции схожие классы объектно-признаковой модели связываются с родовым объектом более высокого уровня - суперклассом (абстрактныгм классом, или понятием), и рассматриваются как его частные (видовые) случаи. В этом смысле онтология ПрО представляется как модель, описыгвающая структуру классов (как "реальных", т.е. зафиксированных в объектно-признаковой модели ПрО, так и абстрактных, построенных путем обобщения спецификаций реальных классов или, образно говоря, "над" реальными классами).

С позиций применения абстракции обобщения объектно-признаковые модели изучаются в АФП, где определенная нами тройка (С, М, I) известна как формальныгй контекст - ФК, а С и М именуются соответственно множествами (формальных) объектов и (формальныгх) атрибутов.

Иерархия классов предметной области

АФП определяет [9], что для любого множества X с С объектов множество X = {т | т е М, "g е X: gIm} является набором их общих атрибутов, а для У с М множество У' = {g | g е С, "т е У: gIm} составляют объекты, которые обладают всеми атрибутами из У. Пара (X, У), гдеXсС, УсМ, на-

зывается (формальным) понятием контекста К = (С, М, I), еслиХ= У, У = X. Xименуется объемом, а У - содержанием понятия (X, У): объем включает все объекты, которые принадлежат понятию, а содержание образуют атрибуты, которые совместно характеризуют объекты понятия.

В(К) = Б(в, М, I) =

= {(X, У)| ІX^G,У^M,X=У,У=X}

обозначает множество всех понятий контекста К.

Таким образом, АФП предлагает формализацию того, что рассматривают в аналитической философии и логике, исследуя смысл имен (символов), и отражают в известной схеме, получившей название "семантического треугольника". Формально-математическое содержание АФП можно охарактеризовать как прикладной анализ соответствия Галуа, устанавливаемого отношением I между подмножествами множеств С и М. Интересующее нас конструирование структуры обобщающих понятий "над" объектно-признаковой моделью связано с изучением отношения порядка на множестве всех понятий данного ФК.

Согласно АФП и в полном соответствии с традиционной логико-философской трактовкой формальное понятие (X1, У1) называется подпонятием (т.е. является менее общим) другого понятия, или обобщения, У2), -обозначается ^х, У1) < (X2, У2), - еслиX1 cX2, или, эквивалентно, У1 з У2. Это отношение порядка задает на множестве всех понятий ФК замкнутую решетку (В(К); <), называемую решеткой понятий [9]. Важно отметить, что минимальное понятие, содержащее объект g е С в своем объеме, есть Yg = ({g}//, &}'), а тт = ({т}', {т}'') - максимальное понятие включающее атрибут те М в своем содержании.

Решетка понятий может быть визуализирована с помощью ациклического размеченного орграфа - диаграммыг Хассе, узлы которого представляют понятия, а дуги, изображающие отношение порядка, направлены из каждого узла лишь к его "соседям снизу". Таким образом, пути, исходящие из узла-понятия ведут ко всем узлам-подпонятиям. "g е С узел диаграммы, представляющий

понятие Yg, маркируется идентифицирующим g выражением (именем объекта) "снизу", а "т е М узел-понятие ±т помечается именем атрибута т "сверху".

Обзор и сравнение различных алгоритмов построения множества всех понятий ФК и его диаграммы Хассе имеется в [17]. Оригинальная версия подобного алгоритма, согласованная с целями онтологического анализа ПрО, представлена в [18], а в [7] обоснованы следующие положения.

Утверждение 4.1. Диаграмма Хассе может быть формально преобразована в иерархию классов-понятий с механизмом наследования признаков-атрибутов, где каждый член иерархии описывается набором отличительных, а характеризуется совокупностью отличительные и унаследованныгх от предков признаков.

Утверждение 4.2. Иерархия классов, полученная на основе преобразования диаграммы Хассе, в общем случае отражает множественное наследование признаков.

При этом формально всякий класс определяется как тройка (X, У, СИ), где X- объекты класса, У - совокупность отличительных и унаследованных признаков, а СИ - отличительные признаки класса. По построению имеем:

• (X, У) е В*(К) (В*(К) = В(К) \ (0, М) \ (С, 0), если (С, 0) е В(К), иначе В*(К) = В(К) \ (0, М)), а СИ е У и 0;

• класс (X2, У2, СИ2) обобщает класс (X Ур СНХ), если ^х, У;) < (^2, У2);

• в части отличительных признаков описания классов дизъюнктивны, т.е. СИ. п СИ. = 0, . Ф.;

• множество образованных классов (т.е. онтологию ПрО) составляет объединение двух непересекающихся множеств: {(X, У, СИ) | (X, У) е В*(К), СИ = {т | т е У, (^ Т) = ±т}} и {(-^Ь {g}/ , 0) |g е G,

||&Л>1}.

Таким образом, определен метод преобразования концептуальной объектно-признаковой модели в онтологию ПрО.

Эффективность онтологического анализа

В рассмотренной выше интерпретации

результат онтологического анализа - концептуальная модель, описывающая структуру классов, - существенно зависит как от объема и представительности выборки D * объектов ПрО, так и состава P- и S-гипотез, выдвигаемых аналитиком. Поэтому уместен вопрос об эффективности предложенных методов и алгоритмов в зависимости от их параметров и условий применения. Качественные оценки такого рода удалось получить путем статистического моделирования процесса построения онтологии.

Устанавливая критерии эффективности онтологического анализа, во-первых, отмечаем полноту вовлечения экспериментальных данных о ПрО, а, во-вторых, - формальноалгоритмический характер преобразования концептуальной объектно-признаковой модели в онтологию ПрО. Если первое замечание носит скорее общеметодологический характер, то второе указывает на возможность и достаточность использования в качестве показателей эффективности характеристики объектно-признаковой модели, т.е. значительно более простой конструкции, чем итоговая иерархическая структура онтологии ПрО. Тем самым удается избежать проблем со сложностью и неоднозначностью измерений на множестве символьных объектов типа иерархий (см., например, [10]).

С учетом сказанного в качестве критериев эффективности были выбраны три показателя:

• p1 - количество идентифицированных в ПрО классов объектов (равноp - количеству строк матрицы инцидентности объектнопризнаковой модели ПрО, если в выборке D* не обнаружено ни одного неопознанного объекта, иначе -p - 1);

• p2 - количество классов ПрО, которые не были идентифицированы (объекты каждого такого класса в результате анализа ошибочно отнесены к одному из "идентифицированных" классов; ошибка первого рода);

• U - количество классов ПрО, которые не были опознаны (т.е. все измерительные процедуры системы MS применительно к объектам этих классов выдавали исключительно результат None; ошибка второго рода).

Если допустить, что число различных

классов объектов в ПрО конечно и равно p0, то справедливо равенство pi = p0 -p2 - U, и, следовательно, в эксперименте достаточно было наблюдать за двумя из трех показателей.

Имитатором ПрО в экспериментах служили объектно-признаковые модели размерности p0 х q0, где q0 > 1,p0 е (I, 2q0), а плотность заполнения модели определяла величина E_p0 е (0, jp0] - среднее количество классов ПрО, объекты которых характеризуются отдельно взятым свойством ПрО. В экспериментах ТОС сразу имела вид матрицы инцидентности, что допустимо в силу формально-алгоритмического характера преобразования исходной ТОС к такому виду.

Имитация измерительной системы сводилась к случайному отбору q свойств ПрО, которые принимались как измеряемые свойства захватываемых объектов ПрО; q е (0, q0] - диапазон варьирования этим "уп-равляемыгм параметром" онтологического анализа.

В основной серии экспериментов исследуемый процесс имитировался без учета влияния представительности выборки D*, что эквивалентно r = |D*| ® ^. Это означало использование в качестве исходной ТОС непосредственно объектно-признаковой модели, имитировавшей ПрО. На рис. приведен типичный пример наблюдавшейся зависимо с-ти оценок среднего исследовавшихся критериев (в процентах к p0; в экспериментах точность оценок с достоверностью 0,95 была не хуже 5 %) от количества измеряемых свойств q при р0 = 60 классах объектов в ПрО, E_p0 = p0 / 2 и трех различных случаев количества свойств, характеризовавших ПрО: q0 е {30, 60, 120}. Как и во всех подобных экспериментах обнаруживается независимость исследуемых показателей от величины q0. Анализ этих фактов приводит к следующим важным качественным выводам:

• идентификация классов ПрО в большей степени зависит от количества, чем от состава имеющихся в распоряжении исследователя различных измерительных процедур;

• количество различных измерительных процедур, которые необходимы для различе-

Рис. Зависимость среднего критериев эффективности онтологического анализа от количества измеряемых свойств предметной области

ния классов ПрО, не зависит от мощности множества признаков, характеризующих эту ПрО;

• выгбор измерительныгх процедур (отбор принимаемых во внимание свойств ПрО) следует прежде всего связывать с целями анализа ПрО, т.е. субъективно понимаемыми "ценностью", "качеством" свойств ("свобода состава ");

• "свобода состава" принимаемых во внимание свойств ПрО делает естественной множественность онтологий ПрО, по-разному описывающими одни и те жереальныге клас-сыг объектов и поэтому отличающихся как учитываемыми отношениями между объектами, так и входящими в них абстрактными обобщающими понятиями.

В дополнительной серии экспериментов величина избранных критериев оценивалась в зависимости от объема выборки О* и энтропии распределения РО(х) объектов ПрО по классам; результаты этой серии имели в целом предсказуемый характер и не внесли коррективов в представленную выше качественную картину.

6S

Инструментальная поддержка

В очерченном выше объеме онтологический анализ поддержан в новой версии Мастера схем - одного из встроенных приложений объектно-ориентированной системы моделирования gB [6, 19]. Теперь это приложение располагает двумя свободно переключаемыми режимами функционирования.

В режиме схем приложение поддерживает прямое конструирование экспертом-ана-литиком концептуальных схем ПрО (т.е. онтологий предметных областей моделирования в форме иерархий классов, включая их свойства, методы и структурные отношения) с автоматическим порождением объектноориентированных баз данных для размещения денотативных, или объектных моделей в ПрО [6]. В новой версии добавлена возможность реконструкции ФК по данной онтологии (т.е. функция обратного проектирования), что, в частности, позволило эффективно реализовать операцию объединения концептуальные схем - мощного инструмента интеграции знаний на этапе онтологического анализа ПрО [18].

В режиме контекстов выполняются методы анализа, описанные в данной статье: интерактивное формирование исходных сведений о ПрО в форме ТОС, автоматические преобразование ТОС в ФК и конструирование концептуальной схемы ПрО по ФК (прямое проектирование), симметрично режиму схем имеется принципиально важная операция объединения контекстов. Разумеется, пользователь освобожден от необходимости знать точную математическую семантику возникающих при этом структур и выполняемых операций. С инструментом его связывает графический интерфейс с привычным образом ТОС и ФК, панелями управления и совокупностью интерактивных форм для ввода/редактирования имен, значений и других описаний исходной информации о ПрО.

Таким образом, инструментальная поддержка онтологического анализа осуществлена с совмещением работы Мастера схем в двух различных ПрО: первая описывается рекурсивной "Схемой схем" [6, 20], вторая - схемой, основу которой составляет семантический треугольник. Работа с денотативной мо-

делью в одной из этих ПрО включает возможность автоматического порождения соответствующей денотативной модели в другой рабочей ПрО, что и составляет основное содержание автоматизации онтологического анализа.

Заключение

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1) Аналитическая работа с целью выделения и объединения релевантных инфоло-гических и функциональных аспектов предметной области моделирования в соответствующей формальной онтологии определена как онтологический анализ.

2) В предложенной интерпретации онтологический анализ вбирает в себя элементы методологий классического прикладного анализа данных и относительно новой ветви теории решеток - анализа формальных понятий. В работе приведены необходимые определения и очерчены основные алгоритмы такого подхода.

3) Результаты экспериментального исследования эффективности процедур онтологического анализа позволяют дать качественное объяснение основному феномену фазы концептуального анализа в задачах моделирования сложных систем - возможности формирования и сосуществования нескольких концептуальных моделей-онтологий для данной предметной области.

4) Предложенный в работе аналитический арсенал онтологического анализа получил адекватную компьютерную поддержку (в удобном и доступном в квалификационном смысле для непрограммирующих экспертов предметных областей) в одном их встроенных приложений общецелевой системы моделирования gB.

СПИСОК ЛИТЕРАТУРЫ

1. Моисеев. Н.Н. Тектология Богданова - современные перспективы // Вопросы философии. 1995. № 8.

2. ПоспеловГ.С. Искусственный интеллект

- основа новой информационной технологии. М.: Наука, 1988.

3. Guarino N. Formal ontology, conceptual analysis and knowledge representation // Int. J.

of Human Computer Studies. V.43. 1995. №5/6.

4. Гаврилова ТА., Хорошевский В. Ф. Базы знаний интеллектуальных систем. СПб.: Питер, 2000.

5. Девятков В.В. Онтологии и проектирование систем // Приборы и системы. Управление, контроль, диагностика. 2000. №1.

6. Смирнов С.В. Онтологии в задачах моделирования сложных систем // Проблемы управления и моделирования в сложных системах: Труды II международной конф. Самара: СНЦ РАН, 2000.

7. Смирнов С.В. Онтологический анализ: определения и алгоритмы // Проблемы управления и моделирования в сложных системах: Труды III международной конф. Самара: СНЦ РАН, 2001.

8. Калянов Г.Н. CASE структурный системный анализ (автоматизация и применение). М.: Лори, 1996.

9. Witte R., Ganter B. Formale Begriffsanalyse. Springer-Verlag, 1996.

10. Загоруйко Н.Г. Прикладные методы анализа данных и знаний. Новосибирск: Изд-во Института математики СО РАН, 1999.

11. Рубашкин В.Ш. Представление и анализ смысла в интеллектуальных информационных системах. М.: Наука, 1989.

12. Новицкий П.В. Основы информационной теории измерительных устройств. Л.: Энергия, 1968.

13.Киндлер Е. Языки моделирования. М.: Энергия, 1985.

14. Философский энциклопедический словарь. М.: Инфра-М, 1997.

15. Кораблин М.А., Смирнов С.В. Наследование свойств в задачах объектно-ориентированного программирования на языке Модула-2 // Программирование. 1990. №4.

16. Замулин А.В. Типы данных в языках программирования и базах данных. Новосибирск: Наука, 1987.

17. Кузнецов С.О., Объедков С.А. Алгоритмы построения множества всех понятий формального контекста и его диаграммы Хассе // Известия академии наук РАН. Теория и системы управления. 2001. № 1.

18. Виноградов И.Д., Смирнов С.В. Алгоритм объединения концептуальных схем на основе формального контекста // Проблемы управления и моделирования в сложных системах: Труды III международной конф. Самара: СНЦ РАН, 2001.

19. Смирнов С.В. Среда моделирования для построения инженерных теорий // Известия Самарского научного центра РАН.

1999. №2.

20. Смирнов С.В. Онтологическая относительность и технология компьютерного моделирования сложных систем // Известия Самарского научного центра РАН. Т.2.

2000. №1.

ONTOLOGICAL ANALYSIS OF MODELING DOMAINS

© 2001 S.V. Smirnov

Institute for the Control of Complex Systems of Russian Academy of Sciences, Samara

This article describes a conceptualizations phase in systems modeling which result is ontology of the modeling domain in the object-oriented form. The offered data analysis method bridges the gap between a data mining and formal concept analysis. Formation of the initial protocol of research (table "objects-properties") at first is specified. In particular the special description of relations between objects is added. This table will automatically be transformed to a formal context. Then the class structure model with interclass relations can be identified during formal concept analysis. The article ends by review our toolkit for support of ontological analysis.

i Надоели баннеры? Вы всегда можете отключить рекламу.