Минин щи пни 2П1
СИНТЕЗ ИМИТАЦИОННЫХ МОДЕЛЕЙ НА ОСНОВЕ ОНТОЛОГИЙ С ИСПОЛЬЗОВАНИЕМ ПРОЦЕДУРЫ СООТНЕСЕНИЯ ШАБЛОНОВ И ОБРАТНОЙ «ДОПАРАМЕТРИЗАЦИИ» ОНТОЛОГИИ
О.В. Кудинова
В рамках работы ИИММ была разработана онтология КНЦ и технология синтеза имитационной модели на основе шаблонов. Для решения задачи синтеза имитационной модели на основе онтологического описания, необходимо сначала вырезать соответствующий фрагмент онтологии в соответствии с поставленной целью. Затем соотнести набор шаблонов с этим фрагментом, и провести процедуру допара-метризации онтологии в случае, если некоторые шаблоны невозможно сопоставить с элементами онтологии, либо они соотнесены частично.
Онтологию можно представить следующим образом [1]:
0=<Х, Мх, Ях, Е>, где Х - множество понятий онтологии;
Л1х - множество атрибутов над понятиями онтологии;
Ях - множество отношений над понятиями онтологии;
Б - множество правил функционирования онтологии.
Процедура выделения фрагмента онтологии представлена как отображение 4 множества О в подмножество ОЬ. Отображение выполнено в соответствии с целью имитационного моделирования. в - дерево целей, состоящее из двух уровней. Тогда процедуру выделения можно представить следующим образом (1):
£, : О ° >ОЪ , (1)
где ОЬ а X причем Зх е X: х = (^) х1. , и
г
еО: gi®xi, 1=1,к,
где к - количество подцелей.
Операция ® обозначает однозначное соответствие элементу множества в элемента множества X. В данном случае Х является корнем дерева.
Процедура выделения связей из онтологии представлена как отображение ю множества О в подмножество ОЬ следующим образом (2):
Сд'.О (2)
где ОЬ а X такое, что У о Л и
\/оЬ} е ОЬ ЭН, ® Пх , Их е Их и 11! е И.
где 7 = 1, к, к - количество подцелей;
Ях - множество связей над понятиями онтологии;
Я - множество связей между элементами шаблона.
Процедура выделения атрибутов из онтологии представлена как отображение и множества О в подмножество ОЬ следующим образом (3):
и О —^ ОЬ, (3)
где ОЬ си X такое, что У о Л е ОЬ Эа!;® а!:: .
Шх е Atx и € А(,
где 1 — 1, к, к - количество подцелей;
Л1х - множество атрибутов над понятиями онтологии;
Л1 - множество атрибутов множества шаблонов.
Процедура выделения правил функционирования из онтологии представлена как отображение с множества О в подмножество ОЬ следующим образом (4): '
ст.О^-ОЬ, (4)
где ОЬ а X такое. что У о/г е ОЬ 3/- ® .
Л, е К и / е >' •
где I — \, к . к - количество подцелей;
Бх - множество правил функционирования над понятиями онтологии;
Б - множество правил функционирования шаблонов.
Таким образом, получен следующий фрагмент онтологии (5):
ФО = <0Ь, Л, Б, Я>, (5)
где 0Ь - множество объектов;
Л - множество атрибутов над ОЬ;
Б - множество правил функционирования над ОЬ;
Я - множество отношений между ОЬ.
Пусть имеется вырезанный фрагмент из онтологии КНЦ. Этот фрагмент был выбран в соответствие с поставленной целью - «Финансирование КНЦ».
На рис. 1. изображен фрагмент онтологии КНЦ, где С - концепты, А - атрибуты соответствующих концептов, стрелки - связи между концептами.
В соответствии с технологией концептуальных шаблонов шаблон - это некоторая типовая конструкция, обладающая неизменной структурой и набором входных и выходных параметров, а также функционально реализующая определенную цель [2].
Определим множество шаблонов А={Р1}, где 1=1,.. .,ш., т-размерность множества А.
Рис.1. Фрагмент онтологии КНЦ
Пусть определен некоторый набор шаблонов, разработанный экспертами в данной предметной области. В работе для общего понимания работы технологии представлены только несколько шаблонов, которые реализуется в виде модели системной динамики.
Шаблон «Финансирование КНЦ»
Шаблон «Финансирование Института»
Шаблон «Заработная плата»
Формально шаблон можно представить в виде следующего множества: Р = (81 , X, У, I} , где 81 - множество структурных элементов шаблона;
X - множество входных параметров шаблона;
У - множество выходных параметров;
I - множество начальных значений.
Процедура соотнесения шаблонов фрагменту онтологии заключается в том, чтобы каждому структурному элементу шаблона был найден элемент онтологии. Формально процедура соотнесения представляется как отображение 8, в котором каждому шаблону из множества шаблонов А ставится в соответствие некоторое множество элементов фрагмента онтологии, причем каждый структурный элемент шаблона соотнесен с элементом ФО (6).
Б-.А^ФО, (6)
причем
\/Р, е А ЗЕО. а ФО, причем У\/, е Л , е Л.
* ] 1 1 1 ] 3 5
где X/1 cz Pi 8/ , с ЕО ■ (ЕО - некоторое множество элементов фрагмента онтологии, Р1 - отдельный шаблон).
Схема отображения S представлена как матрица, строки которой соответствуют элементам шаблона Р1, а столбцы - элементам Е0^
Г0, если st. <> st,
[1, в противном случае
Введем некий критерий соотнесения. Этим критерием будет выступать относительная величина структуры (ОВС).
ОВС характеризует структуру совокупности, определяет долю (удельный вес) части в общем объеме совокупности. ОВС расчитывают как отношение объема части совокупности к абсолютной величине всей совокупности, определяя тем самым удельный вес части в общем объеме совокупности: т
ОВС = -Ч
м
где т1 - число соотнесенных элементов 1-го шаблона (количество ненулевых строк в матрице 8ц); М - общее число структурных элементов в шаблоне. Для каждого Р1 находится свое ОВСР1.
Введем предельное значение а (а=1 означает, что все элементы и связи полностью соотнесены с элементами и отношениями онтологии). Установим предельное значение равным 0,6. Тогда ОВС>а означает, что большая часть структуры шаблона соотнесена с элементами онтологии и можно провести процедуру допараметризации. Если ОВС<а, то это означает, что большинство элементов шаблонов не могут быть соотнесены с элементами онтологии, а, значит, этот шаблон не будет использоваться на этапе синтеза имитационной модели.
Например, для шаблона «Заработная плата» были соотнесены следующие элементы: «Количество сотрудников» и «Оклад». Вычислим ОВС для данного шаблона. Общее число структурных элементов и связей шаблона М = 5, тогда как соотнесенных ш = 4: ОВС = 4/5 = 0,8. Значит, шаблон «Заработная плата» почти соотнесен с элементами и отношениями онтологии.
Также необходимо учесть, что онтология и шаблоны разрабатывались разными экспертами, которые могут оперировать синонимичными понятиями данной предметной области. Принимая это обстоятельство во внимание, для каждого шаблона дополнительно проводится процедура поиска синонимов. Она заключается в поиске синонимов сначала в выделенном фрагменте онтологии, затем работает с понятиями оставшейся части онтологии, которая не учитывалась при вырезании фрагмента онтологии.
Пусть 8УК - множество синонимов данной предметной области, Х - множество элементов фрагмента онтологии, 81 - множество элементов шаблона Р1. Тогда процедура поиска синонима строится по следующему принципу:
1) поиск несоотнесенного элемента в словаре синонимов данной предметной области и выделение всех синонимов данного понятия;
2) сопоставление выделенного набора синонимов с элементами фрагмента онтологии;
3) если поиск не дал положительного результата, то процедуру поиска повторяем для оставшейся части онтологии. Если процедура поиска выполняется в оставшейся части онтологии и дает положительный результат, то найденные синонимичные понятия добавляются к фрагменту онтологии с обязательным указанием связей.
Вернемся к примеру с шаблоном «Заработная плата». В шаблоне элементы «Количество сотрудники» и «Оклад» связаны с элементом «Заработная плата» информационной связью. В онтологии имеются только «Количество сотрудников» и «Оклад», но есть информационная связь с элементом «Жалованье». Используя процедуру поиска синонимов, можно однозначно установить, что «Жалованье» есть синоним «Заработной платы».
В словаре синонимов для слова «Заработная плата» имеется несколько синонимов - жалованье, доход, заработок и др. Затем этот набор выделенных синонимов сравнивается с понятиями в онтологии. Если концепт равен одному из синонимов множества 88уп то вместо элемента шаблона «Заработная плата» пользователю предлагается использовать синонимичное понятие в онтологии «Жалованье», а также сразу установить предложенные связи. Функция поиска синонимичных понятий для несоотнесенного элемента (7).
= оЬк, если ЗБяупе Буп, причем оЬк = Бяуп] п (7)
ОЬ = ио\ иsti, в противном случае
. *=1
Ряуп = -
где 88уп - множество выделенных синонимов для st1;
8уп - множество всех синонимов для данной предметной области;
0Ь - множество понятий фрагмента онтологии ФО;
811 - несоотнесенный элемент из множества структурных элементов St шаблона Р.
Процедура поиска синонимов позволяет увеличить степень соотнесения каждого шаблона, а также избежать проблемы избыточности онтологии.
После процедуры соотнесения шаблонов и процедуры поиска синонимов могут возникнуть три ситуации:
1) Шаблон вообще нельзя соотнести с элементами онтологии.
2) Найдены не все связи между всеми имеющимися элементами.
3) Найдены не все элементы в онтологии, а соответственно не все необходимые связи.
Рассмотрим первый случай, когда шаблон вообще нельзя соотнести с элементами онтологии, т.е. ОВСР1=0. Если процедура поиска для шаблона Р1 не дает никаких результатов, то встает вопрос о необходимости использования данного шаблона на этапе синтеза имитационной модели. Если пользователь посчитает, что данный шаблон все-таки необходим, то проводится процедура допараметризации онтологии. Она заключается в «достраивании» фрагмента онтологии теми понятиями, которые пользователь посчитает необходимыми для синтеза модели. Также пользователь сам указывает, какие связи должны быть между этими элементами (9):
ФО=<ОЬ^ОЬи,А'и ^Еи >
где 0Ьи - множество пользовательских понятий;
Аи - множество пользовательских атрибутов;
Яи - множество пользовательских связей между элементами;
Би - множество пользовательских правил функционирования над новыми понятиями.
Таким образом, данная процедура позволяет расширить онтологию, т.е. увеличить степень детализи-рованности онтологии.
Процедура допараметризации может быть полной или частичной. Допараметризация считается полной, когда в онтологию добавляются как новые понятия, так и связи между ними. Если онтология пополняется только связями, то допараметриза-ция является частичной.
Во втором случае, когда структурные элементы шаблона соотнесены с элементами фрагмента онтологии, но в самой онтологии отсутствуют некоторые связи между этими элементами, процедура допара-метризации является частичной. Система, анализируя информацию шаблона и фрагмента онтологии, предлагает пользователю наиболее подходящие связи между соотнесенными элементами данного шаблона. Пользователь может принять их либо установить свои.
Третий случай, когда структурные элементы шаблона соотнесены не полностью, а соответственно не все связи определены. Здесь применяется процедура полной допараметризации с учетом имеющихся соотнесенных элементов шаблона. Т.е. мы не просто добавляем новые понятия и связи, а на основе соотнесенных и добавленных элементов система выдает предположительные связи между этими элементами.
После процедур соотнесения и допараметриза-ции, в вырезанном фрагменте онтологии могут остаться неучтенные элементы (т.е. такие понятия, которые не учитывались при разработке шаблонов). В зависимости от предпочтений пользователя, эти элементы на этапе синтеза модели могут использоваться в качестве вспомогательных переменных, несущих дополнительную информацию о шаблонах.
Таким образом, в данной работе рассмотрена процедура соотнесения шаблонов и допараметриза-ции онтологии, которые позволяют не только получить имитационную модель на основе онтологии и шаблонов, но и расширить саму онтологию, добавляя отсутствующие в ней связи и понятия.
Литература
1. Guarino, N. Ontologies: What Are They, and Where’s The Research? - Режим доступа: http://www-ksl.stanford.edu/KR96/Panel.html
2. Кодема, В.А. Технология распознавания концептуальных шаблонов системы автоматизации синтеза системно-динамических моделей / В.А. Кодема // Имитационное моделирование. Теория и практика” (ИИМОД-2007): сб. науч. тр. III-й Всероссийской научно-практической конф. -С-Петербург, 17-19 окт. 2007. - С.157-162.
3. Быстров, В.В. Технология концептуальных
шаблонов для синтеза имитационных моделей сложных систем / В.В. Быстров, А.В. Горохов // Проблемы управления и моделирования в сложных системах: сб. науч. тр. IX
Международной конф. - Самарский научный центр РАН. - Самара, 2007. - С.462-467.
4. Быстров, В.В. Информационная технология концептуального синтеза имитационных моделей /В.В. Быстров, А.В. Горохов // Сб. тр. II Всероссийской научной конф. ЭКОМОД 2007. -Киров, 2007. - С.69-76.