Научная статья на тему 'Интеграция семантических моделей документа'

Интеграция семантических моделей документа Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
154
56
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОНТОЛОГИЯ / СЕРВИС УПРАВЛЕНИЯ ДОКУМЕНТАМИ / МОДЕЛЬ / КЛАСС / ПОДКЛАСС

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Грегер С.Э., Жуйкова О.С.

В статье рассматривается разработка сервиса интеграции семантических моделей документа, позволяющего частично автоматизировать процесс создания документа. Создание документа рассматривается как программная интеграция структурной семантической модели документа и семантической модели запросов к базе знаний, отображающей знание о некоторой предметной области.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Интеграция семантических моделей документа»

Объём публикации не позволяет рассмотреть другие аспекты моделирования, такие как моделирование задач, моделирование пользовательского интерфейса и структур хранения, вопросы интеграции семантических моделей и генерации программных элементов. Эти вопросы мы предполагаем рассмотреть в дальнейших публикациях.

Литература

1. Грегер С.Э. Интеллектуальная система проектирования веб-приложений. Объектные системы - 2013: материалы VII Международной научно-практической конференции (Ростов-на-Дону, 10-12 мая 2013 г.) / Под общ. ред. П.П. Олейника. - Ростов-на-Дону: ШИ ЮРГТУ (НПИ),

2013. с.50-54

2. Гаврилова Т.А. Базы знаний интеллектуальных систем. СПб: Питер, 2000. 384 с.

3. Грегер С.Э., Сковородин Е.Ю. Построение онтологического портала с использованием объектной базы - Объектные системы - 2010: Материалы I Международной научнопрактической конференции. Россия, Ростов-на-Дону, 10-12 мая 2010 г / под общ. ред. П.П. Олейника. - Ростов-на-Дону, 2010. С. 74-78.

4. Олейник П.П. Унифицированная модель тестирования инструментов разработки объектноориентированных приложений - Объектные системы - 2014 (Зимняя сессия): материалы IX Международной научно-практической конференции (Ростов-на-Дону, 10-12 декабря 2014 г.) / Под общ. ред. П.П. Олейника. - Ростов-на-Дону: ШИ (ф) ЮРГПУ (НПИ) им. М.И. Платова,

2014. -С. 23-32.

5. Ахметов Д.Р., Грегер С.Э. Редактор онтологий для онтологоуправляемой информационной системы. Объектные системы - 2013: материалы VII Международной научно- практической конференции (Ростов-на-Дону, 10-12 мая 2013 г.) / Под общ. ред. П.П. Олейника. - Ростов-на-Дону: ШИ ЮРГТУ (НПИ), 2013.с.80-82.

УДК 681.3

ИНТЕГРАЦИЯ СЕМАНТИЧЕСКИХ МОДЕЛЕЙ ДОКУМЕНТА

Грегер Сергей Эдуардович, Уральский федеральный университет имени первого Президента России

Б.Н.Ельцина, Нижнетагильский технологический институт (фил.). Факультет экономики и менеджмента, кафедра информационных технологий, доцент. Россия. Нижний Тагил,

segreger@gmail.com

Жуйкова Ольга Сергеевна, студент, Нижнетагильский технологический институт филиал уральского федерального университета имени первого Президента России Б.Н. Ельцина, Россия,

Нижний Тагил, Zhuikova-nt94@vandex.ru

Современные информационные системы (ИС) стали неотъемлемой частью нашей жизни. С их помощью можно значительно ускорить, упростить и обеспечить более эффективный сбор, хранение и обработку информации. ИС широко применяются в различных сферах, в том числе и в образовании. Применение ИС в этой сфере позволяет облегчить работу преподавателям и студентам. Одним из таких проектов ИС является разработка «Сервиса интеграции», позволяющего правильно создать структуру необходимого документа.

«Сервис интеграции» основан на разработанных модулях (загрузки, изменения, удаления, форматирования информации и т.д.) CMS Plone. Совокупность всех созданных модулей позволяет организовать модель ИС, которая позволяет решать многие задачи:

1. Хранение материалов.

2. Поиск необходимого материала (выполнение запросов).

3. Редактирование материалов.

4. Формирование документов и их форматирование.

5. Сохранение документа в необходимом формате.

142

6. Единый программный продукт.

7. Замена бумажного документооборота на электронный.

8. Использование посредством сети Интернет.

9. Создание дополнительных модулей, позволяющие выполнять дополнительные задачи.

«Сервис интеграции» представляет собой онтологию, которая обеспечивает

непротиворечивое накопление любого количества информации в стандартной структуре классификации. Применение объектно-ориентированной базы данных для хранения онтологий с использованием специальных компонент хранения позволяет осуществлять эффективный контроль и верификацию данных, проверку корректности, полноты и непротиворечивости данных как на этапе анализа и нормализации существующих данных, так и при занесении новых элементов данных. Каждый объект объектно-ориентированной базы представляет некоторый элемент онтологии [1,2].

Модели создаются при разработке системы с помощью специального инструментария. Обычно строится несколько моделей, описывающих систему с различных точек зрения, на разных уровнях абстракции. Для построения модели документа созданы две онтологии.

Информационная система «отражает» логику и правила, организуя и преобразуя информационные потоки, автоматизирует процессы работы с данными и информацией и визуализирует результаты в виде наборов отчетных форм [4].

Онтология структуры документа используется для описания структуры документов. Эта онтология включает в себя два основных класса вершин — документ и фрагмент документа. На структурном уровне моделирования создается модель документа в терминах этих классов. Выделяются фрагменты документов и их структурные связи, формулируемые через отношение «целое-часть», и отношение порядка «следует за». Для определения реквизитов фрагмента (например, текстовый элемент, коллекция элементов) используется отношение «классификатор фрагмента» связывающий класс фрагмента с классом вида фрагмента. Модели создаются с помощью специального инструментария - элементов преобразования. Они включают в себя набор функций, которые преобразуют необходимую информацию к нужному виду (например, из строк в маркированный список).

Поскольку для реализации ИС мы используем CMS Plone, то мы можем использовать ее возможности и в решении такой задачи как выполнение запросов, которые, в свою очередь, могут предоставлять, изменять и удалять запрошенную информацию. Для этого мы используем адаптер, который, собственно, и выполняет необходимые пользователю запросы. Адаптер осуществляет поиск информации как в источнике данных (онтологии), так и в элементах документа. Тем самым появляется дополнительный набор функций, которые может выполнять данный «Сервис интеграции». В данный момент это организовано на уровне моделей, представление которой можно увидеть на рисунке 1.

Для поддержки семантических запросов в системе определены классы задач, решаемых системой и программные решатели задач. Запросы к семантической модели во время работы отображаются на систему задач, показанную на рисунке 2.

Так как задачи, поставленные пользователем, решены программно, запрос выполняется в несколько этапов:

Первый этап - в информационной системе пользователь определяет свой запрос.

Второй этап - сопоставляет данному запросу одну из задач, представленных в системе задач.

Третий этап - программное выполнение запроса.

Так, благодаря онтологиям, при обращении к поисковой системе пользователь будет иметь возможность получать в ответ ресурсы, семантически релевантные запросу. Для создания классов семантических запросов используется интерфейс поиска элементов онтологии по частично определенной модели ограничений на значения. Рассмотрены

143

частично определенные модели двух видов — модель, определяемая набором индивидуалов класов онтологий, и модель ограничений на классы связей.

Рис. 1 - Сервис интеграции

Модель, определяемая набором индивидуалов классов онтологий, формируется с помощью интерфейса (Рис. 3), позволяющего определить запрос к онтологии, указывая ограничения на множество объектов, связанных с заданным классом.

Рассмотрим пример запроса, записанного на разработанном нами языке запросов к онтологии:

1. #Запрос1^1^1апсе=@Запрос

2. #Запрос2^1^1апсе=@Запрос

3. @СложныйЗапрос1.Результат=Пересечение([#Запрос1.Результат,

#Запрос2.Результат])

4. #Запрос1.контекст_запроса=#webdesign

5. #Запрос1.тип связи=@1ЫОЬ]ес1Ргорег1у

6. #Запрос1.имя связи=‘для дисциплины’

7. #Запрос1.тип запроса=“Обратная ссылка”

8. #Запрос1.тип результата=@1еагп curse

В строках 1 и 2 объявляется существование объектов «Запрос1» и «Запрос2», реализующих класс «Запрос». В строке 3 декларируется класс «Сложный запрос» как результат выполнения операции по нахождению пересечения результатов соответствующих запросов. В строках 4-8 приведен пример определения ограничений на связь «для дисциплины» класса «1еагп сигее» через ограничение на множество связанных с этим классом объектов. Определяя ограничения на каждую связь, мы тем самым ограничиваем множество всех объектов класса «1еагп сигее». Неопределенность модели выражается в том, что не все ограничения на связи могут быть определены.

Модель на классы связей формируется с помощью специального интерфейса, позволяющего определить запрос к онтологии, указывая ограничения на тип связей класса. Сохраняя сформированную модель в виде элемента онтологии и объединяя наборы подобных элементов, можно формировать сложные запросы.

Создавая классы, наследующие основные онтологические классы, можно развивать модель документа. Использование классов классификаторов предоставляет возможность определять презентационную модель документа. В настоящее время используются две онтологии классификаторов — онтология веб-компонентов и онтология компонентов MS Ойлсе Word. Отношения, определяющие классификацию структурной модели документа, вынесены в отдельный онтологический модуль — онтологию презентации, что позволяет

144

генерировать документы различных форматов, связывая с онтологией структуры соответствующую презентационную онтологию [3].

задача выполнения семантического запроса Й получить список всех преподавателей +■ о результат 4* ^описание задачи 4* о решатель задачи

fij список всех преподавателей Л. база знаний Q elearn &- .о. связь класса

_о класс предметной области i" Qj преподаватель 4* Л класс предметной области

Title

The title of the navigation tree. Leaveblank for the default, translated title. |Системы |

ontolocation

The name of the folder. Leaveblank for the default, translated ontolocation. Iprojectontojogy |

rootclass

The name of the root ontoclassblank for the default, translated rootclass. [System |

reference_n a me

The name of the referenceblank for the default, translated reference name. |hasMetatype |

+* Л включает задачу 4- о делегирует задачу

^ получение списка объектов о-класса ; fr- _о_ о-класс

Рис. 2 - Система задач, на которую опирается запрос

Type of reference

ЕClass atribute нет значения)

Class atribute

ClassObjectProperty

In-dObjectProperty

pclassblank for the default, translated rootclass.

b

Рис. 3 - Интерфейс указания ограничений на тип связей класса

В настоящее время в сервисе возможна генерация только текстового и html-представления документов, но разрабатываются агенты для формирования документов в других форматах, таких как босх и pdf. Агент производит многоуровневый запрос к базе знаний, получая набор отношений, в которых участвует выбранное понятие и формирует их визуальное представление в виде таблицы связей.

Инструментальная система реализована как веб-приложение и используется в составе сайта кафедры информационных технологий Нижнетагильского технологического института. Применение объектно-ориентированной базы данных с набором специальных компонентов позволяет осуществлять гибкое моделирование и упраление документами.

Литература

1. Грегер С.Э. Сервер приложений «Zope». Учебное пособие для вузов М.:Горячая линия - Телеком, 2009.-256 с.:ил.

2. Грегер С.Э. Администрирование и интерфейс пользователя CMS Plone (монография). Федер. Агентство по образованию, ГОУ ВПО "УГТУ-УПИ им.первого Президента России Б.Н.Ельцина". Нижнетагил. технол. ин-т (фил.). -Нижний Тагил: НТИ(ф) УГТУ-УПИ, 2009. -140с.

3. Грегер С.Э., Жуйкова О.С. Сервис управления рабочими программами // Объектные системы -2014: Материалы IX Международной научно-практической конференции. Россия, Ростов-на-Дону, 10-12 декабря 2014 г / под общ. ред. П.П. Олейника. - Ростов-на-Дону, 2014. С. 60-64.

145

УДК 004.652.3, 004.652.8

ОБЪЕКТНО-АТРИБУТНАЯ БАЗА ДАННЫХ ДЛЯ ОПИСАНИЯ ПРОСТРАНСТВЕННО-ВРЕМЕННЫХ ОТНОШЕНИЙ ОБЪЕКТОВ1314

Салибекян Сергей Михайлович, к.т.н., доцент Национального исследовательского университета «Высшая школа экономики», Московский институт электроники и математики, Москва,

salibek@yandex.ru

Петрова Светлана Борисовна, студент Национального исследовательского университета «Высшая школа экономики», Московский институт электроники и математики, Москва, sv.halkina@gmail.com Дени^ва Юлия Андреевна, магистрант Национального исследовательского университета «Высшая школа экономики», Московский институт электроники и математики, Москва, o.a.bulava@gmail.com

В настоящее время большое внимание научной общественности обращено к системам ориентации технических объектов в пространстве: автоматические системы управления транспортными средствами, компьютерные игры, автоматические межпланетные системы (луноход, марсоход и т.п.), гибкие производственные линии, техническое зрение. В нашей статье мы предложим методику описания пространственно-временных и причинноследственных отношений между объектами, которые можно будет использовать в подобных системах.

Изначально наша работа была связана с созданием формата базы данных (БД) для описания смысла, извлеченного из текста на естественном языке. БД должна была иметь возможность описывать достаточно широкую предметную область, вплоть до всего окружающего мира (на тематику текста не накладывается никаких ограничений). И т.к. в реальном тексте довольно часто присутствует описание пространственно-временных и причинно-следственных отношений, возникла необходимость разработать методику их описания и анализа. В дальнейшем мы расскажем о формате всей БД, и более подробно остановимся на способе описания пространственно-временных и причинно-следственных отношений, являющейся частью БД.

Основой методики создания БД стали, во-первых, объектно-атрибутный (ОА) подход к организации вычислительного процесса и структур данных [1,2], позволяющий создавать БД сетевого (графового) типа и позволяющий производить динамическое преобразование структур данных без опасности нарушить их целостность. Во-вторых, структурная грамматика [3] (в частности, теория синтаксических ролей Ч. Филлмора [4], и теория семантических валентностей [5]), которая позволяет описывать смысл текста в виде графа, узлы которого ассоциируются с объектами или действиями, а дуги - со смысловыми связями между ними. Каждая часть речи имеет определенный набор связей (валентностей), с помощью которых она может порождать смысловые связи с другими словами. Валентностями они называются по аналогии с химией: как у атома имеются несколько валентностей, с помощью которых он может объединяться с другими атомами и образовывать молекулу, так и языковые единицы (в частности, слова), могут «сцепляться» с другими словами и образовывать смысловые конструкции. Например, глагол имеет следующие валентности: субъект (тот, кто производит действие), объект (над кем производится действие), инструмент, адресат и т.д. ОА-подход, для которого разработана математическая модель [6], позволил формализовать структурную грамматику и дал возможность реализовать ее на ЭВМ. В результате граф, отражающий объекты, играющие определенные синтаксические роли, и смысловые связи между ними, был реализован в виде семантического ОА-графа (базы данных (БД) сетевого (графового) типа) [7]. Фрагмент

13

Исследование осуществлено в рамках Программы фундаментальных исследований НИУ ВШЭ в 2015 год

14 Статья рекомендована к опубликованию в журнале "Прикладная информатика"

146

i Надоели баннеры? Вы всегда можете отключить рекламу.