Научная статья на тему 'Модели и инструменты представления пространственно-временных данных в семантическом вебе'

Модели и инструменты представления пространственно-временных данных в семантическом вебе Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
427
76
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЕМАНТИЧЕСКИЙ ВЕБ / МОДЕЛИРОВАНИЕ ДАННЫХ / RDF-ДАННЫЕ / ПРОСТРАНСТВЕННО-ВРЕМЕННЫЕ ДАННЫЕ / ОНТОЛОГИЯ / SEMANTIC WEB / SPATIO-TEMPORAL DATA / ONTOLOGY

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шульга Татьяна Эриковна, Вагарина Наталия Сергеевна, Мельникова Нина Ивановна, Мищенко Дмитрий Алексеевич

На современном этапе развития технологий семантического веба большой интерес представляют возможности их применения для представления пространственно-временных данных в различных предметных областях. Сегодня пространственно-временная информация является важной частью многих центральных узлов облака связанных данных (Linked Data Cloud), а вопросы геопространственной семантики, гео-онтологий и семантической совместимости активно исследуется в течение последних нескольких лет. Несмотря на важность и актуальность темы, а также активное развитие семантических технологий, пространственно-временные данные не имеют подробного описания в российских работах. В данной статье приводится обзор моделей и инструментов семантического представления пространственно-временной информации. Предлагается методика разработки набора связанных данных с учетом пространственно-временной информации с использованием популярного редактора онтологий Protégé. В качестве примера предметной области выбран футбол, а именно моделируются данные футбольных турнирных таблиц в пространственно-временном контексте.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Шульга Татьяна Эриковна, Вагарина Наталия Сергеевна, Мельникова Нина Ивановна, Мищенко Дмитрий Алексеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MODELS AND TOOLS FOR PRESENTATION SPATIO-TEMPORAL DATA ON THE SEMANTIC WEB

At the present stage of development of the technologies of the Semantic Web, the most interesting subject is the possibility of their application to represent spatio-temporal data in a variety of thematic areas. For these reasons, issues of geospatial semantics, geo-ontologies and semantic interoperability of data were active areas of research in the past few years. Today, the space-time information is an important part of many key nodes in the Linked Data Web. Despite the importance and relevance of the topic, as well as the active development of semantic technologies, spatio-temporal data does not have a detailed description in the works of Russian scientists, published in Russia. This article discusses the models and tools of the semantic representation of space-time information. The paper proposes a method of developing a set of linked data based on spatial-temporal information in order to develop ontologies in Protege editor. As a subject area there was selected information on football matches, to provide data on the standings in the spatio-temporal context.

Текст научной работы на тему «Модели и инструменты представления пространственно-временных данных в семантическом вебе»

УДК 004.822

МОДЕЛИ И ИНСТРУМЕНТЫ ПРЕДСТАВЛЕНИЯ ПРОСТРАНСТВЕННО-ВРЕМЕННЫХ ДАННЫХ В СЕМАНТИЧЕСКОМ ВЕБЕ

© 2016 Т.Э. Шульга, Н.С. Вагарина, Н.И. Мельникова, Д.А.Мищенко

Саратовский государственный технический университет имени Ю.А. Гагарина

Статья поступила в редакцию 11.11.2016

На современном этапе развития технологий семантического веба большой интерес представляют возможности их применения для представления пространственно-временных данных в различных предметных областях. Сегодня пространственно-временная информация является важной частью многих центральных узлов облака связанных данных (Linked Data Cloud), а вопросы геопространственной семантики, гео-онтологий и семантической совместимости активно исследуется в течение последних нескольких лет. Несмотря на важность и актуальность темы, а также активное развитие семантических технологий, пространственно-временные данные не имеют подробного описания в российских работах. В данной статье приводится обзор моделей и инструментов семантического представления пространственно-временной информации. Предлагается методика разработки набора связанных данных с учетом пространственно-временной информации с использованием популярного редактора онтологий Protégé. В качестве примера предметной области выбран футбол, а именно моделируются данные футбольных турнирных таблиц в пространственно-временном контексте. Ключевые слова: семантический веб, моделирование данных, RDF-данные, пространственно-временные данные, онтология.

ВВЕДЕНИЕ

Развитие технологий семантического веба [1] основывается на идее представления данных и знаний в новых машиночитаемых форматах (RDF, RDFS, OWL и др.). RDF-данные, разработанные на основе известных OWL-онтологий (моделей представления знаний), могут легко объединяться и использоваться за пределами первоначального контекста их создания. Именно поэтому их принято называть связанными данными (Linked Data). Облако связанных данных быстро растет с каждым годом и представляет пользователям все больше возможностей, позволяя отвечать на сложные запросы, охватывающие несколько источников данных из разных научных областей. Однако, разобщение данных делает их обработку и интерпретацию весьма сложной задачей. Таким образом, исследование семантической совместимости связанных данных и онтологий имеет решающее значение для обеспечения последовательных и значимых резуль-

Шульга Татьяна Эриковна, доктор физико-математических наук, профессор кафедры «Информационно-коммуникационные системы и программная инженерия». Е-mail: shulga@sstu.ru

Вагарина Наталия Сергеевна, кандидат физико-математических наук наук, доцент кафедры «Информационно-коммуникационные системы и программная инженерия». Е-mail: v-n-s@yandex.ru

Мельникова Нина Ивановна, доктор социологических наук наук, профессор кафедры «Информационно-коммуникационные системы и программная инженерия». Е-mail: melnikovani@gmail.ru Мищенко Дмитрий Алексеевич, магистрант. Е-mail: mishchenkoda@sstu.ru

татов в области современных веб-технологий. Пространство и время являются основными принципами упорядочения и структурирования таких данных и обеспечивают неявный контекст для их интерпретации. Многие связанные наборы данных либо непосредственно содержат пространственно-временные идентификаторы, либо связаны с наборами данных, содержащими их, что делает их центральными узлами, концентраторами облака связанных данных.

Способы представления пространственно-временной информации активно исследуются в различных областях науки (темпоральные логики, пространственно-временные базы данных и др.). Особенный интерес в связи с развитием семантического веба представляет решение этого вопроса в контексте OWL-онтологий. Онтологии предлагают средства как для представления знаний в конкретной предметной области, так и для представления понятий высокого уровня, их свойств и взаимосвязей. Так называемые временные онтологии представляют возможности для представления информации и, в частности, событий со свойствами, изменяющимися во времени. Примером популярной временной онтологии может служить онтология OWL-Time, продвигаемая консорциум W3C[2]. Ряд успешных проектов, например, таких как Geonames.org[3], Linked Geo Data [4], показывают преимущества и перспективы пространственных онтологий. Заметим, что правительства и правительственные учреждения некоторых стран в последние годы начали активно разрабатывать гео-онтологии и публиковать свои данные в виде связанных пространственно-временных данных [5].

Учитывая активное развитие семантических технологий, в российской научной литературе в последние годы больше внимание уделяется онтологическому моделированию, например, [6,7,8,9,10]. Однако, несмотря на важность и актуальность темы, семантический подход к представлению именно пространственно-временных данных не имеет подробного описания в российских работах.

В данной статье приводится обзор моделей и инструментов, которые могут быть использованы для семантического представления пространственно-временной информации. Предлагается методика разработки набора связанных данных с учетом пространственно-временной информации с использованием популярного редактора онтологий Protégé [11,12]. В качестве примера предметной области выбран футбол, а именно моделируются данные футбольных турнирных таблицах в пространственно-временном контексте.

МОДЕЛИ ПРЕДСТАВЛЕНИЯ ПРОСТРАНСТВЕННО-ВРЕМЕННЫХ ДАННЫХ

В семантическом вебе основным языком представления данных является язык RDF, который позволяет записывать утверждения в виде бинарных отношений (например, отношение (свойство) «работает в» может связывать только два ресурса, например «Иванов» и «МГУ»). Язык представления знаний OWL позволяет описывать типы объектов (классы), взаимосвязи между ними (свойства, также представляющие собой бинарные отношения), и способы совместного использования классов и свойств (аксиомы). Синтаксис и семантика этих языков не позволяет представлять данные и знания с учетом временного аспекта и пространственной информации.

Представление динамических и геопростан-ственых свойств информации требует соответствующих подходов и моделей (позволяющих представлять понятия времени, свойств, изменяющихся во времени, а также пространственных понятий). К основным из них можно отнести: пространственно-временную модель « сущность-связь» (Entity-Relation, ER), расширенный язык RDF для представления пространственно-временной информации (stRDF), темпоральные дескрипционные логики, реификацию, n-арные отношения (N-ary relations), именованные графы, подходы «Управление версиями» (Versioning), 4D-fluent и др. Опишем кратко данные подходы и модели.

Пространственно-временная модель ER предоставляет механизм для описания эволюции событий во времени. Однако, данная модель не подходит для использования в семантическом вебе, так как, во-первых, семантика языка OWL не эквивалентна семантики модели ER (например, OWL поддерживает концепцию «открытого

мира», а модель ER - «закрытого») и, во-вторых, связи между данными в OWL ограничены бинарными отношениями.

stRDF предлагает расширение RDF, добавляя к данным информацию об интервале времени, в течение которого они существуют, и пространственную информацию. Такой подход требует расширения синтаксиса и семантики стандартного RDF.

Темпоральные дескрипционные логики расширяют стандартные дескрипционные логики (основу OWL), позволяя представить такие семантические временные конструкции как «где-то в прошлом», «всегда в будущем». Они предлагают дополнительные выразительные возможности и сохраняют разрешимость, но при этом требуют расширения синтаксиса и семантики OWL.

Реификация представляет собой общую методику для представления n-арных отношений с помощью языков, которые используют только бинарные отношения ( в частности, языков RDF и OWL). В частности, n-арное отношение представляется как новый объект, у которого все аргументы исходного n-арного отношения представлены как свойства. В результате получается конструкция «утверждение об утверждении». Этот подход страдает, во-первых, от большой избыточности данных, так как новый объект создается всякий раз, когда должно быть представлено временное отношение, а во-вторых ограничивает возможности вывода в OWL, так как свойства отношения не связаны непосредственно с самим отношением.

N-ary relations также представляет собой методику, согласно которой n-арные отношения представляются с использованием дополнительного объекта. В отличие от реификации, n-арные отношения между объектами представляются здесь как два свойства, связанные с каждой новым объектом из отношения. Такой подход требует только одного дополнительного объекта для каждого временного интервала, сохраняет семантику свойств, но страдает от избыточности данных в случае описания симметрических и обратных свойств (например, обратное отношение добавляется явным образом два раза).

В последнем стандарте языка RDF введено понятие именованного графа (Named Graph), который представляет собой RDF-граф, которому присваивается имя в формате URI. Источником для имени графа может быть имя элемента данных либо из самого графа, либо из других графов. Кроме того, имя может быть самостоятельным идентификатором или пустым узлом. Согласно данному подходу основной RDF (граф по умолчанию) содержит определения интервала начальной и конечной точек существования для каждого именованного графа. Подход Named Graphs не являются частью спецификации OWL и не поддерживают рассуждений OWL.

Подход «управления версиями» предполагает, что онтология имеет различные версии (по

одному на каждый момент времени). Когда происходит изменение, создается новая версия. Очевидно, что данный подход имеет существенные недостатки: изменения даже отдельных атрибутов требуют создания новой версии онтологии, а поиск событий, произошедших в определенные моменты времени, требует исчерпывающего поиска в нескольких версиях онтологии.

Подход 4D-fluent основан на идее представления понятий, изменяющихся во времени, в виде 4-мерных объектов, где четвертым измерением является время. При этом временные интервалы могут быть представлены с неизвестной начальной и конечной точками с помощью их отношения (например, "перед", " после того, как ") к другим известным интервалам времени. В рамках подхода 4D-fluent предлагается набор правил вывода, цель которых состоит в том, чтобы получить утверждение дополнительных фактов, подразумеваемых в базе знаний (то есть, определить временную связь между двумя событиями через их связь с третьим). Кроме того, в данном подходе осуществлена поддержка запросов.

Все описанные модели и подходы страдают от избыточности данных, поскольку для каждого объекта, изменяющегося в времени или описываемого с помощью пространственных характеристик, создаются несколько новых бинарных отношений, описывающих эти аспекты (то есть, для каждого нового события создается новый временной объект и дополнительные бинарные отношения, описывающие его, а также связывающие с уже существующими классами). Помимо увеличения сложности наборов данных в целом, при этом возникают ограничения на использование языка OWL, в частности, на задание таких свойств, как кардинальность, инверсия, транзитивность отношений. Подход 4D-fluent также страдает от избыточности данных, но сохраняет при этом семантические возможности OWL, в том числе поддержку логического вывода.

В связи с этим на практике наибольшее распространение получил подход, связанный с описанием связанных данных с использованием стандартных временных и пространственных OWL-онтологий (словарей). Наиболее ярким примером временной онтологии является онтология OWL-Time, которая будет описана ниже. Что касается пространственных онтологий, то заметим, что за последнее десятилетие, было предпринято много различных попыток создать геопространственный RDF-стандарт. Несколько различных организаций, в том числе и W3C создали свои собственные онтологии для представления и запросов к геопространственным данным. Так, GeoRSS [13] представляет собой словарь терминов, которые могут быть использованы в документах RDF для представления геопространственной информации. Основная цель проекта заключается в создании общей

лексики геопространственных терминов для использования в RSS-каналах. В качестве еще одного примера можно привести словарь Basic Geo Vocabulary[14], представляющий собой простой RDF для кодирования значений широты и долготы. Он определяет класс Point, а также свойства lat, long, и alt для описания местоположения объекта с точки зрения широты и долготы.

Кроме того, согласно самой идее семантического веба, если стандартные пространственно-временные представления, такие, как OWL-Time, GeoRSS и Basic Geo Vocabulary плохо подходят для создаваемого приложения в конкретной предметной области, то всегда существует возможность их расширения, или создания собственных словарей. Однако при этом необходимо учитывать необходимость совместимости новых пространственно-временных представлений с уже существующими.

ВРЕМЕННАЯ ОНТОЛОГИЯ OWL-TIME

Для каждого события, происходящего в мире, помимо другой связанной с ним информацией, характерно где и когда произошло это событие. Именно поэтому разработка приложений, связанных с обработкой пространственно-временных данных является одним из приоритетных направлений современного этапа развития веба. На данный момент, язык OWL поддерживает некоторые элементы представления времени и пространства, однако он имеет ограниченное количество типизированных литералов, связанных с пространственно-временной информацией. Для решения этой задачи консорциум W3C разработал онтологию OWL-Time для описания временного содержания веб-страниц и временных свойств веб-служб.

На естественном языке часто используют выражения с временными агрегатами, такие как «каждый вторник», «каждый третий понедельник в 2016», «четвертое воскресенье подряд» и т.п. Следовательно, онтология должна содержать описание временных агрегатов для представления этих выражений. Кратко опишем онтологию OWL-Time, ядро которой представлено на рис. 1.

Основной класс онтологии TemporalEntity, представляет собой понятие временного субъекта. Данный класс является объединением своих подклассов Instant (момент времени) и Interval (интервал времени). Класс Interval имеет один подкласс ProperInterval (правильный интервал, имеющий различные моменты начала и конца), непересекающийся с классом Instant. Класс ProperInterval имеет один подкласс DateTimeInterval, экземпляры которого могут быть, в частности, описаны с помощью стандартного типа данных языка XML: xsd:dateTime.

Длительность интервала времени определяется экземпляром класса DurationDescription,

который напрямую связан с моментами времени свойствами hasBeginning и hasEnd. Экземпляр класса DurationDescription использует такие свойства, как недели, дни, часы, минуты и секунды, чтобы указать продолжительность. Для добавления временных единиц, с помощью которых возможно измерить интервалы, используется класс TemporalUnits. Класс TimeZone необходим для добавления информации о временной зоне, где происходит событие. Подклассами класса TimeZone являются City, Country, State и другие. Их основной задачей является указание местоположения. Для упрощения задачи с представлением данных в разных часовых поясах используют стандарт Pacific Standard Time. Класс DateTimeDescription позволяет определить моменты времени (Instant).

Онтология OWL-Time может эффективно использоваться в рамках подхода 4D-Fluents.

РЕАЛИЗАЦИЯ ПОДХОДА 4D-FLUENTS ДЛЯ ОПИСАНИЯ ВРЕМЕННЫХ ДАННЫХ

Подход 4D-Fluents предлагает способы эффективного представления временной информации в OWL. Известно, что в SD-виде все

сущности мира делятся на две основные категории: «endurants» (физические объекты, такие как автомобили, компании, люди) и «occurants» (события, такие, как покупка автомобиля). Сущности типа «endurants» должны существовать постоянно в любой промежуток времени и не имеют временных измерений, в то время как сущности типа «occurants» - временные части, которые существуют, когда событие происходит. Основной проблемой этого подхода является идентификации набора свойств «endurants», которые не изменяются с течением времени. Например, если рассмотреть развитие человека, то объект «endurant» имеет как набор свойств, которые не изменяются с течением времени (например, ДНК), так и набор свойств, которые меняются с течением времени (например, цвет волос, рост, вес). В рамках подхода 4D-Fluents не делается различия между «endurants» и «occurants». Идея заключается в том, что каждый объект имеет начальную и конечную точку. При таком подходе проблема идентификации набора свойств становится тривиальной, так как каждый субъект имеет временные части.

Для реализации подхода 4D-Fluent используется плагин для Protégé 4D-Fluents Tab.

^ DateTimelnterval H hasDateTimeDescription : GeneralDateTimeDescription ■ xsdDateTime : dateTime

Рис. 1. Ядро онтологии OWL-Time

Protégé [10, 11] - это свободно распространяемая платформа (редактор онтологий) с открытым исходным кодом, которая обеспечивает инструменты для построения моделей предметной области и приложений, основанных на базах знаний с онтологиями; поддерживает создание, визуализацию и манипулирование онтологиями в различных форматах представления. Данная платформа может быть расширена за счет использования различных плагинов. Плагин 4D-Fluents Тав разработан в Департаменте электронной и вычислительной техники технического Университета Крита. Он поддерживает создание и редактирование временных онтологий в совместимом с OWL2 формате. 4D-Fluent Tab работает с временной информацией, следовательно, нужен словарь для описания временных понятий и отношений между ними. Эта информация может быть найдена в онтологии OWL-Time, описанной выше.

Таким образом для создания онтологии согласно подходу 4D-Fluent необходимо использовать платформу Protégé, временную онтологию OWL-Time в качестве словаря и плагин 4D-Fluents Тав, позволяющий создавать и редактировать временные онтологии так же, как и статические. Следует отметить, что уже существующая статическая онтология, при необходимости добавления в нее пространственно-временных элементов, может быть легко преобразована во временную с помощью плагина 4D-Fluents Tab. Причем, это могут сделать даже те пользователи, которые малознакомы с особенностями модели 4D-Fluent.

МЕТОДИКА РАЗРАБОТКИ НАБОРА

СВЯЗАННЫХ ДАННЫХ С УЧЕТОМ

ПРОСТРАНСТВЕННО-ВРЕМЕННОЙ ИНФОРМАЦИИ

Предложим одну из возможных методик разработки набора связанных данных с учетом пространственно-временной информации с использованием популярного редактора онтологий Protégé. В качестве примера предметной области выбран футбол, а именно моделируются данные футбольных турнирных таблиц в пространственно-временном контексте.

Прежде всего необходимо разработать онтологию, представляющую предметную область. (Заметим, что на практике такая разработка начинается с анализа уже существующих онто-логий данной области, но для простоты примера опустим этот этап). Для разработки онтологии в первую очередь необходимо определить её масштаб. В рассматриваемом примере областью разрабатываемой онтологии является описание футбольных клубов, стадионов, матчей между командами и их привязка к временным интервалам. Для описания интервалов времени подключим описанную выше онтологию OWL-Time, определенную в пространстве имен http://www.

w3.org/2006/time#.

После описания масштаба онтологии и основных понятий предметной области перейдем к проектированию иерархий классов и свойств. При проектировании в нашем случае был использован нисходящий подход. На базе основных понятий были определены классы онтологии «Стадион», «Клуб», «Матч». Кроме того, к основным классам можно отнести классы из онтологии OWL-Time: TemporalEntity, Instant, Interval, описанные выше. Разработанная онтология включает в себя также объектные свойства (Object Properties), описывающие отношения между экземплярами классов, и свойства типов данных (Data Properties), описывающие отношения между конкретными литералами и экземплярами классов. Примерами объектных свойств являются свойства «имеет стадион», «проходит на стадионе», примерами свойств типов данных - свойства « начало матча» и «конец матча».

Когда созданы иерархия классов и свойств необходимо добавить аксиомы (ограничения предметной области на совместное использование классов и свойств), например «матч проходит на одном стадионе», «в матче принимают участие ровно две команды».

В качестве примера временных аксиом можно привести следующие: «У каждого футбольного матча ограниченное время: 90 минут», «У каждого матча есть начальный и конечный момент». Длительность матча в нашем случае будет определяться экземпляром класса DurationDescription, который напрямую связан с экземплярами класса Instant: Начало_матча и Конец _матча (рис. 2).

После добавления аксиом необходимо проверить онтологию на согласованность с помощью встроенной в Protégé машины логического вывода.

Для наполнения онтологии следует использовать реальные данные о клубах и о местоположении стадионов в формате RDF.

Для добавления реальных данных о местоположении футбольных стадионов в онтологию воспользуемся географической базой данных GeoNames [3]. GeoNames интегрирует географические данные, такие как имена мест на различных языках, высота, широта, долгота, количество население и другие данные из разных источников. GeoNames содержит более 10 миллионов географических названий и состоит из более чем 2,8 млн населенных пунктов и 5,5 млн альтернативных имен. Все географические единицы классифицируются в один из девяти классов объектов.

В качестве примера при помощи поисковой системы GeoNames найдем информацию о стадионе футбольного клуба «Арсенал», введя ключевое слова «Arsenal» в строку поиска. При выборе одного из найденных результатов сервис переходит на страницу с картой и автоматически

ф footballOntology (http:tfwww.semantlcweb.arg/dmitriy/f оotba 110 nto la gy. d w I)

Active Onto Id <jy Entities Classes Object Properties j^Qata Pro perties j Individuals Class hierarchy Class bk'arohy [hbredj

4D-Fluents Tab OntnGraf

Members list: Начало матча 1

Class hierarchy: Instant

▼ »Thing

У Temporal Entity [1 Instant Interval • Клуб #Матч V Стадион

* Ж

♦ Желтая_карточка_1

♦ Желтая_карточка_2

♦ Конец_матча_1_

♦ Конец_натча_2

♦ Конец_натча_3

♦ Начало матча 1

♦ Начало_матча_2

♦ Начало матча 3

♦ Пенальти 1

Рис. 2. Экземпляры класса Instant

показывает желаемую область. В результате можно скачать информацию о геопозиции искомого объекта в формате RDF. Аналогичным образом необходимо найти информацию о других стадионах. После этого можно приступать к созданию экземпляров классов в Protégé и добавлению найденной пространственной информации в онтологию.

После заполнения информации о стадионах, необходимо внести в онтологию сведения о футбольных клубах. Эту информацию можно найти в различных источниках, в нашем случае будем использовать сервис DBpedia Lite. DBpedia Lite извлекает некоторые структурированные данные из Википедии и представляет их в виде связанных данных. В отличие от DBpedia, этот сервис учитывает проблемы с заголовками статей, которые меняются с течением времени. Это делает его более безопасным для хранения информации. Найденная с помощью этого сервиса

информация сохраняется в формате RDF/XML и затем обычными средствами Protégé добавляется в разрабатываемую онтологию.

После добавления экземпляров классов Клуб и Стадион можно приступать к созданию экземпляров класса Матч. При этом необходимо организовать связь экземпляров класса Матч с экземплярами классов Стадион, Клуб, Instant, Interval за счет использования свойств, которые учитывают следующие особенности предметной области. Для быстрого добавления временных характеристик матча можно использовать плагин 4D-Fluents Тав.

Набор RDF-триплетов (субъект-свойство-объект) для одного экземпляра класса «Матч» представлен на рис. 3.

На заключительном этапе разработки необходимо проверить созданный набор данных на согласованность средствами встроенной в Protégé машины логического вывода, и добавить в репо-

Рис. 3. Набор триплетов для экземпляра класса «Матч»

Query Repository

Query Language: SPARQL

Ci--,:

1 prefix fo: <http:/An™.semantieweb.org/dmitriy/footballûntology.owl#>

2 PREFIX rdfs <http:7/iJWW.w3.org/2009/01/rdf-schema#>

3 PREFIX rdf: <http://wuw.w3. org/1999/B2/22-rdf-synta;i-ns#>

4

5 select ?teaml ?team2 ?penalti 6• where {

7

8 • Bi

10 i 111 12

?match a fo:MaT4 ;

fo:Ha4a;icH_B_ [ ^:начало_матча "2014-06-14T15:00:00"'">xsd:<iateTime] fo:играют_в_гостях [ rdfs:label ?teaml ]; fo:wrpaF0T_Ha_CBoer4_no/ie [ rdfs : label ?team2 ]; fo:6ыл_назначен [ fo:пенальти ?penaltï] .

}

Рис 4. Временной SPAROL-запрос

зиторий (хранилище RDF-триплетов). В результате этого становится возможным осуществлять запросы к данным на языке SPAROL, в том числе и с учетом временных характеристик. Например, на рис. 4 представлен запрос, позволяющий узнать, какие команды играли в матче, который начался 14 июня 2014 года в 15-00.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ЗАКЛЮЧЕНИЕ

Приведенный в работе обзор подходов к семантическому представлению пространственно-временной информации показал, что каждый из них обладает существенными недостатками как с точки зрения избыточности информации, трудоемкости реализации, так и с точки зрения совместимости с языком OWL. Как и большинство проектов семантического веба, «пространственно-временные» модели и инструменты находятся в экспериментальной фазе. Наиболее перспективным, по мнению авторов, является использование стандартизованных онтологий, например OWL-Time в совокупности с инструментами, позволяющими реализовать подход 4D-Fluent. Представляется, что именно этот подход за счет совместимости с языком OWL (а, следовательно, и с другими «слоями» семантического веба), имеет перспективы дальнейшего существования даже при условии появления новых инструментов и проектов. Описанная в статье методика разработки набора связанных данных, основанная на этой идеи, может быть использована преподавателями вузов, студентами, изучающими технологии семантического веба, а также разработчиками приложений по обработке пространственно-временных данных.

СПИСОК ЛИТЕРАТУРЫ

1. Антониоу Г., Грос П., Хармелен ван Ф., Хоекстра Р.

Семантический веб. Учебник. 3-е изд. [перевод с

англ. Т. Шульга]. М.: ДМК Пресс, 2016. 240 с.

3.

4.

7.

JerryR. Hobbs, FengPan. Time Ontology in OWL. URL: http://www.w3.org/TR/owl-time/ (дата обращения 19.09.2016).

Географическая база данных GeoNames. URL: http:// www.geonames.org/ (дата обращения 19.09.2016). C. Stadler, J. Lehmann, K. Hoffner, and S. Auer. Linkedgeodata: A core for a web of spatial open data. Semantic Web Journal, 3(4), 2012. K. Janowicz, S. Schade, A. Broring, C. Keßler, P. Maue, and C. Stasch. Semantic enablement for spatial data infrastructures. Transactions in GIS, 14(2):111-129, 2010.

Гаврилова Т.А., Кудрявцев Д.В., Горовой В.А. Модели и методы формирования онтологий // Научно-технические ведомости Санкт-Петербургского государственного политехнического университета. 2006. № 46. С. 21-28.

Романов С.В., СытникА.А., Шульга Т.Э. О возможностях использования коммуникативных грамматик и LSPL-шаблонов для автоматического построения онтологий//Известия Самарского научного центра Российской академии наук, т. 17, №2(5), 2015. - C.1104-1108.

ДаниловН.А., Шульга Т.Э. Варианты использования онтологии для анализа юзабилити // Информационно-коммуникационные технологии в науке, производстве и образовании ICIT-2016: материалы Международной научно-практической конференции. Саратов. 2016. C.160-167. Вагарина Н.С., Мельникова Н.И. Адаптация зарубежного опыта применения технологий семантического Веб в образовании // Технические науки - от теории к практике: материалы XXIV Междунар. заоч. науч.-практ. конф. Новосибирск, 7 августа 2013 г. Новосибирск, 2013. С. 21-27.

10. О создании инструментов изучения семантического веба / А.А. Сытник, Н.С. Вагарина, Н.И. Мельникова, Т.Э. Шульга, М.Ю. Апсаликов // Вестник СГТУ №3 (80), Саратов: Сарат. гос. техн. ун-т, 2015г., С. 145-150.

11. Официальный сайт редактора онтологий Protege [Электронный ресурс]. URL: http://protege.stanford. edu/ (дата обращения 19.09.2016).

12. Сытник А. А., Шульга Т.Э., Вагарина Н.С., Мельникова Н.И. Основы построения OWL-онтологий с помощью редактора Protégé Desktop 5.0 beta: учебное

9.

пособие. Саратов: Сарат. гос. техн. ун-т.2015. 84 с. 14. Basic Geo (WGS84 lat/long) Vocabulary. URL: 13. DanBrickley. GeoRSS Model. URL: http://www.georss. https://www.w3.org/2003/01/geo/(дата обращения

org/model.html (дата обращения 19.09.2016). 19.09.2016).

MODELS AND TOOLS FOR PRESENTATION SPATIO-TEMPORAL DATA ON THE SEMANTIC WEB

© 2016 T.E. Shulga, N.S.Vagarina, N.I. Melnikova, D.A. Mishenko

Yuri Gagarin State Technical University of Saratov

At the present stage of development of the technologies of the Semantic Web, the most interesting subject is the possibility of their application to represent spatio-temporal data in a variety of thematic areas. For these reasons, issues of geospatial semantics, geo-ontologies and semantic interoperability of data were active areas of research in the past few years. Today, the space-time information is an important part of many key nodes in the Linked Data Web. Despite the importance and relevance of the topic, as well as the active development of semantic technologies, spatio-temporal data does not have a detailed description in the works of Russian scientists, published in Russia. This article discusses the models and tools of the semantic representation of space-time information. The paper proposes a method of developing a set of linked data based on spatial-temporal information in order to develop ontologies in Protege editor. As a subject area there was selected information on football matches, to provide data on the standings in the spatio-temporal context. Keywords: Semantic Web, spatio-temporal data, ontology.

Tatyana Shulga, PhD in Physics and Mathematics, Professor at the Information and Communication Systems and Software Engineering Department. Е-mail: shulga@sstu.ru Natalya Vagarina, PhD in Physics andMathematics, Assosiate Professor of the Information and Communication Systems and Software Engineering Department. Е-mail: v-n-s@yandex.ru Nina Melnikova, PhD in Sociology, Professor at the Information and Communication Systems and Software Engineering Department. Е-mail: melnikovani@gmail.ru Dmitry Mischenko, Graduate Student. Е-mail: mishchenkoda@sstu.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.