Научная статья на тему 'Функции семантической обработки данных космического мониторинга'

Функции семантической обработки данных космического мониторинга Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
143
49
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Функции семантической обработки данных космического мониторинга»

УДК 528.854.4 П.А. Калантаев

ИВМиМГ СО РАН, Новосибирск

ФУНКЦИИ СЕМАНТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ КОСМИЧЕСКОГО МОНИТОРИНГА

1. Введение

Технологические наборы данных ГИС могут рассматриваться как объектно-ориентированная база данных, подчиняющаяся заданным семантическим правилам и записанная в соответствии с заданным синтаксисом. Семантика опирается на то, что любой картографический объект обладает, как пространственно-геометрическими, так и функционально-описательными свойствами. Между объектами могут существовать связи различного типа, позволяющие смоделировать сколь угодно сложную сущность реального мира. С ростом WWW возникает необходимость новых способов организации информации. Новый стандарт Semantic Web [3] улучшает методы поиска, за счет новой структуры запросов геопространственного поиска, основанного на семантике пространственных и терминологических онтологий [3].

2. Определение семантического каталога базы данных

Систематические наблюдения природных явлений (ПЯ) зачастую

представлены разнотипными и несоизмеримыми данными, сопровождаемыми легендами-описаниями в терминах прикладного значения. Легенды-описания данных дают естественную семантическую основу организации БД. Семантика - раздел языкознания и логики, исследующий проблемы, связанные со смыслом, значением и интерпретацией лексических единиц. Соответственно этому классическому определению семантический каталог обеспечивает организацию БД на основе логики, смысла, значения и интерпретации лексических единиц природных явлений.

Семантический каталог базы данных природных явлений - это система выдачи осмысленных ответов на поисковые запросы пользователей [4]. В проекте, на основе клиент-серверной Web-технологии, обеспечиваются три типа запросов к распределённой БД ПЯ: навигационные, пространственные и интеллектуальные. База данных ПЯ может быть закрытой корпоративной, и распределена на Web-серверах как локальной, так и глобальной сети.

Навигационный запрос формируется Web-клиентом в виде строки ключевых слов. В ответ на запрос сервер БД формирует Web-страницу со списком сетевых адресов размещения объектов БД.

Пространственный запрос формируется Web-клиентом в виде строки с адресом и (или) координатами географического объекта. В ответ на запрос сервер БД формирует Web-страницу с изображением карты или аэрокосмического снимка географического объекта.

Интеллектуальный запрос формируется Web-клиентом в виде строки параметров функции обработки данных БД. В ответ на запрос сервер БД формирует Web-страницу с результатами обработки данных ПЯ. Допустим (в проекте), каждый гидрологический пост (Web -клиент) бассейна реки Обь с

заданной периодичностью помещает на центральный Web-сервер показатели наблюдения. С той же периодичностью на сервере ведётся расчет статистических и физических характеристик состояния бассейна Оби, получаемых руководством (Web-клиентами) по запросу к БД. По запросу, с использованием цифровых карт и аэро- космо- снимков, на сервере моделируются 2-х и 3-х мерные сцены текущего состояния бассейна Оби. При этом центральный сервер БД обеспечивает запрос на автоматическое оповещение (по E-mail) руководства о критических ситуациях, выявленных в результате текущего обсчета данных гидрологических постов, предоставляя разнотипные, в том числе мультимедиа, данные о ситуации ПЯ. На лабораторном сервере уже функционирует БД ПЯ первой очереди (http://loi.sscc.ru/DBRL), реализующая навигационные (например, данные по урагану Катрина) и пространственные (например, Web-атлас НСО) запросы (рис. 1).

Рис.1. Web-интерфейс базы данных природных явлений 3. Стандарты описания семантики

Гибкая инфраструктура Internet позволяет легко добавлять новые универсальные услуги, такие как Semantic Web [1], позволяющий описывать семантику ПЯ в соответствии с отечественным стандартом представления пространственных данных, включающих информацию об отношениях объектов. Для проекта Semantic Web разработан метаязык XML (Extensible Markup Language), предназначенный для создания программных приложений обмена данными в Web, а также для cмысловой обработки семантики этих

данных. Semantic Web - новое направление развития платформы XML, основу которого составляет стандарты Resource Definition Framework (RDF) и языка описания Web - онтологий (OWL Web Ontology Language). Язык OWL разработан для приложений содержательной обработки информации. В сравнении с XML, RDF, и RDF Schema (RDF-S), OWL обеспечивает более полную машинную обработку Web -контента. OWL предоставляет наряду с формальной семантикой дополнительный терминологический словарь. В RDF-спецификации объявляется некоторое множество ресурсов, для каждого из которых определяются пары "свойство-значение". Описание семантики свойств в RDF называется RDF-схемой. По сути, RDF-схема позволяет определять онтологию предметной области - природных явлений. Под онтологией понимается "спецификация концептуализации предметной области". Такая спецификация представляет собой своего рода словарь понятий предметной области и совокупность явным образом выраженных предположений относительно смысла этих понятий. Развитые определения онтологий формализуются средствами языков логики первого порядка. Они допускают возможности логического вывода. По проекту, возможности логического вывода разрабатываются для БД ПЯ второй очереди.

4. Геосемантическая Web модель данных

В настоящее время актуальна разработка на основе Internet-стандарта Semantic Web новой модели геопространственных данных (geospatial data). Эта модель должна заменить геореляционную модель данных (georelational data model), применяемой ныне. Недостаток геореляционной модели данных (интегрирующей ГИС и реляционную СУБД) - неприспособленность реляционных таблиц для семантического анализа и полнотекстового поиска в распределённых атрибутивных БД ГИС. Эти задачи легко исполняются средствами объектно-ориентированных баз данных XML. Интеграция ГИС и баз данных XML желательна и возможна. Эффективные функции семантического анализа атрибутивных данных особенно актуальны для реализации пользовательских запросов агрегирования данных сети распределённых ГИС (например, сети центров приёма и обработки ДДЗ в РФ). Условно, ибо термин не устоявшийся, новая модель может быть названа геосемантическая Web модель данных - Geosemantic Web data model [3]. Чтобы реализовать идею организации геоинформации средствами Semantic Web, требуется эффективная распределённая человеко-машинная система, способная не только визуализировать и представлять данные, но также вести смысловую обработку данных несоизмеримых типов. Автоматизация распознавания разнотипных данных требует новой инфраструктуры информационных определений и правил вывода.

5. Заключение

Стратегические перспективы развития платформы XML связаны с созданием семантического Web. Для достижения этой цели необходимо решить большой комплекс сложных научно-технических задач. Одна из этих задач, - моделирование тематических геоданных на основе Semantic Web, с целью информационного обеспечения для фундаментальных исследований в

области наук о Земле. Web поддержка онтологий различных предметных областей геоданных позволяет осуществлять более эффективный поиск требуемой геоинформации в Web и является важным шагом к поддержке семантической интеграции геоинформационных ресурсов и других возможностей управления информационными и программными средствами распределённых ГИС и СУБД природных явлений.

Работа выполнена частично при финансовой поддержке Российского фонда фундаментальных исследований (проект № 07-07-00085).

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. П.А. Калантаев. Семантическая организация пространственных данных. // В сборнике трудов Международной Конференции “ИНТЕРКАРТО - ИНТЕРГИС 11Устойчивое развитие территорий: теория ГИС и практический опыт” 25 сент.-3 окт. 2005 г., Ставрополь-Домбай-Будапешт, изд-во СГУ, 2005 г., с.92-96.

2. А.А. Бучнев, П.А.Калантаев, В.П.Пяткин. Интернет технологии в обработке данных дистанционного зондирования Земли // Труды Международного научного конгресса «ГЕ0-Сибирь-2006», 24-28 апреля 2006, Новосибирск, Россия, т.3, ч.1. «Мониторинг окружающей среды, геоэкология, дистанционные методы зондирования Земли и фотограмметрия», с. 43-51.

3. Berners-Lee, T., Hendler, J., and Lassila, O. (2001) The Semantic Web: A new form of Web content that is meaningful tocomputers will unleash a revolution of new possibilities. The Scientific American 284: 34-43.

4. А. Иванов. Принципы организации семантического каталога / http://mywebsearch.adelite.com/articles/776.html.

© П.А. Калантаев, 2007

i Надоели баннеры? Вы всегда можете отключить рекламу.