Научная статья на тему 'Информационно-вычислительная система для хранения, поиска и аналитической обработки данных по окружающей среде основанная на технологиях semantic Web'

Информационно-вычислительная система для хранения, поиска и аналитической обработки данных по окружающей среде основанная на технологиях semantic Web Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
314
69
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КЛЮЧЕВЫЕ СЛОВА: ИНФОРМАЦИОННЫЕ СИСТЕМЫ / МЕТАДАННЫЕ / ВЕБ-ТЕХНОЛОГИИ / МЕТЕОРОЛОГИЯ / ИЗМЕНЕНИЯ КЛИМАТА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гордов Е. П., Окладников И. Г., Титов А. Г.

Представлена рабочая модель информационно-вычислительной системы для хранения, семантического поиска, а также обработки и визуализации наборов данных по метеорологии, климату и переносу атмосферного загрязнения.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Гордов Е. П., Окладников И. Г., Титов А. Г.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Информационно-вычислительная система для хранения, поиска и аналитической обработки данных по окружающей среде основанная на технологиях semantic Web»

----------------------------- © А.Г. Титов, Е.П. Гордов,

И.Г. Окладников, 2009

УДК 004.9

А.Г. Титов, Е.П. Гордов, И.Г. Окладников

ИНФОРМАЦИОННО-ВЫЧИСЛИТЕЛЬНАЯ СИСТЕМА ДЛЯ ХРАНЕНИЯ, ПОИСКА И АНАЛИТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ ПО ОКРУЖАЮЩЕЙ СРЕДЕ ОСНОВАННАЯ НА ТЕХНОЛОГИЯХ SEMANTIC WEB

Представлена рабочая модель информационно-вычислительной системы для хранения, семантического поиска, а также обработки и визуализации наборов данных по метеорологии, климату и переносу атмосферного загрязнения. Ключевые слова: информационные системы, метаданные, веб-технологии, метеорология, изменения климата.

Для прогноза, моделирования и интерпретации изменений климата активно применяются наборы данных о характеристиках окружающей среды, полученные для разных пространственных и временных масштабов, и сценариев. Существует значительное число доступных в Интернете архивов, содержащих огромное количество данных, полученных в результате измерений или численного моделирования характеристик атмосферы и окружающей среды. Эти данные различаются по способу получения, физическому размещению и доступу, а также по формату файлов, в которых они хранятся. Нередко программное обеспечение для обработки данных используемое в одной организации является несовместимым с программным обеспечением, используемым в других научных организациях. Все это не только затрудняет обмен данными и результатами, но также усложняет возможность их сравнения, что уменьшает достоверность выполняемого на этой основе анализа. В результате обработка, сравнение и визуализация данных, полученных от разных источников или организаций, становится достаточно трудоемкой задачей, а комплексное практическое применение полученных результатов становится практически невозможным.

С нашей точки зрения, для поддержки всего набора исследований, выполняемых при всестороннем исследовании окружающей среды, необходимо создание соответствующей информационновычислительной инфраструктуры, существенным образом использующей возможности Интернета [1, 2].

1. Современное состояние проблемы.

На сегодняшний день существует несколько информационных веб-систем, посвященных обработке пространственно распределенных геофизических данных. Одна из них — это GES-DISC (Goddard Earth Sciences Data and Information Services Center) Interactive Online Visualization ANd aNalysis Infrastructure (GIOVANNI, http://disc.sci.gsfc.nasa.gov/giovanni/). Она разрабо-тана в NASA и предназначена для организации доступа к проце-дурам обработки данных. Еще одна система обработки данных разработанна в Институте вычислительной математики РАН

(http://ksv.inm.ras.ru/GCM_DATA_PLOTTING/GCM_INM_DATA.ht ml). Она обеспечивает визуализацию полученных в ИВМ РАН результатов моделирования для различных климатических сценариев, полученных на основе совместной модели общей циркуляции атмосферы и океана. Система "Climate explorer", разработанная в Королевском метеорологическом институте Голландии (KNMI, http://climexp.knmi.nl/), имеет в своем рас-поряжении большое количество разнообразных исторических данных наблюдений, реанализа, климатических индексов, ре-зультатов моделирования и сезонных прогнозов погоды. Одна-ко, несмотря на ряд сделанных попыток в области инфор-матизации наук о Земле, по-прежнему нет мощного инстру-мента, обладающего унифицированным вебинтерфейсом и объеди-няющего широкие возможности по обработке, анализу и ви-зуализации пространственно распределенных наборов данных, полученных из различных источников, для интегрированного исследования глобальных и региональных изменений климата.

2. Описание информационно-вычислительной системы

Разработанная информационно-вычислительная система имеет набор стандартных программных инструментов для обработки и визуализации собранных данных. Доступ к ней организован через веб портал RISKS (http://climate.risks.scert.ru /reanalysis/). В ходе работы были собраны архивные метеорологические данные разного происхождения, из различных источников, проведена их систематизация, преобразование к унифицированному формату и организация в виде некоторой структуры, хранящейся на носителях большого объема мощной вычислительной платформы. Система предоставляет возможность не только для визуализации архивных данных, но и для исследования тенденций изменения глобальных и региональных характеристик окружающей среды и климата в ре-

зультате природных и антропогенных процессов. Структурно информационно-вычислительная система состоит из трех частей: набора метеорологических данных, вычислительного ядра и графического интерфейса пользователя. На данный момент в системе используются данные американских реанализов NCEP/NCAR первой и второй редакции, реанализ Японского метеорологического агентства JMA/CRIEPI JRA-25 и реанализ Европейского центра среднесрочных прогнозов ECMWF ERA-40. Метеоданные в структурированном виде хранятся на сервере и доступны только для обработки системой. Пользователь не имеет непосредственного доступа к данным и не может скачать их, однако свободно может получить результаты графического отображения, как данных, так и результатов их обработки. Вычислительное ядро системы представляет собой набор модулей, подключаемых с помощью PHP и выполняемых системой GrADS. По окончании расчетов производится вывод результатов в графический файл, который в дальнейшем передается в ядро системы для отображения на веб-странице. Графический интерфейс разработан на базе ядра веб-портала ATMOS с использованием языков HTML, PHP и Java, и представляет собой динамическую форму для ввода параметров расчета и визуализации.

Система [3] позволяет выполнять ряд ключевых для оценки климата математических и статистических операций рассчи-тывать 12 индексов изменения климата, выработанные Комиссией по климатологии и Экспертной группой по обнаружению изменений климата и индексам.

Заключение.

Разработанная система является частью создаваемого комплекса программ для обработки и визуализации данных об окружающей среде для исследовательских нужд. Она будет использована при создании распределенной информационновычислительной инфраструктуры, поддерживающей интегрированное исследование состояния и динамики окружающей среды Сибири, и ее взаимосвязей с современными глобальными процессами [4]. Доступность системы в Интернете и возможность работы с данными без использования специальных знаний в программировании должна позволить широкому кругу ученых сконцентрироваться на решении конкретных задач, а также обеспечить гарантии достоверности получаемых результатов.

Работа выполнена при частичной поддержке Программы фундаментальных исследований СО РАН 4.5.2 и интеграционных проектов СО РАН № 4, 50 и 66.

------------------------------------------- СПИСОК ЛИТЕРАТУРЫ

1. Abel, D.J. Towards integrated geographical information processing. Int. J. Geographical Information Science, 1998, V. 12, p.353-371.

2. Гордов Е.П., Лыкосов В.Н. Развитие информационно-вычислительной инфраструктуры для интегрированного регионального исследования окружающей среды Сибири // Выч. технологии, 2007, т. 12, с. 19-30.

3. Окладников И.Г., Титов А.Г. Веб-система для обработки и визуализации метеорологических данных. // Измерения, моделирование и информационные системы для изучения окружающей среды / Под общ. ред. проф. Е.П. Гордова. -Томск: Изд-во Томского ЦНТИ, 2006, с. 42 - 44.

4. Gordov E.P., Begni G., Heiman M, Kabanov M.V., Lykossov V.N., Shvidenko A.Z., Vaganov E.A. Integrated regional study as a basis for international scientific cooperation. //Выч. технологии, 2006, Т. 11, Спец. выпуск 1, с.16-28. шгЛ

TitovA.G., GordovE.P., OkladnikovI.G.

INFORMATION-COMPUTATIONAL SYSTEM FOR STORAGE,

SEARCH AND ANALYTICAL PROCESSING OF ENVIRONMENTAL

DATASETS BASED ON THE SEMANTIC WEB TECHNOLOGIES

The working model of the software system for storage, semantically-enabled search and retrieval along with processing and visualization of environmental datasets containing results of meteorological and air pollution observations and mathematical climate modeling is presented.

Key words: information systems, metadata, semantic web, meteorology, climate change.

— Коротко об авторах ---------------------------------------------------

Гордов Евгений Петрович - доктор физико-математических наук, главный научный сотрудник, профессор, E-mail: gordov@scert.ru Окладников Игорь Георгиевич - кандидат технических наук, старший научный сотрудник, E-mail: oig@scert.ru

Титов Александр Георгиевич — младший научный сотрудник, Email: titov@scert.ru

Институт мониторинга климатических и экологических систем Сибирского отделения РАН (ИМКЭС СО РАН), г. Томск.

i Надоели баннеры? Вы всегда можете отключить рекламу.