Научная статья на тему 'Разработка интерактивной базы знаний о Каспийском регионе в рамках проекта Европейского научного сотрудничества CaspInfo'

Разработка интерактивной базы знаний о Каспийском регионе в рамках проекта Европейского научного сотрудничества CaspInfo Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
118
25
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПРЕДЕЛЕННЫЕ БАЗЫ ДАННЫХ / БАЗА ЗНАНИЙ / WWW-СЕРВИС / ВЕБ-БРАУЗЕР / МЕТАДАННЫЕ / ИНТЕРАКТИВНЫЕ ТЕХНОЛОГИИ / ПРОЕКТ CASPINFO / DISTRIBUTED DATABASES / KNOWLEDGE BASE / WEB-SERVICE / WEB-BROWSER / METADATA / INTERACTIVE TECHNOLOGIES / THE CASPINFO PROJECT

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Лурье И. К., Аляутдинов А. Р., Калинкин И. В., Семин В. Н.

В статье представлена методика разработки интерактивной базы знаний о Каспийском регионе как составной части международного информационного сервиса CaspInfo. Ее основная задача обеспечение интерактивного доступа как к создаваемым в рамках проекта базам данных, так и к уже существующим европейскими базами метаданных, включая процедуры накопления и обмена современной достоверной информацией. Отличительные особенности разрабатываемой базы знаний широкое использование открытых сетевых технологий и оригинальный интерфейс пользователя, предоставляющий возможности поиска информации научной, библиографической, социально-экономической и картографической. Система управления этими информационными ресурсами реализована в виде WWW-сервиса базы знаний о Каспийском регионе.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Лурье И. К., Аляутдинов А. Р., Калинкин И. В., Семин В. Н.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ELABORATION OF AN INTERACTIVE KNOWLEDGE BASE OF THE CASPIAN REGION WITHIN THE CASPINFO EUROPEAN SCIENTIFIC COLLABORATIVE PROJECT

The natural heritage of the unique Caspian region belongs to five coastal states, i.e. Azerbaijan, Kazakhstan, Iran, Russia and Turkmenistan. Assessment, monitoring and conservation of the unique ecosystem of the Caspian region require the development of technologies and tools for acquisition, structuring, storage and use of the large amounts of information (scientific, legal, administrative, natural and anthropogenic spatial data). The article deals with the elaboration of a management system for information resources of a specialized web-service, i.e. the knowledge base of the Caspian region.

Текст научной работы на тему «Разработка интерактивной базы знаний о Каспийском регионе в рамках проекта Европейского научного сотрудничества CaspInfo»

УДК 001.4.:528.91:528.8:681.3

И.К. Лурье1, А.Р. Аляутдинов2, И.В. Калинкин3, В.Н. Семин4

РАЗРАБОТКА ИНТЕРАКТИВНОЙ БАЗЫ ЗНАНИЙ О КАСПИЙСКОМ РЕГИОНЕ В РАМКАХ ПРОЕКТА ЕВРОПЕЙСКОГО НАУЧНОГО СОТРУДНИЧЕСТВА CASPINFO5

В статье представлена методика разработки интерактивной базы знаний о Каспийском регионе как составной части международного информационного сервиса CaspInfo. Ее основная задача — обеспечение интерактивного доступа как к создаваемым в рамках проекта базам данных, так и к уже существующим европейскими базами метаданных, включая процедуры накопления и обмена современной достоверной информацией. Отличительные особенности разрабатываемой базы знаний — широкое использование открытых сетевых технологий и оригинальный интерфейс пользователя, предоставляющий возможности поиска информации — научной, библиографической, социально-экономической и картографической. Система управления этими информационными ресурсами реализована в виде WWW-сервиса — базы знаний о Каспийском регионе.

Ключевые слова: распределенные базы данных, база знаний, WWW-сервис, веб-браузер, метаданные, интерактивные технологии, проект CaspInfo.

Введение. Природным наследием уникального прикаспийского региона владеют пять прибрежных стран — Азербайджан, Казахстан, Иран, Россия и Туркменистан. Несмотря на политические и социальные различия, ученые и жители региона разделяют общую обеспокоенность состоянием Каспийского моря и прибрежных территорий. Решение задач оценки, мониторинга и в конечном итоге общей проблемы сохранения уникальной экосистемы прикаспийского региона связано с разработкой средств и технологий сбора, структуризации, хранения и использования больших объемов информации — научной, законодательной, правовой и административной, пространственно определенной природной и антропогенной. Разработка системы управления информационными ресурсами на основе специально создаваемого WWW-сервиса — базы знаний о Каспийском регионе — значимый вклад в решение перечисленных проблем..

Задачи исследования. В настоящее время в Каспийском регионе остро стоят экологические проблемы, многие из которых носят трансграничный характер и определяются как антропогенным воздействием на экосистему, так и естественными причинами. В прибрежных странах накоплены многолетний практический опыт и огромный объем научной информации, которые пригодны для решения проблем экологического и социального характера. Национальные приоритеты в области охраны окружающей среды, в

научных исследованиях, мониторинге и сборе научных данных в целом схожи. Однако отсутствие единого экологического законодательства, противоречивые правовые и административные акты разных стран усложняют совместное регулирование деятельности в области природопользования и защиты окружающей среды. Для решения этой задачи необходимо создание информационной модели, связывающей науку, законодательство, промышленность и бизнес-структуры. К важным элементам при использовании такой модели относятся наличие, доступность и достоверность информации об окружающей среде, в том числе о морской и промышленной деятельности, а также регламентирующих актов, действующих в рамках современного законодательства разных стран.

Реализовать такую модель можно путем разработки и внедрения информационного сервиса международного проекта CaspInfo (Caspian Sea Environmental And Industrial Data & Information Service, http:// www.caspinfo.net). Сотрудниками географического факультета МГУ имени М.В. Ломоносова в рамках международного сотрудничества уже с 2008 г. ведутся работы по проекту CaspInfo, который входит в 7-ю рамочную программу Европейского союза и представлен 19 участниками из разных стран. Основная идея проекта CaspInfo близка к разработкам крупнейших европейских научно-исследовательских проектов SeaDataNet и SIMORG (http://www.seadatanet.org),

1 Московский государственный университет имени М.В. Ломоносова, географический факультет, кафедра картографии и геоинформатики, заведующая кафедрой, профессор, e-mail: lurie@mail.ru

2 Московский государственный университет имени М.В. Ломоносова, географический факультет, кафедра картографии и геоинформатики, науч. с., e-mail: alik@geogr.msu.ru

3 Московский государственный университет имени М.В. Ломоносова, географический факультет, научно-исследовательская лаборатория комплексного картографирования, науч. с., e-mail: ikl@geogr.msu.ru

4 Московский государственный университет имени М.В. Ломоносова, географический факультет, кафедра картографии и геоинформатики, науч. с., e-mail: vnsemm@mail.rn

5 Работа выполнена при поддержке РФФИ (проект №08-05-00126-а), гранта «Программы поддержки ведущих научных школ» (НШ-3405.2010.5), Минобрнауки РФ (ГК № 14.740.11.0200) и проекта CaspInfo Комиссии Евросоюза.

основными задачами которых являются совместимость и унификация международных и европейских стандартов метаданных, обеспечение доступа к распределенным базам морских и экологических данных. Данные предоставляются профессиональными национальными центрами сбора информации — составляющими общеевропейской сети по обеспечению онлайнового доступа к базам данных.

К основным целями проекта CaspInfo относятся:

— инициация и поддержка специальной части интернета в Каспийском регионе, соединяющей ведущие научно-исследовательские институты, органы государственного управления, представителей нефтегазовой промышленности и других структур, заинтересованных в совместном создании и использовании информационного сервиса CaspInfo;

— разработка и создание сетевой информационной службы CaspInfo для облегчения доступа к социально-экономической и правовой информации, а также к метаданным распределенных баз данных, управляемых региональными партнерами;

— исследование и разработка устойчивой модели применения информационного сервиса CaspInfo в различных целях, в том числе для поддержки принятия решения, учитывая требования всех заинтересованных сторон.

Таким образом, в рамках проекта CaspInfo в интернете будет создана новая тематически направленная поисковая система, базирующаяся на данных и знаниях о каспийском регионе и интерактивно доступная пользователям разного уровня.

Разработка интерактивной базы знаний о Каспийском регионе — составная часть создания информационного сервиса CaspInfo. Ее основная задача — обеспечение интерактивного доступа как к создаваемым в рамках проекта базам данных, так и к уже существующим европейскими базами метаданных, включая процедуры обмена и накопления современной достоверной информацией. Среди европейских используются следующие каталоги:

1) EDMO (European Directory Marine Organizations) — Европейский каталог морских организаций. Каталог содержит адресную информацию и информацию о профильности научно-исследовательских институтов, научных центров, контролирующих органов, государственных и частных организаций, которые в той или иной форме участвуют в океанографических и морских научных исследованиях. В настоящее время в каталоге имеется информация более чем о 1500 организациях (http://www.seadatanet. org/metadata/edmo);

2) EDMERP (European Directory Marine and Environmental Research Projects) — Европейский каталог морских и экологических исследовательских проектов. Каталог включает около 2000 научно-исследовательских проектов по широкому спектру научных дисциплин: физическая, химическая и биологическая океанография, морская метеороло-

гия, морская биология и рыбное хозяйство, оценка окружающей среды, исследование прибрежных и устьевых процессов и др. Научно-исследовательские проекты характеризуются как наборы метаданных с указанием наиболее значимых аспектов исследования (http://www.seadatanet.org/metadata/edmerp);

3) EDMED (European Directory Marine and Environmental Datasets) — Европейский каталог морских и экологических данных. В настоящее время этот каталог описывает более чем 3500 наборов данных из 700 различных организаций в Европе. Наборы данных описаны в каталоге независимо от их исходного формата: это и цифровые данные, и бумажные карты, фотографии и видеоматериалы, геологические пробы и биологические экземпляры (http://www.seadatanet. org/metadata/edmed).

Существует множество других проектов, в том числе международных, которые обладают большим объемом информации научного, социально-экономического, законодательного характера. К таким проектам можно отнести Каспийскую международную программу (CEP) (http://www.caspianenvironment. org), EDIOS (European Directory of the Ocean-observing System), CSR (Cruise Summary Report) (http://www. seadatanet.org/metadata/csr) и ряд других. Отработанная технология на основе веб-сервисов позволяет включать и использовать информацию практически из любых центров сбора научной и иной информации при соблюдении соответствующих правовых норм. Поэтому создаваемые в рамках проекта CaspInfo локальные базы метаданных, совместимые с существующими базами EDMO, EDMERP и EDMED, обеспечивают реальную возможность построения полнофункциональной информационной базы знаний о Каспийском регионе.

Достоинство разрабатываемой базы знаний — широкое использование открытых сетевых технологий и оригинальный интерфейс пользователя, предоставляющий уникальные возможности поиска информации, в том числе картографической. Осуществляя доступ через интернет и используя стандартные программы веб-браузеры (например, Internet Explorer), не требующие установки дополнительного программного обеспечения, пользователи из разных стран будут иметь возможность не только осуществлять быстрый поиск необходимой тематической информации, но и заносить в базу свою информацию, формируя таким образом информационное пространство Каспийского региона.

Методы и технологии. Ценность географической информации, особенно востребованной в системах поддержки принятия решений (СППР), увеличивается по мере привлечения технологий и программных средств формирования баз знаний. В компьютере знания так же, как и данные, отображаются в знаковой форме — в виде формул, текста, файлов, информационных массивов и т.п. Поэтому можно сказать, что знания — это особым образом организованные

Рис. 1. Общая структура базы знаний

данные. База знаний наравне с базой данных — необходимая составляющая СППР [7, 8].

Создание интерактивной базы знаний о Каспийском регионе предусматривает решение двух задач:

— разработка структуры и содержания интерактивной базы знаний о регионе, отражающей научную, библиографическую, социально-экономическую и картографическую информацию;

— разработка и создание интерактивной системы управления информационными ресурсами (содержимым базы знаний) специально создаваемого WWW-сервера проекта CaspInfo, которая обеспечивает обмен и накопление информации в каталогах метаданных.

Интерактивная база знаний структурно организована в четыре отдельные базы данных (каталоги метаданных): «Ученые», «Библиография»,

«Социально-экономические данные», «Картографические материалы», встроенные в структуру CaspInfo (рис. 1).

При разработке баз данных основной упор был сделан на полноту информации, интерактивность доступа к базам данных, удобство при занесении информации, легкость поиска необходимой информации. Часть этих задач реализована посредством разработки пользовательского интерфейса, другая часть — посредством разработки оригинального программного обеспечения — веб-приложения.

База метаданных «Ученые» содержит информацию об исследователях, в сферу научных интересов которых входит Каспийский регион. Эта база позволяет найти контактную информацию об исследователе, название его организации, научные проекты, в которых он принимал участие. Так как раздел о персональной информации имеет открытый доступ, то любой исследователь, заинтересованный в установлении научных контактов, имеет право включить себя в базу данных.

База метаданных «Публикации» — каталог научных статей, монографий и других опубликованных источников (рис. 2). Эта база позволяет найти научные публикации различной тематики, связанные с Каспийским регионом, и дает возможность пользователю внести информацию о своей публикации.

База метаданных «Социально-экономические данные» представляет собой структурированный каталог социально-экономических данных, организованный в виде набора отдельных файлов. Содержащаяся в них информация может представлять интерес не только для ученых или специалистов в различных областях производства, но и для любого пользователя, живущего в Каспийском регионе, или использована

Рис. 2. Фрагмент веб-интерфейса базы метаданных «Библиография» (левая часть — критерии поиска, правая часть — результаты)

в образовательных целях, так как тематически в этой базе данных может быть представлена самая разносторонняя информация.

База метаданных «Картографические материалы» содержит информацию о разнообразных картографических материалах, характеризующих Каспийский регион. В качестве исходной информации в этом каталоге метаданных могут выступать и опубликованные карты, и материалы дистанционного зондирования, и авторские оригиналы, схемы и прочие картографические материалы. Помимо поиска и ввода текстовых метаданных о картографических материалах, а также для большей наглядности в системе предусмотрена возможность загрузки эскизов картографических материалов (рис. 3).

Технологически реализация баз данных осуществлялась следующим образом. Для каждого класса логических объектов («Ученые», «Библиография», «Социально-экономические данные», «Картографические материалы») база данных использует основную таблицу. Каждая запись в этой таблице соответствует единственному логическому объекту и включает уникальный цифровой идентификатор объекта. В полях основной таблицы хранятся скалярные атрибуты логического объекта, такие, как текст, дата, и нумерованные атрибуты, представляемые в виде списка ключевых кодов. Для работы с нумерованными атрибутами базы данных содержат справочные таблицы описания таких кодов. Так, служебная справочная таблица «Страна», основанная на международном стандарте ISO 3166 numeric (http:// www.iso.org/iso/country_codes), описывает кодовые обозначения государств и зависимых территорий, а также основных административных образований внутри государств (таблица).

Необходимо отметить, что при разработке структур баз метаданных «Библиография», «Социально-экономические данные», «Картографические ма-

Рис. 3. Пример визуализации базы метаданных «Картографические материалы» (левая часть — критерии поиска, правая часть — результаты)

Пример таблицы «Страна», основанной на стандарте ISO 3166-1 numeric

Численный код страны 3-буквенный код страны 2-буквенный код страны Страна

036 AUS AU Австралия

112 BLR BY Белоруссия

643 RUS RU Россия

840 USA US США

териалы» учитывалась спецификация стандарта метаданных Dublin Core (http://www.dublincore. org) — простого и эффективного набора для описания широчайшего диапазона сетевых ресурсов. Этот стандарт разработан международной междисциплинарной группой профессионалов библиотечного дела, компьютерных наук, музейного дела и прочих смежных наук.

Оригинальная технология перекрестного поиска в таблицах всех баз данных, задаваемого текстовой строкой, дает возможность получить информацию четырьмя способами:

1) свободный поиск для символов всей строки во всех полях всех таблиц;

2) поиск по названию организации, ее идентификатору или электронному адресу;

3) поиск по названию проекта или идентификатору;

4) поиск по ФИО или электронному адресу.

С точки зрения функциональности интерактивная база данных предоставляет пользователям в режиме реального времени следующие сервисы: визуализация баз метаданных, поиск — фильтрация — сортировка необходимой информации; визуализация детальной информации о выбранном объекте; занесение информации об объектах с использованием системы управления содержимым базы данных. Для базы «Картографические материалы» предусмотрен специфический сервис отображения эскиза картографического источника посредством реализации технологии WMS (Web Map Service), а для базы «Социально-экономические данные» обеспечена возможность сохранять необходимую информацию на локальном диске пользователя.

Создание интерактивной системы управления содержимым базы знаний о Каспийском регионе — основная и наиболее трудоемкая задача выполненных разработок. Она включает прежде всего разработку системы пользовательского интерфейса — специального программного веб-приложения для обеспечения пользователей средствами запроса информации, имеющей отношение к Каспийскому морю, для ее обновления и редактирования в разных базах метаданных, размещенных на веб-портале CaspInfo (рис. 1), для облегчения доступа к метаданным и распределенным наборам данных, управляемым региональными партнерами. Эти приложения разрабатываются с использованием новейших веб-технологий архитектуры «клиент— сервер», обеспечивающих простое и относительно дешевое решение проблемы коллективного доступа к базам данных в сетях [7, 8]. Методология создания приложений базируется на использовании стандарта открытых ГИС — OpenGIS (OGC). В основе концепции открытых систем лежит упрощение комплексирования вычислительных систем за счет

международной и национальной стандартизации аппаратных и программных интерфейсов. Для оптимизации времени запроса при создании графического интерфейса использовано распространенное в свободном доступе веб-приложение MapServer.

Разработанное веб-приложение состоит из северной и клиентской частей. Для предоставления услуг по размещению информации для серверной стороны и для обслуживания других веб-сервисов используется один из серверов IOC-IODC (International Oceanographic Data Center, электронный адрес: http://193.191.134.20/caspinfo/).

Клиентская часть приложения реализуется как набор HTML-страниц с использованием языков JavaScript и HTML, что позволит рядовым пользователям работать с сервером CaspInfo с помощью сетевых браузеров Internet Explorer или FireFox/ Mozilla (ver.3).

Интерфейс поиска обеспечит пользователей средствами выбора критериев поиска для каждого поля указанных выше баз данных. Если таблица или связанные таблицы имеют пространственный компонент, пользователь будет иметь возможность использовать карту для формирования критерия «Пространственный запрос» (Spatial query). Чтобы задать критерии выбора, пользователь должен или щелкнуть мышкой на карте и тянуть прямоугольник, или ввести значения и диапазоны широт и долгот. Только записи, попавшие полностью или частично в заданный прямоугольник, будут включены в результат поиска. Результаты поиска могут быть представлены в двух формах — табличной и, если возможно, на карте.

Использование веб-приложения MapServer позволяет добавить ГИС-функциональность к поисковой системе. В качестве базовых слоев используются слои OpenLayers Library (http://www.openlayers.org), реализованные посредством технологии WMS. Этот же сервис реализован для базы метаданных «Картографические материалы» для отображения эскиза картографического источника.

Заключение. Разработанные базы метаданных «Ученые», «Библиография», «Социально-экономические данные», «Картографические материалы» совместно с созданной интерактивной системой управления служат главными модулями базы знаний о Каспийском регионе, а в целом представляют собой составную часть информационного сервиса CaspInfo. Эти разработки позволяют обеспечить интерактивный поиск и визуализацию данных, в том числе картографическую, а также интеграцию с международными онлайновыми системами доступа к базам данных о Каспийском регионе. Пилотный проект базы знаний представлен на сайте http://193.191.134.20/caspinfo/

СПИСОК ЛИТЕРАТУРЫ

1. Веб-портал проекта CASPINFO. URL: http://www. caspinfo.net (дата обращения: 01.08.2010).

2. Веб-портал проекта SeaDataNet (Pan-European Infrastructure for Ocean and Marine Data Management). URL: http://www.seadatanet.org (дата обращения: 01.08.2010).

3. Веб-портал Каспийской международной программы. URL: http://www.caspianenvironment.org (дата обращения: 01.08.2010).

4. Веб-портал Международной организации по стандартам. URL: http://www.iso.org/iso/country_codes (дата обращения: 01.08.2010).

5. Веб-портал проекта Dublin Core MetaData Initiative (Разработчики структур метаданных для широкого спектра

применения). URL: http://www.dublincore.org (дата обращения: 01.08.2010).

6. Веб-портал OpenLayers — JavaScript (библиотека открытого кода для визуализации картографических материалов в Интернете). URL: http://www.openlayers.org (дата обращения: 01.08.2010).

7. Геоинформатика: Учебник: В 2 кн. / Под ред. В.С. Тикунова. М.: Академия, 2010.

8. Лурье И.К. Геоинформационное картографирование. Методы геоинформатики и цифровой обработки космических снимков: Учебник. М.: Изд-во КДУ, 2010.

Поступила в редакцию 09.08.2010

I.K. Lurie, A.R. Alyautdinov, I.V. Kalinkin, V.N. Semin

ELABORATION OF AN INTERACTIVE KNOWLEDGE BASE OF THE CASPIAN REGION WITHIN THE CASPINFO EUROPEAN SCIENTIFIC COLLABORATIVE PROJECT

The natural heritage of the unique Caspian region belongs to five coastal states, i.e. Azerbaijan, Kazakhstan, Iran, Russia and Turkmenistan. Assessment, monitoring and conservation of the unique ecosystem of the Caspian region require the development of technologies and tools for acquisition, structuring, storage and use of the large amounts of information (scientific, legal, administrative, natural and anthropogenic spatial data). The article deals with the elaboration of a management system for information resources of a specialized web-service, i.e. the knowledge base of the Caspian region.

Key words: distributed databases, knowledge base, web-service, web-browser, metadata, interactive technologies, the CaspInfo project.

i Надоели баннеры? Вы всегда можете отключить рекламу.