Научная статья на тему 'Информационная система проекта «Электронная Сибирь»: сервисы управления данными'

Информационная система проекта «Электронная Сибирь»: сервисы управления данными Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1560
138
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
Z39.50 / ГЕОГРАФИЧЕСКАЯ ПРИВЯЗКА ИНФОРМАЦИОННЫХ РЕСУРСОВ / ЦИФРОВЫЕ РЕПОЗИТОРИИ / DSPACE / GEOGRAPHICAL BINDING OF INFORMATION RESOURCES / DIGITAL REPOSITORIES

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Жижимов Олег Львович, Амельченко Светлана Алексеевна

Описана структура программного комплекса проекта «Электронная Сибирь», выполняемого в Новосибирской государственной областной научной библиотеке в рамках Президентской программы. Комплекс состоит из ряда серверов, реализующих требуемую функциональность. Обсуждается интероперабельность созданной информационной системы. Отдельное внимание уделено географической привязке информационных ресурсов. Приведены пользовательские и административные графические интерфейсы для доступа к географическому аспекту информации.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Жижимов Олег Львович, Амельченко Светлана Алексеевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Information system of the project «Electronic Siberia»: data control services

The structure of a program complex of the project “Electronic Siberia” carried out in Novosibirsk regional scientific library within the framework of the Presidential program is described in this article. The complex consists of number of the servers providing demanded functionality. The interoperability of the created information system is discussed. Special attention is given to geographical reference of information resources. User and administrative graphic interfaces for access to geographical aspect of the information are presented.

Текст научной работы на тему «Информационная система проекта «Электронная Сибирь»: сервисы управления данными»

Вестник ДВО РАН. 2012. № 2

УДК 004

О.Л.ЖИЖИМОВ, С.А.АМЕЛЬЧЕНКО

Информационная система проекта «Электронная Сибирь»: сервисы управления данными

Описана структура программного комплекса проекта «Электронная Сибирь», выполняемого в Новосибирской государственной областной научной библиотеке в рамках Президентской программы. Комплекс состоит из ряда серверов, реализующих требуемую функциональность. Обсуждается интероперабельность созданной информационной системы. Отдельное внимание уделено географической привязке информационных ресурсов. Приведены пользовательские и административные графические интерфейсы для доступа к географическому аспекту информации.

Ключевые слова: DSpace; Z39.50, географическая привязка информационных ресурсов; цифровые репози-тории.

Information system of the project «Electronic Siberia»: data control services. O.L.ZHIZHIMOV (Institute of Computing Technologies, SB RAS, Novosibirsk), S.A.AMELCHENKO (Novosibirsk State Regional Scientific Library).

The .structure of a program complex of the project "Electronic Siberia" carried out in Novosibirsk regional scientific library within the framework of the Presidential program is described in this article. The complex consists of number of the servers providing demanded functionality. The interoperability of the created information system is discussed. Special attention is given to geographical reference of information resources. User and administrative graphic interfaces for access to geographical aspect of the information are presented.

Key words: DSpace; Z39.50, geographical binding of information resources; digital repositories.

Проект «Электронная Сибирь», выполняемый в Новосибирской государственной областной научной библиотеке (НГОНБ) в рамках Президентской программы по поддержке творческих проектов общенационального значения в области культуры и искусства (грант № 182-pn) направлен на интеграцию электронных краеведческих ресурсов Сибири для повышения эффективности их использования в научных, образовательных и культурных целях. В ходе выполнения проекта отработана модель взаимодействия и скоординирована деятельность участников по оцифровке сибирских изданий и предоставлению доступа к информационным ресурсам. На первом этапе в проекте задействованы четыре центральные библиотеки - Кемеровской, Новосибирской, Томской областей и Алтайского края. Каждая из них является создателем, держателем и распространителем своей части электронной библиотеки и сохраняет за собой право самостоятельно определять политику, темпы, специфику перевода своих фондов в цифровой формат.

В настоящей работе описана структура программного комплекса, обеспечивающего работу создаваемой в рамках проекта электронной библиотеки.

*ЖИЖИМОВ Олег Львович - доктор технических наук, заведующий лабораторией (Институт вычислительных технологий СО РАН, Новосибирск), АМЕЛЬЧЕНКО Светлана Алексеевна - заместитель директора (Новосибирская государственная областная научная библиотека). *Е-таП: zhizhim@sbras.ru

Работа частично поддержана грантом РФФИ № 10-07-00302а.

По материалам 1-й научно-практической конференции «Новые информационно-библиотечные технологии в науке и образовании», проведенной 12-16 сентября 2011 г. Дальневосточным федеральным университетом и Центральной научной библиотекой ДВО РАН.

При выборе архитектуры и структуры программного комплекса учтены определенные требования, а именно возможность:

работы (загрузка, каталогизация, хранение, поиск) информационных ресурсов различного типа (полные тексты, изображения, аудио- и видеоинформация; и др.);

пользовательского и административного доступа к информационным ресурсам через веб-интерфейсы;

модернизации внешнего вида веб-интерфейсов;

авторизованной работы с электронной библиотекой (информационной системой); аутентификации пользователей во внешних системах, например на основе LDAP; интеграции информационной системы проекта с другими информационными системами на основе открытых спецификаций и протоколов;

пакетной загрузки и выгрузки информации в распространенных схемах и форматах; группировки информации по иерархическим коллекциям; поддержки поиска по метаданным и полным текстам;

поддержки географического аспекта информации в части каталогизации и поиска на основе географических координат геометрических объектов;

расширения схем метаданных, используемых для описания информационных ресурсов; использования преимущественно свободно распространяемого программного обеспечения.

Исходя из этих требований, а также из опыта построения аналогичных по функциональности информационных систем [1, 3, 5] определена следующая структура программного комплекса (рис. 1).

В качестве основной СУБД, хранящей и обрабатывающей служебную и пользовательскую информацию, выбрана PostgreSQL. Это обусловлено хорошей функциональностью и быстродействием системы, а также возможностью ее функционирования на разных программно-аппаратных платформах. Немаловажным аргументом явилось наличие в PostgreSQL механизмов обработки географической информации, представленной в количественном виде на основе описания простых геометрических объектов (точка, линия, прямоугольник, полигон и др.) [4].

Основой системы управления контентом служит DSpace [11] (рис. 2). Это Java веб-приложение, которое может функционировать в среде любого сервера приложений, например свободно распространяемого Apache Tomcat, как это сделано в проекте «Электронная Сибирь». Система DSpace обладает широкими возможностями в области управления цифровым контентом и практически полностью удовлетворяет приведенным выше требованиям: свободная распространяемость и широкая распространенность, открытый код, работа с разнородными ресурсами, интеграция с LDAP, поддержка протоколов OAI для обмена данными с другими системами, поиск по метаданным и полным текстам и др.

К недостаткам первоначальной DSpace можно отнести отсутствие интерфейсов доступа к данным Z39.50 [8], SRW/SRU, возможности работы (каталогизация, поиск, навигация) с географическими объектами. Учитывая, что DSpace широко используется для создания

Рис. 1. Структура серверного программного обеспечения информационной системы

F 45 Главная страница ре...

С ft Oelib.ngonb.ru/jspui/community-list

& im m *

Hi-TGch@Mail.Ru

•В C^PpCBRIPjj... (à HceocMgjfAail.Ru Погода@МаНЯ|

m

ЭЛЕКТРОННАЯ

СИБИРЬ

© Главная страница Просмотр

и коллекции © Дата выпуска © АЕ © За © Кл

Зар

© Of

©

© ЕЁ

©

© Q.

Гл^ем^я страницу р^погитфрия

Разделы и коллекции

B-Ö Разделы и коллекции

В Алтайская краевая универсальная

hg Сибирика и краеведение (книги)

[емаровская областная научная 6

I библиотека им. В. Я. Шишкова

ie издания^

■и. В.Д. Фёдорова

Рис. 2. Пользовательские интерфейсы модернизированной DSpace

V Главная страница ре...

Ç- С? ¡Oelib.ngonb.ru/jspui/handie/NGONB/8102

Hi-TechgtMail.Ru '<2 Коллекция ееб-ф

=В CfP|jCbPIP(j... HoeocTM®Mail.Ru Погод а ®Ма i I. Ru Рекомендуемые с...

is « О л

CJ Другие закладки

m

ЭЛЕКТРОННАЯ

СИБИРЬ

Поиск в архиве

Найти!

Географический поиск

© Главная страница

®. © Дата выпуска

G Заглавие ® Ключевое слова

Зарегистрированным:

© Обновления на e-mail m M архив

РЕСУРСОВ

' Редактировать просияв ® £ "" '

Главная лтваниид пвппаитавия

Щцдцаа сбластная уикваасальная научная библиате^а им. а.С. Пушкина Заметки краеведов

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на ЭТОТ ресурс: МЛр: //еИЬ.пдопЪ.хч/узрих/1ч*тИе/ЯвОШ/еЮ2

Ангоры: Г^айдан10^)"Эду^рр •'г^т'-тть'тнич Библиографическое описание: Майщанюк, 3. К. Городской краеведческий клуб "Старый Тонек" / Э, К. Майданюк // Панорама библиотечной жизни Томской области / Том. обл. универс науч. 6-1 И' !. А. С. Пушкина.— Вып. 1(4). -Томск, 2006', . |дб-107 Дата публикации: 2006 Ссылка на связанный ресурс: ЬИр://е! ib.tom5k.ru/DUrl/l-56/ Располагается в коллекциях: Заметки краеведов

Файлы этого ресурса:

Файл Описание Размер Формат

2010-0080,pdf 171,30 kB Adobe PDF Пррдмдтретм'ОтКВ«"*

Погаэеть полное oi

Д Р'ЧТ" I

электронных библиотек, трудно было пройти мимо соблазна модифицировать эту систему для придания ей дополнительной функциональности. В результате созданы дополнительные модули DSpace, которые позволили каталогизировать, хранить и обрабатывать информацию с географическим аспектом (рис. 3). Достигнутая функциональность системы позволяет реализовать географическую привязку как для контента, так и для контекста (место публикации, место хранения, место находки и т.д.). Ввод географической информации осуществляется графически посредством интерфейсов Google MAP v.3 и масштабируемых карт. Система допускает работу с различными геометрическими объектами - точки, линии, прямоугольники, полигоны.

Сервер ZooPARK, входящий в программно-аппаратный комплекс, реализует недостающие в DSpace функции доступа к данным по стандартным технологиям. Так, он обеспечивает доступ к данным по протоколам Z39.50, SRW/SRU, через провайдер Z-PostgreSQL напрямую манипулирует с данными DSpace, хранящимися в СУБД PostgreSQL. В частности, именно ZooPARK обеспечивает кроме всего прочего поиск информации по ее географическому аспекту на основе поисковых запросов RPN и наборов поисковых атрибутов Bib-1, GILS и CIP [9].

Сервер LDAP хранит в своих каталогах информацию о пользователях системы и в первую очередь реализует функции их аутентификации и авторизации, в том числе групповой и ролевой [2]. Такая организация хранения учетных записей обеспечивает простой доступ к ним из различных систем, а также допускает работу в распределенном режиме хранения информации как посредством развитых в LDAP механизмов репликации

С Ä О«UbrgonbAi;2100/гдм5/здJ,htm?stype =с -i * Ш

□ Hi-T«h®Mail,Ru i: Колп&ция ввб-ф,., Hj WEÖ CI*P|jCli№|j,.. <Ф ноеоетифМаИДи * О Другие закпадш

mm

нориалиэйбамнйй предсга*пени$ Г yi |si. 1901383-

Нэсор агвиОпо». filter*1 ¡62.71337«! Псчдая карту | 237&760' иска: | Области nepctptu аюгся jJ yl |S4.7042921. Докск |

j ellb.ngonb.m:2100/2gw5/gls/goMap3.htjn?rnvSCT^

Рис. 3. Интерфейсы модернизированной DSpace для ввода и редактирования географической информации (Google Map)

Г

Г<иеначстр>441эре...

*■ С Л н.'у-ЪгпИйтН

Q Hi-TccMJHaii Ru а катают» мб-Ф. Q wa СГРуСУЧРу . Л Ни П Сохранить паро/ь в Google Chrome? Сохра-мть парогь

®

ЭЛЕКТРОННАЯ

СИБИРЬ

Отправка ресурса: Опишите Ваш рес^

пожалуйста, заполните следующую информацию об ompaormano

55.02123230010374,83.1038667161 J4.U. К>ри

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Карп 1

Й4МИЧ fBiWWIk»» Г»ГМ4ич«кц« ««»МИН4Щ г

äJ

Отправка ресурса: Загрузка фай

Velib.ngonb.ru/]spul/gis/goMap3.htm?... 1Щ1Н *

о elb.rgonb.ru/)spul/gis/goMap3.hlm?myScrlp1:=setMapDataasl=asrcl=di>

У] Новосибирск

I-№W->| li

Данные карты ©2011 Geocerrtre Constiing - Ус no e^Wnorct ?об ани а

Показать | Очистить | Сохранить |

к. Досчп-» и.аденин. о тнги ¿-»Гшс.» ■■ .potна. н. ггодд«&:.ги. e,öl,n; Вы6»р*га фанп | Файл быСрач

< Ниц | Дим > | Skip Sit uploid > | Ош»щпк/Соч:р»нить |

_I_

-d

Рис. 4. Интерфейсы информационной системы для географического поиска с использованием Google Map и шлюза Z39.50-WWW (ZooPARK)

данных каталогов, так и посредством организации прямых ссылок на другие серверы LDAP. Сервер Sun Java System Directory Server v7.0 (рис. 1) может быть заменен на любой другой сервер LDAP, например на Open LDAP.

Взаимодействие с другими системами. Поскольку одно из основных требований, предъявляемых к современным информационным системам, - интероперабельность, следует отметить соответствующую функциональность описываемого программного комплекса, который обеспечивает:

возможность загружать и выгружать данные в формате XML в схемах QDC, DC, MARCXML, METS с помощью базовой конфигурации DSpace;

доступ к данным по протоколам Z39.50, SRW/SRU с динамической конвертацией метаданных в различные схемы и форматы. Функции реализованы в сервере ZooPARK в соответствии с его спецификациями;

стандартный поиск информации, в том числе географической, в соответствии со спецификациями Z39.50, CIP [9] и SRW/SRU (рис. 4);

обмен метаданными по протоколу OAI PMH в качестве как клиента, так и сервера. Функции реализованы в базовой DSpace и расширены дополнительными модулями для поддержки различных дополнительных схем метаданных (RUSMARC и др.) (рис. 5). В процессе функционирования система использует данные из внешних источников:

а) каталогов LDAP - для аутентификации и авторизации пользователей. Доступ осуществляется по протоколу LDAP;

б) данные по классификационным схемам и тезаурусам - для каталогизации ресурсов; доступ осуществляется по протоколам Z39.50 или SRW/SRU в соответствии с профилем ZTHES (рис. 6);

в) данные из внешних источников, доступных, например, по протоколу SRW/SRU, -для авторитетного контроля имен при каталогизации [6].

г) внешние карты Google - для каталогизации географической информации (рис. 4). Все данные информационной системы могут индексироваться внешними поисковыми

системами, что позволяет включать их в системы глобального поиска информации.

В заключение следует подчеркнуть, что информационная система для поддержки проекта «Электронная Сибирь» обладает функциональностью, отсутствующей в других подобных системах. Программный комплекс, лежащий в ее основе, может применяться в других проектах, так как список его функциональных возможностей носит достаточно общий характер, а используемый спектр программных компонент доступен в том числе и в открытых кодах. Несомненным преимуществом программного комплекса является максимальное соответствие всех его внешних интерфейсов международным стандартам. Кроме того, нельзя не отметить, что реализованная в рамках проекта «Электронная Сибирь» возможность работы с географическим аспектом информации сегодня в России уникальна [7, 10]. Электронная библиотека Проекта находится в открытом до ступе (http://elib.ngonb.ru/jspui/).

В дальнейшем предполагается модернизация системы DSpace для реализации географического поиска встроенными методами; настройка доступа к данным в соответствии со спецификациями SRW/SRU и их представление в форматах MARCxml (Rusmarc) и METS; совершенствование пользовательских графических интерфейсов.

ЛИТЕРАТУРА

1. Жижимов О.Л., Молородов Ю.И., Пестунов И.А. и др. Интеграция разнородных данных в задачах исследования природных экосистем // Вестн. НГУ Сер. «Информационные технологии». 2011. Т. 9, № 1. С. 67-74.

2. Жижимов О.Л., Федотов А.М., Юданов Ф.Н. Модель управления информационными ресурсами организации // Вестн. НГУ. Сер. «Информационные технологии». 2010. Т. 8, № 4. С. 81-95.

3. Жижимов О.Л., Мазов Н.А., Федотов А.М. Некоторые заметки об эволюции цифровых репозитариев традиционных библиотек к полнофункциональным электронным библиотекам // Вестн. ВГУЭС. 2010. Т. 3, № 7. С. 55-63.

4. Жижимов О.Л., Мазов Н.А. Об использовании географических координат при поиске библиографической информации // Науч. и техн. библиотеки. 2009. № 1. С. 54-60.

5. Жижимов О.Л., Мазов Н.А. Принципы построения распределенных информационных систем на основе протокола Z39.50 / ОИГГМ СО РАН. Новосибирск: ИВТ СО РАН, 2004. 361 с.

6. Федотов А.М., Жижимов О.Л., Князева А. А. и др. Проблемы авторитетного контроля для распределенных электронных библиотек и библиографических баз данных // Вестн. НГУ. Сер. «Информационные технологии». 2011. Т. 9, № 1. С. 3-17.

7. Abresch J., Hanson A., Heron S.J., Reehling P.J. Integrating geographic information systems into library services: a guide for academic libraries. N.Y.: Information Science Publishing (an imprint of IGI Global), 2008. 301 p.

8. ANSI/NISO Z39.50-1995. Information Retrieval (Z39.50): Application Service Definition and Protocol Specification / Z39.50 Maintenance Agency Offical Text for Z39.50-1995. July 1995.

9. Catalogue Interoperability Protocol (CIP) Specification - Release B // CEOS/WGISS/ICS/CIP-B, Is. 2.4.75. Apr. 2005.

10. Hill L.L. Georeferencing: The Geographic Associations of Information.: Cambridge; Massachusetts; London: MIT Press, 2006. 260 p.

11. Tansley R., Bass M., Smith M. DSpace as an Open Archival Information System: Current Status and Future Directions // Lecture Notes in Computer Sci. 2003. Vol. 2769. P. 446-460.

Google

Рис. 6. Интерфейсы модернизированной DSpace для работы с рубрикаторами по протоколу SRU (ZTHES, AJAX) при каталогизации ресурса

i Надоели баннеры? Вы всегда можете отключить рекламу.