Научная статья на тему 'Построение типовой модели информационной системы для работы с документами по научному наследию'

Построение типовой модели информационной системы для работы с документами по научному наследию Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
749
83
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФОРМАЦИОННАЯ СИСТЕМА / ЭЛЕКТРОННАЯ БИБЛИОТЕКА / БАЗА ДАННЫХ / ЦИФРОВОЙ ДЕПОЗИТАРИЙ / НАУЧНЫЕ ШКОЛЫ / ПРОТОКОЛ OAI / АБСТРАКТНЫЙ ПОИСК / МЕТАДАННЫЕ / МЕКОФ / DSPACE / INFORMATION SYSTEM / DIGITAL LIBRARY / DATABASE / DIGITAL DEPOSITORY / RESEARCH SCHOOLS / THE PROTOCOL OAI / AN ABSTRACT SEARCH / METADATA MEKOF

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Жижимов Олег Львович, Федотов Анатолий Михайлович, Федотова Ольга Анатольевна

Работа посвящена описанию технологического подхода к созданию типовой модели информационной системы для поддержки научных исследований, организованной в виде электронной библиотеки для работы с документами по научному наследию. Описываются архитектура информационной системы и принципы интеграции с цифровым депозитарием, правила представления и преобразования метаданных.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Жижимов Олег Львович, Федотов Анатолий Михайлович, Федотова Ольга Анатольевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

BUILDING A GENERIC MODEL OF INFORMATION SYSTEM FOR WORKING WITH DOCUMENTS ON THE SCIENTIFIC HERITAGE

The work is devoted to the description of the technological approach to creating a generic model of information system to support research, organized in the form of an electronic library for working with documents on the scientific heritage. We describe the architecture of information systems and the principles of integration with a digital depository, and transformation rules for the submission of metadata.

Текст научной работы на тему «Построение типовой модели информационной системы для работы с документами по научному наследию»

УДК 002.53

О. Л .Жижимов, А. М. Федотов, О. А. Федотова

Институт вычислительных технологий СО РАН пр. Акад. Лаврентьева, 6, Новосибирск, 630090, Россия

Новосибирский государственный университет ул. Пирогова, 2, Новосибирск, 630090, Россия

Государственная публичная научно-техническая библиотека СО РАН ул. Восход, 15, Новосибирск, 630200, Россия

E-mail: ofedotova@ict.nsc.ru

ПОСТРОЕНИЕ ТИПОВОЙ МОДЕЛИ ИНФОРМАЦИОННОЙ СИСТЕМЫ ДЛЯ РАБОТЫ С ДОКУМЕНТАМИ ПО НАУЧНОМУ НАСЛЕДИЮ *

Работа посвящена описанию технологического подхода к созданию типовой модели информационной системы для поддержки научных исследований, организованной в виде электронной библиотеки для работы с документами по научному наследию. Описываются архитектура информационной системы и принципы интеграции с цифровым депозитарием, правила представления и преобразования метаданных.

Ключевые слова: информационная система, электронная библиотека, база данных, цифровой депозитарий, научные школы, DSpace, протокол OAI, абстрактный поиск, метаданные, МЕКОФ.

Введение

Основным требованием, предъявляемым к информационным системам, предназначенным для поддержки научных исследований, является интероперабельность.

Под интероперабельностью любой информационной системы, в том числе и электронной библиотеки, понимается степень ее способности взаимодействовать с другими информационными системами, в том числе и с человеком [1]. Но если при взаимодействии с последним (как с информационной системой) основная нагрузка на обеспечение взаимопонимания ложится на человека, который в состоянии обработать даже очень плохо организованную информацию, то для обеспечения эффективного взаимодействия между информационными системами требуются специальные технологические подходы и общие соглашения. Обеспечение интероперабельности систем невозможно без строгого выполнения соответствующих международных стандартов и рекомендаций. При этом стандартам должны соответствовать:

• протоколы и интерфейсы доступа к данным;

• поисковые языки и интерфейсы;

• схемы и форматы представления данных;

• интерфейсы визуализации однотипных данных;

• правила кодирования информации;

• правила контроля доступа к данным.

В работе [2] был определен базовый профиль стандартов информационной системы для поддержки научных исследований, организованной в виде электронной библиотеки.

* Работа выполнена при поддержке РФФИ (проекты № 12-07-31111, 12-07-00472, 11-07-00561, 10-07-00302), а также программы «Ведущие научные школы РФ» (грант НШ № 6293.2012.9) и проекта ФЦП № 2012-1.4-07-5140022-004.

ISSN 1818-7900. Вестник НГУ. Серия: Информационные технологии. 2012. Том 10, выпуск 3 © О. Л. Жижимов, А. М. Федотов, О. А. Федотова, 2012

Под профилем метаданных понимается адаптация существующей схемы метаданных к нуждам конкретной задачи, решаемой информационной системой 1. Исходя из анализа существующих форматов метаданных, предназначенных для работы с публикациями, документами и другими информационными ресурсами, можно сделать вывод, что для исследовательской работы с материалами по научному наследию наиболее подходящим является формат ГОСТ 7.19-2001 (МЕКОФ) 2. По сравнению с другими общеупотребительными форматами метаданных (форматы семейства MARC 3, данный формат обладает наиболее полной системой классификации типов документов и других информационных ресурсов и достаточно большим набором словарей-справочников, необходимых для описания и идентификации информационных ресурсов.

В настоящей работе рассматривается технологический подход к созданию типовой модели информационной системы, предназначенной для обеспечения научных исследований. Разрабатываемая модель информационной системы для работы с материалами, имеющими отношение к научному наследию, должна решать задачи долговременного хранения информации, организации абстрактного поиска по атрибутам, организации сбора и обмена метаданными и информацией между удаленными хранилищами информационных ресурсов.

Научные школы

Научные школы - ценное интеллектуальное наследство научного сообщества. Изучение научного наследия основателей сибирских научных школ является важной задачей. Период их деятельности совпал со временем стремительного развития науки. Сегодня отчетливо вырисовывается истинное значение идей и событий, масштабность личностей. Среди сибирских ученых есть всемирно признанные, сделавшие весомый вклад в мировую науку. Главное достоинство СО РАН в том, что оно сохранило научные школы. Многие лидеры ушли из жизни, а научные школы остались и продолжают свое развитие. Школы живут, потому что остались ученики, не разрушены традиции и сохранилась память.

Нашему поколению оставлено богатейшее научное наследие, которое следует сберечь. Промедление в этой работе может привести к невосполнимым утратам, связанным с временным фактором: потерей документов, уходом из жизни очевидцев событий. Одной из важнейших задач, связанных с сохранением научного наследия, является комплекс мероприятий, направленный на создание специализированных информационных систем (электронных библиотек), предназначенных для хранения информации, для организации доступа и механизмов использования информации [3].

Очевидными являются два необходимых требования, которые можно предъявить к таким информационным системам. Первое требование - необходимость создания и обеспечение системы надежного долговременного хранения цифровых (электронных) документов с сохранением всех смысловых и функциональных характеристик исходных документов. Второе - обеспечение «прозрачного» поиска и доступа к документам пользователей, как для ознакомления, так и для анализа и проведения научной работы [4].

В существующих разработках электронных библиотек, как правило, поиск и доступ к информации обеспечивается только посредством визуальных графических интерфейсов. Это хорошо для пользователя-человека, но очень плохо для пользователя-приложения (например,

„ 4ч

для проведения различных аналитических исследований ).

Для обеспечения функций поиска вне графических интерфейсов требуется поддержка специальных сетевых сервисов и языков запросов. В идеальном случае все информационные системы должны поддерживать единый поисковый профиль и единый язык запросов. Реали-

1 ГОСТ Р ИСО / МЭК ТО 10000-2-99. Информационная технология. Основы и таксономия функциональных стандартов. Ч. 2. Принципы и таксономия профилей ВОС.

2 ГОСТ 7.19-2001. Система стандартов по информации, библиотечному и издательскому делу. Формат для обмена данными. Содержание записи.

3 MARC Standards / Library of Congress, Network Development and MARC standards Office // The Library of Congress [web-сайт] / Library of Congress. 2007. URL: http://www.loc.gov/marc/; RUSMARC: Российский коммуникативный формат // Российская библиотечная ассоциация URL: http://www.rba.ru:8101/rusmarc/

4 Можно делать выборки и вручную, но в наше время это странно.

зация парадигмы абстрактного поиска сегодня существует в виде нескольких моделей организации поисковых сервисов, например, модель Z39.50 [5; 6] и более простая модель SRW/SRU [6] 5. Практическая реализация сервисов типа SRW/SRU дает существенно новое качество электронной библиотеки - возможность включения ее ресурсов в глобальные поисковые системы на более высоком уровне, нежели уровень внешней индексации статических Web-страниц другими системами.

Другие возможные типы поиска связаны с поиском по заданным шаблонам и с поиском с привлечением онтологии. Поиск с привлечением онтологии является более интеллектуальным. Для его реализации требуется дополнительная информация - информация о предметной области, включающая определения терминов, сущностей и связей. Следует отметить, что представление этой дополнительной информации должно соответствовать глобальным договоренностям - международным стандартам, иначе поиск с привлечением словарей, тезаурусов и онтологии всегда будет ограничен текущей системой, а интероперабельность не будет реализована [7].

Архитектура информационной системы

по научному наследию

Исходя из сформулированных требований, информационная система поддержки исследований по научному наследию должна состоять из системы долговременного хранения и системы управления информацией для организации абстрактного поиска необходимого для анализа и проведения научных работ. Очень важным компонентом технологии работы с научным наследием являются метаданные, содержащие информацию, необходимую для документирования процесса хранения информационных ресурсов. Эти метаданные представляют собой информацию о формате, структуре и использовании информационных ресурсов, историю всех операций, в том числе любые изменения, аутентичность, техническую историю, ответственность, права и проч.

Таким образом, информационная система по научному наследию функционально должна состоять из трех блоков.

1. Цифровой депозитарий 6 (или репозитарий, далее ЦД) - это независимая система долговременного хранения и доступа к разнородным цифровым объектам, которая предназначена для предоставления электронных (цифровых) версий документов по научному наследию (книг, научных статей, репринтов, писем, изображений и других материалов, представленных в электронном виде).

2. Справочники - это набор баз данных, содержащих информацию об авторах и других персонах (авторитетные файлы), географических пунктах, городах, издательствах, имеющих отношение к конкретной научной школе, тематические словари-классификаторы, тезаурусы, описания предметной области данной научной школы и классификаторы документов в соответствии с МЕКОФ.

3. Сервер метаданных должен обеспечить работу с метаданными - каталогизацию всех информационных ресурсов в соответствии с общепринятыми международными стандартами. На нем должен работать целый набор прикладных сервисов, которые должны: поддерживать схемы абстрактного поиска в соответствии со схемами, предлагаемыми протоколом Z39.50 и SRW/SRU, поддерживать схемы поиска по заданным шаблонам и с привлечением онтологии, поддерживать обнаружение фактов и идентификацию документов по информации, которая находится в справочнике, а также обеспечивать сбор метаданных из собственного и удаленных ЦД (обмен, синхронизация и модификация), конвертацию метаданных между существующими стандартами (ГОСТ, MARC и т. д.) и соответствующий перевод схем метаданных из одного формата в другой.

5 SRU - Search/Retrieval via URL / The Library of Congress. USA: <http://www.loc.gov/standards/sru

6 Депозитарий (англ. depository) - место, где что-либо может быть размещено для продажи или хранения (Webster, 1913).

Цифровые репозитарии

Для организации системы долговременного хранения информационных ресурсов (депозитариев) международной организацией по стандартизации (ISO) предложен стандарт ISO-14721 (OAIS - Open Archive Information System 7) [8]. Эталонная модель для стандарта OAIS - это концептуальная модель, которая была использована многими организациями для разработки наборов метаданных и организации крупных хранилищ цифровых объектов.

Отметим, что для долговременного сохранения цифровых объектов необходимо, чтобы метаданные хранились отдельно от объектов, в системе, независимой от той, которая была использована при их создании.

Наиболее популярные в мире системы ЦД, такие как DSpace 8 [14], E-Prints 9 [15], Fedora 10 и др., строятся в рамках модели OAIS на основе технологий открытых систем, что дает принципиальную возможность их использования при построении информационных систем.

В качестве репозитария для информационной системы по научному наследию выбран ЦД, созданный на основе DSpace. Выбор обусловлен тем, что данная система уже эксплуатируется в СО РАН 11 (а также в ряде других институтах и университетах России) на протяжении нескольких последних лет [9].

Процесс интеграции ЦД в среду электронной библиотеки по научному наследию для этих систем отличается только в несущественных деталях и основан на модели агрегирования и распространения метаданных. Применение этой модели закреплено в протоколе OAI Protocol for Metadata Harvesting (далее OAI или OAI-PMH) 12, который поддерживается большинством систем, предназначенных для хранения информационных ресурсов.

Типичная организация ЦД состоит из трех уровней. На примере DSpace рассмотрим основные компоненты ЦД.

• Уровень приложений. На этом уровне находятся компоненты, отвечающие за взаимодействие с ЦД: компоненты, реализующие пользовательские веб-интерфейсы, а также модули, реализующие прикладные интерфейсы: OAI, функции импорта / экспорта данных. Провайдер данных для протокола OAI позволяет строить программный интерфейс для взаимодействия различных информационных систем с DSpace на основе этого стандартного протокола. Существующий в DSpace менеджер сервисов позволяет строить сервисы для фильтров метаданных, которые используются для преобразования метаданных из внутренней схемы в схемы, пригодные для обмена метаданными с внешними системами.

• Уровень рабочих процессов. Уровень рабочих процессов определяет функциональность ЦД: средства администрирования, управление пользователями и авторизация, прикладные поисковые интерфейсы. Отметим, что DSpace обеспечивает разграничение доступа к информационным ресурсам на основе протокола LDAP 13, что позволяет при создании информационной системы не разрабатывать собственную систему аутентификации, а использовать уже существующую в СО РАН систему аутентификации пользователей и достаточно легко разграничить ресурсы на публичные и служебные.

• Уровень хранения. Обеспечивает взаимодействие ЦД с внутренней СУБД и содержит компоненты, отвечающие за хранение цифровых объектов в файловой системе.

7 Открытая архивная информационная система.

8 DSpace: an open source solution for accessing, managing and preserving scholarly works // MIT Libraries; HP Labs. 2007. URL: http://www.dspace.org/

9 EPrints Free Software // EPrints for Digital Repositories / School of Electronics and Computer Science, University of Southampton, UK. 2008. URL: http://www.eprints.org/

10 Fedora: Fedora Repository System // Fedora Commons / Gordon and Betty Moor Foundation; Cornell University Information Science; University of Virginia Library; The Andrew W. Mellon Foundation. 2007. URL: http://www.fedora-commons.org/

11 http://elib.nsc.ru:8080/jspui/

12 The Open Archives Initiative Protocol for Metadata Harvesting: Protocol Version 2.0 of 2002-06-14 // Open Archives Initiative / The OAI Executive; OAI Techical Commitee. 2004. URL: http://www.openar-chives.org/OAI/openarchivesprotocol.html

13 RFC 4510: Lightweight Directory Access Protocol (LDAP): Technical Specification Road Map / OpenLDAP Foundation. 2006. URL: http://www.apps.ietf.org/rfc/rfc4510.html

Регистрация информационных ресурсов

Регистрация информационных ресурсов в информационной системе, посвященной научному наследию, требует решения следующих вопросов.

1. Создание профиля метаданных. Под профилем метаданных понимается адаптация схемы метаданных к нуждам конкретной информационной системы. По соглашению [10], профиль метаданных может включать элементы из различных схем. Помимо схемы метаданных в понятие профиля метаданных входят поисковые атрибуты, каждый из которых ассоциирован с одним элементом или несколькими элементами схемы метаданных.

2. Создание пользовательского интерфейса. Пользовательский интерфейс электронной библиотеки должен учитывать конкретный профиль метаданных и предусматривать возможности модификации документов и метаданных, их поиска и просмотра.

3. Архивация информационных ресурсов в хранилище данных. Эта задача решается, как правило, встроенными компонентами ЦД.

4. Поддержка сервисов работы с метаданными (извлечение, обмен, синхронизация, модификация) и с самими информационными ресурсами.

5. Реализация различных схем поиска и извлечения ресурсов. Для выполнения функций электронной библиотеки система должна обладать развитым набором настраиваемых сервисов по извлечению документов (информационных ресурсов) как по запросам внешних (удаленных) приложений (например, web-сайтов), так и для собственных целей.

Для синхронизации метаданных информационных ресурсов между информационной системой электронной библиотеки и ЦД должен быть создан сервис, основанный на использовании протокола OAI. В задачи этого сервиса входит извлечение метаданных из ЦД, конвертирование (при необходимости) и передача их серверу метаданных. Под конвертированием здесь понимается как преобразование метаданных и схем метаданных (например, Dublin Core 14 в ГОСТ 7.19 или RUSMARC), а также при необходимости преобразование форматов (например, в XML 15 или ISO-2709 16).

Отметим, что при взаимодействия с удаленными системами обмен метаданных должен выполняться между ними согласованно, с использованием форматов обмена. В настоящее время общим подходом является использование формата XML или, если речь идет о библиографических базах данных, ISO-2709. Следовательно, система должна иметь сервисы конвертирования метаданных из формата другой системы, при этом необходимо одновременно конвертировать и схему метаданных.

Реализация

Рассмотренная модель информационной системы, работающей с материалами научного наследия, реализуется на примере научной школы Алексея Андреевича Ляпунова - основателя теоретического программирования и российской (советской) кибернетики [11].

Основной каталог информационных ресурсов сервера метаданных информационной системы строится в соответствии со схемой метаданных ГОСТ 7.19 (МЕКОФ). Разработанная схема учитывает основные требования этого стандарта и схемы метаданных Dublin Core. В дальнейшем нашу схему метаданных мы будем называть внутренней.

Для долговременного хранения документов использовался репозитарий DSpace СО РАН 17. Была расширена стандартная схема метаданных DSpace полями, включающими основные требования ГОСТ 7.19 (МЕКОФ). Для поддержки процесса наполнения полнотекстовых баз созданные профили метаданных были зарегистрированы в системе DSpace и в соответствии с ними были настроены рабочие процессы и пользовательский интерфейс

14 Dublin Core Metadata Initiative, 2007. URL: http://www.dublincore.org/

15 Extensible Markup Language (XML) 1.0 (Fourth edition) // World Wide Web Consortium. 2006. URL: http://www.w3.org/XML/

16 ISO 2709:2008 [Электронный ресурс]: Information and Documentation - Format for Information Exchange // ISO - International Organization for Standardization. 2008. URL: http://www.iso.org/iso/iso_catalogue/catalogue_tc/ catalogue_detail.htm?csnumber=41319

17 http://elib.nsc.ru: 8080/jspui/handle/SBRAS/5510

Интеграция цифрового депозитария с информационной системой

системы. Для того чтобы выполнять обмен метаданными между DSpace в соответствии с расширенным профилем, был создан сервис на языке XSLT 18, выполняющий преобразование схем метаданных из внутренней схемы DSpace в схему сервера метаданных и в схему Dublin Core с использованием квалификаторов. Реализован также OAI сервис, который в пакетном режиме периодически, в соответствии с расписанием, проводит синхронизацию метаданных ЦД и сервера метаданных.

Для заполнения основного каталога метаданных в соответствии с созданными схемами метаданных используются контролируемые словари из справочного блока системы.

В настоящий момент для заполнения отдельных полей были созданы следующие контролируемые словари:

• персоны - авторитетные файлы;

• классификационные индексы;

• списки учреждений, организаций и предприятий;

• типы документов;

• географические названия;

• типы содержимого документов.

В дальнейшем их список будет расширен.

Функциональность поиска документов (информационных ресурсов) доступна конечным пользователям тремя путями: через пользовательский интерфейс информационной системы (сервера метаданных), через специализированный поисковый сервис (для внешних приложений) и через пользовательский интерфейс ЦД DSpace. Однако в любом случае сами документы всегда хранятся в ЦД, поэтому, через какой бы интерфейс пользователь ни нашел необходимый ему документ, документ будет напрямую извлечен по протоколу HTTP из ЦД.

Функционирование информационной системы, обеспечивающей интеграцию ЦД и электронной библиотеки, показано на рисунке.

На всех уровнях пользовательских интерфейсов (сервер метаданных, сервисы и ЦД) контроль доступа пользователей к ресурсам информационной системы осуществляется на основании идентификационной информации в соответствии с протоколом LDAP. DSpace имеет встроенную поддержку LDAP, а в программируемых сервисах и в сервере метаданных поддержка обеспечивается сервисами информационной системы.

18 XSL Transformations (XSLT) Version 1.0: W3C Recommendation // World Wide Web Consortium. 1999. URL: http://www.w3. org/TR/xslt

Выбранная технология интеграции разрабатываемой информационной системы для поддержки исследований по научному наследию с ЦД позволяет использовать любые другие реализации ЦД, поддерживающие протокол OAI 19. Для работы с внешними ЦД, поддерживающими протокол OAI, реализован сервис, преобразующий схему метаданных Dublin Core во внутреннюю схему метаданных системы.

Извлекаемые из внешних ЦД метаданные также помещаются в базу данных электронной библиотеки (сервера метаданных). Если для конкретного ЦД это возможно, то метаданные извлекаются в XML-схеме с дальнейшим преобразованием в схему ГОСТ. Если схема данных внешнего ЦД неизвестна, то метаданные преобразуются из схемы, основанной на Dublin Core, в схему метаданных ГОСТ.

Для интеграции электронной библиотеки с внешними системами и приложениями по протоколу OAI (в дальнейшем планируется реализовать поддержку протокола Z39.50) используются сервисы преобразований внутренней схемы метаданных, например, в схему MARCXML 20 или RUSMARC и др. При необходимости этот же подход может быть использован для преобразования метаданных в другие схемы семейства MARC. Примеры преобразований из схемы запросов, которые получаются по OAI в разные схемы метаданных приведены в Приложении.

Заключение

Разработанная модель информационной системы может быть использована как типовая модель системы для работы с документами, связанных с научным наследием, поскольку решает основные задачи, предъявляемые к этим системам:

• обеспечение системы надежного долговременного хранения цифровых (электронных) документов с сохранением всех смысловых и функциональных характеристик исходных документов;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

• обеспечение «прозрачного» поиска и доступа к документам пользователей как для ознакомления, так и для анализа и проведения научной работы;

• организация сбора информации по удаленным ЦД, поддерживающих протокол OAI.

В рамках представленной модели открытыми пока остаются вопросы поиска по шаблонам и обнаружения фактов, идентификации персон и автоматической систематизации и классификации ресурсов.

Список литературы

1. Жижимов О. Л., Федотов А. М. Обеспечение интероперабельности электронных библиотек // Информационные технологии и математическое моделирование в науке, технике и образовании (Бишкек, Кыргызстан, 5-9 октября 2011 г.): Изв. Кыргыз. гос. техн. ун-та им. И. Раззакова. 2011. № 24. Материалы междунар. конф. С. 331-335.

2. Федотов А. М., Барахнин В. Б., Жижимов О. Л., Федотова О. А. Технология создания корпоративных информационных систем учета трудов научных работников // Вестн. Ново-сиб. гос. ун-та. Серия: Информационные технологии. 2011. Т. 9, вып. 2. С. 31-41.

3. Федотова О. А. Построение модели информационной системы для описания научных школ СО РАН // Математические и информационные технологии, MIT-2011 / Междунар. конф. (IX конф. «Вычислительные и информационные технологии в науке, технике и образовании). Врнячка Баня, Сербия, 27-31 августа 2011 г., Будва, Черногория, 31 августа - 5 сентября 2011 г., № гос. регистрации 0321102644. URL: http://conf.nsc.ru/files/conferences/MIT-2011/fulltext/49982/56788/fedotova.pdf

4. Жижимов О. Л., Мазов Н. А., Федотов А. М. Некоторые заметки об эволюции цифровых репозитариев традиционных библиотек к полнофункциональным электронным библио-

19 Протокол OAI более рассчитан на те случаи, когда стоит задача извлечения данных цифрового депозитария для их последующей обработки во внешней системе (например, индексирование во внешней базе данных, поисковом сервисе и т. п.).

20 MARCXML: MARC21 XML Schema // The Library of Congress. 2007. URL: http://www.loc.gov/standards/ marcxml/

текам // Вест. Владивосток. гос. ун-та экономики и сервиса. Территория новых возможностей. 2010. №3 (7). С.55-63.

5. ANSI/ISO Z39.50-2003. Information Retrieval (Z39.50): Application Service Definition and Protocol Specification // NISO Press. Bethesda, Maryland, U.S.A., 2003. 267 p.

6. Жижимов О. Л., Мазов Н. А. Принципы построения распределенных информационных систем на основе протокола Z39.50. Новосибирск: ОИГГМ СО РАН; ИВТ СО РАН, 2004. 361 с.

7. Шокин Ю. И., Федотов А. М., Барахнин В. Б. Проблемы поиска информации. Новосибирск: Наука, 2010. 198 с.

8. ISO-14721 Reference Model for an Open Archival Information System (OAIS), Draft Recommended Standard, CCSDS 650.0-P-1.1 (Pink Book) Issue 1.1 August 2009.

9. Жижимов О. Л., Молородов Ю. И., Пестунов И. А., Смирнов В. В., Федотов А. М. Интеграция разнородных данных в задачах исследования природных экосистем // Вестн. Но-восиб. гос. ун-та. Серия: Информационные технологии. 2011. Т. 9. № 1. С. 67-74.

10. Duval E. Metadata Principles and Practicalities. Katholieke Universiteit Leuven, Belgium // D-Lib Magazine. 2002. Vol. 8. №>. 4. URL: http://www.dlib.org/dlib/april02/weibel/ 04weibel.html

11. Федотов А. М. К 100-летию со дня рождения Алексея Андреевича Ляпунова // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2011. Т. 9, № 4. С. 5-11.

Материал поступил в редколлегию 18.07.2012

Приложение

Примеры преобразований из схем, которые выдаются по OAI в разные схемы метаданных

MARC21 в представлении marcXML

- r OAI РМН ssiischcmaLocation—"lrttp:/7www.openaichi\res.org/OAL'2.0/ httj>^/www.openaichives.oig^OAiy2.0/OAI-PlMH.xsd">

I'l qnesl identifier="oai:elib.5bras.ru:SBRAS/5831" тти T :n]i I;i ft I fi\ in, verb—1,lGetRecord">hitp:.'7elib.sbTas.m:£080/oai/request</,reqiie5t>

- <record xsi:schemaLocation-'lhrtp://wftrw.loc.govMAK.C21, slim http://wurw.loc.gov:,staiixlardb,maicKml,,&chema,'MARC2 lslim.xsd">

ГОСТ 7.19 (МЕКОФ)

-<ОА1-РЛШ151:5сЬетаЬосайоп='Ъ«р://\\т^.оре11агсЫуе5.о12/ОА1/2.0/ http://wwTV.openardihres.Org/OAI/2.0/OAI--PMH.xsd"> <responseDate>2012-07-25T05:36:09Z<responseDate>

<requestmetadataPrefii="mekof' verb-"GetRecord"identifier^"oaL:elib.sbra5.ru:SBRAS-583l">http: elib.sbras.ru:8080/oairequest<request> -<GetRecord> -<record> -<header>

<identifier>oai:elib.sbrasiu:SBRAS/5831<i'identifier> <datestamp>2012-05-01T19:00:18Z<'datestamp> <setSpeOhdl_SBRAS_5514</setSpeO <header> - <metadata>

- <record xsi:schemaLocation='htip: elib.sbras.ruMEKOF'slim http: ^lib.5bras.ruMEK0F s[mMEK0FMslim.xsd"> <ЫЛегШШХХМ12Шттт<Шет> -<datafield imp="00r indl="" tag=n101n>

<subfield code="A">000<subfield> </datafield> -<datafield indl="" imp="001" tag="200">

- <subfield code-"A">

0 методологических вопросах математической биологии <subfield> <datafield> -<datafield indl="" шр="00Г tag=n210"> <sub field code="D ">1975</subfield> <datafield>

<datafield indl="" imp="001" tag="223"/>

- <datafield tag="300" indl="" imp="001">

- <subfield code="F">

ЛяпуноЕ A A 0 методологических вопросах математической биологии / Ляпунов А.А, Багрииовсш Г.П. II Математическое моделирование в биологии: материалы первой школы по математическому моделированию сложных биологических систем, Мозжинка, март 1973 г. - М, 1975. - С. 5-18.

<subfield> <datafield>

-<datafield tag="640" indl-" imp-001">

<subfield code="A">Hay4Hbie труды AA. JbnyHOBa</subfield> <datafield>

- <datafield indl="" imp="001" tag='700">

<subfield code-'А">Ляпунов: A.A.<subfield> <datafield>

<datafield indl="2" imp="001" tag="7Hn/> <record> </metadata> </record> <'GetRecord> <OAI-PMH>

RUSMARC

— <OAI-PMH xsi:schemaLocarion=rlhttp://wwTÄ.opeiiarchives.org,'OAr/2.0/ http://Avwrw.openarchives.org',OAL'2.0/OAI-PMH.xsd,"> <request nietadataPrefix—'rusmarc"verb="GetRecord identifier='oai:elib.sbras.m:SBRAS/583r,>http:,7eüb.sbras.m:8080

- <record xsi:schemaLocarion=''http:/'elib.sbras.m,RL"S^'IARC/slim http://eüb.sbras.iu/RUSMARC/slim/RUSMARCslim^

14

O. À. Xhêhmob, A. M. OeflOTOB, O. A. OeflOTOBa

DIM

«OAl-rMH iii:îcbemaLocji(ioii- htlp. «Hn Cçaiarctaici CTK OA1'2.0 blip w«v opcnint]uvC»Or|£.OAL2.00Al']>MH-jLwl"5-<l*|i*»sâ^l*>2012-07-2iT06:3A372!</r*ipOMsDils>

'-request verb^'Getftecord' ■*ladataFnfii-~dim" idiBtifitr^'Oatelib.sbrai ju&bras Î8îl">hrtp: eUbjbcas.m:8(lS0 «u'kqu«f-№qu«t> ■XitlKH«ni>

- <h»]d»r>

'-iiUmifiir-'iMi flih ibr*t ruSRRAS.5$3l<wUnnfiir> ^iinti^joi 3-05-01t19 00 isz< j>l»cti-i»> -HiSu.c-hdl SBRAS SJH<MlSpK>

- f BHadaU-*

'dim: field nadschema- de" eknicnt-'conm butor" quahflti—"auîhoi">Jlmiyiton, AA<dint:fMid> ■Jim: field tudwhema- dr eLentritl- ronmhuror qualifier-' nuthor'^liiupaninwui. FTI <'dim:firld-' - rlini : hilil iudwh#ma= dr fl*mpr»t='daiç" qualifi»r=';irreuianed' j20iî-03-26t0754 5SZ< dim:Geld> tfdim: field mdieli#ma='dfM #l#mi>nt="dMe" q u i liii»r=- Uh le">2Q l2-03-26T07 : £4 5 ÏZ<'d i » ; f»»l d> <Am:E*U mdwli.m>- dr" »k.nHi.1- djilr' qm> ll^M™"n*U«<r>1975<'d;«>:U

- "Jim; fit Id inJiiliTiiia- .i: cbmrnl-'xlcDliticT* ijuatifwr-'cHol:™" Ijiij- RU*=-

JUliywW AA o sictcchxio nn c c mx isoupocu itarcMamiorkoft ùwIiUîhk .'Iihvmoh A A , EioipniMMcmai i'll. MaiuiaunCcKiK mooc. mpo Battue h diklioituh Maicptaa-tii ucptsuA iuku.iu do Mm cum mccirajv >tcuc:iitpoBHHitio c.*j*nbix uHixionrjCciJLT ciKini, MoxuuiKa, Majjr 1373 r. ■ M, 1975. ■ C. 3- IS. <;din:fkid>

■Jim:Bold tuduhema- d:' ekmc-nt-'ideim&er' quaUfwr-'uji'^hnp elA.iTKas ra SOSO jipuih^dli SULFAS ïSJl'- dim:GtW> ■Jim:Getd nadwhema- dr flHiirnt-'dfurrijinofi'' lan j-"ni_R,U">

TfKCT naivH rut c '.".iirr.i Oxn.e-WHBia i JIM I id CO ftVH (http ivwu- prornetni* iwc ru. ickhc e.* rhool t. Iyajiiinov works 1975 ili) «,dm;(HM>

SubnuUcd b)- 01.cn Fcikjic.a (f^4iSSia«il.ru> on 2012-03-2ÎT07.54.5SZ No. ef IkIHicubï. 1 0 nnumiiin)si «jupeoui waitiiMiriccsuiS 5tto.tDiTOi.pslf 3&95Î6 b>l«, dicckma M2îilctCc2b7?tc716îc4i I2flc5f51 {MD5) -idina:fiHil>

- 1_-dim:Gcfd ndxlitmi "dc" element "descnjiltoef qualifier ""pio\ enance" lauï

Made available iq DSpace on 20l2'03-26T07:J4:58Z (GMT). Mo. ofbrtitreami: l O ueioaononptiCKHX Donpocax naMMannecKoft otaononDt.pdf: 3S9Î-66 b>1«, checksum: 902Sdeif2t2b?Stc7l63£4<U2flcifSl <MDi) Fmidus Bine dale: 1P7S

r-'ttim:Geld ntdi<rh*ma="dt~" el*ment= language" qualifier^ :io' lans="ni_RU'>mvdinn:fi»ld'

'-dim:Gold ntdielif ma="dr" *Um»iit= 'tnuree '"-'MtiTmimnf rk'oe uAae-iupQWHllC r âwnnanniv diitrftrld--

<4im:G*U mdwli.m>- dr" hnf'm RU^H^-hhmC tp>3M A A Jtaryxo W<d; a>:MJ>

- dim; field indiilniiia-"dc" vlcmeal-'dtlc" hli(="nt_RU"> O M clùjM era icckhjl lOIZpOCflA HOlCMOXmCCKCA DBo.ionm

4ÉH!filU>

'-dim: Geld jadHfa*faa-~dc" ïlMntnt-"fj-pi" lanj-"fU_ku">j1irti.di' dim:Gtld>

'Jim:Gold ludschtma- de" ckmcnt^'Kifllmi" qualiGcr-"li-panotpag«"--*^ IÏ-: diraifirld:-

<i'in*t]dat]> <JT*t*T&>

QDC

■:0.\J PMFI i*.i:wliiniii iii nlniQ-'htrji• \viywnperuHrhivf. twg.OAli'2 0 hup' ni\iA"np«iarfhii« i <mpo«kditc>2i)12-i)7.25t(hj:4():26z--re5poaii;dati>

nit-tadalai'rtfii-'qd.:" rtrb-'i>lRccord" id««tiliei—"Mi eUb ibias ni SBIÎAS 1 ">h

* <mmd> - mi*adir'

-ridtnlLlirr--^u clib itnas.iu SBKA3 jSil^" idmlifur" -cd>i.danip>2012-05-OITl9 00 ItZ^iau»!.? c«»SPk:î4..U_SRRA&_<S 14< H»<Spw---«Ante» cnubdi№

j, OAT.'2 Q OAI PMKnd>

p:' eUbibtajro SOSO oaa requt!t'-r«jot5<:"

org. wbrmai smh qrir 2 DOS 01 XXi'dirinrais xvl hnp purl ntg ilr flrm«ni 1 1 ht

org. whrtnnv xcnLi qdr- 2006 01

■ ditfrnn:dalf.\i-fi-ptrdiu:iffcc-niatj>fition-"hnp purl org.dc'irrnK li Wdc *td>20] 2 0Î.26TO7 54 drteraï:djtrAcrf|itid:-

■:dcti-rnis:avatlabli-iH:5chciuaLMatii>n_ hnp purl.org dc itrnis hnp dublincote.org scbumai unli qdc2006 OliHidcKnai xsd hap: purl.orgdc'elements 1 1 hnp dublmcore.orgscbetnai mib ^dc 2006 01 06dc.xsd^-20I2 02! 26T07:54:iKZ--drtfras:av-aiUbifr-

'-dctinusiLisutd isi:Hh«miLocalioo-"hltp: pjrl or? i: terrai hitp: dublmcc*e ofB iihenias xiiiliqdc 200ik01D6 dctermi xid bttp: pari or? dc- elementi 1.1 hltp: dublsncore.ors ichfmas xial5. qdc 2C06 0106 dc.xid"> 19'? j'- dct« — *Jt:№n№:bil)li<qraphicCitiIioii lurKheanaLoratioa 'luip puil cuji ilc lenni ht1p dublmcuce.cs;» scbatuu Mills gdc 2000 01 '36 dcleinmsd hflp pul.crx* de eleinïiili M hup dubluicote oiii scbetuas xnils qdc 2006 01 06 dc.x; iml:Uni!-'m RU">

jlurvmti AA. ohrrujm«»mci;u<n^icwaiinctkoflihtthwrnii .'loivhob A A., baipu№!tii:mu [".it. V m«cn

f ivnr.-M„im -c s-is

i tJRI" *

="hnp purl erg djf. if

»•'df : id#nGfur hi»="dft«

.fish «hrMrn SûSO jspui tuuiitlf SBRAS 5831 vdc:idontifur^ *:dc:df-irription \U:ichrtuaI.iwarii>ii_ hnp purl nrg.tk irmtV TeKtT ctitlii omt c cafiia Owmou [TD'CtE CO №21 (hnp: '-'dc:dcscri|i4MB>

'-dc: laniuaa* tjp«^"dc[enni: 1S06>9 2 " rsL:wrh«niLocaho»-

unl:Unc iu R-U~>i"u<j,dc:laagaagfr>

<dc:iource iii:Hli(iiia|jOcalioD-~hlLp. patl caj dc IctEii hllp duhbticccc raj sclit

org lebnruiK. unit qdc'2006 0l OS drterrai hnp' purl org.de.>lrmnm 1 1 hltp dttblinmre org.'lehrniM xdiU qde-2006 01 Oft dr K»d">hB] org.dcelrmeoti I 1 http dublinrorr org whemni xrnl'. qdr. 2006 01 Oft dr iml:lan(_,nj_RU">

org vbrmni smk qric 2006 01 tHi drtenrn lid hnp pfotoeieus.njC-ruicietKeSchools h apuiio%' wrki 1975-jH)

- <de:+il Ou

» intwiin Hir= iIc;M)urr*=-^cbpnatjmtiiHi—"Imp pml iH|i iU- Inm

»bjKfr

U niitclinual ii-.-j I inTi= hnp Jiiirt org do temta h

putLwg'dc termi' http: dubloitcoie orR 4chemas xmliii'fc,2CK)6i&r№ Artemii.xsd bttp: purLors dc elements 1 1 http: dubbnccre ors scliemas smU qd; 2006-01 06 dc .xsd" jali qdc 2020 'D106 dctanuxid hllp. ixnl.cnjc doclaOait] 1.1.' liltp. didjlnicutcca* icbcraaj uiilKjiJc'2 OO&V 1 06dc ^ Mat cjiat in c c >a>c http/.-¿„bfaccirr «cp.-uhraiiia'xnU-qclu-SM« 01 'Vidrlrrrni x%d hllp "].>iil «p,<lr.>ïnnrnt* I ]/ http dubliwo«- «cp. «-•hra.m'xmU'qdr.'MK 01 Wife X ml :1»>C- ' IU_RU">Ht)TO» p' Aiblio«r№ nrg irhifflm xrals ijitr. 2006 01 ijfi detenw Kid hup purl <trp'do etnnetsii I I bttp' dubliniiWf org irhetsim siBli ndr.J00601. Ofi'dRKtd' iml:latif= ni_Rt.'">

<dc:lttlp>

■:dc:hjjf iii:vrhrnnal firalbon- h.Tt[i pyrl org lir termi HiikUi»g^"ni_RU">Article<'dc:typ*> <nttidi(a>

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

<.GrlKicOrd>

«OAl-niH?

r. dulilincore org Khfinii Hnl iq dc.2 OOfi 01.06 dotenns xsd hitp' . purl org. iter I

il I

iv dufaluiniKe org. wbntULi xmli qrir.'2006 01 06 df Xid"

O. L. Zhyzhymov, A. M. Fedotov, O. A. Fedotova

BUILDING A GENERIC MODEL OF INFORMATION SYSTEM FOR WORKING WITH DOCUMENTS ON THE SCIENTIFIC HERITAGE

The work is devoted to the description of the technological approach to creating a generic model of information system to support research, organized in the form of an electronic library for working with documents on the scientific heritage. We describe the architecture of information systems and the principles of integration with a digital depository, and transformation rules for the submission of metadata.

Keywords: information system, digital library, database, digital depository, research schools, DSpace, the protocol OAI, an abstract search, metadata MEKOF.

i Надоели баннеры? Вы всегда можете отключить рекламу.