Научная статья на тему 'Эволюция информационных систем: от Web-сайтов до систем управления информационными ресурсами'

Эволюция информационных систем: от Web-сайтов до систем управления информационными ресурсами Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1443
123
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИРИС / ИНФОРМАЦИОННАЯ СИСТЕМА / INFORMATIONAL SYSTEM / ЭЛЕКТРОННАЯ БИБЛИОТЕКА / DIGITAL LIBRARY / СЛОВАРЬ-СПРАВОЧНИК / DICTIONARY / КЛАССИФИКАЦИЯ ИНФОРМАЦИОННЫХ РЕСУРСОВ / CLASSIFICATION OF INFORMATION RESOURCES / ЦИФРОВОЙ РЕПОЗИТОРИЙ / DIGITAL REPOSITORY / ИНФОРМАЦИОННО-ПОИСКОВЫЙ ТЕЗАУРУС / THESAURUS FOR INFORMATION RETRIEVAL / КЛЮЧЕВЫЕ ТЕРМИНЫ / KEY TERMS / ПРОТОКОЛ OAI-РМН / OAI-PMH PROTOCOL / МЕТАДАННЫЕ / METADATA / IDIS SB RAS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шокин Юрий Иванович, Федотов Анатолий Михайлович, Жижимов Олег Львович, Федотова Ольга Анатольевна

Начиная с 1998 г. в ИВТ СО РАН ведутся работы по созданию Интегрированной распределенной информационной системы (ИРИС СО РАН). Статья посвящена истории создания и описанию технологических решений, применяемых при создании системы. Описываются архитектура информационной системы и принципы интеграции с внешними источниками, правила представления и преобразования метаданных, а также работа со словарями, которые используются для систематизации и классификации информационных ресурсов, и моделированию связей между ними.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Шокин Юрий Иванович, Федотов Анатолий Михайлович, Жижимов Олег Львович, Федотова Ольга Анатольевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE EVOLUTION OF INFORMATION SYSTEMS: FROM WEBSITES TO INFORMATION RESOURCE MANAGEMENT SYSTEMS

The works on development of Integrated Distributed Information Systems (IDIS SB RAS) has been carried out by ICT SB RAS since 1998. This paper is devoted to the history and description of technology for the system development. The information system architecture and principles of integration with external resources, rules for the declaration and conversion of metadata, as well as works with dictionaries that are used to organize and classify information resources and modeling of relations between them are described.

Текст научной работы на тему «Эволюция информационных систем: от Web-сайтов до систем управления информационными ресурсами»

УДК 004.9

Ю. И. Шокин , А. М. Федотов 1 2, О. Л. Жижимов , О. А. Федотова 3

1 Институт вычислительных технологий СО РАН пр. Акад. Лаврентьева, 6, Новосибирск, 630090, Россия

2 Новосибирский государственный университет ул. Пирогова, 2, Новосибирск, 630090, Россия

3 Государственная публичная научная техническая библиотека СО РАН ул. Восход, 15, Новосибирск, 630008, Россия

shokin@ict.nsc.ru, fedotov@sbras.ru, zhizhim@mail.ru, 04f8@mail.ru

ЭВОЛЮЦИЯ ИНФОРМАЦИОННЫХ СИСТЕМ: ОТ WEB-САЙТОВ ДО СИСТЕМ УПРАВЛЕНИЯ ИНФОРМАЦИОННЫМИ РЕСУРСАМИ *

Начиная с 1998 г. в ИВТ СО РАН ведутся работы по созданию Интегрированной распределенной информационной системы (ИРИС СО РАН). Статья посвящена истории создания и описанию технологических решений, применяемых при создании системы. Описываются архитектура информационной системы и принципы интеграции с внешними источниками, правила представления и преобразования метаданных, а также работа со словарями, которые используются для систематизации и классификации информационных ресурсов, и моделированию связей между ними.

Ключевые слова: ИРИС, информационная система, электронная библиотека, словарь-справочник, классификация информационных ресурсов, цифровой репозиторий, информационно-поисковый тезаурус, ключевые термины, протокол ОА1-РМН, метаданные.

Введение

В начале 1998 г. в Сибирском отделении РАН была сформирована целевая программа развития информационных ресурсов Отделения под общим названием «Электронная библиотека Сибирского отделения РАН». Для решения проблемы информационной обеспеченности сотрудников Отделения было принято решение о создании собственной универсальной Интегрированной распределенной информационной системы (ИРИС) СО РАН [1; 2], содержащей полнофункциональную систему об интеллектуальном потенциале Отделения (информационную систему об институтах, сотрудниках, достижения и других аспектах, связанных с работой Отделения) и систему электронной поддержки сбора и накопления научной информации (электронных атласов, электронных коллекций, баз данных и т. п.).

* Статья написана по материалам доклада, представленного на XV Российскую конференцию с международным участием «Распределенные информационно-вычислительные ресурсы» (DICR-2014), Новосибирск, 2-5 декабря 2014 URL: http://conf.nsc.ru/dicr2014/.

Работа выполнена при частичной поддержке РФФИ (проекты № 12-07-00472, 13-07-00258), президентской программы «Ведущие научные школы РФ» (грант НШ-5006.2014.9).

Шокин Ю. И., Федотов А. М, Жижимов О. Л., Федотова О. А. Эволюция информационных систем: от ШеЪ-сайтов до систем управления информационными ресурсами // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2015. Т. 13, вып. 1. С. 117-134.

ISSN 1818-7900. Вестник НГУ. Серия: Информационные технологии. 2015. Том 13, выпуск 1 © Ю. И. Шокин, А. М. Федотов, О. Л. Жижимов, О. А. Федотова, 2015

Основные направления программы связаны с формированием собственных электронных ресурсов по ведущим отраслям наук (математика, науки о земле, химия, биология, археология и др.), созданию и поддержке электронных коллекций и электронных публикаций, организации удобных систем доступа к библиотечным и библиографическим базам данных и базам данных институтов Отделения [3]. Результаты работ должны обеспечить:

• единую распределенную информационную среду Отделения;

• информационную поддержку исследований по фундаментальным и прикладным направлениям;

• поддержку профессионально-ориентированных систем подготовки и обмена научных документов;

• поддержку профессионально-ориентированных систем доступа и интерфейсов с хранилищами данных;

• коллективное использование приобретаемой электронной литературы, каталогов, баз данных и библиографических изданий;

• поддержку электронных версий научных журналов, издаваемых институтами Отделения;

• поддержку принятия и реализации организационных и управленческих решений в Отделении.

Информационный портал СО РАН

В основу создаваемой информационной системы был положен информационный WWW-сервер 1 Отделения, который стал интегрирующим звеном для системы поддержки информационных ресурсов Отделения (рис. 1). Сервер содержал разнообразную информацию о деятельности Сибирского отделения, включая: базу данных организаций и сотрудников СО РАН (рис. 2); доску объявлений; основные результаты исследований и годовые отчеты СО РАН; интеллектуальный (научный) потенциал Сибири; систему поддержки конференций

Рис. 1. Информационный сервер СОРАН

1 Сейчас он называется Порталом СО РАН (http://www.sbras.ru/) и, по данным Webometrics (на 03.02.2015), сайт занимает первое место в России (http://research.webometrics.info/en/ Europe/ Russian% 20Federation) среди научных организаций и 45-место в мире (http://research.webometrics.info/en/world).

Рис. 2. БД СО РАН

СО РАН; электронную библиотеку СО РАН; важнейшие разработки институтов СО РАН, предлагаемые для широкого использования; сеть Новосибирского научного центра; информационные проекты СО РАН; геоинформационные технологии в СО РАН; Дом ученых СО РАН; газету «Наука в Сибири» (рис. 3); справочные материалы по информационным ресурсам; нормативные документы РФ; фотоальбом Сибирского отделения РАН; историю Сибирского отделения РАН и много других ресурсов.

Основные ресурсы, созданные тогда, не потеряли своей актуальности до сих пор. В первую очередь отметим электронный атлас «Биоразнообразие животного и растительного мира Сибири» (рис. 4) [4], систему поддержки проведения конференций [5], виртуальной музей СО РАН [6], базу данных организаций и сотрудников СО РАН [7].

В результате работ по программе сложилось понимание того, что информационная система для поддержки научных исследований ИРИС должна основываться на использовании концепции электронных (цифровых) библиотек [8-11]. В рамках нашего подхода цифровые библиотеки рассматриваются как отдельная конкретная технология работы с цифровой информацией, образующая новый класс информационных систем (ИС), предназначенных для управления информационными ресурсами [12; 13].

Под термином электронная библиотека (ЭБ) в данной работе будем понимать систему управления структурированными каталогизированными коллекциями разнородных электронных (цифровых) объектов (ресурсов). Система управления информационными ресурсами не только обеспечивает поиск, навигацию по рубрикаторам (по словарям-классификаторам) и непосредственно предоставляет пользователю конкретный ресурс (публикацию, документ, фотографию, описание факта и др.), а также дополнительные сведения о нем, например, географическую привязку, информацию об авторах, информацию о фактах, библиографию, перечень организаций и т. д.

Рис. 3. Газета «Наука в Сибири

Концепция ИРИС

В настоящее время наиболее эффективным способом решения проблем организации доступа к распределенным информационным ресурсам является организация информации о них

в информационные системы, обличенные в форму электронных библиотек 2. В работах [14; 15] были сформулированы основные принципы реализации ИРИС, основанные использовании идеи электронных библиотек.

Отметим, что ЭБ - явление относительно новое, но уже достаточно популярное [16]. Тем не менее, ЭБ сегодня следует рассматривать как множество слабосвязанных сущностей, объединяемых, на первый, взгляд только общим названием [13; 17]. Современное название «электронная библиотека» - это не только и не столько дань моде, сколько попытка охарактеризовать новый феномен - возникновение принципиально нового класса систем, призванных аккумулировать и распространять информацию в электронной форме [18]. А большой интерес к самим системам данного класса объясняется потребностями общества и ростом возможностей по их удовлетворению [19].

В связи с этим можно сформулировать основные цели, стоящие перед ЭБ (системами управления информационными ресурсами) [20]:

• управление информационными ресурсами;

• обеспечение и управление доступом к информации;

• долговременное хранение информации;

• сохранение научного и культурного наследия;

• поддержка аналитической работы с информацией;

• повышение эффективности научных исследований и обучения.

В существующих разработках ЭБ, как правило, поиск и доступ к информации обеспечиваются только посредством визуальных графических интерфейсов. Это хорошо для пользователя-человека, но не годится для пользователя-системы. Для реализации функций поиска вне графических интерфейсов требуется поддержка специальных сетевых сервисов и языков запросов. В идеальном случае все ИС должны поддерживать единый поисковый профиль и единый язык запросов [12].

Однако в общем случае под словосочетанием «электронная библиотека» могут фигурировать совершенно различные объекты, такие как архивы цифрового контента и наборы программного обеспечения для управления этим контентом. ЭБ может называться система сетевых сервисов, предоставляющих доступ к цифровому контенту и объединенных единой системой управления этим доступом [20]. Такое определение ЭБ полностью соответствует определению традиционной библиотеки как организации в системе, например, Министерства культуры [12].

Ввиду того, что информация в ИС отображает некоторые сущности реального мира (физические объекты: предметы, процессы, явления, персоны, публикации, документы, алгоритмы, программы, файлы, факты, ключевые термины и т. д.), следует рассматривать ИС как множество информационных объектов - наборов данных, представляющих (описывающих) эти сущности в ИС. Отметим, что разработка модели ЭБ должна использовать онтологические описания и концептуальные модели, обобщающие накопленный опыт в сфере создания и использования ЭБ [20]. Неплохой обзор существующих концептуальных моделей ЭБ приведен в [22].

2 По-простому, понятие электронной библиотеки заключается в том, что любой ресурс должен быть стандартным образом каталогизирован, снабжен метаданными, правилами доступа и уникальным идентификатором.

Рис. 4. Страница из электронного атласа «Биоразнообразие животного и растительного мира Сибири»

Онтологическая модель ЭБ ИРИС основана на концептуальных моделях ЭБ RM OAIS 3 и DELOS DLRM 4.

В соответствии с концептуальной моделью DELOS Информационный ресурс (ИР) - это абстрактное понятие, выражаемое экземплярами одной из своих специализаций. В частности, экземплярами понятия ИР являются экземпляры информационного объекта любого типа (например, документы, базы данных, коллекции, функции и т. п.). Каждый ресурс в соответствии с моделью DELOS:

• имеет идентификатор;

• организован в соответствии с описанием ресурса. Ресурс может быть сложным и структурированным, поскольку он, в свою очередь, может состоять из меньших ресурсов и иметь связи с другими ресурсами;

• может регулироваться функциями, управляющими его жизненным циклом;

• выражается через информационный объект;

• должен быть описан метаданными, а также может быть описан или дополнен дополнительными метаданными и аннотациями.

В основе реализации Системы управления электронными библиотеками (СУЭБ) в ИРИС лежит метамодель, исходящая из того, что каждый информационный ресурс характеризуется набором присущих ему атрибутов и методов, характеризующих его свойства и связи с другими ресурсами. Эффективным средством описания информационных объектов выступают метаданные - данные, являющиеся неотъемлемой частью информационного объекта и описывающие реальный объект или группу объектов.

Каждый информационный объект в ИС состоит из (рис. 5):

• информационного содержания объекта (первичный информационный объект, например, изображение, полный текст и т. д.) - объект, который может использоваться самостоятельно;

• объект метаданные - объект, главная цель которого состоит в том, чтобы дать информацию об ИР (как правило о первичном информационном объекте);

• объект аннотация - объект, главная цель которого состоит в том, чтобы аннотировать ИР или его часть. Примеры таких аннотаций включают примечания, структурированные комментарии и связи. Объекты аннотации помогают интерпретировать ИР, содержат либо поддержку, либо детальные объяснения, либо информацию о том, как можно использовать ИР.

Рис. 5. Структура сущностей ИС

Документы

3 Open Archival Information System.

4 Digital Library Reference Model. ISO-14721 Reference Model for an Open Archival Information System (OAIS), Draft Recommended Standard, CCSDS 650.0-P-1.1 (Pink Book) Issue 1.1 Aug. 2009.

В информационном пространстве все информационные ресурсы: события, факты, программы и любые другие сущности реального или виртуального мира - существуют только в форме некоторых информационных объектов [23, 24], концептуальная модель которых была описана выше.

Бельгийский ученый П. Отле - пионер и основоположник науки «информатика» - в своем трактате о документации [25] определяет расширение понятия (термина) документ 5: «материальный объект, содержащий информацию, специально предназначенный для ее передачи в пространстве и времени», который трактуется как основной «объект», с которым оперирует любая информационная система [26]. Таким образом, документ - это информационный объект, представлявший структурированное описание реальной сущности (объекта, субъекта, факта или понятия), совокупность которых составляют информационное наполнение системы.

В ИС документ - это целостный информационный объект, представленный в цифровом виде, имеющий некоторый стандартный набор атрибутов и функций и допускающий однозначную идентификацию. Документ может описывать статью из журнала, сам журнал, персону, оцифрованное изображение, экспериментальные данные, программу или вычислительный алгоритм, базу данных, фрагмент базы данных и т. п. [23]. Например, документ не обязан содержать полный текст статьи, но в качестве атрибута он может содержать указатель на хранилище данных (репозиторий), где полный текст хранится. Кратко требования к документу можно охарактеризовать так (рис. 6):

• документ имеет уникальный идентификатор;

• документ имеет структурированное описание (метаданные);

• документ имеет набор атрибутов (свойств) и методов (функций);

• взаимодействие с документом (например, работа с атрибутами) происходит через набор методов (функций).

, L

Рис. 6. Свойства документа

Ключевым моментом в работе с документами является использование метаданных для формирования структуры, схемы данных и свойств документов - информационных элементов системы и ведения каталога системы. Система управления ИС опирается на метаинфор-мацию, содержащую онтологию, описывающую принципы организации информации. Онтология, описывающая конкретную предметную область, конкретизируется в схеме данных (атрибутов), описывающих информацию в метаданных [24].

Электронные библиотеки

5 Documentum (лат.) - доказательство. Candela L., Castelli D., Dobreva M., Ferro N., Ioanni-dis Y., Katifori H., Koutrika G., Meghini C., Pagano P., Ross S., Agosti M., Schuldt H., Soergel D. The DELOS Digital Library Reference Model Foundations for Digital Libraries. IST-2002-2.3.1.12. Technology-enhanced Learning and Access to Cultural Heritage. Version 0.98, Dec. 2007.

Как мы отмечали, электронные библиотеки - это распределенные каталогизированные информационные системы, позволяющие хранить, обрабатывать, распространять, анализировать, а также организовывать поиск в разнообразных коллекциях электронных (цифровых) документов. Основная задача, решаемая электронными библиотеками, - это управление информационными ресурсами и «интеграция информационных ресурсов (включая поддержку унифицированного доступа к ним), а также эффективная навигация в них» [23].

Под интеграцией информационных ресурсов понимается их объединение с целью использования (с помощью удобных и унифицированных пользовательских интерфейсов) разнородной информации с сохранением ее свойств, особенностей представления и пользовательских возможностей манипулирования с ней. При этом объединение ресурсов не обязательно должно осуществляться физически, оно может быть виртуальным, главное - оно должно обеспечивать пользователю восприятие доступной информации как единого информационного пространства. В частности, такие системы обеспечивают работу с гетерогенными наборами и базами данных или системами баз данных, обеспечивая пользователю эффективность информационных поисков независимо от особенностей конкретных систем хранения ресурсов, к которым осуществляется доступ [24].

Под эффективной навигацией в информационной системе понимается возможность для пользователя находить интересующую его информацию с наибольшей полнотой и точностью при наименьших затратах усилий во всем доступном информационном пространстве. При таком подходе хорошо известные информационно-поисковые системы, используемые в информационных системах и базах данных, являются частными случаями навигационных средств [23, 24].

В настоящее время существуют достаточно мощные ИС, удовлетворяющие в той или иной степени потребности научных работников в информации, однако основной недостаток большинства систем - ограниченность интеграции ресурсов как внутри каждой из них, так и с внешними системами. Основу разработки ЭБ составляют стандарты и международные рекомендации, формирующие профиль ЭБ, под которым понимается один или набор нескольких базовых нормативно-технических документов (стандартов и спецификаций), ориентированных на решение определенной задачи (реализацию заданной функции либо группы функций приложения или среды), с указанием, если нужно, выбранных классов, подмножеств, опций базовых стандартов, необходимых для выполнения конкретной функции 6. Наиболее важным является профиль метаданных информации, циркулирующей в системе. Выбор профиля метаданных должен основываться на выполнении следующих требований [20, 23, 27, 28]:

• включать описания основных типов информации, требующейся для поддержки научно-образовательной деятельности;

• быть открытым, т. е. обеспечивать доступ к информации в соответствии с ее описанием (метаданными);

• быть расширяемым, т. е. обеспечивать возможность детализации описаний;

• обеспечивать возможность интеграции информации;

• обеспечивать возможность уникальной идентификации информации;

• обеспечивать отбор, систематизацию и классификацию информации;

• обеспечивать возможности размещения и поиска информации в распределенной среде;

• быть ориентированным на современные технологии описания и использования информации;

• обеспечивать возможность интероперабельности с другими системами.

Отметим, что серьезной проблемой является идентификация информационных ресурсов [29], позволяющая получать библиографические сведения, а также устанавливать связи определенного ресурса с другими фактами и объектами.

При работе с цифровыми объектами уже выработан определенный набор стереотипов, отсутствие которых вызывает дискомфорт [12]. Одним из элементов этого набора является на-

6 ГОСТ Р ИСО / МЭК ТО 10000-2-99. Информационная технология. Основы и таксономия функциональных стандартов. Часть 2. Принципы и таксономия профилей ВОС.

личие взаимных ссылок между цифровыми объектами, например, в виде гиперсвязей в пользовательских графических интерфейсах просмотра информации. Реализация взаимных ссылок в цифровых документах не представляет большой сложности, однако здесь прослеживается своя специфика. Во-первых, электронный объект с реализованными связями уже не совсем соответствует своему печатному оригиналу. Во-вторых, внедренные в объект связи должны быть гарантированно актуальными. Так появляется требование обеспечения ссылочной целостности данных. Это очень жесткое требование, которое тяжело соблюсти даже в хорошо формализованных системах управления БД. Приемлемым решением здесь может быть замена жестких гиперссылок динамическими ассоциативными связями между документами (или между элементами, составляющими документ), определяемыми в момент представления документа пользователю, на уровне системы управления.

Существует достаточно много технологических разработок ИС для ЭБ, так или иначе ориентированных на поддержку научных исследований, например, еигоСИК 7, еЫЬгагу 8, Информика 9, МаШКЕТ 10. В большей степени удовлетворяет информационным потребностям научно-образовательного сообщества в информации система ИСИР (ЕНИП) РАН [27, 30].

Наиболее важным выводом из вышесказанного является следующий: информационная модель ЭБ должна быть многоуровневой и состоять как минимум из нескольких компонент [21; 23; 24]: хранилища данных (репозитория), сервера метаданных, сервера приложений (диспетчера), словарей-справочников (рис. 7).

Рис. 7. Архитектура ЭБ

Цифровые репозитории

Хранилище данных - цифровой репозиторий является одним из важнейших компонентов системы и предназначен только для обеспечения «функции» долговременного хранения информационных ресурсов. Тем самым функция хранения данных отделена и не зависит от других функций и сервисов системы.

Для организации системы долговременного хранения информационных ресурсов (репози-ториев цифровых объектов) международной организацией по стандартизации (ISO) предложен стандарт ISO-14721 (Open Archive Information System - OAIS 11). Эталонная модель для

7 http://www.eurocris.org/

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8 http://elibrary.ru/

9 http://www.informika.ru/

10 http://www.mathnet.ru/

11 OAIS - Открытая архивная информационная система.

стандарта OAIS - это концептуальная модель, основанная на расширенной схеме данных Dublin Core 12. Эта модель была использована многими организациями для разработки наборов метаданных и создания крупных хранилищ цифровых объектов.

На основе данной модели создана концепция «институционального репозитория» как системы долговременного хранения, накопления информации и обеспечения надежного доступа к цифровым объектам, представляющим собой результат интеллектуальной деятельности научного или образовательного учреждения. К основным особенностям институционального репозитория относятся:

• обеспечение разграниченного доступа к разнородным цифровым объектам (публикациям, изображениям и т. д.);

• организация доступа к информационным ресурсам для мирового сообщества (в том числе с помощью полнотекстового индексирования мировыми поисковыми системами);

• унифицированный доступ к метаданным по стандартным протоколам (поддержка ин-тероперабельности);

• возможность организации единой точки доступа к информационным ресурсам;

• сохранение других информационных ресурсов, в том числе неопубликованных, таких как диссертации, препринты и технические отчеты, программное обеспечение, мультимедиа и т. д.

Согласно данным сайта OpenDOAR 13, большинство институциональных репозиториев основано на свободном программном обеспечении и построено в рамках модели OAIS на базе технологий открытых систем. В настоящий момент в мире насчитывается более десятка систем поддержки институциональных репозиториев, наиболее популярные из них DSpace 14 (свыше 41% установок), E-Prints 15, Fedora 16 (сравнительную характеристику этих систем и описание используемых в них информационных моделей можно найти в [31]). Процесс интеграции репозитория в среду ЭБ для этих систем отличается лишь несущественными деталями и основан на модели агрегирования и распространения метаданных. Применение этой модели закреплено в протоколе OAI Protocol for Metadata Harvesting (далее OAI или OAI-PMH) 17, который поддерживается большинством систем, предназначенных для хранения информационных ресурсов.

В качестве репозитория для ИС была выбрана система DSpace. Выбор обусловлен тем, что она является самой популярной в мире и уже эксплуатируется в СО РАН 18 (а также в ряде других институтов и университетов России) на протяжении десяти лет.

Кроме того, система DSpace имеет ряд привлекательных особенностей. Для базовой организации данных зафиксирована определенная модель данных (DIM - внутренний формат данных DSpace), основанная на схеме Dublin Core и ее расширениях. При некотором напряжении при помощи этой схемы можно отобразить основные элементы всех используемых в настоящий момент форматов. Система с помощью фильтров метаданных, которые используются для преобразования метаданных из внутренней схемы в схемы, пригодные для обмена метаданными с внешними системами на основе XSLT 19 трансформаций, позволяет конвертировать и индексировать метаданные в разнообразных форматах (МЕКОФ 20, MODS 21,

12 DCMI - Dublin Core Metadata Initiative (http://www.dublincore.org/).

13 The Directory of Open Access Repositories. URL: http://www.opendoar.org/

14 DSpace [Электронный ресурс] : an open source solution for accessing, managing and preserving scholarly works // dspace.org [web-сайт] / MIT Libraries; HP Labs. - 2007. <http://www.dspace.org/>

15 EPrints Free Software [Электронный ресурс] // EPrints for Digital Repositories [web-сайт] / School of Electronics and Computer Science, University of Southampton, UK. - 2008. <http://www.eprints.org/>

16 Fedora [Электронный ресурс] : Fedora Repository System // Fedora Commons [web-сайт] / Gordon and Betty Moor Foundation; Cornell University Information Science; University of Virginia Library; The Andrew W. Mellon Foundation. - 2007. <http://www.fedora-commons.org/>

17 The Open Archives Initiative Protocol for Metadata Harvesting [Электронный ресурс]: Protocol Version 2.0 of 2002-06-14 // Open Archives Initiative: [web-сайт] / The OAI Executive; OAI Techical Commitee. 2004 (http://www.openarchives.org/).

1!i http://elib.nsc.ru: 8080/jspui/

19 http://www.w3.org/TR/xslt/

20 Этот формат наиболее привлекателен в России, т. к. подержан ГОСТом [35].

21 Metadata Object Description Schema (MODS) - http://www.loc.gov/standards/mods/

22 23 24

METS 22, QDC 23, MARC 2 и др.). Система хранит информацию о пользователях, поддерживает авторизацию и разграничивает доступ к содержимому репозитория по группам, сетевым адресам и на основе протокола LDAP 25, что при создании ИС дает возможность использовать уже существующую систему аутентификации пользователей (а не разрабатывать свою собственную) и достаточно легко дифференцировать публичные и служебные ресурсы, оставляя при этом свободный доступ к метаданным. Провайдеры данных для протоколов OAI-PMH, Z39.50 [32] 26 и SRW/SRU 27, стандартных для библиотечного сообщества, позволяют разрабатывать программный интерфейс для взаимодействия ИС поддержки ЭБ с хранилищем данных, построенном на основе DSpace.

Отметим, что для обеспечения работы ЭБ в рамках сформулированных выше функциональных требований, недостаточно метаданных, используемых для долговременного сохранения цифровых объектов (нужны дополнительные метаданные для организации связей между документами, способов представления документов и т. д., что подробнее изложено в следующем разделе), поэтому необходимо, чтобы метаданные хранились в системе поддержки ЭБ, независимой от той, которая использовалась при их создании.

Для синхронизации метаданных информационных ресурсов между ИС ЭБ и хранилищем данных используется сервис, основанный на применении протоколов OAI-PMH, SRW/SRU и сервера приложений на основе ZooPARK-ZS [33] (в зависимости от типа хранилища данных). В задачи этого сервиса входит извлечение метаданных из репозитория, конвертирование (при необходимости) и передача их серверу метаданных. Под конвертированием здесь понимается как преобразование метаданных и схем метаданных (например, QDC [34] в ГОСТ 7.19 28 или RUSMARC 29), так и преобразование форматов (например, в XML 30 или ISO-2709 31).

Следует подчеркнуть, что при взаимодействии с удаленными системами обмен метаданными должен происходить согласованно, с использованием форматов обмена.

Выбор метаданных для СУЭБ

Для поддержки сложных функций поиска и классификации необходимо обеспечить возможность поиска по атрибутам, полнотекстового поиска, а также просмотра ресурсов по категориям и словарям-классификаторам.

В существующих ИС информационные ресурсы разрознены, недостаточно систематизированы и структурированы. В ходе создания их описаний недостаточное внимание уделяется вопросам интероперабельности: слабо применяются соглашения и рекомендации по стандартизации представления документов и средства интеграции разнородных информационных ресурсов. Под интероперабельностью ИС понимается степень ее способности взаимодействовать с другими ИС, в том числе и с человеком. Но если при взаимодействии с человеком (как с ИС) основная нагрузка на достижение взаимопонимания ложится на последнего, способного обработать даже плохо организованную информацию, то для обеспечения эффективного взаимодействия между собственно ИС требуются специальные технологические ме-

22 Metadata Encoding and Transmission Standard (METS) - http://www.loc.gov/METS

23 Qualified Dublin Core (QDC) [29].

24 Machine-Readable Cataloging (MARC) - http://www.loc.gov/marc/

25 RFC 4510 [Электронный ресурс]: Lightweight Directory Access Protocol (LDAP): Technical Specification Road Map / OpenLDAP Foundation. - 2006. <http://www.apps.ietf.org/rfc/rfc4510.html>

26 ANSI/NISO Z39.50-2003. Information Retrieval (Z39.50): Application Service Definition and Protocol Specification. NISO Press, Bethesda, Maryland, U.S.A. November 2002.

27 SRU (Search/Retrieve via URL) [Электронный ресурс]. Режим доступа: http://www.loc.gov/standards/sru/ (дата обращения: 23.08.2013).

28 ГОСТ 7.19-2001. Система стандартов по информации, библиотечному и издательскому делу. Формат для обмена данными. Содержание записи

29 RUSMARC [Электронный ресурс]: Российский коммуникативный формат // Российская Библиотечная Ассоциация [web-сайт] / Российская Библиотечная Ассоциация. http://www.rba.ru:8101/rusmarc/

30 Extensible Markup Language (XML) 1.0 (Fourth edition) [Электронный ресурс] // World Wide Web Consortium [web-сайт]. - 2006. <http://www.w3.org/XML/>

31 ISO 2709:2008: Information and documentation - Format for information exchange // ISO - International Organization for Standardization. - 2008.

тоды и общие соглашения. Это влечет за собой необходимость соблюдения соответствия всех схем данных, интерфейсов и протоколов международным стандартам и рекомендациям [12, 20].

В работах [20, 21] был определен профиль ЭБ как необходимый набор стандартов и компонентов информационной системы, ориентированной на научные исследования.

В настоящее время существует большое количество систем метаданных, предназначенных для описания различных классов информационных ресурсов (документов). Использование систем метаданных (схем данных) пока еще недостаточно формализовано. ИС, ориентированные на одинаковые классы информационных ресурсов, используют различные, зачастую оригинальные системы метаданных и форматы метаописаний, а также разные подходы к решению прикладных задач. Устранением подобных несоответствий занимаются многие орга-

32 33 34 35

низации по всему миру, например, такие как как W3C 32, DCMI, OCLC 33, IFLA 34, IETF 35, ISO 36, RDA 37 и др.

Метаданные необходимы для решения следующих задач:

• предоставление сведений о документах для получения представления об их содержании, структуре, способах использования и т. д.;

• систематизация информации о документах;

• выбор из множества документов определенного подмножества по формальным признакам и сопоставление документов по формальным признакам;

• внутрисистемные технологические задачи, связанные с обеспечением подготовки документов, размещением документов в информационной среде и т. д.;

• внешние технологические задачи, связанные, прежде всего, с обменом данными с

внешними информационными системами.

Метаданные

ПоОщзде-ляюшая нч.

□писательные или структурные метаданные

Рис. 8. Классы метаданных

В связи с этим будем подразделять метаданные на следующие классы (рис. 8):

• административные или служебные метаданные - метаданные, несущие исключительно служебную информацию, например, дата модификации документа, владелец документа (не путать с автором), права доступа к документу и т. п.;

• системные метаданные - метаданные, обеспечивающие технологические задачи системы управления ресурсами, например, правила представления документов пользователю, правила преобразования схем данных структурных метаданных, правила определения ассоциативных связей между документами и т. п.;

32 World Wide Web Consortium (W3C). URL: http://www.w3.org/

33 Online Computer Library Center. URL: http://oclc.org/

24 International Federation of Library Association. URL: http://www.ifla.org/

35 Internet Engineering Task Force (IETF). URL: http://www.ietf.org/

36 International Organization for Standardization. URL: http://www.iso.org/

37 Research Data Alliance. URL: https://www.rd-alliance.org/

• описательные или структурные метаданные - метаданные в стандартном понимании, описывающие документ в соответствии с выбранной схемой данных, например, QDC или МЕКОФ.

Основу содержания в ИРИС составляют документы (информационные объекты), представляющие основные типы сущностей:

• субъекты: - персона, организация и т. д.;

• объекты (единицы хранения): - публикация, документ, факт, научный результат, мероприятие, фотография и др.;

• отношения: - понятие, ключевой термин, событие, время, место и т. п.

В отличие от общепринятых ЭБ указание на субъекты дается с помощью ссылки на экземпляр сущности «субъект», что позволяет корректно решать задачу идентификации объектов.

Используемый профиль определяет список элементов данных (полей), необходимых для создания записи соответствующего типа, и раскрывает содержание элементов данных. Для эффективной работы сервера приложений используется набор словарей-классификаторов, содержащих как классификационные признаки, так и наборы ключевых терминов (с отношениями порядка), по которым производится систематизация и классификация материала.

Для формирования метаданных применяются несколько стандартов, являющихся расширениями рекомендаций Dublin Core 38 и Qualified Dublin Core (QDC). Для документов была расширена стандартная схема метаданных QDC полями, включающими основные требования государственного стандарта МЕКОФ.

Словари (ключевые признаки, ключевые термины) - это особый вид метаданных, отражающих наиболее существенные свойства объекта и имеющие наиболее важное значение с точки зрения ИС. Специфика словарей определяется терминологией конкретной предметной области, которой посвящена ЭБ. Необходимо рассматривать различные типы ключевых терминов (ключевые термины в стандартном понимании; ключевые термины, описывающие персону; ключевые термины, описывающие организацию; ключевые термины, описывающие временные периоды; ключевые термины, описывающие географические понятия), а также тематические словари-классификаторы, тезаурусы, описания предметной области данной научной школы и классификаторы документов в соответствии с МЕКОФ.

Существует ряд российских (например, УДК 39, ГРНТИ 40) и международных (например, MSC-2000 41, ORTELIUS 42) словарей для классификации научных данных. Однако в целом эти словари содержат только общенаучную информацию и не подходят (хотя использовать их все равно нужно) для систематизации материалов.

Метаданные существенным образом зависят от природы и структуры объектов реального мира, от способа представления их в виде информационных объектов и от специфики ИС. Учитывая это, необходимо классифицировать описываемые объекты. Совокупность правил, достаточная для формирования метаданных в определенном классе ИС и (или) для решения определенного ряда задач над информационными объектами, представляет собой систему метаданных.

Практическая реализация

Рассмотренная модель ИС реализована в виде Системы управления ЭБ (СУЭБ ИРИС), созданной и эксплуатируемой в ИВТ СО РАН с 2004 г. [23]. Конечно, за это время производились некоторые технологические модификации, но принципы, заложенные тогда, сохранились и поддерживаются до сих пор.

38 http://www.dublincore.org/

39 УДК - Универсальная десятичная классификация.

40 ГРНТИ - Государственный рубрикатор научно-технической информации.

41 MSC-2000 - Математический классификатор. URL: http://www.ams.org/msc/msc.html

42 The «Ortelius Thesaurus on Higher Education». URL: http://cordis.europa.eu/cerif/src/sum_concl.htm

Рис. 9. Сайт СО РАН 2004 - 2014 гг.

Главное достоинство разработанной технологии состоит в том, что она позволила сохранить все созданные ресурсы в актуальном виде, поддерживает к ним доступ. Может быть, это является главной причиной высокого рейтинга сайта СО РАН.

СУЭБ ИРИС оперирует электронными коллекциями документов. Электронная коллекция - это набор документов, объединенных по смысловому признаку и имеющих одинаковую структуру (схему данных) [24]. СУЭБ позволяет работать с двумя видами коллекций: каталогами и тезаурусами. Принципиальное отличие каталогов от тезаурусов состоит в том, что в тезаурусах можно организовывать иерархические зависимости (родитель-потомок, часть-целое и т. п.) между записями. Коллекции-каталоги предназначены для хранения и обработки метаданных о документах различной природы: публикации, ключевые термины, персоны, организации, фотографии и т. д. Коллекции-тезаурусы предназначены для работы со словарями-классификаторами.

Сервер метаданных СУЭБ содержит служебную коллекцию Основной каталог метаданных, которая содержит документы, описывающие все метаданные, которые можно использовать в системе. Документы Основного каталога включают описания схемы метаданных QDC, расширенной метаданными для соответствия МЕКОФ и описания служебных метаданных, описывающими структуру объектов, пользовательские интерфейсы, ассоциативные связи между документами, права доступа к документам и т. д. (при желании он может быть расширен новыми метаданными).

Априори каждая коллекция (в зависимости от вида) имеет минимальный обязательный набор метаданных. Администратор коллекции имеет возможность доопределить схему метаданных коллекции, исходя из имеющихся метаданных из основного каталога.

В СУЭБ представлено два вида ассоциативных связей между документами (записями): жесткие и мягкие. Жесткие связи реализованы средствами СУБД путем ссылок на первичные ключи записи. К сожалению, такой тип связи не защищен от нарушения целостности (в случае неправильного изменения или удаления записи). Мягкие связи реализуются через процедуру поиска соответствий. Такой способ установления связей защищен от любых нарушений целостности БД и достаточно удобен пользователям, поскольку для указания на необходи-

мость связи используются наглядные мнемонические определения. Соответствия устанавливаются следующими способами.

• Ссылка на идентификатор записи - уникальный в пределах одной коллекции, текстовый код, формируемый в рамках конкретной коллекции по определенным правилам. Например, для коллекции, содержащей описания персон, идентификатор формируется (на русском языке) последовательно из фамилии, инициалов и года рождения. Отметим, что за десять лет эксплуатации СУЭБ не было зафиксировано ни одного конфликта при формировании идентификаторов.

• Ссылка на ключевой термин - особый вид метаданных, выбираемый из словаря ключевых терминов, по существу представляющий собой тезаурус предметной области коллекции. Ссылка определяет запись, в которой данный ключевой термин присутствует в метаданных.

Для внутреннего долговременного хранения цифровых объектов используется репозито-рий DSpace. Стандартная схема метаданных DSpace, основанная на схеме DCMI, расширена полями, отвечающими основным требованиям МЕКОФ. Для поддержки процесса наполнения полнотекстовых БД созданные профили метаданных зарегистрированы в системе DSpace, и в соответствии с ними настроены рабочие процессы, а также пользовательский интерфейс системы.

С целью организации обмена метаданными между DSpace и сервером метаданных (а также с другими системами с расширенным профилем) создан специальный сервис, выполняющий преобразование метаданных из внутренней схемы DSpace в другие схемы метаданных, в том числе и в схему DCMI, с использованием квалификаторов (QDC 43), а также в схему МЕКОФ (представление ISO2709 или XML). Реализован OAI-PMH сервис, который в пакетном режиме периодически, в соответствии с расписанием, проводит синхронизацию метаданных репозитория и сервера метаданных. Для заполнения основного каталога метаданных в соответствии с созданными схемами метаданных используются контролируемые словари из справочного блока сопровождения. Для обеспечения интероперабельности данных DSpace также задействован сервер приложений на основе ZooPARK-ZS, реализующий доступ к метаданным системы по протоколам Z39.50 и SRW/SRU.

Разработанная модель может быть использована как типовая модель системы для работы с документами, связанными с научно-образовательной деятельностью, поскольку решает основные задачи, предъявляемые к этим системам: обеспечение системы надежного долговременного хранения цифровых (электронных) документов с сохранением всех смысловых и функциональных характеристик исходных документов; обеспечение «прозрачного» поиска и доступа пользователей к документам, как для ознакомления, так и для анализа содержащихся в них фактов; организация сбора информации по удаленным цифровым репозиториям, поддерживающим протоколы OAI-PMH, SRW/SRU, Z39.50.

Рассмотренная технология создания и поддержки информационных ресурсов кроме работы с научными коллекциями с успехом была реализована в научно-образовательной сфере на примере ЭБ научной школы Алексея Андреевича Ляпунова - основателя теоретического программирования и российской кибернетики, а также в виде ЭБ учебных пособий 44 по курсам «Современные проблемы информатики и вычислительной техники», «Вычислительные системы», «Информатика» и «Экология» и др.

Список литературы

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Шокин Ю. И., Федотов А. М. Распределенные информационные системы // Вычислительные технологии. 1998. Т.3, № 5. С.79-93.

2. Шокин Ю. И, Федотов А. М. Электронная библиотека Сибирского отделения РАН // Электронные библиотеки: Рос. науч. электрон. журн. 1999. Т. 2. Вып. 4. URL: http://www. elbib.ru/index.phtml?page=elbib/rus/journal/1999/part4/fedotov (дата обращения: 04.09.2014).

3. Шокин Ю. И., Федотов А. М., Жижимов О. Л, Мазов Н. А. Интегрированная распределенная информационная система (ИРИС) Сибирского отделения РАН // Материалы выездного заседания научно-координационного совета по целевой программе «Информационно-

43 Qualified Dublin Core (QDC). URL: http://www.dublincore.org/documents/dcmi-terms/

44 http://fedotov.nsu.ru/lecture.php

телекоммуникационные ресурсы СО РАН», Иркутск, 29-30 августа 2002 г. Иркутск: Ин-т географии СО РАН, 2003. С. 139-149.

4. Федотов А. М., Артемов И. А., Ермаков Н. Б., Красников А. А., Потемкин О. Н, Ряб-ко Б. Я, Федотов А. А., Хорев А. Г. Электронный атлас «Биоразнообразие растительного мира Сибири» // Вычислительные технологии. 1998. Т.3, № 5. С. 68-78.

5. Федотов А. М., Гуськов А. Е, Молородов Ю. И. Информационная система поддержки проведения конференций СО РАН // Материалы выездного заседания научно-координационного совета по целевой программе «Информационно-телекоммуникационные ресурсы СО РАН», Иркутск, 29-30 августа 2002, г. Иркутск: Ин-т географии СО РАН, 2003. С. 91-110.

6. Шокин Ю. И, Ламин В. А, Федотов А. М. и др. Виртуальный музей науки и техники СО РАН // Материалы выездного заседания научно-координационного совета по целевой программе «Информационно-телекоммуникационные ресурсы СО РАН», Иркутск, 29-30 августа 2002, г. Иркутск: Ин-т географии СО РАН, 2003. С. 118-125.

7. Леонова Ю. В, Клименко О. А., Федотов А. М. Информационная система «База данных организаций и сотрудников СО РАН». Новосибирск: РИЦ Прайс-Курьер, 2005. С. 55

8. Федотов А. М., Шокин Ю. И. Электронная библиотека Сибирского отделения РАН // Информационное общество. 2000. № 2. С. 22-31.

9. Шокин Ю. И., Федотов А. М. Библиотека, работающая круглосуточно // ЭКО. 2000. № 6. С. 163-172.

10. Шокин Ю. И., Федотов А. М. Информационная система Сибирского отделения РАН // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: Сб. докл. Протвино, 2000. С.6-15.

11. Шокин Ю. И., Федотов А. М. Электронная библиотека Сибирского отделения РАН // Информационно-библиотечное обеспечение науки. Проблемы интеграции информационных ресурсов: Сб. науч. тр. 2000. С. 118-128.

12. Жижимов О. Л, Мазов Н. А., Федотов А. М. Некоторые заметки об эволюции цифровых репозиториев традиционных библиотек к полнофункциональным электронным библиотекам // Вестн. Владивосток. гос. ун-та экономики и сервиса. Территория новых возможностей. 2010. Т. 7, № 3. C. 55-63.

13. Антопольский А. Б., Вигурский К. В. Концепция электронных библиотек. Электронные библиотеки: рос. науч. электронный журн. 1999. Т. 2. Вып. 2. URL:

http://www.elbib.ru/index.phtml?page=elbib/rus/journal/1999/part2/antopol (дата обращения: 04.05.2013).

14. Федотов А. М. Концептуальные подходы к построению распределенных систем // Тр. Междунар. конф. по вычислительной математике (МКВМ-2004): Рабочие совещания. Новосибирск: ИВМиМГ СО РАН, 2004. С. 132-143.

15. Шокин Ю. И., Федотов А. М. Поддержка и развитие распределенных информационно-вычислительных ресурсов в СО РАН // Вычислительные технологии. (Совместный выпуск). Вестн. Каз нац. ун-та им. аль-Фараби. Серия: Математика, механика, информатика. 2004. Т.42, Ч. 4, № 3. С.324-334.

16. Земсков А. И, Шрайберг Я. Л. Электронные библиотеки: Учеб. пособие для студентов ун-тов и вузов культуры и искусств и др. учеб. заведений. 3-е изд. М.: ГПНТБ России, 2004.

17. Воройский Ф.С. Электронные и традиционные библиотеки - суть не одно и то же. Электронные библиотеки: рос. науч. электронный журн. 2003. Т. 6. Вып. 5. URL: http://www. elbib.ru/index.phtml?page=elbib/rus/journal/2003/part5/voroisky (дата обращения: 04.05.2010).

18. Акимов С. И, Елизаров А. М., Ершова Т. В., Когаловский М. Р., Федоров А. О., Хохлов Ю. Е. Научно-методическая поддержка разработки научных электронных библиотек. Электронные библиотеки: рос. науч. электронный журн. 2005. Т. 8, № 1. URL:

http://www.elbib.ru/index.phtml?page=elbib/rus/journal/2005/part1/AEEKFH.

19. Вигурский К. В. Что такое электронная библиотека? Доклад на конференции «Информационные технологии в образовании - 2005». URL: http://rd.feb-web.ru/library.htm.

20. Федотов А. М., Барахнин В. Б., Жижимов О. Л, Федотова О. А. Технология создания корпоративных информационных систем учета трудов научных работников // Вестн. Ново-сиб. гос. ун-та. Серия: Информационные технологии. 2011. Т. 9, № 2. С. 31-41.

21. Жижимов О. Л., Федотов А. М., Федотова О. А. Построение типовой модели информационной системы для работы с документами по научному наследию // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2012. Т. 10, № 2. С. 5-14.

22. Резниченко В. А, Проскудина Г. Ю, Кудим К. А. Концептуальная модель электронной библиотеки // Тр. XI Всерос. науч. конф. «RCDL'2009», Россия, г. Петрозаводск (Карелия), 17-21 сентября 2009 г. Петрозоводск, 2009. С. 23-31.

23. Шокин Ю. И, Федотов А. М, Гуськов А. Е, Жижимов О. Л, Столяров С. В. Электронные библиотеки - путь интеграции информационных ресурсов Сибирского отделения РАН // Вестн. Каз нац. ун-та. Серия: Математика, механика, информатика. - Алматы: КазНУ, 2005. № 2. С. 115-127.

24. Федотов А. М. Методологии построения распределенных систем // Избр. докл. X Рос. конф. «Распределенные информационно-вычислительные ресурсы» (DICR-2005), Новосибирск, 6-8 октября 2005 г.; Вычислительные технологии. - Новосибирск: ИВТ СО РАН, 2006. Т.11. С. 3-16.

25. Otlet P. Traite de documentation. Bruxelles: Ed. Mundaneum, 1934.

26. Отле П. Библиотека, библиография, документация: Избр. тр. пионера информатики. М.: ФАИР-ПРЕСС: Пашков Дом, 2004.

27. Бездушный А. Н, Бездушный А. А, Серебряков В. А., Филиппов В. И. Интеграция метаданных Единого Научного Информационного Пространства РАН. М.: Вычислительный Центр им. А. А. Дородницына РАН, 2006.

28. Федотов А. М., Барахнин В. Б., Жижимов О. Л, Федотова О. А. Модель информационной системы для поддержки научно-педагогической деятельности // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2014. Т.12, № 1. С. 89-101.

29. Федотов А. М., Жижимов О. Л, Князева А. А., Колобов О. С, Мазов Н. А., Турчанов-ский И. Ю., Федотова О. А. Проблемы авторитетного контроля для распределенных электронных библиотек и библиографических баз данных. // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2011. Т. 9, № 1. С. 89-101.

30. Захаров А. А, Серебряков В. А. Система управления электронными библиотеками LibMeta // Тр. XII Всерос. науч. конф. «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» - RCDL'2010. Казань, 2010. С. 28-37.

31. Кудим К. А,. Проскудина Г. Ю, Резниченко В. А. Сравнение систем электронных библиотек EPrints 3.0 и DSpace 1.4.1 // IX Всерос. науч. конф. «Электронные библиотеки: перспективные методы и технологии, электронные коллекции». Переяславль-Залесский, 1518 октября 2007 г. Переяславль-Залесский, 2007.

32. Жижимов О. Л, Мазов Н. А. Принципы построения распределенных информационных систем на основе протокола Z39.50. ОИГГМ СО РАН, Новосибирск: ИВТ СО РАН, 2004. 361 с.

33. Жижимов О. Л., Федотов А. М., Шокин Ю. И. Технологическая платформа массовой интеграции гетерогенных данных // Вестн. Новосиб. гос. ун-та.. Серия: Информационные технологии. 2013. Т. 11, № 1. С. 24-41.

Материал поступил в редколлегию 25.04.2015

I. Yu. Shokin 1, A. M. Fedotov 1 2, O. L. Zhizhimov \ O. A. Fedotova 3

1 Insitute of Computational Technologies SBRAS 6Lavrentiev Ave., Novosibirsk, 630090, Russian Federation

2 Novosibirsk State University 2 Pirogov Str., Novosibirsk, 680090, Russian Federation

3 The Sate Public Scientific Technological Library of the SRAS 15 VoskhodStr., Novosibirsk, 630008, Russian Federation

shokin@ict.nsc.ru, fedotov@sbras.ru, zhizhim@mail.ru, 04f8@mail.ru

THE EVOLUTION OF INFORMATION SYSTEMS: FROM WEBSITES TO INFORMATION RESOURCE MANAGEMENT SYSTEMS

The works on development of Integrated Distributed Information Systems (IDIS SB RAS) has been carried out by ICT SB RAS since 1998. This paper is devoted to the history and description of

technology for the system development. The information system architecture and principles of integration with external resources, rules for the declaration and conversion of metadata, as well as works with dictionaries that are used to organize and classify information resources and modeling of relations between them are described.

Keywords: IDIS SB RAS, informational system, digital library, dictionary, classification of information resources, digital repository, thesaurus for information retrieval, key terms, OAI-PMH protocol, metadata.

References

1. Shokin Yu. I., Fedotov A. M. Distributed Information Systems. Computational Technologies, 1998, vol. 3, № 5, p. 79-93.

2. Shokin Yu. I., Fedotov A. M. Digital Library of SB RAS. Russian Digital Libraries. 1999, vol. 2 , iss. 4. URL: http://www.elbib.ru/index.phtml?page=elbib/rus/journal/1999/part4/fedotov (date of access: 04.09.2014).

3. Shokin Yu. I., Fedotov A. M., Zhizhimov O. L., Mazov N. A. Integrated Distributed Information Systems (IDIS) SB RAS. Information resources of SB RAS: proceedings. Irkutsk, 2003, p.139-149.

4. Fedotov A. M., Artyomov I. A., Ermakov N. B., Krasnikov A. A., Potyomkin O. N., Ryabko B. Y., Fedotov A. A., Khorev A. G. Electronic atlas «Biological variety of the Siberian flora» // Computational Technologies. 1998, vol. 3, № 5, p. 68-78.

5. Fedotov A. M., Guskov A. E., Molorodov Yu. I. Conference Information System of SB RAS. Information resources of SB RAS: proceedings. Irkutsk, 2003, p. 91-110.

6. Shokin Yu. I., Lamin V. A., Fedotov A. M. Virtual museum of science and technique SB RAS. Information resources of SB RAS: proceedings. Irkutsk, 2003, p. 118-125.

7. Leonova Y. V., Klimenko O. A., Fedotov A. M. The Information System «Database of organizations and employees of SB RAS». Novosibirsk, 2005. 55 p.

8. Fedotov A. M., Shokin Yu. I. The Digital Library of SB RAS. The Information Society. 2000. № 2, p. 22-31.

9. Shokin Yu.I., Fedotov A.M. Library that working twenty-four hours a day // ECO. 2000, № 6, p.163-172.

10. Shokin Yu.I., Fedotov A.M. The Informational System of SB RAS // RCDL'2000 proceedings. - 2000, p. 6-15.

11. Shokin Yu. I., Fedotov A. M. Digital Library of SB RAS. Information and Library support of science. Problems of information resources integration: proceedings. Moscow, 2000, P. 118128.

12. Zhizhimov O. L., Mazov N. A., Fedotov A. M. Some notes on the evolution of digital repositories of traditional libraries to a full-featured digital libraries. Vestnik of Vladivostok State University of Economics and Service. Territory for new opportunities, 2010, № 3 (7), p. 55-63.

13. Antopol'skiy A. B., Vigurskiy K. V. The concept of digital libraries // Russian Digital Libraries Journal. 1999, vol. 2, iss. 2. URL: http://www.elbib.ru/index.phtml? page=elbib/rus/journal/1999/part2/antopol (date of access: 04.05.2013).

14. Fedotov A. M. Conceptual approaches to distributed system development // Proceedings of The International Conference on Computational Mathematics (ICCM-2004). Novosibirsk, 2004, p.13-143.

15. Shokin Yu. I., Fedotov A. M. Support and development of distributed information and computation resources in SB RAS. Computational Technologies (Joint issue). Vestnik KazSU. Mathematics, mechanics, informatics series, 2004, vol. 42, part 4, № 3, p. 324-334.

16. Zemskov A. I., Shraiberg Y. L. Digital libraries. - Moscow: National Public Library for Science and Technology. 2004, 130 p.

17. Voroisky F. S. Traditional and digital libraries are not one and the same / Russian Digital Libraries Journal, 2003, vol. 6, № 5. URL: http://www.elbib.ru/index.phtml?page= elbib/rus/journal/2003/part5/voroisky (date of access: 04.05.2010).

18. Akimov S. I., Elizarov A. M., Ershova T. V., Kogalovskiy M. R., Fedorov A. O., Hohlov Yu. E. Research and methodological support to the development of scientific digital libraries. Rus-

sian Digital Libraries Journal. 2005, vol. 8, № 1. URL: http://www.elbib.ru/index.phtml?page= elbib/rus/journal/2005/part1/AEEKFH.

19. Vigursky K. V. What is a digital library? Information Technologies in Education - 2005: report. URL: http://rd.feb-web.ru/library.htm.

20. Fedotov A. M., Barakhnin V. B., Zhizhimov O. L., Fedotova O. A. The technology of creation of corporate information systems for accounting resources, created by researchers. Vestnik NSU: Information Technologies, 2011, vol. 9, № 2, p. 31-41.

21. Zhizhimov O. L., Fedotov A. M., Fedotova O. A. Building a generic model of information system for working with documents on the scientific heritage. Vestnik NSU: Information Technologies, 2012, vol. 10, № 2, p. 5-14.

22. Reznichenko V. A., Proskudina G. Yu, Kudim K. A. Conceptual Model of Digital Library // Digital Libraries: Advanced Methods and Technologies, Digital Collections: Proceedings of the XI All-Russian Research Conference RCDL'2009. Petrozavodsk: KRC RAS, 2009, p. 23-31.

23. Shokin Yu. I., Fedotov A. M., Zhizhimov O. L., Guskov A. E., Stolyarov S. V. Digital Libraries - the path of integration of information resources of the SBRAS. Vestnik KazSU: Special Issue. Almaty, Kazakhstan, Al-Farabi Kazakh National University, 2005, № 2, p. 115-127.

24. Fedotov A. M. Methodologies of the distributed systems buildup. Computational Technologies: Special Issue. 2006, vol. 11, p. 3-16.

25. Otlet P. A Treatise on Documentation. Brussels, Mundaneum, 1934.

26. Otlet P. Library, bibliography, documentation: Selected works of the pioneer of computer science. Moscow: FAIR-PRESS, Pashkov Dom, 2004, 348 p.

27. Bezdushnyi A. N., Bezdushnyi A. A., Serebryakov V. A., Filippov V. I. Integration of metadata of the Unified Scientific Information Space of the Russian Academy of Sciences. Moscow, 2006. 238 p.

28. Fedotov A. M., Zhizhimov O. L., Fedotova O. A., Barakhnin V. B. A model of information system to support scientific and educational activities // Vestnik NSU. Series: Information Technologies. 2014, vol. 12, iss. 1, p. 89-101.

29. Fedotov A. M., Zhizhimov O. L., Knyazeva A. A., Kolobov O. S., Mazov N. A., Turchanovsky I. Yu., Fedotova O. A. Problems of authority control for distributed digital libraries and bibliographic database. Vestnik NSU. Series: Information Technologies. 2011, vol. 9, № 1, p. 89-101.

30. Zakharov A. A., Serebryakov V. A. Digital library management system LibMeta. Proceedings of the RCDL 2010. Kazan, 2010, p. 28-37.

31. Kudim K. A., Proskudina G. Yu., Reznichenko V. A. Comparison of repository systems EPrints 3.0 and DSpace 1.4.1. Proceedings of the RCDL 2007. Pereslavl, 2007.

32. Zhizhimov O.L., Mazov N.A. Principles of Construction of the Distributed Information Systems on the Basis of the Protocol Z39.50. Novosibirsk, ICT SB RAS, 2004. 361 p.

33. Zhizhimov O. L., Fedotov A. M., Shokin Yu. I. Technology platform for the mass integration of heterogeneous data // Vestnik NSU. Series: Information Technologies. 2013, vol. 11, № 1, p. 24-41.

i Надоели баннеры? Вы всегда можете отключить рекламу.