Научная статья на тему 'Распределенные электронные библиотеки'

Распределенные электронные библиотеки Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
396
44
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Глухов В. А., Лаврик О. Л.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Распределенные электронные библиотеки»

СОВРЕМЕННОЕ СОСТОЯНИЕ И ПЕРСПЕКТИВЫ РАЗВИТИЯ АВТОМАТИЗИРОВАННЫХ ИНФОРМАЦИОННЫХ СИСТЕМ

В.А.ГЛУХОВ, О.Л.ЛАВРИК РАСПРЕДЕЛЕННЫЕ ЭЛЕКТРОННЫЕ БИБЛИОТЕКИ

Библиотеки были изобретены человечеством, чтобы хранить документальные источники и предоставлять их в общественное пользование. Библиотеки и занимались комплектованием документов в формах, присущих каждой конкретной эпохе — глиняных табличках, папирусных свитках, рукописях, печатных изданиях и, наконец, изданиях на электронных носителях.

Библиотечные Интернет-технологии

Развитие сети Интернет поставило перед каждой библиотекой задачи, которые условно можно разделить на две группы:

1) организация удаленного доступа к письменным источникам, хранящимся в библиотечных фондах; 2) обеспечение доступа для своих читателей к “чужим” информационным ресурсам, доступным через Интернет.

Если проанализировать развивающиеся сейчас направления библиотечных работ, связанных с Интернетом то можно заметить, что первая группа задач решается главным образом за счет:

— обеспечения доступа к собственным электронным каталогам, проблемноориентированным библиографичес-ким базам данных, сводным каталогам библиотек, а также организации доступа к каталогам различных библиотек по сетевым поисковым протоколам типа 739. 50;

— публикации в Интернете электронных версий специализированных библиотечных изданий (журналов, библиографических списков, указателей литературы, каталогов выставок и т.д.);

— создания полнотекстовых баз данных (включающих как издания самих библиотек, так и электронные версии книг и журналов из их библиотечных фондов) и обеспечения поиска в этих массивах через Интернет;

— предоставления услуг по электронной доставке документов и электронному межбиблиотечному абонементу.

Российские библиотеки и информационные центры получили возможность работы с Интернетом не так давно, примерно в 1996-1997 гг. Таким образом, теоретические и практические разработки в этой области, по сути, только начинаются. Прежде всего, они сосредоточены на обеспечении доступа к электронным каталогам и базам данных для удаленных пользователей библиотек. Это каталоги таких организаций, как БЕН (http://ben.irex.ru), ГПНТБ СО РАН (http://info.spsl.nsc.ru), ГПИБ (http://www.shpl.ru/), ГПНТБ России (http://www.gpntb.ru/), ИНИОН РАН (http://www.inion.ru/), ЦНСХБ (http://www.cnsxb.ru/), НБ МГУ (http://www.msu.su/), ряда региональных и вузовских библиотек. Поиск можно провести и в электронном каталоге РГБ (http://www.rsl.ru/), но лишь по поступ-лениям последних лет.

Многие библиотеки публикуют на своих wеb-страницах текстовые файлы со списками библиографических указателей различных типов, дают перечни предоставляемых продуктов и услуг, рекламируя собственные информационные ресурсы, издания, которые они могут поставлять в традиционных режимах, открывают так называемые “электронные магазины”.

Полнотекстовых баз данных электронных журналов, представляющих интерес не только для библиотекарей, на «еЬ-страницах библиотек практически нет. Чаще всего это труды сотрудников данной библиотеки и периодические издания по библиотечной тематике. Лишь ВИНИТИ, ИНИОН и ВНТИЦ публикуют полные версии некоторых из издаваемых ими научных журналов, но эти организации и не являются чисто библиотечными учреждениями.

С другой стороны, работы по оцифровке фонда источников начинаются сейчас во многих библиотеках. Создается хранилище электронных текстов источников в ИНИОН. В ГПНТБ СО РАН создана полнотекстовая БД прижизненных изданий А.С.Пушкина, завершается работа над электронной коллекцией аналитических обзоров по экологии. Не слишком большие достижения библиотек в этой области объясняются не только отсутствием у них достаточной материально-технической базы, но прежде всего проблемой соблюдения авторских прав. В обычной практике библиотеки редко принимают во внимание эту проблему, например, ксерокопируя источники по заказам своих читателей. То же копирование, только в электронном виде, не говоря уже о создании хранилищ электронных копий книг и журналов из библиотечных фондов и предоставление доступа к ним через Интернет, является нарушением существующих законодательных актов в области авторского права, весьма, надо сказать, несогласованных. Именно поэтому библиотеки сейчас выставляют в Интернете главным образом собственную продукцию, а она, за исключением библиографических указателей и списков литературы, ориентирована только на библиотекарей.

Технологию электронной доставки документов (ЭДД) освоили в

экспериментальном режиме все крупнейшие библиотеки страны. ЭДД обеспечивает удаленный доступ к источникам, хранящимся в традиционном виде. В упрощенном виде здесь действует следующая схема: читатель обращается в свою библиотеку с просьбой заказать копию статьи из журнала, который она не выписывает. Заказ по электронной почте или через Интернет направляется в ту библиотеку, которая может его выполнить. Источник сканируется, и электронная копия пересылается библиотеке-посреднику. Читателю выдается либо распечатка, либо файл на дискете.

Некоторые библиотеки (ИНИОН, РГБ, ГПИБ) имеют интер-фейс, позволяющий удаленному пользователю напрямую оформить заказ у исполнителя, минуя посредника — местную библиотеку.

Несмотря на весьма простую и не очень затратную технологию, не так много библиотек перешли на промышленный режим ЭДД. К ним можно отнести (помимо уже упоминавшихся ИНИОН, РГБ и ГПИБ) ВИНИТИ, ГПНТБ СО РАН, ЦНСХБ (1). Эти библиотеки, а также БАН, БЕН, ВПТБ, ВНТИЦ и некоторые другие сейчас объединяются в Ассоциацию российских служб ЭДД, целью которой является взаимодействие в обеспечении своих читателей и удаленных пользователей электронными копиями первоисточников из библиотечных фондов.

На первом этапе Ассоциация будет работать по следующей схеме. Любой читатель может обратиться за электронной копией в любую библиотеку, входящую в Ассоциацию. Заказ по электронной почте методом общей рассылки будет направлен сразу всем библиотекам — членам Ассоциации. Библиотеки определяют, кто из них может выполнить заказ, и сообщают отправителю. Затем изготавливается копия и передается библиотеке-заказчику, которая в свою очередь передает ее читателю. Таким образом, читатели смогут через интерфейс ЭДД на сервере РГБ или ИНИОН заказать копию статьи, которая будет сделана, например, в ГПНТБ СО РАН в Новосибирске или в БАН в Санкт-Петербурге.

Несмотря на появление электронной доставки документов, библиотеки продолжают совершенствовать межбиблиотечный абонемент. Развивается так называемый электронный МБА. Так, на протяжении двух лет стабильно работает встроенный в электронные каталоги БЕН, ГПНТБ СО РАН и др. модуль заказа по МБА через Интернет (2, 3).

Однако если мы внимательно посмотрим на описанные выше направления деятельности библиотек в Интернете, то можем заметить, что это всего лишь новые технологические решения традиционных библиотечных процессов. И предоставление удаленного доступа к собственным электронным каталогам, библиографическим, фактографическим и даже полнотекстовым базам данных, и заказ, и выполнение услуг по каналам связи, и МБА — в принципе все это имело место и до появления Интернета. С

развитием техники и телекоммуникаций эти направления традиционной библиотечной деятельности лишь поменяли форму своей реализации.

Работа библиотек с ресурсами Интернета

Решение второй группы задач — предмет активных дискуссий библиотекарей-практиков и библиотекарей-теоретиков. С ней связано также появление термина “Шете^ ііЬгягіяп”. Помимо очевидного направления работы — поиска информации (библиографической, фактографической, полнотекстовой) в Интернете, выполнения справок по заказу удаленных пользователей и своих читателей, — библиотеки начали каталогизацию ресурсов Интернета. Эта работа первоначально развивалась (и продолжается до сих пор) как публикация на web-страницах аннотированных или неаннотированных списков ссылок на различные информационные ресурсы. Не имея возможности приобрести и сохранить саму инфор-мацию, библиотеки таким образом пытаются хотя бы обеспечить своим пользователям удобную навигацию в сети Интернет.

Однако накопление библиотеками таких ссылок и особенно поддержание их в актуальном состоянии весьма неэффективно. По опыту работы ряда библиотек средний срок нахождения информации по конкретному адресу — полгода (4). Правда, сейчас появились программы-роботы, позволяющие отслеживать ссылки, удерживать их в актуальном состоянии (см., например, (5)). Кроме того, как правило, ссылки создаются на весь информационный ресурс или его крупные части, а этого явно недостаточно. Если мы делаем ссылку, скажем, на электронное хранилище полных текстов журналов или книг, то что мы сообщаем пользователю? Информацию о том, что существует такой ресурс, не более. Это все равно, что сказать: “Ступайте в ближайшую библиотеку, там есть литература по интересующей вас теме”. Допустим, мы не просто сообщаем пользователю о существовании таких электронных коллекций, но и публикуем у себя перечень журналов и книг, которые они содержат. Это уже лучше, но все же мы опять отсылаем пользователя к этой электронной коллекции, предоставляя ему возможность самому отыскать конкретные публикации78. Ниже мы еще вернемся к этому вопросу.

Что же принципиально нового может появиться и появляется в работе библиотек с использованием и развитием сети Интернет? Возможно, в скором времени станет практикой архивирование самих информационных ресурсов Интернета. Прежде всего — это работа по описанию, учету, а возможно, и сохранению резервных копий этого нового вида информационных ресурсов — так, как это делается с обычными печатными изданиями в библиотеках и архивных хранилищах. Как мы уже говорили, это социальная задача библиотек, и сейчас она просто должна распространиться на новый вид ресурсов. Создатели этих ресурсов, так же как и издатели традиционных книг и журналов, в меньшей, чем библиотеки, степени ориентированы на сохранение электронных ресурсов для потомков. Пока, однако, этот вопрос даже не ставится, а его решение имеет массу сложностей — научных, организационных, правовых и технических.

Распределенные электронные библиотеки

Еще одно направление работы — создание электронных библиотек — пошло по пути оцифровывания печатных источников и приобретения прав на электронные источники у издателей. При этом электронные фонды таких библиотек, как правило, автономны, замкнуты и расширяются лишь за счет тех же списков ссылок на другие ресурсы. Такие

78 Форма представления информации на web-страницах библиотек носит несистемный характер с точки зрения распределения задач, аналогичного тому, которое сложилось в традиционной библиотечной среде и по линии Минкультуры, и РАН, не говоря уж о ГСНТИ. С одной стороны - имеет место массовое дублирование, начиная от web-адресов библиотек, причем не всегда полных и часто неточных, с другой - полное отсутствие систематизированных Интернет-ресурсов по тематике и проблемам, за информационную поддержку которых отвечает данная библиотека в традиционной системе. По нашей предварительной оценке, то, что библиотеки рекламируют и собирают на своих web-страницах - в 80% случаев имеет отношение к деятельности самих библиотек (данные о библиотеке, информация о конференциях, труды сотрудников, учеба, повышение квалификации и т.д.). Другими словами, web-страницы ориентированы в основном на библиотечное сообщество, а не на читателя, тем более - удаленного.

библиотеки состоят из разнородных информационных массивов — электронных каталогов, библиографических, фактографических, полнотекстовых баз дан-ных, справочнонормативных массивов и т.д. Пользователь, попадая в такую виртуальную автономную библиотеку, ограничен ее рамками и вынужден искать недостающую информацию (например, библиографические данные или полные тексты документов) за пределами такой коллекции, используя ссылки на некий совокупный ресурс.

Конечно, создание подобного рода электронных библиотек является необходимым шагом, однако разработка таких локальных информационных продуктов, как нам кажется,

— тупиковый путь развития.

Поэтому необходимо создание библиотек, обеспечивающих пользователей связями между элементами как своих, так и совокупных ресурсов, находящихся за их пределами.

В этой связи предлагаем рассмотреть следующую модель электронной библиотеки.

В отличие от традиционных библиотечных хранилищ, где фонд источников отделен от справочно-поискового аппарата в виде карточных каталогов, электронные библиотеки составляют единое целое, части которого связаны друг с другом, например, ссылками -библиографические описания с полными текстами. Помимо этих внутренних ссылок между частями отдельной электронной библиотеки создаются ссылки на внешние относительно данной коллекции ресурсы, причем не на отдельный информационный ресурс Интернета в целом, а на составляющие его единицы, например, конкретную статью из электронного журнала или другую публикацию, хранящуюся в полнотекстовой базе данных. Например, журнальные статьи из полнотекстовых баз данных с пристатейными списками литературы должны иметь ссылки, связывающие данную статью с полными текстами источников, которые в ней упоминаются. Эти ссылки или связи могут быть установлены между источниками, хранящимися как внутри одного электронного фонда, так и в разных коллекциях (рис. 1).

Подобный продукт может создаваться следующим образом. Любая научная публикация содержит некоторое число ссылок на использованную литературу. Вполне реален вариант, когда при подготовке научной работы автор заказывает и получает электронные копии, причем изготовитель этих копий обеспечивает их хранение; либо при подготовке рукописи используются статьи из электронных версий журналов и т.д. Такая публикация, представленная в Интернете (например, статьей в электронной версии журнала) и снабженная списком литературы, может быть связана через гипертекстовые ссылки с электронными копиями цитируемых публикаций, которые находятся в доступных через Интернет хранилищах, так же как и со статьями из электронных журналов. Технологической основой к созданию такого информационного продукта может служить, в частности, технология электронной доставки документов. Главное то, что эта технология позволяет объединить разобщенные информационные ресурсы и преодолеть пространственные барьеры между ними.

Электронная Электронная

библиотека полный библиотека

текст полный Библиографи-

текст ческая база

полный текст ....... данных

...... ссылки документы

ссылки 1. полный 1.

1. полный текст 2. текст 2.

2. ........ 3.

3. ........ 4.

....... Электронная библиотека

ссылки полный текст Полнотекстовая

1. ....... база данных

2. ....... журналов

журналы

1.

2.

Рис. 1. Связи между элементами распределенной

электронной библиотеки

Такую библиотеку можно назвать распределенной электронной библиотекой. Распределенная электронная библиотека — это совокупность логически и технологически связанных между собой документов из различных электронных коллекций и отдельных информационных ресурсов, доступных через Интернет.

Что следует включать в состав фонда такой библиотеки, какие связи с другими ресурсами она должна обеспечивать?

Нам представляется, что распределенная электронная библиотека может характеризоваться:

— принципами отбора документов (комплектования);

— способами создания связей между элементами;

— методами формирования электронного фонда.

Что касается принципов отбора документов, то из опыта работы с информационными ресурсами Интернета следует, что части фонда распределенной электронной библиотеки должны быть элементами профессионально создаваемых и постоянно поддерживаемых информационных ресурсов. Точно так же, как традиционные библиотеки не включают в свои фонды некоторые виды печатной продукции (что определяется, конечно, статусом библиотеки), — так и распределенные электронные библиотеки должны охватывать не все информационные ресурсы, а лишь те из них, которые входят в область интересов их пользователей.

Основной проблемой при создании подобной библиотеки является генерация гипертекстовых ссылок на внешние ресурсы и их фрагменты — связей между распределенными в пространстве элементами электронных библиотек. Сложность заключается в том, что пока не существует уникального идентификационного номера электронной публикации в Интернете наподобие ISSN или ISBN, хотя разработки в этой области ведутся как издателями, так и библиотечным сообществом.

Определенные надежды здесь возлагаются на описания типа Dublin Core (6), хотя, как нам кажется, это совершенно необоснованно, и вот почему. Во-первых, пока эти описания не распространяются на динамически формируемые документы из баз данных и, во-вторых, сама процедура описания отдается на откуп создателям Интернет-ресурсов. Вспомним, чем закончились попытки обязать авторов и издателей книг делать библиографические описания на свои произведения. Как правило, эти описания непригодны для использования в библиотеках, потому что создаются непрофессионалами в этой области. С Dublin Core дело обстоит еще сложнее, поскольку предполагается, что авторы будут сами индексировать свои электронные издания. С результатами подобного “самоиндексирования” может ознакомиться каждый, кто хоть раз пытался найти ссылки в поисковых системах типа Yahoo или Rambler. Поэтому, как нам кажется, до тех пор пока не разработаны надежные средства описания информационных ресурсов Интернета, следует сосредоточить усилия на разработке систем автоматического обнаружения и описания этих ресурсов, средств эвристического поиска.

Очевидно, что сопряжение элементов распределенных электронных библиотек (процедура установления ссылок между их частями) должно осуществляться автоматически, поскольку, во-первых, только так могут быть учтены все связи, и, во-вторых, это должно позволить поддерживать их в актуальном состоянии -так как элементы электронной библиотеки меняют свое местоположение, добавляются новые документы и т.д. То же относится и к связям, которые устанавливаются между документами локального электронного фонда. Такие разработки сейчас ведутся рядом российских библиотек.

Методы формирования распределенных электронных библиотек могут быть различными. Условно их можно назвать прямым и косвенным. Прямой метод заключается в том, что части таких библиотек формируются как результат совместной деятельности, т.е. целенаправленно создается распределенный электронный фонд. Так, при подготовке некоторых изданий, составляющих основу специализированной электронной библиотеки, могут быть оцифрованы источники, необходимые для их написания. Эти источники входят затем в состав электронного фонда копий публикаций другой электронной библиотеки и могут быть связаны ссылками с текстами первой коллекции. Такой метод формирования

распределенного фонда наиболее продуктивен, поскольку повышается качество отбора документов в фонд библиотеки.

Косвенный метод заключается в том, что автоматически устанавливаются отсылки от документов фонда одной электронной библиотеки и их структурированных частей к документам других электронных библиотек. Для этого должны быть разработаны системы справочников, описывающих структуры этих библиотек и эвристические программы обнаружения электронных информационных ресурсов.

Отметим, что в подобных библиотеках может существовать два вида ссылок — внутренние, связывающие части одной коллекции между собой, и внешние, которые устанавливаются между элементами различных коллекций.

Рассмотрим теперь конкретный пример создания подобной библиотеки, базирующейся на использовании указанных методов. В качестве исходных электронных библиотек взяты:

— Электронная библиотека ИНИОН (http://www.inion.ru). Она состоит из библиографических баз данных, содержащих описания книг и статей из журналов, поступивших в библиотеку ИНИОН, а также хранилища электронных копий источников, отсканированных по заказам пользователей или в рамках специальных проектов;

— Научная электронная библиотека (http://library.intra.ru), созданная по инициативе Российского фонда фундаментальных исследований. Она содержит полные тексты статей свыше 350 зарубежных и отечественных электронных журналов;

— Электронная коллекция ГПНТБ СО РАН по экологии http://info.spsl.nsc.ru/win/ecol/index.html, имеющая полные тексты аналитических обзоров, представленные в Интернете.

При подготовке обзоров ГПНТБ СО РАН по экологии проводились поиски информации по различным библиографическим базам данных, в том числе базам ИНИОН, а затем заказывались копии в службе электронной доставки документов этой организации. В некоторых случаях в электронном хранилище ИНИОН оказывались полные тексты статей, которые заведомо процитированы в обзорах или указаны в списке литературы. Таким образом, гипертекстовая ссылка от библиографического описания источника в списке использованной литературы к документу из электронного полнотекстового хранилища ИНИОН позволяет увязать документы из разных частей распределенной библиотеки.

Электронные тексты первоисточников, хранящиеся в ИНИОН, равно как и другие элементы двух электронных библиотек, в свою очередь имеют гипертекстовые отсылки, например, к другим работам автора обзора в этом же хранилище электронных копий, или — опять через список литературы — к другим хранилищам и

базам данных.

Для подготовки обзоров также используются статьи из коллекции электронных журналов Научной электронной библиотеки. Через разрабатываемую сейчас систему справочников эти элементы распределенной электронной библиотеки также должны быть связаны друг с другом. Таким образом, формируются единые тематические или проблемно ориентированные информационные поля в рамках распределенной библиотеки. В нашем случае — по различным аспектам экологии и охраны окружающей среды. Сейчас ведутся работы по реализации этой технологии на примере создания информационных полей в области экономических и правовых аспектов охраны окружающей среды.

Полагаем, что сказанное выше открывает путь к созданию новых электронных библиотек на базе формально распределенных в пространстве информационных ресурсов

— библиотек, создание которых принципиально невозможно в традиционной информационной среде.

Список литературы

1. Глухов В.А., Лаврик О.Л. Электронная доставка документов. - М.: ИНИОН РАН, 1999. - 132 с.

2. Каленов Н.Е, Власова С.А. Каталог книг и продолжающихся изданий ЦБС БЕН РАН в Интернете // Современные технологии в информационно-библиотечном обеспечении научных исследований: материалы 8-го научно-практического семинара (Таруса, 13-18 сентября 1999 г.). - М., 1999. - С. 100-102.; Соловьева С.А. Система баз данных на основе электронного журнального каталога БЕН РАН, доступная через Интернет // Там же. - С. 97-99.

3. Баженов С.Р., Баженов И.С., Мазов Н.А., Малицкий Н.А. Система обеспечения контроля и учета доступа из

Интернета к распределенным библиографическим базам данных // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества. Материалы конф. Судак. Респ. Крым, Украина, 513 июня 1999 г. - М., 1999. - С. 226-228; Баженов С.Р., Новоженин А.Ф. Разработка системы решения информационно-библиотечных задач в ГПНТБ СО РАН с использованием Интернета // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества. Материалы конф. Судак. Респ. Крым, Украина, 6-14 июня

1998 г. - М., 1998. - С. 265-267.

4. Кон Л.Ф., Дашенко В.В. Интернет в Новосибирской государственной областной библиотеке // Тезисы докладов Междунар. конф. “Интернет, общество, личность”, Санкт-Петербург, 1-5 февраля 1999 г. - СПб, 1998. - С. 104-106.

5. Паринов С. Активный информационный робот как сетевой агент исследователя на примере онлайновых

ресурсов по экономике КеРБс/Ки/КиРБс // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: Тр. первой Всероссийской научной конференции, С.-Петербург,

19-22 октября 1999 г. - СПб, 1999. - С. 104-111.

6. Шварцман М.Е. К вопросу каталогизации ресурсов Интернета // Мир библиографии. - 1998. - N5; Шварцман М.Е. Использование метаданных для каталогизации российских ресурсов Интернета // Электронные библиотеки. - 1998. - Т. 1, Вып. 2.

i Надоели баннеры? Вы всегда можете отключить рекламу.