Обмен опытом
УДК 02 : 004 + 002.5 : 004 ББК 78.34 (7Сое)
ЦИФРОВЫЕ БИБЛИОТЕКИ: ОПЫТ США © Н.С. Редькина, 2008
Государственная публичная научно-техническая библиотека Сибирского отделения Российской академии наук 630200, г. Новосибирск, ул. Восход, 15
Рассматривается опыт США в создании цифровых библиотек, описывается технология участия академических библиотек в организации Мировой цифровой библиотеки, проектах корпораций «Google» и «Microsoft», изучаются перспективы развития цифровых библиотек в США и дальнейшая роль библиотекарей в обслуживании читателей и пользователей.
Ключевые слова: цифровые библиотеки, Мировая цифровая библиотека, интернет-библиотека «Google Print», проект Microsoft «Live Search Books», управление цифровыми ресурсами, библиотека Корнелл-ского университета.
Цифровые библиотеки (ЦБ) приобретают все большую популярность среди пользователей Интернета и становятся одним из наиболее важных источников в информационном поиске. Среди основных факторов повышения их роли можно указать: во-первых, увеличение количества бесплатных и коммерческих цифровых библиотек (формирование мировой, европейской [1], национальных и частных цифровых библиотек); во-вторых, расширение аудитории пользователей Интернета, «отсутствие границ» и, таким образом, оперативное получение информации большим числом пользователей; в-третьих, возможность, в связи с развитием информационных технологий и техники, представления информации в удобном для просмотра мультимедийном формате, объединение различных гетерогенных источников, включающих текст, изображение, звуковые и видеоданные и др. Реализация новых цифровых библиотек меняет роль традиционных библиотек в цикле производства полнотекстовых цифровых коллекций и организации к ним доступа.
Соединенные Штаты Америки - одна из первых стран, где стали активно применяться цифровые технологии в библиотечной сфере деятельности.
Библиотека Конгресса США
В 1990 г. в Библиотеке Конгресса США начал реализоваться проект «Память Америки» [2] по созданию коллекции избранных изданий, в дальнейшем распространенных на электронных носителях в 44 школах и библиотеках страны. Пробный
проект, завершенный в 1994 г., позволил понять, что имеется большой интерес к подобным материалам. Кроме того, поступали запросы на получение более детальной информации по различным вопросам. В декабре 2000 г. Конгресс США издал закон («Public Law» 10б-554) о признании важности сохранения материалов (мировой коллекции знаний) в цифровом формате для будущих поколений.
Библиотека Конгресса США имеет опыт сотрудничества с библиотеками разных стран (России, Франции, Нидерландов, Бразилии, Испании) по созданию цифровых библиотек с общим названием «Global Gateway» [3]:
• «France In America» («Франция в Америке»). Исследуется история французского присутствия в Северной Америке с первых десятилетий от XVI столетия до конца XIX в.
• « The Atlantic World: America and the Nether-lands» («Атлантический Мир: Америка и Нидерланды»). Исследуется история голландского присутствия в Америке и взаимодействие между Соединенными Штатами и Нидерландами от Генри Хадсона (1609 г.) до завершения Второй мировой войны. Проект - сотрудничество между Библиотекой Конгресса и Национальной библиотекой Нидерландов, которая, в свою очередь, привлекла к участию другие ведущие голландские библиотеки, музеи и архивы.
• «Pamllel Histories: Spain, the United States, and the American Frontier» («Параллельные истории: Испания, Соединенные Штаты и американская граница»). Цифровая библиотека в мультиме-
* Автор использует термин «цифровая библиотека» (от англ. digital library), принятый в США. В России же используется термин «электронная библиотека». - Ред.
дийном формате, материалы представлены на двух языках (английском и испанском). Исследуется взаимодействие между Испанией и США от XV до начала XIX столетия. Совместная работа Национальной библиотеки Испании и Библиотеки Конгресса.
• «United States and Brazil: Expanding Frontiers, Comparing Cultures» («Соединенные Штаты и Бразилия: расширение границ, сравнение культур»). Исследуется история Бразилии, взаимодействие между Бразилией и Соединенными Штатами с XVIII столетия до настоящего времени, дается в сравнении бразильская и американская культура и история. Проект - сотрудничество между Библиотекой Конгресса и Национальной библиотекой Бразилии.
В конце 1999 г. совместными усилиями был открыт двуязычный проект «Встреча на границах» («Meeting of Frontiers») [4] по истории заселения западного побережья США и освоения востока России, куда вошло более 2,5 тыс. разных экземпляров, включая около 70 тыс. изображений из коллекций редких книг, рукописей, фотографий, карт, фильмов и звукозаписи, принадлежащих Библиотеке Конгресса. В последующие годы сайт был расширен и дополнен многими тысячами других экземпляров с пояснительными текстами. Партнерами этого проекта являются Библиотека Конгресса, Университет штата Аляска, Российская государственная библиотека, Российская национальная библиотека, а также более чем 20 библиотек, архивов и музеев из городов Сибири и Дальнего Востока.
В цифровой библиотеке «Встреча на границах» представлены материалы об освоении и заселении американского Запада, о происходившем параллельно освоении и заселении Сибири и российского Дальнего Востока, а также о встрече русских и американцев на Аляске и на северо-западном побережье Америки. В цифровую библиотеку вошли:
• книги и периодические издания, в том числе подборки из основных фондов Библиотеки Конгресса, включая книги, написанные американскими авторами, которые участвовали в 1865 г. в экспедиции телеграфной компании «Вестерн Юнион», переселенческие справочники, агитировавшие русских переезжать в Сибирь, справочники, изданные в 1890-х гг. для американцев, которые направлялись в Клондайк для участия в золотой лихорадке, книги ранних американских путешественников в Россию, первые путеводители для туристов, отправляющихся на Аляску и тихоокеанский Северо-Запад, а также несколько изданий художественной литературы и популярных книг; газеты, коллекция русских и украинских проспектов и брошюр; Царские привилегии 1899 - 1917 гг. и др.;
• рукописи (подборки из документов Альберта Фишера, Джорджа Кеннана, Архив Министерства Военно-морского флота СССР и др.);
• коллекции различных материалов (коллекция Георга фон Аш, документы и фотоматериалы Автономной индустриальной колонии «Кузбасс»);
• ноты;
• фильмы и звукописи;
• фотографии и графика;
• выставки и др.
Проект предназначен для использования в американских и российских школах и библиотеках, а также для широкой общественности обеих стран. Многие из первоисточников никогда ранее не публиковались или являются чрезвычайно редкими, поэтому проект может представлять интерес для ученых и исследователей, особенно для тех, кто имеет ограниченный доступ к фондам крупнейших научных библиотек.
Развитием уже существующих проектов тематических цифровых библиотек - «American Memory Project», систематизирующего знания об истории США, и «Global Gateway», в рамках которого собираются сведения о культурных связях народов мира, стал проект «Мировая цифровая библиотека».
Мировая цифровая библиотека
Предложение об организации Мировой цифровой библиотеки (World Digital Library) было сделано в июне 2005 г. директором Библиотеки Конгресса США Джеймсом Биллингтоном на заседании Комиссии ЮНЕСКО в Организации Объединенных Наций. Формирование электронной коллекции наиболее ценных материалов по истории и культуре народов мира уже явилось новой формой профессионального взаимодействия международного библиотечного сообщества. Проект осуществляется при поддержке ЮНЕСКО, Международной федерации библиотечных ассоциаций и учреждений (ИФЛА) и корпорации «Google», выделившей финансирование на планирование и создание прототипа сайта Мировой цифровой библиотеки (МЦБ). Помимо Библиотеки Конгресса в проекте участвуют такие крупные библиотеки мира, как: Российская государственная библиотека, Российская национальная библиотека, Библиотека Александрина, Национальная библиотека Бразилии, Национальная библиотека Кореи и Национальная библиотека и архивы Египта. В настоящее время ведется работа по первому этапу создания библиотеки, включающая планирование и разработку сайта-прототипа, который должен быть размещен на сайте www.worlddigitallibrary.org и представлен на заседании ЮНЕСКО в конце 2007 г. (рис. 1). Предполагается, что поиск в МЦБ будет вестись на шести официальных языках Организации Объединенных Наций - арабском, китайском, французском, русском и испанском, а также
Рис. 1. Прототип Мировой цифровой библиотеки
на португальском языке. Пользователи библиотеки могут искать и просматривать оцифрованные материалы, выбирая их по таким критериям, как место, время, тема, учреждение и др.
Главная цель МЦБ состоит в предоставлении обществу бесплатного и многоязычного доступа к коллекциям, имеющим важное культурное, историческое и образовательное значение. Мировая цифровая библиотека должна объединить редкие и уникальные издания США и Запада и культурные источники стран, в которых проживает более миллиарда человек - Китая, Индии, а также стран исламского мира - от Индонезии, Центральной и Восточной Азии до Африки. В задачи Мировой цифровой библиотеки входит сбор и обработка книг, рукописей, фотографий, звуковых материалов, связанных с культурой различных народов и этнических групп.
Участие библиотек в проектах «Google» и «Microsoft» по созданию цифровых интернет-библиотек
В рамках проекта компании «Google» по организации самой полной, по словам представителей, интернет-библиотеки «Google Print», ряд ведущих библиотек мира приступили к оцифровыванию имеющихся в их фондах изданий и передаче копий в распоряжение компании. Сепаратные соглашения «Google» с каждой отдельной библиотекой, заключенные в 2004 г., предусматривают следующий объем сканирования: библиотека Стенфорда -полностью (8 млн книг); библиотека университета Мичигана - полностью (7 млн книг); библиотека Гарварда - 40 тыс. книг; библиотека Оксфорда -все книги, изданные до 1900 г.; общественная библиотека Нью-Йорка - не защищенный копирайтом материал для школьников и студентов. На сегодня сотрудничество компании «Google» расширилось, привлечено большее количество европейских и американских библиотек.
Оцифровываются все возможные издания, однако указывается, что полностью на сайте проекта можно прочитать лишь те, которые по юридическим нормам США являются «общественным достоянием» (public domain). Доступ к остальным изданиям (предполагается, что в базу проекта в итоге попадет максимально возможное число копий любых из существующих в мире книг) ограничен -можно выполнять поиск по всем текстам (рис. 2, 3), но реализованная система защиты авторских прав позволяет ознакомиться только с несколькими страницами. Авторы указывают, что проект не следует рассматривать как онлайновую библиотеку для полноценного чтения, а лишь как возможность ознакомиться с изданием, чтобы впоследствии при необходимости ее купить. Просматриваемые фрагменты сопровождаются ссылками на сайты книготорговых магазинов. Также на сайте действует система ограничений, позволяющая видеть некоторый материал лишь при наличии регистрации в почтовой системе «Gmail»1 и урезающая объемы материала, который можно просмотреть за определенный промежуток времени.
Рис. 2. Поиск в цифровой библиотеке компании «Google»
1 Gmail - бесплатная почтовая служба, в которую встроена поисковая технология «Google».
Рис. 3. Полнотекстовый поиск в цифровой библиотеке «Google»
Аналогично тому, что создает «Google» в сотрудничестве с крупными библиотеками США и Европы, корпорация «Microsoft» представила бета-версию нового сервиса под названием «Live Search Books» (LSB), который также позволит пользователям Интернета читать десятки тысяч электронных книг (рис. 4). В настоящее время LSB функци-
Рис. 4. Поиск в цифровой библиотеке «Live Search Books» корпорации «Microsoft»
онирует в тестовом режиме. Интерфейс виртуальной библиотеки максимально прост: в поисковую строку LSB достаточно ввести полное название книги или ключевое слово и в результате на экран выводится список релевантных по параметрам поиска изданий, а также страницы изданий, на которых найдено искомое слово, т. е. имеется возможность с помощью опции «Search inside a book» («Поиск внутри книги») производить поиск непосредственно по полному тексту издания. В настоящее время в базу данных включены только те книги, на которые не распространяются авторские права. Это книги, которые были отсканированы в Британской библиотеке, Калифорнийском университете, Университете Торонто, Нью-Йоркской публичной библиотеке, Корнеллском университете и Американском музее ветеринарной медицины. Кроме этого, «Microsoft» включит в результаты поиска книги, защищенные авторским правом, на публикацию которых было получено разрешение правообладателей.
Как и «Google», «Microsoft» заключает договоры на сканирование с библиотеками, университетами и издательствами. Доход от LSB в «Microsoft» планируют получать за счет рекламы и получения отчислений с доходов продавцов книг.
Библиотека Корнеллского университета
Корнеллский университет, основанный в 1865 г., является на сегодняшний день одним из самых престижных и крупных высших учебных заведений США (около 14 тыс. студентов и 7 тыс. аспирантов, приблизительно 3,5 тыс. преподавателей). Открытый вскоре после американской гражданской войны, университет, по мнению его основателей, предназначался для изучения всех областей знания, теоретических и прикладных дисциплин. Эти идеалы нашли отражение в девизе университета, заключенном в словах Эзра Корнелла: «Я желаю основать учреждение, где любой может найти себе обучение в любом предмете».
Библиотека Корнеллского университета представляет собой систему, состоящую из 20 библиотек, распределенных по отраслям знаний (медицинская библиотека, музыкальная библиотека и др.), каждая из которых имеет свою службу технической поддержки [5]. В 2005 г. совокупный фонд библиотеки составлял 7,5 млн печатных изданий, 8,2 млн микрофильмов и микрофиш, 440 тыс. карт, кинофильмов, DVD и других видов носителей информации, что ставит данную библиотеку в число крупнейших академических библиотек США. Фонд значительно дополнен цифровыми ресурсами и университетским архивом.
Библиотека Корнеллского университета - один из инициаторов в создании и управлении цифро-
выми ресурсами, имеет специалистов по планированию, созданию, организации, архивированию и поддержке цифровых коллекций. В университете отмечают тот факт, что изменилась философия представления информации и «переворот» уже совершен, американцы чаще стали обращаться в первую очередь к сетевым ресурсам. В связи с этим были определены три приоритетных направления в области развития цифровых библиотек: 1) оцифровка изданий, 2) предоставление цифровых коллекций, 3) электронные публикации (в рамках сотрудничества с 33 издательствами мира, библиотека взяла на себя работу по переводу в электронный формат изданий по математике и статистике, выставляемых частично для бесплатного доступа) (рис. 5) [6].
Перспективы развития библиотек, по словам Ойи Й. Ригер, временного заместителя директора университетской библиотеки, руководителя подразделения «Цифровая библиотека и информационные технологии» (рис. 6), отвечающего за планирование, внедрение и техническую поддержку библиотечных инициатив в области цифровых технологий, включая создание и управление цифровыми коллекциями и программами электронных публикаций, в том, что библиотеки будут иметь большое значение в управлении электронными коллекциями, хотя это будет не видно пользователям.
Рис. 5. Цифровая библиотека «Euclid» по математике и статистике
Роль библиотек становится менее индивидуальна, повышается роль корпоративных ресурсов, функционирующих по принципу «нет стен». Уникальность библиотек будет зависеть от архивов, редких изданий и специальных коллекций. Задача университетской библиотеки - информировать об этих коллекциях и представлять их. По мнению Ойи Й. Ригер, будущее библиотеки Корнеллского университета состоит в следующем:
• Создание цифровых коллекций.
Рис. 6. Структура подразделения «Цифровая библиотека и информационные технологии»
Корнеллского университета:
Отдел «Цифровая библиотека и информационные технологии»; 2) сектор специальных проектов и инициатив; 3) сектор административной поддержки; 4) сектор «настольного» обслуживания ПК; 5) сектор цифровых библиотек и услуг по нововведениям; 6) сектор технологий научных коммуникаций; 7) сектор архивирования; 8) сектор электронных публикаций; 9) сектор цифрового производства «Data Mining Group»; (DMG) - организация, объединяющая крупнейших разработчиков ПО в области анализа данных и проектирующая отраслевые стандарты в области data mining, такие как «Predictive Model Markup Language» (PMML); 10) сектор менеджмента и развития Веб; п) сектор услуг по дизайну; 12 сектор системной архитектуры
• Поддержка on-line каталога, хотя в настоящее время отмечается уже меньшее обращение к нему.
• Еще одно направление - предоставление программного обеспечения (ПО) для преподавателей и тех, кто хочет публиковать свои материалы в Интернете. Уже сегодня отмечается тенденция -преподаватели и студенты чаще публикуют материалы в электронном формате, многие формируют свои коллекции (фотографии, отчеты, заметки, исследовательские материалы). Библиотека помогает организовать этот ресурс, управляет электронными коллекциями, работая индивидуально с преподавателями и факультетами по созданию мультимедийных презентаций и видеоклипов, книг, представления в Интернете материала, собранного исследователями и преподавателями. Так, в Корнеллском университете создаются коллекции цифровых видеоклипов (каждый около 2 мин), предназначенных для целей обучения, в основном по бизнесу и предпринимательству, снабженных транскриптом текста (интервью, лекции), информацией о лекторе и пользующихся огромной популярностью (рис. 7) [7].
Рис. 7. Коллекция обучающих цифровых видеоклипов
• Создание удобного для пользователя способа поиска информации в цифровой библиотеке. Пользователь не заходит на разные сайты (универ-
ситета, факультета, библиотеки). Электронные ресурсы стали выставляться на электронную доску (blackboard)2, и пользователь сразу попадает на тот или иной полнотекстовый ресурс.
Алгоритм работы над созданием цифровой коллекции:
1. Отбор из вторичных источников информации наиболее ценных и значимых источников, при этом не имеет значения, в какой библиотеке хранится первоисточник, налаженная система межбиблиотечного абонемента позволяет оперативно и без проблем получить издание в пользование. Сотрудничество с научными сотрудниками для проверки данных.
2. Просмотр первоисточника, закладки и заметки на основные страницы.
3. Отправка на сканирование поставщику (vendor).
4. Получение сканированного материала от поставщиков на дисках (CD или DVD). Изображения в простом формате.
5. Загрузка на сервер университета.
6. Распознавание.
7. Проверка качества распознанных оцифрованных материалов (автор(ы), название, аннотации, оглавление, рисунки).
8. Создание инструмента для поиска. Внесение библиографических данных, информации о рисунках, названиях глав, дополнительной информации в поля.
9. Загрузка в специальные платформы.
10. Организация доступа в on-line режиме к коллекции. Найти цифровую библиотеку можно тремя способами:
• через on-line каталог;
• страницу в Интернете (каждая коллекция имеет свою страницу);
• поисковую систему «Google», однако полный текст не откроется, необходимо зайти на страницу университета.
В настоящее время Корнеллский университет, наряду с другими библиотеками мира, участвует в проектах корпораций «Google» и «Microsoft».
Управление ресурсами цифровой библиотеки
Сегодня одна из основных задач для библиотек -это управление (менеджмент) цифровой библиотекой собственной генерации. С одной стороны, решение кажется достаточно простым, с другой -чрезвычайно сложным, учитывая, что технологический момент здесь не столько труден, сколько организационный. По подсчетам американских специалистов, только 20% времени уходит на
2 Blackboard - платформа для управления on-line ресурсами и взаимодействия читателя с библиотекой.
оцифровку изданий, а 80% - непосредственно на организацию, поддержку и управление цифровой библиотекой. Для эффективного менеджмента и решения основных задач, связанных с формированием и обеспечением доступа к цифровым коллекциям, Магйп КиЛЬ3 считает необходимым ответить для себя на некоторые вопросы, наглядно представленные на рис. 8:
1. Поддержка или развитие цифровых библиотек (ЦБ)?
2. Доступ к ЦБ только локально (университет) или возможность работы с ЦБ через Интернет без ограничений?
3. Отражение материалов по определенной тематике или создание универсальной (междисциплинарной) ЦБ?
4. Хранение ЦБ на сервере библиотеки или в 1Т-центре университета?
5. Настройка или полная реализация ЦБ?
Итак, библиотеки США принимают активное
участие в создании и организации ЦБ, предоставляя удаленный доступ к ценнейшим материалам, хранящимся в их фондах, повышая не только качество услуг, но и гарантии сохранности важнейших документов из библиотек мира. Кроме того, библиотекари задумываются о перспективах своей деятельности в условиях, когда «все будет оцифровано», прорабатывая модели создания управления и сохранения цифровых библиотек, предлагая новые услуги информационного обслуживания с применением новых технологий и формы, проекты сотрудничества с библиотеками мира.
&
Н
S _
S н
Й § а &
&
« g IS S = о
5 V©
6 g
X і©
а
?
&
Рис. 8. Управление цифровой библиотекой
Список литературы
1. La bibliotheque numerique europeenne: une strategie culturelle de la Toile / Lesquins Noemie // BBF: Bull. bibl. France. - 2006. - Vol. 51, N 3. - P. 68-80, 133-136.
2. American Memory Project [Электронный ресурс]. -Режим доступа: http://www.memory.loc.gov
3. Global Gateway [Электронный ресурс]. - Режим доступа: http://international.loc.gov
4. «Встреча на границах» («Meeting of Frontiers»)
[Электронный ресурс]. - Режим доступа:
http://intemational.loc.gov/intldl/mtfhtml/mfhome.html
5. Cornell University Library [Электронный ресурс]. -Режим доступа: http://www.library.cornell.edu
6. Project Euclid [Электронный ресурс]. - Режим доступа: http://projecteuclid.org
7. Cornell’s eClips [Электронный ресурс]. - Режим доступа: http://eclips.cornell.edu
Материал поступил в редакцию 28.12.2007 г.
Сведения об авторе: Редькина Наталья Степановна - кандидат педагогических наук, заведующий научно-технологическим отделом, тел. (383) 266-15-36, e-mail: [email protected]
3 Директор отдела открытых систем и сервисов библиотеки Корнеллского университета.