Научная статья на тему 'Ретроконверсия каталогов: современный опыт и проблемы применения'

Ретроконверсия каталогов: современный опыт и проблемы применения Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
464
55
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Ретроконверсия каталогов: современный опыт и проблемы применения»

БИБЛИОТЕЧНО-БИБЛИОГРАФИЧЕСКАЯ И НАУЧНО-ИНФОРМАЦИОННАЯ ДЕЯТЕЛЬНОСТЬ

О.В. СЕРГЕЕВА*

РЕТРОКОНВЕРСИЯ КАТАЛОГОВ: СОВРЕМЕННЫЙ ОПЫТ И ПРОБЛЕМЫ ПРИМЕНЕНИЯ

История возникновения и развития библиотек донесла до нас сведения о существовании библиотечных каталогов еще в виде глиняных табличек с указанными на них номером полки в библиотеке. А сегодня привычные карточные каталоги вытесняет оцифрованная информация об источниках — так называемые электронные каталоги и библиографические базы данных (БД).

Развитие информационных технологий, постоянно увеличивающийся поток информации и спрос на нее в последнее время существенно повысили требования к организациям, занимающимся распространением информации, и привели к изменению традиционных форм библиотечного обслуживания. Наряду с появившимися в 80-х годах библиографическими БД самых различных библиотек и центров информационного обслуживания, сводными каталогами, электронными каталогами текущих изданий, тематическими БД, представленными как в Интернете, так и на компакт-дисках, все большее распространение получает электронная доставка документов (ЭДД). Ее столь стремительное развитие обусловлено как появлением новых технологических возможностей в мире цифровой информации, так и крайней необходимостью (недоступность источника в близлежащих библиотеках, чрезвычайная редкость или ветхость требуемого издания и т.д.). Возможность доставки электронной копии документа по сети Интернет из любой библиотеки в любую точку ми-

* Сергеева Ольга Владимировна - заведующая Отделом каталогизации и электронных каталогов Фундаментальной библиотеки ИНИОН РАН.

ра делает такой способ получения информации чрезвычайно привлекательным и заменяет собой межбиблиотечный абонемент, ставший в последнее время дорогостоящей услугой.

Автоматизация процессов ввода для создания библиографических БД изданий, поступивших в ИНИОН, была начата в 1978 г. Фундаментальная библиотека начала получать обязательный бесплатный экземпляр с 1918 г. Поэтому, несмотря на то, что ИНИОН одним из первых внедрил процессы автоматизации в нашей стране, большая часть фонда (за 60 лет) не содержится в библиографических БД вовсе, сведения об этом фонде находятся лишь в карточных каталогах (алфавитном и предметном). Кроме того, исходя из специфики работы ИНИОН, в БД переводились лишь «научно значимые» документы (около 60%), прежде всего статьи, а далеко не весь массив поступивших изданий.

В карточных каталогах библиотеки ИНИОН РАН (предметном и алфавитном) на сегодняшний день1 содержится примерно 6,2 млн. карточек. Около 75 тыс. (за последние 2 года) представлены в электронном каталоге ИНИОН в Интернете. Там же расположена библиографическая БД за последние 15 лет, в которой содержится примерно 1 млн. записей (не считая статей), та же информация содержится на тематических компакт-дисках. Учитывая наличие в карточных каталогах добавочных описаний, предстоит работа по приведению в машиночитаемую форму объема карточек, превышающего 2 млн. единиц. Причем обработка массива будет не сплошной, а выборочной.

Представленный в Интернете каталог поступивших в библиотеку ИНИОН РАН изданий ведется с 2000 г. Его пополнение происходит примерно один раз в месяц. Электронный каталог поступлений ИНИОН является электронной копией карточных алфавитного и предметного каталогов одновременно за последние два года.

Однако глубина ретроспекции, представленная в электронных каталогах, играет немаловажную роль как для потребителей такой информации, так и для служб, представляющих ее. Научные изыскания заставляют специалистов и ученых заниматься ретроспективными поисками наряду с изучением последних изданий. Увеличение же запросов пользователей ЭДД возрастает прямо пропорционально

1 Данные приводятся на 2002 г.

увеличению объема представленных в Интернете библиографических записей, что принесет определенную выгоду библиотеке.

Кроме того, внедрение ретроконверсии обусловлено необходимостью поддержания рейтинга библиотеки ИНИОН на современном уровне.

Эта же проблема коснулась других библиотек и организаций, занимающихся информационным обслуживанием. Процесс преобразования исходного информационного продукта в другой, пригодный для новых условий и целей использования, называется конвертированием. В нашем случае перевод данных с каталожной карточки в электронный вид получил название ретроконверсии. За последние годы ректроконверсия довольно успешно проведена в Российской книжной палате, Российской государственной библиотеке, Российской национальной библиотеке, Государственной публичной научно-технической библиотеке и других с разной глубиной ретроспекции. На сегодняшний день приведение карточного каталога ИНИОН в оцифрованный вид — важнейшая задача как обслуживания читателей библиотеки, так и поддержания статуса библиотеки ИНИОН РАН на должном уровне.

Процесс ретроконверсии можно проводить как с помощью специальных фирм, профессионально этим занимающихся, как это сделала РКП, так и используя внутренние резервы самой библиотеки, например РГБ, ГПНТБ, РНБ.

Шестилетний опыт работы в этом направлении фирмы «Про-софт-М» выявил некоторые «узкие» места: в каждой библиотеке, обращавшейся в фирму с просьбой провести ретроконверсию, в составе фонда было приблизительно 30% одинаковых изданий. Все библиотеки при составлении библиографического описания использовали один и тот же ГОСТ 7.1 -84, однако унифицированного представления библиографической записи не было. Каждая библиотека привносила в описание какую-то свою специфику, придерживалась своей традиции. Работа исполнителя, взявшегося за процесс ретроконверсии одновременно в нескольких библиотеках, существенно была бы облегчена, а стоимость ее уменьшена, если бы базы данных и электронные каталоги этих библиотек строго придерживались единого стандарта. Но, как показали результаты проведения таких работ, это пожелание останется невыполнимым, так как различные библиотеки используют различные макеты карто-

чек, систему индексации и т.п. в зависимости от специфики библиотеки. Кроме того, как подтверждено практикой, сличение оцифрованных массивов менее дорогостоящий процесс, чем выявление дублетов. Поэтому 30% литературы (совпадение фондов) приходится обрабатывать несколько раз.

В 1998 г. фирмой «Прософт-М» была создана специальная программа, предназначенная для решения вышеперечисленных задач. Процессы, вошедшие в программу, — конвертирование, ввод и сканирование. Ретроконверсия каталога подразумевает работу с каталожной карточкой и очень в редких случаях работу с книгой. Для каждого типа библиографического описания (БО) преимущественным является свой вид ретроконверсии.

БО иностранной литературы преимущественно конвертируется (заимствуется) из других библиографических баз, желательно иностранных, так как составленное на родном языке описание, скорее всего, будет содержать меньшее количество ошибок. Это возможно, конечно, при совместимом формате, наличии весьма существенных материальных возможностей заказчика. При таком способе, правда, неизбежны существенные исправления в библиографической записи, так как единых правил составления БО для всего читающего мира не существует.

Ввод с карточки используется в основном при небольших массивах и небольших описаниях (рукописные и старопечатные карточки) — это самый дорогостоящий вид ретроконверсии. Сначала делается перевод с карточки, потом редактирование. При этом значительная часть фонда проходит рекаталогизацию, так как правила описания неоднократно с тех пор менялись.

При работе с русскоязычной частью каталога используется метод скоростной ретроконверсии — перенос информации с карточки в БД путем сканирования. Информация о данной части фонда мгновенно оказывается в распоряжении пользователя. Далее частями идет приведение ее в машиночитаемую форму (распознавание).

Сегодня профессионально занимаются проблемой ретроконверсии не только «Прософт-М», но и такие фирмы, как «Инфро-Комм», «Одеон» и др. Правда, услуги их пока еще стоят довольно дорого, но это связано лишь с тем, что их опыт также еще недостаточно велик. Однако, приступив к ретроконверсии самостоятельно, не имея

вообще никаких наработок в этом направлении, исполнители рискуют столкнуться с множеством проблем в процессе своего эксперимента.

На ежегодной конференции Российской библиотечной ассоциации (РБА) представитель фирмы «ИнфроКомм» поделился опытом работы в этом направлении. В частности, он считает, что при ретроконверсии целесообразно использовать комплексный подход:

— ручной;

— конвертирование и заимствование (используется для иностранных записей);

— сканирование и распознавание.

Как мы видим, принцип осуществления работ в этом направлении не отличается у профессионалов и у новичков, видимо, это элементарно и очевидно. Ручной ввод осуществляется в заданном формате с рукописных и старопечатных карточек сотрудниками фирмы.

Для конвертирования библиографических записей из других библиографических баз и каталогов специалистами «ИнфроКомм» созданы специальные таблицы форматов, на основе которых базируются конверторы. При заимствовании записей из различных библиографических баз конвертирование осуществляется автоматически. Заимствованная запись, как правило, изменяется после просмотра книги de ужи. Использование таблиц форматов дает существенное преимущество фирмам, занимающимся ретроконверсией каталогов, перед библиотеками, проводящими эту работу самостоятельно.

Сканирование происходит следующим образом. Карточки из каталога ксерокопируются, причем сразу же возвращаются в каталог, затем с этих копий делается сканирование, затем распознавание и приведение в машиночитаемую форму.

Метод сканирования, как поделились опытом сотрудники РГБ, больше всего подходит для больших каталогов на русском языке. Этот метод состоит из трех этапов:

— сканирование;

— перевод графических карточек в машиночитаемую форму;

— обеспечение тематического поиска (содержательная обработка литературы).

Как утверждают программисты РГБ, сканирование 300 тыс. карточек оправдывает покупку одного сканера. Сегодня в РГБ отска-

нировано 8 млн. карточек1 с глубиной ретроспекции до 1961 г. РГБ удалось самостоятельно провести эксперимент по ретроконверсии каталогов благодаря грамотной организации работы, программному и техническому обеспечению последнего поколения, материальной помощи Библиотеки Конгресса США.

ГПНТБ также имеет опыт проведения ретроконверсии каталогов, ими разработана и успешно используется программа «ReMarc».

РГБ смогла позволить себе провести самостоятельно эксперимент по осуществлению ретроконверсии каталогов, но не каждая библиотека обладает таким штатом опытных программистов, такими техническими возможностями и программным обеспечением последнего поколения.

В самом начале 2003 г. молодая российская фирма «Одеон» получила лицензию на использование стратегической технологии управления информацией «RetrievalWare 7.0» от американской компании Convera International Technologies (Excalibur). Эта компания была основана в 1980 г. и сегодня имеет 5200 проектов во всем мире. Техно -логия, используемая фирмой «Одеон», предлагает новые решения процессов ретроконверсии каталогов, такие как автоматическое распознавание машинописного текста (даже плохого качества, с «прыгающими» и стертыми буквами), распознавание разборчивого почерка, каким и является почерк библиографа. Система «нечеткого поиска» позволяет находить слова из текста библиографической записи даже с пропущенными (затертыми) буквами и орфографическими ошибками.

Фирмой «Одеон» предоставляются бесплатные тестовые программы, а в случае удовлетворительных результатов тестирования в каждом отдельно взятом учреждении — весь пакет программ для сканирования и распознавания. Высокие стратегические и технологические возможности «RetrievalWare 7.0» обусловливают и высокие требования к используемой техники.

Ретроконверсия — это технология, давно введенная за рубежом. В нашей стране она получила широкое распространение с 1998 г. К сожалению, совместное сотрудничество между фирмами, осуществляющими эти процессы, не ведется из-за вопросов конкуренции. Возникающие в ходе работ проблемы решаются самостоятельно. Не-

1 Данные приведены на май 2002 г.

смотря на это, решены вопросы уровня записи: всеми фирмами используется ядерная запись, т.е. минимальный набор элементов плюс точки доступа. Технология ретроконверсии предусматривает работу со старыми массивами каталожных карточек, поэтому вопросы неоднократного изменения правил описания за эти годы поставили перед создателями электронных каталогов и библиографических БД следующую задачу: свести разницу в описаниях до минимума. С другой стороны, увеличение ассортимента макетов каталожных карточек, заложенных в программу, поможет эффективно пользоваться такой базой. Другими словами, все способы, которые не повлияют отрицательно на качество поиска, могут быть использованы.

Все эти услуги и программы пока еще очень дороги, но состояние карточных каталогов требует решения вопроса о приведении их в электронную форму. Ветхость карточек, приводящая порой к потере информации (стерся шифр, часть самой записи), выцветание рукописных карточек, написанных чернилами, делающее их «слепыми», неизбежные заставки в столь огромном каталоге, полное редактирование которого провести практически не реально, недобросовестность некоторых читателей, не заботящихся о сохранности каталогов, — все это заставляет задуматься о том, сколько еще сможет прослужить нам верой и правдой карточный каталог. Кроме того, его нельзя увеличивать до бесконечности в пространстве.

Кроме физического имеет место и моральное устаревание карточного каталога. Возможности расширенного поиска информации в электронных каталогах и библиографических базах данных, их доступность через Интернет с любого компьютеризированного рабочего места сделали их более востребованными на рынке информационных услуг по сравнению с традиционными каталогами.

Список литературы

1. Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества: Материалы VIII Междунар. конф., Судак, 9- 17 июня 2001 г.: В 2 ч. -М.: ГПНТБ России, 2001. - Т. 1- 2.

2. Библиотечное дело - 2001: российские библиотеки в мировом информационном и интеллектуальном пространстве: Тез. докл. VI Междунар. науч. конф., Москва, 26-27 апр. 2001 г.: В 2 ч. - М.: Изд-во МГУКИ, 2001.

3. Библиотечное дело - 2002. Библиотечное образование и практика: поиски взаимопонимания: Тез. докл. VII Междунар. науч. конф., Москва, 24-25 апр. 2002 г. - М.: Изд-во МГУКИ, 2002.

4. Воройский Ф.С. Систематизированный толковый словарь по информатике: Ввод. курс по информатике и вычислительной технике в терминах. - М.: Либерея, 1998.

5. Глухов В.А., Лаврик О.П. Развитие электронной доставки документов в библиотеках России // Библиотечно-информационное обеспечение в области социальных и гуманитарных наук на пороге XXI века. - М.: ИНИОН РАН, 1999.

6. Единое информационно-культурное пространство библиотек России: 6-я ежегодная сессия конференции РБА // Библиотековедение. - М., 2001. - № 1. - С. 131- 134.

7. Лаврик О.Л., Артемьева Е.Б. Научные библиотеки в новом тысячелетии: проблемы взаимоиспользования ресурсов: [регион. науч.-практ. конф.] // Библиотековедение. - М., 2001. - № 10. - С. 123- 125.

i Надоели баннеры? Вы всегда можете отключить рекламу.