БИБЛИОСФЕРА, 2013, № 2, с. 88-91
Информатика
УДК 025.45.05:025.2:021.63:004 ББК 78.364.111.3+78.352+78.023
ФОРМИРОВАНИЕ БАЗЫ ДАННЫХ УДК ДЛЯ АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ ВЕДЕНИЯ СВОДНОГО ТЕМАТИКО-ТИПОЛОГИЧЕСКОГО ПЛАНА КОМПЛЕКТОВАНИЯ ЦЕНТРАЛИЗОВАННОЙ БИБЛИОТЕЧНОЙ СИСТЕМЫ БЕН РАН
© Е. Н. Бочарова, А. А. Ивановский, 2013
Библиотека по естественным наукам Российской академии наук 119991, г. Москва, ул. Знаменка, 11/11
Рассматривается система формирования базы данных для автоматизированной системы ведения сводного тематико-типологического плана комплектования (ТТПК) централизованной библиотечной сети БЕН РАН. Анализируется необходимость введения в состав базы рубрик УДК большого количества индексов, за которыми не стоит ни одной комплектуемой библиотеки. Такие записи выполняют в системе справочную, информационную функцию. Они позволяют библиотечному специалисту любого профиля свободно ориентироваться в структуре современных научных знаний.
Ключевые слова: тематико-типологический план комплектования (ТТПК), Универсальная десятичная классификация (УДК), рубрика УДК, индекс УДК, тип изданий, база данных рубрик (БДР), база данных библиотек (БДБ).
Considered is the system for forming the database for the automated systems of managing the union theme and typological plan of acquisition in the Centralized Library System of the Library on Natural Sciences of the Russian Academy of Sciences. Such records fulfill reference and information functions. They allow any specialist freely rely in the structure of modern scientific knowledge.
Key words: subject-typological acquisition plan, Universal decimal classification (UDC), UDC number, edition type, UDC numbers database, library database.
Тематико-типологический план комплектования - документ, определяющий необходимый для эффективной работы библиотеки тематико-типологический состав фонда всей библиотеки в целом или отдельных ее подразделений [1].
Библиотека по естественным наукам Российской академии наук (БЕН РАН) является библио-течно-информационным центром, обеспечивающим через свою сеть библиотек в академических институтах информационную поддержку научных исследований РАН в области естественных наук. На сегодняшний день в Централизованную библиотечную систему (ЦБС) БЕН РАН входит более 120 библиотек научно-исследовательских учреждений (НИУ) РАН.
Фонды ЦБС формируются как единый отраслевой фонд, особенность которого в его рассредоточении по подразделениям системы. Совокупный спрос читателей (ученых) удовлетворяется путем использования фондов всех библиотек, входящих в ЦБС. Для каждой библиотеки ЦБС БЕН РАН ТТПК определяет тематику, типы и виды приобре-
таемых в ее фонд изданий. На основе ТТПК библиотек сети формируется сводный ТТПК ЦБС БЕН РАН. Быстрая смена приоритетов в информационных потребностях ученых и специалистов РАН требует оперативного изменения ТТПК библиотек. Несоответствие реальных потребностей читателей в информации и ТТПК обслуживающей их библиотеки приводит к пробелам в фонде и накоплению непрофильной литературы.
Особенно остро проблема актуализации ТТПК стоит при комплектовании фондов иногородних библиотек НИУ РАН, осуществляемом комплектаторами Центральной библиотеки заочно [2].
В разные периоды основой для создания сводного ТТПК ЦБС БЕН РАН являлись и специально разработанная единая схема профилей комплектования, и библиотечно-библиографическая классификация, и рубрикаторы реферативных журналов ВИНИТИ и ГАСНТИ. В 90-е гг. прошлого века профили комплектования библиотек начали составлять на основе Универсальной десятичной классификации (УДК) [2].
Развитие современных информационных технологий позволило решить эту проблему на качественно новом уровне. В 2005 г. в БЕН РАН внедрена в эксплуатацию автоматизированная интерактивная система формирования и поддержки ТТПК на основе УДК [3, 4]. На рис. 1 представлена схема автоматизированной системы ведения сводного ТТПК ЦБС БЕН РАН.
Сотрудниками Центральной библиотеки разработаны единые для всех библиотек правила формирования и актуализации ТТПК:
• при индексации тематических разделов ТТПК библиотек используются индексы УДК, содержащие не более трех знаков после первой точки (предполагалось, что для понимания потребностей библиотеки этого вполне достаточно);
• литература подразделяется на три типа: научная (Н), справочная (С) и учебная (У);
• выделяется три уровня важности изданий: «необходимо иметь в фонде» (3), «желательно иметь в фонде» (2), «возможно иметь в фонде» (1);
• актуализация ТТПК библиотек производится по мере необходимости;
• пересмотр сводного ТТПК ЦБС БЕН РАН производится каждые три года.
На основе этих правил каждая библиотека ЦБС составляет ТТПК и по электронной почте отправляет его на рабочее место администратора системы. В системе производится фильтрация файлов, загружаемых в базу данных библиотек (БДБ). При этом осуществляется семантический контроль, при
котором отсекаются записи, содержащие неправильно оформленные или несуществующие рубрики. В дальнейшем эти записи анализируются сотрудниками отдела комплектования отечественной литературой (ОКОЛ) и отдела научной обработки литературы (ОНОЛ) для принятия решения о вводе необходимых рубрик в базу данных рубрик (БДР) УДК. Далее записи объединяются в единую БД, образуя сводный ТТПК ЦБС БЕН РАН (рис. 1).
Система поддерживает ведение нескольких, связанных между собой посредством номеров (индексов), записей БДР УДК и БДБ. При помощи отсортированных файлов осуществляются поисковые функции системы, контроль над экспортом данных и формируются отчеты и сводные таблицы. База данных рубрик формируется сотрудниками ОНОЛ. Они отслеживают изменения названий рубрик УДК, появление новых разделов и классов. Очень важное место в их работе занимает проверка соответствия названий рубрик и индексов, введенных в БДР ранее и в присланных ТТПК библиотек.
На сегодняшний день БДР УДК содержит 11 тыс. записей рубрик. Однако лишь около 3 тыс. из них имеют указания на комплектуемые библиотеки. Зачем нужны остальные 8 тыс. записей? Можно ли оптимизировать БДР УДК, уменьшив число индексов? Рассмотрим методические и технологические решения, под влиянием которых формировалась БДР УДК.
Путь книги в БЕН РАН предусматривает, что каждое издание систематизируется дважды. Первый раз - это научная систематизация, задачей которой
ТТПК библиотек, входящих в ЦБС БЕН РАН:
• индексы УДК
• типы изданий
• степень важности
Поисковая система: Индексы УДК Рубрика Библиотека Типы изданий Степень важности
Рис. 1. Схема автоматизированной системы ведения сводного ТТПК ЦБС БЕН РАН
ИНФОРМАТИКА
максимально точно отразить содержание каждого издания в виде индексов УДК. Именно эти индексы становятся основой для тематического поиска источников при работе с электронным систематическим каталогом БЕН РАН.
Второй раз - утилитарная систематизация. Еще до внесения издания в электронный каталог (и научной систематизации) в технологической БД БЕН РАН осуществляется распределение экземпляров издания по библиотекам ЦБС в соответствии с их ТТПК. При этом специалист-комплектатор определяет область знания и конкретное научное направление, к которому относится каждое издание. Для этого он пользуется БДР УДК.
Каждый индекс в этой БДР имеет описание, включающее как текст официальных таблиц УДК, так и формулировки рабочих таблиц классификации БЕН РАН. Часть индексов в БДР имеет указание на то, какие библиотеки должны быть укомплектованы литературой по соответствующей тематике. Однако, как мы сказали выше, таких индексов менее половины. Более половины же индексов выполняют лишь справочную роль.
В условиях интенсивной нагрузки комплектатор не имеет возможности ознакомиться с содержанием каждой книги. Поэтому при определении тематики конкретного издания он вынужден ориентироваться на его название, издательскую или авторскую аннотацию, заголовки глав, разделов, оглавление. В этой ситуации справочная роль индексов УДК заключается в том, что они выступают как нормированные ключевые слова. Немаловажно, что эти «ключевые слова» образуют многоуровневую классификацию, к тому же используемую в качестве национального стандарта при индексировании научно-технической информации.
Заметим, что часть записей в БД УДК несет одновременно и информационную (указание на комплектуемые библиотеки), и справочную функцию. Такая ситуация характерна для индексов глубокой детализации, формулировка которых при этом все же соответствует информационным потребностям конкретной библиотеки.
Наконец, среди методических решений, повлиявших на большой объем БД УДК, следует указать еще одно обстоятельство. При переходе библиотеки от традиционной, печатной, формы представления ТТПК к современной, электронной форме, список индексов для БД УДК формировался, отчасти, априорно. В этот список было внесено некоторое количество формулировок «про запас». С одной стороны, эти формулировки отражали общую логику классификации научной литературы. С другой - не выполняли ни информационной (за такими формулировками не было закреплено ни одной библиотеки), ни справочной функции. Рассмотрим последнюю ситуацию на примерах.
Индекс 57 в официальных таблицах УДК имеет описание «Биологические науки в целом». В соответствии с синтаксисом УДК, учебная, справочная литература по биологии в целом имеет индексацию 57(03) и 57(07) соответственно. Однако, как сказано выше, учебная и справочная литература по разным отраслям знаний в ТТПК ЦБС БЕН отделена от собственно научной литературы. Поэтому все индексы с нотацией *(07*) и *(03*) являются избыточными, и их удаление не отразится на процессах комплектования (здесь знак астериска «*» заменяет любое количество любых допускаемых УДК символов).
Индекс 57(1/9) - «региональные аспекты биологических наук в целом» - имеет крайне незначительное наполнение в Едином фонде БЕН, а региональные аспекты конкретный: биологических направлений представляют больший информационный интерес для конечных пользователей. Таким образом, индекс 57(1/9) также может быть удален из БД без последствий для процесса комплектования. Аналогичная ситуация сложилась практически по всем индексам с описанием «в целом» и общими определителями: будучи верными синтаксически, они не имеют ни справочной, ни информационной ценности для ТТПК.
В УДК в явной форме отсутствуют подклассы «Общие вопросы». Источники, касающиеся общих вопросов различных наук, собираются под индексами с описанием «в целом» и добавлением, например, определителей формы или индексов смежных областей знаний. Рассмотрим последнее на примере.
Класс 556 - Гидросфера. Вода в целом. Общая гидрология - подразделяется на следующие подклассы:
556.1 - Гидрологический цикл, свойства и условия. Глобальный водный баланс.
556.3 - Гидрология подземных вод. Геогидрология. Гидрогеология.
556.5 - Гидрология поверхностных вод. Гидрология суши.
При таком делении общие вопросы гидрологии (учебники, справочники, исторические материалы, методы исследования) вынужденно индексируются различными способами: 556(07), 556(03), 556(09), 556:001.891.5. Под самим же индексом 556 собираются материалы общего характера по общей гидрологии.
Отсутствие в УДК подклассов «Общие вопросы» для каждой отрасли знаний порождает одну практическую сложность в управлении комплектованием. Проблема источников учебного и справочного характера решена в ТТПК БЕН «технологически»: вместо соответствующего индексирования с использованием общих определителей формы в ТТПК введено понятие «типа литературы»: научной, учебной, справочной.
Однако проблема с материалами общего характера остается. Следуя логике УДК, темы «материалы общего характера по гидрологии» и «гидрология в целом» индексируются одинаково - 556. При этом наполнение этих тем принципиально различно. В первом случае - это общие вопросы, во втором - все множество частных вопросов.
Если библиотека заказывает литературу по всем частным вопросам какого-либо класса, то это обстоятельство внешне неотличимо от заказа другой библиотекой только общих вопросов по этому классу. В связи с этим, в ТТПК БЕН в качестве эксперимента для каждого класса, содержащего дальнейшую детализацию и являющегося информационным (не справочным), в БД УДК имеется две записи: одна - с указанием «общие вопросы», другая - с указанием «частные вопросы».
Существовавшая априорно заданная установка об ограничении глубины детализации ТТПК сетевых библиотек тремя знаками после запятой в целом себя не оправдала. Большое количество научно-исследовательских тем НИУ РАН, которые обслуживает ЦБС БЕН РАН, индексируются по УДК с использованием специальных определителей. Поэтому в настоящее время норма об ограничении глубины детализации шестью символами -рекомендательная: для некоторых разделов УДК (и соответствующих им отраслей знаний) ее вполне достаточно, чтобы определить тематику не статейных публикаций. А при необходимости в ТТПК вносится индекс УДК полностью, в соответствии с потребностями конкретной библиотеки.
Таким образом, на современном этапе развития БД УДК содержит индексы, выполняющие информационные и справочные функции. Оптимизацию этой БД нельзя осуществить путем сокращения ее объема. Мы показали, что часть индексов может быть удалена: это индексы, не выполняющие ни информационной, ни справочной функции в ТТПК. В то же время в БД следует ввести дополнительные рубрики, которые позволят разграничить об-
щие вопросы отдельных отраслей знаний и источники, содержащие информацию по этим же отраслям знаний в целом. При последнем обновлении данных сводного ТТПК ЦБС БЕН РАН выявлена потребность библиотек в литературе по истории и философии конкретных наук, правовой литературе. Поэтому необходимо внести соответствующие индексы УДК, ранее не используемые в БД.
Можно сказать, что современное направление развития системы ТТПК в ЦБС БЕН РАН - это направление к разделению функций между библиотечными специалистами разного профиля. От одного специалиста не требуется знаний состояния книжного рынка, УДК и информационных потребностей конкретного исследовательского учреждения. За счет совершенствования системы редактирования БД рубрик УДК и принципов ее наполнения специалист каждого профиля получает возможность работать с самодостаточной БД, которая к тому же обладает и справочной функцией. Все это в конечном итоге повышает эффективность работы комплектаторов и систематизаторов и оптимизирует их трудовые затраты.
Литература
1. Справочник библиотекаря / науч. ред. А. Н. Ванеев ; Брежнева В. В. [и др.]. - СПб., 2010. - С. 57-60.
2. Дмитриева З. Г., Кочукова Е. В., Наумова В. С. Совершенствование системы централизованного комплектования отечественной литературой на базе использования сетевых технологий // Современные технологии в информационном обеспечении науки. -М., 2003. - С. 243-246.
3. Бочарова Е. Н., Кочукова Е. В., Докторов Я. Я. Актуализация сводного тематико-типологического плана комплектования ЦБС БЕН РАН // Библиосфера. -2009. - № 2. - С. 87-89.
4. Дмитриева З. Г., Докторов Я. Я. Автоматизированная система формирования тематико-типологических планов комплектования ЦБС БЕН РАН // Университетская библиотека: через традиции к инновациям : сб. докл. межрегион. науч.-практ. конф. (2-5 окт. 2007 г.). - Казань, 2007. - С. 93-98.
Материал поступил в редакцию 06.03.2013 г.
Сведения об авторах: Бочарова Елена Николаевна - младший научный сотрудник отдела комплектования отечественной литературой, тел.: (495) 291-21-87, e-mail: [email protected],
Ивановский Александр Александрович - кандидат биологических наук, заведующий отделом проблем управления ЦБС, тел.: (495) 691-24-78, e-mail: [email protected]