База данных «авторитетный файл наименований научных учреждений АПК»: формирование, организация поиска, актуализация Data base named as "authority file of names of the AIC scientific institutions": formation,
organization of search, updating
Ь Л московский ЩР экономический
лЛ ЖУРНАЛ
УДК 63:025.3 DOI 10.24411/2413-046Х-2019-17027 Семенова Ольга Федоровна,
старший научный сотрудник, Центральная научная сельскохозяйственная библиотека, г. Москва
Ласточкина Наталия Владиславовна,
старший научный сотрудник, Центральная научная сельскохозяйственная библиотека, г. Москва
Стеллецкий Василий Игоревич,
ведущий инженер-программист, Центральная научная сельскохозяйственная библиотека, г. Москва
Semienova O.F., sof@cnshb.ru
Lastochkina N.V., lnv@cnshb.ru
Stelletsky V.I., swi@cnshb.ru
Аннотация: Описаны результаты научной работы по актуализации генерируемой в ФГБНУ ЦНСХБ многофункциональной базы данных «Авторитетный файл наименований научных учреждений АПК», выполненные в 2017-2019 гг. Представлены результаты исследований по развитию и совершенствованию программных и лингвистических средств, обеспечивающих унификацию представления библиографических данных, структурирование информации, совершенствование поиска. Приведены результаты пополнения контента базы данных, расширения справочно-фактографической
информации о научных учреждениях на основе анализа внутренних и внешних источников в части наименований научных учреждений АПК. Рассмотрены методические решения по формированию авторитетных данных на научные учреждения АПК, учитывающие варианты объединения научных учреждений и структурные особенности создаваемых аграрных и многоотраслевых научных центров. Изложены результаты работ по совершенствованию сервисных возможностей базы и навигации в информационных ресурсах на основе авторитетных данных: по модернизации программных средств, разработанных в ЦНСХБ, обеспечивающих поиск библиографической и полнотекстовой информации об изданиях научных учреждений и публикациях сотрудников из авторитетных записей; по разработке сервиса поиска информации о научных учреждениях АПК из библиографических записей базы данных «АГРОС» с предоставлением пользователю исторической информации о научном учреждении и пакета библиографической информации об изданиях научного учреждения и публикациях сотрудников.
Summary: The results of the scientific work on updating the multifunctional data base "Authority file of names of the AIC scientific institutions" generated in the Central Scientific Agricultural Library in 2017-2019 are described. The results of research on the development and improvement of software and linguistic tools that ensure the unification of the presentation of bibliographic data, the structuring of information, and the improvement of search are presented. The results of the replenishment of the database content, expansion of reference-factual information about scientific institutions based on the analysis of internal and external sources in terms of the names of scientific institutions of the agro-industrial complex are given. Methodical decisions on the formation of authority data on scientific institutions of the agro-industrial complex, taking into account the options for combining scientific institutions and the structural features of agricultural and diversified research centers, are considered. The results of work on improving the service capabilities of the database and navigation in information resources based on , authority data are presented: on software upgrades developed at the Central Scientific Agricultural Library, providing search for bibliographic and full-text information about publications of scientific institutions and publications of employees from authority records; on the development of a service for searching information on scientific institutions of the agro-industrial sector from bibliographic records of the AGROS data base, providing the user with historical information about the scientific institution and a bibliographic information package about publications of the scientific institution and publications of employees.
Ключевые слова: базы данных, авторитетные данные, авторитетный файл, информационный поиск, информационные ресурсы, научные учреждения, АПК, ЦНСХБ. Keywords: data bases, authority data, authority file, information search, information resources, research institutions, agricultural and industrial complex, CSAL.
Введение. Формирование авторитетных файлов является одним из средств совершенствования структуры библиографических, реферативных, полнотекстовых и других ресурсов, создаваемых библиотеками, а также инструментом поиска. Авторитетные файлы представляют собой часть лингвистического обеспечения информационно-поисковой системы современной библиотеки, служат для идентификации лиц, организаций, географических наименований, предметов. Посредством авторитетных данных устанавливаются связи между различными объектами, что обеспечивает навигацию в среде данных и доступ к информационным ресурсам. Крупнейшие библиотеки России (РГБ, РНБ, БАН, ГПНТБ СО РАН, ЦНСХБ, ЦНМБ) проводят исследования по созданию авторитетных файлов для таких объектов, как предмет (тема), лицо, организация, географическое название [1]. Осуществляется многолетнее взаимодействие национальных, отраслевых, региональных российских библиотек в проекте Центра ЛИБНЕТ по корпоративному созданию и ведению Базы данных «Авторитетные файлы», которая включает авторитетные данные на имена лиц, наименования организаций и предметные рубрики, общим объемом более 2,3 млн. записей. Реализуются проекты, в которых доступ пользователей к базам данных и каталогам, сформированным в различных форматах и изолированных хранилищах, организован из единой точки при помощи структурированных авторитетных данных [2].
Ведущая отраслевая библиотека России Федеральное государственное бюджетное научное учреждение «Центральная научная сельскохозяйственная библиотека» (ЦНСХБ) более 10 лет осуществляет работы по формированию авторитетных данных на наименования организаций и использованию их для организации доступа к информационным ресурсам. С 2016 г. в информационной системе ЦНСХБ функционирует отраслевое лингвистическое средство - База данных «Авторитетный файл научных учреждений АПК» (БД «АФ НИУ АПК»), сформированная в рамках выполнения работ по государственному заданию [3]. Записи БД «АФ НИУ АПК» используются многофункционально: для организации авторитетного контроля библиографических данных при создании библиографического описания документа, как средство поиска библиографической и полнотекстовой информации, как источник справочно-фактографической информации. Авторитетные данные создаются в Российском
коммуникативном формате представления авторитетных/нормативных записей в машиночитаемой форме (RUSMARC Authorities) с использованием программного модуля MarcAuth для создания и ведения авторитетных файлов АИБС MARC-SQL. Глубина ретроспекции базы - с середины XIX в. В БД «АФ НИУ АПК» включено около 1150 авторитетных записей на 290 действующих научных учреждений АПК, в том числе, научно-исследовательских институтов и их филиалов - 54%, опытных станций - 32%, федеральных аграрных научных центров - 4%, академий и их подразделений - 2%. За 2017-2019 гг. в базу данных включено около 500 авторитетных записей на 120 учреждений, в том числе, около 50 авторитетных записей на иностранных языках.
В информационно-поисковой системе ЦНСХБ осуществляется авторитетный контроль точек доступа на наименования организаций на монографическом уровне формирования библиографических записей, заголовки авторитетного файла используются для заполнения сведений о месте работы авторов статей на аналитическом уровне формирования библиографических записей.В отраслевом проекте «Сводный каталог библиотек АПК» формируются контролируемые точки доступа на наименования организаций в библиографических записях библиотек-участников. Набор обязательных элементов данных авторитетной записи на наименование научного учреждения АПК включает историческую справку, информационные ссылки, варианты наименований организации, связанные наименования и другие элементы. Записи на равноправные принятые наименования организации, за разный период ее существования, а также на наименования связанных с ней организаций формируют кластер авторитетных записей, так как между записями средствами формата RUSMARC Authorities устанавливаются различные типы связей. Авторитетные записи из модуля MarcAuth конвертируются в формат HTML и загружаются в Информационно-поисковую систему «Артефакт» (ИПС «Артефакт») для формирования БД «АФ НИУ АПК» с применением программных средств, разработанных в ЦНСХБ.
БД «АФ НИУ АПК» размещена на сайте ЦНСХБ в открытом доступе в форме отдельного информационного ресурса. Просмотр данных базы пользователями осуществляется в доступном интерфейсе через браузер. Поиск в базе данных возможен по отдельным элементам: принятому наименованию организации, вариантам наименований, связанным наименованиям, наименованиям на иностранном языке, исторической справке, информационным ссылкам, полям примечаний, идентификатору записи, источнику записи, или по всем элементам одновременно. Пользователям предоставляются справочные и исторические сведения об учреждении, возможности осуществления
гипертекстовой навигации к связанным наименованиям научных учреждений, поиска в базе данных «АГРОС» и Электронной библиотеке, просмотра соответствующей записи в формате RUSMARC Authorities.
Включение авторитетных файлов в состав лингвистического обеспечения отраслевой ИПС соответствует современному уровню информационного обслуживания пользователей. Целью исследования является формирование и актуализация авторитетных данных о научных учреждениях АПК, развитие пользовательских сервисов, совершенствование программных и лингвистических средств поиска в отраслевой информационно-поисковой системе.
Методы. Методологической основой исследования явились положения, изложенные в «Функциональных требованиях к авторитетным данным», разработанные Международной федерацией библиотечных ассоциаций и учреждений (ИФЛА), и методика создания, ведения и использования Национального авторитетного файла, разработанная Российской национальной библиотекой и Центром ЛИБНЕТ [4, 5]. Авторитетные данные в БД «АФ НИУ АПК» формируются с использованием методов анализа, сопоставления, моделирования и синтеза с учетом особенностей создания отраслевого многофункционального информационного ресурса. При этом соблюдаются принципы достоверности и полноты информации о научном учреждении АПК, принцип выявления актуальных и исторических форм наименований учреждения с использованием внутренних и внешних источников, принцип формирования максимального количества связей в авторитетных записях для создания кластеров взаимосвязанных наименований за весь период существования учреждения.
Результаты и обсуждения. Актуализация БД «АФ НИУ АПК», проведенная в 20172019 гг., включала работы по развитию и совершенствованию программных и лингвистических средств, обеспечивающих унификацию данных, представление и структурирование информации в части наименований организаций; пополнение контента базы данных за счет формирования авторитетных данных на наименования научных учреждений по различным направлениям сельского хозяйства; развитие методики формирования авторитетных данных на наименования научных учреждений АПК; развитие пользовательских сервисов и совершенствование поиска в информационных ресурсах.
В процессе актуализации БД «АФ НИУ АПК» формируются авторитетные записи на наименования вновь созданных учреждений, и проводится модификация ранее созданных авторитетных записей. Авторитетные записи модифицируются при изменениях в
географических названиях, присвоении организации имени ученого, уточнении исторических сведений, выявлении новых вариантов наименований, ссылок на официальные документы, при переименовании и изменении статуса учреждения. Осуществляется постоянный мониторинг изменений наименований научных учреждений АПК. Источником актуализации БД «АФ НИУ АПК» в 2017-2019 гг. служили издания научных учреждений АПК, поступившие в фонд ЦНСХБ, приказы Федерального агентства научных организаций, Министерства науки и высшего образования, уведомления о реорганизациях, полученные из научных учреждений АПК, данные о месте работы авторов статей в журналах и сборниках, справочники, энциклопедии и внешние источники информации, предоставляющие наиболее достоверные сведения об учреждениях.
Включение в БД «АФ НИУ АПК» авторитетных записей на новые и измененные наименования научных учреждений потребовало проведения дополнительного анализа входного потока документов и развития методики по формированию авторитетных записей. Выработаны методические решения по формированию авторитетных данных на наименования отраслевых федеральных аграрных научных центров, которые учитывают различные варианты объединения научных учреждений и структурные особенности создаваемых центров. Например, при создании Федерального научного агроинженерного центра ВИМ в 2016-2017 гг. реорганизованы 7 научных учреждений, которые или изменили наименование или вошли в состав центра как подразделение, утратив свое наименование. Авторитетные данные на эти учреждения уже были включены в БД «АФ НИУ АПК», в связи с реорганизацией справочная информация дополнена, сформированы ссылки и установлены связи с записью на наименование центра. При формировании авторитетных данных на наименование центра проведено объединение нескольких кластеров авторитетных записей. С этой целью сформированы ссылки и установлены связи «см.» и «см. также» с авторитетными записями на наименования институтов -подразделений центра.
Пример ссылочных примечаний в авторитетной записи на наименование центра: 200а Федеральный научный агроинженерный центр ВИМ c Москва
305а До 2017 г. см.:
Ь Всероссийский научно-исследовательский институт механизации сельского хозяйства (Москва) Ь Всероссийский научно-исследовательский технологический институт ремонта и эксплуатации машинно-тракторного парка (Москва)
b Всероссийский научно-исследовательский институт электрификации сельского хозяйства (Москва)
305a До 2018 г. см.:
b Всероссийский научно-исследовательский институт механизации животноводства (пос. Знамя Октября, Московская обл.)
b Всероссийский научно-исследовательский институт механизации и информатизации агрохимического обеспечения сельского хозяйства (Рязань) b Рязанский научно-исследовательский институт сельского хозяйства 305a См. также:
b Институт агроинженерных и экологических проблем сельскохозяйственного производства (Санкт-Петербург)
Сегмент авторитетных записей БД «АФ НИУ АПК» на наименование федерального аграрного научного центра представляет собой агломерат (объединение) кластеров авторитетных данных на наименования научных учреждений. В зависимости от варианта объединения аграрных научных учреждений и структурных особенностей федерального научного центра в агломерат включаются авторитетные данные на вновь созданные учреждения; данные на учреждения, на основе которых образован центр; данные на учреждения, вошедшие в состав центра на правах филиалов или подразделений, без изменения наименований и изменившие наименования. Варианты объединения научных учреждений отражаются в характере и количестве устанавливаемых связей в агломерате авторитетных данных.
Выработаны методические решения по формированию авторитетных данных на наименования региональных многоотраслевых научных центров Российской академии наук, в которые в статусе подведомственных учреждений вошли аграрные научные учреждения. В справочном примечании авторитетной записи на наименование центра РАН указываются все научные учреждения, вошедшие в состав центра, сведения, относящиеся к истории создания центра (дата создания, этапы реорганизации и др.). Ссылки к записям на наименования учреждений, вошедших в состав центра, и связи с ними не формируются.
В 2019 г. проведены работы по расширению справочно-фактографической информации о научных учреждениях в БД «АФ НИУ АПК». В набор авторитетных данных на действующее наименование научного учреждения АПК включены: URL сайта научного учреждения, URL страницы с контактной информацией, URL страницы научного учреждения на сайте федерального центра и т. п. В БД «АФ НИУ АПК» программными средствами, разработанными в ЦНСХБ, созданы новые поисковые опции
«Сайт» и «Контакты» в форме гипертекстовой навигации к внешним ресурсам. Таким образом, к имеющимся данным об истории, датах, географическом месте, языке организации, добавлены адресные характеристики организации: адрес местонахождения и/или почтовый адрес, номера телефонов, адреса электронной почты, адрес веб-сайта, который поддерживает организация, или веб-сайта об организации.
Дальнейшее развитие пользовательских сервисов и совершенствование возможностей поиска на основе БД «АФ НИУ АПК» состояло в интеграции функциональности авторитетных данных, что включает обеспечение процессов поиска ресурсов, просмотра ресурсов, связанных определенной тематикой, навигацию между ресурсами. В 2019 г. проведены работы по модернизации программных средств, обеспечивающих возможность поиска библиографической и полнотекстовой информации по изданиям научных учреждений, имеющимся в фонде ЦНСХБ и в фондах библиотек-участников отраслевого проекта «Сводный каталог библиотек АПК». К возможности поиска изданий научного учреждения (монографии, сборники трудов, материалы конференций, авторефераты диссертаций и т. д.) добавлена возможность поиска статей сотрудников научного учреждения со страницы научного учреждения в БД «АФ НИУ АПК». При нажатии пользователем кнопки/опции «Поиск в БД АГРОС» программные средства, разработанные в ЦНСХБ, формируют поисковый запрос, включающий соответствующие идентификаторы авторитетных записей и принятую форму авторитетной записи на наименование научного учреждения из БД «АФ НИУ АПК». В один клик пользователь получает всю информацию о публикациях научного учреждения и его сотрудников, имеющихся в каталогах ЦНСХБ и «Сводном каталоге библиотек АПК». Пакет библиографической информации структурирован по виду документов и по дате публикации, можно выбрать интересующий сегмент информации, перейти к библиографической записи, заказать документ из фонда и т.д. Кликнув на кнопку/опцию «Поиск в Электронной библиотеке» на странице научного учреждения в БД «АФ НИУ АПК», пользователь получает список библиографической информации об изданиях научного учреждения, полный текст которых размещен в Электронной библиотеке, а также доступ к этим документам.
В 2018-2019 гг. на основе структурированных авторитетных данных на наименования научных учреждений АПК, имеющихся в библиографических записях базы данных «АГРОС», разработан сервис поиска информации о научных учреждениях АПК, позволяющий формировать необходимый для пользователя пакет сведений об изданиях, организовывать доступ к изданиям и предоставлять другие сервисные возможности.
Документографическая база данных «АГРОС» - главное звено информационно-поисковой системы ЦНСХБ объемом свыше 1,954 млн записей. В структуру базы данных входят электронные каталоги: книг, журналов, статей, авторефератов диссертаций, депонированных рукописей, редких и ценных книг, документов из других библиотек, документов ФАО, электронных ресурсов, отчетов о НИР, газет [6]. В процессе загрузки библиографической информации в ИПС «Артефакт» программными средствами, разработанными в ЦНСХБ, проводится сравнение данных на наименования научных учреждений АПК с данными файлов-таблиц, включающих принятые формы наименований и идентификаторы БД «АФ НИУ АПК». Файлы-таблицы с нормированными данными автоматически пересоздаются при каждом обновлении БД «АФ НИУ АПК». В библиографических записях на монографическом уровне проводится поиск соответствующего идентификатора авторитетной записи. В библиографических записях на аналитическом уровне осуществляется побуквенное сравнение данных из поля «Место работы автора» с принятыми формами наименований авторитетных записей, что существенно расширяет зону поиска. При положительном результате поиска в библиографической записи базы данных «АГРОС» строка с данными на наименование научного учреждения становится активированной, формируется гиперссылка. При наведении курсора на активированную строку пользователь видит всплывающий текст «Информация из Авторитетного файла ЦНСХБ». По гиперссылке происходит прямой переход из библиографической записи базы данных «АГРОС» на соответствующую страницу БД «АФ НИУ АПК», откуда пользователь может осуществить широкий поиск публикаций научного учреждения АПК.
Выводы. В результате научного исследования проведен анализ внутренних и внешних источников в части наименований научных учреждений АПК, сформированы авторитетные записи на наименования вновь созданных учреждений для включения в БД «АФ НИУ АПК» и проведена модификация ранее созданных авторитетных записей. Оптимизирована и расширена методика формирования авторитетных записей на наименования научных учреждений АПК с учетом вариантов объединения научных учреждений и структурных особенностей создаваемых научных центров. БД «АФ НИУ АПК» используется как элемент лингвистического обеспечения для создания информационных продуктов и/или ресурсов ЦНСХБ, таких как база данных «АГРОС», Электронная библиотека, тематических полнотекстовых и реферативных баз данных и других, в общеотраслевом проекте «Сводный каталог библиотек АПК». Программными средствами, разработанными в ЦНСХБ, на основе БД «АФ НИУ АПК» осуществляется
гипертекстовая навигация в информационных ресурсах ЦНСХБ от авторитетных данных к другим авторитетным данным и/или библиографическим данным, и от библиографических данных к авторитетным данным. Авторитетные записи «БД АФ НИУ АПК» содержат фактографическую и историческую информацию о научных учреждениях, с максимальной полнотой отражают связи между различными формами наименований научных учреждений АПК, включают ссылки к внешним ресурсам. На основе структурированных авторитетных данных БД «АФ НИУ АПК», которые позволяют точно идентифицировать объекты и установить связи между ними, а также обеспечивают точность поиска, реализован формат «единого окна» по организации доступа пользователей к информации о научных учреждениях АПК и их публикациях. БД «АФ НИУ АПК» представляет собой многофункциональный информационный продукт, обеспечивающий поиск изданий научных учреждений АПК и информации о них, поиск в отраслевых ресурсах и навигацию между ресурсами.
Список литературы
1. Стегаева М.В. Национальный авторитетный файл наименований организаций: теоретические и технологические аспекты формирования и ведения : автореф. дис. ...канд. пед. наук. - СПб., 2016. - 24 с.
2. Буле В. Возобновление роли авторитетных данных для библиографических описаний в отношении с Веб: опыт Национальной библиотеки Франции // II Международный библиографический конгресс, 6 октября 2015, Москва, РГБ. URL: http://www.aselibrary.ru/video/conference43/conference436750/ (дата обращения: 27.05.2019).
3. Ласточкина Н.В., Семенова О.Ф., Сычева Е.П. Информация о научно-исследовательских учреждениях АПК - в помощь специалистам // Вестник российской сельскохозяйственной науки. - 2016. - № 5. - С. 25-27.
4. Функциональные требования к авторитетным данным. Концептуальная модель. Рабочая группа ИФЛА по разработке функциональных требований к авторитетным записям и их нумерации (FRANAR) : заключительный отчет, декабрь 2008. - СПб. : РНБ, 2011. - 115 с.
5. Национальный авторитетный файл : руководство по созданию, ведению и использованию. Вып. 1. Наименование организации. Предметные рубрики. - М., 2005. -184 с.
6. Пирумова Л.Н. База данных «АГРОС»: структура, формирование и актуализация // Научно-техническая информация. Серия. 1. - 2018. - № 12. - С. 14-20.