Научная статья на тему 'Интегральная система ВИНИТИ РАН по информационному обеспечению научных исследований в области точных, естественных и технических наук: концепция создания и перспективы развития'

Интегральная система ВИНИТИ РАН по информационному обеспечению научных исследований в области точных, естественных и технических наук: концепция создания и перспективы развития Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
383
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БАЗА ДАННЫХ / БАНК ДАННЫХ / ИНФОРМАЦИОННАЯ СИСТЕМА / ИНФОРМАЦИОННЫЙ РЕСУРС / ИНФОРМАЦИОННАЯ НАВИГАЦИЯ / КЛАССИФИКАЦИОННАЯ СИСТЕМА / РЕФЕРАТИВНЫЙ ЖУРНАЛ / РУБРИКАТОР / ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Никольская Инга Юрьевна

Рассмотрен опыт проектирования и основные направления развития интегральной информационной системы (ИИС) ВИНИТИ РАН по точным, естественным и техническим наукам. Характеризуются информационные ресурсы, представленные в ИИС, поисковые возможности и средства их реализации. Показаны новые тематические фрагменты в составе ресурсного комплекса ИИС, обозначены пути формирования механизмов информационной навигации. Обосновывается необходимость дальнейшего развития классификационных систем по точным, естественным и техническим наукам и работы по совершенствованию рубрикаторов ВИНИТИ РАН, относящихся к этим областям научного знания.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Никольская Инга Юрьевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Интегральная система ВИНИТИ РАН по информационному обеспечению научных исследований в области точных, естественных и технических наук: концепция создания и перспективы развития»

И.Ю. Никольская*

ИНТЕГРАЛЬНАЯ СИСТЕМА ВИНИТИ РАН ПО ИНФОРМАЦИОННОМУ ОБЕСПЕЧЕНИЮ НАУЧНЫХ ИССЛЕДОВАНИЙ В ОБЛАСТИ ТОЧНЫХ, ЕСТЕСТВЕННЫХ И ТЕХНИЧЕСКИХ НАУК: КОНЦЕПЦИЯ СОЗДАНИЯ И ПЕРСПЕКТИВЫ РАЗВИТИЯ

Рассмотрен опыт проектирования и основные направления развития интегральной информационной системы (ИИС) ВИНИТИ РАН по точным, естественным и техническим наукам. Характеризуются информационные ресурсы, представленные в ИИС, поисковые возможности и средства их реализации. Показаны новые тематические фрагменты в составе ресурсного комплекса ИИС, обозначены пути формирования механизмов информационной навигации. Обосновывается необходимость дальнейшего развития классификационных систем по точным, естественным и техническим наукам и работы по совершенствованию рубрикаторов ВИНИТИ РАН, относящихся к этим областям научного знания.

Ключевые слова: база данных; банк данных; информационная система; информационный ресурс; информационная навигация; классификационная система; реферативный журнал; рубрикатор; предметный указатель.

1. Основные характеристики интегральной информационной системы ВИНИТИ РАН

Интегральная информационная система (ИИС) ВИНИТИ РАН -это комплекс информационных ресурсов и научно-информационные средства для их эффективного использования. Ядром проекти-

* Никольская Инга Юрьевна - доктор технических наук, заместитель директора по научной работе Всероссийского института научной и технической информации РАН (г. Москва). E-mail: noz@viniti.ru

33

руемой ИИС станет Банк данных (БнД) ВИНИТИ (1). Он представляет собой совокупность подсистем, функционирующих на различных программно-аппаратных платформах в технологическом сегменте локально-вычислительной сети (ЛВС) ВИНИТИ. Характерной особенностью БнД является постоянное совершенствование механизма его функционирования и способов представления в нем информации. К другим составляющим элементам ИИС относятся архив опубликованных первичных и вторичных документов, а также разработанные процедуры информационного обмена с отечественными и зарубежными информационными организациями. Эти процедуры позволяют говорить о создании в ВИНИТИ уникальной информационной навигационной системы, которая будет функционировать в рамках создаваемого в ВИНИТИ специального портала.

Общее представление об информационных потоках и ресурсах ВИНИТИ дает рисунок 1.

ПОЛЬЗОВАТЕЛИ Рис. 1. Информационные потоки и ресурсы ВИНИТИ

Специализированный научно-информационный портал ВИНИТИ1 призван обеспечивать многоцелевую навигацию по электронным ресурсам в различных областях науки и техники. Благодаря использованию сети Интернет обмен информацией может происхо-

1 http://www2.viniti.ru

34

дить между регионами России, странами СНГ, а также ближнего и дальнего зарубежья. Система информационной навигации ВИНИТИ представлена на рисунке 2.

ПОЛЬЗОВАТЕЛИ

Средства поиска информации

Программное обеспечение

•ИПС для

диалогового поиска врежиме on-line •ИПС для

диалогового поиска вБДна CD-ROM •ПО электронного РЖ

Лингвистическое обеспечение

•Тезаурусы •Ключевые слова •Классификации •Словари

неинформативной лексики

•Алгоритмические средства распознавания неинформативной лексики

Методическое обеспечение

•Характеристики

информационных

ресурсов

•Форматы

представления

данных

•Адресная информация •Рекомендации (Help) для пользователей по проведению поиска

Рис. 2. Средства информационной навигации ВИНИТИ

Составной частью в ИИС ВИНИТИ войдет архив ВИНИТИ. В своей основе - это сотни тысяч поступивших в ВИНИТИ за многие годы книг, статей, материалов конференций, специальных выпусков и изданий, депонированных рукописей, авторефератов кандидатских и докторских диссертаций. Архив будет постоянно пополняться огромным количеством ежегодных поступлений, которые обрабатываются и систематизируются с использованием УДК (13-14), ГРНТИ (4-6) и Рубрикатора ВИНИТИ (11-12).

Доступ к архиву будет обеспечиваться через фонды ВИНИТИ с помощью систематизированных информационных кодов документов (СИДов) и поисковых образов документов (ПОДов). Сегодня очевидна необходимость постепенного перевода наиболее используемой части архива в электронную форму. Поэтому требуется дальнейшее развитие информационной системы в указанном направлении. Сис-

35

тема должна базироваться на современных информационных технологиях и располагать богатым банком знаний (9, с. 21-23).

Для решения этих задач была предложена концепция создания ИИС ВИНИТИ. На базе ВИНИТИ как головного института Государственной системы научной и технической информации (ГСНТИ) и базовой организации по обмену научной и технической информацией между государствами - участниками СНГ была начата разработка специальной информационно-поисковой системы по точным, естественным и техническим наукам. В соответствии с концепцией вся информационная система ВИНИТИ будет состоять из нескольких информационных комплексов, каждый из которых, в свою очередь, будет содержать несколько информационных подсистем:

1. Точные науки

1.1. Математика

1.2. Физика

1.3. Астрономия

1.4. Механика

2. Естественные науки

2.1. Науки о жизни

2.2. Науки о Земле

2.3. Химия

3. Технические науки

3.1. Автоматика и радиоэлектроника

3.2. Машиностроение

3.3. Металлургия

3.4. Транспорт

3.5. Энергетика и электротехника

Тематическое деление комплексов соответствует внутренней структуре ВИНИТИ (15, с. 72). Пути создания интегрированной системы информационных ресурсов рассмотрены в (8). Работы по созданию ИИС ВИНИТИ будут проходить в несколько этапов. На первом этапе планируется охватить комплекс точных наук (в первую очередь, математических и физических). Совершенно очевидно, что формирование ИИС ВИНИТИ должно определяться новыми перспективами развития информационной системы ВИНИТИ (обновленными представлениями об информационных ресурсах соответствующих БД, выходами на различные классификационные системы, широким использованием данных из смежных областей знаний и др.).

36

2. Архитектура ИИС ВИНИТИ РАН по математическим и физическим наукам

Качество информационной системы в первую очередь определяется спектром информационных услуг, предоставляемых пользователю. При этом имеется в виду как удовлетворение запросов самого пользователя, так и информационный сервис, предлагаемый системой.

Информационная система должна обеспечивать выполнение следующих основных требований (9, с. 21-23):

• гарантированная полнота вводимого массива документов по объявленной тематике и данных, содержащихся в документе;

• высокая информативность рефератов и формализация изложения;

• многоаспектность отражения содержания документа как на естественном языке в реферате, так и на языке классификационных кодов и ключевых слов;

• наличие ряда дополнительных сведений: место выполнения работы, указание характера документа (оригинальная работа, обзор, персоналия и т.д.), вида документа (статья, диссертация, монография, препринт).

Внедрение современных технологий, использующих высокоорганизованную электронную технику, предоставляет новые возможности по части расширения спектра информационных услуг (быстрота поиска нужной информации, использование для поиска больших массивов документов, возможность вхождения в информационные банки данных и передачи информации по различным каналам связи и др.).

В то же время автоматизацию процессов подготовки, хранения, поиска и выдачи информации можно рассматривать как средство совершенствования обслуживания пользователей. Основой совершенствования обслуживания и расширения сервиса являются:

• обогащение информационного фонда данными, в первую очередь, получаемыми путем углубленной интеллектуальной обработки документа;

• обеспечение средств доступа к хранящейся в банке информации;

• возможность пополнения информации, содержащейся в базах данных, новыми фактами, полученными путем применения экспертных систем, и в конечном итоге - создание базы знаний.

37

Автоматизация информационных процессов должна обеспечить пользователю возможность не только получить ответ на поставленный вопрос, но и провести диалог с базой знаний. Поэтому наряду с документальными базами данных должен быть создан ряд сервисных (обслуживающих информационный поиск) и справочных баз данных, имеющих корреляцию с документальными базами. Все эти базы будут загружены в систему и сформируют ее единый, политематический аспектный информационный фонд. При этом предполагается, что информация, предназначенная для вывода из баз данных системы, может предоставляться как на бумажных, так и на электронных носителях.

Таким образом, можно сформулировать цели создания интегральной информационной системы ВИНИТИ (ИИС ВИНИТИ).

А. Создание политематического информационного фонда, содержащего:

• документальные базы первичных и вторичных информационных источников;

• сервисные (обслуживающие информационный поиск) базы, необходимые для формирования документальных баз данных (классификационные системы, различного вида указатели, многоязычные терминологические словари, тезаурусы, дескрипторные списки и др.);

• справочные базы (научных центров, тематических исследовательских планов и их реализации, научных конференций, регистрационной системы ученых-математиков, планов изданий математических издательств и др.).

Б. Организация оперативного и качественного информационного обслуживания индивидуальных и коллективных пользователей, которым необходима многоаспектная информация по спектру проблем и задач, исследование и решение которых возможно с использованием информационных ресурсов ИИС.

ИИС будет выполнять оперативное обслуживание своих постоянных пользователей, обращающихся с запросами. Система сможет обеспечить выдачу любой информации, содержащейся в ее информационном фонде. Поиск информации будет проходить в режиме диалога пользователя с системой.

Обращение к системе будет происходить на естественном языке предметной области. Системой будут обеспечиваться «дружелюбный» интерфейс и возможность доступа к информационному фонду пользователей с разным уровнем подготовки.

В качестве рабочего естественного языка первоначально будет принят русский язык, а затем - английский и другие языки.

38

Английский язык будет использоваться как язык-посредник для дальнейшего расширения набора рабочих языков.

Сведения могут выдаваться в любой заказанной компоновке информационных данных, содержащихся в системе.

Пользователь сможет стать постоянным абонентом издания, скомпонованного по его личному заказу (избирательное распространение информации (ИРИ). В зависимости от набора заказанных данных (информационных полей) такие издания будут иметь вид экспресс-оповещения.

Система будет обеспечивать получение информационных изданий в электронном виде, допускающем их тиражирование, как на электронных, так и на бумажных носителях. В частности, смогут компоноваться и выдаваться на электронных носителях:

• реферативный журнал (русская версия, в перспективе и английская версия);

• сигнальная информация (библиографический сборник тематически упорядоченных библиографических описаний новых документов, поступивших в систему);

• указатели к реферативному журналу (к каждому номеру реферативного журнала), а также кумулятивные годовые указатели (авторские, систематические, указатели журналов, конференций, монографий, персоналий и т.д.).

В режиме диалога, используя также экспертную систему, пользователь сможет последовательно установить интересующую его многоплановую информацию. Эта форма сервиса основана на том, что все базы данных, включенные в систему (и те, которые могут быть включены в дальнейшем), образуют Единый информационный фонд.

Программное обеспечение системы позволит выдавать комплексный ответ на запрос, который компонуется путем обращения к разным базам данных. Банк данных обеспечит взаимодействие всех баз, погруженных в Единый информационный фонд. Система предусматривает возможность расширения числа баз данных и организации взаимодействия между ними.

В результате анализа информационных ресурсов в области математических и физических наук и средств доступа к ним стала очевидной необходимость формирования в составе ИИС ВИНИТИ принципиально новых фрагментов этой системы. Создание этих фрагментов должно обеспечить процесс формирования у пользователей интегральных проблемно-ориентированных информационных полей и, следовательно, переход на более высокий уро-

39

вень информационного сопровождения научных исследований. Для решения поставленной задачи необходимо:

• разработать архитектуру и необходимый интерфейс для пользователей ИИС;

• расширить зону поиска релевантной информации и существенно снизить уровень «информационного шума»;

• разработать интегральные классификационные системы (рубрикаторы по математическим и физическим наукам), позволяющие вести сквозной поиск необходимой информации в отечественных и зарубежных источниках;

• разработать и обеспечить дальнейшее развитие системы лингвистического оснащения, обеспечивающей поиск релевантной информации;

• обеспечить взаимодействие электронных информационных ресурсов (ЭИР) ИИС с информационными ресурсами в традиционной (печатной форме), включая первоисточники.

Обобщенная архитектура ИИС ВИНИТИ РАН по математическим и физическим наукам представлена на рисунке 3. В составе ИИС центральную часть составляют БД «Математика» и «Физика».

3. Электронные информационные ресурсы ИИС ВИНИТИ РАН по математическим и физическим наукам

При разработке БД «Математика» и «Физика» необходимо было полностью переосмыслить архитектуру новых БД в составе политематического БнД ВИНИТИ, а также перспективы развития обеих БД и в полной мере использовать многолетний опыт известных математических и физических школ России.

Для эффективной работы системы информационного обеспечения научных исследований в области математических и физических наук БД «Математика» и «Физика» должны обладать следующими характеристиками:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

• расширяемость, т.е. возможность переноса как системы, так и всей совокупности данных на другие программно-аппаратные платформы;

• возможность эффективной работы в гетерогенных средах;

40

Интегральная информационная система ВИНИТИ РАН

Информационные ресурсы в традиционной (печатной) форме

Информационные ресурсы в электронной форме

Реферативные журналы

Указатели к РЖ

Базы Данных

А

«0 А

1- ГО

:> 1

1- ге е

«Е *

й 0.

0.

Ресурсный комплекс

Программно-технологический комплекс

Навигационный комплекс

Рис. 3. Обобщенная архитектура ИИС ВИНИТИ по математическим и физическим наукам

• обеспечение работы с современными средствами универсального доступа к данным (www-браузерами, СДБЕ-средствами разработки и др.);

• наращиваемость, т.е. возможность расширять объемы доступных данных без уменьшения пропускной способности системы.

Обобщенная структурная схема БД ВИНИТИ по математическим и физическим наукам представлена на рис. 3. Она содержит в своем составе три функциональных комплекса: ресурсный, навигационный и программно-технологический.

3.1. Ресурсный комплекс БД ВИНИТИ «Математика» и «Физика»

Приведем описание содержания баз данных ресурсного комплекса БД ВИНИТИ «Математика» и «Физика» (рис. 4).

41

Ресурсный комплекс Баз Данных

Рис. 4. Обобщенная структурная схема ресурсного комплекса БД «Математика» и «Физика»

3.1.1. Документальные базы данных

БД первоисточников содержит полнотекстовые электронные копии документов, отраженных в РЖ «Математика» и «Физика». Система обеспечивает получение копий документов в любом количестве экземпляров как на электронных, так и на бумажных носителях информации.

БД вторичных документов содержит:

• библиографическое описание документа;

• реферат;

• формализованное изложение содержания работы - классификационные индексы, указывающие на область, к которой относится исследование, ключевые слова и ключевые фразы, указание метода исследования, приложений, внедрения;

• дополнительные сведения - место хранения оригинала и его идентификатор в базе первоисточников, место выполнения работы и др.

42

В эту БД ежемесячно вводится более 30 тыс. новых документов, а также в настоящее время создается ретроспективный фонд.

БД цитированной! литературы содержит сведения о литературе, цитированной в любом документе, хранящемся в базе вторичных документов, а также о том, в каких документах, зарегистрированных в системе, цитируется определенная, интересующая пользователя, научная публикация.

БД «Итоги науки и техники. Серии математическая и физическая». Полнотекстовая БД предназначена для тематического поиска в многотомном и многосерийном издании «Математика» и «Физика».

БД депонированных рукописей. Библиографическая БД содержит информацию, аналогичную содержанию базы вторичных документов по депонированным рукописям в области математических наук. Она имеет следующие поля данных: название работы, фамилия и инициалы автора, место работы автора (организация или учреждение), адрес места работы автора (город), дата депонирования, объем рукописи и наличие иллюстраций, количество библиографических ссылок, язык рукописи, регистрационный номер депонированной научной работы. Информационная навигация обеспечивается при помощи авторского указателя. Пополнение БД производится ежемесячно.

3.1.2. Справочные базы данных

БД «Информационные центры» (институты, кафедры, общества, семинары) содержит названия центров, адреса, указание тематической направленности, наименование издаваемых научных трудов и др.

БД «Планы НИР» содержит перечень разрабатываемых плановых тем НИР, выполняемых проектов РФФИ, тем диссертационных работ с указанием руководителей, места выполнения и другие сведения.

БД «Персоналии» содержит фамилии, имена, отчества, основные даты биографии, места работы, тематическую направленность исследований, списки научных работ, фамилии аспирантов и соискателей, защитивших диссертационные работы, перечень правительственных и научных наград и другие сведения.

БД «Научные форумы» содержит наименование мероприятий, сведения об организаторах, числе участников, месте проведения, подготовке к изданию трудов и др.

43

БД «Издательские планы» предназначена для обеспечения полноты документальной базы, а также для информирования пользователей.

БД транслитераций содержит фамилии российских и зарубежных авторов в русской транскрипции и в транскрипциях на иностранных языках.

3.2. Навигационный комплекс БД «Математика» и «Физика»

Приведем описание содержания баз данных навигационного комплекса БД «Математика» и «Физика» (рис. 5).

Сервисные (обслуживающие информационный поиск) БД.

БД классификационных систем и рубрикаторов содержит используемые в мировой практике классификации математической и физической литературы.

Рис. 5. Обобщенная структурная схема навигационного комплекса БД «Математика» и «Физика»

44

БД лингвистического обеспечения содержит многоязычные математические и физические терминологические словари, списки ключевых слов и словосочетаний с привязкой к классификационным системам (8), тезаурусы.

БД указателей содержит систему различного вида указателей, применяемых при информационном поиске (7).

Из перечисленных классификационных систем об УДК, ГРНТИ и Рубрикатор ВИНИТИ речь шла выше. Номенклатура ВАК представляет собой перечень специальностей ученых Высшей аттестационной комиссии (НВАК) (4; 10). Разработаны сопоставительные таблицы НВАК и ГРНТИ, позволяющие соотнести квалификацию ученых с системой научной и технической информации и произвести подбор научных данных для подготовки специалистов высшей квалификации и специалистов соответствующей квалификации для решения проблем, возникающих в конкретных сферах знания (2; 3; 5, с. 4245). «Фундаментальные направления» - это классификационная система РФФИ, по которой систематизируются поддержанные проекты, области и направления фундаментальных исследований.

В заключение заметим, что при проектировании БД блоков естественных и технических наук будет использован опыт проектирования БД по точным наукам (математика и физика). Структуры и информационное наполнение в своей основе будут аналогичными БД по точным наукам. Отличия будут состоять только в номенклатуре изданий, специфике издаваемых информационных продуктов и предоставляемых информационных услуг.

Литература

1. Арский Ю.М., Леонтьева Т.М., Никольская И.Ю., Шогин А.Н. Банк данных ВИНИТИ. Состояние и перспективы развития. - М.: ВИНИТИ, 2006. - 242 с.

2. Белоозеров В.Н. Таблицы соответствия Государственного рубрикатора НТИ и Номенклатуры специальностей ВАК // НТИ-2000. Материалы конференции. - М.: ВИНИТИ, 2000. - С. 42-45.

3. Белоозеров В. Н, Малахов А.А., Розина И.А. Применение ГРНТИ в задачах управления наукой и научно-технической экспертизы // НТИ-99: Материалы конференции. - М.: ВИНИТИ, 1999. - С. 44-50.

4. Государственный классификатор НТИ. 6-е изд., т. 1 (Рубрикатор научно-технической информации). - М.: ВИНИТИ РАН, 2007. - 240 с.

5. Государственный классификатор НТИ. 6-е изд., т. 2 (Алфавитно-предметный указатель ГРНТИ). - М.: ВИНИТИ РАН, 2007. - 210 с.

6. Государственный рубрикатор научно-технической информации. - 5-е изд. - М.: ВИНИТИ, 2001. - 391 с.

45

7. Ефременкова В.М., Никольская И.Ю., Голод Е.С. Принципы формирования предметно-систематических указателей РЖ/БД ВИНИТИ РАН «Математика» // Информационная школа молодого ученого II: Сб. науч. тр. ЦНБ УрО РАН; Отв. ред. П.П. Трескова; Сост. О.А. Оганова. - Екатеринбург, 2012. - С. 155-165.

8. Интегрированная система информационных ресурсов. Архитектура, реализация, приложения: Сб. ст. / Отв. ред. д. ф.-м. н. В.А. Серебряков. - М.: ВЦ РАН,

2004. - 240 с.

9. Никольская И.Ю. Проблемы создания и перспективы развития информационной системы «Математика» в составе информационной системы ВИНИТИ // НТИ. Сер. 2. Информационные процессы и системы. - М.: ВИНИТИ, 2006. - № 11. -С. 21-23.

10. Номенклатура специальностей научных работников. (Классификатор ВАК). Справочники и классификаторы. Приложение № 1 к приказу Минпромнауки России от 31 января 2001 г. № 47.

11. Рубрикатор информационных изданий ВИНИТИ (РВИНИТИ) Математика и Вычислительные науки. - М.: ВИНИТИ, 2008. - 136 с.

12. Рубрикатор информационных изданий ВИНИТИ (РВИНИТИ): В 4-х т. - М.: ВИНИТИ,

2005. - Т. 1. Физико-математические науки - 293 с.; Т. 2. Химия. Металлургия, машиностроение. Электроэнергетика - 273 с.; Т. 3. Науки о Земле и жизни. - 293 с.; Т. 4. Транспорт. Связь. Автоматика. Информатика. Управление. - 172 с.

13. Универсальная десятичная классификация. - Полное 4-е изд. на рус. яз. - М: ВИНИТИ, 2001. - Т. 1

14. Универсальная десятичная классификация. - Полное 4-е изд. на рус. яз. - М.: ВИНИТИ, 2002. - Т. 3: 5/54. Математика. Естественные науки. - 255 с.

15. Черный А.И. Всероссийский институт научной и технической информации: 50 лет служения науке. - М.: ВИНИТИ, 2005. - 316 с.

46

i Надоели баннеры? Вы всегда можете отключить рекламу.