Научная статья на тему 'Информационно-поисковый Тезаурус ИНИОН РАН по политологии'

Информационно-поисковый Тезаурус ИНИОН РАН по политологии Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
95
19
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Базарнова Светлана Васильевна, Слива Алексей Иванович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Информационно-поисковый Тезаурус ИНИОН РАН по политологии»

IV. ПРИЛОЖЕНИЕ

С.В. БАЗАРНОВА, А.И. СЛИВА

ИНФОРМАЦИОННО-ПОИСКОВЫЙ ТЕЗАУРУС ИНИОН РАН ПО ПОЛИТОЛОГИИ

В Институте научной информации по общественным наукам (ИНИОН) РАН более 20 лет функционирует Автоматизированная информационная система по общественным наукам (АИСОН). В этой системе представлена и библиографическая информация по политологии. Для повышения эффективности поиска этой информации подготовлен Информационно-поисковый тезаурус по политологии.

1. Что такое Информационно-поисковый тезаурус по политологии?

Информационно-поисковый тезаурус по политологии представляет собой особый тип отраслевого словаря. Как всякий отраслевой словарь или отраслевая энциклопедия, он содержит отраслевую терминологию. При этом он обладает следующими специфическими особенностями.

Во-первых, в Тезаурус включены только те термины, которые необходимы для описания содержания документов, включаемых в библиографическую базу данных, и, соответственно, для поиска нужных документов в ней. Слишком специфические термины в Тезаурус не включаются.

Во-вторых, Тезаурус создан на основе индексирования реального потока документов и запросов, вводимых в АИСОН, а это значит, что он содержит терминологию, активно используемую в

отрасли. В ряде случаев для обеспечения полноты представления терминологии привлекались и дополнительные источники, а именно: современные отраслевые словари и энциклопедии по политологии, а также различные учебники, учебные пособия, классификации и т.д. Благодаря такому подходу к созданию словаря Тезаурус отражает современную терминологию политологии и политической практики. При этом степень полноты преставления отраслевой терминологии обусловливается задачами, стоящими перед АИСОН.

В-третьих, значение терминов, включенных в Тезаурус, передается не в виде обычной дефиниции или словарной статьи, а в виде перечня близких по значению лексических единиц с указанием типа связи между ними - синонимии, иерархии и ассоциации, а в ряде случаев и кратких определений. Это позволяет определить место термина в терминологической системе отрасли, представленной в Тезаурусе, и тем самым определить его значение.

2. Для чего нужен Тезаурус по политологии?

Тезаурус используется для индексирования документов, которые включаются в базу данных и в традиционные библиографические указатели, и, соответственно, для индексирования запросов. Содержание каждого документа описывается в среднем 5-6 терминами.

Формирование базы данных по политологии было начато в 1998 г. на основе библиографической информации, включаемой в указатель «Правоведение. Политология». В настоящее время база данных по политологии включает около 30 тыс. документов при ежегодном поступлении массива в 3 тыс. документов (из них около 1 тыс. документов - на иностранных языках, причем на английском - около 600). В ней представлены все основные виды документов: статьи из журналов и сборников, монографии, сборники, материалы научных конференций, авторефераты диссертаций, справочная и библиографическая литература, учебная литература, депонированные рукописи и т.д. При этом из 30 тыс. документов, представленных в базе данных, книги составляют около 6 тыс.

3. Что представляет собой Тезаурус по политологии?

В Тезаурус включено около 7 тыс. терминов, что соизмеримо с отраслевыми словарями по политологии. Все термины упорядочены по алфавиту.

Тематический охват Тезауруса определяется реальным потоком документов и запросов по политологии, поступающих в Фундаментальную библиотеку ИНИОН РАН. При этом документы на стадии комплектования отбираются таким образом, чтобы обеспечить информационное обслуживание специалистов отрасли в целом, т.е. не отдается приоритета определенной проблематике, в том числе и обусловленной конъюнктурными задачами. Основные проблемы, представленные в Тезаурусе, это: политологические исследования, политология как наука, теория политики, история политических учений, политические системы, политическая организация общества, внешняя политика, международные отношения.

В Тезаурусе несколько близких по значению терминов могут быть объединены в одну группу, и эта группа терминов может быть обозначена одним из терминов данной группы. Этот термин выступает в качестве обозначения этой группы. Тем самым происходит укрупнение терминологии, и Тезаурус становится более наглядным и удобным для пользования. Такие термины называются дескрипторами, а остальные термины такой группы - недескрипторами.

Таким образом, все термины, включенные в Тезаурус, разделены на две категории - дескрипторы и недескрипторы. Дескрипторы - это термины, разрешенные для использования при индексировании, а недескрипторы - запрещенные для этих целей термины. От каждого такого недескриптора дается отсылка к заменяющему его дескриптору. Такие отношения между дескрипторами и недескрипторами рассматриваются как отношения синонимии, причем синонимия может быть двух типов:

- языковая синонимия (например: аполитичность и аполитизм, аппарат управления и управленческий аппарат);

- условная синонимия, т. е. синонимия только в рамках данного Тезауруса (например: недескриптор правила рыбной ловли -условный синоним к дескриптору рыболовство, недескриптор правительственные акты - условный синоним к дескриптору акты органов государственного управления).

Все недескрипторы представлены в словарной статье соответствующего дескриптора после пометы иЕ: гражданские инициативы

иЕ гражданские акции общественные инициативы самоорганизация граждан, а от каждого недескриптора дается отсылка к заменяющему его при индексировании дескриптору: гражданские акции

см.: гражданские инициативы. В Тезаурусе из 7 тыс. терминов примерно 3,5 тыс. дескрипторов и столько же - 3,5 тыс. недескрипторов.

Между дескрипторами могут быть зафиксированы два типа отношений - отношения «выше - ниже» (иерархические отношения) и ассоциативные отношения. Благодаря этому каждый дескриптор выступает в окружении родственных или близких по значению терминов и тем самым описывается его значение.

Таким образом, в словарных статьях дескрипторов могут быть представлены три типа отношений - отношения между дескрипторами и недескрипторами - синонимия и два типа отношений между дескрипторами - отношения «выше - ниже» (иерархические) и ассоциативные отношения. партийная система ВТ политическая система ЫТ двухпартийная система многопартийная система однопартийная система ЯТ коалиции политических партий партология политические партии финансирование партий иЕ партийно-политическая система система партий РУБ А111551 ББК 66.6

(ВТ - вышестоящие дескрипторы, ЫТ - нижестоящие дескрипторы, ЯТ - ассоциативные дескрипторы, иЕ - недескриптоы, которые заменяет этот дескриптор при индексировании, РУБ - руб-

рики отраслевого рубрикатора ИНИОН, к которым отнесен дескриптор в Тезаурусе, ББК - рубрики Библиотечно-библиографической классификации, к которым отнесен дескриптор в Тезаурусе)

4. Вспомогательные указатели к Тезаурусу

Алфавитный список всех дескрипторов с полными словарными статьями и недескрипторов (Алфавитный лексико-семантический указатель) - это основные части Тезауруса. Кроме того, в Тезаурус включено три вспомогательных указателя - пермутационный, систематический и классификационный.

Пермутационный указатель содержит все дескрипторы и недескрипторы без словарных статей. Упорядочение производится по алфавиту каждого значимого слова или предварительно выделенного значимого компонента, входящего в состав дескриптора или недескриптора. Такие компоненты могут находиться в начале слова: анти-, пост-, нео-, поли-, вне-, макро-, микро-, транс- и т.д. или в конце слова: -кратия, -логия, -изм. При упорядочении по алфавиту для каждого значимого слова или компонента значимого слова, определенного заранее, формируется так называемое «словарное гнездо». Дескрипторы и недескрипторы могут дублироваться в двух и более словарных гнездах в зависимости от количества входящих в него значимых слов или компонентов слов. Например, дескриптор антиглобалистское движение входит в три словарных гнезда: «анти-», «глобали-», «движение».

Систематический указатель содержит только дескрипторы без словарных статей. В нем дескрипторы упорядочены по иерархическому принципу - по рубрикам отраслевого рубрикатора ИНИОН по политологии. Внутри каждой рубрики упорядочение дескрипторов производится по алфавиту. В зависимости от своего значения каждый дескриптор относится к одной или нескольким рубрикам.

Классификационный указатель содержит только дескрипторы без словарных статей. В нем дескрипторы также упорядочены по иерархическому принципу - по разделам ББК. Упорядочение внутри каждого раздела производится по алфавиту.

5. Как искать в Тезаурусе дескрипторы, нужные для поиска?

Тезаурус обеспечивает возможность поиска в базе данных по дескрипторам (в разной комбинации), по рубрикам отраслевого рубрикатора и по комбинации дескрипторов и рубрик. Для подбора соответствующих дескрипторов и рубрик нужно пользоваться соответствующими указателями Тезауруса.

Основной Алфавитный лексико-семантический указатель используется для поиска нужных дескрипторов по алфавиту, если известны термины, по которым нужно вести поиск. Кроме того, он используется для проверки значения дескрипторов, найденных во вспомогательных указателях. Связи с другими дескрипторам, указанные в словарных статьях, позволяют менять стратегию поиска при неудовлетворительном результате поиска, так как они помогают расширить поиск, уточнить запрос, переформулировать его.

Пермутационный указатель используется для поиска нужного дескриптора, если известны какие-то родственные термины, и тогда можно поискать нужный термин в рамках соответствующего словарного гнезда. Однако после нахождения нужного дескриптора целесообразно проверить его значение в Алфавитном лексико-семантическом указателе, зафиксированное в словарной статье.

Систематический указатель служит либо для выбора нужной рубрики для поиска по ней, либо для поиска нужных дескрипторов в рамках рубрики, которая более или менее соответствует потребности пользователя.

Классификационный указатель служит для поиска соответствующих дескрипторов в рамках соответствующего раздела ББК. Непосредственный поиск по индексам ББК в базе данных невозможен.

Таким образом, Тезаурус обеспечивает следующие возможности поиска нужных дескрипторов.

Тип поиска Вид указателя

Поиск дескрипторов по терминам, Алфавитный лексико-семанти-известным индексатору или поль- ческий указатель зователю, уточнение их значения в системе

Поиск дескрипторов в словарном Пермутационный указатель гнезде

Поиск дескрипторов в рубриках Систематический указатель

Рубрикатора ИНИОН

Поиск дескрипторов в разделах Классификационный указатель ББК

Дескрипторы, найденные в Пермутационном, Систематическом, Классификационном указателях, рекомендуется проверить в Алфавитном лексико-семантическом указателе для уточнения их значений в рамках АИСОН или для отбора дескрипторов, связанных с найденным дескриптором семантическими отношениями, для расширения или сужения области поиска.

6. Возможности использования Тезауруса за пределами АИСОН

Значительный объем Тезауруса (около 7 тыс. терминов), широкий тематический охват и большая степень специфичности дескрипторов позволяют использовать весь Тезаурус или отдельные его части также и в других информационных центрах и библиотеках для обработки литературы по политологии. При этом он может использоваться не только в автоматизированных базах данных, но и в традиционных предметных каталогах для формирования предметных рубрик. Естественно, он может также использоваться и при формировании различных предметных указателей как в библиографических указателях, так и в различных изданиях.

Большое количество условных синонимов при дескрипторах позволяет создавать на основе этого Тезауруса микротезаурусы по отдельным отраслям политологии за счет перевода условных синонимов в дескрипторы. Тезаурус можно использовать и при создании соответствующих проблемно-ориентированных и персональных баз, в первую очередь, на основе базы данных АИСОН.

7. Формы представления и распространения Тезауруса

Тезаурус существует в обычной печатной форме и распространяется на компакт-дисках. Кроме того, он встроен в базу данных и потому доступен в Интернете.

База данных по политологии распространяется на компакт-дисках, и в этот компакт-диск в качестве компонента включается и Тезаурус, что обеспечивает удобство и эффективность поиска в этой базе данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.