Научная статья на тему 'ОПЫТ ВЕДЕНИЯ ИНФОРМАЦИОННО-ПОИСКОВЫХ ТЕЗАУРУСОВ ПО ОБЩЕСТВЕННЫМ НАУКАМ'

ОПЫТ ВЕДЕНИЯ ИНФОРМАЦИОННО-ПОИСКОВЫХ ТЕЗАУРУСОВ ПО ОБЩЕСТВЕННЫМ НАУКАМ Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
55
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
информационно-поисковые тезаурусы / библиографический банк данных / ведение (актуализация) тезаурусов / контролируемый словарь / общественные науки / АИСОН ИНИОН РАН / IR thesauri / bibliographic databank / thesauri support (maintenance / upgrading) / controlled dictionary / social sciences / The Russian Academy of sciences Institute of scientific information Automated information retrieval system for social sciences

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Магай Елена Васильевна, Мдивани Роберт Робертович

Описан опыт научно-практической работы по ведению (актуализации) тезаурусов Автоматизированной информационной системы Института научной информации по общественным наукам РАН: методика контроля и пополнения терминологического состава тезаурусов как средства расширения возможностей навигации в концептуальном пространстве документов библиографического фонда.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по СМИ (медиа) и массовым коммуникациям , автор научной работы — Магай Елена Васильевна, Мдивани Роберт Робертович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Experience with information retrieval thesauri in the social sciences

The experience of scientific and practical work on the maintenance (the actualization) of the thesauri of the Automated Information System of the Institute of Scientific Information on Social Sciences of the Russian Academy of Sciences is described: the method of control and replenishment of the terminology of thesauri as a means of expanding the navigation capabilities in the conceptual space of bibliographic fund documents.

Текст научной работы на тему «ОПЫТ ВЕДЕНИЯ ИНФОРМАЦИОННО-ПОИСКОВЫХ ТЕЗАУРУСОВ ПО ОБЩЕСТВЕННЫМ НАУКАМ»

УДК 030:81'1/4

Е.В. Магай, Р.Р. Мдивани*

ОПЫТ ВЕДЕНИЯ ИНФОРМАЦИОННО-ПОИСКОВЫХ ТЕЗАУРУСОВ ПО ОБЩЕСТВЕННЫМ НАУКАМ

Аннотация. Описан опыт научно-практической работы по ведению (актуализации) тезаурусов Автоматизированной информационной системы Института научной информации по общественным наукам РАН: методика контроля и пополнения терминологического состава тезаурусов как средства расширения возможностей навигации в концептуальном пространстве документов библиографического фонда.

Ключевые слова: информационно-поисковые тезаурусы; библиографический банк данных; ведение (актуализация) тезаурусов; контролируемый словарь; общественные науки; АИСОН ИНИОН РАН.

E.V. Magai, R.R. Mdivani Experience with information retrieval thesauri

in the social sciences

Abstract. The experience of scientific and practical work on the maintenance (the actualization) of the thesauri of the Automated Information System of the Institute of Scientific Information on Social Sciences of the Russian Academy of Sciences is described: the method of control and replenishment of the terminology of thesauri as a means of expanding the navigation capabilities in the conceptual space of bibliographic fund documents.

* Магай Елена Васильевна, Институт научной информации по общественным наукам РАН, Центр информатизации, научный сотрудник, e-mail: mamdi13@mail.ru; Magai Elena Vasilevna, Institute of Scientific Information for Social Sciences RAN, The Center of Informatization, Researcher, e-mail: mamdi13@mail.ru

Мдивани Роберт Робертович, Институт научной информации по общественным наукам РАН, Центр информатизации, старший научный сотрудник, кандидат филологических наук, e-mail: mamdi13@mail.ru; Mdivani Robert Robertovich, Institute of Scientific Information for Social Sciences RAN, The Center of Informatization, Senior Researcher, Ph.D., e-mail: mamdi13@mail.ru

© Магай Е.В., Мдивани Р.Р., 2018

209

Keywords: IR thesauri; bibliographic databank; thesauri support (maintenance; upgrading); controlled dictionary; social sciences; The Russian Academy of sciences Institute of scientific information Automated information retrieval system for social sciences.

Основная функция, заложенная в названии тезауруса автоматизированной информационной системы, отличающая его от других видов словарей - это информационно-поисковая функция, обеспечивающая адекватную реакцию автоматизированной системы на сформулированный с его помощью запрос потребителя. Из этого следует проблема соответствия информационно-поискового тезауруса задачам аналитико-синтетической переработки основного содержания конкретной научной публикации и формулирования поискового образа документа, поступающего в библиографический банк данных автоматизированной информационной системы ИНИОН РАН, поскольку мощность языка запросов соответствует мощности языковых средств [1, c. 220].

Поисковый образ документа в банке данных, служащий его идентификации, выражает сущностные, смысловые свойства содержащейся в нем информации, что позволяет идентифицировать его в качестве диахронной, вневременной информации [11, c. 6].

Индетерминизм приводит к аналитико-синтетической переработке конкретных научных публикаций. Это онтологически связанный, неизбежный процесс, ибо любая «новая духовная реальность и высочайшая энергия чистого научного понятия остаются связанными тайной нитью с языком» [18, c. 378].

Из этого следует необходимость ведения (периодической актуализации) информационно-поисковых тезаурусов, которое предполагает пополнение их новыми терминами, выявленными в процессе индексирования документов, включаемых в автоматизированную систему и отраслевые периодические издания библиографической информации. При этом в процессе своей работы библиографы-индексаторы руководствуются специальной «Методикой индексирования», а также «Общими требованиями к координатному индексированию», определенными государственными стандартами [3].

«Методика индексирования» предусматривает, в частности, обязательный просмотр индексаторами так называемых информативных зон текста, в первую очередь - выявление ключевых слов, встречающихся в заголовке, аннотации и вводной части издания [8, c. 343].

Согласно технологии, принятой в АИС ИНИОН, выявленные ключевые слова, отсутствующие в действующем тезаурусе системы, но с точки зрения индексатора необходимые для обеспечения соответствия поискового образа документа его основному содержанию, фиксируются для передачи их группе разработки и ведения тезаурусов отдела электронных информационных техно -логий, где новые термины анализируются, классифицируются по Рубрикатору АИСОН и формируются словарные статьи, выражающие их парадигматические связи с имеющимися дескрипторами тезауруса.

Установление парадигматических связей в словарной статье дескриптора в случае отношения «выше-ниже» особой сложности не представляет, так как определить, какой из пары терминов обозначает более широкое понятие, не составляет труда. Сложнее включение в словарную статью ассоциативных отношений, поскольку соответствующий ГОСТ определяет их как отношения между парой понятий, которые не связаны иерархически, однако имеют сильную смысловую связь [3, с. 2]. В этом случае установление смысловой связи предполагает высокий уровень научной компетенции разработчиков тезауруса, поскольку в сфере информационно-аналитической деятельности понимание предмета, фундаментальных основ и задач информатики являются необходимым условием успешного развития любой информационной системы [6, с. 233-234].

С языковедческой точки зрения парадигматические связи терминов словарной статьи тезауруса образуют лексическое или семантическое поле, поскольку предметное, смысловое содержание связывает их таким образом, что словарная статья образует смысловое единство более высокого порядка, чем собственно заглавный дескриптор.

Ведение (актуализация) тезауруса связано с качеством индексирования документов, в процессе которого индексатор-библиограф должен фиксировать появление новых терминов - «кандидатов в дескрипторы» - для включения их в тезаурус, соблюдая принцип соответствия терминов информационно-поискового языка содержанию документов, вводимых в систему, что в определенной степени обеспечивает «семантическую силу» языка запросов, формулируемых с использованием тезауруса системы. Это требует от современного библиографа широкого кругозора, поскольку он связан с постоянно изменяющимся документопотоком, а также способности к сотрудничеству с другими работниками при решении общесистемных задач.

Как справедливо отмечено в классической работе Дж. Солто-на, одним из главных недостатков, присущих тезаурусу, является то, что его надо вести, поскольку «в связи с ростом фонда документов возникает необходимость в системе обслуживания тезауруса. В тех случаях, когда данный массив пополняется новыми документами, можно использовать четыре способа корректировки тезауруса:

A) можно использовать исходный тезаурус без изменения и на выросшем массиве документов;

B) можно добавить к существующим категориям тезауруса новые термины из влитых в массив документов;

C) можно ввести новые словарные статьи для новых терминов;

Б) можно полностью перестроить тезаурус, создав новую

классификацию на базе пополненного словаря» [12, с. 495].

Представляется, что эти четыре способа исчерпывают варианты ведения информационно-поискового тезауруса как лингвистического средства аналитико-синтетической переработки документопо-тока, обеспечивающей эффективный поиск информации по запросам потребителей, обращенным к любому библиографическому банку данных автоматизированной информационной системы.

Однако следует отметить, что есть и иной подход отдельных специалистов в области научной информации к разработке и ведению информационно-поискового тезауруса, придерживающихся мнения, что полнота представления отраслевой терминологии обеспечивается за счет включения терминологии из словарей, справочников, энциклопедий, классификаций и учебников, а также различных иных классификаций. Благодаря этому в тезаурус включаются дескрипторы, имеющие большее значение в науке, но на момент создания тезауруса в силу конъюнктурных причин отсутствующие в документах.

Такой подход противоречит понятию информационно-поискового тезауруса, функция которого определена Системой стандартов по информации, библиотечному и издательскому делу [3] и предусматривает рекомендации, касающиеся развития и ведения информационно-поисковых тезаурусов. Сами термины-понятия, «имеющие значение в науке», но отсутствующие в документах, накопленных в банке данных, могут обеспечить только нулевую выдачу в сочетании с дескрипторами действующего тезауруса системы в случае конъюнктивной формы запроса.

Еще на заре развития информатики Ч.Т. Мидоу отмечал, что «язык индексирования - это живой, меняющийся язык, изменение которого в современной научной библиотеке происходит довольно быстро» [18, р. 82].

Функция тезауруса автоматизированной системы библиографической информации - служить инструментом аналитико-синтетической переработки и поиска информации о научных публикациях, поступивших в банк библиографических данных.

Термины-понятия, имеющие значение в науке, но отсутствующие в документах, по определению нельзя называть принятым в информатике термином «дескрипторы», ибо они не являются средством описания содержания и поиска в системе документов. Именно поэтому информационно-поисковый тезаурус является контролируемым словарем, т.е. словарем, термины-понятия которого соответствуют содержанию документов конкретного банка данных и не определяются профетическими способностями его авторов. Следовательно, пополнение информационно-поискового тезауруса, обеспечивающее выдачу документов, индексирование которых на вводе потребовало использования нового дескриптора, является вторичным, т.е. следствием появления соответствующего документа.

Если от индексатора, использовавшего новый термин, не поступила соответствующая информация в группу разработки и ведения тезаурусов, то у лингвистов остается единственная возможность поддерживать лингвистическое обеспечение (ЛО) системы на современном уровне развития науки: вести контролируемый словарь, проверяя индексацию документов, поступивших в банк данных АИС; проверяя учет индексаторам терминов из информативных зон документов, как это предусмотрено «Методикой индексирования», например, можно достичь высокой эффективности, используя термины из заголовков [7, с. 343].

Следует отметить, что «ручное» создание информационно-поискового тезауруса и его дальнейшее пополнение (ведение) с учетом развития конкретной области науки и, соответственно, ее терминологии, связано с большими затратами интеллектуального труда. В частности, это касается не только контроля появления новых терминов, но и - главное - определения парадигматических связей с другими терминами конкретной информационной системы, так как универсальные тезаурусы, энциклопедии и словари плохо представляют концептуальные связи богатой и специфичной терминологии научных дисциплин [9].

Семантика информационно-поискового тезауруса библиографической информационной системы имеет свою специфику, обусловленную общелингвистическими особенностями функционирования терминологической лексики в языке. В лексической единице помимо плана выражения (фонетического или графического) в плане

содержания выделяются значение и смысл слова. Это связано с различением двух моментов: в первом случае речь идет об объектах, процессах и действиях, которые этим словом обозначаются, т.е. именуются, а во втором - о мыслительной реальности, которая этим словом обозначается, т.е. выражается. Именно это связано с принятым в науке противопоставлением значения и смысла слова. Сказанное выше, естественно, характерно и для научного дискурса, для использования в процессе научной коммуникации терминов, т.е. входящих в ту или иную научную парадигму понятий. Активная причастность понятий к сферам человеческой деятельности влечет появление такого свойства, как сущностная оспариваемость понятий. Сущностно оспариваемые понятия принципиально ориентированы на порождение новых смыслов, определяемых развертыванием дискурса и контекста. Так, например, сложно обстоит дело с использованием в нынешнем политическом дискурсе таких слов-понятий, как «права человека», «демократия», «суверенитет» [4, с. 203-234].

В социальных науках (если не учитывать конкретных данных) развитие научной мысли идет, главным образом, за счет различных интерпретаций и уточнений смысла тех или иных терминов при сохранении их плана выражения и конвенционального значения. Поэтому можно утверждать, что в автоматизированных системах по социальным и гуманитарным наукам функцией информационно-поискового языка является не выражение мысли автора документа: его функция - служить конвенциональным знаком для всего комплекса мыслей, даже опровергающих друг друга, но связанных с обсуждением конкретной проблемы или объекта исследования и выраженных во множестве релевантных запросу документов. Иначе говоря, отдельный пользователь системы может вкладывать свой смысл в значение термина, но именно общность значения объединяет пользователей языка (не только информационно-поискового) в процессе коммуникации, хотя в сознании конкретного индивида различие значение-смысл может и не осознаваться. Именно это обстоятельство позволяет, при всех расхождениях взглядов ученых-обществоведов различных школ и направлений, использовать в системе АИСОН тезаурусы в качестве нормативного словаря со стандартными парадигматическими отношениями синонимии, «выше-ниже» и ассоциативными.

Опыт многолетней эксплуатации АИСОН показал, что специфика наименований объектов и процессов, исследуемых в социальных и гуманитарных науках, позволяет без ущерба для обра-

ботки документов и запросов использовать отношение «вышениже» в обобщенном виде, включая отношение часть-целое.

Для системы терминов социальных и гуманитарных наук характерна ситуация, предусмотренная в стандарте ISO 2788 и в руководстве по составлению тезаурусов Ассоциации информационного менеджмента. В сильно специализированных тезаурусах отношение «целое-часть» может быть представлено как иерархическое, если наименование целого раскрывается через наименование частей. В иерархические связи тезаурусов ИНИОН [13] в ряде случаев включалось несколько вышестоящих дескрипторов, но уровни иерархии относительно заглавного дескриптора не нумеровались, тем более что далеко не всегда дескрипторы, вышестоящие по отношению к заглавному, находятся в иерархических отношениях между собой. Это касается и нижестоящих дескрипторов, между которыми нумеровать уровни иерархии (по крайней мере в социальных науках) также не необходимо в силу того обстоятельства, что зачастую основания деления могут быть разными, например:

бедность

BT глобальные проблемы

социальная стигматизация социальные проблемы социальные явления

Что же касается установления ассоциативных отношений, то, в отличие от определяемого на основе логического и семантического анализа иерархического отношения «выше-ниже», необходимые и достаточные принципы установления ассоциативного отношения представить эксплицитно довольно сложно: при установлении ассоциативной связи действующий ГОСТ просто разрешает использовать любые отношения кроме «род-вид» и синонимии [3, с. 17]. Так или иначе, но отношение ассоциации определить гораздо труднее, чем остальные: его гораздо легче определить негативно, чем позитивно. Ассоциативное отношение - не иерархия и не синонимия. Ассоциативное отношение устанавливается между терминами, которые близко связаны между собой концептуально. Иными словами, ассоциативное отношение между терминами может быть установлено в тезаурусе, если они имеют смысловую связь, которая должна быть выражена эксплицитно на основании того, что она показывает альтернативные термины, которые могут быть использованы при индексировании документов и, соответственно, запросов.

Индексатор, анализирующий текст, должен выявить различия между ключевой и контекстной информацией, точнее - между ключевыми и контекстными терминами. Так что совместная (даже частая) встречаемость терминов в рамках отдельной публикации не может быть твердым критерием для выявления ассоциативных связей [3, с. 79]. Поэтому более надежным является критерий научного знания, т.е. знание специалиста о том, какие термины связаны с данным термином в контексте его научного определения или толкования.

В процессе отбора терминологии для ИПЯ дескрипторного типа возникает проблема прекоординации терминов. Хотя поисковая программа системы позволяет координировать при поиске любые ключевые слова с помощью булевых операторов, эффективность выдачи информации в значительной мере зависит от учета в тезаурусе традиционно используемых в научной литературе (и, соответственно, при индексировании) устойчивых терминологизированных словосочетаний. Это связано с тем, что полнота описания некоего денотата с помощью цепочки не связанных грамматически лексем всегда ниже, чем при прямом наименовании денотата дескриптором-словосочетанием, являющимся названием соответствующего объекта или процесса. Дескрипторы тезауруса, представляющие собой многокомпонентные номинативные словосочетания, должны рассматриваться как одно из средств координации входящих в их состав ключевых слов, повышающее качество функционирования тезауруса в системе, поскольку при использовании однословных терминов-дескрипторов возникает опасность ложной координации, а использование терминов-словосочетаний позволяет эту опасность избежать [18, с. 42].

Например, запрос в виде координации двух самостоятельных лексем «преступления + несовершеннолетние» является двусмысленным, так как может означать «преступления несовершеннолетних» и «преступления против несовершеннолетних». Использование же в тезаурусе в качестве дескриптора словосочетания «преступления против несовершеннолетних» обеспечивает релевантность выдачи. Использовать термин-словосочетание вместо возможной комбинации терминов следует и в тех случаях, когда его отсутствие влияет на целостность принятой в данной отрасли системе понятий. Например, в тезаурусе по экономике «аренда жилья» может быть выражена как «аренда» и «жилье», однако это исключит из тезауруса общепринятый термин и не позволит построить соответствующую словарную статью с необходимыми парадигматическими связями с другими

дескрипторами, поскольку связи в дескрипторах «аренда» и «жилье» не совпадают со связями в дескрипторе «аренда жилья».

аренда жилья аренда жилье

• ВТ аренда • ЭТ аренда жилья • ВТ социальные

• жилищное • аренда земли проблемы

хозяйство • лизинг • ЯТ жилищное

• ЯТ арендный • ЯТ арендная плата хозяйство

жилищный фонд • арендные отношения • жилищный рынок

• жилищное право • арендодатели жилые здания

• жилищные • договорные • социальное жилье

пособия отношения

• концессии

• промышленный парк

С другой стороны, запрос иногда может быть связан с темой, выраженной потребителем однословным термином; в этом случае, если зафиксированы его вхождения в словосочетания, открывается возможность определить его смысловую нагрузку в системе. С этой точки зрения алфавитный порядок словарных статей в лексико-семантическом указателе тезауруса дает мало информации пользователю, так как дескрипторы упорядочены по первому слову и определить нужные контексты использования данного термина в системе (если он не стоит в начале словосочетания) возможно только при сквозном просмотре всего лексического массива.

Задачу показа контекстной координированности искомого термина с другими решает пермутационный указатель, где ключевые слова образуют семантические гнезда, объединяющие все вхождения данного термина - ключевого слова в контексте словосочетания. Иначе говоря, гнезда пермутационного указателя являются своеобразным средством эксплицитного показа ключевых слов, входящих в состав терминов-словосочетаний. Это особенно важно для терминологии наук (не только социальных), использующих зачастую многокомпонентные дескрипторы-словосочетания типа «обращение взыскания на обеспечение исполнения обязательств» или «подделка идентификационного номера транспортных средств». Входя в синтагматическую цепочку многокомпонентного термина, эти слова приобретают статус ключевых слов (или фокуса словосочетания), открывая дополнительные входы в терминологическую систему, использованную в тезаурусе. Например, в тезаурусе «Экономика и демография» число вложений в гнездо (nest depth) слова «фонд» и его

дериватов («оборот фондов», «фондовый рынок») составляет 47 словосочетаний, из которых только 17 имеют ключевое слово «фонд» («фонд -») в начале многокомпонентного термина, т.е. могут быть легко найдены в алфавитном лексико-семантическом указателе. В остальных случаях контексты искомого слова легко обозримы в пределах соответствующего гнезда, например:

арендный жилищный фонд,

жилищный фонд,

земельный фонд,

лесной фонд,

частный жилищный фонд,

амортизационные фонды,

внебюджетные фонды,

платежи во внебюджетные фонды.

В подавляющем большинстве случаев основное значение ключевого слова-фокуса гнезда сохраняется, однако иногда возможны случаи омонимии, разрешаемой исключительно благодаря контексту. Например, слово «экономия» в значении «сбережение чего-то» входит в дескрипторы-словосочетания: «экономия материальных ресурсов», «экономия на масштабах производства» и т.п. С другой стороны, «экономия» в экономической науке является компонентом идиоматического, неразложимого словосочетания «политическая экономия», входящего в свою очередь в сочетания с прилагательными, определяющими различные направления экономической мысли, такие как «буржуазная политическая экономия», «вульгарная политическая экономия», «классическая политическая экономия». Поэтому в подобных случаях включение не первого слова идиоматического термина-словосочетания (как в случае «политической экономии») в автоматически формируемые гнезда пер-мутаций является, в принципе, избыточным. Однако с точки зрения интеллектуальных затрат на редактирование пермутационного указателя подобной избыточностью можно пренебречь.

Структура термина, состоящего из сложного слова с дефисом, позволяет автоматически образовать дополнительное вложение в гнездо за счет использования второй части термина, если она соответствует общему фокусу данного гнезда, например: буржуазно-демократическая революция, народно-демократическая революция,

национально-демократическая революция, сравнительно-исторический метод, культурно-исторический подход, морально-психологический климат, социально-психологический климат.

Систематический указатель, являющийся необходимой частью тезауруса, выполняет две функции. Во-первых, тематические рубрики упорядочивают массив дескрипторов, облегчая пользователю выбор терминов, релевантных его интересу. Это важно при использовании тезауруса в качестве концептуального словаря, включающего несколько тысяч терминов. Во-вторых, рубрика классификатора в словарной статье информирует об общем тематическом аспекте выбранного дескриптора в контексте значения самой рубрики.

СНЛ - ИПТ - Автоматическое индексирование

Возвращаясь к разработанной и изданной в ИНИОН Серии отраслевых информационно-поисковых тезаурусов по социальным и гуманитарным наукам [13], следует сказать, что принципиальные основы системы лингвистического обеспечения АИСОН были заложены до ввода ее в промышленную эксплуатацию. В периодических библиографических изданиях для описания содержания публикаций в отделе научно-библиографической информации традиционно использовался только Рубрикатор. Перспектива развития АИСОН, накапливающей большие объемы информации, требовала глубокого раскрытия содержания библиографического материала. Поэтому заместителем главного конструктора, ответственного за разработку лингвистического обеспечения, было предложено использовать ключевые слова и аннотировать зарубежные публикации, что стало дополнительным источником накопления ключевых слов на русском языке, особенно при обработке статей из периодики, где, как правило, затрагиваются довольно узкие темы, что обогащало накапливаемый запас необходимой в будущем терминологии.

Таким образом создавались Списки нормализованной лексики (СНЛ), а у библиографов вырабатывались необходимые навыки индексирования документов. При этом большую методическую помощь ОНБИ оказывали сотрудники Отдела предметного каталога библиотеки. Появляющаяся в публикациях новая терминология

фиксировалась и пополняла СНЛ, послужившие основой при разработке отраслевых информационно-поисковых тезаурусов.

Для разработки информационно-поисковых тезаурусов была написана специальная программа, позволяющая пополнять тезаурусы, автоматически проверять парадигматические связи дескрип-торных статей и формировать указатели (Алфавитный лексико-семантический, Систематический и Пермутационный).

Изначально эта программа была рассчитана и на создание многоязычных тезаурусов, что с успехов реализовалось выпуском в 1997 г. совместно с Боннским информационным центром трехъязычного (немецко-англо-русский) тезауруса по социальным наукам [19] объемом 10 100 терминов.

В результате было получено лингвистическое средство для выполнения основной функции БД АИСОН - обеспечения пользователей научной информацией, в том числе - в режиме удаленного доступа.

Следующим этапом в развитии лингвистических средств стала актуализация отраслевых тезаурусов. Была проведена большая интеллектуальная работа по анализу и пополнению терминологического состава трех библиографических банков данных АИСОН: экономика и демография, философия, социология (см. табл.).

Таблица

Тезаурус 1-е издание 2017 г. прирост

Экономика и демография 4.821 6.531 1.710

Философия 3.378 6.326 2.948

Социология 2.330 4.344 2.014

Следует отметить, что эти статистические данные подтверждают вывод Дж. Солтона о 4% ежегодном приросте лексики [12, с. 496].

Первые выпуски Серии информационно-поисковых тезаурусов по социальным и гуманитарным наукам (2001-2014) [13] функционируют в составе Большого информационного словаря по общественным наукам (БИСОН) [17], повышая эффективность отраслевого и межотраслевого поиска информации.

Нормальное функционирование БИСОН предполагает периодическое обновление составляющих его отраслевых тезаурусов, поскольку перед ИНИОН РАН стоит задача информационной поддержки принципиально нового уровня развития социальных и

гуманитарных наук, представленного современным потоком научной литературы на разных языках, что дает возможность ее практического использования при решении задач инновационного развития общества.

Массив терминологии актуализированных отраслевых тезаурусов может использоваться при переходе на автоматическое индексирование литературы.

Список литературы

1. Локальные информационно-упорядоченные подпространства в глобальном пространстве Интернет / Адамович И.М., Заикин М.Ю., Земсков Д.В., Пешков А.Н. // Системы и средства информатики. - М.: Наука, 2005. - Вып. 15. -С. 219-232.

2. ГОСТ 7.66-92 (ISO 5963-85). Индексирование документов. Общие требования к координатному индексированию. Введ. 1993-01-01. - М.: Изд-во стандартов, 1992.; ГОСТ Р 7.0.0.66-2010 (ISO 5963:1985). Индексирование документов. Общие требования к координатному индексированию. Введ. 2011-07-01. - М.: Изд-во стандартов, 2010.

3. ГОСТ Р 7.0.91 (ISO 25 964-1:2011, MOD). Тезаурусы для информационного поиска. Введ. 2016-07-01. - М.: Стандартинформ, 2015. - 110 с.

4. Ильин М.В. Слова и смыслы: опыт описания ключевых политических понятий. - М.: РОССПЭН, 1997. - 431 с.

5. Колин К.К. Философские проблемы информатики. - М.: БИНОМ. - Лаборатория знаний, 2010. - 263 с.

6. Лукашевич Н.В. Тезаурусы в системе информационного поиска. - М., 2011. -512 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7. Маннинг К.Д., Рагхаван П., Шютце Х. Введение в информационный поиск / пер. с англ. - М.: И.Д. Вильямс, 2011. - 528 с.

8. Методика индексирования документов в АИСОН: дескрипторный поисковый образ документа / науч. рук. Мдивани Р.Р.; отв. исполн.: Базарнова С.В., Мдивани Р.Р., Архангельская В. А., Шемберко Л.В. - М.: ИНИОН РАН, 1989. - 250 с.

9. Плешкевич Е.А. Проблема эволюции теоретических положений в дисциплинах документально-информационного цикла: обзор // Научно-техническая информация. Сер. 1: Организация и методика работы. - 2009. - № 7. - С. 3-10.

10. Рубашкин В.Ш., Лахути Д.Г. О языке и средствах диалога с экспертом предметной области в системе ведения семантического словаря // Научно-техническая информация. Сер. 2. - 2002. - № 7. - С. 7-15.

11. Рубрикатор автоматизированной информационной системы по общественным наукам (АИСОН): классификационная таблица / ИНИОН РАН. Фундам. б-ка; сост. Антонюк Г.С. и др.; отв. ред. Глинский В.А., Слива А.И. - М., 2000. - 192 с.

12. Солтон Дж. Динамические библиотечно-информационные системы. - М.: Мир, 1979. - 557 с.

13. Тезаурусы ИНИОН по социальным и гуманитарным наукам: Информационно-поисковый тезаурус ИНИОН по экономике и демографии / сост.: Архангельская В.А. при участии Мдивани Р.Р.; ред.: Мдивани Р.Р. - М.: ИНИОН РАН, 2001. - 492 с.

Информационно-поисковый тезаурус ИНИОН по философии / сост.: Гинзбург Б.П. при участии Мдивани Р.Р.; ред.: Мдивани Р.Р., Серебряная Е.И. -М.: ИНИОН РАН, 2002. - 324 с.

Информационно-поисковый тезаурус ИНИОН по правоведению / сост.: Ба-зарнова С.В., Шевцова С.О. при участии Мдивани Р.Р.; ред.: Крысанова Н.В., Мдивани Р.Р., Слива А.И. - М.: ИНИОН РАН, 2002. - 808 с. Информационно-поисковый тезаурус ИНИОН по социологии / сост.: Гинзбург Б.П. при участии Мдивани Р.Р.; ред.: Гирко Л.В., Ли О.С., Мдивани Р.Р. - М.: ИНИОН РАН, 2003. - 240 с.

Информационно-поисковый тезаурус ИНИОН по политологии / сост.: Базар-нова С.В., Мдивани Р.Р., Слива А.И., Шевцова С.О.; ред.: Верченов Л.Н., Ильин М.В., Магай Е.В., Мдивани Р.Р., Мелешкина Е.Ю., Пивоваров Ю.С. [отв. ред.]. - М.: ИНИОН РАН, 2007. - 632 с.

Информационно-поисковый тезаурус ИНИОН по языкознанию / сост.: Сми-ренский В.Б.; ред.: Антонюк Г.С., Магай Е.В., Мдивани Р.Р. [отв. ред.], Стрельченко П.Я. - М.: ИНИОН РАН, 2007. - 200 с.

Информационно-поисковый тезаурус ИНИОН по религиоведению / сост.: Де-нискин А.А. при участии Мдивани Р.Р.; ред.: Кимелев Ю.А., Магай Е.В., Мдивани Р.Р. - М.: ИНИОН РАН, 2008. - 164 с.

Информационно-поисковый тезаурус ИНИОН по литературоведению и фольклористике / сост.: Курашова М.Я., Смиренский В.Б., Швырёва Г.П., Этова О.В. при участии Мдивани Р.Р.; ред.: Магай Е.В., Мдивани Р.Р. [отв. ред.]. - М.: ИНИОН РАН, 2010. - 112 с.

Информационно-поисковый тезаурус ИНИОН по науковедению: Наука и образование / сост.: Магай Е.В., Мдивани Р.Р., Хадиаров Г.Г.; ред.: Маке-шин Н.И., Мдивани Р.Р. - М.: ИНИОН РАН, 2011. - 496 с. Информационно-поисковый тезаурус ИНИОН по историческим наукам. - М.: ИНИОН РАН, 2012. - Т. 1: История. Археология / сост.: Базарнова С.В., Матвеева Е.Ю. при участии Громовой Д.Н., Окороковой И. Л., Русаковой М.Ю.; ред.: Магай Е.В., Мдивани Р.Р., Пивоваров Ю.С. [отв. ред.], Шевырин В.М. -610 с.; Т. 2: Этнология. Антропология / сост.: Магай Е.В., Мдивани Р.Р., Уварова Т.Б.; ред.: Мдивани Р.Р., Уварова Т.Б. - 300 с.

14. Хобом Х.-К. Информация и документация по социальным наукам // Теория и практика общественно-научной информации. - М.: ИНИОН, 2002. -Вып. 17. - С. 262-280.

15. Шемберко Л.В., Шнайдерман М.Б., Слива А.И. Лингвистический навигатор по социальным и гуманитарным наукам: Назначение, структура и принципы применения // Научно-техническая информация. Сер. 1: Организация и методика работы. - 2014. - № 11. - С. 26-37.

16. Aitchinson Y., Gilchrist A. Thesaurus construction: a practical manual. - 2 nded. -London: Aslib, 1987. - 231 p.

17. Cassirer E. Philosophie der symbolischen Formen. - Hamburg: Felix Meiner Verlag, 2010. - Teil 3: Phaenomenologie der Erkenntnis. - 598 p.

18. Meadow Ch.T. The analysis of Information Systems. - Los Angeles: Melville publishing company, 1967. - 410 p.

19. Thesaurus Sozialwissenschften: Deutsch. English. Russisch. IZ. - Bonn, 1997. - 310 p.

i Надоели баннеры? Вы всегда можете отключить рекламу.