Научная статья на тему 'Электронный идеографический словарь: теоретический и прикладной аспекты (на материале "русского тематического словаря")'

Электронный идеографический словарь: теоретический и прикладной аспекты (на материале "русского тематического словаря") Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
582
88
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЛЕКСИКОГРАФИЯ / КОМПЬЮТЕРНАЯ ЛЕКСИКОГРАФИЯ / ИДЕОГРАФИЯ / ТЕМАТИЧЕСКИЙ СЛОВАРЬ / ЭЛЕКТРОННЫЙ СЛОВАРЬ / LEXICOGRAPHY / COMPUTER LEXICOGRAPHY / IDEOGRAPHY / THEMATIC DICTIONARY / ELECTRONIC DICTIONARY

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Богачёва Галина Фёдоровна, Ольховская Александра Игоревна, Парамонова Мария Константиновна

В статье рассматриваются концепции «Русского тематического словаря» и способы её реализации средствами компьютерной лексикографии. Авторы обращаются к обсуждению преимуществ электронной версии словаря. К ним относятся визуальная материализация линейных и иерархических связей между единицами лексикона, снятие трудностей словарной интерпретации со стороны гипотетических пользователей, расширенные возможности поиска и мультимедийная поддержка словарного текста.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Богачёва Галина Фёдоровна, Ольховская Александра Игоревна, Парамонова Мария Константиновна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

An electronic ideographic dictionary: theoretical and practical aspects (on the material of The Russian Thematic Dictionary)

The article considers the conception of The Russian Thematic Dictionary and ways to implement it using computer lexicography. A very productive idea of the dictionary as a language system model (Morkovkin 1970) underlies The Russian Thematic Dictionary according to which information on the systemic features of a unit is a springboard for its speech implementation. The first part of the article presents a number of theoretical provisions regarding lexis ideographic description. Minimal units of ideographic description, means of lexical system vectors representation (such as paradigmatic, syntagmatic and derivational), a need for definitions in a thematic dictionary are discussed in this part. The second part relates to The Russian Thematic Dictionary computer implementation techniques which are working on the implementation of the basic idea that lies in its foundation. These techniques are primarily a visualization of diverse linear and hierarchical connections between lexis units that always stay planar in a paper dictionary version. The volume in an electronic version is created in three ways: through a hyperlink system, a cluster presentation of thematic groups and a combined vision of objects belonging to different compositional levels. The second advantage of the dictionary computer implementation is the simplification of vocabulary interpretation achieved through a system of pop-up windows which include transcripts and commentaries. Besides, the computer version provides advanced search capabilities. At the moment the system of filters includes options such as grammatical features, stylistics, synonyms, antonyms, paronyms and taronyms, analogues, etymology, semantic compatibility and linguocultural material. The planned functionality of The Russian Thematic Dictionary also gives an opportunity of individual work with dictionary materials (adding materials to one's "briefcase", the possibility of their systematisation and downloading). Finally, the computer electronic version of The Russian Thematic Dictionary has a multimedia component that includes not only images but also audio and video recordings. Illustrative elements will not be used in all dictionary entries but primarily for words that are hypothetically poorly understood and have a pronounced empirical component of the meaning. Images, for example, are very useful when describing units of the "Precious, Semi-Precious and Ornamental Stones" thematic group (chrysoberyl, alexandrite, aquamarine, spinel, etc.), audio recordings when describing units of the "Animal Sounds" group (rumble, clink, tweet, tinker (make a sequence of ringing melodic sounds), etc.), video recordings when describing units of the "Animal Movement Methods" group (gait, trot, gallop, jog-trot, etc.). The computer implementation of The Russian Thematic Dictionary will become an original and multifunctional lexicographic work representing a multidimensional model of the Russian language lexical system.

Текст научной работы на тему «Электронный идеографический словарь: теоретический и прикладной аспекты (на материале "русского тематического словаря")»

УДК 81'374

DOI: 10.17223/22274200/12/3

Г.Ф. Богачёва, А.И. Ольховская, М.К. Парамонова

ЭЛЕКТРОННЫЙ ИДЕОГРАФИЧЕСКИЙ СЛОВАРЬ: ТЕОРЕТИЧЕСКИЙ И ПРИКЛАДНОЙ АСПЕКТЫ (НА МАТЕРИАЛЕ «РУССКОГО ТЕМАТИЧЕСКОГО СЛОВАРЯ»)

В статье рассматриваются концепции «Русского тематического словаря» и способы её реализации средствами компьютерной лексикографии. Авторы обращаются к обсуждению преимуществ электронной версии словаря. К ним относятся визуальная материализация линейных и иерархических связей между единицами лексикона, снятие трудностей словарной интерпретации со стороны гипотетических пользователей, расширенные возможности поиска и мультимедийная поддержка словарного текста.

Ключевые слова: лексикография, компьютерная лексикография, идеография, тематический словарь, электронный словарь.

юбой словарь может быть рассмотрен с двух позиций -

внутренней, связанной с его лингвистической и лексикогра-

фической концепцией, и внешней, связанной с форматом его воплощения. Абстрагируясь от конкретики обсуждаемого предмета, указанное противопоставление можно свести к оппозиции формы и содержания. Вопрос формы (формата) лексикографического произведения долгое время оставался на периферии исследовательского внимания. Его обсуждение осуществлялось разве что в рамках учебной лексикографии, для которой внешнее исполнение словаря в большей степени связано с его дидактическим эффектом1.

Появление компьютерной лексикографии резко актуализировало параметр формы, который запечатлелся в противопоставлении бу-

1 Так, П.Н. Денисов выделяет блок гигиенических и эстетических требований к учебному словарю, к которым относит полиграфическое исполнение (красочное или строгое в зависимости от аудитории), небольшой и удобный в пользовании формат и лёгкость наведения справок (краткость подачи информации, большое количество входов в словарь) [1. С. 214]. В качестве основания для классификации словарных произведений учёный рассматривает способ мета-языкового воплощения и с опорой на него обозначает словари, использующие наглядные средства (рисунки, фотоснимки, схемы), звуковые средства и средства кино [2. С. 118-119].

мажных и электронных словарей. Если следовать широко известному философскому постулату о том, что «содержание определяет форму, а форма зависит от содержания», электронный формат следует рассматривать не сам по себе, а в тесной взаимосвязи с реализуемой в данном конкретном случае концепцией. Иными словами, при обращении к компьютерной реализации словаря лексикографу следует задуматься над тем, каким образом внутренние характеристики лексикографического произведения могут быть гармонизированы с возможностями электронного формата. При этом необходимо помнить, что электронный формат - по крайней мере пока - не создаёт нового лексикографического качества сам по себе, однако способен его многократно усиливать. Настоящая статья посвящена рассмотрению способов материализации основных принципов «Русского тематического словаря» (далее также РТС) средствами компьютерной лексикографии. Оговоримся, что компьютерное воплощение РТС находится в данный момент на этапе идейного оформления, но не реализации.

Прежде всего - несколько слов о ключевой идее рассматриваемого словаря. Около полувека назад основоположник теории и практики отечественной идеографии, В.В. Морковкин, высказал весьма плодотворную идею о необходимости создания такого идеографического словаря, который представлял бы собой «макет лексической системы» [3. С. 43-58]. Опираясь на положение о том, что «речевая актуализация включает в себя две операции: 1) выбор нужного слова из лексической парадигмы; 2) употребление выбранного слова по законам данного языка» [3. С. 47], он приходит к выводу, что достижение обозначенной цели возможно за счёт демонстрации в словаре лексической парадигматики и лексической синтагматики. Как видно из данного суждения, принцип языковой системности интересовал учёного не сам по себе, а как проявление коммуникативной целесообразности. Добавим также, что системность, безусловно, соответствует и когнитивным основам организации языковой способности. Хотя лингвистике по сей день доподлинно неизвестны принципы хранения языка в сознании его носителей, исследования психолингвистического толка и прежде всего ассоциативные эксперименты свидетельствуют в пользу того, что ментальная языковая организация в целом соразмерна языковой системности (выделение парадиг-

матических, синтагматических, словообразовательных и других ассоциаций).

Основная задача «Русского тематического словаря» состоит в практической реализации идеи о словаре-макете лексической системы, а также в раскрытии её коммуникативного потенциала. В процессе работы над словарём идея начала наполняться кровью и плотью, что позволило определить ключевые принципы РТС [4] и по-новому взглянуть на ряд вопросов идеографической лексикографии. Коснёмся здесь лишь тех, которые имеют непосредственное отношение к макетированию лексической системы.

1. Уточнение вопроса о минимальной единице идеографического описания

Общеизвестно, что лексикология и лексическая семантика обладают двумя единицами изучения - базовой, в качестве которой выступает слово, и элементарной, которой является лексико-семантический вариант [5. С. 111]. Единицей идеографического описания по понятным причинам является речевое, или «потебниан-ское», слово, т.е. ЛСВ (в противовес многозначному слову). Однако наложение тематического принципа на ЛСВ в некоторых случаях приводит к его расщеплению на две тематические специализации, не разрушающие его смыслового тождества, ср.: пастушья сумка (группа «Лекарственные растения»): семена (лечебные свойства) ~и; содержание чего-л. в ~е; собирать (сушить) ~у; • «Кашка, сумка пастушья | от любых болевых | ощущений зрачок | в одночасье готовы избавить» (И.А. Бродский. Колокольчик звенит..) и пастушья сумка (группа «Сорные растения»): вырвать [с корнем] ~у: (группы связаны взаимными отсылками).

Это позволяет говорить о политематичности некоторых единиц, а также о принципиальной пересекаемости тематических полей. Последняя, разумеется, давно известна лингвистике, ср.: «... семантические поля суть классы пересекающиеся; единственного разбиения словаря на семантические поля, если не принимать искус-

1 Словарные статьи из РТС здесь и далее по тексту приводятся в сокращении, за исключением словарных статей, представленных на макетах страниц электронной версии Словаря. Расшифровка основных сокращений и условных знаков, используемых в РТС, предъявлена в конце данной статьи.

ственных принципов классификации и не подменять семантические компоненты бинарными или иными дифференциальными признаками, не существует» [6. С. 251], однако её природу нельзя считать изученной. Неясно, в частности, для каких областей такая пересекаемость является естественным явлением: периферийных (что относит её к категории явлений «системного шва») или ядерных. Вполне возможно, ясность относительно этого вопроса внесет работа над словарём.

В противоположность «расщеплению» одного ЛСВ на несколько тематических специализаций в словаре фиксируется и обратное явление - частичное наложение семантики разных, хотя близких и эпидигматически связанных, речевых слов. Основанием для подобного наложения является диффузность значений полисеманта, проблему которой в своё время обозначил Д.Н. Шмелёв [7] и детально рассмотрела Анна А. Зализняк [8]. В общем и целом диффузность проявляется в непротиворечивой (не каламбурной) совместимости значений многозначного слова в рамках одного контекста, ср.: «Помнишь, так говорил ты, бывало, | И спокойные щуря глаза, | Улыбался, когда бушевала | Над тобою и мною гроза...» (М. Вега. Смех богов) - сочетание спокойные глаза представляет значение 'взгляд', в то время как щурить глаза - значение 'орган зрения'. Возможность неоднозначных употреблений говорит о том, что коммуникативный потенциал слова в живой речи реализуется весьма прихотливо: часто один ЛСВ «перетягивает» на свою орбиту узнаваемые семантические фрагменты других ЛСВ.

Традиционная лексикография, как известно, отражает семантическую структуру полисеманта дискретно, уклоняясь от переходных случаев. Между тем диффузность может считаться ключевым принципом речевого бытования некоторых значений слова - прежде всего тех, которые связаны тривиальным метонимическим сдвигом. На основании этого можно сделать вывод, что стремление лексикографов «освободить словарные статьи от "неопределённых" примеров существенно искажает представление о семантической структуре описываемых слов» [7. С. 86]. В РТС диффузные ЛСВ подаются в одной словарной статье с использованием сочетаемостных иллюстраций обоих значений. Так, анализ контекстов употребления слова жизнь даёт основание «слить» в одной статье два его значения: 'время существования кого-л. от рождения до смерти' и 'чьё-л. су-

ществование как процесс, наполненный событиями, имеющий ка-кие-л. особенности и т.п.': (б) жизнь (тематическая область «Фазы человеческой жизни») ... долгая (короткая, бурная, холостая) половина (остаток, полнота, разнообразие) ~и; начать где-л. (продлить кому-л., любить нсв.) Отметим, однако, что возможность «слияния» значений слова в идеографическом словаре непосредственно зависит от степени близости стоящих за ними тематических категорий - чем они ближе, тем вероятность «слияния» больше, и наоборот.

Таким образом, основной единицей идеографического описания, вне всякого сомнения, следует считать речевое слово, однако тема-тико-коммуникативный принцип представления материала время от времени вносит свои коррективы, либо «расщепляя» ЛСВ без ущерба его значению, либо «объединяя» в одной словарной статье эпи-дигматически и тематически близкие единицы.

Тематико-коммуникативный подход к моделированию лексической системы имеет ещё одно следствие, касающееся минимальной единицы описания в словаре. Оно заключается в предъявлении тематически маркированных фразеологизмов на правах заголовочных единиц, обладающих собственной парадигматикой и синтагматикой. Например:

в расцв'ете (во цв'ете) лет (сил), фр. * Син. ^в [с'амом] сок'у. <...>.

мужчина (женщина) быть нсв. (жениться св. и нсв., стать кем-л., погибнуть) • «[Умный, красивый, в меру упитанный] мужчина в полном расцвете сил» (крылат. выраж.; из мультфильма «Малыш и Карлсон», реж. Б.П. Степанцев); <...> «Он даже снял воротничок | И расстегнул слегка жилет | И весь дрожал как старичок | Хотя он был в расцвете лет» (Д.И. Хармс. В ночной пустынной тишине.).

С одной стороны, фразеологизмы образуют отдельную подсистему, функционирующую по собственным законам и правилам; не случайно в традиционной лексикографии они отражаются либо в словарях особого жанра (фразеологических), либо в специальной зоне словарной статьи. С другой стороны, в коммуникативном аспекте фразеологические единицы ничем не отличаются от собственно слов, что доказывает, например, их совершенно естественное вхождение в синонимические ряды на равных правах со словами (ср.: немолодой, в возрасте, не первой молодости). Иначе говоря, на

коммуникативном уровне различия между некоторыми лексическими единицами разной природы и разной структуры если не стираются вовсе, то уходят на второй план.

2. Способы представления векторов лексической системы

Языковая системность в современной науке, как известно, моделируется тремя векторами - парадигматическим, синтагматическим и деривационным (в терминологии Д.Н. Шмелёва - эпидигматиче-ским). Хотя способы материализации первых двух векторов, как кажется, не нуждаются в отдельном обсуждении, коротко обозначим их. Языковая парадигматика запечатлена в словаре, во-первых, посредством сгущения лексических единиц в тематические единства; во-вторых, за счёт специальной зоны словарной статьи, в которой собраны синонимы, антонимы, аналоги1 и паронимы заголовочной единицы. Языковая синтагматика представлена в сочетаемостной зоне словарной статьи с помощью перечня грамматических моделей, заполненных типичными лексическими распространителями, а также в так называемой лингвокультурологической зоне с помощью примеров из поэтических произведений.

Что касается деривационного вектора, то его коммуникативный потенциал менее очевиден, а потому вопрос его отражения в идеографическом словаре заслуживает отдельного обсуждения. Нас будут интересовать два момента: а) коммуникативная природа словообразовательного гнезда; б) многозначность как инструмент придания слову семантической глубины.

С одной стороны, словообразовательное гнездо является результатом системных по своей природе процессов, реализацией существующих в языке деривационных моделей. С другой стороны, множество производных единиц может считаться откликом на разнообразные коммуникативные потребности носителей языка (потребность

1 В лингвистике под аналогом разумеется «лексема, которая относится к той же части речи, что и данная, и имеет похожее значение, но семантически отстоит от данной лексемы дальше, чем её синонимы» [9. Т. 1. С. 489]. В рамках концепции РТС к аналогам причисляются не любые когипонимы наподобие красный - жёлтый - зелёный, а лишь те, которые имеют существенную общую часть в значении и сочетаемости, например: кривой - покосившийся, перекошенный, полированный - шлифованный, извиваться, виться - петлять, вилять.

передать оттенки качества, состояния, отношения, размер, стилистический регистр и т.д.). Поскольку производные единицы модифика-ционного типа - в силу их очень большой смысловой близости к производящей единице - являются её постоянными «спутниками» не только в составе словообразовательного гнезда, но и коммуникативно, т. е. всегда готовы передать нужный нюанс ее значения в соответствии с ситуацией речи, то и в словаре авторы сочли логичным расположить их рядом, сопроводив соответствующими пометами (ласк, уменьш.-ласк, уменьш., увел, ослабл., пренебр, уничиж., детск., женск. и т.п.), например: старый, старенький, староватый; дряхлость, дряхлый; охота, охотиться; старик, стариковский, по-стариковски, стариковски, старичок, старикан, старикашка, старичонка; воробей, воробьиха, воробьёнок и т.д. Отметим, что в отличие от многих тематических словарей РТС не придерживается час-теречного принципа формирования тематических групп, поскольку живая коммуникация строится на основе использования единиц разных частей речи.

Приблизительно так же решается вопрос с единицами, образованными в результате мутационных процессов: члены словообразовательного гнезда по возможности располагаются контактно, что, с одной стороны, демонстрирует их родство, а с другой - предоставляет адресату весь спектр единиц, которые могут понадобиться в процессе порождения речи. В этом случае значение единицы выводится не соотнесением значения производящего слова и пометы -указателя словообразовательного значения, а обычным образом, т. е. опорой на сочетаемость, синонимы и другие средства: тело ... * Син. ^телеса... человеческое (мужское, женское, здоровое, загорелое) строение (мышцы, температура) ~а ...; телеса. разг., шутл., ирон.* Син. ^тело. ... пышные (обширные, могучие)

Многозначность является, пожалуй, единственным системным феноменом, отражение которого противоречит концепции идеографического словаря. Это связано не только с тем, что значения полисемантичного слова, как правило, разнесены по разным тематически блокам, но и с тем, что сложно представить ситуацию, в которой пользователю словаря понадобится несколько ЛСВ для решения конкретной речевой задачи. Тем не менее компьютерное воплощение РТС предоставляет возможности для «связанного» предъявления значений одного слова. В этом случае в конкретной словарной ста-

тье размещаются ссылки на словарные статьи, расположенные в других тематических группах, с указанием названия и индекса этих групп. Так пользователь знакомится не только с правилами употребления данного речевого слова, но и с его семантическим, в том числе ассоциативно-экспрессивным, фоном (см. ниже примеры для слов зелёный и золотой), что сообщает плоскостному идеографическому описанию смысловую глубину.

3. Вопрос о толковании как элементе идеографического словаря

Значение лексической единицы (абсолютная ценность), безусловно, относится к системообразующим факторам, поскольку обусловливает и значимость слова (относительную ценность), и его со-четаемостные возможности (сочетательную ценность). Учитывая это обстоятельство, можно предположить, что словарь, призванный стать моделью лексической системы, в необходимом порядке включает в себя толкования лексических единиц. Однако этот вывод вряд ли можно считать правомерным по нескольким причинам. Во-первых, в отношении языка, явленного нам в аспекте функционирования (языковой данности), толкование, безусловно, выступает в качестве лингвистического конструкта. Представление модели, максимально свободной от «вмешательства» извне, предполагает как бы простую фиксацию тех явлений и связей, которые есть в языке. Во-вторых, толковательную функцию отчасти выполняет идеографический синопсис словаря вкупе с наполнением различных словарных зон, прежде всего зоны сочетаемости и синонимо-антонимической зоны.

Вот как, например, раскрывается значение 'внутреннее пространство между верхними и нижними челюстями у человека, ограниченное спереди губами' слова рот: а) в синопсисе представлена интегральная часть, т. е. отношение к тематическим областям и группам (родовые признаки) - «Тело человека», «Голова», «Лицевая часть»; б) в словарной статье представлены дифференциальные признаки (видовые отличия), здесь - главным образом посредством сочетаемости: открытый (закрытый, беззубый) ~ без зубов; полость (гигиена) рта; открыть (разинуть разг., полоскать) дышать нсв. ртом; влить что-л. в ~ и т.д. Иллюстративные предложения (пре-

1

имущественно извлечённые из поэтических произведений ), во-первых, дополняют коллекцию словосочетаний; во-вторых, демонстрируют функционирование заголовочного слова в законченном текстовом отрезке; в-третьих, позволяют показать некоторые важные периферийные семантические элементы; в-четвёртых, просто раскрывают художественные возможности данного слова. Ср. иллюстрации для слова рот в упомянутом выше значении: «Огни - как нити золотых бус. | Ночного листика во рту - вкус» (М.И. Цветаева. В огромном городе моём - ночь..); «О, болтливый язык! Для чего ты подвешен | В гулкой области рта?..» (С.В. Петров. Черновик человека); «И я живу, | тебя, | как воздух, | ртом ловлю, | стихом, | последнею строкой | леплю | тебе | из губ: | люблю» (С.И. Кирсанов. Твоя поэма).

Обозначив в нескольких чертах концептуальные основы «Русского тематического словаря», перейдём к рассмотрению способов его компьютерного воплощения. Среди первоочередных достоинств электронного формата можно назвать визуальную материализацию многообразных линейных и иерархических связей между единицами лексикона, которые в бумажной версии всегда остаются имплицитными и плоскостными. Придание объёма осуществляется тремя основными способами - с помощью системы гиперссылок, кластерного предъявления тематических групп и совмещённого видения объектов разной принадлежности.

Гиперссылки сегодня являются неотъемлемым элементом интернет-пространства и локальных документов. Их назначение, как известно, состоит в установлении связи между информационными объектами разного характера и обеспечении быстрого перехода от одного к другому. В рамках электронной версии РТС гиперссылками связаны компоненты, работающие на моделирование парадигмати-

1 Причины обращения к поэтическим цитатам на страницах тематического словаря, равно как и принципы их отбора, заслуживают отдельного разговора (об этом см. [10]). В данной статье необходимо акцентировать внимание лишь на двух моментах. Во-первых, основным назначением данных текстовых отрезков является формирование эстетической компетенции предполагаемого пользователя словаря и, в частности, выработка у него языкового вкуса. Во-вторых, при отборе поэтических иллюстраций авторы опираются на принципы самопонятности (логической законченности и избегания излишней образности), узу-альности, или соответствия нормам современного словоупотребления, а также на принцип мощного семантизирующего эффекта.

ческих связей между единицами словника (рис. 1). К таким компонентам относятся представленные в словарной статье синонимы (абсолютные и относительные), аналоги, антонимы, паронимы и таро-нимы. Например: (а) страх <...> * Син. бо'язнь (а)употр. реже. Ср. 'ужас (а), исп'уг (а), тр'епет (а); лет'е|ть (о скорости протекания времени) <...> * Син. пролет'ать, беж'ать, пробег'ать, мч'аться, нест'ись, пронос'иться, мельк'ать. Ант. ползт'и, тян'уться; мете'ор <...> * Ср. бол'ид. Не путать с метеор'ит; кр'емниев|ый <...> * Ср. кр'емнистый. Не путать с кремнёвый. Думается, что за счёт гиперссылок такого рода воссоздаётся существующая в сознании человека языковая системность.

Неорганический мир. Неживая материя / Земная поверхность / Водные пространства

/ Источники I Родник

родн'ик. родник|'а, м., нд., I в.

•ЬСин. ипючг. Ср. ист'очн^к.

холодный (живой) чистить пить зй. нсв. (напиться) из ~'а ~ бьёт зд.нсе.

откуда-л. (журчит wee., питает нсв. озеро, иссяк)

• «Родник между ними из почвы бесплодной, | Журча, пробивался волною

холодной..» (М.Ю. Лермонтов. Три пальмы).

^ ключик2 родниковый ^

Рис. 1. Гиперссылки в РТС

В основе идеографического синопсиса Словаря лежат пять крупных разделов - «Абстрактные категории и отношения, формы существования материи и духа», «Неорганический мир. Неживая материя», «Неодухотворённая живая материя», «Человек» и «Общество, страна, государство». Каждый из указанных разделов имеет древовидную структуру и дробится на всё более мелкие группы и подгруппы. Наиболее подходящим способом визуального представления данного языкового материала являются, на наш взгляд, тематические облака кластерного типа с возможностью последовательного погружения в их содержание. Таким образом, основной принцип графического дизайна Словаря состоит в облачно-кластерном моделировании лексикона. Поскольку тематические разделы, расположенные на главной странице, выполняют функцию

основного (семантико-ориентированного) входа в словарь, принципиально важно, чтобы они давали пользователю достаточно ясное представление об их наполнении. Перечисленные ранее названия глобальных тематических полей такого представления, как кажется, не дают, поэтому необходимо перейти на более низкий уровень смыслового обобщения.

Тематические группы второй ступени действительно могут служить надёжным навигатором в поиске слова, поскольку соответствуют интуитивному представлению человека о существующих в языке смысловых блоках. Ср.: внутри раздела «Абстрактные категории» выделяются группы «Время», «Пространство», «Форма», «Движение», «Количество» и др., внутри раздела «Неорганический мир. Неживая материя» - группы «Вещества», «Космос», «Земной шар», «Атмосфера земли, климат и погодные явления», «Поверхность Земли», «Недра Земли», внутри раздела «Неодухотворённая живая материя» - группы «Растительный мир», «Животный мир» и т.п. Если воспользоваться принятой в когнитивной лингвистике классификацией категорий на категории подчинённого, базового и высшего уровней, то такие тематические группы можно считать категориями высшего уровня, в то время как глобальные разделы относятся, судя по всему, к суперкатегориям, искусственно конструируемым и плохо осознаваемым рядовыми носителями (за исключением, пожалуй, раздела «Человек»).

Таким образом, на главной странице Словаря целесообразно предъявить тематические группы первой и второй ступени обобщения (рис. 2). Каждая тематическая группа оформляется в виде окружности, диаметр которой зависит от объёма входящего в группу языкового материала. При этом желательно, чтобы окружности, относящиеся к одному тематическому разделу, были окрашены в один цвет. При клике по окружности пользователь перемещается вглубь тематического древа, соответственно, перед ним разворачивается тематический кластер выбранной группы

Рис. 2. Главная страница РТС

(рис. 3). Иерархическая связь между группами передаётся соединительными линиями, отсутствие таковой - соположением окружностей. Хотя кластерное оформление тематического каркаса представляется наиболее оптимальным, электронная версия РТС позволяет выбрать стандартный списочный способ его предъявления.

Рис. 3. Кластер тематической группы

Что касается совмещённого видения объектов разной принадлежности, то оно, по задумке авторов, будет реализовано в двух моментах. Первый связан с возможностью пользователя видеть присловную и присловарную грамматическую характеристику слова

на одной странице1. Технически это можно сделать за счёт всплывающего окна с окончаниями парадигмы, которое появляется при клике на её индекс (рис. 4).

Ввезите текс/п Зля поиска в словаре

Неорганический мир. Неживая материя

с'олнышк|о. -а, только е<5. ср., нд., Ц

—— _ _ _ Индекс

Единственное число Родит.падеж -а / -а'

Дат. падеж -у / -у'

Винит, падеж = Им.

Творит, падеж -ом' -о'м

Предл. падеж -е / -е

Множественное чнелло Именит, падеж а/ -а'

Родит, падеж -0

Дат. падеж -ам / -а'м

Винит, падеж нд — Им. од — Род.

Творит, падеж -ами / -а ми

Предл. падеж -ах / -а'х

ласковое (весеннее) ~ сияет нее. (светит нее.)

• «Я на солнышке лежу, I Я на солнышко гляжу» («Песня львёнка и черепахи», сл. С.Г. Козлова, муз. Г.И. Гладкова).

Рис. 4. Словоизменительная парадигма слова «солнышко»

Второй момент предполагает придание заголовочной единице семантического объёма за счёт указания, во-первых, на её вхождение в другие тематические группы (тематические специализации ЛСВ), а во-вторых, на тематическую отнесенность других значений этого же слова (рис. 5). Так, на странице словарной статьи алмаз (переход ~а в графит; углерод в виде ~а) в группе «Неметаллы / Простые вещества» мы найдём ссылку ткж. 53 (53 - здесь номер тематической группы), перейдя по которой пользователь попадёт в группу «Дра-

1 Присловарная грамматическая характеристика представляет собой расположенные в зоне словарных приложений регулярные словоизменительные парадигмы русского языка. Присловная грамматическая характеристика находится непосредственно в словарной статье, справа от заголовочной единицы, и содержит словоформы, которые не укладываются в образцовые грамматические схемы. Связь между присловной и присловарной характеристиками осуществляется на основании системы индексов (I а-ж, II а-г, III а-з, IV а-з, V а-б). Первый опыт такого рода описания языкового словоизменения находим в [11].

гоценные камни» (огранка ~ов; диадема с ~ами, что-л. усыпано ~ами); в словарной статье зелёный (~ помидор) в группе «Развитие растений» мы найдём ссылки на другие ЛСВ этого слова, ср.: зелёный - «Цветовые ощущения» (~ краска), зелёный - «Юность, молодость» (~ юнец).

Неорганический мир. Неживая материя / Вещества / Простые вещества / Металлы / Золотой

золот|'ой. относ., IV а. *кСин. ^злаУой

~ песок (рудник, самородок, слиток, серьги, кольцо)

• «Сказка о золотом петушке» (сказка A.C. Пушкина); «Золотой ключик или Приключения Буратино» (повесть-сказка А.Н. Толстого); «Белка песенки поёт, | Да орешки всё грызёт, | А орешки непростые, | Всё скорлупки золотые, | Ядра - чистый изумруд..» (A.C. Пушкин Сказка о царе Салтане..); «Пять коней подарил мне мой друг Люцифер | И одно золотое с рубином кольцо, | Чтобы мог я спускаться в глубины пещер | И увидел небес молодое лицо» (Н.С. Гумилёв. Баллада).

В других подгруппах:

золот'ой [Человек как субъект трудовой деятельности / Ювелирные изделия /Драгоценные металлы / Золотой} Другие значения:

золот'ой (Человек / Человек как живое существо / Ощущения и восприятия человека / Органы чувств и их функционирование / Зрение и зрительные ощущения I Цветовые ощущения / Золотой)

золот'ой (Абстра^ные категории и отношения, формы существования материи и духа // Качество / Оценка качества / Общая оценка качества / Золотей)

золотоносный

Рис. 5. Предъявление политематичности и многозначности в РТС

Следующим достоинством компьютерного воплощения РТС является снятие трудностей словарной интерпретации, которое достигается посредством системы всплывающих окон с расшифровками и комментариями (рис. 6). Такая помощь, как представляется, может понадобиться читателям для понимания некоторых лингвистических терминов, не получивших широкого распространения за пределами науки о языке (например, аналог, тароним, лингвокультурологиче-ская информация), а также использованных в словаре сокращений и условных обозначений (например, нд.- неодушевлённое [существительное], сравн. I - синтетическая форма сравнительной степени, • - знак, вводящий пословицы, поговорки, крылатые выражения, яркие цитаты и др., ~к Ср. - сравните; знак, вводящий аналоги, Не путать с - знак, вводящий паронимы и таронимы). Поскольку пре-

дугадать уровень лингвистической и лексикографической компетенции пользователя практически невозможно, предпочтительно, чтобы комментированию в словаре подвергалось максимальное количество метаязыковых элементов.

Рис. 6. Всплывающее окно с пояснением термина

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Кроме того, компьютерная версия РТС предоставляет расширенные возможности поиска. Речь здесь идёт не о механизмах поиска конкретной единицы - они, вообще говоря, дублируют входы бумажной версии (через синопсис, через русский и английский алфавитные указатели), а о параметрическом поиске разнообразной языковой информации. В настоящий момент в систему поисковой фильтрации включены такие параметры, как грамматическая характеристика, стилистика, синонимы, антонимы, паронимы и таронимы, аналоги, этимология, сочетаемость и лингвокультуроло-гический материал (рис. 7). Данное решение делает рассматриваемое произведение не только словарём, но и инструментом лингвистических исследований, что существенно расширяет аудиторию его предполагаемых пользователей. Запланированный функционал РТС обеспечивает также возможность индивидуальной работы со словарными материалами. Читатель, в частности, может добавлять необходимые ему словарные статьи в свой «портфель» (раздел «Избранное»), систематизировать их удобным для него способом и скачивать.

I I Иллюстративный материал

I__I Лингвострановедческий материал

Q Грамматическая характеристика Часть речи:

Существительное

( ) Одушепённостч

О Неодушелённость

Средний Женский Щ

I Фразеологизм

Q Синонимы

U Антонимы

□ ПаронимьРи TaponHMiP

П Аналоги®

J Этимология

|_| Стилистическая помета

Главная I Неорганический мир. Неживая материя I Космос / Вселенная, космос: общие понятия

макрок'осмос. -а, только ед. м., нд.. I а, книжн. *Син. макрок'осм. Eng. macrocosm[os]

Макрокосмос / Вселенная, космос: общие ноняшяг Космос / Неорганический мир Нежиаая материя

макрок'осм. -а. только ед.. м., нд., I а. книжн. +Син. макрок'осмос. Eng. macrocosm

Макрокосм / Вселенная, космос: общие понятия/ Космос I Неорганический мир. Неживая материя

мир', -а, зв. еа., м., нд., I а,*Син. Вселенная. Eng. world.

Мир' I Вселенная, космос: общие попятят Космос /Неорганический мир. Неживая материя

Рис. 7. Система фильтрации в РТС

Говоря о компьютерной версии словарного произведения, сложно обойти стороной её мультимедийный аспект и, в частности, использование разного рода инструментов наглядности. Наглядные способы семантизации, будучи широко известными в традиционной бумажной лексикографии, приобретают существенную значимость при обсуждении данного словарного ресурса. Это связано, во-первых, с его жанровыми ограничениями (демонстрирующий, а не объяснительный словарь), а во-вторых, с расширением круга иллюстративных возможностей электронного словаря, в котором могут быть задействованы не только изображения, но и аудио- и видеозаписи.

Теоретическим основанием включения иллюстративных элементов в словарь является положение о том, что знание эмпирического (образного, наглядно-чувственного) компонента есть неотъемлемое условие знания слова. Ср.: «Мы полностью знаем значение предметного слова, только если у нас сложился и его чувственно-наглядный образ. Так, зная, что домкрат - это «механизм для поднятия тяже-

стей на небольшую высоту», мы ещё не знаем значения слова домкрат, нам необходимо его увидеть. Предложение «крупное садовое травянистое растение с большими яркими соцветиями» ещё не составляет для нас значения слова георгин, а «самка крупного домашнего рогатого скота» - ещё не значение слова корова, пока мы не сформировали представления об этих предметах» [12. С. 130]. Аудио- и видеозаписи в этом смысле отличаются от рисунков лишь тем, что обслуживают особые разряды конкретной лексики: первые - слова со звуковым компонентом в значении, вторые - с мо-торно-двигательным.

Рис. 8. Словарная статья с иллюстрациями

Следует отметить, что иллюстративные элементы предполагается использовать не во всех словарных статьях, а прежде всего в отношении тех слов, которые являются гипотетически малопонятными (агнонимическими) для пользователя словаря и имеют яркий эмпирический компонент в значении1. Рисунки, например, крайне полез-

1 В.В. Морковкин перечисляет семантические разряды лексики, в отношении которых полезно применять остенсивную семантизацию. К ним он относит:

1) объекты растительного и животного мира; 2) предметы быта и домашнего обихода; 3) предметы одежды; 4) бижутерию и детали украшения одежды; 5) предметы мебели; 6) устройства и механизмы; 7) детали машин и механизмов; 8) рабочие инструменты; 9) музыкальные инструменты; 10) строения, архитектурные сооружения и их детали; 11) сосуды и другие ёмкости; 12) холодное и огнестрельное оружие; 13) спортивные объекты и пр. [13. С. 172].

ны при описании единиц тематической группы «Драгоценные, полудрагоценные и поделочные камни» (хризоберилл, александрит, аквамарин, шпинель, опал, турмалин и др.), аудиозаписи - при описании слов группы «Звуки, издаваемые животными» (урчать, цокать, скулить, чирикать, тенькать, стрекотать и др.), видеозаписи -при лексикографировании единиц группы «Способы передвижения животных» (аллюр, рысь, галоп, трусить, планировать2, вспорхнуть и др.) (рис. 8).

Воплощение «Русского тематического словаря» в электронном формате позволит получить оригинальное и многофункциональное лексикографическое произведение, представляющее объёмную модель лексической системы русского языка. Задуманная компьютерная версия является, во-первых, традиционным справочным пособием с удобной системой поиска; во-вторых, средством обучения, предназначенным для порождения речи; в-третьих, своеобразной базой данных для исследовательской работы.

Принятые в РТС сокращения и условные знаки

Ант. - антонимы

зд. - здесь, в данном значении

Не путать с - паронимы и таронимы

нд. - неодушевлённое (существительное)

нсв. - несовершенный (вид)

св. - совершенный (вид)

Син. - синонимы

Ср. - сравните; знак, вводящий аналоги

ткж. - также

фр. - фразеологизм

— знак, вводящий заголовочную единицу в исходной форме или её неизменяемую часть (основу)

* (пятиконечная звезда) - знак, вводящий синонимы, антонимы, аналоги, паронимы и таронимы заголовочной единицы

• (тёмный кружок) - знак, вводящий пословицы, поговорки и яркие цитаты

| (вертикальная чёрточка) - знак, с помощью которого: а) в грамматической характеристике изменяемая часть отделяется от неизменяемой; б) стихотворное произведение делится на строки.

58 | Г.Ф. Богачёва, А.И. Ольховская, М.К. Парамонова ' (акут) - знак ударения

I а, V б - индекс, отсылающий к присловарной грамматической характеристике

^ (поднятая над строкой галочка) - знак в разделе *, указывающий на то, что синоним относится к иному по сравнению с заголовочной единицей стилистическому регистру

[ ] (квадратные скобки) - в них заключаются: а) факультативные элементы; б) краткие этимологические справки

(а), (б), (в) и т.д. - индексы лексико-семантических вариантов многозначного слова

... (отточие) - знак прерванной цитаты (в отличие от многоточия)

Литература

1. Денисов П.Н. Лексика русского языка и принципы её описания. - М.: Рус. яз., 1993. - 248 с.

2. Денисов П.Н. Очерки по русской лексикологии и учебной лексикографии. -М.: Изд-во МГУ, 1974. - 256 с.

3. Морковкин В.В. Идеографические словари. - М.: Изд-во МГУ, 1970. - 71 с.

4. Богачёва Г.Ф., Ольховская А.И. Русский тематический словарь: традиции и новации // Русский язык за рубежом. - 2016. - № 4. - С. 49-55.

5. Новиков Л.А. Семантика русского языка. - М.: Высш. шк., 1982. - 272 с.

6. Апресян Ю.Д. Лексическая семантика. Синонимические средства языка. - М.: Наука, 1974. - 367 с.

7. Шмелев Д.Н. Современный русский язык: Лексика: учеб. пособие. - М.: Еди-ториал УРСС, 2003. - 336 с.

8. Зализняк А.А. Многозначность в языке и способы ее представления. - М.: Языки славянских культур, 2006. - 672 с.

9. Апресян Ю.Д. Исследования по семантике и лексикографии. - Т. 1: Парадигматика. - М.: Языки славянских культур, 2009. - 568 с.

10. Ольховская А.И. Поэзия как элемент «Русского тематического словаря» // Международный аспирантский вестник. - 2016. - № 3. - С. 55-60.

11. Морковкин В.В., Богачёва Г.Ф., Луцкая Н.М. Большой универсальный словарь русского языка / под ред. В.В. Морковкина. - М.: Словари XXI века: АСТ-ПРЕСС ШКОЛА, 2016. - 1456 с.

12. Стернин И.А. Проблемы анализа структуры значения слова. - Воронеж: Изд-во Воронеж. ун-та, 1979. - 122 с.

13. Морковкин В.В., Морковкина А.В. Русские агнонимы (слова, которые мы не знаем). - М.: АО «Астра семь», 1997. - 415 с.

AN ELECTRONIC IDEOGRAPHIC DICTIONARY: THEORETICAL AND PRACTICAL ASPECTS (ON THE MATERIAL OF THE RUSSIAN THEMATIC DICTIONARY)

Voprosy leksikografii - Russian Journal of Lexicography, 2017, 12, pp. 39-60. DOI: 10.17223/22274200/12/3

Galina F. Bogacheva, Aleksandra I. Olkhovskaya, Maria K. Paramonova, Pushkin State Russian Language Institute (Moscow, Russian Federation). E-mail: [email protected] / [email protected] / [email protected]

Keywords: lexicography, computer lexicography, ideography, thematic dictionary, electronic dictionary.

The article considers the conception of The Russian Thematic Dictionary and ways to implement it using computer lexicography. A very productive idea of the dictionary as a language system model (Morkovkin 1970) underlies The Russian Thematic Dictionary according to which information on the systemic features of a unit is a springboard for its speech implementation.

The first part of the article presents a number of theoretical provisions regarding lexis ideographic description. Minimal units of ideographic description, means of lexical system vectors representation (such as paradigmatic, syntagmatic and derivational), a need for definitions in a thematic dictionary are discussed in this part.

The second part relates to The Russian Thematic Dictionary computer implementation techniques which are working on the implementation of the basic idea that lies in its foundation. These techniques are primarily a visualization of diverse linear and hierarchical connections between lexis units that always stay planar in a paper dictionary version. The volume in an electronic version is created in three ways: through a hyperlink system, a cluster presentation of thematic groups and a combined vision of objects belonging to different compositional levels. The second advantage of the dictionary computer implementation is the simplification of vocabulary interpretation achieved through a system of pop-up windows which include transcripts and commentaries.

Besides, the computer version provides advanced search capabilities. At the moment the system of filters includes options such as grammatical features, stylistics, synonyms, antonyms, paronyms and taronyms, analogues, etymology, semantic compatibility and linguocultural material. The planned functionality of The Russian Thematic Dictionary also gives an opportunity of individual work with dictionary materials (adding materials to one's "briefcase", the possibility of their systematisation and downloading).

Finally, the computer electronic version of The Russian Thematic Dictionary has a multimedia component that includes not only images but also audio and video recordings. Illustrative elements will not be used in all dictionary entries but primarily for words that are hypothetically poorly understood and have a pronounced empirical component of the meaning. Images, for example, are very useful when describing units of the "Precious, Semi-Precious and Ornamental Stones" thematic group (chrysoberyl, alexandrite, aquamarine, spinel, etc.), audio recordings when describing units of the "Animal Sounds" group (rumble, clink, tweet, tinker (make a sequence of ringing melodic sounds), etc.), video recordings when describing units of the "Animal Movement Methods" group (gait, trot, gallop, jog-trot, etc.).

The computer implementation of The Russian Thematic Dictionary will become an original and multifunctional lexicographic work representing a multidimensional model of the Russian language lexical system.

References

1. Denisov, P.N. (1993) Leksika russkogo yazyka i printsipy ee opisaniya [Vocabulary of the Russian language and the principles of its description]. Moscow: Russkiy yazyk.

2. Denisov, P.N. (1974) Ocherkipo russkoy leksikologii i uchebnoy leksikografii [Essays on Russian lexicology and educational lexicography]. Moscow: Moscow State University.

3. Morkovkin, V.V. (1970) Ideograficheskie slovari [Ideographic dictionaries]. Moscow: Moscow State University.

4. Bogacheva, G.F. & Ol'khovskaya, A.I. (2016) "Russkiy tematicheskiy slovar'": traditsii i novatsii [Russian Thematic Dictionary: traditions and innovations]. Russkiy yazyk za rubezhom - Russian Language Abroad. 4. - pp. 49-55.

5. Novikov, L.A. (1982) Semantika russkogo yazyka [Semantics of the Russian language]. Moscow: Vysshaya shkola.

6. Apresyan, Yu.D. (1974) Leksicheskaya semantika. Sinonimicheskie sredstvayazyka [Lexical semantics. Synonymic means of language]. Moscow: Nauka.

7. Shmelev, D.N. (2003) Sovremennyy russkiy yazyk. Leksika [The modern Russian language. Vocabulary]. Moscow: Editorial URSS.

8. Zaliznyak, A.A. (2006) Mnogoznachnost' v yazyke i sposoby ee predstavleniya [Polysemy in the language and ways of representing it]. Moscow: Yazyki slavyanskikh kul'tur.

9. Apresyan, Yu.D. (2009) Issledovaniyapo semantike i leksikografii [Studies on semantics and lexicography]. Vol. I. Moscow: Yazyki slavyanskikh kul'tur.

10. Ol'khovskaya, A.I. (2016) Poetry as an element of the Russian Thematic Dictionary. Mezhdunarodnyy aspirantskiy vestnik. 3. pp. 55-60. (In Russian).

11. Morkovkin, V.V., Bogacheva, G.F. & Lutskaya, N.M. (2016) Bol'shoy univer-sal'nyy slovar' russkogo yazyka [A great universal dictionary of the Russian language]. Moscow: Slovari XXI veka; AST-PRESS ShKOLA.

12. Sternin, I.A. (1979) Problemy analiza struktury znacheniya slova [Problems in analyzing the structure of the meaning of a word]. Voronezh: Voronezh State University.

13. Morkovkin, V.V. & Morkovkina, A.V. (1997) Russkie agnonimy (slova, kotorye my ne znaem) [Russian agnonyms (words that we do not know)]. Moscow: AO "Astra sem'".

i Надоели баннеры? Вы всегда можете отключить рекламу.