Научная статья на тему 'Многоаспектный автоматизированный диалектный словарь наименований человека в воронежских говорах и его возможности в плане отражения семантики диалектного слова'

Многоаспектный автоматизированный диалектный словарь наименований человека в воронежских говорах и его возможности в плане отражения семантики диалектного слова Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
374
88
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИАЛЕКТНЫЙ СЛОВАРЬ / ОБРАЗ ЧЕЛОВЕКА / ЛЕКСИКО-СЕМАНТИЧЕСКАЯ ГРУППА / ЛЕКСИКОГРАФИЯ / ТЕМАТИЧЕСКАЯ ГРУППА / ДИАЛЕКТНАЯ ЛЕКСИКОГРАФИЯ / ВОРОНЕЖСКИЕ ГОВОРЫ / DIALECT VOCABULARY / IMAGE OF PUPIL / LEXICAL-SEMANTIC GROUP / LEXICOGRAPHY / THEMATIC GROUP / DIALECT LEXICOGRAPHY / VORONEZH DIALECTS

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Литвинова Татьяна Александровна, Загоровская Ольга Владимировна

Цель работы – представить структуру словаря наименований человека в воронежских говорах как комплексного многоаспектного автоматизированного словаря. Постановка данной проблемы соответствует общему направлению развития мировой лексикографии, одной из основных тенденций которой является тенденция к лексикографической параметризации языка и созданию универсальных словарей, позволяющих значительно расширить содержащуюся в них информацию о слове и сделать словарь не просто «толковником» слов, но представить их во всей совокупности языковых и речевых характеристик, т. е. отразить в определенной мере все уровни языковой системы и репрезентировать данную систему. На основе многолетних теоретических и полевых исследований авторов впервые разработана структура комплексного автоматизированного словаря наименований человека в воронежских говорах, разработана структура его словарной статьи, определены ее компоненты. Проектируемый словарь будет являться первым опытом многоаспектного автоматизированного тематического словаря в отечественной диалектной лексикографии.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Литвинова Татьяна Александровна, Загоровская Ольга Владимировна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MULTIFACETED MACHINE-AIDED DIALECT VOCABULARY OF PUPIL CHARACTERISTICS IN VORONEZH DIALECTS AND ITS POSSIBILITIES IN REFLECTING DIALECT WORD SEMANTICS

The aim of the paper is to present the structure of dialect vocabulary of pupil characteristics in voronezh dialects as complex multifaceted machine-aided dialect vocabulary. Statement of such problem corresponds to the general direction of development of world lexicography. One of the tendencies of modern lexicography is the tendency to lexicography language parametrization and development of universal vocabulary which permit to broaden information about words, represent them with all their language and speech characteristics, reflect all the levels of language system Based on longitudinal theoretical and field research the structure of complex machine-aid vocabulary of pupil characteristics in Voronezh dialects and its components are developed for the first time. The vocabulary is the first example of multifaceted machine-aided dialect thematic vocabulary in Russian dialect lexicography.

Текст научной работы на тему «Многоаспектный автоматизированный диалектный словарь наименований человека в воронежских говорах и его возможности в плане отражения семантики диалектного слова»

УДК 8133

МНОГОАСПЕКТНЫЙ АВТОМАТИЗИРОВАННЫЙ ДИАЛЕКТНЫЙ СЛОВАРЬ НАИМЕНОВАНИЙ ЧЕЛОВЕКА В ВОРОНЕЖСКИХ ГОВОРАХ И ЕГО ВОЗМОЖНОСТИ В ПЛАНЕ ОТРАЖЕНИЯ СЕМАНТИКИ ДИАЛЕКТНОГО СЛОВА

Т. А. Литвинова, О. В. Загоровская

Цель работы - представить структуру словаря наименований человека в воронежских говорах как комплексного многоаспектного автоматизированного словаря. Постановка данной проблемы соответствует общему направлению развития мировой лексикографии, одной из основных тенденций которой является тенденция к лексикографической параметризации языка и созданию универсальных словарей, позволяющих значительно расширить содержащуюся в них информацию о слове и сделать словарь не просто «толковником» слов, но представить их во всей совокупности языковых и речевых характеристик, т. е. отразить в определенной мере все уровни языковой системы и репрезентировать данную систему.

На основе многолетних теоретических и полевых исследований авторов впервые разработана структура комплексного автоматизированного словаря наименований человека в воронежских говорах, разработана структура его словарной статьи, определены ее компоненты. Проектируемый словарь будет являться первым опытом многоаспектного автоматизированного тематического словаря в отечественной диалектной лексикографии.

Ключевые слова: диалектный словарь, образ человека, лексико-семантическая группа, лексикография, тематическая группа, диалектная лексикография, воронежские говоры.

Введение. Образ человека — ядро национальной культуры, системы ее ценностей. Человек отразил в языке свой физический облик, эмоции, интеллект, отношение к себе и окружающему миру (работы Ю. Д. Апресяна, Н. Д. Арутюновой, Т. И. Вендиной, М. П. Одинцовой, А. А. Уфимце-вой и мн. др.). Образ человека — один из основных в языковой картине мира, в том числе и в диалектной.

Лексико-семантическое поле «Человек» активно изучается в диалектной лексикологии, в том числе и на материале воронежских говоров (см. подробнее в [9]). Однако лексико-семантическое поле характеристик человека в воронежских говорах, несмотря на свою очевидную значимость в структуре диалекта, не получило системного лексикографического описания. Обширный лексикографический материал, представляющий несомненную ценность для лингвистов, культурологов,

Литвинова Татьяна Александровна, канд. филол. наук, научный сотрудник, Региональный центр русского языка при Воронежском государственном педагогическом университете; Россия, г. Воронеж, e-mail: centr_rus_yaz@mail.ru Загоровская Ольга Владимировна, д-р филол. наук, проф., зав. кафедрой русского языка, современной русской и зарубежной литературы, Воронежский государственный педагогический университет;

Россия, г. Воронеж; e-mail: olzagor@yandex.ru

© Литвинова Т. А., Загоровская О.В., 2013

психологов, не введен в научный оборот. Данная ситуация характерна не только для воронежских говоров.

Отметим, что, согласно нашим данным, в настоящий момент существуют лишь единичные работы, в которых представлено лексикографическое описание тематической группы «Человек» [1, 2, 12]. Считаем, однако, что проектируемый словарь наименований человека в воронежских говорах должен являться комплексным. Как отмечается, создание комплексных лексикографических произведений с углубленной интерпретацией различных аспектов плана содержания словесного знака является одной из актуальных проблем современной диалектной лексикографии.

Постановка данной проблемы соответствует общему направлению развития мировой лексикографии, одной из основных тенденций которой является тенденция к «лексикографической параметризации языка» (Ю. Н. Караулов) и созданию «универсальных» (многоаспектных, многоцелевых) словарей, позволяющих значительно расширить содержащуюся в них информацию о слове и сделать словарь не просто «толковником» слов, но представить их во всей совокупности языковых и речевых характеристик, т. е. отразить в определенной мере все уровни языковой системы и репрезентировать данную систему [4].

1. Полифункциональные словари в современной лексикографии. В отечественной лексикографии подготовка комплексных полифунк-

циональных словарей, включающих целую серию лексикографических параметров (видов лексикографической информации), осуществляется, в основном, на материале литературного языка с использованием машинных форм подготовки и ведения словарей.

В традиционной диалектной лексикографии возможность решения названной проблемы обычно связывается с созданием серии словарей одного и того же лексикографируемого объекта (см., например: работы Ф. П. Сороколетова, О. И. Блиновой, В. А. Сенкевича). Принятые в теории и практике традиционных книжных диалектных словарей принципы и способы (методы) сбора и обработки, а также представления языковых данных не позволяли до недавнего времени ставить вопрос об объединении разноаспектной информации в одном лексикографическом произведении. Однако использование современных компьютеров для создания и ведения диалектного словаря существенно расширяет его возможности в плане отражения самых разных типов лексикографической информации и делает создание многоаспектного диалектного словаря вполне реальным.

2. Многоаспектный автоматизированный диалектный словарь МАДС (Л). Как представляется, проектируемый словарь наименований человека в воронежских говорах должен в своей структуре учитывать разработки, ведущиеся одним из авторов данной статьи, О. В. Загоровской, касающиеся создания МАДС (Л) [4]. МАДС (Л) разрабатывался в рамках создания Спф ДФ Машинного фонда русского языка (МФ РЯ). Основными научными целями МАДС (Л) являлись:

- внедрение в практику диалектной лексикографии достижений современной теоретической лингвистики (в первую очередь, теоретической семасиологии) и современной вычислительной лексикографии, основанной на применении современных ЭВМ;

- разработка структурной модели типовой словарной статьи компьютерного диалектного словаря, позволяющего с максимальной полнотой отразить особенности диалектной словесной единицы (с точки зрения ее материального выражения и плана содержания) и направленного на функционирование в общей системе МФ РЯ.

Исходной теоретической идеей названного словаря являлась концепция полноты лексикографического описания языка [5]. Лингвистической основой МАДС (Л) являлись материалы русского говора с. Лойма Прилузского района Коми, представленные в виде записей диалектных текстов различной тематической направленности и ситуативной отнесенности, характеризующие современное состояние лоем-ского говора (экспедиционное обследование названного говора ведется с 1976 года) [4].

2.1. Общая структура МАДС (Л). МАДС (Л) создается как функционирующий в компьютерной среде комплекс баз данных лексикографического

типа (АЛС), в структуру которого входят следующие составляющие: словник; специализированная словарная база данных (СБД), или специализированная словарная картотека; иллюстративнотекстовая база (ТБД), или автоматический конкорданс; комплекс лингвистических алгоритмов и программ (КЛАП).

Словник МАДС (Л) представляет собой массив исходных форм слов и сочетаний, которые являются заголовочными для словарных статей. В соответствии с особенностями МАДС (Л) в составе его словника выделяются три основных массива:

- слова собственно диалектные, имеющие на территории распространения национального русского языка изоглоссу, принадлежащие как целое только диалектным системам и отсутствующие в литературном языке;

- слова диалектно-просторечные, входящие как в диалектный язык, так и в просторечие и не известные литературному языку;

- слова общенародные, составляющие общерусский лексический фонд и известные как народным говорам, так и литературному языку.

Формирование словника МАДС (Л) осуществлялось в несколько этапов.

На первом этапе на основе ТБД в автоматическом режиме формировался список словоформ (текстоформ).

На втором этапе происходило создание первичного словника — «словника словозначе-ний» (включающего однозначные слова, ЛСВ многозначных слов и отдельные устойчивые словосочетания). Лемматизация при этом осуществляется автоматически на основе использования собственного словаря «словоформа — лемма», формирование которого происходит параллельно с процессом лемматизации на основе принципов аналогии и обучаемости. При этом используются функциональные возможности ТО-компоненты АЛС УНИЛЕКС.

Формирование окончательного (вторичного) словника — «словника слов» — осуществлялось в интерактивном режиме на заключительном этапе работы.

Специализированная словарная база данных МАДС (Л) представляет собой совокупность словарных статей, создаваемых в автоматическом и диалоговом режимах на основе ТБД и хранящихся во внешней памяти ЭВМ с учетом возможностей различного рода преобразований информации. Для формирования словарных статей МАДС (Л) использовались также базы данных некоторых машинных диалектных словарей, а также материалы машинной версии МАС, созданной в Отделе Машинного фонда Института русского языка АН. Подготовка включаемых в МАДС (Л) словарных статей осуществлялась в соответствии со специально разработанными типовой структурой и формальной грамматикой словарной статьи МАДС (см. ниже).

Иллюстративно-текстовая база данных МАДС (Л) представляет собой совокупность специальным образом обработанных диалектных текстов, введенных на машинные носители. При сборе диалектного материала основное внимание уделялось разнонаправленности, естественности и случайности фиксации диалектных данных в целях отражения всех имеющихся в говоре фрагментов языковой модели мира и функциональностилистических пластов лексики.

Главное назначение ТБД — служить основой формирования, дополнения и корректировки специализированной словарной базы (словарной картотеки) МАДС (Л). Однако по своему характеру и организации названный специализированный конкорданс является многофункциональным и в принципе может быть использован для самых различных диалектологических исследований, например, в области морфологии, синтаксиса, семантики текста (на современном этапе развития компьютерной лингвистики полифункциональность следует рассматривать как обязательное условие создания ТБД).

Комплекс лингвистических алгоритмов и программ МАДС (Л) включает в себя следующие составляющие:

- АЛС УНИЛЕКС, разработанную в лабо-

ратории НИВЦ МГУ [3] и имеющую две подсистемы: словарно-ориентированную [6] и тексто-

ориентированную [11].

- АЛС ГОВОР, разработанную в Сыктывкарском университете и имеющую три подсистемы: генеральный лингво-операционный программный

интерфейс; источнико-ориентированную подсистему (включающую картотеко-ориентированный, иллюстрационно-ориентированный и библиографический модули) и учебно-ориентированную подсистему [4].

Перечень лексикографических параметров диалектного слова для МАДС (Л) составлен на основе анализа всех известных мировой практике типов лексикографической информации, анализа диалектных словарей, с учетом своеобразия диалекта как устной формы существования национального языка, не имеющей письменно закрепленных норм языкового употребления (ср. отсутствие таких привычных для литературной лексикографии параметров, как, например, «орфографический», «орфоэпический», «нормативный»), и с учетом функциональной специфики регионального словаря, который, с одной стороны, призван отразить особенности лексико-семантической системы диалекта и языкового сознания его носителей, а с другой — служить словарем-справочником для носителей литературного языка. Большинство перечисленных выше параметров (в указанном или ином терминологическом обозначении) хорошо известны в лексикографической практике и в том или ином наборе активно используются при подготовке диалектных словарей разных типов.

2.2. Структура словарной статьи. Основные особенности МАДС (Л) заключаются в структуре его словарной статьи, которая построена с учетом необходимости отражения в словаре следующих лексикографических параметров:

1. Акцентного 13. Картинного (рисунок или вербальное описание)

2. Фонетического 14. Иллюстративного

3. Словоизменительного 15. Статистического

4. Частеречного 16. Этнокультурно-исторического

5. Собственно грамматического (распадающегося для каждой части речи на свои ряды, отражающие определенные грамматические характеристики слова: род, число, вид и т. п.) 17. Этимологического 18. Хронологического (время фиксации слова) 19. Библиографического (адрес записи)

6. Морфемного 7. Вариантного 8. Омонимического 20. Лексикографического (указания на другие словари, в которых зафиксировано слово)

9. Многозначности / однозначности 21. Г еографического (сведения о населенном пункте)

10. Дефиниционного (толкование денотативной части значения) 22. Ареального (сведения о принадлежности слова к одному из трех пластов диалектной лексики: - общенародному; - диалектно-просторечному; - собственно диалектному)

11. Эмоционально-оценочного 23. Глубинно-семантического (сведения о конструктной семантике слова)

12. Собственно языкового, включающего следующие подвиды: — парадигматический (сведения о синонимах, антонимах, гиперонимах, ЛСП, семантическом поле, словообразовательной парадигме); — синтагматический (сведения о лексической, грамматической и фразеологической сочетаемости слова); — стилистический (сведения о функционально-, темпорально-, социально-, квантитативно- и экспрессивностилистических характеристиках диалектного слова)

Следует отметить, что приведенный список лексикографических параметров слова для МАДС (Л) не является закрытым. Как справедливо отмечается в научной литературе, количество лексикографи-руемых параметров трудно исчислить (см., например, [5]). Их число в каждом случае определяется не только целевой установкой словаря и его адресатом, но и степенью изученности структурных черт словарного состава того или иного языкового образования. Очевидно, что более глубокое проникновение в устройство диалектной языковой системы может привести к выявлению новых типов лексикографической информации.

Нельзя не учитывать также возможностей более подробной детализации тех или иных параметров, которая может значительно увеличить их общий список. Ср., например, встречающиеся в различных словарях случаи детализации таких параметров, как «собственно грамматический», «семантический», «этимологический», «тематический», «глубинно-семантический» (последний, кстати, ни в одном из известных диалектных словарей не получает комплексного отражения, а предстает или как «семантическая структура слова в диалектной макросистеме» — в сводных диалектных словарях, или как «семантическая структура общенародного слова в системе национального русского языка» — в академических толковых словарях русского языка).

В существующих диалектных словарях указанные для МАДС (Л) лексикографические параметры встречаются в различных сочетаниях. Для традиционных «книжных» словарей, составляемых, прежде всего, с целью объяснения смыслового наполнения диалектного слова, обычным является следующий набор лексикографических параметров: «акцентный», «фонетический», «частеречный», «собственно грамматический», «семантический», «стилистический», «синтагматический», «фразеологический», «эмоционально-оценочный», «омонимический», «иллюстративный», «географический».

К названным параметрам в некоторых случаях добавляются «вариантный», «синонимический», «этимологический», «хронологический», «национально-культурный». Вместе с тем, как уже отмечалось, лексикографическая информация о структурно-языковых особенностях лексем в традиционных толковых диалектных словарях получает очень слабое отражение. Включаемые в такие словари сведения об омонимах, вариантах и синонимах оказываются весьма фрагментарными и непоследовательными.

В создаваемых в последнее время диалектных разноаспектных словарях, в том числе «машинных», удельный вес «структурной» информации значительно повышается. Это происходит, с одной стороны, за счет выдвижения соответствующих параметров на первый план в словаре и использования сразу нескольких структурных параметров, например, вариантного, синонимического,

омонимического и тематического (в виде сведений о лексико-семантической парадигме) — в «системном диалектном словаре» (ССД); вариантного, омонимического, мотивационного (включающего сведения о словообразовательных и некоторых парадигматических связях слова в системе), частотного — в мотивационном словаре (МДС).

С другой стороны, увеличение удельного веса «структурных» типов лексикографической информации в создаваемых диалектных словарях происходит за счет сокращения общего количества параметров. Причем такое сокращение может быть очень значительным.

Задача сочетания в одном диалектном словаре «содержательных» и «структурных» лексикографических параметров в их многообразии остается для отечественной лексикографии нерешенной. Насколько нам известно, подобная ситуация характерна и для зарубежной диалектной лексикографии, в которой даже наиболее полные, с точки зрения отражаемой лексикографической информации, диалектные словари, машинные базы данных и машинные архивы диалектных текстов не включают толкования значений. Указанная задача является одной из центральных для рассматриваемого МАДС (Л).

Г лавные особенности МАДС (Л) заключаются в структуре его словарной статьи, которая подразделяется на большое количество элементов, или зон. В основу построения формата словарной статьи положены идеи о системном характере значения слова, зонном принципе организации лексикографической информации и о возможности представления синтаксической модели текста статьи на основе выделения его непосредственно составляющих. Формальная грамматика МАДС (Л) строится в соответствии с принципами, предложенными Л. И. Колодяжной (1987), и представляет собой усовершенствованную версию формальной грамматики АСРГК (см.: [7]).

Структура словарной статьи в формальной грамматике МАДС (Л) предстает в виде иерархических бинарных деревьев, строящихся из составных и элементарных компонент. Составные компоненты образуются из элементарных таким образом, что каждая компонента данного уровня состоит из двух соседних компонент более низкого уровня.

Список элементарных компонент МАДС (Л), определенных с учетом соответствия перечисленным выше основным лексикографическим параметрам диалектного слова, представляет собой следующий набор:

- собственно заглавное слово — № 1;

- номер омонима — № 2;

- часть речи — № 3;

- собственно грамматические характеристики — № 4;

- номер словозначения — № 5;

- словоформы, в которых реализуется слово — № 6;

- морфологическое членение — № 7;

- эмоционально-оценочные характеристики (пейоративные и мелиоративные) — № 8;

- функционально-стилистические характеристики («обиходно-разговорное», «специальное», «официально-культурное», «народно-поэтическое») — № 9;

- ситуативно-стилистические характеристики («грубое» — «бранное» — «уважительное» — «ситуативно-стилистически нейтральное») — № 10;

- темпорально-стилистические характеристики («старое» — «новое» — «темпорально нейтральное») — № 11;

- социально-стилистические характеристики («свойственное речи старшего поколения» — «свойственное речи младшего поколения» — «детское» — «свойственное речи женщин» — «социально-стилистически нейтральное») — № 12;

- квантитативно-стилистические характеристики («малоупотребительное» — «широкоупотребительное») — № 13;

- экспрессивно-стилистические характеристики («экспрессивное» — «экспрессивно-нейтральное») — № 14;

- дефиниция (толкование денотативной части значения) — № 15;

- указание на реалию — № 16;

- вид ссылки для дефиниции — № 17;

- адрес ссылки — № 18;

- иллюстрация — № 19;

- район сбора иллюстративного материала —

№ 20;

- населенный пункт сбора материала —

№ 21;

- год фиксации материала — № 22;

- номер экспедиционного источника — № 23;

- формальные варианты — № 24;

- абсолютная частотность употребления —

№ 25;

- относительная частотность употребления —

№ 26;

- синонимы — № 27

- антонимы — № 28;

- гипонимы — № 29;

- согипонимы — № 30;

- гипероним — № 31;

- ближайшая ЛСП — № 32;

- семантическое поле — № 33;

- лексический мотиватор (для производных слов) — № 34;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- лексическая сочетаемость — № 35;

- грамматическая сочетаемость — № 36;

- фразеологическая сочетаемость — № 37;

- описательно-образная характеристика —

№ 38;

- этимологические сведения — № 39;

- дополнительные этнокультурные сведения — № 40;

- сведения о словарях, в которые включено слово (ЛСВ) — № 41;

- принадлежность слова (ЛСВ) к общенародной, диалектно-просторечной или собственно диалектной лексике — № 42;

- сведения о семантике слова в конструкт-ной макросистеме (о конструктной семантике слова) — № 43;

- служебная информация (сведения о составителях словарной статьи, времени ее подготовки и т. п.) — № 44.

Как видно из приведенного материала, большинство элементарных компонент МАДС (Л) совпадают с перечисленными выше лексикографическими параметрами, необходимыми для всесторонней характеристики слова в диалектном словаре универсального типа. Вместе с тем некоторые лексикографические параметры не имеют очевидных соответствий в списке элементарных компонент МАДС (Л) или могут быть соотнесены сразу с несколькими из них. Отмеченные расхождения объясняются тем, что лексикографические параметры допускают фиксацию в разных формах, в том числе в аналитической и синкретической.

Аналитическое (раздельное) представление в МАДС (Л) некоторых лексикографических параметров объясняется, прежде всего, спецификой самого словаря, который, с одной стороны, должен отразить своеобразие лексико-семантической системы территориального диалекта, а с другой — предназначен для носителей литературного языка, обладающих иным, отличным от диалектного, языковым сознанием. Так, именно несовпадением лексико-семантических систем и языковых представлений носителей литературного языка и диа-лектоносителей объясняется «раздельная» подача в МАДС (Л) лексикографического параметра «дефиниция» и включение в грамматику словарной статьи (и, соответственно, в ее структуру на выходе) таких отдельных составляющих, как «толкование денотативной части значения» и «указание на реалию».

Как было показано в предыдущей главе, описание (толкование) денотативной части семантики диалектного слова может не совпадать с описанием самой реалии, с точки зрения носителей литературного языка, а совокупность дифференциальных признаков, входящих в смысловую часть значения диалектной лексемы, может отличаться от совокупности признаков, составляющих данное понятие в сознании носителей литературного языка.

Необходимость введения в словарные статьи МАДС (Л) информации о реалиях, кажущейся в подобных случаях избыточной, определяется двумя причинами. Во-первых, названная информация позволяет выявить отдельные существенные несовпадения в составе смыслового компонента значения на первый взгляд семантически тождественных лексем в диалекте и литературном языке. Во-

вторых, заполненность элементарной компоненты «отнесенность к реалии» может служить основой для получения из МАДС (Л) принципиально нового для диалектной лексикографии литературнодиалектного словаря, включающего литературные слова и диалектные эквиваленты к ним. Подобный словарь «не только дал бы возможность сопоставлять лексический запас говора и литературного языка, устанавливать их сходства и различия в структурно-семантическом плане, но и позволил бы решать другие, более общие, проблемы, например, вопрос о понятийной соотнесенности говора и литературного языка, который в русском языкознании еще не ставился и не обсуждался» [13, с. 226].

Как следует из изложенного, принятое в МАДС (Л) разграничение элементарных компонент «толкование смысловой части значения» и «указание на реалию» отличается от известного в лексикографии, в том числе диалектной, разграничения «филологического» и «энциклопедического» видов лексикографической информации, основывающегося на идее разделения бытовых (наивных) и научных понятий для одной лексической единицы определенной языковой системы.

Представляется, что разграничение в МАДС (Л) указанных элементарных компонент в определенной мере даже снимает для данного словаря традиционную проблему выбора между «филологическим» и «энциклопедическим» определениями значения (т. е. его смысловой части) или, по крайней мере, ставит эту проблему несколько иначе. В МАДС (Л) применение указанных определений основывается не на особенностях каких-то групп слов, а на характере определяемого явления: то ли это смысловая часть значения слова (тогда определение всегда оказывается «филологическим»), то ли это реалия (тогда используется «энциклопедическое» определение: или в развернутом виде, или через ссылку на соответствующее литературное слово).

Типологическими и функциональными особенностями МАДС (Л) объясняется также аналитическая форма представления в нем лексикографического параметра «картинный», содержанием которого является информация о чувственноконкретном образе предмета.

Названный параметр может передаваться в отдельной элементарной компоненте «описательнообразная характеристика», а также содержаться в компоненте «иллюстрация» или даже в толковании смысловой части значения. Включение в МАДС (Л) информации, соответствующей указанному параметру, оказывается важным не только при семанти-зации этнографической лексики (на что обычно указывается в научной литературе по диалектной лексикографии), но и при лексикографической характеристике целого ряда общерусских слов или их вариантов, имеющих в говоре специфические чувственно-образные компоненты значения, связанные с особенностями и условиями быта, материальной культуры диалектоносителей.

Аналитическим по способу представления является в МАДС (Л) и национально-культурный лексикографический параметр, включающий информацию этнокультурного, культурно-исторического и лингвострановедческого характера. Как было показано в настоящем исследовании, региональнокультурное своеобразие может наблюдаться в любой части семантики диалектного слова. Соответственно регионально-культурная информация может включаться в самые разные «содержательные» элементарные компоненты словарной статьи: «толкование денотативной части значения»; «эмоциональнооценочные характеристики»; «функциональностилистические характеристики»; «синонимы»; «семантическое поле» и т. п.

Однако, несмотря на весьма широкие возможности представления рассматриваемого лексикографического параметра в разных структурных составляющих словарной статьи, в МАДС (Л) выделяется и специальная элементарная компонента — «дополнительные этнокультурные сведения», в которую помещается та национальнокультурная информация, которая по своему содержанию не может полностью войти ни в одну из элементарных компонент.

Помимо рассмотренного выше аналитического способа отражения лексикографических параметров в словарной статье МАДС (Л) встречается и противоположный способ — синкретический, когда разные виды лексикографической информации задаются в одной элементарной компоненте.

Так, акцентная информация дается в МАДС (Л) совместно с заглавным словом и в иллюстрациях, фонетическая совмещается с иллюстративной. Нередко используется совмещение понятийной информации с регионально-культурной, а последней — с образно-картинной и эмоционально-оценочной. Одной из наиболее «синкретических» оказывается в МАДС (Л) элементарная компонента «иллюстрация».

Следует отметить, что синкретический способ выражения лексикографических параметров соответствует принятой практике составления словарей, т. к. позволяет избавиться от дублирования сведений в тех случаях, где это не противоречит общей структуре лексикографической работы.

В целом заполнение всех элементарных компонент, связанных с отражением плана содержания диалектного слова, осуществляется в МАДС (Л) с учетом своеобразия этого содержания, особенностей отдельных составляющих семантики диалектной лексемы. При этом учитываются не только специфика понятийного членения мира в говоре, своеобразие образов-представлений, связанных с определенными лексемами, системные связи последних, но и особенности эмоциональнооценочных и стилистических характеристик словесных единиц (и всех разновидностей названных характеристик).

Формальная грамматика МАДС (Л) построена с учетом факультативности элементов словарной статьи. Принцип факультативности распространяется на все элементарные компоненты, кроме таких, как «заглавное слово», «район сбора иллюстративного материала», «населенный пункт сбора материала», «год фиксации», «номер экспедиционного источника», «частотность употребления».

Незаполненность некоторых элементарных и составных компонент словарной статьи МАДС (Л) может определяться несколькими причинами:

- временным отсутствием информации, которая в дальнейшем может быть получена или в результате расширения текстовой базы данных (например, информация о стилистических характеристиках слова, фразеологизмах, дополнительных этнокультурных сведениях, некоторых парадигматических связях слова и т. п.), или в результате проведения специальных лингвистических исследований (например, информация об этимологии слова, о семантической структуре слова в макросистеме);

- неактуальностью некоторых типов лексикографической информации для данной словарной статьи (например, информации о реалии или об описательно-образных характеристиках для слов, не обладающих в данном отношении своеобразием по сравнению с соответствующими лексемами литературного языка);

- принципиальным отсутствием для некоторых словесных единиц, входящих в МАДС (Л), отдельных видов лексикографических параметров (в силу, например, отсутствия у слова омонимов, синонимов, фразеологической сочетаемости, отсутствия данного слова в словарях литературного языка или диалектных и т. п.).

Ср. фрагмент словарной статьи МАДС (Л) (цифрами обозначены номера информационных зон, соответствующих элементарным компонентам словарной статьи):

ДЫШКУЛЬ. № 1 Дышкуль. № 2 -. № 3 Сущ. № 4 Муж. р. № 5 -. № 6 Дышкуль, дышкули.

№ 7 Дыш-куль. № 8 Презр. № 9 Обих. — разг. № 10 Нейтр. № 11 Нейтр. № 12 Нейтр. № 13 Широкоупотр. № 14 Экспр. № 15 Ленивый человек. № 16 -. № 17 -. № 18 -. № 19 Мужик-от дыш-куль, неработь. — Дышкуль не робит ничо <... >. № 20 Прилузский. № 21 Лойма. <... >. № 27Варига, вишенье, лентяк, лентяй, легостай, неработь. № 28Гужбан. <... > № 37 -. № 38 -. № 39 От коми дыш «ленивый» и куль «черт»: КРС, с.217, 334;

дышкуль, разг. «ленивый черт». № 40 -.

№ 41АСРГКА. № 42 Собственно диалектное.

№ 43 -. № 44. Загоровская, 1989.

Ограниченность объема работы не позволяет привести более полные примеры словарных статей МАДС (Л), которые могли бы достаточно наглядно продемонстрировать возможности описываемого словаря в семантизации диалектных словесных единиц. Указанные возможности определяются самим набором входящих в словарную статью содержательных элементарных компонент, которые соответствуют основным структурным составляющим значения диалектного словесного знака (см. табл.).

Как видно из приведенного материала, структура словарной статьи МАДС (Л) предполагает отражение не только реальной, но и конструкт-ной семантики слова с точки зрения диалектной (для собственно диалектных слов) или общенациональной (для общенародных и диалектнопросторечных слов) макросистемы. Особенности отражения конструктной семантики словесного знака в диалектном компьютерном словаре представляют собой самостоятельную проблему, которая книге не рассматривается. Ограничимся лишь замечанием о том, что наличие соответствующего параметра делает МАДС (Л) лексикографическим произведением такого типа, в котором оказывается возможным совмещение полного словаря одного говора со сводным словарем, что еще несколько десятилетий назад казалось для диалектной лексикографии совершенно нереальным.

Как уже было отмечено, работа по формированию словарных статей МАДС (Л) ведется как в автоматическом, так и в интерактивном режимах. В автоматическом режиме с использованием специальных программ осуществляется заполнение тех элементарных компонент словарной статьи, которые соответствуют компилятивным, т. е. требующим простой сортировки материала, лексикографическим параметрам (о видах лексикографических параметров см.: [5, с. 114—147]): «номер омонима» (по показателям частотности); «формальные варианты» (по тождеству содержательных компонентов); «словоформы»; «номер» ЛСВ (изо всех известных принципов расположения значений слов в МАДС (Л) используется один — частотный); «иллюстрация»; «район сбора материала»; «населенный пункт»; «номер экспедиционного источника» и некоторые др.

Таблица

Семантика диалектной словесной единицы и ее составляющие Элементарные компоненты словарной статьи МАДС (Л), отражающие соответствующую часть семантики диалектного слова

Основные Вспомогательные

I. РЕАЛЬНАЯ СЕМАНТИКА

Денотативный компонент значения Дефиниция (толкование понятийной части значения) Иллюстрация Дополнительные этнокультурные сведения

Окончание табл.

Семантика диалектной словесной единицы и ее составляющие Элементарные компоненты словарной статьи МАДС (Л), отражающие соответствующую часть семантики диалектного слова

Основные Вспомогательные

Эмотивный компонент значения Эмоционально-оценочные характеристики Иллюстрация

Собственно языковой компонент значения: - парадигматический микрокомпонент Синонимы Антонимы Г ипероним Ближайшая ЛСП Семантическое поле Лексический мотиватор Иллюстрация Дополнительные этнокультурные сведения

- синтагматический микрокомпонент Лексическая сочетаемость Г рамматическая сочетаемость Фразеологическая сочетаемость Иллюстрация Семантическое поле

- стилистический микрокомпонент Функционально-стилистические характеристики: - ситуативно-стилистические - темпорально-стилистические - социально-стилистические - квантитативно-стилистические - экспрессивно-стилистические Иллюстрация

Эмпирический компонент значения Описательно-образная характеристика Иллюстрация Указание на реалию

II. КОНСТРУКТНАЯ СЕМАНТИКА

Принадлежность слова к собственно диалектной, диалектно-просторечной или общенародной лексике Сведения о конструктной семантике слова Сведения о словарях, в которые включено слово

Заполнение же компонент, соответствующих «аналитическим» и «конструктивным» параметрам, выполняется на данном этапе работы в интерактивном режиме, что объясняется спецификой содержания подобных компонент, которое или предполагает обращение к внеязыковой действительности (например, «толкование смысловой части значения», «указание на реалию», «стилистические характеристики»), или требует сложного анализа диалектного материала («грамматические характеристики», «лексический мотиватор»).

Вместе с тем, следует подчеркнуть, что во многих случаях заполнение подобных компонент осуществляется на основе подготовленных компьютером данных, т. е. оказывается частично (а иногда и весьма значительно) автоматизированным. Например, частично автоматизировано в МАДС (Л) формирование структурно-языкового параметра, в том числе таких его подвидов, как «семантическое поле», «ближайшая ЛСП», «синонимы», «антонимы». Названные компоненты формируются лексикографом путем корректировки подготовленных компьютером с использованием метода ДСА списков лексем. На основе подготовленных ЭВМ данных заполняется в интерактивном режиме элементарная компонента «дефиниция».

Формирование лексикографического параметра «конструктная семантика» осуществляется в пакетном режиме с использованием подготовленных компьютером данных машинных версий СРНГ и СРГКА, а также МАС (с привлечением в дальнейшем данных БАС и опубликованных диалектных словарей).

Заполнение элементарных компонент МАДС (Л) как в автоматическом, так и в интерактивном режимах осуществляется на основе рассмотренных выше принципов семантической эквивалентности «черного слова» и его описания (с включением в семантическую часть словарной статьи всей значимой информации о диалектном слове), системности (предполагающей раскрытие семантики слова с учетом его парадигматических отношений), а также принципа отражения реального языкового сознания диалектоносителей.

Безусловно, большой объем работы по подготовке словарных статей, проводимой в интерактивном режиме, усложняет подготовку МАДС (Л). Однако следует помнить, что лингвист, субъект-исследователь, всегда был и остается центральной фигурой в лексикографии, без которой создание словарей, направленных на всестороннее отражение диалектного слова в языковой системе (а не

только на передачу его структурогенных параметров), в принципе невозможно.

Отмеченный факт объясняется в первую очередь тем, что данные гуманитарных наук обладают трудно формализуемой семантикой и требуют преимущественного использования диалоговых средств взаимодействия с ПК.

Рассмотренные выше особенности МАДС (Л) определяют его основные функции и возможности:

- работу со словарем в режиме диалога;

- оперативный поиск информации, в том числе на основе получения проекций словаря по заданному списку элементов словарной статьи;

- пополнение и редактирование словарных статей на любом этапе работы;

- формирование новых словарных статей на основе расширения текстовой базы;

- проведение исследовательских работ по изучению свойств конструируемой модели диалектной системы и особенностей отражения в ней специфической языковой картины мира.

В силу того, что лексикографическая информация из МАДС (Л) может быть получена от многих входов в словарь и в виде его различных проекций, сложность структуры словарной статьи рассматриваемого словаря не является препятствием для восприятия лексикографической информации пользователем (что было бы характерно для

«универсального» словаря, создаваемого в книжной форме). Результаты работы с МАДС (Л) еще раз подтверждают приведенное выше положение о том, что именно машинный словарь, практически не имеющий предела ни в степени сложности словарной статьи, ни в количестве входов в словарь, является единственной возможной формой реализации «универсального» диалектного словаря, включающего достаточно полные сведения о плане содержания диалектного слова и его своеобразии.

Выводы

1. На основе многолетних теоретических и полевых исследований впервые разработана структура комплексного автоматизированного словаря наименований человека в воронежских говорах, разработана структура его словарной статьи, определены ее компоненты.

2. Проектируемый словарь будет являться первым опытом многоаспектного автоматизированного тематического словаря в отечественной диалектной лексикографии. Его ценность будет заключаться, как представляется, не только в вводе в научный оборот массива диалекной лексики понятийной зоны «Человек», но и в том, что с его помощью могут быть уточнены некоторые положения диалектной лексикологии, семасиологии, лекскиографии.

Библиографический список

1. Алексеенко, М. А. Человек в русской диалектной фразеологии: словарь / М. А. Алексеенко,

Т. П. Белоусова, О. И. Литвинникова. — М.: ИТИ Технологии, 2004. — 238 с.

2. Алексеенко, М. Человек в производных именах русской народной речи / М. Алексеенко, О. Литвинникова. — М.: Элпис, 2007. — 520 с.

3. Андрющенко В. М. Автоматизированная лексикографическая система ЦЖЬЕХ (основные проектные решения) / В. М. Андрющенко // Вычислительная лингвистика. Теоретические аспекты. Вопросы автоматизации лексикографических работ. — М., 1982. — С. 104—120.

4. Загоровская, О. В. Проблемы общей и диалектной семасиологии и лексикографии / О. В. Загоровская. — Воронеж: Научная книга, 2011. — 383 с.

5. Караулов Ю. Н. Лингвистическое конструирование и тезаурус литературного языка / Ю. Н. Караулов. — М.: Наука, 1981. — 368 с.

6. Колодяжная Л. И. Проблемы формализации представления данных в автоматическом словаре поэтических образов / Л. И. Колодяжная, Н. В. Павлович // Вторая всесоюзная конференция по созданию Машинного фонда русского языка: тез. докл. — М., 1987. — С. 86—88.

7. Лесников С. В. Формальная грамматика словарной статьи Автоматического словаря русских говоров Коми АССР и сопредельных областей / С. В. Лесников, О. В. Загоровская // Вторая всесоюзная конференция по созданию Машинного фонда русского языка: материалы. — М., 1988. — С. 107—119.

References

1. Alekseenko, M. A. Chelovek v russkojj dialektnojj frazeologii: slovar' / M. A. Alekseenko, T. P. Belousova, O. I. Litvinnikova. — M.: ITI Tekhnologii, 2004. — 238 s.

2. Alekseenko, M. Chelovek v proizvodnykh imenakh russkojj narodnojj rechi / M. Alekseenko, O. Litvinnikova. — M.: Ehlpis, 2007. — 520 s.

3. Andrjushhenko V. M. Avtomatizirovannaja

leksikograficheskaja sistema UNILEX (osnovnye proektnye reshenija) / V. M. Andrjushhenko // Vychislitel'naja

lingvistika. Teoreticheskie aspekty. Voprosy avtomatizacii leksikograficheskikh rabot. — M., 1982. — S. 104—120.

4. Zagorovskaja, O. V. Problemy obshhejj i

dialektnojj semasiologii i leksikografii / O. V. Zagorovskaja. — Voronezh: Nauchnaja kniga, 2011. — 383 s.

5. Karaulov Ju. N. Lingvisticheskoe konstrui-rovanie i tezaurus literaturnogo jazyka / Ju. N. Karaulov. — M.: Nauka, 1981. — 368 s.

6. Kolodjazhnaja L. I. Problemy formalizacii

predstavlenija dannykh v avtomaticheskom slovare

poehticheskikh obrazov / L. I. Kolodjazhnaja, N. V. Pavlovich // Vtoraja vsesojuznaja konferencija po sozdaniju Mashinnogo fonda russkogo jazyka: tez. dokl. — M., 1987. — S. 86—88.

7. Lesnikov S. V. Formal'naja grammatika slovarnojj stat'i Avtomaticheskogo slovarja russkikh govorov Komi ASSR i sopredel'nykh oblastejj / S. V. Lesnikov, O. V. Zagorovskaja // Vtoraja vsesojuznaja konferencija po sozdaniju Mashinnogo fonda russkogo jazyka: materialy. — M., 1988. — S. 107—119.

8. Литвинова, Т. А. Лексемы, характеризующие человека по отношению к труду, в воронежских говорах / Т. А. Литвинова // Вестник Челябинск. гос унта. Филология. Искусствоведение. — 2011. — Вып. 52. — С. 84—89.

9. Литвинова, Т. А. Лексемы, характеризующие человека по отношению к труду, в воронежских говорах / Т. А. Литвинова // Вестник Челябинск. гос. унта. Филология. Искусствоведение. — 2011. — Вып. 10.

— С. 73—76.

10. Литвинова, Т. А. Номинации человека как отражение языковой картины мира (на материале воронежских говоров): дис. ... канд. филол. наук / Литвинова Татьяна Александровна. — Воронеж, 2011. — 177 с.

11. Литвинова, Т. А. Особенности метафорических переходов в сфере номинаций лица в воронежских говорах / Т. А. Литвинова // Вестник Пятигорск. гос. лингвистич. ун-та. — 2011. — Вып. 1. — С. 81—84.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

12. Мошкович Ж. Г. Автоматизированная лексикографическая система УНИЛЕКС-2: учеб. пособие / Ж. Г. Мошкович. — М., 1989. — 107 с.

13. Пискунова, С. В. Словарь тамбовских говоров. Человек: анатомические названия, физические особенности, социальные и семейные отношения, духовная культура/ С. В. Пискунова, А. С. Щербак, И. В. Попови-чева; Тамбов. гос. ун-т им. Г. Р. Державина. — Тамбов: Изд-во Тамбов. гос. ун-та (ТГУ), 2006. — 268 с.

14. Сороколетов Ф. П. Очерки по русской диалектной лексикографии / Ф. П. Сороколетов, О. Д. Кузнецова. — Л.: Наука, 1987. — 231 с.

8. Litvinova, T. A. Leksemy, kharakterizujushhie cheloveka po otnosheniju k trudu, v voronezhskikh govorakh / T. A. Litvinova // Vestnik Cheljabinsk. gos. un-ta. Filologija. Iskusstvovedenie. — 2011. — Vyp. 52. — S. 84—89.

9. Litvinova, T. A. Leksemy, kharakterizujushhie cheloveka po otnosheniju k trudu, v voronezhskikh go-vorakh / T. A. Litvinova // Vestnik Cheljabinsk. gos. un-ta. Filologija. Iskusstvovedenie. — 2011. — Vyp. 10. —

S. 73—76.

10. Litvinova, T. A. Nominacii cheloveka kak otrazhenie jazykovojj kartiny mira (na materiale voronezhskikh govorov): dis. ... kand. filol. nauk / Litvinova Tat'jana Aleksandrovna. — Voronezh, 2011. — 177 s.

11. Litvinova, T. A. Osobennosti metaforicheskikh perekhodov v sfere nominacijj lica v voronezhskikh govorakh / T. A. Litvinova // Vestnik Pjatigorsk. gos. lingvistich. un-ta. — 2011. — Vyp. 1. — S. 81—84.

12. Moshkovich Zh. G. Avtomatizirovannaja leksikograficheskaja sistema UNILEKS-2: ucheb. posobie / Zh. G. Moshkovich. — M., 1989. — 107 s.

13. Piskunova, S. V. Slovar' tambovskikh govorov. Chelovek: anatomicheskie nazvanija, fizicheskie osobennosti, social'nye i semejjnye otnoshenija, dukhovnaja kul'tura/

S. V. Piskunova, A. S. Shherbak, I. V. Popovicheva; Tambov. gos. un-t im. G. R. Derzhavina. — Tambov: Izd-vo Tambov. gos. un-ta (TGU), 2006. — 268 s.

14. Sorokoletov F. P. Ocherki po russkojj dialektnojj leksikografii / F. P. Sorokoletov, O. D. Kuznecova. — L.: Nauka, 1987. — 231 s.

MULTIFACETED MACHINE-AIDED DIALECT VOCABULARY OF PUPIL CHARACTERISTICS IN VORONEZH DIALECTS AND ITS POSSIBILITIES IN REFLECTING DIALECT WORD SEMANTICS

^ А. Litvinova,

PhD in Philology, Scientific fellow,

Russian Language Regional Centre of Voronezh State Pedagogical University;

Russia, Voronezh, e-mail: centr_rus_yaz@mail.ru О. V. Zagorovskaya,

D. Sc. in Philology, Prof.,

head of Dept. of Russian Language, Modern Russian and Foreign Literature,

Voronezh State Pedagogical University;

Russia, Voronezh, e-mail: olzagor@yandex.ru

The aim of the paper is to present the structure of dialect vocabulary ofpupil characteristics in voronezh dialects as complex multifaceted machine-aided dialect vocabulary. Statement of such problem corresponds to the general direction of development of world lexicography. One of the tendencies of modern lexicography is the tendency to lexicography language parametrization and development of universal vocabulary which permit to broaden information about words, represent them with all their language and speech characteristics, reflect all the levels of language system Based on longitudinal theoretical and field research the structure of complex machine-aid vocabulary of pupil characteristics in Voronezh dialects and its components are developed for the first time. The vocabulary is the first example of multifaceted machine-aided dialect thematic vocabulary in Russian dialect lexicography.

Keywords: dialect vocabulary, image of pupil, lexical-semantic group, lexicography, thematic group, dialect lexicography, Voronezh dialects.

i Надоели баннеры? Вы всегда можете отключить рекламу.