Научная статья на тему 'О структуре семантического поля глаголов типа «Стараться»'

О структуре семантического поля глаголов типа «Стараться» Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
228
35
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Соловьев В. Д., Байрашева В. Р.

В статье изучается структура семантического поля глаголов типа «стараться» в русском языке. Сопоставляются различные методологии исследования: традиционная, корпусной анализ, психосемантические эксперименты, а также различные математические методы обработки данных. Получено уточнение описания синонимических рядов в этом поле.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On the structure of semantic field for the «try»-type verbs

In the paper structure of semantic field for the verbs like «to try» in Russian is investigated. Different methodologies are compared, including the traditional methodology, corpora analysis, psychosemantics experiments and diverse mathematical methods of data processing. A more precise description of synonymous sets in the field is obtained.

Текст научной работы на тему «О структуре семантического поля глаголов типа «Стараться»»

В.Д. Соловьев, В.Р. Байрашева О СТРУКТУРЕ СЕМАНТИЧЕСКОГО ПОЛЯ ГЛАГОЛОВ ТИПА «СТАРАТЬСЯ»1

В статье изучается структура семантического поля глаголов типа «стараться» в русском языке. Сопоставляются различные методологии исследования: традиционная, корпусной анализ, психосемантические эксперименты, а также различные математические методы обработки данных. Получено уточнение описания синонимических рядов в этом поле.

1. Введение

В данной статье изучается структура поля, содержащего следующие слова: норовить, порываться, пробовать, пыжиться, пытаться, силиться, стараться, (*) тужиться, тщиться.

Недавно она подверглась тщательному анализу в [Divjak, Gries 2005] с применением корпусных методов. Цель нашей работы: а) привести результаты дополнительного корпусного исследования с привлечением нескольких новых параметров, б) привести результаты психосемантического эксперимента - опроса информантов на предмет выделения синонимических рядов,

в) продемонстрировать возможности различным математических методов обработки результатов,

г) провести общее обсуждение некоторых методологических вопросов описания структуры семантических полей. Список слов в нашем исследовании выбран таким же, как и в работе [Divjak, Gries 2005], с тем, чтобы прямо сопоставить полученные результаты.

Одним из основных способов структурирования семантического поля является разбиение его на синонимические ряды. Такой подход представляется естественным в силу его теоретической разработанности (многочисленные статьи по синонимии и словари синонимов), а также в силу практической значимости. В частности, широко известный электронный лексической ресурс WordNet [WordNet 2007] в качестве элементарной единицы содержит именно Синсеты - синонимические ряды.

Приведем разбиение множества (*) на синонимические ряды из разных публикаций, отметив, что ни один из авторов не включает в рассмотрение слово тужиться.

[Апресян и др. 1997]. Синонимы: пробовать, пытаться, стараться и силиться, остальные слова из списка (*) трактуются как аналоги, их синонимические ряды не рассматриваются.

[ССРЯ 2001]. Два синонимических ряда: (1) пытаться, пробовать и (2) стараться, норовить, силиться, пытаться, тщиться, пыжиться.

1 Работа выполнена при финансовой поддержке РФФИ, грант № 07-06-00221-а.

[Чернова 1996]. Синонимы: норовить, пробовать, пытаться, силиться, стараться, тщиться. Остальные слова из (*) не рассматриваются.

[Александрова 2003]. Два синонимических ряда: (1) пытаться, пробовать, порываться и (2) стараться, силиться, норовить, тщиться, пыжиться.

Как видим, авторы словарей синонимов не имеют единого описания структуры этого поля, что указывает как на его объективную сложность, так и на недостаточное развитие методологии описания. К сожалению, даже сам список слов также варьируется у разных авторов, что не позволяет осуществить точное сравнение. Не совпадает и число синонимических рядов: из четырех словарей лишь в двух [ССРЯ 2001] и [Александрова 2003] выделяется по два синонимических ряда. Тем не менее, можно выявить ряд общих черт.

Прежде всего, слова пробовать, пытаться, а также стараться и силиться во всех словарях объявляются синонимами. Слова норовить, тщиться, пыжиться также включаются в один синонимический ряд во всех словарях, в которых они рассматриваются. Основные отличия в объединении этих групп следующие. Слова стараться, силиться Ю.Д. Апресян объединяет с пробовать, пытаться, а З.Е. Александрова и [ССРЯ 2001] - с норовить, тщиться, пыжиться (у С. В. Черновой вообще все вместе).

Значительное расхождение в мнениях лексикографов указывает на то, что интуиции исследователей не достаточно, чтобы принять точное решение о синонимии слов в сложных случаях. Требуется привлечь объективные методы анализа, основанные на больших объемах данных. Таковыми являются корпусной анализ и психосемантические эксперименты.

Кроме того, описание синонимических рядов является лишь первым шагом к полному описанию структуры семантического поля. Обычно словари синонимов не структурируют сами ряды (исключение - [Апресян и др. 1997]), а также не описывают структуры более высокого порядка -

объединения близких по смыслу синонимических рядов. Этот метод также не выявляет структуры типа «центр-периферия».

2. Корпусные методы

В [Divjak, Gries 2005] проведена важная работа по получению независимого от интуиции отдельных исследователей описания синонимии в этом семантическом поле. В этой работе выводы делаются на основе анализа 1585 предложений, содержащих изучаемые слова и взятых из Национального корпуса русского языка, Амстердамского корпуса и из Интернета. Каждое из предложений описывается по 87 параметрам. Затем применяется алгоритм иерархического агломеративного кластерного анализа [Kauffman, Rousseeuw 1990]. В результате получается следующая иерархическая структура (дендрограмма), описывающая близость слов в выбранном пространстве признаков.

Пробовать -

Пытаться Стараться

Тщиться

Пыжиться

Тужиться

Силиться

Порываться

Норовить

Рис. 1. Дендрограмма по [Divjak, Gries 2005]

Здесь четко выделяются следующие три группы: (1) пробовать, пытаться, стараться, (2) силиться, порываться, норовить, (3) пыжиться, тужиться, тщиться. Полученная классификация в целом хорошо согласуется с данными словарей синонимов, что, впрочем, и следовало ожидать. Основные отличия состоят в следующем. Пара стараться, силиться оказалась разорванной, а слово норовить объединяется не с тщиться, пыжиться, а с силиться, порываться.

87 параметров, учитываемых в [Divjak, Gries 2005], покрывают практически все основные морфологические и синтаксические свойства, легко вычленяемые из текста. Д. Дивяк стреми-

лась избежать использования семантических параметров, так как они обычно не выражаются на поверхностном уровне формальными средствами и их выделение требует привлечение интуиции исследователя.

Мы вводим 6 новых свойств, ориентированных на семантику. У рассматриваемых глаголов, как и у многих других действий, имеется причина и/или цель, которые могут быть явно указаны в предложении. Хотя эти параметры являются семантическими, они достаточно четко дифференцируются и их выделение не составляет труда. Вообще надо отметить, что задача, состоящая в разделении конструкций на два класса (дихотомия) по семантическим свойствам, задает значительно меньшую нагрузку на интуицию носителя языка, чем, скажем, задача, стоящая перед лингвистом-лексикографом - найти правильное толкование слова. Дихотомия в семантической области (в том числе задача определить, что выражено в предложении - причина или цель) сближается с задачей дихотомии в синтаксической сфере (определить, является ли предложение грамматически правильным или нет). Последняя же ставится информантам в полевых исследованиях типологов, и на основе полученных данных строятся описания малоисследованных языков. Мы считаем, что в данном случае влияние субъективной оценки сведено к минимуму. Далее причина и цель могут иметь разные формы выражения: придаточными предложениями, деепричастными оборотами, именной группой. Примеры (из Библиотеки Мошкова [Библиотека 2003]):

1. Причина, выраженная придаточным предложением. Он старался держать ее подальше от уха, потому что кто-то совсем недавно, должно быть, окунул ее в острый китайский соус. (Адамс Д. «Детективное агентство Дирка Джентли»).

2. Цель, выраженная именной группой. Вы старались на благо своей страны, а я - на благо своей. (Конан А. «Его прощальный поклон»).

Мы сочли целесообразным ввести 6 комбинированных признаков, учитывающих одновременно, что выражается и какими средствами: цель-деепричастие, цель-придаточное, цель-именная группа, причина-деепричастие, причина-придаточное, причина-именная группа. Такой подход дает больше информации, чем учет этих признаков порознь. Например, порываться и силиться имеют одинаковое соотношение частоты выражения причины и цели, а также почти одинаковое соотношение способов выражения. Однако распределение способов выражения по функциям у

них различно. Для выражения цели деепричастия чаще используются для слова порываться, а придаточное - для силиться. Для выражения причины придаточное используется чаще для порываться, а именная группа - для силиться. Разуме -ется, суммируя соответствующие числа, можно получить и данные по исходным параметрам цель, причина.

Для анализа использовались предложения из наиболее представительного корпуса совре-

Частоты

менного русского литературного языка - Библиотеки Мошкова, насчитывающего более 800 млн. слов. Для каждого слова из списка (*) были взяты по 500 предложений (т.е. в общей сложности рассмотрено 4500 предложений), первых, выдаваемых поисковой системой этого корпуса (обращения к корпусу производились летом 2006 г.). В табл. 1 приведены итоговые данные.

Таблица 1

Ц-Д Ц-П Ц-ИГ П-Д П-П П-ИГ Ц + П

НОРОВИТЬ 0 0,3 0,1 0,1 0,3 0,3 4

ПОРЫВАТЬСЯ 0,1 0,3 0,1 0,1 0,3 0,2 6

ПРОБОВАТЬ 0,3 0,1 0,1 0,1 0,2 0,1 2

ПЫТАТЬСЯ 0 0,8 0 0 0,1 0 2

СИЛИТЬСЯ 0 0,4 0,1 0,1 0,2 0,3 3

ТЩИТЬСЯ 0 0,8 0 0 0,2 0,1 2

СТАРАТЬСЯ 0 0,5 0,1 0,1 0,3 0,1 9

ПЫЖИТЬСЯ 0,3 0,1 0 0,1 0 0,5 20

ТУЖИТЬСЯ 0,5 0,4 0,1 0 0,1 0 12

В последней колонке указана частота выражения цели и причины в процентах от общего числа предложений. В остальных колонках указана частота соответствующего параметра в долях единицы. Учитывая относительно небольшое число примеров, вычисления проводились с точностью до 0,1 (заметим, что в связи с ошибками округления, сумма по строке может отличаться от 1.)

3. Математические методы анализа данных

Для анализа полученных данных уместно применить математические методы. Слова рассматриваются как точки в 6-мерном пространстве признаков. Сначала между всеми словами подсчитыва-ются расстояния, отражающие степень их близости. Расстояния вычисляются по метрике Manhattan (она же «городская», она же «расстояние Хемминга»), определяемой формулой £ i (|a - b | ), где i - признак, a , bi - значения признака i у слов a и b, | | -

операция вычисления абсолютной величины числа (например, |-5| = 5). Это одна из стандартных метрик, применяемых в подобного рода исследованиях. Впрочем, выбор конкретной метрики не оказывает существенного влияния на результат.

В табл. 2 приведены полученные значения таким образом, что в ячейке на пересечении столбца и строки указано расстояние между соответствующими словами. В матрице заполнения только верхний правый угол, так как она симметрична относительно диагонали: ясно, что расстояние между словами 81 и 82 равно расстоянию между словами 82 и 81. Диагональ заполнена прочерками, но можно и считать, что расстояние между словом и им самим равно 0. Малые значения расстояния в таблице 2 указывают на то, что соответствующие слова ведут себя похожим образом в аспекте выделенных признаков.

Расстояния между словами

Таблица 2

нор пор про пыт сил тщи стар пыж туж

НОРОВИТЬ - 0,2 0,8 1,1 0,2 1,0 0,4 1,1 1,2

ПОРЫВАТЬСЯ - 0,6 1,1 0,4 1,0 0,4 1,2 1,0

ПРОБОВАТЬ - 1,3 0,8 1,2 0,8 0,7 0,8

ПЫТАТЬСЯ - 0,9 0,1 0,7 1,6 1,1

СИЛИТЬСЯ - 0,8 0,4 1,1 1,0

ТЩИТЬСЯ - 0,6 1,7 1,2

СТАРАТЬСЯ - 1,5 1,0

ПЫЖИТЬСЯ - 1,3

ТУЖИТЬСЯ -

Далее применен один из стандартных алгоритмов кластеризации [Загоруйко 1999], последовательно объединяющий близкие объекты в кластеры. Он дает результат, показанный на рис. 2.

Кластеризация на основе учета выделенных параметров в целом отличается от кластеризации, полученной Д. Дивяк, и от всех разбиений на синонимические ряды в словарях синонимов. Хотя некоторые моменты и совпадают. Так, в точности, как и у Д. Дивяк, слова норовить и порываться одними из первых объединились в кластер, а на следующем шаге к ним присоединилось силиться. Основным отличием является то, что здесь не выделились три группы слов, получилась топологически более сложная структура.

Различия с результатами Д. Дивяк представляются естественными, поскольку рассматриваемые в нашем исследовании и у нее параметры характеризуют разные аспекты слов. Было бы интересно объединить все параметры вместе и построить интегральное описание. Таким образом, полученные результаты можно трактовать как дополнительные к результатам Д. Дивяк. Разумеется, ни результаты Д. Дивяк, ни наши не являются окончательным решением, а лишь материалом для дальнейшего анализа.

Норовить

Порываться

Силиться

Стараться

Пытаться Тщиться

Пыжиться

Пробовать -

Тужиться -

Рис. 2. Дендрограмма близости слов в пространстве параметров «цель-причина»

4. Психосемантические эксперименты

Другим естественным способом избежать субъективизма в семантических исследованиях является опрос значительного количества информантов и усреднение полученных данных. Нами

был проведен следующий психосемантический эксперимент (по методике [МШег 1971], ранее отработанной в серии исследований по семантике эмоций [Соловьев 2002; 2005]).

Информантам (36 студентов факультета вычислительной математики и кибернетики Казанского государственного университета) был дан наш список слов (расположенных в алфавитном порядке) и предложено разбить его на любое число групп близких по смыслу слов. Далее для каждой пары слов подсчитывалось, сколько человек отнесли эти два слова в одну группу. Результаты приведены в табл. 3. Как и выше, в силу симметричности матрицы, заполнена только верхняя половина.

Мы исходим из того, что чем ближе слова по смыслу, тем большее число информантов объединят их в один синонимический ряд. Даже без применения специальных средств математического анализа здесь легко обнаружить определенные закономерности. Некоторые пары и группы слов выделяются совершенно очевидным образом. Это {норовить, порываться}, {пробовать, пытаться}, {пыжиться, силиться, тужиться}. Соответствующие значения, характеризующие степень близости слов в этих группах, не менее 17, в то время как наибольшее из остальных - 10.

Вторая закономерность - числа в столбце для слова тщиться заметно меньше, чем для всех остальных слов. Это связано с тем, что слово тщиться в настоящее время выходит из употребления и многие информанты говорили, что просто не знают его, и оно не участвовало в их разбиении слов на группы. Все же можно отметить, что по приведенным в таблице данным оно ближе к словам из группы {пыжиться, силиться, тужиться}, чем к остальным.

Особое положение занимает слово стараться. Оно имеет значимые корреляции со всеми выделенными группами. 10 человек объединили его с силиться, 10 - с пытаться, 8 - с норовить. Это требует особого рассмотрения, которое мы отложим до следующего раздела.

Исключив пока слово стараться, посмотрим на имеющееся разбиение остальных слов: {норовить, порываться}, {пробовать пытаться}, {пыжиться, силиться, тужиться, тщиться}. Оно очень точно соответствует разбиению у Д. Дивяк. Это указывает на то, что основанные на большой статистике объективные методы - будь то опрос информантов или корпусной анализ -дают хорошо согласованные результаты. Единственное различие - силиться отнесено у нее к другой группе - к {норовить, порываться}.

Таблица 3

Данные первого психосемантического эксперимента

нор пор проб пыж пыт сил стар туж тщит

1 Норовить - 17 7 1 4 3 8 3 2

2 Порываться - 9 2 6 2 3 1 0

3 Пробовать - 0 23 2 5 1 0

4 Пыжиться - 2 20 4 25 7

5 Пытаться - 8 10 2 1

6 Силиться - 10 21 5

7 Стараться - 7 1

8 Тужиться - 5

9 Тщиться -

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Сопоставим найденное описание с данными словарей синонимов. Прежде всего, следует отметить, что и психосемантический эксперимент, и корпусной метод у Д. Дивяк дают разбиение этого поля на 3 группы, т.е. более детальную классификацию, чем любой из словарей синонимов. В словаре [Апресян и др. 1997] все рассматриваемые слова пробовать, пытаться, стараться и силиться объединяются в один синонимический ряд. При этом отмечается, что слова пробовать, пытаться наиболее близки друг другу. Это подтверждает и наш эксперимент - в один синонимический ряд их объединили 23 участника (больше только для пары пыжиться, тужиться). В [Апресян и др. 1997] также отмечается, что глагол силиться почти по всем признакам заметно отличается от остальных. Это соответствует тому, что в нашем эксперименте силиться отнесено к другому ряду - с пыжиться,

тужиться. Включение в [Апресян и др. 1997] силиться в один ряд с пробовать, пытаться можно связать с отсутствием в этом словаре иных слов из данного поля.

В [ССРЯ 2001] в отдельный ряд выделена бесспорная пара пытаться, пробовать и во второй - остальные рассматриваемые в этом словаре слова: стараться, норовить, силиться, пытаться, тщиться, пыжиться. Второй ряд представляется слишком неоднородным - его вполне можно развить минимум на два, что и выявилось в данном эксперименте.

Для проверки полученных данных был проведен 2-ой эксперимент с другой группой из 41 студента того же факультета (по общему впечатлению более продвинутых). Результаты приведены в табл. 4.

Таблица 4

Данные второго психосемантического эксперимента

нор пор проб пыж пыт сил стар туж тщит

1 Норовить - 24 8 1 7 3 6 1 3

2 Порываться - 6 5 6 10 7 3 5

3 Пробовать - 2 31 2 10 2 6

4 Пыжиться - 2 15 9 33 19

5 Пытаться - 5 12 2 7

6 Силиться - 19 18 9

7 Стараться - 6 7

8 Тужиться - 19

9 Тщиться -

Как и в первом эксперименте, немедленно выделяются пары {норовить, порываться}, {пробовать, пытаться}, {пыжиться, тужиться}. Глагол силиться близок к последней паре, но отстоит от нее несколько дальше, чем в первом эксперименте, приближаясь к {норовить, порываться}. Это хорошо соотносится с данными Д. Дивяк. Слово тщиться оказалось более известным этой группе информантов. Лишь немногие сказали, что не знают его значение. Оно сближается с {пыжиться, ту-

житься}. И вновь стараться занимает промежуточное положение, не сближаясь явно ни с одной группой. В целом, результаты обоих экспериментов хорошо коррелируют друг с другом.

5. Отношение гипо-гиперонимии и прототипичность

Наиболее интересными с точки зрения классических парадигм когнитивной лингвистики являются результаты психосемантического экспе-

римента в отношении слова стараться. Его равная удаленность от всех выделенных групп может быть объяснена тем, что оно является прототипи-ческим центром данной области.

Для обоснования этой точки зрения применим еще один метод математического анализа подобного рода данных. Кроме использовавшихся выше алгоритмов кластеризации, строящих древовидные дендрограммы, существуют и другие полезные алгоритмы. В числе основных средств анализа, дающих наглядное представление об изучаемом объекте, назовем ординацию - размещение точек многомерного пространства на плоскости с сохранением расстояний между объектами. В качестве примера приведем здесь результаты применения ординации к данным табл. 4, выполненной с помощью профессионального статистического пакета R [Development ... 2006]. Получаемый применением данного алгоритма объект можно назвать семантической картой. Цифры на рис. 3 соответствуют номерам слов в табл. 4.

2

6

1

7

4

8

5 3

9

Рис. 3. Семантическая карта поля глаголов типа стараться

Как видим, слово стараться - номер 7 занимает точно центр карты, наглядно подтверждая свою прототипичность. Отметим, что на дендро-граммах центр и периферия не различаются.

По всей видимости, отнесение стараться к одному из выделенных выше синонимических рядов неправомерно. Предлагается следующее объяснение этого явления.

Для подобных абстрактных семантических полей прототипический центр, возможно, является гиперонимом по отношению к остальным сло-

вам этой группы, т. е. лежит как бы в другой плоскости и потому вообще не должен рассматриваться вместе с ними при описании синонимических рядов. Будучи гиперонимом, стараться, естественно, имеет некую общую семантическую компоненту со всеми остальными словами, не сближаясь тесно ни с одним из них.

В предметных областях прототип и гипероним совершенно различные понятия. Но в абстрактных областях ситуация много сложнее. Традиционные словари синонимов не обращают должного внимания на отношения гиперонимии-гипониии. В то же время эти отношения являются ключевыми в тезаурусах.

Приведем сходный пример из английского языка. Поставим вопрос: в какой синонимический ряд входит слово sadness (обычно переводимое на русский язык как грусть, печаль)? Согласно словарю синонимов английского языка [Апресян и др. 1979], основанному на Webster's Dictionary of Synonyms [Webster's ... 1968], sadness синонимично с melancholy, depression, dejection, gloom, blues, dumps. При этом сам Ю.Д. Апресян пишет [Апресян и др. 1979]: «sadness имеет наиболее общее значение и вне контекста не дает представления ни о глубине чувства, ни о его характере, ни о причине», т.е. sadness явно занимает позицию прототипического центра этой группы.

С другой стороны, возьмем тезаурус WordNet. Он как раз основан на синонимических рядах, упорядоченных отношениями гипонимии-гиперонимии. В нем sadness трактуется именно как гипероним по отношению к конкретным проявлениям этого состояния, таким как melancholy, sorrow, grief и др. Единственным же синонимом sadness указывается unhappy.

Таким образом, при описании синонимических рядов нужно быть очень внимательным, стараясь учесть и отношения типа гипонимии-гиперонимии, особенно плохо описанные или вообще не описанные в абстрактных областях. Вышеуказанные примеры свидетельствуют о тесной связи гиперонимов с прототипами, что, впрочем, требует дальнейших исследований.

6. Метрические семантические карты

Представленная на рис. 3 семантическая карта имеет много общего с семантическими картами, используемыми в типологии [Anderson 1982]. В типологии на картах изображаются различные значения типологических категорий, причем так, что сходные значения располагаются близко друг к другу [Татевосов 2002]. Неодно-

кратно выражалось мнение, что на этих картах геометрическое расстояние должно отражать степень близости значений, однако в типологии это до сих пор не реализовано [Татевосов 2002].

Карта рис. 3 как раз обладает тем свойством, что расстояния на ней действительно отражают степень близости соответствующих объектов. Адекватное представление на карте расстояний гарантируется математическими методами и алгоритмами, реализованными в пакете Я. В этом смысле карты такого типа можно назвать метрическими семантическими.

Используем полученную информацию для более тщательного анализа структуры группы слов пробовать, пытаться, стараться и силиться, (**) объединенных в [Апресян и др. 1997] в один синонимический ряд и описания тех сем, которые ответственны за обнаруженное структурирование.

Ю.Д. Апресян определяет общее значение слов из ряда (**) как прилагать усилия, чтобы произвести определенное действие, причем субъект или говорящий не знает, приведет ли данное приложение усилий к нужному результату.

Согласно [Апресян и др. 1997], силиться более близок к пытаться и стараться, чем к пробовать. Общим для первых трех слов является указание на большое количество затрачиваемых усилий. В то же время силиться отличается от остальных слов из (**) по многим параметрам, и прежде всего, по тому, что почти всегда обозначает неэффективную попытку, в то время как пытаться и пробовать лишь допускают неудачу попытки, а стараться вообще предполагает достижение желаемого результата. Все необходимые языковые примеры могут быть найдены в [Апресян и др. 1997].

Таким образом, семы «большое количество затрачиваемых усилий» и «неэффективность попытки» по-разному структурируют множество (**). Визуализированные на рис. 3 данные психолингвистического эксперимента демонстрируют, что в сознании носителей языка силиться не может быть более близко к пытаться и стараться, чем к пробовать. Силиться в изучаемом семантическом поле предельно далеко и от пытаться, и от пробовать. Это можно интерпретировать таким образом, что разделяющая значения этих слов сема «неэффективность попытки» в сознании носителей языка более важна, чем сема «большое количество затрачиваемых усилий».

Заключение

В статье представлены результаты психосемантических экспериментов и корпусного анализа структуры семантического поля глаголов типа «стараться». Полученные данные обрабатывались различными математическими методами. Проведено сопоставление полученных результатов с недавними исследованиями Д. Дивяк и с описаниями в словарях синонимов.

Итоговое предлагаемое описание данного поля выглядит следующим образом. Стараться является прототипическим центром этого поля (гиперонимом?) по отношению к остальным словам. Бесспорными синонимами являются пары {норовить, порываться}, {пробовать, пытаться}, {пыжиться, тужиться}. Силиться наиболее близок к последнему ряду, но имеет и некую корреляцию со словами норовить, порываться. Тщиться также близок к ряду {пыжиться, тужиться}, но это слишком редкое слово и потому оно стоит несколько особняком.

Общий вывод состоит в том, что оба объективных метода исследований: и психосемантический эксперимент, и корпусной анализ - дают близкие результаты, не противоречащие полученным традиционными методами описаниям в словарях синонимов, а в некоторых аспектах их уточняющие. Оба метода дают более дифференцированную картину, выделяя три синонимических ряда, а не два или даже один, как во всех имеющихся словарях. Объективность методов состоит в их независимости от интуиции отдельного исследователя и возможности повторить в любой исследовательской группе описанные эксперименты и проверить результаты. Данные различных психосемантических экспериментов хорошо согласуются, т.е. обладают свойством устойчивости. Это указывает на то, что в них отражается некая когнитивная реальность, которая не может быть игнорирована в лингвистических исследованиях.

Психосемантический эксперимент позволил выявить четкую структуру вида «центр-периферия» (в центре слово стараться), что не позволяет сделать корпусной метод, по крайней мере, в тех формах, которые применялись в данной работе и исследовании Д. Дивяк. Требуется дальнейшее развитие корпусного метода в направлении фиксации связей типа гипонимии-гиперонимии. Психосемантический эксперимент также позволяет определить иерархию сем по степени их влияния на структуру семантического поля в соответствии с их психологической важностью.

Пакет статистического анализа Я может быть рекомендован для визуализации структуры семантических полей (с наглядным выделением центра и периферии) на основе статистической информации, полученной из психолингвистических экспериментов.

Список литературы

Александрова З. Е. Словарь синонимов русского языка. М.: Русский язык-Медиа, 2003.

Апресян Ю.Д. и др. Англо-русский синонимический словарь. М.: Русский язык, 1979.

Апресян Ю.Д. и др. Новый объяснительный словарь синонимов русского языка. Вып.1. М.: Языки русской культуры. 1997.

Библиотека Мошкова. http://aot.ru. 2003.

Загоруйко Н.Г. Прикладные методы анализа данных и знаний. Новосибирск: Изд. ИМ СО РАН, 1999.

ССРЯ - Словарь синонимов русского языка / Ред. А.П. Евгеньева. М.: Астрель, 2001.

Соловьев В.Д. Структура семантического поля эмоций в русском языке // Труды межд. семинара «Диалог'02». М.: Наука, 2002.

Соловьев В.Д. К методологии описания синонимии // Эмоции в языке и речи. М.: РГГУ. 2005.

Татевосов С.Г. Семантическое картирование: объяснительная теория или описательный

метод? // Труды казанской школы по компьютерной и когнитивной лингвистике. Казань: Отечество, 2002.

Чернова С.В. Модальные глаголы в современном русском языке. Семантическая модель 'замысел - осуществление замысла'. Киров: ВГПУ, 1996.

Anderson L.D. The perfect as a universal and as a language particular category // Hopper P. (ed.) Tense and aspect: between semantics and pragmatics. Amsterdam: John Benjamins, 1982.

Development Core Team. A language and environment for statistical computing. Foundation for Statistical Computing, Vienna, Austria. 2006. ISBN 3-900051-07-0, URL http://www.R-project.org.

Divjak D., Gries S. Ways of trying in Russian: clustering behavioral profiles. Corpus Linguistics and Linguistic Theory, 2005.

Kauffman L., Rousseeuw P. Finding Groups in Data. New York: John Wiley, 1990.

Miller G.A. Empirical methods of the study of semantics // Semantics. Cambridge: Cambridge Univ. Press, 1971.

Webster's new dictionary of synonyms. Springfield, 1968.

WordNet. http://wordnet.princeton.edu. 2007.

V.D. Solovyev, V.R. Bairasheva

ON THE STRUCTURE OF SEMANTIC FIELD FOR THE «TRY»-TYPE VERBS

In the paper structure of semantic field for the verbs like «to try» in Russian is investigated. Different methodologies are compared, including the traditional methodology, corpora analysis, psychosemantics experiments and diverse mathematical methods of data processing. A more precise description of synonymous sets in the field is obtained.

i Надоели баннеры? Вы всегда можете отключить рекламу.