Научная статья на тему 'Анализ лексико-семантического поля глаголов деятельности для тезауруса RussNet'

Анализ лексико-семантического поля глаголов деятельности для тезауруса RussNet Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
645
65
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Азарова И. В., Ушакова А. А.

В статье описывается структура лексико-семантического поля глаголов деятельности в компьютерном идеографическом словаре RussNet, который разрабатывается на кафедре математической лингвистики Санкт-Петербургского университета. Задается система параметров, характеризующих глагольные значения деятельности / занятия, и выделяются подгруппы в структуре поля глаголов деятельности. Приводятся краткие сведения о проектах WordNet и EuroWordNet, задавших основные принципы построения тезаурусов типа wordnet. На примере исследуемого поля описывается методика наполнения RussNet.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Analyzing the lexical-semantic field of the verbs of activity for the RussNet thesaurus

The article describes the structure of the lexical-semantic field containing verbs of activity as represented in the computerbased ideographic dictionary RussNet, which is currently being developed at the Department of Mathematical Linguistics, Saint Petersburg State University. A set of parameters is defined to account for verbal meanings of activity/occupation and a number of sub-groups are suggested which form the structure of the lexical-semantic field in question. An overview of WorldNet and EuroWorldNet is presented, as these projects outlined the basic concepts relevant for any worldnet-type thesaurus. RussNet word entry procedures for verbs of activity are described.

Текст научной работы на тему «Анализ лексико-семантического поля глаголов деятельности для тезауруса RussNet»

Сер. 9. 2007 Вып.1 4.2

ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА

И.В. Азарова, А.А.Ушакова

АНАЛИЗ ЛЕКСИКО-СЕМАНТИЧЕСКОГО ПОЛЯ ГЛАГОЛОВ ДЕЯТЕЛЬНОСТИ ДЛЯ ТЕЗАУРУСА RUSSNET

Данная статья посвящена описанию системной организации лексических значений в русском языке на семантическом уровне. Русский глагол, характеризующийся сложностью своей семантической структуры и, как следствие, являющийся трудным объектом для описания, за последние 20-30 лет не раз становился темой научных работ. Среди публикаций следует выделить работы группы «Русский глагол», организованной Э.В. Кузнецовой1, исследования Н.Ю. Шведовой2, P.M. Гайсиной3.

Одним из базовых методологических подходов к описанию лексики (и в частности глаголов) как внутренне организованной совокупности является метод анализа лексико-семантических полей. Формализованное описание таких полей, элементы которых существуют в тесной взаимосвязи и взаимоопределяют друг друга, может стать основой построения словарных систем, представляющих семантический уровень языка. Данное исследование посвящено описанию структурных взаимосвязей, существующих в лексико-семантическом поле глаголов деятельности в контексте построения компьютерного тезауруса RussNet4.

RussNet - это компьютерный идеографический тезаурус русского языка типа Word-Net, разрабатываемый на кафедре математической лингвистики Санкт-Петербургского государственного университета. Методология построения лексико-семантической базы данных WordNet была заложена группой ученых Принстонского университета (США), возглавляемой Дж. Миллером5. Установка на приоритетность принципов организации лексических единиц в сознании носителей языка вывела на первое место отношения, которые связывают вместе разрозненные элементы словаря, формируя некую структуру. Компьютерный идеографический словарь WordNet представляет собой сеть, базовыми элементами которой являются слова и синонимические ряды (синсеты), которые могут быть связаны друг с другом парадигматическими отношениями. База данных состоит из четырех разделов, соответствующих четырем частям речи - существительному, прилагательному, наречию и глаголу. Слова, связанные лексико-семантическими отношениями, обычно принадлежат к одной семантической области или семантическому полю. Единица такой области (слово или синсет) представляет собой лексикализованное понятие. Запрос к тезаурусу задается в виде слова (словоформы). Информация, выдаваемая в ответ на запрос, включает в себя указание на часть речи, к которой принадлежит данная единица и список всех синонимических рядов, в которые входит данное слово (что эквивалентно перечислению всех его значений). Для каждого синсета дается словарное определение значения слова с примерами употребления в данном значении и его парадигматические связи (антонимы, гипонимы, гиперонимы, тропонимы, меронимы, холонимы и т. д.).

Идеи, которыми руководствовались создатели WordNet, получили широкое развитие: в ходе реализации проекта Euro WordNet к 1999 г. были разработаны лексико-семантические базы данных для целого ряда европейских языков (французского, испанского, итальянского, немецкого, голландского, эстонского и чешского). В 1999 г. на кафедре математической

© И.В. Азарова, А.А.Ушакова, 2006

лингвистики СПбГУ была начата работа над созданием аналогичного лексикона для русского языка. Проект получил название ЛиввЫе!6. Цель проекта-построение компьютерного тезауруса, который, подобно \VordNet, должен охватывать базовую общеупотребительную лексику и не ограничиваться описанием отдельной терминологической области. Наполнение словаря ведется методом отбора и анализа лексико-семантических полей, в состав которых входят высокочастотные лексемы, которые предположительно формируют ядерную часть лексико-семантических полей. При этом используются данные контекстного анализа, различных толковых словарей и ассоциативного словаря.

Как правило, описанные лексико-семантические группы - глаголы говорения, бытийные глаголы, глаголы отношения, глаголы восприятия, глаголы созидания, глаголы положения в пространстве и некоторые другие - выделяются без особых проблем. Однако ряд глаголов традиционно вызывает значительные трудности в описании, так как, во-первых, смысловая разнородность не позволяет четко сформулировать объединяющее их значение, а во-вторых, выявление структуры получившегося семантического образования также представляет собой нетривиальную задачу. Одной из таких «проблемных» групп является группа глаголов, условно обозначенных нами как «глаголы деятельности».

Перед нами стояла задача создать структурное описание лексико-семантического поля (ЛСП) глаголов деятельности для компьютерного идеографического словаря КшзЫе!:. Для получения адекватного описания необходимо прежде всего определить, что вкладывается в счмо понятие «деятельность».

С точки зрения обобщенной глагольной семантики (действие-состояние-отношение) глаголы деятельности естественно относятся к действию. Интуитивно понятно, что деятельность и действие не являются синонимами, что их нужно разграничивать некоторым образом при построении классификации. Однако в существующих описаниях такое разграничение либо не проводится вообще, либо проводится, но без определения критерия разграничения и, зачастую, даже без констатации самого разграничения. Так, в «Толковом словаре русских глаголов» под редакцией Л.Г. Бабенко7 действие и деятельность представлены нерасчлененно, что проявляется как в названиях самих выделяемых ЛСГ, так и в их составе. Все глаголы разделяются на 3 группы: 1) действие и деятельность, 2) бытие/ состояние/качество, 3) отношение. Внутри первой группы выделяются, в частности, такие лексико-семантические подгруппы, как глаголы движения; глаголы перемещения объекта; глаголы физического воздействия на объект; глаголы созидательной деятельности; глаголы интеллектуальной деятельности; глаголы звучания и др.

Деятельность прежде всего подразумевает наличие некоей внутренней структуры: в отличие от действия - одноактного процесса - деятельность не может быть целостной, так как ее смысловое наполнение должно быть неоднородным, т. е. включающим в себя ряд действий. Какими средствами такой комплекс может быть выражен в языке? Во-первых, эта содержательная особенность находит отражение в значении. Например, глаголы учиться, работать, служить, заботиться о ком-либо подразумевают, что субъект-деятель выполняет целый ряд действий, которые в комплексе обозначаются указанным глаголом. Во-вторых, значение оказывает влияние на одну их важнейших характеристик глагола - его временную локализованность.

Обращение к теме реализации идеи времени в семантике глагола позволяет выделить группу глаголов, обладающих семантическим своеобразием, проистекающим в большой степени из особенностей их временной соотнесенности.

Е.В. Падучева выделяет группу глаголов, которые называет занятиями. Глаголы-занятия обладают следующими свойствами: 1) в них есть динамика (можно выделить

качественно разные фазы), 2) они предполагают наличие субъекта, контролирующего ситуацию, и 3) обладают свойством нетерминативности. Это глаголы imperfectiva tantum. Их временная специфика заключается в том, что они не обладают конкретной локализацией во времени. Как пишет Е.В. Падучева, «главное аспектуальное свойство занятий состоит в том, что они занимают сверхдолгий интервал, не целиком заполненный деятельностью или действиями субъекта, но при этом характеризуют субъект на всем протяжении этого интервала»8.

Глаголы, реализующие значение комплексной деятельности, являются глаголами несовершенного вида. Одно из основных их свойств - это абстрагированность от реального протекания во времени хотя бы в одном из своих значений. О.Н. Селиверстова выделяет группу глаголов на базе этого типа временной соотнесенности, называя такие глаголы предикатами класса9.

Ср.: работать (вообще) -работать (в данную минуту)

В первом случае имеет место абстрагированность от оси времени, во втором случае денотат предиката лежит на оси времени, т. е. данное «состояние» протекает или длится в реальной последовательности течения времени, в результате чего в каждый следующий момент времени имеет место следующая фаза его протекания или существования.

Класс понимается как обобщение, соотносимое с отдельными случаями, но абстрагированное от них: класс не может быть равен какому-либо одному из своих членов или множеству всех своих членов. Так как денотат предиката класса не лежит на оси времени, предикат является истинным для любой точки того отрезка времени, с которым он соотносится, но он не имеет места ни в одной из них. В результате, можно сказать Я курю в тот момент, когда не куришь сигарету, и это утверждение будет истинным. Таким образом, денотат предикатов этого типа соотносится с осью времени, но не лежит на ней непосредственно.

Предикаты класса подразделяются на предикаты со значением гетерогенного класса (класс как обобщение разнородных действий: царствовать, править, воспитывать, руководить, заведовать) и предикаты со значением гомогенного класса (класс, для которого можно выделить центральную, основную деятельность: питаться, курить [вообще], воровать).

0.Н. Селиверстова также предлагает несколько тестов для выявления предикатов этого типа:

1. Употребление в контексте с вообще-то: Вообще-то я не курю (подразумевается: «сейчас курю» истинно, а «вообще курю» ложно- выявляет это противопоставление).

2. Употребление в контексте с раньше: Раньше я курила (подразумевается: а сейчас бросила; «раньше» выявляет неопределенную временную соотнесенность).

3. Невозможность употребления в контексте Вчера в это время я..., а теперь... Например: * Вчера в это время я работала на заводе, а теперь...

Предикаты класса не могут противопоставляться предикатам со значением действия, протекающего в описываемый момент времени.

Эти тесты являются хорошей иллюстрацией к способности глагола иметь несколько значений, одно из которых по типу может относиться к предикатам класса, другое же -соотноситься с текущим моментом (и иметь видовую пару). У некоторых глаголов такая способность в принципе отсутствует. Таковы прежде всего глаголы, которые можно объединить в подгруппу глаголов руководящей деятельности: царствовать, руководить, править, заведовать. С точки зрения Е.В. Падучевой, эти глаголы являются занятиями. Однако понятие класса допускает, что для разных значений глагола степень абстрагированное™

от временной оси может быть разной, и тогда указанные тесты позволяют выделить значение занятия, присутствующее у данного глагола. Так нецелостная природа деятельности отражается и на значении глагола.

Таким образом, основание для включения глаголов в ЛСП деятельности - это возможность их употребления в контекстах деятельности, т. е. в контекстах, реализующих значение деятельности. На основании анализа мы сформулировали это значение - 'иметь что-либо предметом своих занятий, деятельности = в течение определенного периода времени выполнять ряд разнородных действий, подчиненных некой стратегической задаче (цель деятельности) или отобранных и упорядоченных согласно структуре деятельности, содержательно объединяющей указанные действия в одно целое'.

В связи с тем, что методика построения тезауруса WordNet, а вслед за ним тезауруса RussNet базируется на гипотезе о том, что ядра лексико-семантических групп оформляются вокруг частотных лексем, занимающих верхние уровни родовидовой иерархии, на первом этапе для контекстного анализа был отобран массив глаголов, реализующих сформулированное значение и находящихся в верхней части словника частотного словаря С.А. Шарова10. В их число вошли следующие глаголы: работать, заниматься, служить, учиться, воевать, бороться, защищать, возиться, охранять, торговать, беречь, заботиться, трудиться, воспитывать, ухаживать, растить, сражаться (глаголы расположены в порядке уменьшения частоты встречаемости согласно частотному словарю С.А. Шарова). Контекстный анализ проводился на исследовательском корпусе современных текстов «Бокренок»11 объемом около 21 млн словоупотреблений, включающем в себя тексты разных функциональных стилей.

Процедура анализа выглядела следующим образом12. Случайная выборка, извлеченная с помощью программы-менеджера корпуса текстов Бонито, размечалась в зависимости от употребления глагола в контексте и соотносилась с тем или иным словарным значением. Объем случайной выборки зависел от частоты встречаемости глагола в корпусе и для частотных глаголов колебался в пределах от 54 до 300 контекстов на глагол. Словарные определения формулировались на базе MAC - 2-го издания 4-томного словаря русского языка13. При этом имеющие место корректировки словарных определений связаны с тем, что тезаурус RussNet не предполагает выделения оттенков значения. В связи с этим последние либо объединялись с основным значением, либо выделялись в самостоятельное значение, если анализ валентностей давал на то основание. Так, например, первое значение глагола трудиться по MAC - 'заниматься каким-л. трудом, делом; работать', оттенок этого значения - 'работать над созданием, изготовлением чего-л., производить обработку чего-л.'. Этот оттенок был выделен в самостоятельное значение благодаря наличию контекстного маркера - обязательной валентности объекта: трудиться над чем-л.

По результатам анализа выборочной совокупности контекстов выделялись частотные значения глаголов, выражающие категорию деятельности, а также проводился дополнительный сплошной отбор контекстов, пока на каждое из частотных значений не приходилось по 100 контекстов (или менее, если общее число контекстов в корпусе для данного глагола было недостаточно велико). Кроме того, изменялась словарная нумерация значений: самому частотному значению присваивался первый номер, далее значения упорядочивались по убыванию частоты. Согласно результатам проведенных исследований 100 случайных контекстов, извлеченных из корпуса, дают такую же схему валентностей, что и 1000 контекстов; минимальное необходимое количество контекстов - 2514. В связи с этим, если количество контекстов, отнесенных к данному значению, составляло более 25, проводился количественный анализ - вычислялась частота встречаемости той или иной

валентности. В комментарии к значению глагола выявлялось семантическое наполнение, характерное прежде всего для валентностей субъекта и объекта. Для каждого из выделенных значений приводились примеры из корпуса текстов.

Как и следовало ожидать, большинство рассмотренных глаголов многозначны: для 17 частотных глаголов было выявлено более 50 значений, из которых 26 непосредственно реализуют значение деятельности в сформулированном смысле. Всего было проанализировано 74 значения глаголов деятельности, реализующихся в 2959 контекстах.

Наличие сформулированного значения деятельности позволяет выделить архилексему поля, которая, во-первых, должна быть высокочастотной и, во-вторых, в одном из своих значений в наиболее общем виде реализовывать значение деятельности. Этим условиям отвечает глагол заниматься в первом значении - 'иметь что-либо предметом своих занятий, деятельности'. Поскольку заниматься не конкретизирует вид деятельности, этот глагол находится на более высоком уровне родовидовой иерархии, чем другие частотные глаголы, такие, как работать, воевать, служить, торговать и т. д.

Кроме того, с целью выявить дополнительные аспекты возможной детализации значений своих гиперонимов, в рассматриваемый контекст были введены следующие 16 низкочастотных глаголов: батрачить, бездельничать, вкалывать, корпеть, обучать, огородничать, пестовать, плотничать, подвизаться, приторговывать, разбойничать, репетиторствовать, рыбачить, халтурить, хозяйствовать.

В результате анализа глагольных значений и их сочетаемости с лексическим окружением были выделены следующие параметры категории деятельности, в разной степени реализующиеся в значениях рассмотренных глаголов.

1) Абстрактная временная локализованность. Этот параметр подразумевает, что, по крайней мере, в одном из значений глагол может обозначать занятие субъекта, не соотносимое с конкретным промежутком времени, но характеризующее субъект на всем протяжении этого промежутка.

2) Квантованность. Под квантованностью понимается дискретное наполнение деятельности отдельными составляющими. При этом структура может быть двухуровневой, что подразумевает наличие обобщающего компонента, выраженного, собственно, в виде значения глагола деятельности, и обобщаемых компонентов (подразумевается набор действий, содержательно объединенных в одно целое). Например, деятельность, обозначаемая глаголом воспитывать в значении 'растить, давая образование, прививая какие-л. навыки, правила поведения и т. п.' подразумевает, что субъект обеспечивает жизненные потребности воспитуемого, его обучение, формирует в его сознании базовые установки и т. д.

3) Наличие контрагента. Субъект деятельности регулярно взаимодействует с разными типами контрагентов. Контрагентом может быть начальник или социально вышестоящий агенс (для субъектов глаголов работать, служить, учиться, трудиться, батрачить, вкалывать и др.), подчиненный (для субъектов группы глаголов руководящей деятельности руководить, управлять, править, царствовать, командовать, контролировать), ребенок (для субъектов глаголов воспитывать, растить), бенефициант (для субъектов глаголов заботиться, ухаживать, защищать, охранять, беречь), противник или враждебная сила (для субъектов глаголов сражаться, воевать, бороться).

4) Наличие плана или алгоритма, в соответствии с которым реализуется деятельность, определяется ее конкретное содержание, является прямым следствием ее квантованности. Отдельные этапы деятельности должны реализовываться в определенной последовательности и согласовываться друг с другом во времени и пространстве. Например, строительство (строить дом) подразумевает последовательное движение

от фундамента к крыше. План является воплощением стратегического смысла деятельности, ее целей и задач.

5) Наличие продукта (результата) деятельности. В качестве продукта (результата) деятельности обычно рассматривается достигнутая (воплощенная) цель: дом (деятельность: строить дом), кинофильм (деятельность: снимать кино), образование (деятельность: учиться).

6) Целесообразность. Структура и содержание деятельности соответствуют ее целевой установке - результату или задаче. Например, задачей обучения (глаголы учиться, обучать) является получение представлений, навыков, квалификации, и в соответствии с этим определяется содержание и процедура обучения.

7) Возможность заполнения валентности субъекта группой лиц или названием организации (множественность субъекта). Субъектом глагола деятельности может являться не индивидуум, а группа людей (или организация, частью которой эти люди являются), так как в осуществлении деятельности на разных стадиях или единовременно могут участвовать несколько человек. Например, военные действия (деятельность: воевать) часто реализуются полком или дивизией, в торговле (деятельность: торговать) могут участвовать магазины или лавки, а обеспечивать безопасность (деятельность: охранять) могут несколько вооруженных людей.

8) Возможность выделения отдельных стадий в осуществляемой деятельности. Ряд деятельностей допускают выделение отдельных стадий в ходе достижения поставленной субъектом цели. Стадии имеют технологический (как, например, в строительстве - фундамент, пол, стены, кровля), квалификационный (как, например, в учебе - курсы, классы) или психологический характер. Каждая стадия завершается качественным скачком.

Результатом анализа этой системы параметров стала таблица показателей, в которой степень реализации того или иного параметра в значении проанализированных глаголов оценивается по четырехбалльной шкале: 1 - нет, не реализован; 2 - скорее нет, чем да; 3 - скорее да, чем нет; 4 - да, реализован. Для каждого глагола была получена сумма баллов, которая определяет, в какой мере глагол выражает весь комплекс базовых характеристик деятельности. Суммируя баллы для каждого из глаголов, прошедших контекстный анализ, получаем шкалу, отражающую то, в какой степени в значении частотного глагола присутствуют вышеописанные признаки, т. е. насколько многогранно он представляет категорию деятельности во всей ее сложности. При этом давалась интегральная оценка: глаголы рассматривались не в отдельных своих значениях, а как структура из нескольких значений; так они далее фигурируют и в подгруппах. Результаты суммирования выглядят следующим образом:

Глагол

Сумма баллов Глагол Сумма баллов

учиться работать

воспитывать руководить служить трудиться

воевать бороться

31 31

30

27

26

24

24

22

заботиться

ухаживать

возиться

сражаться заниматься защищать охранять

беречь

22 21

21

20

20

20

19

17

Интересно отметить, что архилексема поля глагола деятельности заниматься попала в середину списка и уступает таким глаголам, как работать, учиться и т. д. по признаку наличия контрагента, который реализуется лишь в небольшой части контекстов (заниматься кем-либо), и наличия плана или алгоритма, в соответствии с которым реализуется деятельность. В данном случае это следствие высокой степени общности значения, в котором часть признаков оказывается «не востребованной». Глаголы, имеющие суммарный балл менее 20, составляют периферию поля, так как для них в меньшей степени реализованы признаки много стадийности деятельности и наличия плана или алгоритма, в соответствии с которым деятельность осуществляется. В то же время, признаки квантованности и абстрактной временной локализации (хотя бы в одном из значений) у всех глаголов выражены в достаточно высокой степени.

С учетом указанных признаков, опираясь на семантическую близость значений, в лексико-семантическом поле глаголов деятельности представляется возможным выделить следующие основные подгруппы, задающие базовую структуру поля глаголов деятельности:

1) глаголы трудовой и профессиональной деятельности (центральный глагол работать, глаголы трудиться, служить, батрачить, вкалывать, пахать и др.);

2) глаголы деятельности, направленной на создание сложного объекта (создавать, творить, строить (дом), писать (роман), ставить (спектакль), снимать (фильм), репетировать (сцену) и др.);

3) глаголы руководящей и контролирующей деятельности (руководить, управлять, заведовать, командовать, царствовать, править, контролировать, проверять и др.);

4) глаголы обучения, воспитания и познания (учить, учиться, обучать, обучаться, репетиторствовать, преподавать, исследовать, изучать, воспитывать, растить, пестовать и др.);

5) глаголы занятия (центральный глагол - архилексема поля - заниматься, а также конкретные виды деятельности: работать, воевать, торговать, воровать, разбойничать, охотиться, рыбачить, хозяйствовать)',

6) глаголы противостояния (воевать, сражаться, бороться и др.);

7) глаголы защиты объекта (защищать, охранять, беречь, оберегать и др.);

8) глаголы помощи объекту (заботиться, ухаживать и др.).

Групповое структурирование лексико-семантического поля позволяет оптимизировать дальнейшую процедуру описания глагольного массива, предполагающую на следующем этапе подробный анализ совокупности значений и поиск парадигматических связей, которые можно было бы включить в КиввЫе!:.

На примере глаголов, которые были подробно проанализированы методом контекстного анализа, было предложено представление о связях, существующих между их отдельными значениями. Это представление впоследствии может быть расширено посредством увеличения количества проанализированных лексем, которые будут заполнять указанные подгруппы.

Центральная лексема поля - глагол заниматься в значении 'иметь что-л. предметом своих занятий, деятельности' - не указывает на конкретный вид деятельности. Глаголы, конкретизирующие вид деятельности (в данном материале встретились глаголы работать, воевать, торговать, воровать, разбойничать, рыбачить, хозяйствовать), являются тропонимами (от греч. тротгоа - 'способ') центральной лексемы. Тропонимия - это разновидность родовидовых отношений, которая в \VordNet является основной формой иерархического структурирования синонимических рядов глаголов. Как один из основных

вариантов радиальной организации лексико-семантического поля, тропонимия составляет основу древовидных структур, элементами которых могут выступать отдельные глагольные значения. В данном случае тропоним (например торговать) конкретизирует способ, которым осуществляется деятельность заниматься', а временное соотношение между тропонимом и гиперонимом - совпадение во времени (иными словами, субъект торгует все то время, пока он занимается торговлей). Способ (тротосг) понимается широко и в данном случае представляет собой указание на конкретный вид деятельности.

Необходимо отметить, что у большей части рассмотренных глаголов деятельности присутствует значение, в котором они допускают актуализацию. Приведем пример глагола торговать. В своем первом значении он указывает на постоянное занятие: 'вести торговлю, иметь торговые отношения с кем-л.' (пример 1), в то время как второе значение - 'заниматься продажей, отпуском товаров покупателям' - допускает актуализацию, т. е. соотнесение деятельности с текущим моментом (пример 2):

1) Если ему предложили торговать, он должен знать все о товаре, которым торгует, и обязательно взять лицензию на право торговли (номер файла в корпусе «Бокренок»: doc #52: 125 l/Pop_science/Howto/childO 1 .txt);

2) Я попросила Игоря остановиться в стороне, чтобы девочки, которые торговали овощами, не увидели, что я подъехала на джипе (номер файла в корпусе «Бокренок»: doc #311: 1251_new/ Prose/Chernyh. txt).

В то же время главной особенностью структуры значений глаголов деятельности является не наличие у многих из них актуализированного значения, а их способность подниматься на более высокий уровень обобщения, которой лишены глаголы, не входящие в лексико-семантическое поле глаголов деятельности. Индикатором такой способности к обобщению является именно абстрактная временная локализация в одном из значений глагола.

Глагол работать обладает наиболее разветвленной собственной подгруппой, в которую входят в одном из своих значений такие частотные глаголы, как служить, трудиться, а также такие низкочастотные глаголы, как халтурить, вкалывать, корпеть, бездельничать, огородничать, плотничать. При этом при образовании родовидовых связей задействуются разные значения глагола. Так, глагол работать1 ('иметь постоянное занятие, (должность), выполнять фиксированный круг обязанностей, (определенный в соответствии с занимаемой должностью)') является гиперонимом глагола служить2 ('исполнять воинские обязанности, быть на военной службе') и одновременно входит в один синонимический ряд с глаголом служить5 ('работать по найму, исполнять обязанности, предусмотренные работой'). В то же время глагол работать3 ('заниматься каким-либо делом, применяя свой труд в какой-либо области, трудиться'), который входит в один синонимический ряд с глаголами трудиться1 ('заниматься каким-л. трудом, делом; работать') и подвизаться (стилистический синоним), является гиперонимом глаголов плотничать и огородничать и антонимом глагола бездельничать.

Ряд глаголов-занятий также образует подгруппы. Например, в подгруппу глаголов обучения и приобретения знаний объединяются частотные глаголы учиться, обучать и низкочастотный глагол репетиторствовать (тропоним обучать)', в подгруппу глагола воспитывать входят его синонимы растить в значении 'ухаживать, обеспечивать рост и развитие кого-л., воспитывать' и пестовать; подгруппа глагола торговать включает в себя низкочастотный глагол приторговывать.

В связи с многозначностью глаголы входят в синонимические ряды в разных значениях. Приведем в качестве иллюстрации пример трех синонимических рядов, выделенных в подгруппе, состоящей из трех глаголов: воевать, сражаться и бороться.

1. сражаться1 - воевать°

- сражаться1 - 'вести бой, принимать участие в сражении, биться, драться с оружием в руках';

- воевать2 - 'сражаться с кем-чем-л.'.

2. сражаться2 - бороться1 - воевать1

- сражаться2 - 'бороться, решительно противодействовать, сопротивляться кому-чему-л.';

- бороться1 - 'сопротивляться чему-л., стараться преодолеть или уничтожить что-л.';

- воевать3 - 'то же, что бороться (с кем-чем-л. и против кого-чего-л.)'.

3. сражаться- - бороться2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- сражаться3 - 'вступить в борьбу, спор с кем-л. за что-л.';

- бороться2 - 'отстаивать что-л.; добиваться, стремиться достичь чего-л.'.

Таким образом, анализ параметров категории деятельности позволил определить базовую структуру и основной состав поля глаголов деятельности, в частности его под-групповую субструктуру. В результате контекстного анализа значений и валентностных характеристик глаголов отдельных подгрупп были выявлены синонимические ряды и родовидовые отношения, составляющие основу структуры тезауруса Яшв^^ была получена новая структура значений указанных глаголов, адаптированная для представления в тезаурусе 11и85№1 (значения ранжированы по признаку частотности).

Выполненное разграничение категорий «деятельность» и «действие» позволило сформулировать подход к решению вопроса о включении того или иного глагола в поле глаголов деятельности, учитывающий внутреннюю неоднородность, составной характер, а также специфику временной соотнесенности значений исследуемых глаголов.

В статье представлен опыт применения полевого подхода к описанию структуры совокупности глаголов, задаваемой полеобразующим значением деятельности. Описание процедуры и результатов проецирования этого значения на совокупность частотных глаголов является одним из методологически значимых итогов работы в контексте решения задачи наполнения тезауруса Яг^Ые^ Выявлены параметры, позволяющие получить адекватное представление о месте лексико-семантического поля глаголов деятельности в общем континууме глагольных значений. Параметрическое задание категориального значения, получаемое в результате контекстного анализа стартовой совокупности элементов поля, представляется целесообразным средством уточнения структуры поля. Исследованная и структурированная совокупность может быть использована в качестве фрагмента структуры ЯизвЫе!.

1 Русская глагольная лексика: пересекаемость парадигм / Под ред. Л.Г. Бабенко. Екатеринбург, 1997; Кузнецова Э.В. Части речи и лексико-семантические группы слов // Вопросы языкознания. 1975, №5; Плотникова C.B. Высокочастотные глаголы в современном русском языке: лексико-семантическая классификация глаголов и регулярная многозначность: Автореф. канд. дис. Екатеринбург, 1996.

2 Шведова Н.Ю. Глагол как доминанта в системе русской лексики // Филологический сборник. М., 1995.

3 Гайсина P.M. Соотношение семантики и синтаксиса глагола // Исследования по семантике: Семантические единицы и их парадигмы. Вып. 17. Уфа, 1992.

4 Азарова И. В. и др. Разработка компьютерного тезауруса русского языка типа WordNet // Мат-лы конф. «Корпусная лингвистика и лингвистические базы данных», 5-7 марта 2002 г. СПб., 2002.

5 Апресян Ю.Д., Богуславская О.Ю., Левошпина И.В., Уринсон Е.В. Новый объяснительный словарь синонимов. М„ 1995.

5 Fellbaum Ch. A Semantic Network of English Verbs // WordNet: an electronic lexical database / Ch. Fellbaum (ed.), MIT Press Books, 1998.

6 Азарова И.В. и др. Указ. соч.; Азарова И.В., Митрофанова O.A., Синопальникова A.A. Компьютерный тезаурус русского языка типа WordNet // Компьютерная лингвистика и интеллектуальные технологии. Труды международной конференции «Диалог-2003» (Протвино, 11-16 июня 2003 г.). M., 2003; Азарова И. В., Синопальникова A.A. Использование

статистико-комбипаторных свойств корпуса современных текстов для формирования структуры компьютерного тезауруса RussNet // Труды международной конференции «Корпусная лингвистика-2004». СПб., 2004.

7 Толковый словарь русских глаголов / Под ред. Л.Г. Бабенко. Екатеринбург, 1999.

8 Падучева Е.В. Семантические исследования: Семантика времени и вида в русском языке. Семантика нарратива. M., 1996.

9 Семантические типы предикатов / Отв. ред. О.Н. Селиверстова. М., 1982.

10 Шарое С.А. Список частот для слов русского языка (2000), URL: www.artint.ru/projects/frqlist.asp

11 Корпус был создан на кафедре математической лингвистики СПбГУ (см. Азарова И.В., Синопачьникова A.A. Указ. соч.).

12 О стандартной процедуре подготовки wordnet-словарей см.: Азарова И.В., Иванов В.Л., Овчинников. Указ. соч.

13 Малый академический словарь русского языка: В 4 т. / Под ред. А.П. Евгеньевой. М., 1981-1984.

14 Азарова И.В., Иванов В.Л., Овчинникова Е.А. Использование схемы наследования рамок валентностей в тезаурусе RussNet для автоматического анализа текста // Компьютерная лингвистика и интеллектуальные технологии: Труды междунар. конф. «Диалог-2006» (Бекасово, 31 мая-4 июня 2006 г.). М, 2006. Сходную оценку объема обучающей совокупности предложений, которую предлагается использовать для разграничения значений полисемантичных слов (25 vs 200), см.: Leacock С., Chodorow M. Combining Local Context and WordNet Similarity for Word Sense Identification // WordNet: an electronic lexical database / Ch. Fellbaum (ed.). MIT Press Books, 1998.

Статья принята к печати 20 ноября 2006 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.