Научная статья на тему 'Квантитативное исследование имени существительного в русском языке по его синтаксическим признакам'

Квантитативное исследование имени существительного в русском языке по его синтаксическим признакам Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
284
36
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РУССКИЙ ЯЗЫК / СИНТАГРУС / ИМЯ СУЩЕСТВИТЕЛЬНОЕ / СИНТАКСИЧЕСКИЕ ПРИЗНАКИ / КВАНТИТАТИВНОЕ ИССЛЕДОВАНИЕ / RUSSIAN / SYNTAGRUS / TREEBANK / NOUNS / SYNTACTIC PROPERTIES

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Юн Ван, Хайтао Лю

Focusing on Russians nouns and with the SynTagRus treebank built by the Russian Academy of Sciences as data source, this paper performs a quantitative analysis of the syntactic structures formed by Russian nouns as governors and as dependents, respectively. A more accurate description is provided of the basic types, word-order properties and syntactic functions of the syntactic structures in both cases.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A Quantitative Study of the Noun in RussianAccording to Its Syntactic Features

Focusing on Russians nouns and with the SynTagRus treebank built by the Russian Academy of Sciences as data source, this paper performs a quantitative analysis of the syntactic structures formed by Russian nouns as governors and as dependents, respectively. A more accurate description is provided of the basic types, word-order properties and syntactic functions of the syntactic structures in both cases.

Текст научной работы на тему «Квантитативное исследование имени существительного в русском языке по его синтаксическим признакам»

ВЕСТНИК МОСКОВСКОГО УНИВЕРСИТЕТА. СЕР. 9. ФИЛОЛОГИЯ. 2013. № 5

Ван Юн, Лю Хайтао

КВАНТИТАТИВНОЕ ИССЛЕДОВАНИЕ ИМЕНИ СУЩЕСТВИТЕЛЬНОГО В РУССКОМ ЯЗЫКЕ ПО ЕГО СИНТАКСИЧЕСКИМ ПРИЗНАКАМ1

Данная статья ставит своей целью расширение потенциала использования статистических методов в синтаксическом анализе русского языка. На основе данных из корпуса СинТагРуса, разработанного Институтом проблем передачи информации РАН, анализируются квантитативные признаки имени существительного в двух случаях: когда оно выступает в роли главного слова и когда — в роли зависимого слова. Описываются главные типы синтаксических конструкций и особенности порядка слов в этих синтаксических конструкциях. Отдельно рассматриваются синтаксические отношения в обоих случаях.

Ключевые слова: русский язык, СинТагРус, имя существительное, синтаксические признаки, квантитативное исследование.

Focusing on Russians nouns and with the SynTagRus treebank built by the Russian Academy of Sciences as data source, this paper performs a quantitative analysis of the syntactic structures formed by Russian nouns as governors and as dependents, respectively. A more accurate description is provided of the basic types, word-order properties and syntactic functions of the syntactic structures in both cases.

Key words: Russian, SynTagRus, Treebank, nouns, syntactic properties.

1. Введение

В лингвистическом исследовании нередко используются статистические методы, которые «позволяют количественно описывать поведение различных языковых единиц (фонем, букв, морфем, слов) в тексте: частоту употребления единиц, их распределение в текстах разного жанра, сочетаемость с другими единицами и т. п. Одновременно накапливается обобщенная количественная информация о классах единиц, о языковых конструкциях (напр., данные о средней длине слова или предложения, о частоте употребления каких-либо грамматических форм в тех или иных синтаксических

1 Данная работа написана при финансовой поддержке правительства КНР, грант NSSFC, проект № 11&ZD188. Авторы выражают глубокую признательность ETAP Line за предоставленное разрешение использовать для исследования корпус СинТагРус, разработанный Институтом проблем передачи информации РАН, а также Иоакиму Нивре за предоставление данных CoNLL — варианта корпуса. Они также выражают сердечную благодарность докт. филол. наук, проф. И.А. Бубновой за помощь в подготовке русского варианта текста статьи.

функциях и т. п.) Такая информация углубляет описание единиц языка» [ЛЭС, 2002: 231]. Эти методы часто служат основным средством в ходе информационной обработки естественного языка. В России статистические методы использовались лингвистами уже в конце XIX в. В последние годы русские ученые, продолжая эту традицию, расширяют сферу использования данного подхода, и это позволяет им получать новые результаты, особенно в области морфологии и лексикологии (см., например: [Белов, 2010; Кретов и др., 2011; Под-лесская, 2012 и др.]).

Что касается китайских ученых, то их внимание сфокусировано на анализе языка с использованием БДЗ (банка деревьев зависимостей). К настоящему времени в Китае уже создан синтаксически размеченный корпус китайского языка, который постоянно продолжает пополняться. В течение 10 лет на основе этого корпуса и других БДЗ исследователи занимаются изучением квантитативных признаков китайского языка, выделяя и сопоставляя их с признаками, характерными для других языков.

Следует отметить значительные результаты, которые были достигнуты в статистической характеристике частей речи и их синтаксических функций в китайском языке [Лю, 2009; Liu, 2009; Liu et al., 2009; Гао, 2010]. Прежде всего тщательный анализ статистических данных, полученных на основе БДЗ, показал, что такие данные оказываются надежным источником для построения различных типологий [Лю, 2010]. Не менее значимым для дальнейших исследований является заключение о направлении зависимостей как о стабильном показателе языковой типологии, сделанное в ходе изучения некоторых синтаксических и типологических признаков с использованием пяти БДЗ китайского языка, разработанных разными методами синтаксической разметки и включающих в себя тексты разных стилей [Liu et al., 2009].

Основной целью нашего исследования, результаты которого изложены в данной статье, было подтверждение выводов китайских ученых на примере русского языка, а также демонстрация возможностей БДЗ для построения языковых типологий.

В первое десятилетие XXI в. Лаборатория компьютерной лингвистики Института проблем передачи информации РАН создала синтаксически размеченный корпус русских текстов — корпус СинТагРус. Эта база данных дает широкие возможности проводить количественный анализ языковых явлений в разных аспектах русского языка, особенно в области синтаксиса, в силу того, что корпус содержит «синтаксическую структуру (СинтС) каждого предложения в виде дерева зависимостей» [Апресян и др., 2005: 194]. На основе такого корпуса можно дать более точное определение частоты каждой из частей речи и главных типов синтаксических конструкций, где

данная часть речи выступает как главный или как зависимый элемент. Более того, существует возможность охарактеризовать порядок слов внутри этих конструкций и их синтаксические функции, в результате чего можно проверять характеристики частей речи, качественно описанные в грамматических трудах, и даже выявить незамеченные до этого признаки.

Объектом нашего исследования, описываемого в данной работе, явилось имя существительное. Выбор объекта исследования определялся его важной синтаксической ролью в русском языке.

Наше исследование основано именно на данных из СинТагРуса. Для первого этапа работы методом случайной выборки нами было отобрано 3509 предложений, охватывающих 50 662 слов (не включая знаки пунктуации). Наша задача сводилась к следующему:

1) определить главные типы синтаксических конструкций, где имя существительное выступает в роли главного или зависимого слова;

2) проанализировать особенности порядка слов в разных синтаксических конструкциях;

3) охарактеризовать главные типы синтаксических отношений и их особенности в случаях, когда имя существительное выступает в роли главного слова;

4) охарактеризовать главные типы синтаксических отношений и их особенности в случаях, когда имя существительное выступает в роли зависимого слова.

2. Порядок слов в синтаксических конструкциях с именем существительным

Среди китайских русистов распространено мнение, что в силу свободного порядка слов в русском языке члены предложения не имеют в нем постоянной позиции. Вместе с тем в русской грамматике детально описываются правила словорасположения разных словосочетаний, их обычный, а также и стилистически окрашенный, порядок слов. Чтобы определить, насколько свободен порядок слов в русском языке, нужна информация о направлении синтаксической связи и расстоянии между словами. Однако в СинТагРусе эти данные не приводятся в эксплицитном виде. В силу этого нашей основной задачей была статистическая обработка отобранных нами из СинТаг-Суса предложений с целью получения необходимой информации и дальнейшей ее статистической обработки, которая в итоге позволила бы сделать релевантные выводы о закономерностях порядка слов в русском языке.

Прежде всего, было необходимо выяснить отношения между порядком слов, с одной стороны, и расстоянием между членами конструкции и направлением зависимостей, с другой. Как отмечает

Лю Хайтао, «расстояние между членами конструкции представляет собой линейное расстояние между главным словом и зависимым, т. е. разница между двумя словами, которые связаны отношением зависимости» [Лю, 2009: 252]. Если зависимое слово находится в препозиции по отношению к главному, то величина является положительной, а если в постпозиции — отрицательной. Такой признак препозиции или постпозиции в синтаксическом отношении (в дальнейшем именуемое как СинтО) называется направлением зависимости. По статистическим чертам СинтО двух направлений можно охарактеризовать черты порядка слов данного языка [Liu, 2010]. Например, в выбранном архиве данных из СинТагРуса количество СинтО с положительной величиной (т. е. зависимое слово находится в препозиции по отношению к главному) составляет 18 033, а с отрицательной величиной (т. е. зависимое слово находится в постпозиции по отношению к главному) составляет 32 629. В итоге 64.41 % зависимых слов находятся в постпозиции по отношению к главному. Это доказывает, что для русского языка характерна постпозитивность зависимого слова, что контрастирует с китайским языком. По статистическим данным «китайский язык, по сути, является языком с постпозитивностью главного слова... Только одна треть зависимых слов находится в постпозиции по отношению к главному слову» [Лю, 2009: 255].

С другой стороны, по нашим наблюдениям, синтаксические конструкции с именем существительным в русском языке проявляют также и черты постпозитивности.

Полученные нами статистические данные свидетельствуют, что в синтаксических конструкциях с участием имени существительного постпозиция преобладает над препозицией в случае, когда оно выступает как главное слово (т.е. g=S). Количество зависимых в постпозиции составляет 8901 и занимает 52.88 %о от общего числа, соответственно число существительных в препозиции составляет 7930, что составляет 47.12 %. Такое расположение в основном совпадает с общей картиной расположения всех частей речи в СинТагРусе. Кроме того, зависимое слово находится, главным образом, прямо после или перед главным словом в соседней позиции. Как показывают данные, количество конструкций, где расстояние зависимостей равняется 1, составляет 6172, т. е. 77.83 0% от общего числа конструкций с положительной величиной; а число конструкций, где расстояние зависимостей равняется -1, составляет 4769, что равняется 53.58 % от общего числа конструкций с отрицательной величиной. Общая средняя величина расстояния зависимостей составляет 1.57, в том числе положительная средняя — 1.47, а отрицательная средняя — 2.08.

В случае, когда имя существительное служит зависимым словом (т. е. w=S), статистические данные четко показывают, что здесь

постпозиция зависимых существительных явно преобладает над препозицией таких существительных. Число зависимых в постпозиции равняется 15 557 (77.75 % от общего числа), между тем как число зависимых в препозиции — 4451, что составляет только 22.25 %. Иными словами, в данном случае подавляющее большинство зависимых слов находятся в постпозиции. При сравнении этих данных с предыдущим вариантом можно заметить, что там не проявляется такой явный количественный контраст между постпозитивными и препозитивными зависимыми. Кроме того, и расстояние зависимостей, главным образом расстояние положительной величины, отличается друг от друга. Как показывают данные, во втором случае число конструкций, где расстояние зависимостей равняется 1, составляет 2041, что составляет 45.86 % от общего числа конструкций с положительной величиной. Другими словами, совершенно явно проявляется тенденция равномерного расположения, что противоположно расположению слов при g=S. Что касается постпозитивных зависимых, то здесь наблюдается сходное расположение в обоих случаях, при g=S и при Общая средняя величина расстояния зависимостей при составляет 1.99, в том числе положительная средняя величина — 2.79, а отрицательная средняя величина — 1.77.

Из вышесказанного следует, что наблюдаются различия в направлении и расстоянии зависимостей в обоих случаях: и когда имя существительное служит главным словом, и когда оно служит зависимым. Эти различия проявляются в следующем:

1. В количественных показателях по направлению зависимостей. Хотя в обоих случаях отрицательные значения преобладают над положительными, они отличаются в количественном отношении. Так, когда существительное служит главным словом, число зависимых в постпозиции больше, чем их количество в препозиции, но данные различия несущественны. Причина такого положения видится в том, что такие конструкции включают немало субстантивных конструкций с прилагательным, где обычный порядок компонентов — препозиция прилагательного по отношению к существительному. В случае, когда существительное служит зависимым словом, также преобладает постпозиция зависимых слов, но наблюдается резкий подъем.

2. В средней величине расстояния зависимостей. Средняя величина расстояния зависимостей при g=S оказывается меньше, чем при Это свидетельствует о том, что плотность между словами в синтаксических конструкциях с существительным как главным словом больше, чем в конструкциях с существительным как зависимым словом.

3. В распределении величины расстояния зависимостей. При g=S расстояние положительного направления меньше того же расстояния отрицательного направления, что служит доказательством большей

тесноты связи между прилагательным и существительным чем плотность между существительным и существительным (■№). При w=S ситуация оказывается обратной: здесь расстояние положительного направления больше расстояния отрицательного направления, иными словами, плотность между глаголом сказуемое) и существительным дополнение) больше, чем плотность между существительным подлежащее) и глаголом сказуемое).

3. Статистический анализ имени существительного как главного слова 3.1. Дистрибуция СинтО при g=S

Выше были проанализированы особенности порядка слов в синтаксических конструкциях с именем существительным. Далее мы попытаемся выяснить признаки их синтаксических отношений, анализируя соответствующие статистические данные. В этой части анализ развертывается на основе данных при g=S.

Статистика показывает, что имя существительное в роли главного слова образует с зависимым словом 47 СинтО. Более частотными являются определительное, квазиагентивное, 1-комплетивное, атрибутивное и сочинительное СинтО.

Первое место занимает определительное СинтО, всего 6815 (40.49 % от общего числа СинтО). Это значит, что самой активной конструкцией является согласованное отношение, образованное именем существительным (в роли главного слова) и прилагательным (в роли зависимого). Например: белыеволосы^], действующий источник^], отодвинутыйстол^].

За ним следует квазиагентивное СинтО, где зависимым словом служит также имя существительное, которое функционирует как несогласованное определение к главному слову. Такие СинтО насчитывают в общей сложности 2112, что составляет 12.55 %о. Например: конструкциякомплексапроцесс^] разработок^], заявлениеНиколая^].

Почти такое же количество (2111) имеет 1-комплетивное СинтО, которое связывает предикативное слово с его вторым актантом, служащим прямым дополнением вершины и заполняющим валентность предикативного слова. Роль предикативного слова чаще всего выполняет отглагольное существительное, но также встречаются предлоги и инфинитивы. Например: ведение^] системы^], страсть^] к^]..., задача^] догнать^].

В атрибутивном СинтО зависимое слово представляет собой несогласованное определение по отношению к главному слову — существительному. В качестве зависимого слова этого СинтО чаще всего выступает предложная группа (дом за сотрудничество

между]']), нередко встречается имя существительное в родительном падеже специалисты университета [']; планировка [g] помещения [']); либо существительное в творительном падеже (конструкция протяженностью ['], изучение[g] посредством[']) и наречия некоторых типов (ветчина утюжком [']); игра вслепую[']).

Если во всех вышеуказанных СинтО зависимое слово выполняет функцию определения к главному слову, то в сочинительном СинтО в качестве зависимого слова часто выступает сочинительный союз, подчиняющий себе второй однородный член. Например: биосфера[%] и['], цифра[^] или\уг], экономисты^§] ни['].

Ниже наше внимание будет сосредоточено на более подробном анализе первых трех СинтО. Мы попытаемся представить статистику по каждому СинтО и на основе статистических данных выявить черты распределения частей речи в роли зависимого слова, особенности расстояния между главным и зависимым словом в разных синтаксических конструкциях и направления зависимостей, а также синтаксические функции этих конструкций.

3.2. Черты определительного СинтО

При определительном СинтО в подавляющем большинстве случаев функционирует именно согласованное определение в конструкциях А['] + S[g] и У[']+ S[g]. Во-первых, согласованное определение образуют прилагательное, местоименное и порядковое прилагательные. В целом было выявлено 6003 таких случаев, что составляет 88.09 % всех зависимых слов. Во-вторых, зависимым словом служит причастие, которое тоже образует согласованное определение по отношению к главному слову — существительному. Их общее количество — 658, т.е. 9.66 % от общего числа зависимых. Таким образом, 97.75 % зависимых слов, управляемых существительным, выполняют функцию согласованного определения.

В конструкциях А['] + S[g] подавляющее большинство зависимых слов представлено препозитивными прилагательными. Их насчитывается 5910, т. е. 98.45 % всех прилагательных в данных конструкциях, причем зависимые находятся главным образом в соседней позиции. Было выявлено 4915 конструкций, у которых расстояние между словами равняется 1, что составляет 83.16 % всех препозитивных прилагательных. Например: посторонние люди, научное предприятие, первые шаги. Препозитивные прилагательные встречаются достаточно редко, прежде всего тогда, когда активизируется актуальное членение. В этих случаях имя существительное, как правило, имеет обобщенное значение. Например: вещь дорогая, дело политическое. Постпозиция бывает и в определительных конструкциях с местоименными существительными, как ничего плохого, что-нибудь рискованное.

В конструкциях У^] + S[g] в роли зависимого слова выступает причастие, которое выполняет такую же функцию, как и прилагательное. Но под влиянием глагольного характера оно несколько отличается от прилагательного в направлении зависимостей, которое проявляет черты равномерного распределения по двум сторонам. Как показывают статистические данные, число препозитивных зависимых составляет 362 (55.02 % от общего числа конструкций данного типа). Расстояние в 1 встречается в 217 случаях. Например: устаревшие законы, интересующие участки, описанная методика. Расстояние с отрицательной величиной демонстрирует иную картину: расстояние в -1 встречается только три раза, а -2 — в 201 случаях.

3.3. Черты квазиагентивного СинтО

При квазиагентивном СинтО главным словом часто служит предикатное существительное, а зависимое слово реализует первую синтаксическую валентность этого слова, т. е. указывает на его субъект, поэтому в роли зависимого слова выступает именно существительное. В целом было выявлено всего 2048 таких конструкций (96.97 0% всех зависимых), остальные зависимые — предлоги и прилагательные. Независимо от того, какая часть речи выполняет функцию зависимого слова, их подавляющее большинство находятся в постпозиции. Как показывают данные, 1903 зависимых существительных имеют отрицательную величину расстояния, что составляет 92.92 % от их общего числа. Предлоги и прилагательные в функции зависимых слов представлены незначительно, однако все они (100 %) имеют отрицательную величину. Это объясняется тем, что зависимые слова выполняют функцию несогласованного определения по отношению к главному слову — существительному. Например: кабинет Семена, существование цивилизации, совместимость членов. Данные слова редко находятся в препозиции, причем это происходит только в том случае, если данное местоименное существительное не рассматривается в корпусе как особая часть речи и примыкает к существительному. Например: его жизнь, их работы, ее вид и т.д. Еще раз подчеркнем, что предлог занимает незначительную часть в общем числе зависимых слов при квазиагентивном СинтО и находится только в постпозиции. Например: взаимосвязь между, недоверие со стороны, часть из.

3.4. Черты 1-комплетивного СинтО

1-комплетивное СинтО связывает предикатное слово (в нашем случае — S) с его вторым синтаксическим актантом, которым чаще всего служит также существительное. Если при квазиагентивном СинтО зависимое слово указывает на субъект главного слова, то при

1-комплетивном СинтО — на его объект. Например: распределение ресурсов, возврат денег, описание внешности. Кроме того, зависимое слово данного СинтО также заполняет и другие валентности управляющего им слова, например: метод визуализации, работницы библиотек, цена войны. Статистические данные показывают, что в данном типе СинтО зависимое существительное насчитывает 1534 случая, т. е. 72.67 % всех зависимых слов. Второе место в роли зависимого слова принадлежит предлогу (435 случаев от общего числа, т. е. 20.61 %). В итоге эти две конструкции (S[g]+S[w] и S[g]+PR[w]) составляют уже 93.28 % всех зависимых. В обеих конструкциях большинство зависимых слов находятся в постпозиции по отношению к главному слову — существительному. В том числе зависимые слова с отрицательной величиной в конструкции S[g]+S[w] представлены в 1495 случаях, что составляет 97.46 % всех зависимых в конструкции данного типа. Что касается конструкции S[g]+PR[w], то здесь число зависимых членов с отрицательной величиной равно 425 (97.70 % всех зависимых этой конструкции). В данном случае зависимых с положительной величиной имеется только 10, а их препозитивная позиция объясняется их особой функцией в предложении. Например, стилистическую функцию выполняет конструкция к (людям) любовь, где препозитивный зависимый предлог подчеркивает свое зависимое существительное люди. Зависимые предлоги в конструкциях за ... контроль, на ...средств выполняют коммуникативную функцию по принципу актуального членения. В данном случае предложный оборот называет уже известное и представляет собой тему высказывания, поэтому он расположен в его начале. Центром высказывания, его ремой, является главное существительное, которое, как и следовало ожидать, выносится в конец предложения.

Анализ СинтО, образуемых именем существительным в роли главного слова, доказывает следующие его синтаксические признаки:

1) из всех частей речи имя существительное представляет собой такую часть речи, которая выполняет самые разные синтаксические функции;

2) самыми активными синтаксическими функциями конструкций с именем существительным в роли главного являются согласованное или несогласованное определение;

3) обычным порядком слов согласованного определения является препозиция зависимого слова, а несогласованного — постпозиция зависимого, что приводит в первом случае к положительной величине направления зависимостей, а во втором — к отрицательной;

4) необычный порядок слов — зависимых членов — часто выполняет коммуникативную или стилистическую функции.

4. Статистический анализ имени существительного как зависимого слова 4.1. Дистрибуция СинтО при w=S

Выше были проанализированы СинтО, которые существуют между существительным (как главным словом) и подчиняемым им зависимым словом, в результате чего были выявлены основные черты субстантивных конструкций. В этой части работы статистический анализ будет развертываться по отношению к СинтО между существительным как зависимым словом и его «хозяином», т. е. управляющим им словом, главным словом в конструкции, с целью определения синтаксических функций зависимого существительного в таких конструкциях. В корпусе СинТагРус отмечены 47 СинтО, образуемые зависимым-существительным. Более частотными являются предложное, предикативное, 1-комплетивное, квазиагентивное и аппозитивное СинтО.

На первом месте стоит предложное СинтО, количество которых составляет 5659 (28.29 % от общего числа). Это означает, что при СинтО, образуемых существительным как зависимым и управляющим им словом, преобладает предложная группа. Например: на[%] должностив^] Москву^], через^] неделю^].

За ним следует предикативное СинтО, где существительное играет роль субъекта при главном существительном — предикативного слова, и часто заполняет первую или вторую валентность последнего. Например: Сергей^] рассказываетместо^] странное[%\, есть^] указание^]. Число конструкций такого СинтО составляет 4397, т.е. 21.98 % от общего числа.

Почти такую же долю занимает 1-комплетивное СинтО, насчитывающее 4166 единиц и составляющее 20.82 %. Здесь зависимое-существительное представляет собой прямое дополнение к главному слову, т. е. заполняет второй актант предикативного слова. Например: держатьчеловека^], покачать[^\ головой^], держа себя

Четвертое место приходится на долю квазиагентивного СинтО, при котором зависимое существительное представляет собой несогласованное определение к управляющему им слову, число таких конструкций — 2048 (10.24 %). В данных конструкциях главным словом служит предикативное существительное, а зависимое — существительное представляет собой субъект своего «хозяина» и осуществляет его первую валентность. 100 % главных слов являются существительными. Например: число^] жителей^], большинство^] сетей^], вспышка^] пламени^].

Еще одно СинтО, где в роли главного слова выступает также имя существительное — это аппозитивное СинтО. Такая конструкция на-

считывает 749 единиц и занимает 3.74 % от общего числа всех выявленных конструкций. Например: МихаилКасьянов^], философ Плаmон[w], аэропорт[^ Кеннеди[м].

Ниже мы подробно проанализируем первые три вида СинтО и попытаемся на основе статистического анализа данных раскрыть черты каждого из них: распределение частей речи в роли главного слова, особенности направления и расстояния зависимостей, а также синтаксические функции конструкций.

4.2. Черты предложного СинтО

Как показывают статистические данные, часть речи, подчиняющая имя существительное и образующая с последним предложное СинтО — это предлог, при этом средняя величина расстояния зависимости между главным словом — предлогом и зависимым-существительным составляет 1.47. В конструкциях СинтО данного типа число конструкций с отрицательной величиной по направлению зависимостей составляет 5639 или 99.65 % от общего числа конструкций данного типа. Это означает, что здесь преобладает постпозиция зависимого, т. е. существительного. Кроме того, большинство постпозитивных зависимых слов находятся в соседней позиции по отношению к предлогу, т. е. их расстояние зависимостей равняется -1. Такие конструкции составляют 3628 (64.34 %) постпозитивных зависимых-существительных. Например: на складе, согласно данным, за счет государства. Кроме того, встречается немало конструкций с расстоянием зависимостей -2. Их общее количество составляет 1608 (28.52 % от общего числа постпозитивных зависимых слов). Например: в . году, кроме . единиц, в течение . веков.

Очень незначительную часть представляют препозитивные зависимые-существительные. Чаще всего это или крылатые выражения — предложные группы, такие как: лет назад, .недель спустя, или конструкции с приблизительной семантикой, например: минут через, метрах в. Встречаются и отдельные случаи, где данные конструкции выполняют стилистическую функцию: справедливости ради. Средняя положительная величина по расстоянию зависимости составляет 1.16.

4.3. Черты предикативного СинтО

В предикативном СинтО в роли главного слова, от которого зависит существительное, выступают глагол, прилагательное и существительное, которые представлены 85.72 %, 7.28 % и 4.55 % соответственно в общем числе главных слов данного СинтО. Это доказывает, что в таких синтаксических конструкциях предикатным словом служит главным образом глагол, а на прилагательное и существительное приходится незначительная доля случаев. Кроме того, в

этих случаях все зависимые-существительные представляют собой субъект предиката, что и определяет их обычное предпозитивное расположение по отношению к предикату.

Как показывают данные, в конструкциях S[w]+V[g] 2797 зависимых слов-существительных препозитивны, т. е. на них приходится 74.21 % всех зависимых слов. Из них 1329 находятся в соседней позиции, т.е. расстояние зависимостей равняется 1. Например: посещение выглядело, директор показался, улица бурлила. Такие случаи составляют 47.52 % всех препозитивных существительных. Средняя положительная величина расстояния зависимостей составляет 2.86. Что касается постпозитивного существительного, то их количество равняется только 972 (25.79 % от общего числа зависимых). Из них у 460 существительных расстояние -1 (47.33 % всех постпозитивных существительных), например: возникла опасность, прошла информация, ведутся эксперименты. Средняя отрицательная величина расстояния зависимостей составляет 2.01.

В конструкциях S[w]+А[g] выявлено 262 препозитивных существительных (81.88 % всех зависимых). Из них 114 существительных расположены непосредственно рядом со своим управляющим словом, у 57 существительных расстояние до управляющего ими слова составляет 2. В процентном соотношении эти существительные представлены 43.51 % и 21.76 % соответственно от всех препозитивных существительных. Средняя положительная величина по расстоянию зависимостей составляет 2.82. Что касается количества постпозитивных существительных, то их общее число составляет 58 единиц (18.12 %). Из них в соседней позиции находится 29 существительных, что равно половине постпозитивных существительных, а еще 18 существительных — с расстоянием -2, что составляет 31.03 %. Средняя отрицательная величина по расстоянию зависимостей составляет 2.24.

В конструкциях S[w]+S[g] большинство зависимых-существительных находятся в препозиции по отношению к своему управляющему слову. 182 существительных составляют 91 % всех зависимых слов. По сравнению с предыдущими конструкциями предикативного СинтО здесь наблюдается более равномерное распределение расстояния зависимостей, свидетельством чего служит тот факт, что только 35 существительных находятся в соседней позиции по отношению к своему управляющему слову (19.23 % из числа препозитивных существительных), существительных с расстоянием -2 — 64 (35.17 %), с расстоянием 3 — 37 (20.33 %). Средняя положительная величина по расстоянию зависимости составляет 3.34. Число постпозитивных существительных равняется 19 (лишь 9 %). Здесь также наблюдается равномерное расположение конструкций с разными расстояниями зависимостей: с расстоянием -1 только 3 (15.79 %), с расстоянием -2

значительно больше — 12 (63.16 %). Средняя отрицательная величина по расстоянию составляет 2.28.

Статистический анализ показывает, что связь между главным словом и зависимым в конструкциях предикативного СинтО менее тесна. Причина этого, на наш взгляд, заключается в том факте, что в таких конструкциях между словами могут быть вставлены более длинные конструкции, такие как деепричастные обороты, причастные обороты, разные подчиненные предложения и др.

4.4. Черты 1-комплетивного СинтО

1-комплетивное СинтО связывает предикатное слово (V, S, А или ADV) с его вторым актантом. В роли предикатного слова выступает, прежде всего, глагол, затем следует имя существительное. Каждый из них, соответственно, представлен 60.95 0% и 36.82 0% от общего числа главных слов. Незначительным количеством представлены прилагательные и наречия, которые составляют только 1.15 %% и 1.13 о% соответственно. Это свидетельствует о том, что зависимое-существительное часто служит прямым дополнением и присоединяется к своему «хозяину» — предикатному слову — по 1 комплетивно-му СинтО. Предикатным словом является прежде всего переходный глагол, за ним следует существительное, прилагательное и наречие. Именно поэтому обычным порядком зависимого-существительного является постпозитивный.

В конструкциях V[g]+S[w] преобладает постпозиция зависимого-существительного. Таких существительных было выявлено 1998, что составляет 78.69 % от общего числа зависимых слов. Препозитивные существительные представлены только 541 случаями, т. е. 21.31 % от общего числа. Независимо от типа конструкции — препозиции или постпозиции зависимого — наблюдается равномерное расположение существительного по расстоянию зависимостей. Средняя величина расстояния зависимостей составляет 2.12. Количество постпозитивных существительных, которые имеют величину 1 (49.30 % от общего числа), равняется 985. Немало и конструкций с величиной -2 (584 случаев, т. е. 29.23 %%). Средняя отрицательная величина расстояния зависимостей составляет 1.97. Из всех препозитивных существительных имеется 213, которые находятся в соседней позиции по отношению к управляющему ими слову, и 140 существительных — с расстоянием 2. Они представлены соответственно 39.37 % и 25.88 % от всех препозитивных зависимых. Средняя положительная величина расстояния зависимостей составляет 2.68.

В конструкциях S[g]+S[w] наблюдается большой контраст между количеством зависимых постпозитивных и препозитивных существительных. Он объясняется тем, что подавляющее большинство представлено постпозитивными зависимыми, которые встречаются

в 1494 случаях, т. е. в 97.39 % всех зависимых, а число препозитивных зависимых существительных только 40. Средняя величина расстояния зависимостей составляет 1.59. Однако положительная и отрицательная величины расходятся по своему позиционному распределению. В первом случае преобладает соседнее расположение между главным и зависимым словами: есть 34 конструкции, расстояние зависимостей которых равняется 1, что составляет 85 % всех препозитивных зависимых. В целом такое распределение приводит к тому, что средняя величина расстояния зависимостей является очень небольшой — только 1.21. По сравнению с этим во втором случае наблюдается более равномерное распределение расстояния зависимостей, доказательством чего служит тот факт, что 894 конструкции с расстоянием 1 составляют 59.84 % всех постпозитивных существительных, и 437 конструкций с расстоянием 2 составляют 29.25 % от общего числа. Средняя отрицательная величина расстояния зависимостей составляет 1.60.

Статистический анализ СинтО, связывающих зависимое-существительное со своим управляющим словом, позволил выявить следующие признаки соответствующих синтаксических конструкций:

1) имя существительное может быть зависимым от других частей речи и образует 47 СинтО, что свидетельствует о его наивысшей активности в образовании СинтО;

2) будучи зависимым словом, существительное участвует, главным образом, в образовании предложной группы, а также конструкций S[w]+V[g], У^^^], S[g]+S[w];

3) зависимое-существительное может выполнять разные синтаксические функции, оно часто подчиняется предикатному слову и служит первым актантом (когда оно выступает как субъект предиката) или вторым актантом (когда оно выступает как объект предиката) этого слова, а также образует несогласованное определение для слова, управляющего им;

4) в СинтО, образуемых зависимым-существительным и его управляющим словом, зависимое главным образом находится в постпозиции по отношению к своему «хозяину», исключение составляет только предикативное СинтО, при котором преобладает препозиция существительного, служащего субъектом предикатного слова;

5) на уровне средней величины расстояния зависимостей самым большим расстоянием обладает предикативное СинтО, затем следует 1 комплетивное, квазиагентивное и предложное, что является свидетельством наименьшей плотности между подлежащим и сказуемым.

5. Заключение

Исследование показывает, что статистический метод помогает нам дать точное описание и анализ грамматических явлений. В случае русского языка Корпус СинТагРус, составленный по теории грамматики зависимостей, представляет собой надежный источник данных для квантитативного исследования. Именно на эту основу опирается анализ, проведенный в данной статье, объектом исследования которой является имя существительное в роли главного и зависимого слов. Полученные результаты позволяют сделать следующие выводы:

1. В обоих случаях (в роли главного слова и в роли зависимого слова) существительное обладает наивысшей активностью среди всех частей речи в образовании СинтО: оно образует всего 47 СинтО2.

2. СинтО между словами в синтаксической конструкции, где существительное выступает в роли главного слова, проявляют черты большой разности в градиенте: первое, второе, третье и четвертое СинтО занимают в отдельности 40.49 %, 12.55 %, 12.54 % и 6.93 %. В случае, когда существительное выступает в роли зависимого слова, проявляются черты равномерности в дистрибуции разных СинтО: первое СинтО представлено только 28.29 %, а второе, третье и четвертое СинтО представлены соответственно 21.98 %, 20.82 % и 10.24 %.

3. На уровне направления зависимостей в обоих случаях преобладает отрицательная величина, т. е. в синтаксических конструкциях зависимое слово находится главным образом в постпозиции. При этом наблюдается разная пропорция: когда существительное подчиняет другие слова, доля постпозитивных зависимых составляет только 52.88 %, т.е. чуть больше половины; когда существительное зависит от других слов, то эта доля достигает 77.75 %, что значительно больше предыдущего.

4. На уровне порядка слов соседняя позиция составляет очень большую долю препозитивных зависимых (77.83 %) в случаях, когда существительное выступает в роли главного слова, что доказывает доминирующее определительное отношение между существительным и зависящим от него словом.

5. Средняя величина расстояния зависимостей между словами в случае, когда существительное выступает в роли управляющего слова, меньше, чем то, которое наблюдается в случае, когда существительное является зависимым словом. Они составляют соответственно 1.57 и

2 В случае, когда существительное выступает в роли главного слова, количество СинтО, образуемых остальными 8 частями речи, таково: V — 36 , A — 30, ADV — 25, NUM — 16, PR — 16, CONJ — 14, PART — 6, INTJ — 1. В случае, когда существительное выступает в роли зависимого слова, количество СинтО, образуемых остальными частями речи, таково: PR — 35, A — 34, V — 32, ADV — 31, NUM — 25, CONJ — 19, PART — 9, INTJ — 4.

1.99. Этот факт свидетельствует о том, что в первом случае зависимое слово чаще всего выполняет определительную синтаксическую функцию, что приводит к большей плотности между словами, между тем как во втором случае зависимое существительное часто образует предикативную конструкцию, где оно служит вторым актантом предикатного слова, что и приводит к меньшей плотности между словами данной конструкции.

В заключение необходимо заметить, что в состав СинТагРуса входят тексты разных типов: и современная русская проза, и научно-популярные и общественно-политические статьи из журналов, и тексты новостных лент, которые проанализированы в данной статье не отдельно, а совместно. В силу этого результаты, полученные в нашем исследовании, носят общий характер. Однако в перспективе, как нам представляется, можно выбрать данные из Корпуса по разным типам и сделать отдельный анализ, чтобы дать более тонкое толкование синтаксических признаков имени существительного в текстах каждого из этих типов.

Список литературы

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Апресян Ю.Д., БогуславскийИ.М., Иомдин Б.Л., Иомдин Л.Л., Санников А.В., Санников В.З., Сизов В.Г., Цинман Л.Л. Синтаксически и семантически аннотированный корпус русского языка: современное состояние и перспективы // Национальный корпус русского языка: 2003-2005. Результаты и перспективы. М., 2006. Белов А.М. Феномен квантитативной ритмики в современных фонологических теориях // Вопросы языкознания. 2010. № 1. Гао Сун. Квантитативное исследование по синтаксическим функциям имени существительного в современном китайском языке на основе БДЗ // Обучение и исследование по китайскому языку. 2010. № 2. Кретов А.А., Меркулова И.А., Титов В.Т. Проблемы квантитативной лексикологии славянских языков // Вопросы языкознания. 2011. № 1. ЛЭС 2002 — Лингвистический энциклопедический словарь / Гл. ред.

В.Н. Ярцева. 2-е изд., доп. М., 2002. Лю Хайтао. Грамматика зависимостей: от теории к практике. Пекин, 2009. Подлесская В.И. Структурная и линейно-просодическая целостность именных групп по данным корпусного исследования: сочиненные и комита-тивные группы с личным местоимением первого лица в русском языке // Вопросы языкознания. 2012. № 1. РГ 1980 — Русская грамматика / Гл. ред. Н.Ю. Шведова. Т. I. М., 1980. Liu Haitao. Probability Distribution of Dependencies based on Chinese Dependency Treebank // Journal of Quantitative Linguistics. 2009. 16 (3). Liu Haitao. Dependency direction as a means of word-order typology: a method

based on dependency treebanks // Lingua. 2010. 120 (6). Liu Haitao, Yiyi Zhao and Wenwen Li. Chinese syntactic and typological properties based on dependency syntactic treebanks // Poznan Studies in Contemporary Linguistics. 2009. 45(4).

Сокращения

БДЗ — банк деревьев зависимостей

СинтО — синтаксическое отношение

A — прилагательное

ADV — наречие

CONJ — союз

g — главное слово

INTJ — междометие

NUM — числительное

PART — частица

PR — предлог

S — существительное

V — глагол

w — зависимое слово

Сведения об авторах: Ван Юн (Yong Wang), докт. филол. наук, профессор, зав. кафедрой русского языка, зам. директора Института иностранных языков Чжэц-зянского университета (КНР). E-mail: [email protected]; Лю Хайтао (Haitao Liu), докт. филол. наук, профессор, директор Научно-исследовательского центра по моделям речевой деятельности Института иностранных языков Чжэцзянского университета (КНР). E-mail: [email protected]

i Надоели баннеры? Вы всегда можете отключить рекламу.