УДК 811.161.1'373
СИНТАГМАТИЧЕСКАЯ СТРАТИФИКАЦИЯ РУССКОЙ ЛЕКСИКИ
Ю. А. Суворова
Воронежский государственный университет
Поступила в редакцию 19 марта 2013 г.
Аннотация: статья посвящена анализу лексики русского языка по синтагматическому параметру. Сравнивается синтагматическое ядро русской лексики по двум словарям.
Ключевые слова: русский язык, параметрический анализ лексики, синтагматическое ядро лексики, синонимический ряд.
Abstract: the paper deals with the syntagmatic analysis of Russian vocabulary. The aim of the paper is to compare two syntagmatic cores of Russian vocabulary.
Key words: Russian language, parametric analysis of vocabulary, syntagmatic core, synonymic set.
Данная статья посвящена описанию распределения лексики Малого академического словаря (МАС-2) [1] по синтагматическому параметру в рамках параметрического анализа, разработанного В. Т. Титовым [2, 3], и сравнению полученных данных с синтагматической стратификацией лексики Фразеологического словаря современного русского литературного языка [4].
Целью данного исследования является определение системного веса каждой из лексем словаря на основании анализа количества ее словосочетаний, выявление стратификации лексики словаря-источника по синтагматическому весу и установление состава синтагматического ядра русской лексики по данным МАС-2. Сравнение данных МАС-2 с данными Фразеологического словаря современного русского литературного языка позволяет оценить достоверность информации о синтагматике русских слов, которая содержится в МАС-2.
Фразеологический словарь современного русского литературного языка, построенный на материале «Словаря современного русского литературного языка» в 17 томах, насчитывает 12 200 словарных статей с устойчивыми словосочетаниями. На наш взгляд, данный словарь представляется достаточно информативным и удачным для оценки достоверности синтагматического ядра лексики МАС-2 на фоне Большого академического словаря (БАС).
Объектом исследования выступает Малый академический словарь под редакцией А. П. Евгеньевой [1]. Корпус материала для исследования, полученный благодаря превращению электронной версии словаря-источника в базу данных, насчитывает 83 596 слов. Основываясь на мнении В. Т. Титова, что ядро лек-сико-семантической системы составляют существительные, глаголы и прилагательные [2, с. 12; 5, с. 22], мы обращаемся только к этим частям речи.
Материалом для выделения синтагматического параметра являются фразеосочетания словарной статьи МАС-2. Большее число фразеологизмов одного слова дает больший его синтагматический вес. Собранные данные о количестве фразеосочетаний, имеющихся в словарных статьях, и их дальнейшая обработка позволили получить следующие результаты.
В табл. 1 показано распределение лексики МАС-2 по синтагматическому параметру. В первом столбце отражается количество фразеологизмов у одного слова, во втором - количество слов, имеющих определенное число фразеосочетаний, третий столбец указывает на общее количество анализируемых слов, т.е. на количество слов в словаре. В столбце С-Вес указывается относительная величина синтагматического веса слова, которая вычисляется по формуле, предложенной В. Т. Титовым [2, с. 15]:
Pr
X r - R,
© Суворова Ю. А., 2013
где Рг - вес /-того ранга; ^г - сумма единиц всех рангов; Я1__. - сумма единиц от первого до данного ранга.
Из табл. 1 видно, что к ядру будут относиться все слова, имеющие при себе от 3 до 144 фразеологизмов, а к периферии - слова, имеющие при себе 1-2 фра-зеосочетания или не имеющие их. Конечный размер синтагматического ядра русской лексики по данным МАС-2 составляет 1093 слова.
Распределение русской лексики по числу фразео-сочетаний представлено на рис. 1. По данным, представленным на рисунке, видно, что наибольший синтагматический вес имеют слова, насчитывающие до 5 фразеосочетаний со словом.
r
Т а б л и ц а 1
Распределение русской лексики по количеству фразеологизмов (по данным МАС-2)
ФС Слов Накопл. С-Вес Примеры
144 1 1 0,999988 рука
95 1 2 0,999976 глаз
90 1 3 0,999964 голова
69 1 4 0,999952 душа
59 1 5 0,999940 нога
52 1 6 0,999928 дело
50 1 7 0,999916 слово1
48 1 8 0,999904 что
44 1 9 0,999892 дать
40 3 12 0,999856 место, сердце, ухо
39 2 14 0,999833 вода, язык
38 3 17 0,999797 взять
37 1 18 0,999785 ум
35 1 19 0,999773 тот
34 5 24 0,999713 брать, знать1, лицо, нос, черный
33 3 27 0,999677 идти, кровь
32 2 29 0,999653 живой, черт
31 1 30 0,999641 путь
29 2 32 0,999617 жизнь
28 1 33 0,999605 красный
27 1 34 0,999593 зуб
26 4 38 0,999545 белый, конец, смотреть, счет
25 3 41 0,999510 время, глядеть, стоять
24 3 44 0,999474 стать1, час, честь1
23 3 47 0,999438 мертвый, выйти
22 8 55 0,999342 сидеть, шаг, день, дорога
21 4 59 0,999294 дух, ставить1, вид1
20 3 62 0,999258 рот, память, последний
19 9 71 0,999151 край1, золото, делать, пора, бить, принять
18 4 75 0,999103 горло, год, играть, хвост
17 3 78 0,999067 войти, сон, поднять
16 7 85 0,998983 случай, копейка, огонь, палец, шея, совесть
15 9 94 0,998876 угол, плеч, кость, открытый, малый, класть
14 14 108 0,998708 муха, брат, смерть, небо, круг, ход, век, камень
13 18 126 0,998493 гора, хлеб, прямой, часть, ходить, род, спина
12 13 139 0,998337 оставить, тяжелый, ветер, минута, собака
11 21 160 0,998086 новый, говорить, лёгкий, море, бог, вопрос, тон
10 22 182 0,997823 горе, пройти, каша, мир1, средний, дом, круглый
9 31 213 0,997452 ломать, порядок, ночь, видеть, лежать, тянуть, мозг
8 37 250 0,997009 открыть, великий, детский, пот, крутить, чаша, горох
7 56 306 0,996340 цена, снять, хватать, ждать, кошка, судьба, лес, речь
6 86 392 0,995311 мать, ловить, закрыть, закон, кусок, думать, жар
5 115 507 0,993935 попасться, печать, свободный, судьба, птица, форма
4 200 707 0,991543 похожий, лопнуть, железный, взгляд, скорый, щит
3 386 1093 0,986925 кислый, спор, мель, царский, зрение, момент, дым
2 968 2061 0,975346 почет, пробный, ущерб, локоть, подбить, увидеть
1 3731 5792 0,930714 кукла, лысый, прикусить, трубить, сетчатый, статуя
0 77804 83596 0 привстать, обступить, выкрутить, терпкий, жалоба
Ранг значений (от 0 до 144)
Рис. 1. Распределение русских слов по синтагматическим весам (в МАС-2)
Самое большое количество фразеологизмов оказалось у следующих слов: рука (144), глаз (95), голова (90), душа (69), нога (59), дело (52), слово1 (50), дать (40), место (40), сердце (40),ухо (40), вода (39), язык (39), взять (38),ум (37), брать (34), знать1 (34), лицо (34), нос (34), черный (34), идти (33), кровь (33), живой (32), черт (32), путь (31), жизнь (29), красный (28), зуб (27), белый (26), конец (26), смотреть (26), счет (26), время (25), глядеть (25), стоять (25), стать1 (24), час (24), честь1 (24), мертвый (23), выйти (23).
Полученные результаты позволяют сделать предположение о том, что синтагматика в Малом академическом словаре проработана слабо. Для проверки данной гипотезы мы обратились к Фразеологическому словарю современного русского литературного языка [4].
База данных Фразеологического словаря современного русского литературного языка насчитывает 12 195 слов. Обработав данные Фразеологического словаря подобным образом, мы получили данные о распределении русской лексики по количеству фра-зеосочетаний (табл. 2).
Из табл. 2 видно, что, согласно данным Фразеологического словаря, к ядру будут относиться слова, имеющие от 7 до 168 фразеологических сочетаний. Периферия будет представлена словами, имеющими от 1 до 6 фразеосочетаний, или не имеющими их вообще. Синтагматическое ядро русской лексики, по данным Фразеологического словаря, содержит 1068 слов.
На рис. 2 представлено распределение русской лексики по данным Фразеологического словаря современного русского литературного языка. На графике видно, что наибольший синтагматический вес
имеют слова, насчитывающие до 14 фразеосочетаний со словом.
Самое большое количество фразеологизмов имеют следующие слова: глаз (168), голова (138), давать (128), душа (127), дело (126), взять (115),рука (109), брать (98), ходить (95), выйти (80), язык (79), белый (77), выходить (73), черт (72), нога (71), черный (68), вода (65), дух (62), слово (62), быть (61), держать (61), место (60), сердце (58), тяжелый (57), хвост (55), ум (54), знать1 (53), ход (53), бросать (52), жизнь (51), поставить (51), бог (50), войти (50), время (50), сила (50), честь (50), ставить (49), хватательный (49), входить (48), чистый (48), большой (47), идти (47), стать1 (47), ухо (47), делать (45), смотреть (44), бить (43), вставать (43), дорога (41), красный (41), поднимать (41), шаг (41), нос (40), пойти (40), пускать (40), стоять (40), легкий (39), показывать (38), принимать (38), глядеть (37), память (37), тянуть (37), живой (36), падать (36), прямой (36), свет (36), сделать (36), сидеть (36), случай (36), счет (36), упасть (36), конец (35), угол (35), голос (34), кровь (34), час (34), земля (33), снимать (33), день (32), класть (32), лицо (32), мертвый (32), полный (32), уйти (32), говорить (31), отдавать (31), путь (31), совесть (31), становиться (31), век (30), взгляд (30), форма (30), хлеб (30), выпускать (29), оставлять (29), вести (28), открытый (28), приходить (28), сон (28), уходить1 (28), деньги (27), зуб (27), открывать (27), сказать (27), точка (27), труд (27), хороший (27), вольный (26), воля (26), золотой (26), круг (26), положить (26), прийти (26), терять (26), часть (26), вид1 (25), высокий (25), горло (25), дом (25), пустой (25), смерть (25), воздушный (24), год (24), жить (24), малый1 (24), свободный (24), ударять (24), ветер (23), видеть (23), добрый (23), дурак (23), оставаться (23),
Т а б л и ц а 2
Распределение русской лексики по количеству фразеологизмов (по данным Фразеологического словаря современного русского литературного языка)
ФС Слов Накопл. С-Вес Примеры
1 2 3 4 5
168 1 1 1,0000 глаз
138 1 2 0,9999 голова
128 1 3 0,9999 давать
127 1 4 0,9999 душа
126 1 5 0,9999 дело
115 1 6 0,9998 взять
109 1 7 0,9998 рука
98 1 8 0,9998 брать
95 1 9 0,9998 ходить
80 1 10 0,9997 выйти
79 1 11 0,9997 язык
77 1 12 0,9997 белый
73 1 13 0,9997 выходить
72 1 14 0,9996 черт
71 16 0,9996 нога
68 1 17 0,9995 черный
65 1 18 0,9995 вода
62 20 0,9995 дух, слово
61 23 0,9994 быть, держать
60 1 24 0,9994 место
59 1 25 0,9993 что1
58 1 26 0,9993 сердце
57 1 27 0,9993 тяжелый
55 29 0,9992 хвост
54 1 30 0,9992 ум
53 32 0,9991 знать1, ход
52 1 33 0,9991 бросать
51 2 35 0,9991 жизнь, поставить
50 5 40 0,9989 бог, войти, время, сила, честь
49 2 42 0,9989 ставить, хватательный
48 2 44 0,9988 входить, чистый
47 5 49 0,9987 большой, идти, стать1, ухо
45 1 50 0,9987 делать
44 1 51 0,9986 смотреть
43 2 53 0,9986 бить, вставать
41 4 57 0,9985 дорога, красный, поднимать, шаг
40 4 61 0,9984 нос, пойти, пускать, стоять
39 1 62 0,9983 легкий
38 3 65 0,9983 показывать, принимать
37 3 68 0,9982 глядеть, память, тянуть
36 9 77 0,9979 живой, падать, прямой, свет, сидеть, случай
35 3 80 0,9979 конец, угол
34 3 83 0,9978 голос, кровь, час
33 3 86 0,9977 земля, раз1, снимать
32 7 93 0,9975 день, класть, лицо, мертвый, полный, уйти
31 5 98 0,9974 говорить, отдавать, совесть, становиться
30 5 103 0,9972 век, взгляд, форма, хлеб
29 2 105 0,9972 выпускать, оставлять
28 5 110 0,9971 вести, открытый, приходить, сон, уходить1
27 8 118 0,9968 деньги, зуб, открывать, сказать, точка
О к о н ч а н и е т а б л. 2
1 2 3 4 5
26 8 126 0,9966 воля, золотой, круг, прийти, терять
25 6 132 0,9965 высокий, горло, дом, пустой, смерть, вид1
24 7 139 0,9963 воздушный, год, жить, свободный, ударять
23 12 151 0,9960 видеть, добрый, оставаться, пора, слеза
22 8 159 0,9957 бумага, задавать, посадить, хранить, число
21 17 176 0,9953 великий, внимание, гора, играть, спина
20 14 190 0,9949 божий, гореть, простой, сесть, суд, уважение
19 13 203 0,9946 бес, водить, глубокий, дверь, палец, прах
18 19 222 0,9941 висеть, горе, иметь, кость, край, убивать
17 23 245 0,9934 брат, выдавать, кидать, темный, человек
16 22 267 0,9928 взяться, грех, молодой, пропадать, след
15 35 302 0,9919 бег, вечный, дно, лезть, минута, потерять
14 33 335 0,9910 камень, разум, море, небо, просить
13 47 382 0,9898 жар, знак, носить, разделять, речь, святой
12 58 440 0,9882 вера, вещь, высота, звезда, ломать
11 67 507 0,9864 бегать, быстрый, дар, долг, дыхание, мысль
10 98 605 0,9838 гнуть, думать, лопнуть, личный, облако
9 109 714 0,9809 ад, блеск, браться, верить, зло, кормить
8 159 873 0,9766 нести, очередь, печальный, теплый, улица
7 195 1068 0,9714 брак, искать, лететь, меч, начало, сиять
6 265 1333 0,9643 везти, дым, заря, лишний, мед, ожидать
5 396 1729 0,9537 молния, подумать, середина, слушать, траур
4 686 2415 0,9353 обида, обман, разрушать, сгорать, семя
3 1232 3647 0,9023 годный, душить, живот, лев, лизать
2 2452 6099 0,8366 ручной, рушить, скудный, гнать, мгла
1 6095 12194 0,6733 доверять, еда, жара, купить, умение, умолять
1,2
Ранг значений (от 0 до 168)
Рис. 2. Распределение русских слов по синтагматическим весам (во Фразеологическом словаре современного русского литературного языка)
подавать (23), сводить (23), слабый (23), слеза (23), твердый (23), чужой (23), бумага (22), двор (22), задавать (22), посадить (22), хранить (22), число (22).
Анализ полученных результатов синтагматической стратификации показывает, что информация о синтагматике русской лексики богаче представлена
во Фразеологическом словаре современного русского литературного языка.
На следующем этапе работы было вычислено расхождение в рангах слов двух словарей. Для этого были отобраны слова, которые входят в синтагматическое ядро словарей МАС-2 и Фразеологического словаря русского литературного языка. Количество
таких слов составило 542. В результате вычисления расхождения между рангами слов двух словарей были получены результаты, представленные на рис. 3.
На графике большая часть кривой находится в положительной части, что указывает на более высокие значения рангов Фразеологического словаря современного литературного языка в сравнении со значениями рангов МАС-2. Значения слов душа (0), глаз (1), голова (1), дело (1), черт (1), войти (1), упасть (1), падать (2), сделать (2), язык (2), легкий (2), тянуть (2) расположены ближе всего к нулю. У них отмечается минимальное расхождение в рангах.
Крайние точки кривой представляют собой значения слов, ранги которых имеют большое расхождение. С одной стороны, это слова последний (41), небесный (32), рот (32) и, с другой стороны, слова давать (39) и ходить (23).
Так, например, список фразеологизмов со словом последний в МАС-2 насчитывает 20 сочетаний: отдать последний долг (кому), последние времена (настали, наступили), в последнем счете, последняя спица в колеснице, последнее известие, последний крик моды, последнее прости (сказать или послать), последний путь, последнее слово (чего), последний час (чей), последними словами (ругать, называть и т.п.), до последнего, до последней возможности, до последнего дыхания, до последнего издыхания; при последнем издыхании, до последней капли; до последней капли крови, до последней нитки; испустить последний вздох, спать (или заснуть, уснуть и т.п.) последним сном, последнюю
копейку ребром поставить. Тогда как список Фразеологического словаря представлен лишь 8 фразео-сочетаниями: Отдать/отдавать последний долг, последний приют, последние времена (приходят, наступают и т.д.), из последних сил, в последнем счете, (самое) последнее дело, последняя спица в колесе, последний поклон, последнее прощание, целование и т.п.
Расхождения в рангах слов давать и ходить можно объяснить тем, что фразеологизмы - это, в первую очередь, именные словосочетания. Глаголы же во фразеосочетаниях, как правило, выполняют грамматическую, связочную функцию. Например, слово давать во Фразеологическом словаре содержит 128 фразеосочетаний. Однако большинство словосочетаний с этим словом могут быть заменены одним глаголом, что говорит о связочной (служебно-грамматической) функции глагола давать. Например, давать обет - обещать, давать храпака - храпеть, давать сражение - сражаться, давать в долг, взаймы - одалживать, давать весть, весточку - оповещать, давать добро - разрешать, давать имя, название, прозвище - называть, дать показания - показать (=свидетельствовать), давать потачку кому-л. - потакать, дать приют - приютить, дать промах - промахнуться, давать слово - обещать, давать телеграмму - телеграфировать и т.д. Полученные результаты позволяют говорить о том, что составители Фразеологического словаря используют подобные сочетания в за-ромбовой части словаря, тогда как составители МАС-2 такие сочетания к фразеологизмам не отно-
Рис. 3. Расхождение русской лексики в рангах весов (по данным двух словарей)
сят. Синтагматика глагола давать в МАС-2 представлена лишь тремя фразеологизмами: давай бог ноги, давать волю рукам, не давать прохода (проходу) кому.
Проведенное исследование позволило осуществить синтагматическую стратификацию русской лексики по данным двух словарей - Малого академического словаря русского языка и Фразеологического словаря современного русского литературного языка. Сравнение расхождений в рангах лексики словарей показало, что синтагматика в МАС-2 проработана значительно слабее, чем во Фразеологическом словаре. Сравнение синтагматических ядер двух словарей также дало информацию о лексике с минимальным расхождением в рангах, которая может считаться наиболее достоверной.
ЛИТЕРАТУРА
1. Словарь русского языка : в 4 т. / РАН, Ин-т лингвист. исследований ; под ред. А. П. Евгеньевой. - 4-е изд., стер. - М. : Рус. яз. : Полиграфресурсы, 1999.
2. Титов В. Т. Общая квантитативная лексикология романских языков / В. Т. Титов. - Воронеж : Изд-во Воронеж. гос. ун-та, 2002. - 240 с.
3. Титов В. Т. Частная квантитативная лексикология романских языков / В. Т. Титов. - Воронеж : Изд-во Воронеж. гос. ун-та, 2004. - 552 с.
4. Фразеологический словарь современного русского литературного языка [Электронный ресурс]: 12 200 словарных статей / под общ. ред. А. Н. Тихонова. - М. : АДДК, 2009.
5. Титов В. Т. Методические указания по выделению параметрического ядра лексики (для филологов: студентов и аспирантов) / В. Т. Титов. - Воронеж, 2006. -52 с.
Воронежский государственный университет Суворова Ю. А., преподаватель кафедры теоретической и прикладной лингвистики E-mail: [email protected] Тел.: 8-903-655-09-93
Voronezh State University
Suvorova J. A., Lecturer of the Theoretical and Applied Linguistics Department
E-mail: [email protected] Tel.: 8-903-655-09-93