УДК 811.161.3'371
ПАРАМЕТРИЧЕСКИЙ АНАЛИЗ ХОРВАТСКО-РУССКОГО СЛОВАРЯ
И. А. Меркулова
Воронежский государственный университет
Поступила в редакцию 12 ноября 2014 г.
Аннотация: статья посвящена анализу лексики хорватского языка, представленной в двуязычном словаре, с помощью методов квантитативной лингвистики. На материале словаря выявляются значимые элементы лексико-семантической системы: наиболее употребительные, многозначные, синтагматически активные и синонимически богатые лексемы. Анализ завершается выделением лексико-семантическо-го ядра хорватского языка.
Ключевые слова: хорватский язык, лексика, словарь, параметрический анализ, лексико-семантическое ядро.
Abstract: the paper analyses vocabulary of the Croatian language. The quantitative analysis is based on the Croatian-Russian dictionary. The analysis reveals significant elements of the lexical system of the Croatian, i.e. the lexemes that are the most frequent and polysemous. These words are also used in various collocation and have many synonyms. The analysis presents the core vocabulary of the Croatian language. Key words: Croatian language, vocabulary, dictionary, parametric analysis, lexico-semantic core.
Хорватский язык - один из языков южных славян, являющийся официальным для Хорватии, Боснии и Герцеговины. Как отмечают авторы коллективного международного труда « Славянская лексикография», история хорватской лексикографии иная, нежели история лексикографии других южнославянских языков, а «это доказывает, что существование хорватского литературного языка не связано с существованием самостоятельного хорватского государства, т.е. он жил столетиями, задолго до провозглашения Хорватии государством» [1, с. 336].
В последнее время хорватский язык все чаще стал появляться под своим собственным, а не двойным (сербско-хорватский, сербо-хорватский, хорватско-сербский и т.п.) названием. Соответственно, стали выходить и словари, в которых хорватский язык представлен в соотношении с каким-либо другим славянским или неславянским языком. Хотя в настоящее время все еще ощущается большая потребность в словарях, в которых хорватский язык был бы представлен в соотношении с каким-либо другим славянским языком [2]. Нас интересует, в первую очередь, соотношение хорватский-русский. Истории известны рукописный словарь Dizionarietto каНапо^ауо-Ш08С0УШС0 (1751) уроженца Дубровника Ивана Мария Матияшевича, а также Краткий хорватско-русский словарь (1894) А. Суворова. Среди изданий, вышедших в наше время, можно назвать Русско-хорватский словарь с грамматикой Радослава Ф. Полян-ца и Серафимы М. Мадатовой-Полянец (последнее издание 2002 г.) и двухтомный хорватско-русский
© Меркулова И. А., 2015
словарь Матии Даутовича (Загреб, 2002). В России вышли Хорватско-русский словарь (1999, 2001, 2003) и Новый хорватско-русский словарь (2007) А. Р. Баг-дасарова.
Источником нашего исследования явился хорватско-русский словарь [3].
Метод исследования - параметрический анализ лексики, подробно описанный в работах проф. В. Т. Титова [4; 5].
Первый параметр характеристики лексики - длина слова, которую можно оценить в буквах. Статистика приводится в табл. 1.
Т а б л и ц а 1
Функциональная стратификация хорватской лексики
Количество букв Количество слов Накопление Ф-вес
1 2 3 4
2 8 8 0,99932
3 222 230 0,98039
4 473 703 0,94005
5 1034 1737 0,85188
6 1467 3204 0,72678
7 1704 4908 0,58148
8 1903 6811 0,41920
9 1690 8501 0,27509
10 1250 9751 0,16850
11 791 10 542 0,10105
12 561 11 103 0,05321
13 325 11 428 0,02550
14 156 11 584 0,01219
15 76 11 660 0,00571
16 31 11 691 0,00307
И. А . Меркулова
О к о н ч а н и е т а б л. 1
17
18
19
20
21
22
ФС Количество слов Накопление С-вес
10 11 11 0,99906
9 4 15 0,99872
8 15 30 0,99744
7 18 48 0,99591
6 32 80 0,95541
5 68 148 0,98738
4 82 230 0,98039
3 185 415 0,96462
2 373 788 0,93282
1 1006 1794 0,84705
0 9935 11729 0,00000
Как видим, при выделении функционального ядра можно опираться на слова длиной от 2 до 5 букв.
На рисунке хорошо видно, что максимум слов приходится на длину в 8 букв.
Рисунок. Распределение слов хорватского языка по длине (в буквах)
Приведем примеры слов хорватского языка, имеющих наибольший функциональный вес. Это двух-буквенные - ep 'эпос', la, fa 'музыкальные ноты', os 'ось', us 'вошь', местоимения mi 'мы' и vi 'вы'. Далее следуют 215 слов длиной в 3 буквы, среди которых bic 'кнут, хлыст', bik 'бык', bob I 'боб', bob II 'боб, бобслей', Bog 'бог', bok 'бок', bol 'боль', brk 'ус', brz 'быстрый, скорый', crn 'черный', crv 'червяк', car 'прелесть, очарование', cas 'мгновение, минута', cek 'чек', cep 'пробка', cip 'чип', dah 'дыхание', dan 'день', dar 'дар, подарок', dim 'дым', dio 'часть', dom 'дом, палатка', dug I 'долг', dug II 'длинный', gaj 'роща', gol 'голый', grk 'горький', hod 'ход', ime 'имя', ice 'пища, еда', ici 'идти, ходить', jad 'горе, беда', jak 'сильный, мощный' jal 'зависть', kor 'хор', kos I 'дрозд', kos II 'косой', krv 'кровь', kus 'кусок', laz 'ложь', led 'лёд', let 'полет', lud 'сумасшедший', mis 'мышь', nizI'ряд', nos 'нос', nov 'новый', oci 'глаза', osa 'оса',pas I 'пояс',pas II 'собака',pec 'печь',pod 'пол', put I 'тропа', rad 'работа, труд', raj 'рай', rat 'война', raz 'рожь', san 'сон', sat 'час', sit 'сытый', ziv 'серый', tih 'тихий', tlo 'почва', tup 'тупой', ziv 'живой', zlo 'зло', zub 'зуб', zut 'желтый' и некоторые другие.
Второй параметр характеристики лексики - синтагматическая активность, которая косвенно оцени-
вается по количеству фразеосочетаний со словом. Мы не стали ограничиваться только заромбовой частью словарной дефиниции, представленной очень бедно, а учли все примеры употребления лексемы. Результаты приводятся в табл. 2.
Т а б л и ц а 2
Синтагматическая стратификация хорватской лексики
ФС
10
0
Количество слов
11
15
18
32
68
82
185
373
1006
9935
Накопление
11
15
30
48
80
148
230
415
788
1794
11729
С-вес
0,99906
0,99872
0,99744
0,99591
0,95541
0,98738
0,98039
0,96462
0,93282
0,84705
0,00000
Очевидно, что синтагматическое ядро будут составлять все слова, имеющие при себе хотя бы одно сочетание. Приведем примеры слов, имеющих наибольший синтагматический вес.
Kuca 'дом': drvena ~ деревянный дом; javna ~ публичный дом; kamena ~ каменный дом; nakladna ~ издательский дом; prizemna ~ одноэтажный дом; robna ~универмаг; stambena ~ жилой дом; trgovacka ~ торговый дом; visekatna ~ многоэтажный дом; zidana ~ кирпичный дом; kosjfa 'волосы': bojiti ~u красить волосы; bujna ~ пышные волосы; ста ~ черные волосы; ispadanje ~е выпадение волос; kovrcava ~ кудрявые, курчавые волосы; plava ~ светлые волосы; pocesljati ~u причесать волосы;prati ~u мыть волосы; sijeda ~ седые волосы; suha ~ сухие волосы; valovita ~ волнистые волосы; recenica 'предложение': glavna ~ главное предложение; izjavna ~ повествовательное предложение; jednostavna ~ простое предложение; nezavisno slozena ~ сложносочиненное предложение; nijecna ~ отрицательное предложение; pogodbena ~ условное предложение; poticajna ~ побудительное предложение; slozena ~ сложное предложение; upitna ~ вопросительное предложение; usklicna ~ восклицательное предложение; meso 'мясо': kuhano ~ отварное мясо; meso na raznju ~ мясо на вертеле; meso zaropekurostilju ~ мясо на гриле (барбекю); mijesano ~ мясное ассорти (горячее блюдо); mljeveno ~ рубленое мясо; peceno ~ запеченное [жареное] мясо; piijano ~ тушеное мясо; pohano ~ мясо в панировке; suho ~ копченое мясо; topovsko ~ фраз. пушечное мясо; stil 'стиль': administrativni ~ административный стиль; funkcionalni ~ функцио-
9
4
8
7
6
5
4
3
2
1
нальный стиль; goticki ~ готический стиль; knjizevnoumjetnicki ~ литературно-художественный стиль; novinski ~ газетный стиль; pjesnicki ~ поэтический стиль;poslovni ~ деловой стиль;publicisticki ~ публицистический стиль; razgovorni ~ разговорный стиль; to je njezin ~ это ее стиль; stvar 'вещь': stvar je krenula дело пошло; stvar je u tome da... дело в том, что...; nazvati ~ipravimmenom называть вещи своими именами; prijedimo па ~ перейдем к делу; osobne -i личные вещи; propala ~ пропащее [гиблое] дело; staviti ~i u prtljaínik ~ положить вещи в багажник; skolske ~i школьные веши; sto je na ~i? в чем дело?; to je ~ navike это дело привычки; stanje 'состояние, положение': bracno ~ семейное положение; cvrsto ~ твердое состояние; financijsko ~ финансовое положение; imovno ~ имущественное положение; izvanredno ~ чрезвычайное положение; opsadno ~ осадное положение; pravno ~ правовое положение; ratno ~ военное положение; tekuce ~ жидкое состояние; tesko ~ тяжелое состояние; pravo 'право': biracko ~ избирательное право; drzavno ~ государственное право; imovinsko ~ имущественное право; gradansko ~ гражданское право; kazneno ~уголовное право; medunarodno ~ международное право; nasljedno ~ наследственное право; obiteljsko ~ семейное право;pomorsko ~ морское право;povijesno ~ историческое право; rjecnik 'словарь': castotni ~ частотный словарь; dvojezicni ~ двуязычный словарь; dzepni ~ карманный словарь; etimoloski ~ этимологический словарь; frazeoloski ~ фразеологический словарь; jednojezicni ~ одноязычный словарь; mali ~ краткий словарь; nazivoslovni ~ терминологический словарь; normativni ~ нормативный словарь; objasmdbeni ~ объяснительный словарь; crn 'черный': crna boja ~ черная краска; crna kava ~ черный кофе; crna Marica ~ черный ворон; crne misli ~ черные мысли; crne oci ~ черные глаза; crni dani ~ черные дни; crni humor ~ черный юмор; crno pivo ~ темное пиво; crno trziste ~ черн^1й рынок; crno zlato ~ черное золото; elektricni 'электрический': elektricna mreza ~ электросеть; elektricna pec ~ электропечь; elektricna stolica ~ электрический стул; elektricna struja ~ электрический ток; elektricni krug ~ электроцепь; elektricni napon ~ электрическое напряжение; elektricni otpor ~ электрическое сопротивление; elektricni stroj ~ электромашина; elektricni vlak ~ электропоезд; elektricno brojilo ~ электрический счетчик.
Результаты обработки словаря по эпидигматичес-кому параметру представлены в табл. 3.
Из таблицы видно, что в эпидигматическое ядро придется включать все слова, имеющие при себе минимум два значения. Заметим, что такая ситуация является типичной для двуязычных словарей малого объема.
Т а б л и ц а 3
Эпидигматическая стратификация хорватской лексики
Значения Количество слов Накопление Э-вес
5 2 2 0,99983
4 30 32 0,99727
3 179 211 0,98201
2 1130 1341 0,88568
1 10 389 11 730 0
По пять значений имеет видовая пара odbiti-odbijati 'отбить-отбивать': 1) отбить; 2) отразить; 3) отказать в чем-либо, отказаться от чего-либо; 4) вычесть; 5) отучить.
Далее следуют сразу тридцать слов с четырьмя значениями: zametnuti 'затеять, начать'; zakuhati 'заварить'; prijava 'прописка'; list 'лист'; tjelesni 'физический, телесный'; obljubljivati 'любить'; izdati 'выдать, издать';poziv 'звонок';provaljivati 'взламывать'; rampa 'платформа'; pogonom 'привод, передача'; provaliti 'взломать'; jabucica 'яблочко'; krunica 'коронка'; podignuti 'поднять'; podizati 'поднимать'; gajba 'клетка'; kocka 'куб'; zakuhavati 'заваривать'; broj 'число'; oklop 'броня'; obljubiti 'полюбить'; zalede 'тыл'; donijeti 'принести';ploca 'плита'; izdavati 'выдавать'; provala 'взлом'; donositi 'приносить';pokretac 'двигатель';patron 'патрон, покровитель'.
И наконец, последний параметр - парадигматический. Он определяется количеством синонимов у той или иной лексемы.
Данные по парадигматическому параметру были получены методом позиционного анализа дефиниций [6]. Результаты представлены в табл. 4.
Т а б л и ц а 4
Парадигматическая стратификация хорватской лексики
Количество слов Количество рядов Накопление П-вес
7 2 2 0,99983
6 1 3 0,99975
5 4 7 0,99941
4 15 22 0,99816
3 79 101 0,99155
2 925 1026 0,91413
1 10 922 11 948 0,00000
Лидером парадигматики по материалам словаря стали существительные, объединенные значениями 'девушка': cura, djevojka, gerla, gospodica, puca, treba, udavaca и 'кусок, ломоть': komad, kus, zalogaji, kocka, peca, rezanj, feta. Далее идет семема 'разделить': razdvojiti, razdijeliti, rastaviti, kalati, lamati, razbijati с синонимическим рядом из шести синонимов. Затем
И. А. Меркулова
семемы 'бить', 'болтать', 'еда', 'умереть' с рядами в пять синонимов.
В парадигматическое ядро включаются все лексемы, образующие синонимические ряды.
В результате слияния частных ядер, полученных по каждому из четырех параметров, мы получаем
четыре множества слов, из которых наибольший интерес представляют два множества: слова, вошедшие во все четыре ядра, и слова, вошедшие в три частных параметрических ядра. Общее количество таких слов для хорватского языка - 345, причем малое ядро - 53 слова (оно приводится в табл. 5).
Т а б л и ц а 5
Малое ядро хорватской лексики по двуязычному словарю
Слово Значение Д П С Ф S
1 2 3 4 5 6 7
glas голос 0,98201 0,91413 0,98738 0,94005 3,82357
gust густой 0,98201 0,91413 0,98738 0,94005 3,82357
kola повозка 0,98201 0,91413 0,98738 0,94005 3,82357
broj число 0,99727 0,91413 0,96462 0,94005 3,81607
boja цвет, окраска 0,88568 0,99155 0,99744 0,94005 3,81472
ploca плита 0,99727 0,99155 0,96462 0,85188 3,80532
imati иметь 0,98201 0,99816 0,96462 0,85188 3,79667
list лист 0,99727 0,91413 0,93282 0,94005 3,78427
sat час 0,88568 0,91413 0,99744 0,98039 3,77764
ljut злой, сердитый 0,98201 0,91413 0,93282 0,94005 3,76901
poci пойти 0,98201 0,91413 0,93282 0,94005 3,76901
vuci волочить, тащить 0,98201 0,91413 0,93282 0,94005 3,76901
zbor корпус 0,98201 0,91413 0,93282 0,94005 3,76901
komad кусок 0,98201 0,99983 0,93282 0,85188 3,76654
led лед 0,88568 0,91413 0,98039 0,98039 3,76059
udar удар 0,88568 0,91413 0,98738 0,94005 3,72724
cep пробка 0,98201 0,91413 0,84705 0,98039 3,72358
dah дыхание 0,98201 0,91413 0,84705 0,98039 3,72358
cast честь 0,88568 0,91413 0,98039 0,94005 3,72025
slom провал, неудача, крах 0,88568 0,91413 0,98039 0,94005 3,72025
ici идти, ходить 0,88568 0,91413 0,93282 0,98039 3,71302
kraj край 0,88568 0,91413 0,96462 0,94005 3,70448
kocka куб 0,99727 0,91413 0,93282 0,85188 3,69610
poziv звонок (телефонный) 0,99727 0,91413 0,93282 0,85188 3,69610
kapa головной убор 0,88568 0,91413 0,93282 0,94005 3,67268
tvrd твердый, жесткий 0,88568 0,91413 0,93282 0,94005 3,67268
kotac колесо 0,98201 0,99155 0,84705 0,85188 3,67249
jelo еда, пища 0,88568 0,99941 0,84705 0,94005 3,67219
tuci бить, ударять 0,88568 0,99941 0,84705 0,94005 3,67219
brdo гора (небольшая) 0,88568 0,99155 0,84705 0,94005 3,66433
krema крем 0,88568 0,91413 0,99591 0,85188 3,64760
izbor выбор, отбор 0,88568 0,91413 0,98738 0,85188 3,63907
tanak тонкий 0,88568 0,91413 0,98039 0,85188 3,63208
dom дом 0,88568 0,91413 0,84705 0,98039 3,62725
muh муж 0,88568 0,91413 0,84705 0,98039 3,62725
izlaz выход 0,88568 0,91413 0,96462 0,85188 3,61631
junak герой 0,88568 0,91413 0,96462 0,85188 3,61631
naici появиться 0,88568 0,91413 0,96462 0,85188 3,61631
О к о н ч а н и е т а б л. 5
1 2 3 4 5 6 7
volja воля 0,88568 0,91413 0,96462 0,85188 3,61631
cerner полынь 0,98201 0,91413 0,84705 0,85188 3,59507
cudo чудо 0,88568 0,91413 0,84705 0,94005 3,58691
jeza дрожь, озноб 0,88568 0,91413 0,84705 0,94005 3,58691
utok устье 0,88568 0,91413 0,84705 0,94005 3,58691
leden ледяной, леденящий 0,88568 0,91413 0,93282 0,85188 3,58451
miran мирный 0,88568 0,91413 0,93282 0,85188 3,58451
popis список 0,88568 0,91413 0,93282 0,85188 3,58451
zgoda удобный случай 0,88568 0,91413 0,93282 0,85188 3,58451
svuci снять 0,88568 0,99155 0,84705 0,85188 3,57616
kugla шар 0,88568 0,91413 0,84705 0,85188 3,49874
matun кирпич 0,88568 0,91413 0,84705 0,85188 3,49874
molba просьба 0,88568 0,91413 0,84705 0,85188 3,49874
staza тропинка 0,88568 0,91413 0,84705 0,85188 3,49874
upeci ужалить, укусить 0,88568 0,91413 0,84705 0,85188 3,49874
Доминантой хорватской лексики стали сразу 3 слова, имеющие одинаковый параметрический вес: glas - голос, gust - густой и kola - повозка.
Таким образом, мы получили возможность статистически описать словарь хорватского языка. Более детальное рассмотрение содержательного наполнения каждого из представленных параметров даст возможность сопоставления лексики хорватского и других языков с учетом системных связей и характеристик.
ЛИТЕРАТУРА 1. Тафра Б. Хорватская лексикография / Б. Тафра, Ж. Финк-Арсовски // Славянская лексикография : международная коллективная монография / отв. ред. М. И. Чернышева. - М. : Азбуковник, 2013. - С. 310340.
Воронежский государственный университет Меркулова И. А., кандидат филологических наук, доцент кафедры теоретической и прикладной лингвистики
E-mail: igel1@yandex.ru Тел.: 8 (473) 220-41-49
2. Тафра Б. Хорватско-славянские лексикографические контакты / Б. Тафра // Studia z Filologii Polskiej i Slowianskiej. Issue no. 42. - Warszawa, 2007. - S. 225-245.
3. Багдасаров А. Р. Хорватско-русский словарь / А. Р. Багдасаров. - М. : Астрель-АСТ : Транзиткнига, 2003. - 192 с.
4. Титов В. Т. Общая квантитативная лексикология романских языков / В. Т. Титов. - Воронеж : Изд-во Воронеж. гос. ун-та, 2002. - 240 с.
5. Титов В. Т. Частная квантитативная лексикология романских языков / В. Т. Титов. - Воронеж : Изд-во Воронеж. гос. ун-та, 2004. - 552 с.
6. Кретов А. А. Позиционный анализ парадигматики романско-русских словарей / А. А. Кретов, В. Т. Титов // Проблемы компьютерной лингвистики : сб. науч. трудов. - Воронеж : Издат.-полиграф. центр Воронеж. гос. ун-та, 2008. - Вып. 3. - С. 266-282.
Voronezh State University
Merkulova I. A., Candidate of Philology, Associate Professor of the Theoretical and Applied Linguistics Department
E-mail: igel1@yandex.ru
Tel.: 8 (473) 220-41-49