Научная статья на тему 'Параметрический анализ хорватско-русского словаря'

Параметрический анализ хорватско-русского словаря Текст научной статьи по специальности «Языкознание и литературоведение»

215
58
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ХОРВАТСКИЙ ЯЗЫК / ЛЕКСИКА / СЛОВАРЬ / ПАРАМЕТРИЧЕСКИЙ АНАЛИЗ / ЛЕКСИКО-СЕМАНТИЧЕСКОЕ ЯДРО / CROATIAN LANGUAGE / VOCABULARY / DICTIONARY / PARAMETRIC ANALYSIS / LEXICO-SEMANTIC CORE

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Меркулова И.А.

Статья посвящена анализу лексики хорватского языка, представленной в двуязычном словаре, с помощью методов квантитативной лингвистики. На материале словаря выявляются значимые элементы лексико-семантической системы: наиболее употребительные, многозначные, синтагматически активные и синонимически богатые лексемы. Анализ завершается выделением лексико-семантического ядра хорватского языка.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PARAMETRIC ANALYSIS OF THE CROATIAN-RUSSIAN DICTIONARY

The paper analyses vocabulary of the Croatian language. The quantitative analysis is based on the Croatian-Russian dictionary. The analysis reveals significant elements of the lexical system of the Croatian, i.e. the lexemes that are the mostfrequent and polysemous. These words are also used in various collocation and have many synonyms. The analysis presents the core vocabulary of the Croatian language.

Текст научной работы на тему «Параметрический анализ хорватско-русского словаря»

УДК 811.161.3'371

ПАРАМЕТРИЧЕСКИЙ АНАЛИЗ ХОРВАТСКО-РУССКОГО СЛОВАРЯ

И. А. Меркулова

Воронежский государственный университет

Поступила в редакцию 12 ноября 2014 г.

Аннотация: статья посвящена анализу лексики хорватского языка, представленной в двуязычном словаре, с помощью методов квантитативной лингвистики. На материале словаря выявляются значимые элементы лексико-семантической системы: наиболее употребительные, многозначные, синтагматически активные и синонимически богатые лексемы. Анализ завершается выделением лексико-семантическо-го ядра хорватского языка.

Ключевые слова: хорватский язык, лексика, словарь, параметрический анализ, лексико-семантическое ядро.

Abstract: the paper analyses vocabulary of the Croatian language. The quantitative analysis is based on the Croatian-Russian dictionary. The analysis reveals significant elements of the lexical system of the Croatian, i.e. the lexemes that are the most frequent and polysemous. These words are also used in various collocation and have many synonyms. The analysis presents the core vocabulary of the Croatian language. Key words: Croatian language, vocabulary, dictionary, parametric analysis, lexico-semantic core.

Хорватский язык - один из языков южных славян, являющийся официальным для Хорватии, Боснии и Герцеговины. Как отмечают авторы коллективного международного труда « Славянская лексикография», история хорватской лексикографии иная, нежели история лексикографии других южнославянских языков, а «это доказывает, что существование хорватского литературного языка не связано с существованием самостоятельного хорватского государства, т.е. он жил столетиями, задолго до провозглашения Хорватии государством» [1, с. 336].

В последнее время хорватский язык все чаще стал появляться под своим собственным, а не двойным (сербско-хорватский, сербо-хорватский, хорватско-сербский и т.п.) названием. Соответственно, стали выходить и словари, в которых хорватский язык представлен в соотношении с каким-либо другим славянским или неславянским языком. Хотя в настоящее время все еще ощущается большая потребность в словарях, в которых хорватский язык был бы представлен в соотношении с каким-либо другим славянским языком [2]. Нас интересует, в первую очередь, соотношение хорватский-русский. Истории известны рукописный словарь Dizionarietto каНапо^ауо-Ш08С0УШС0 (1751) уроженца Дубровника Ивана Мария Матияшевича, а также Краткий хорватско-русский словарь (1894) А. Суворова. Среди изданий, вышедших в наше время, можно назвать Русско-хорватский словарь с грамматикой Радослава Ф. Полян-ца и Серафимы М. Мадатовой-Полянец (последнее издание 2002 г.) и двухтомный хорватско-русский

© Меркулова И. А., 2015

словарь Матии Даутовича (Загреб, 2002). В России вышли Хорватско-русский словарь (1999, 2001, 2003) и Новый хорватско-русский словарь (2007) А. Р. Баг-дасарова.

Источником нашего исследования явился хорватско-русский словарь [3].

Метод исследования - параметрический анализ лексики, подробно описанный в работах проф. В. Т. Титова [4; 5].

Первый параметр характеристики лексики - длина слова, которую можно оценить в буквах. Статистика приводится в табл. 1.

Т а б л и ц а 1

Функциональная стратификация хорватской лексики

Количество букв Количество слов Накопление Ф-вес

1 2 3 4

2 8 8 0,99932

3 222 230 0,98039

4 473 703 0,94005

5 1034 1737 0,85188

6 1467 3204 0,72678

7 1704 4908 0,58148

8 1903 6811 0,41920

9 1690 8501 0,27509

10 1250 9751 0,16850

11 791 10 542 0,10105

12 561 11 103 0,05321

13 325 11 428 0,02550

14 156 11 584 0,01219

15 76 11 660 0,00571

16 31 11 691 0,00307

И. А . Меркулова

О к о н ч а н и е т а б л. 1

17

18

19

20

21

22

ФС Количество слов Накопление С-вес

10 11 11 0,99906

9 4 15 0,99872

8 15 30 0,99744

7 18 48 0,99591

6 32 80 0,95541

5 68 148 0,98738

4 82 230 0,98039

3 185 415 0,96462

2 373 788 0,93282

1 1006 1794 0,84705

0 9935 11729 0,00000

Как видим, при выделении функционального ядра можно опираться на слова длиной от 2 до 5 букв.

На рисунке хорошо видно, что максимум слов приходится на длину в 8 букв.

Рисунок. Распределение слов хорватского языка по длине (в буквах)

Приведем примеры слов хорватского языка, имеющих наибольший функциональный вес. Это двух-буквенные - ep 'эпос', la, fa 'музыкальные ноты', os 'ось', us 'вошь', местоимения mi 'мы' и vi 'вы'. Далее следуют 215 слов длиной в 3 буквы, среди которых bic 'кнут, хлыст', bik 'бык', bob I 'боб', bob II 'боб, бобслей', Bog 'бог', bok 'бок', bol 'боль', brk 'ус', brz 'быстрый, скорый', crn 'черный', crv 'червяк', car 'прелесть, очарование', cas 'мгновение, минута', cek 'чек', cep 'пробка', cip 'чип', dah 'дыхание', dan 'день', dar 'дар, подарок', dim 'дым', dio 'часть', dom 'дом, палатка', dug I 'долг', dug II 'длинный', gaj 'роща', gol 'голый', grk 'горький', hod 'ход', ime 'имя', ice 'пища, еда', ici 'идти, ходить', jad 'горе, беда', jak 'сильный, мощный' jal 'зависть', kor 'хор', kos I 'дрозд', kos II 'косой', krv 'кровь', kus 'кусок', laz 'ложь', led 'лёд', let 'полет', lud 'сумасшедший', mis 'мышь', nizI'ряд', nos 'нос', nov 'новый', oci 'глаза', osa 'оса',pas I 'пояс',pas II 'собака',pec 'печь',pod 'пол', put I 'тропа', rad 'работа, труд', raj 'рай', rat 'война', raz 'рожь', san 'сон', sat 'час', sit 'сытый', ziv 'серый', tih 'тихий', tlo 'почва', tup 'тупой', ziv 'живой', zlo 'зло', zub 'зуб', zut 'желтый' и некоторые другие.

Второй параметр характеристики лексики - синтагматическая активность, которая косвенно оцени-

вается по количеству фразеосочетаний со словом. Мы не стали ограничиваться только заромбовой частью словарной дефиниции, представленной очень бедно, а учли все примеры употребления лексемы. Результаты приводятся в табл. 2.

Т а б л и ц а 2

Синтагматическая стратификация хорватской лексики

ФС

10

0

Количество слов

11

15

18

32

68

82

185

373

1006

9935

Накопление

11

15

30

48

80

148

230

415

788

1794

11729

С-вес

0,99906

0,99872

0,99744

0,99591

0,95541

0,98738

0,98039

0,96462

0,93282

0,84705

0,00000

Очевидно, что синтагматическое ядро будут составлять все слова, имеющие при себе хотя бы одно сочетание. Приведем примеры слов, имеющих наибольший синтагматический вес.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Kuca 'дом': drvena ~ деревянный дом; javna ~ публичный дом; kamena ~ каменный дом; nakladna ~ издательский дом; prizemna ~ одноэтажный дом; robna ~универмаг; stambena ~ жилой дом; trgovacka ~ торговый дом; visekatna ~ многоэтажный дом; zidana ~ кирпичный дом; kosjfa 'волосы': bojiti ~u красить волосы; bujna ~ пышные волосы; ста ~ черные волосы; ispadanje ~е выпадение волос; kovrcava ~ кудрявые, курчавые волосы; plava ~ светлые волосы; pocesljati ~u причесать волосы;prati ~u мыть волосы; sijeda ~ седые волосы; suha ~ сухие волосы; valovita ~ волнистые волосы; recenica 'предложение': glavna ~ главное предложение; izjavna ~ повествовательное предложение; jednostavna ~ простое предложение; nezavisno slozena ~ сложносочиненное предложение; nijecna ~ отрицательное предложение; pogodbena ~ условное предложение; poticajna ~ побудительное предложение; slozena ~ сложное предложение; upitna ~ вопросительное предложение; usklicna ~ восклицательное предложение; meso 'мясо': kuhano ~ отварное мясо; meso na raznju ~ мясо на вертеле; meso zaropekurostilju ~ мясо на гриле (барбекю); mijesano ~ мясное ассорти (горячее блюдо); mljeveno ~ рубленое мясо; peceno ~ запеченное [жареное] мясо; piijano ~ тушеное мясо; pohano ~ мясо в панировке; suho ~ копченое мясо; topovsko ~ фраз. пушечное мясо; stil 'стиль': administrativni ~ административный стиль; funkcionalni ~ функцио-

9

4

8

7

6

5

4

3

2

1

нальный стиль; goticki ~ готический стиль; knjizevnoumjetnicki ~ литературно-художественный стиль; novinski ~ газетный стиль; pjesnicki ~ поэтический стиль;poslovni ~ деловой стиль;publicisticki ~ публицистический стиль; razgovorni ~ разговорный стиль; to je njezin ~ это ее стиль; stvar 'вещь': stvar je krenula дело пошло; stvar je u tome da... дело в том, что...; nazvati ~ipravimmenom называть вещи своими именами; prijedimo па ~ перейдем к делу; osobne -i личные вещи; propala ~ пропащее [гиблое] дело; staviti ~i u prtljaínik ~ положить вещи в багажник; skolske ~i школьные веши; sto je na ~i? в чем дело?; to je ~ navike это дело привычки; stanje 'состояние, положение': bracno ~ семейное положение; cvrsto ~ твердое состояние; financijsko ~ финансовое положение; imovno ~ имущественное положение; izvanredno ~ чрезвычайное положение; opsadno ~ осадное положение; pravno ~ правовое положение; ratno ~ военное положение; tekuce ~ жидкое состояние; tesko ~ тяжелое состояние; pravo 'право': biracko ~ избирательное право; drzavno ~ государственное право; imovinsko ~ имущественное право; gradansko ~ гражданское право; kazneno ~уголовное право; medunarodno ~ международное право; nasljedno ~ наследственное право; obiteljsko ~ семейное право;pomorsko ~ морское право;povijesno ~ историческое право; rjecnik 'словарь': castotni ~ частотный словарь; dvojezicni ~ двуязычный словарь; dzepni ~ карманный словарь; etimoloski ~ этимологический словарь; frazeoloski ~ фразеологический словарь; jednojezicni ~ одноязычный словарь; mali ~ краткий словарь; nazivoslovni ~ терминологический словарь; normativni ~ нормативный словарь; objasmdbeni ~ объяснительный словарь; crn 'черный': crna boja ~ черная краска; crna kava ~ черный кофе; crna Marica ~ черный ворон; crne misli ~ черные мысли; crne oci ~ черные глаза; crni dani ~ черные дни; crni humor ~ черный юмор; crno pivo ~ темное пиво; crno trziste ~ черн^1й рынок; crno zlato ~ черное золото; elektricni 'электрический': elektricna mreza ~ электросеть; elektricna pec ~ электропечь; elektricna stolica ~ электрический стул; elektricna struja ~ электрический ток; elektricni krug ~ электроцепь; elektricni napon ~ электрическое напряжение; elektricni otpor ~ электрическое сопротивление; elektricni stroj ~ электромашина; elektricni vlak ~ электропоезд; elektricno brojilo ~ электрический счетчик.

Результаты обработки словаря по эпидигматичес-кому параметру представлены в табл. 3.

Из таблицы видно, что в эпидигматическое ядро придется включать все слова, имеющие при себе минимум два значения. Заметим, что такая ситуация является типичной для двуязычных словарей малого объема.

Т а б л и ц а 3

Эпидигматическая стратификация хорватской лексики

Значения Количество слов Накопление Э-вес

5 2 2 0,99983

4 30 32 0,99727

3 179 211 0,98201

2 1130 1341 0,88568

1 10 389 11 730 0

По пять значений имеет видовая пара odbiti-odbijati 'отбить-отбивать': 1) отбить; 2) отразить; 3) отказать в чем-либо, отказаться от чего-либо; 4) вычесть; 5) отучить.

Далее следуют сразу тридцать слов с четырьмя значениями: zametnuti 'затеять, начать'; zakuhati 'заварить'; prijava 'прописка'; list 'лист'; tjelesni 'физический, телесный'; obljubljivati 'любить'; izdati 'выдать, издать';poziv 'звонок';provaljivati 'взламывать'; rampa 'платформа'; pogonom 'привод, передача'; provaliti 'взломать'; jabucica 'яблочко'; krunica 'коронка'; podignuti 'поднять'; podizati 'поднимать'; gajba 'клетка'; kocka 'куб'; zakuhavati 'заваривать'; broj 'число'; oklop 'броня'; obljubiti 'полюбить'; zalede 'тыл'; donijeti 'принести';ploca 'плита'; izdavati 'выдавать'; provala 'взлом'; donositi 'приносить';pokretac 'двигатель';patron 'патрон, покровитель'.

И наконец, последний параметр - парадигматический. Он определяется количеством синонимов у той или иной лексемы.

Данные по парадигматическому параметру были получены методом позиционного анализа дефиниций [6]. Результаты представлены в табл. 4.

Т а б л и ц а 4

Парадигматическая стратификация хорватской лексики

Количество слов Количество рядов Накопление П-вес

7 2 2 0,99983

6 1 3 0,99975

5 4 7 0,99941

4 15 22 0,99816

3 79 101 0,99155

2 925 1026 0,91413

1 10 922 11 948 0,00000

Лидером парадигматики по материалам словаря стали существительные, объединенные значениями 'девушка': cura, djevojka, gerla, gospodica, puca, treba, udavaca и 'кусок, ломоть': komad, kus, zalogaji, kocka, peca, rezanj, feta. Далее идет семема 'разделить': razdvojiti, razdijeliti, rastaviti, kalati, lamati, razbijati с синонимическим рядом из шести синонимов. Затем

И. А. Меркулова

семемы 'бить', 'болтать', 'еда', 'умереть' с рядами в пять синонимов.

В парадигматическое ядро включаются все лексемы, образующие синонимические ряды.

В результате слияния частных ядер, полученных по каждому из четырех параметров, мы получаем

четыре множества слов, из которых наибольший интерес представляют два множества: слова, вошедшие во все четыре ядра, и слова, вошедшие в три частных параметрических ядра. Общее количество таких слов для хорватского языка - 345, причем малое ядро - 53 слова (оно приводится в табл. 5).

Т а б л и ц а 5

Малое ядро хорватской лексики по двуязычному словарю

Слово Значение Д П С Ф S

1 2 3 4 5 6 7

glas голос 0,98201 0,91413 0,98738 0,94005 3,82357

gust густой 0,98201 0,91413 0,98738 0,94005 3,82357

kola повозка 0,98201 0,91413 0,98738 0,94005 3,82357

broj число 0,99727 0,91413 0,96462 0,94005 3,81607

boja цвет, окраска 0,88568 0,99155 0,99744 0,94005 3,81472

ploca плита 0,99727 0,99155 0,96462 0,85188 3,80532

imati иметь 0,98201 0,99816 0,96462 0,85188 3,79667

list лист 0,99727 0,91413 0,93282 0,94005 3,78427

sat час 0,88568 0,91413 0,99744 0,98039 3,77764

ljut злой, сердитый 0,98201 0,91413 0,93282 0,94005 3,76901

poci пойти 0,98201 0,91413 0,93282 0,94005 3,76901

vuci волочить, тащить 0,98201 0,91413 0,93282 0,94005 3,76901

zbor корпус 0,98201 0,91413 0,93282 0,94005 3,76901

komad кусок 0,98201 0,99983 0,93282 0,85188 3,76654

led лед 0,88568 0,91413 0,98039 0,98039 3,76059

udar удар 0,88568 0,91413 0,98738 0,94005 3,72724

cep пробка 0,98201 0,91413 0,84705 0,98039 3,72358

dah дыхание 0,98201 0,91413 0,84705 0,98039 3,72358

cast честь 0,88568 0,91413 0,98039 0,94005 3,72025

slom провал, неудача, крах 0,88568 0,91413 0,98039 0,94005 3,72025

ici идти, ходить 0,88568 0,91413 0,93282 0,98039 3,71302

kraj край 0,88568 0,91413 0,96462 0,94005 3,70448

kocka куб 0,99727 0,91413 0,93282 0,85188 3,69610

poziv звонок (телефонный) 0,99727 0,91413 0,93282 0,85188 3,69610

kapa головной убор 0,88568 0,91413 0,93282 0,94005 3,67268

tvrd твердый, жесткий 0,88568 0,91413 0,93282 0,94005 3,67268

kotac колесо 0,98201 0,99155 0,84705 0,85188 3,67249

jelo еда, пища 0,88568 0,99941 0,84705 0,94005 3,67219

tuci бить, ударять 0,88568 0,99941 0,84705 0,94005 3,67219

brdo гора (небольшая) 0,88568 0,99155 0,84705 0,94005 3,66433

krema крем 0,88568 0,91413 0,99591 0,85188 3,64760

izbor выбор, отбор 0,88568 0,91413 0,98738 0,85188 3,63907

tanak тонкий 0,88568 0,91413 0,98039 0,85188 3,63208

dom дом 0,88568 0,91413 0,84705 0,98039 3,62725

muh муж 0,88568 0,91413 0,84705 0,98039 3,62725

izlaz выход 0,88568 0,91413 0,96462 0,85188 3,61631

junak герой 0,88568 0,91413 0,96462 0,85188 3,61631

naici появиться 0,88568 0,91413 0,96462 0,85188 3,61631

О к о н ч а н и е т а б л. 5

1 2 3 4 5 6 7

volja воля 0,88568 0,91413 0,96462 0,85188 3,61631

cerner полынь 0,98201 0,91413 0,84705 0,85188 3,59507

cudo чудо 0,88568 0,91413 0,84705 0,94005 3,58691

jeza дрожь, озноб 0,88568 0,91413 0,84705 0,94005 3,58691

utok устье 0,88568 0,91413 0,84705 0,94005 3,58691

leden ледяной, леденящий 0,88568 0,91413 0,93282 0,85188 3,58451

miran мирный 0,88568 0,91413 0,93282 0,85188 3,58451

popis список 0,88568 0,91413 0,93282 0,85188 3,58451

zgoda удобный случай 0,88568 0,91413 0,93282 0,85188 3,58451

svuci снять 0,88568 0,99155 0,84705 0,85188 3,57616

kugla шар 0,88568 0,91413 0,84705 0,85188 3,49874

matun кирпич 0,88568 0,91413 0,84705 0,85188 3,49874

molba просьба 0,88568 0,91413 0,84705 0,85188 3,49874

staza тропинка 0,88568 0,91413 0,84705 0,85188 3,49874

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

upeci ужалить, укусить 0,88568 0,91413 0,84705 0,85188 3,49874

Доминантой хорватской лексики стали сразу 3 слова, имеющие одинаковый параметрический вес: glas - голос, gust - густой и kola - повозка.

Таким образом, мы получили возможность статистически описать словарь хорватского языка. Более детальное рассмотрение содержательного наполнения каждого из представленных параметров даст возможность сопоставления лексики хорватского и других языков с учетом системных связей и характеристик.

ЛИТЕРАТУРА 1. Тафра Б. Хорватская лексикография / Б. Тафра, Ж. Финк-Арсовски // Славянская лексикография : международная коллективная монография / отв. ред. М. И. Чернышева. - М. : Азбуковник, 2013. - С. 310340.

Воронежский государственный университет Меркулова И. А., кандидат филологических наук, доцент кафедры теоретической и прикладной лингвистики

E-mail: igel1@yandex.ru Тел.: 8 (473) 220-41-49

2. Тафра Б. Хорватско-славянские лексикографические контакты / Б. Тафра // Studia z Filologii Polskiej i Slowianskiej. Issue no. 42. - Warszawa, 2007. - S. 225-245.

3. Багдасаров А. Р. Хорватско-русский словарь / А. Р. Багдасаров. - М. : Астрель-АСТ : Транзиткнига, 2003. - 192 с.

4. Титов В. Т. Общая квантитативная лексикология романских языков / В. Т. Титов. - Воронеж : Изд-во Воронеж. гос. ун-та, 2002. - 240 с.

5. Титов В. Т. Частная квантитативная лексикология романских языков / В. Т. Титов. - Воронеж : Изд-во Воронеж. гос. ун-та, 2004. - 552 с.

6. Кретов А. А. Позиционный анализ парадигматики романско-русских словарей / А. А. Кретов, В. Т. Титов // Проблемы компьютерной лингвистики : сб. науч. трудов. - Воронеж : Издат.-полиграф. центр Воронеж. гос. ун-та, 2008. - Вып. 3. - С. 266-282.

Voronezh State University

Merkulova I. A., Candidate of Philology, Associate Professor of the Theoretical and Applied Linguistics Department

E-mail: igel1@yandex.ru

Tel.: 8 (473) 220-41-49

i Надоели баннеры? Вы всегда можете отключить рекламу.