Научная статья на тему 'Параметрический анализ лексики словенского языка по данным двуязычного словаря'

Параметрический анализ лексики словенского языка по данным двуязычного словаря Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
395
131
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДВУЯЗЫЧНЫЙ СЛОВАРЬ / КВАНТИТАТИВНАЯ ЛЕКСИКОЛОГИЯ / ПАРАМЕТРИЧЕСКИЙ АНАЛИЗ / СЛОВЕНСКИЙ ЯЗЫК / BILINGUAL DICTIONARY / QUANTITATIVE LEXICOLOGY / PARAMETRIC ANALYSIS / SLOVENIAN LANGUAGE

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Меркулова Инна Александровна

Статья посвящена квантитативному анализу лексики словенско-русского словаря по четырем параметрам: функциональному, синтагматическому, парадигматическому и эпидигматическому. В результате исследования выделяется лексико-семантическое ядро словенского языка.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PARAMETRIC ANALYSIS OF THE SLOVENIAN BILINGUAL DICTIONARY

The article offers a quantitative analysis of the vocabulary of the Slovene-Russian dictionary including functional, syntagmatic, paradigmatic and epidigmatic parameters. As a result the lexico-semantic core of the Slovenian vocabulary has been discriminated.

Текст научной работы на тему «Параметрический анализ лексики словенского языка по данным двуязычного словаря»

УДК 811.163.6’371 ББК 81.416.5-31

И.А. Меркулова

параметрический АНАЛИЗ ЛЕКСИКИ СЛОВЕНСКОГО ЯЗЫКА по данным двуязычного словаря

Статья посвящена квантитативному анализу лексики словенско-русского словаря по четырем параметрам: функциональному, синтагматическому, парадигматическому и эпидиг-матическому. В результате исследования выделяется лексико-семантическое ядро словенского языка.

Ключевые слова: двуязычный словарь; квантитативная лексикология; параметрический анализ; словенский язык

I.A. Merkulova

parametric analysis of the slovenian bilingual dictionary

The article offers a quantitative analysis of the vocabulary of the Slovene-Russian dictionary including functional, syntagmatic, paradigmatic and epidigmatic parameters. As a result the lexico-se-mantic core of the Slovenian vocabulary has been discriminated.

Key words: bilingual dictionary; quantitative lexicology; parametric analysis; Slovenian language

Словенский язык относится к южнославянской группе славянской языковой семьи. Основная масса говорящих на этом языке проживает в Словении и граничащих с ней государствах: Австрии, Италии, Венгрии, Хорватии.

В отечественной лингвистике обнаруживается крайне малое количество работ, посвященных этому языку [Дуличенко, 2005; Мечковская, 1991, Плотникова, 1990], в том числе его лексике.

Поскольку лексический состав языка представляется исследователю чем-то необозримым, трудно поддающимся систематизации и сопоставлению, необходимо найти способ выявления обозримого множества лексических единиц как слов не случайных, а отобранных с помощью системных лексических критериев. При этом продуктивной представляется мысль о полевой организации словаря, выделении ядра и периферии в лексико-семантической системе [Кузнецова, 1988]. Ядро составляют слова, имеющие высокие показатели функциональности, синтагматики, парадигматики и многозначности.

Целью нашего исследование является выделение лексического ядра словенского языка методом параметрического анализа словаря, предложенным в работах В.Т. Титова и апробированным на материале романских языков

[Титов, 2002; 2004]. Объектом исследования послужила словенско-русская часть двуязычного словаря объемом около 13 тыс. слов [Кшко^^емЫ, 2006]. Обращение к материалу двуязычного словаря неслучайно. Во-первых, именно двуязычные словари минимизируют лексическую систему, сохраняя коммуникативно значимые единицы: двуязычные словари удерживают главное - относительную значимость единиц в словаре и могут использоваться для обнаружения системного ядра лексики. Во-вторых, именно двуязычные словари играют важную роль в обучении иностранным языкам, и зачастую становятся в один ряд с компетентными учебными пособиями по языку. Наконец, эти словари доступны, в отличие, например, от одноязычных словарей синонимов, фразеологизмов, толковых словарей. Далеко не всякая национальная лексикография имеет в своем распоряжении такие специальные словари.

Методика параметрического анализа предполагает решение следующих задач:

1. Создание электронной версии словенско-русского словаря.

2. Получение количественной информации по каждому из параметров словенского языка: а) функциональному; б) эпидигматическому; в) синтагматическому; г) парадигматическому.

Кроме того, при обработке данных словаря необходимо соблюдать ряд правил:

1. Следует учитывать не все русские слова двуязычного словаря, а только те, которые входят в дефиниции значений.

2. Исключить из рассмотрения все пометы и служебные слова как не имеющие лексической семантики, а также онимы, местоимения, числительные и наречия.

Таким образом, описание лексики языка опирается на собственно лексические категории.

Первый параметр характеристики лексики - функциональный. Он характеризует активность слова в речи. Косвенным показателем функциональной активности является его длина: чем употребительнее слово, тем оно короче, и наоборот ^їр£, 1949]. При этом данный показатель менее зависим от случайностей выборки, чем частота. Есть вероятность того, что короткими окажутся заимствованные слова, но они будут отсеяны по другим параметрам.

Распределение словенских слов по длине (в буквах) представлено в табл. 1.

Самые короткие слова в данном корпусе лексики являются служебными элементами (мы их не приводим), а наибольший функциональный вес будут иметь слова с минималь-

Таблица 1 Распределение словенских слов по функциональному параметру

ной длиной в две буквы. Например as 1. карт. туз, 2. ас (летчик); дs ось; гг рожь; йd член, конечность; йк учение, учеба; йр надежда; ш вошь; йт ум.

Наибольшее количество слов приходится на длину в восемь букв. Как видим, в словенском языке целесообразно ограничиться включением в функциональное ядро слов длиной от одной до пяти букв, общее количество которых около двух тысяч.

Вторым параметром является эпидигмати-ка. Под эпидигматическими связями, вслед за автором этого термина, Д.Н. Шмелевым [Шмелев, 1973], следует понимать «деривационные отношения в широком смысле», включающие межсловную (словообразование) и внутрисловную («семантическое словообразование», порождающее многозначность) деривацию.

Эпидигматический вес лексем прямо пропорционален количеству имеющихся у них значений. Максимальный эпидигматический вес - у лексем с максимальным числом значений, минимальный - у однозначных лексем. Чем больше значений у слова, тем богаче его эпидигматические связи и, следовательно, тем надежнее оно закреплено в лексико-семантической системе языка.

Однозначные слова не имеют веса по этому параметру, а максимальный вес получают сразу пять слов, которые, по данным словаря, содержат наибольшее количество значений. Одним из этих слов является существительное vrsta - 1) ряд; 2) строй; 3) вид, род; 4) сорт; 5) очередь. Далее следуют слова, также имеющие по 5 значений: odbijati и его видовой коррелят odbiti - 1) отбивать, откалывать; 2) отбивать, отражать; 3) отклонять, отвергать; 4) отталкивать; 5) вычитать; dob^ti - 1) получить; 2) достать; 3) приобрести; 4) найти, застать; 5) выиграть; prдga - 1) полоса; 2) линия, трасса; направление; 3) железная дорога; 4) дорожка (спорт.); 5) дистанция.

Длина слова Кол-во слов Накопл. Ф-вес

1 6 6 0,9995

2 8 14 0,9989

3 251 265 0,9788

4 572 837 0,9331

5 1170 2007 0,8396

6 1724 3731 0,7019

7 2014 5946 0,5323

8 2147 8093 0,3635

9 1740 9833 0,2266

10 1331 11164 0,1219

11 771 11935 0,0613

12 462 12397 0,0249

13 207 12604 0,0087

14 72 12676 0,0030

15 30 12706 0,0006

16 5 12711 0,0002

17 2 12713 0,0001

18 1 12714 0,0000

19 2 12716 0,0000

Таблица 2 Распределение словенских слов по многозначности

Значений Слов Накопл. Э-Вес

5 5 5 0,9996

4 60 65 0,9949

3 434 499 0,9607

2 2379 2878 0,7734

1 9820 12698 0,0000

І59

При выделении ядра мы можем ориентироваться на 499 слов с количеством значений от 3 до 5 включительно.

Третьим параметром является синтагматический. В качестве косвенного показателя синтагматического веса слова принимается количество его фразеологически связанных употреблений, дающихся в словаре-источнике после дефиниций и за ромбом.

Максимальное количество фразеологизмов (15) имеет существительное leto - год, годы; v zacetku leta в начале года; na konzu (ob koncu) leta в конце года; leta 1941 в 1941 г.; leto dni один год; za leto na один год; v dveh letih за два года; pred enim letom год назад; vsakih pet let раз в пять лет; do dvajsetega leta до двадцати лет; clovek pripetdesetih letih человек лет пятидесяти; istih let одинакового возраста; prestop-no leto високосный год; novo leto Новый год; solsko leto учебный год (в школе); studijsko leto учебный год (в вузе).

Далее следует многозначный глагол Ш, означающий ‘идти, ходить; ездить’, имеющий 14 фразеологизмов: grem domov я иду домой; iti mimo проходить мимо; iti preko cesa переходить что; po kosilu gre v park после обеда он ходит в парк; je ze sel он уже ушел; iti ven выйти вон; iti z avtobusom ехать на автобусе; iti z letalom лететь на самолете; sel je na sluzbeno potovanje он уехал в командировку; to ne bo slo v torbo это не войдет в сумку; delo mu ne gre vec он больше справляется с работой; gre za njegovo zivljenje речь идет о его жизни; kako vam gre? Как вы поживаете?; gre mu na bolje ему стало лучше.

Таблица З Распределение словенских слов по количеству фразеологизмов

ФС Слов Накопл. С-Вес

15 1 1 0,9999

14 1 2 0,999S

13 1 З 0,999S

10 1 4 0,9997

9 З 7 0,9995

8 З 10 0,9992

7 10 20 0,99S4

б 10 30 0,9977

5 28 58 0,9955

4 бЗ 121 0,990б

З 150 271 0,97S9

2 5З4 S05 0,9372

1 2047 2852 0,7775

0 99бб 12S1S 0,0000

Затем следует cas - существительное, означающее ‘время’ и имеющее 13 фразеологизмов: оЬ pravem casu вовремя; nekaj casa некоторое время; prosti cas свободное время; delovni а рабочее время; V zadnjem casu в последнее время; пітат casa у меня нет времени; ієр (йоЬєГ)) cas много времени, долго; ті je dolg еах мне скучно; vse оЬ svojem casu всему свое время; Ш фойШ) s casom идти в ногу со временем.

Проанализировав синтагматическую активность исследуемого корпуса лексики словенского языка путем оценки ее фразеологической сочетаемости, мы выявили 2852 слова, формирующих синтагматическое ядро.

И, наконец, четвертый параметр характеристики лексики - парадигматический.

Показателем парадигматического веса слова в лексико-семантической системе является размерность синонимического ряда им образованного. Поскольку используемый двуязычный словарь не дает прямых указаний на синонимические связи слов, этот параметр приходится оценивать косвенно, пользуясь методом позиционного анализа дефиниций [Кретов, Титов 2008].

Этот формальный метод заключается в том, что синонимами признаются слова в одном из их значений в том случае, если дефиниции этих значений совпадают полностью (жесткое условие) или в начальной части (мягкое условие).

Среди «верхушки» парадигматически нагруженных лексем оказались семемы, объединяющие ряд из восьми и семи лексем: ‘охватывать’, ‘охватить’ - grdbiti, ІотШ, оЬ-hdjati, о^ётаи, popddati, preletdvati, рт1ыаи, prevzёmati. Далее следуют ‘морщить’ (6 синонимов в ряду) - gйbati, кгеШ 1, ктётгШ, v^hati, grbdnciti, тгйеШ и ‘раскрыть’ (5 синонимов в ряду) - razкr^ti, odgrn^ti, razodёti, razprёti, spreglёdati.

Таблица 4 Распределение словенских слов

по разме рности синонимических рядов

Синонимов Знач. Накопл. П-вес

8 1 8 0,9995

7 1 9 0,9994

б 1 10 0,9994

5 5 15 0,9991

4 143 15S 0,9902

З 409 5б7 0,964s

2 1S93 24б0 0,S474

1 13б5б ІбІІб 0,0000

Таблица 5

Малое лексико-семантическое ядро словенского языка

№ п/п Лексема Значение Э-вес Ф-вес С-вес П-вес Е-вес

1 dёlo работа, труд; деятельность 0,9949 0,9713 0,9906 0,9292 3,8860

2 gfd страшный, некрасивый, безобразный 0,9607 0,9713 0,9372 0,9794 3,8486

3 ЬШ стучать, ударять 0,9607 0,9145 0,9992 0,9292 3,8036

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4 Ь1ок корпус 0,9607 0,9145 0,9372 0,9292 3,7416

5 domaC домашний; родной 0,9607 0,9713 0,9789 0,8264 3,7373

6 ка1 росток; зародыш 0,9607 0,9145 0,7775 0,9794 3,6321

7 йоЬШ получить; достать 0,9996 0,9899 0,9372 0,6908 3,6175

8 сёу труба; ствол 0,7734 0,9145 0,9372 0,9794 3,6045

9 тёИ иметь; считать 0,7734 0,9713 0,9995 0,8264 3,5706

10 ь^ благородный 0,7734 0,9145 0,9372 0,9292 3,5543

11 dё1ati работать 0,9607 0,9145 0,9789 0,6908 3,5449

12 danаsnji сегодняшний; современный 0,7734 0,9899 0,7775 0,9794 3,5202

13 gnаti приводить в движение 0,9949 0,9145 0,7775 0,8264 3,5133

14 jа1ov бесплодный 0,7734 0,9145 0,9372 0,8264 3,4515

15 g1йh глухой 0,7734 0,9145 0,7775 0,9292 3,3946

16 hr6m хромой; центральный 0,7734 0,9145 0,7775 0,9292 3,3946

17 izrёden дополнительный 0,9607 0,9145 0,9789 0,5324 3,3865

18 Ьйй читать; собирать 0,7734 0,9899 0,7775 0,8264 3,3672

19 igrаti играть 0,7734 0,9145 0,9789 0,6908 3,3576

20 dёez доля; вклад 0,7734 0,9713 0,7775 0,8264 3,3486

21 hitёti спешить, торопиться; догонять 0,7734 0,9145 0,9372 0,6908 3,3159

22 Ьо1ес болезненный 0,7734 0,9145 0,7775 0,8264 3,2918

23 dot^k прикосновение; контакт 0,7734 0,9145 0,7775 0,8264 3,2918

24 jёder крепкий, здоровый 0,7734 0,9145 0,7775 0,8264 3,2918

25 grаbiti сгребать, грести; охватывать 0,9607 0,9995 0,7775 0,5324 3,2701

26 da1jаva даль; расстояние 0,7734 0,9713 0,9789 0,5324 3,2560

27 izdё1ek изделие; работа 0,7734 0,9713 0,9789 0,5324 3,2560

28 Ыевсёс блестящий, сверкающий 0,7734 0,9145 0,9372 0,5324 3,1575

29 jаmstvo поручительство, гарантия 0,7734 0,9145 0,9372 0,5324 3,1575

30 bri1jav тусклый; тяжелый 0,7734 0,9145 0,7775 0,6908 3,1562

31 bйtati биться 0,7734 0,9145 0,7775 0,6908 3,1562

32 drбben мелкий; точка зрения 0,7734 0,9145 0,7775 0,6908 3,1562

33 goj^ti разводить, выращивать; развивать 0,7734 0,9145 0,7775 0,6908 3,1562

34 kipёti кипеть 0,7734 0,9145 0,7775 0,6908 3,1562

35 izpo1n^ti выполнить; исполниться 0,9607 0,9899 0,9372 0,2268 3,1146

36 izmenjаva замена; обмен 0,9607 0,9145 0,9789 0,2268 3,0809

37 dё1ati se возникать; притворяться 0,7734 0,9145 0,9906 0,3636 3,0421

38 govor^ti говорить 0,7734 0,9145 0,9906 0,3636 3,0421

39 dv^gniti поднять; повысить 0,9607 0,9145 0,7775 0,3636 3,0163

40 besn^1o бешенство 0,7734 0,9145 0,7775 0,5324 2,9978

41 bёsnost ярость; буйство 0,7734 0,9145 0,7775 0,5324 2,9978

42 br^gati заботиться; интересоваться 0,7734 0,9145 0,7775 0,5324 2,9978

43 cfkniti сдохнуть, околеть; отказать 0,7734 0,9145 0,7775 0,5324 2,9978

44 jedmat крепкий, здоровый 0,7734 0,9145 0,7775 0,5324 2,9978

45 dovrs^ti окончить, завершить; исполниться 0,7734 0,9145 0,9372 0,3636 2,9887

1б1

Одно из достоинств параметрического анализа состоит в том, что он позволяет отсеять неядерные лексемы, оказавшиеся в том или ином ядре случайно на этапе суммирования параметрических весов. В этом проявляется основное отличие результатов нашего исследования от данных частотного словаря, который имеет только один параметр - функциональный.

Таким образом, последний этап заключается в суммировании полученных частных ядер с целью получения итогового лексико-семантического ядра словенского языка. При этом можно говорить о малом ядре, в которое слова входят по всем четырем параметрам, и большом ядре, в котором слова оказываются по наличию трех из четырех параметров.

На основе проведенного анализа функциональной, эпидигматической, синтагматической и парадигматической активности исследуемого корпуса лексики словенского языка нами было выделено 45 слов, отвечающих всем критериям принадлежности к ядерной лексике (малому ядру). Доминантой лексикосемантического ядра является слово со значением ‘работа, труд, деятельность’.

Анализ накопленного теоретического и практического материала о лексической системе словенского языка, проведенный в данном исследовании, позволил нам определить системные и функциональные характеристики ядра лексико-семантической системы словенского языка, выявить системно значимые слова среди существительных, прилагательных и глаголов.

Библиографический список

1. Дуличенко, А.Д. Словенский язык [Текст] / A^. Дуличенко // Языки мира: Славянские языки / ред. кол. AM. Молдован, С.С. Скорвид, A.A. Кибрик [и др.]. - М. : Academia, 2005. - C. 198-233.

2. Кретов, А.А. Позиционный анализ парадигматики романско-русских словарей [Текст] / A.A. Кретов,

B.Т. Титов // Проблемы компьютерной лингвистики : сб. науч. тр. - Вып. 3. - Воронеж : ИПЦ ВГУ, 2008. -

C. 266-282.

3. Кузнецова, А.И. Параметрическое исследование периферийных явлений в области морфемики: на материале русского языка [Текст] : автореф. дис... д-ра филол. наук : 10.02.19 / A^. Кузнецова. - М., 19SS.

- 38 с.

4. Мечковская, Н.Б. Словенский язык [Текст] : учеб. пособие для филол. ф-тов ун-тов / Н.Б. Мечковская. -Минск : Университетское, 1991. - 119 с.

5. Плотникова, О.С. Словенский язык [Текст] / О.С. Плотникова. - М. : Изд-во МГУ, 1990. - 198 с.

6. Титов, В.Т. Общая квантитативная лексикология романских языков [Текст] / В.Т. Титов. - Воронеж : Изд-во ВГУ, 2002. - 240 с.

7. Титов, В.Т. Частная квантитативная лексикология романских языков [Текст] / В.Т. Титов. - Воронеж : Изд-во ВГУ, 2004. - 552 с.

8. Шмелев, Д.Н. Проблемы семантического анализа лексики : (На материале рус. яз.) [Текст] / Д.Н. Шмелев.

- М. : Наука, 1973. - 280 с.

9. Rusko-slovenski in slovensko-raski moderni slo-var [Text] = Russko-slovenskij i slovensko-russkij sovre-mennyi slovar’ / Johe Sever, Olga Sergejevna Plotnikova,

- 1. nespremenjena izd., 4. natis - Ljubljana: Cankarjeva zalohba, 2006 (Zbirka Moderni slovarji).

10. Zipf, G.R. Human Behavior and the Principle of Least Effort [Text] / G.R. Zipf. - Cambridge, Mass.: Addition-Westley Press, 1949. - 25б р.

УДК 811.512.1 ББК 81.40/79

А.Э. Мешадиева

СТРУКТУРНО-СЕМАНТИЧЕСКИЕ И СИНТАКСИЧЕСКИЕ ОСОБЕННОСТИ ДЕЕПРИЧАСТНОЙ ФОРМЫ НА -01К£А4 В СОВРЕМЕННЫХ ТЮРКСКИХ ЯЗЫКАХ

В настоящей статье проводится сравнительно-исторический анализ деепричастной формы на ^гкда4 на материале современных тюркских языков, их диалектов и говоров. Анализируется опыт изучения деепричастной формы на -ё1кда4 в тюркологии, устанавливаются различные подходы к определению ее структурно-семантических, синтаксических характеристик и этимологии. В процессе сравнительно-исторического исследования выявляются сходные и отличительные особенности, а также различные фонетические варианты деепричастной формы на ^гкда4 в современных тюркских языках.

Ключевые слова: деепричастная форма на ^кда4; сравнительно-исторический аспект; этимология; современные тюркские языки; диалекты; сходные и отличительные особенности

i Надоели баннеры? Вы всегда можете отключить рекламу.