Научная статья на тему 'Параметрический анализ лексики балканских языков (квантитативный аспект)'

Параметрический анализ лексики балканских языков (квантитативный аспект) Текст научной статьи по специальности «Языкознание и литературоведение»

269
51
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БАЛКАНСКИЙ ЯЗЫКОВОЙ СОЮЗ / ПАРАМЕТРИЧЕСКИЙ АНАЛИЗ ЛЕКСИКИ / ИНДЕКС АСИММЕТРИЧНОСТИ РАСПРЕДЕЛЕНИЯ ЛЕКСИКИ ПО ДЛИНЕ / ЛЕКСИКО-СЕМАНТИЧЕСКАЯ КАРТА БАЛКАНСКИХ ЯЗЫКОВ / THE BALKAN SPRACHBUND / PARAMETRIC ANALYSIS OFVOCABULARY / INDEX OF ASYMMETRIC VOCABULARY DISTRIBUTION OVER WORD LENGTH / LEXICO-SEMANTIC MAP OF THE BALKAN LANGUAGES

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Кретов А. А., Титов В. Т., Катов М. В.

В статье по данным балканско-русских словарей осуществляется параметрический анализ лексики шести балканских языков. По основанию «язык культуры : язык аккультурации» выявляется центральная роль греческого и периферийная роль турецкого. Измеряется расстояние между большими параметрическими ядрами лексики балканских языков и строится лексико-семантическая карта балканских языков. Выявляется центральная роль албанского языка и системообразующая роль албанско-румынско-македонского языкового треугольника для Балканского языкового союза.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PARAMETRIC ANALYSIS OF THE VOCABULARY OF BALKAN LANGUAGES (QUANTITATIVE ASPECT)

The paper presents the parametric analysis of the Balkan Sprachbund lexis. The research draws upon the data from the Balkan-Russian dictionaries. The «language of culture : language of acculturation» criterion demonstrates the central role of the Greek language and the peripheral role of the Turkish language. The analysis is also aimed at the quantitative assessment of the distance between the large parametric cores of the Balkan languages. The paper presents the lexico-semantic map of the Balkan languages and instantiates the major role of the Albanian language and the backbone role of the Albanian-Romanian-Macedonian triangle for the Balkan Sprachbund.

Текст научной работы на тему «Параметрический анализ лексики балканских языков (квантитативный аспект)»

ТЕОРИЯ ЯЗЫКА

УДК 811.1'373-13

ПАРАМЕТРИЧЕСКИЙ АНАЛИЗ ЛЕКСИКИ БАЛКАНСКИХ ЯЗЫКОВ

(КВАНТИТАТИВНЫЙ АСПЕКТ)

А. А. Кретов, В. Т. Титов, М. В. Катов

Воронежский государственный университет

Поступила в редакцию 23 января 2013 г.

Аннотация: в статье по данным балканско-русских словарей осуществляется параметрический анализ лексики шести балканских языков. По основанию «язык культуры : язык аккультурации» выявляется центральная роль греческого и периферийная роль турецкого. Измеряется расстояние между большими параметрическими ядрами лексики балканских языков и строится лексико-семантическая карта балканских языков. Выявляется центральная роль албанского языка и системообразующая роль албанско-румынско-македонского языкового треугольника для Балканского языкового союза.

Ключевые слова: Балканский языковой союз, параметрический анализ лексики, Индекс асимметричности распределения лексики по длине, лексико-семантическая карта балканских языков.

Abstract: the paper presents the parametric analysis of the Balkan Sprachbund lexis. The research draws upon the data from the Balkan-Russian dictionaries. The «language of culture : language of acculturation» criterion demonstrates the central role of the Greek language and the peripheral role of the Turkish language. The analysis is also aimed at the quantitative assessment of the distance between the large parametric cores of the Balkan languages. The paper presents the lexico-semantic map of the Balkan languages and instantiates the major role of the Albanian language and the backbone role of the Albanian-Romanian-Macedonian triangle for the Balkan Sprachbund.

Key words: the Balkan sprachbund, parametric analysis ofvocabulary, Index of asymmetric vocabulary distribution over word length, lexico-semantic map of the Balkan languages.

Исследованию Балканского языкового союза скоро исполняется 200 лет, если отсчитывать его от статьи Ернея Копитара [1]. За эти два века в исследовании Балканского языкового союза (термин Н. С. Трубецкого [2]) было сделано немало. Установлено, что наиболее очевидное сходство языков, входящих в Балканский языковой союз, - сходство их морфологии и синтаксиса [3, 4]. За ним следует сходство фонетики [5]. На последнем месте - сходство лексики. Первоначально исследование единства балканских языков в плане лексики состояло в подсчете грецизмов, турцизмов или славянизмов в других балканских языках [6-15]. Заимствования и сейчас рассматриваются как один из признаков балканизмов. Ср. список балканизмов по У. Хинрихсу: «нелабиализованный гласный (среднего ряда и подъема), редукция падежной системы, 'локативный' тип числительных, постпозитивный артикль, вокатив, аналитический компаратив, адноминальный датив, удвое -ние объекта, перифрастический футур (уо1о), замещение инфинитива, эвиденциальное наклонение, разветвленная глагольная система, лексические заимствования» [16, с. 432, 434] (цит. по [17, с.186]).

© Кретов А. А., Титов В. Т., Катов М. В., 2013

Однако заимствование заимствованию рознь: заимствование, находящееся на периферии системы, не значит почти ничего, тогда как заимствование, проникшее в ядро лексико-семантической системы, грозит языку утратой его идентичности: замена ядерной лексики на заимствованную означает переход с одного языка на другой [18, с. 10-11]. До недавнего времени единственным способом отличить базисную лексику от культурной были семантика: набор тематических групп (термины родства, названия универсальных явлений природы и натурфактов, частей тела, числительные, простые действия и признаки) или список М. Сводеша из 100, 200, 215 значений. «Однако с отнесением каждого конкретного значения в каждом конкретном языке к базисной или небазисной лексике могут возникать разнообразные семантические и культурологические проблемы. Строгое определение базисной лексики дать невозможно» [там же, с. 11].

До недавнего времени возможность объективного выделения ядра лексико-семантической системы, действительно, отсутствовала. Но с появлением параметрического анализа лексики [19-21] ситуация коренным образом изменилась: появилась возможность взвешивать слова по функциональной активности, многозначности, богатству синтагматики,

включая фразеологию, а значения - по числу синонимов в синонимических рядах. Суммарный вес слова по четырем указанным параметрам и представляет собой параметрический вес слова, ранжирование лексики в соответствии с которым позволяет на объективных основаниях стратифицировать лексику языка от сердцевины лексико-семантического ядра (доминанты) до самой дальней периферии.

Главная цель данной статьи - исследовать близость балканских языков на основании сравнения параметрических ядер лексики этих языков.

Объектом исследования послужили иноязычно-русские словари албанского, болгарского, македонского, новогреческого, румынского и турецкого языков, которые были переведены в электронную форму и превращены в базу данных. Сербохорватский язык, обычно относимый к периферии Балканского языкового союза [22] и являющийся, в отличие от болгарского и македонского, синтетическим, а не аналитическим, нами не был учтен, поскольку, строго говоря, в Балканский языковой союз входит лишь торлакское наречие сербохорватского языка, словарем которого мы не располагаем.

Параметрический анализ лексики албанского и новогреческого языков осуществлен А. А. Кретовым [23], румынского языка - В. Т. Титовым [20], данные

по параметрическому анализу лексики турецкого и славянских языков авторам статьи любезно предоставлены И. А. Меркуловой, которой они выражают свою глубокую признательность. Математические вычисления коэффициента корреляции параметрических ядер языков и генерирование лексико-семан-тической карты балканских языков выполнены М. В. Катовым.

Функциональная стратификация лексики балканских языков

Оценка функциональной активности слов по их длине основана на давно выявленной зависимости длины слов от их частотности: самые употребительные слова языка всегда и самые короткие, слова максимальной длины встречаются крайне редко. Кроме того, непроизводные слова всегда короче и, как правило, частотнее производных. Таким образом, отбирая самые короткие слова в языке, мы тем самым выявляем выработанное веками функционирования ядро его лексики - так называемые «корневые слова».

Функциональная стратификация лексики балканских языков представлена в табл. 1.

Распределение слов по длине представлено на рис. 1.

Т а б л и ц а 1

Функциональная стратификация лексики в балканских языках

Длина (букв) Слов Слов Слов Слов Слов Слов

Алб Болг Макед Н-греч Рум Тур

1 10 12 9 3 4 0

2 84 44 85 27 50 72

3 263 253 552 86 253 418

4 518 709 1705 449 657 899

5 1180 1278 3791 899 1093 1935

6 1617 1384 4979 1247 1306 1613

7 1716 1502 5451 1521 1289 1407

8 1781 1328 5196 1639 997 1423

9 1476 967 4266 1430 699 929

10 1089 688 2721 1094 452 678

11 718 367 1573 737 262 494

12 386 218 735 444 129 248

13 181 76 286 259 70 163

14 84 56 118 130 19 93

15 34 20 60 60 11 53

16 8 9 12 29 9 6

17 2 3 5 9 4 2

18 1 3 8 5 1 1

19 3 5 0

20 4 4

21 1

22 1

Е 11148 8920 31552 10079 7309 10434

Как следует из табл. 1 и рис. 1, медиана распределения, характеризующая типичную длину албанского и новогреческого слов, равна 8, болгарского и македонского - 7, румынского - 6 и турецкого - 5.

Форма распределения слов по длине также имеет значение: все языки, кроме турецкого, имеют одновершинное распределение. Двувершинность распределения турецких слов свидетельствует о его неоднородности: короткие исконные слова, относящиеся к разговорной речи, составляют большую вершину, а книжно-литературные, заимствованные по преимуществу из индоевропейских языков (персидского и греческого), образуют вторую вершину.

Интересно сравнить балканские языки по мере симметричности распределения слов по длине: если асимметрия свидетельствует о внешнем влиянии на лексику языка, то симметрия должна свидетельствовать о самостоятельности развития лексики с минимумом внешних влияний на нее.

Применим следующий способ оценки симметричности распределения:

1. Возьмем одинаковое количество рангов длин до и после медианы. Например, у греческого и албан-

ского словарей медиана приходится на 8, следовательно, до медианы - 7 рангов, а после медианы надо взять еще 7 рангов: с 9-го по 15-й.

2. Расположим ранги парами, по мере удаления от вершины распределения (медианы): 7-й с 9-м, 6-й с 10-м, 1-й с 15-м.

3. Вычтем из значения медианы значения парных рангов.

4. Вычтем из разности меньших рангов разность больших рангов.

5. Оценим их по модулю (без учета знаков).

6. Разделим сумму разностей по модулю на число суммируемых величин. Получим среднее значение асимметрии. Чем оно больше, тем сильнее внешнее влияние на лексику языка; чем оно меньше, тем меньше такое влияние и самостоятельнее развитие лексики языка.

Для иллюстрации проделаем весь цикл для распределения албанской лексики. Необходимые данные представлены в табл. 2.

В столбцах 1 и 3 указаны длины слов в буквах; в столбцах 2 и 4 - разность от вычитания из максимального значения 8 ранга значений (по модулю) 1-7 и

—<^Алб —□— Болг

Рис. 1. Распределение слов по длине в словарях-источниках

Т а б л и ц а 2

Вычисление Индекса Асимметричности Распределения слов по длине в албанском словаре-источнике

1 2 3 4 5

РангЛ АлбЛ РангП АлбП АлбРазн

1 0,1589 15 0,1567 0,0022

2 0,1522 14 0,1522 0,0000

3 0,1362 13 0,1435 0,0074

4 0,1133 12 0,1251 0,0118

5 0,0539 11 0,0954 0,0414

6 0,0147 10 0,0621 0,0474

7 0,0058 9 0,0274 0,0215

15-9 рангов соответственно; в столбце 5 - разность между значениями столбцов 2 и 4 (по модулю). Индекс Асимметричности Распределения (ИнАР) слов по длине в албанском словаре-источнике равен сумме всех значений в столбце 5 = 0,1317 и деленном на количество строк, содержащих пары: 0,1317 : 7 = = 0,0188.

Аналогичным образом по данным из табл. 1 вычисляются значения ИнАРа для лексики остальных балканских языков по данным словарей-источников. Значения этих индексов представлены на рис. 2.

Рисунок 2 свидетельствует о том, что всем и без того известно: языком не только балканской, но и всей европейской культуры является греческий язык. Он испытал наименьшее внешнее воздействие, оказав наибольшее воздействие на лексику других языков. Ценность ИнАРа не столько в том, что он это показывает, сколько в том, что он позволяет взвесить языки и разместить их на шкале по признаку «язык культуры : язык аккультурации» (чем больше значение ИнАРа, тем выше степень аккультурации языка). По ИнАРу болгарский язык, испытавший влияние греческого и отчасти турецкого языков, ближе всего к новогреческому. Албанский и македонский языки, испытавшие те же влияния, имеют несколько большие значения ИнАРа. Македонский литературный язык испытал некоторое влияние и болгарского литературного языка. Румынский язык испытал влияние не только греческого и турецкого языков, но и мощнейшее влияние славянских языков, и прежде всего - болгарского и старославянского. Что касается турецкого языка, то он испытал влияние не только персидского, арабского, но и греческого и в меньшей мере - болгарского языков. Его литературная лексика заимствована в максимальной степени. Стремление Турции перенять европейскую культуру и войти в европейский культурный ареал - ни для кого не секрет. Кемаль

Ататюрк, осуществивший переход с арабской на латинскую письменность, заявил об этом самым красноречивым образом. Переговоры о приеме Турции в Евросоюз ведутся и свидетельствуют о неизменности культурного вектора Турции.

Если греческая лексика максимально оригинальная, то турецкая в Балканском языковом союзе - самая вторичная и заимствованная. Мы можем сказать, что греческая лексика в 9 раз более оригинальна, чем турецкая, в 4 раза более оригинальна, чем румынская, и почти в 2 раза более оригинальна, чем македонская и албанская. Болгарская же лексика уступает греческой по оригинальности менее чем на У.

Как видим, ИнАР оказался весьма содержателен и информативен.

Синтагматическая стратификация лексики балканских языков

Синтагматическая стратификация лексики балканских языков представлена в табл. 3.

Наглядно содержание таблицы представлено на рис. 3.

Парадигматическая стратификация лексики балканских языков

Данные о парадигматической стратификации лексики балканских языков представлены в табл. 4.

Наглядно данные табл. 4 представлены на рис. 4.

Эпидигматическая стратификация лексики балканских языков

Распределение лексики балканских языков по числу значений в словарях-источниках представлено в табл. 5.

Данные табл. 5 в сопоставимом масштабе представлены на рис. 5.

0,12 0,10 0,08 0,06 0,04 0,02

и Н-греч Бол г Алб Макед Рум Тур

| ИнАР 0,0105 0,0138 0,0188 0,0193 0,0449 0,0954

Рис. 2. Значения Индекса Асимметричности Распределения лексики по длине для балканских языков

по данным словарей-источников

Т а б л и ц а 3

Стратификация лексики балканских языков по синтагматическому параметру

ФС Слов Слов Слов Слов Слов Слов

Алб Болг Макед Н-греч Рум Тур

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

51 1

37 1

31 1

24 1 1

23 1

20 1

19 1 1

18 1

17 1

16 2 1

15 2 1

14 3 1

13 2 1

12 1 2

11 3 3 1 4

10 2 2 0 1 2

9 5 1 0 3

8 8 4 2 1 4

7 8 13 1 1 4

6 14 9 6 2 1 8

5 29 27 10 3 7

4 57 66 8 3 5 15

3 118 154 40 7 5 42

2 318 412 65 24 19 105

1 1083 1625 547 152 57 344

0 9488 6596 30961 9886 7220 9885

Е 11146 8913 31641 10078 7309 10429

Рис. 3. Распределение балканской лексики по числу фразеосочетаний (в относительных величинах)

Т а б л и ц а 4

Парадигматическая стратификация лексики балканских языков

Синонимов Рядов Рядов Рядов Рядов Рядов Рядов

Алб Болг Макед Н-греч Рум Тур

17 1

12 1 1

9 1 1 1

8 1 6 1

7 3 7 4

6 21 26 12 1

5 35 48 13 2 2

4 118 172 54 16 1 13

3 431 643 195 104 37 79

2 1901 3297 882 975 419 741

1 8636 26512 5719 7743 7105 10030

2 11148 30714 6881 8840 7562 10866

Рис. 4. Распределение синонимических рядов в балканских языках по количеству синонимов (в относительных величинах)

Т а б л и ц а 5

Распределение лексики балканских языков по числу значений

Значений Слов Слов Слов Слов Слов Слов

Алб Болг Макед Н-греч Рум Тур

12 1

11

10

9 1 2 4

8 1 1 4

7 3 3 4 2 4

6 21 12 4 4 6

5 35 9 51 18 5 9

4 118 20 198 86 34 51

3 431 181 1044 376 123 191

2 1901 928 5099 1947 676 1153

1 8636 7655 25229 7644 6465 9012

2 11148 8793 31639 10079 7309 10434

Рис. 5. Распределение лексики балканских языков по числу значений (в относительных величинах)

Параметрические доминанты лексики балканских языков

Суммирование четырех частнопараметрических весов дает параметрический вес слова. По каждому из параметров определяется вес слова в интервале между 0 и 1. Знание параметрического веса каждого слова позволяет осуществить параметрическую стратификацию лексики и получить малое параметрическое ядро со словами, вошедшими в ядро с весом более 3, большое параметрическое ядро образуют слова с весом более 2, периферию большого параметрического ядра образуют слова с весом более 1 и периферию периферии образуют слова с весом менее 1.

Если лексико-семантическую систему (ЛСС) языка сравнить с горой, то слово с самым большим параметрическим весом (доминанту) можно сравнить с пиком этой горы. Доминанта - это та точка, которая задает систему векторных координат на всем пространстве словаря.

Доминантой ЛСС албанского языка является существительное kyc 'ключ', вице-доминантой - глагол dal 'выходить; уходить; быть достаточным, хватать; брать начало; возникать'.

Доминантой ЛСС болгарского языка является существительное ред 'ряд; очередь', вице-доминантой - прилагательное лют 'острый (на вкус) едкий; крепкий, сильный'.

Доминантой ЛСС греческого языка является глагол xävo> 'делать, совершать', вице-доминантой - глагол ßäfa 'класть, ставить; помещать'.

Доминантой ЛСС македонского языка является прилагательное црн 'черный', вице-доминантой - существительное ред 'ряд'.

Доминантой ЛСС румынского языка является глагол da 'дать, давать', вице-доминантой - глаголfi 'быть, существовать'.

Доминантой ЛСС турецкого языка является прилагательное кв1 'рука', вице-доминантой - существительное ad 'имя'.

Построение таблицы корреляции параметрических ядер лексики балканских языков

Сравнение между собой больших параметрических ядер (т.е. слов, вошедших в параметрическое ядро по трем и более параметрам) лексики балканских языков, осуществляемое на основании семантической близости, операционально понимаемой как совпадение не менее половины полнозначных слов в дефинициях, позволило вычислить коэффициент корреляции для всех пар языков и получить таблицу корреляции (табл. 6). Для двух языков с номерами 1, ] в общем списке обозначим коэффициент корреляции К.. Поскольку веса были нормированы, значения коэффициентов получились строго от 0 до 1. Единица - максимальная схожесть - для корреляции языка с самим собой, ноль - для абсолютно несхожих языков, у которых в большом параметрическом ядре не нашлось ни одной сходной по семантике лексемы. Итак, мы имеем таблицу этих коэффициентов, в ко -торой в верхней нулевой строке - список языков, в левом нулевом столбце - тот же список языков, а в каждой ячейке, находящейся в 1-й строке, в ]-м столбце - коэффициент корреляции, определяющий близость этих языков по количеству общих единиц.

Чтобы проанализировать эту таблицу, построим так называемую «лексико-семантическую карту балканских языков». Она позволит более наглядно представить полученные данные. Чем более похожи параметрические ядра лексики двух языков, тем больше коэффициент корреляции. Единица - расстояние от языка до абсолютно такого же языка, т.е. до него самого, ноль - максимальное расстояние между абсолютно непохожими параметрическими ядрами.

Т а б л и ц а 6

Коэффициенты корреляции параметрических ядер лексики балканских языков

Албанский Румынский Македонский Греческий Болгарский Турецкий

Албанский 0,51560 0,52095 0,41003 0,53316 0,29452

Турецкий 0,29452 0,16114 0,20206 0,15714 0,11236

Болгарский 0,53316 0,25722 0,11298 0,15556 0,11236

Румынский 0,51560 0,30588 0,24918 0,25722 0,16114

Македонский 0,52095 0,30588 0,22798 0,11298 0,20206

Греческий 0,41003 0,24918 0,22798 0,15556 0,15714

Сумма 2,27426 1,48902 1,36985 1,19989 1,17128 0,92722

Построение лексико-семантической карты балканских языков (ЛСКБЯ)

Наша задача - нанести на плоскость множество языков - точек - так, чтобы расстояние между каждыми двумя было бы равно рассчитанным величинам. Сразу оговоримся, что задача в общем случае решения не имеет, это можно доказать несложным математическим анализом. Но нам будет достаточно решить более упрощенную задачу: нанести на плоскость множество языков, расстояние между которыми было бы больше или равно рассчитанным величинам. Конечно, мы стремимся к максимальному соответствию построения проведенным расчетам.

Для начала простым сравнением всех рассчитанных расстояний определяем наименьшее. Таким образом выбираем два языка с номерами [ и_], наиболее схожие друг с другом. Наносим их в виде двух точек на плоскости, расстояние между которыми равно Я в выбранном масштабе.

Перебираем все остальные языки и выбираем тот из них, у которого сумма расстояний до двух уже нанесенных на карту является минимальной.

Помещаем новый язык на карту вблизи середины отрезка, получаем треугольник. Точка нанесена заведомо ближе, чем должна быть с учетом рассчитанных расстояний. Поэтому будем постепенно увеличивать расстояния от новой точки до уже имеющихся, перемещая новую точку, пока два расстояния не будут соответствовать заявленному условию (больше или равны рассчитанным значениям). Три точки нашли свое место.

Следующую точку мы можем поместить вблизи любого из отрезков треугольника. Перебираем все сочетания оставшихся языков и имеющихся отрезков границы треугольника и выбираем тот язык и ту границу, для которых сумма рассчитанных расстояний от нового языка до двух языков - вершин отрезка границы является минимальной. Наносим новую точку и снова двигаем ее, удаляя от уже имеющейся границы, пока все расстояния нашего построения не

будут удовлетворять условию задачи. Четыре точки нанесены, граница фигуры образовала четырехугольник.

В дальнейшем алгоритм тот же. Определяем следующий язык и следующий отрезок границы, выбирая наименьшую сумму расчетных расстояний, наносим новую точку с внешней стороны выбранной границы имеющейся фигуры, отодвигаем ее от фигуры, пока все расстояния до уже имеющихся вершин не станут больше или равны рассчитанным значениям из таблицы.

Если имеющаяся фигура имеет сложную конфигурацию и располагается вокруг новой точки, может возникнуть ситуация, при которой последовательными сдвигами от всех окружающих точек мы никогда не сможем удовлетворить условию нужной удаленности от всех нанесенных ранее точек. В этом случае вносим небольшую корректировку в алгоритм: позволяем не только более ранним точкам отодвигать от себя новую, но и новой точке понемногу выдавливать уже имеющиеся, освобождая себе пространство.

Шаги построения ЛСКБЯ представлены ниже.

Первым шагом при построении такой карты является выбор языков, для которых коэффициент корреляции является наибольшим. Это - болгарский и албанский.

Шаг 2. Строим в масштабе отрезок Болгарский-Албанский.

Шаг 3. Добавляем Румынский на линию Болгарский-Албанский.

Шаг 4. Добавляем Македонский на линию Румынский-Албанский.

Шаг 5. Добавляем Греческий на линию Македонский-Албанский.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Шаг 6. Объединение в линию: Греческий и Болгарский.

Шаг 7. Добавляем Турецкий на линию Румынский-Македонский.

Лексико-семантическая карта балканских языков представлена на рис. 6.

Болгарский

Румынский

у^Албанский ^^ \ / >v Турецкий

Греческий Македонский

Рис. 6. Лексико-семантическая карта балканских языков

Рисунок 6 свидетельствует о центральном месте албанского языка в Балканском ареале: у него представлены связи с 4 языками. Но по 4 связи имеют также румынский и македонский языки. Следующую группу образуют греческий и болгарский, у которых по 3 связи: друг с другом, с албанским, у болгарского

- с румынским, у греческого - с македонским. Такой набор связей представляется географически логичным. Периферийную позицию занимает лексика турецкого языка, связанная непосредственно только с румынским и македонским.

Сумма коэффициентов корреляции, представленная в табл. 6, дает более четкое представление о центральности-периферийности балканских языков по данным лексики. Наглядно распределение балканских языков по сумме коэффициентов корреляции представлено на рис. 7.

Как видно из рис. 7, центральное место албанского языка по данному параметру бесспорно, румынский и македонский занимают второе и третье место соответственно, а греческий и болгарский - четвертое и пятое, не сильно различаясь по значениям параметра. Периферийное место турецкого языка по данному параметру столь же бесспорно, сколь и центральное

- албанского языка.

2,5 г

2,0 1,5

1,о- ^Ж

0,5 "

о'—-----------L

Албанский Румынский Македонский Греческий Болгарский Турецкий

Рис. 7. Распределение балканских языков по сумме коэффициентов корреляции параметрических ядер их лексики

Итак, в соответствии с рис. 7, лексика указывает на албанский язык как на центр Балканского языкового союза и Албанско-румынско-македонский треугольник как на системообразующий для Балканского союза. Главными же событиями в формировании союза представляются контакты албанского и стоящих за ним фракийско-иллирийских ингредиентов с романской и славянской составляющими. Греческое и турецкое влияние на лексику, вопреки устоявшемуся мнению, основанному на подсчете заимствований, поверхностно, вторично и периферийно. Греко-турецкие заимствования охватывают преимущественно культурную лексику.

По справедливому замечанию А. Ю. Русакова и А. Н. Соболева, «обнаружение лингвистических констант Балканского полуострова следует признать основной теоретической целью балканского языкознания» [24, с. 8]. Обнаружение лексико-семантиче-ских констант Балканского языкового союза полуострова может стать частью этой задачи и представляет собой одну из ближайших перспектив данного исследования.

ЛИТЕРАТУРА

1. Kopitar Jernej K. Albanische, walachische und bulgarische Sprache / K. Kopitar Jernej // Jahrbücher der Literatur. - Wien, 1829. - № 46. - S. 59-106.

2. Трубецкой Н. С. « Вавилонская башня и смешение языков» / Н. С. Трубецкой // Евразийский временник.

- Берлин, 1923. - № 3. - С. 107-124.

3. Цивьян Т. В. Имя существительное в балканских языках : к структурно-типологической характеристике балканского языкового союза / Т. В. Цивьян. - М. : Наука, 1965. - 196 с.

4. Цивьян Т. В. Синтаксическая структура балканского языкового союза / Т. В. Цивьян. - М. : Наука, 1979.

- 304 с.

5. Лекомцева М. И. К типологии фонологических систем языков Балканского полуострова и Средиземноморья / М. И. Лекомцева // Устроение языка : сб. трудов.

- М. : ОГИ, 2007. - С. 103-131.

6. Филиппова-Байрова М. Гръцки заемни в съвреме-ния български език / М. Филиппова-Байрова. - София, 1969.

7. Avôpiœxqç NiKÔÀaoç. Та s^nviKà axoixeia t^ç ßou^yaptK^q y^œaanç [ Греческие элементы болгарского языка], 1952.

8. Avôpiœxqç NiKÔÀaoç. napà^n^oi an^aaio^oyiKai s^s^siç siç t^v s^nviK^v Kai siç à^aç y^œaaaç [Параллельное семасиологическое развитие в греческом и некоторых других языках], 1960.

9. Grannes А. Etude sur les turcismes en bulgare / A. Grannes. - Oslo, 1970.

10. Stachowski S. Fonetika zapozyczen osmansko-tu-reckich w jçzyku serbsko-chorwackim / S. Stachowski. -Wroc law ; Warszawa, 1973.

11. Skljic A. Turcizmi u srpskohrvatskom jeziku / A. Skljic. - Sarajevo, 1965.

12. Knezovic A. Die Turcizmen in der Sprache der Kroaten und Serben / A. Knezovic // Slavisch-Baltisches Seminar der Westfällischen Wilhelms-Uniwersität Münster (Westf.) MeisenHeim am Glan. - 1962. - № 3.

13. Поповик J. Новогрчке и среднегрчке позаjьмице у савременом српско-хрватском jезику / J. ПоповиЬ // Зборник радове. САН. XXXVI / Византиложки институт. Кн. 2. [Б. г.].

14. Поповик J. Грчке-српске лингвистичке студще. II Грчке позаjьмице у савременом српско-хрватском jезику / J. ПоповиЬ // Зборник радове. САН. XLIV / Византиложки институт. Кн. 3. [Б. г.].

15. Десницкая А. В. Славянские заимствования в албанском языке / А. В. Десницкая. - М., 1963.

16. Hinrichs Uwe. «Die sogenannten 'Balkanismen' als Problem der Südosteuropa-Linguistik und der allgemeinen Sprachwissenschaft» / Hinrichs Uwe. Hinrichs, U. (Hg.) Handbuch der Südosteuropa-Linguistik. - Wiesbaden : Harrassowitz, 1999. - S. 429-461.

17. Соболев А. Н. Антибалканизмы / А. Н. Соболев // Jужнословенски филолог. - 2011. - № LXVII. - С. 185195.

18. Бурлак С. А. Сравнительно-историческое языкознание : учеб. для студ. высш. учеб. заведений // С. А. Бурлак, С. А. Старостин. - М. : Академия, 2005. - 432 с.

19. Титов В. Т. Общая квантитативная лексикология романских языков / В. Т. Титов. - Воронеж : Изд-во Воронеж. гос. ун-та, 2002. - 240 с.

20. Титов В. Т. Частная квантитативная лексикология романских языков / В.Т. Титов. - Воронеж : Изд-во Воронеж. гос. ун-та, 2004. - 552 с.

21. Кретов А. А. Проблемы квантитативной лексикологии славянских языков /А. А. Кретов, И. А. Меркулова, В. Т. Титов // Вопросы языкознания. - М. : РАН, 2011. - № 1. - С. 52-65.

22. Балканский языковой союз // Википедия. - Режим доступа: http://ru.wikipedia.org/wiki/%D0%91% D0 %B0%D0%BB%D0%BA%D0%B0%D0%BD%D1%81%

Воронежский государственный университет Кретов А. А., доктор филологических наук, профессор, заведующий кафедрой теоретической и прикладной лингвистики

E-mail: [email protected] Тел.: 8(473)220-41-49

Титов В. Т., доктор филологических наук, профессор, заведующий кафедрой романской филологии E-mail: [email protected] Тел.: 8(473)253-22-38

Катов М. В., программист научно-методического центра компьютерной лингвистики E-mail: [email protected] Тел.: 8(473)220-41-49

D0%BA%D0%B8%D0%B9_%D1%8F%D0%B7%D1%8 B%D0%BA%D0%BE%D0%B2%D0%BE%D0%B9_%D 1%81%D0%BE%D1%8E%D0%B7.

23. Кретов А. А. Параметрическая стратификация новогреческой лексики : (по данным двуязычного словаря) // Проблемы компьютерной лингвистики : сб. науч. трудов / под ред. А. А. Кретова. - Воронеж. - 2011. -Вып. 5. - С. 166-204.

24. Русаков А. Ю. Субстанциально-функциональная теория балканского языкового союза и славянские языки : доклад к XIV Международному съезду славистов (Охрид, Македония, 10-16 сентября 2008 г.) / А. Ю. Русаков, А. Н. Соболев. - СПб. : Наука, 2008. - 40 с.

СЛОВАРИ-ИСТОЧНИКИ

1. Андрианов Б. А. Карманный румынско-русский словарь : ок. 8000 слов. - 3-е изд., испр. и доп. / Б. А. Андрианов. - М. : Сов. Энцикл., 1964. - 316 с.

2. Бондаренко А. В. Новогреческо-русский и русско-новогреческий словарь общеупотребительной и деловой лексики / А. В. Бондаренко. - М. : АСТ : Астрель, 2002.

- 256 с.

3. Леонидова М. А. Карманный болгарско-русский словарь. Джобен българско-русски речник : 10 000 слов.

- 9-е изд., испр. и доп. / М. А. Леонидова. - М. : Рус. яз., 1986. - 468 с.

4. Толовски Д. Македонско-русский словарь : 30 000 слов, с прил. краткого грамматического справочника, сост. В. М. Иллич-Свитычем / Д. Толовски. - М. : Гос. изд-во иностранных и национальных словарей, 1963. - 576 с.

5. Кочи Р. Д. Краткий албанско-русский словарь : 13 000 слов / сост. : Р. Д. Кочи [и др.] ; ред. А. Костал-лари, с прил. краткого очерка грамматики албанского языка, сост. Б. А. Серебренниковым. - 2-е изд., перераб. и доп. - М. : Гос. изд-во иностранных и национальных словарей, 1951. - 547 с.

6. Щербинин В. Г. Краткий турецко-русский словарь : ок. 10 000 слов / В. Г. Щербинин. - М. : Рус. яз., 1977. - 405 с.

Voronezh State University

Kretov А. А., Doctor of Philology, Professor, Head of the Theoretical and Applied Linguistics Department

E-mail: [email protected]

Tel.: 8(473)220-41-49

Titov V. T., Doctor of Philology, Professor, Head of the Roman Philology Department

E-mail: [email protected]

Ш.: 8(473)253-22-38

KatovM. V., Programmer of the Theoretical and Applied Linguistics Department

E-mail: [email protected]

Ш.: 8(473)220-41-49

i Надоели баннеры? Вы всегда можете отключить рекламу.