Научная статья на тему 'О статистическом анализе согласных на уровне текста'

О статистическом анализе согласных на уровне текста Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
93
19
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭПОС «МАНАС» / ВАРИАНТ ЖУСУПА МАМАЯ / УРОВЕНЬ ТЕКСТОВ / СЛОВОФОРМА / СОГЛАСНЫЕ ЗВУКИ / ЧАСТОТА И ДОЛЯ УПОТРЕБЛЕНИЯ / СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ / EPOS "MANAS" / JUSUP MAMAY''S VERSION / LEVEL OF TEXTS / WORD FORM / FREQUENCY AND PERCENTAGE OF USE / STATISTICS OF CONSONANT SOUNDS

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Шерова А.

Вариант эпоса “Манас” по версии Жусупа Мамая, записанный в Китайской Народной Республике самим сказителем, был издан путем транслитерации с арабской графики на кириллицу в большом однотомнике. Анализ статистики употребления звуков производился на базе корпуса лексики эпоса. Объём вариантаэпоса 750904 словоупотреблений, число разных словоформ 58 690 единиц. Путем компьютерной обработки текста эпоса были установлены: общее число звуков корпуса 4 281174, в том числе общее число согласных 2493 157, общее число гласных 1 788 017. В статье обсуждаются результаты анализа статистики употребления согласных звуков на уровне текста.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Шерова А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The epic "Manas" according to version Jusup Mamay's was recorded in the People's Republic of China by the narrator himself and published by transliteration from Arabic to Cyrillic alphabet in a large one book with a volume of 1782 pages of text. An analysis of the statistics of the epic sounds was made on the basis of this corpus. The volume of the body is 750904 words; the number of different word forms is 58690 units. By computer processing the statistics of the sounds were established: the total number of the hull sounds is 4281174, including the total number of consonants 2493157, the total number of vowels is 1788017. The article discusses the results of the analys is of the statistics of consonant sounds at the text level.

Текст научной работы на тему «О статистическом анализе согласных на уровне текста»

Шерова А.

О СТАТИСТИЧЕСКОМ АНАЛИЗЕ СОГЛАСНЫХ НА УРОВНЕ

ТЕКСТА

Баткенский государственный университет

Аннотация: Вариант эпоса "Манас" по версии Жусупа Мамая, записанный в Китайской Народной Республике самим сказителем, был издан путем транслитерации с арабской графики на кириллицу в большом однотомнике. Анализ статистики употребления звуков производился на базе корпуса лексики эпоса. Объём вариантаэпоса -750904 словоупотреблений, число разных словоформ - 58 690 единиц. Путем компьютерной обработки текста эпоса были установлены: общее число звуков корпуса - 4 281174, в том числе общее число согласных - 2493 157, общее число гласных - 1 788 017. В статье обсуждаются результаты анализа статистики употребления согласных звуков на уровне текста.

Ключевые слова: эпос «Манас», вариант Жусупа Мамая, уровень текстов, словоформа, согласные звуки, частота и доля употребления, статистические характеристики.

Abstract: The epic "Manas" according to version Jusup Mamay's was recorded in the People's Republic of China by the narrator himself and published by transliteration from Arabic to Cyrillic alphabet in a large one book with a volume of 1782 pages of text. An analysis of the statistics of the epic sounds was made on the basis of this corpus. The volume of the body is 750904 words; the number of different word forms is 58690 units. By computer processing the statistics of the sounds were established: the total number of the hull sounds is 4281174, including the total number of consonants 2493157, the total number of vowels is 1788017. The article discusses the results of the analys is of the statistics of consonant sounds at the text level.

Keywords: epos "Manas", Jusup Mamay's version, level of texts, word form, frequency and percentage of use, statistics of consonant sounds.

Одним из важных событий в культурной жизни явилось издание полного корпуса эпоса "Манас" по варианту Жусупа Мамая, который был записан в Китайской Народной Республике. Этот вариант, переведённый по транслитерации с арабского на кириллицу, состоит из 1782 страниц и стал достоянием общественности и широкого круга читателей. В настоящее время ведутся работы по подготовке толкового словаря словоуказателей эпоса «Манас» как по

рассматриваемому варианту, так и по другим вариантам. Предлагаемое исследование внесёт огромный вклад в развитие кыргызского языкознания в направлении компьютерной лексикографии.

Цель нашего исследования - выделить согласные звуки из числа всех употребленных в эпосе звуков и провести их фоностатистический анализ по четырём признакам, а именно, по способу и месту образования согласных, по их парности-непарности и твёрдости-мягкости. При этом учитывались мнения разных ученыхтаких, как Дж. Гринберг, В.Никонов и др. Так, по мнению Дж. Гринберга, являющегося отцом квантитативной лингвистики, для проведения фоностатистического исследования типологии любого языка достаточен текст, состоящий из 100 звукоупотреблений [4]. Однако мы считаем, чтодля достижения более высокой достоверности исследования необходимо рассмотреть текст с объемом в 1 миллион звукоупотреблений.

Статистические расчеты выполнялись на компьютере и путем обработки всего корпуса текста эпоса с учетом употребления согласных в позициях начала, середины и конца слова. Результаты обработки можно представить в виде следующего частотного словаря согласных звуков (табл. 1).

Таблица 1 - Сводные данные частотного словаря согласных звуков

№ Звук Частота Доляв %

1 к 316 935 12,8 %

2 н 296 248 11,9 %

3 т 231 237 9,3 %

4 р 220 752 8,9 %

5 л 213 553 8,7 %

6 д 166 143 6,7 %

7 б 162 136 6,6 %

8 п 151 270 6,1 %

9 й 124 771 5,0 %

10 г 109 894 4,4 %

11 м 105 505 4,3 %

12 с 98 424 3,9 %

13 ж 76 050 3,0 %

14 ч 65 102 2,7 %

15 ш 61 416 2,5 %

16 з 46 538 1,9 %

17 н 42 561 1,7 %

18 х 4 421 0,2 %

19 в 112 0,004 %

20 ф 89 0,003 %

Всего 2493 157 100%

Как видим, для формирования текста эпоса участвуют 20 согласных звуков, которые естественно имеют разные частотные характеристики и соответственно разные функциональные силы. С этой зрения согласные группируются так:

1. Группа наиболее высокочастотных согласных содержит увулярно-велярную фонему к и дентально-носовую фонему н [1]. В пределах данной группы частота встречаемости у фонемы к - 316 935 раз, доля - 12,8%; а частота встречаемости у фонемы н - 296 248 раз, доля - 11,9%. Их суммарная доля - 25%, а долявсех остальных 18 согласных - 75%. Это говорит о том, что 25% всех словоформ эпоса образуется за счет только согласных к, н. То есть каждый четвертый согласный звук эпоса относитсяименно к этой группе.

2. Группу высокочастотных согласных, куда входят дентальный глухой звук т и переднеязычные сонорные л, р. [7]. Суммарная частота группы - 666 542, доля-27% всех согласных. При этомвнутри данной группыкаждый из согласных характеризуется так:

- согласный т: частота употребления- 231 237, доля - 9,3%;

- согласный л: частота употребления- 220 752, доля - 8,9 %;

- согласныйр: частота употребления- 213 553, доля - 8,7%.

Вызывает интерес факт того, что суммарная частота употребления

согласных у первых двух групп примерно равная, т.е. доля у первой группы -25%, а у второй - 27%. Это значит, что с помощью согласных этих двух групп образуется больше половины всех словоформэпоса «Манас». То есть семиотическая сила «быть означающим» у этих 5 согласных к, н, т, л, р равна статистической силе всех остальных 15 согласных.

3. Группа среднечастотных согласных содержит консонанты д, б, п, й, которые характеризуются следующим образом:

- согласный д: частота употребления- 166 143, доля - 6,7%;

- согласный б: частота употребления-162136, доля - 6,6%;

- согласный п: частота употребления-151270, доля - 6,1 %;

- согласный й: частота употребления- 124 771, доля - 5,0 %.

Суммарная частота группы - 604 320, доля - 24,24% всех

согласных. Если сравнить статистические характеристики всех трех групп, то выясняется, что каждый из них имеет примерноодинаковую 25,0%долюупотребления. Это значит, что,благодаря тождественности статистическихсил, каждая из этих групп способна образовать одну четвертую часть всех словоформ, употребленных в корпусе текстов варианта Жусупа Мамая.

4. Редкочастотная группа, куда входят согласныег, м, с, ж, ч, ш, з, ц, характеризуются так:

- согласный г: частота употребления - 109 894, доля - 4,4%;

- согласный м: частота употребления - 105 505, доля - 4,3%;

- согласный с: частота употребления - 98 424, доля - 3,9 %;

- согласный ж: частота употребления - 76050, доля - 3,0 %;

- согласный ч: частота употребления - 65 102, доля - 2,7 %;

- согласный ш: частота употребления - 61 416, доля - 2,5 %;

- согласный з: частота употребления - 46 538, доля - 1,9 %;

- согласный ц: частота употребления - 42 561, доля - 1,7 %.

Суммарные характеристикиэтой группы: частота группы - 605490,

доля - 24,28% всех согласных. Ясно, что, благодаря такой статистической силе, данная группа также способна образовать одну четвертую часть всех словоформ, представленных в варианте Жусупа Мамая.

5. Наиболее низкочастотная группа содержит согласные звуки х, в, ф, которые, как правило, встречаются в составе словоформ иноязычного заимствования [2]. Суммарная доля этой группы ничтожно малая и составляет примерно 0,2 % всех употреблений всех согласных звуков.

Если произвести сравнение фоностатистических данных по позициям словоформы, то выясняется примерно такая картина:

1. В позиции начала слова встречаютс почти все согласные (за исключением носового ц), которые зафиксированы в тексте эпоса 750 904 раз. Из них функционально наиболее активными являются следующие согласные:

а) согласный к: частота употребления - 181294, доля - 24,14%;

б) согласный б: частота употребления - 101207, доля - 13,48%.

2. В позиции середины слова зафиксированы все 20 согласных звуков. Из них наиболее активными являются следующие неносовые сонанты:

а) согласный л: частота употребления - 193 010, доля - 14,0 %;

б) согласныйр: частота употребления - 177 461, доля - 13,0 %.

3. В позиции конца слова зафиксированы все 20 согласных звуков, из них наиболее активными являются следующие:

а) согласный н: частота употребления - 152595, доля - 20,32%;

б) согласный п: частота употребления - 124835, доля - 16,62 %.

Фоностатистический спектр согласных на уровне их

различительных признаков выглядит примерно так:

1. Способ образования согласных. Этот признак, имеющий артикуляционную основу, делит звуковое пространство согласных на две группы: на смычные и щелевые согласные [2, с. 114]:

1) смычные согласные:

к 316 935 18,39%

н 296 248 17,19%

т 231 237 13,42%

д 166 143 9,64%

б 162 136 9,41%

п 151 270 8,78%

г 109 894 6,38%

м 105 505 6,12%

ж 76 050 4,41%

ч 65 102 3,78%

Ц 42 561 2,47 %

Всего: 1 723 081 100%

Как видим, в эпосе общая частота смычных - 1 723 081, доля -69,11%, т.е. почти 7 из 10 словоформ формируются за счет смычных согласных. Что касается их доли внутри данной группы, то она делит их на следующие 4 подгруппы:1) к, н - 35,58%; 2) т - 13,42%; 3) д, б, п, г, м - 40,33%; 4)ж, ч, ц - 10,66%.

2) щелевые согласные:

р 220 752 28,67%

л 213 553 27,73%

й 124 771 16,20%

с 98 424 12,78%

ш 61 416 7,98%

з 46 538 6,04%

х 4 421 0,57%

в 112 0,014%

ф 89 0,011%

Всего: 770076 100%

Как видно, в эпосе общая частота щелевых - 770076, доля -30,89%. То есть функциональная сила у щелевых согласных почти 3 раза ниже, чем у смычных.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Эти согласные статистически распадаются на следующие группы: 1) р, л - 56,4%; 2) й- 16,20%; 3) с -12,78%; 4) ш, з - 14,02%; 5) х, в, ф - 0,60%.

Здесь функциональная сила неносовых сонантов преобладают над остальными щелевыми согласными. Их соотношение примерно: 75% -25%, т.е. статистически из всех щелевых согласных, участвующих в формировании текстовой формы слов, доля неносовых сонантов равно 75%.

2. Место образования согласных. Этот признак, также имеющий артикуляционную основу [5], делит звуковое пространство согласных

на следующие группы:

Дентальные (т, д, н, с, з, л) 1 052 143 40,0%

Велярные (к, г, х, ц) 473 811 20,0%

Препалатальные (ч, р) 423 320 18,0%

Лабиальные (п, б, м, ф, в) 419 112 17,0%

Палатальные (й) 124 771 5,0%

Всего: 2 493 157 100,0%

Для проведения сравнительного анализа локальных рядов согласных эти данные удобно представить в следующем виде (Таблица 2).

Таблица 2 - Сравнительный анализ групп звукового пространства

Дентальные Велярно-увулярные Лабиальные Препалатальные Палатальные Всего

40% 20% 18% 17% 5,0% 100%

Как видим, из всех локальных рядов функционально самой сильной является группа дентальных согласных, шумообразующая преграда которых на пути протекания воздуха через ротовую полость образуется путем смыкания или сближения кончика языка с лингвальным склоном верхних зубов. Доля этой группы - чуть больше 40%.

Далее следует группа велярно-увулярных согласных с функциональной силой 20%, что в два раза ниже, чем у дентальных согласных.

Остальные группы лабиальных (18%) и препалатальных (17%) согласных имеют примерно такую же функциональную силу, как у группы велярно-увулярных. При этом особняком выделяется последняя палатальная группа, в состав которой входит сонорный звук й с функциональной силой 5%.

3. Соотношение шума и звука. По данному признаку обычно различают группы шумных и сонорных согласных, из которых шумные согласные бывают функционально парными [3; 6]. Следовательно, на основе соотношения шума и звука можно выделить группы парных и сонорных согласных, которые верифицируются следующими статистическими данными:

1) парные согласные:

к 316 935 21,27%

т 231 237 15,52%

д 166 143 11,15%

б 162 136 10,88%

п 151 270 10,15%

г 109 894 7,38%

с 98 424 6,61%

ж 76 050 5,10%

ч 65 102 4,37%

ш 61 416 4,12%

з 46 538 3,12%

х 4 421 0,30%

в 112 0,01%

ф 89 0,006%

Всего: 1 489 767 100%

Следовательно, в эпосе общая частота парных - 1 489 767, доля -59,75%. Это значит, что почти 60% согласных, участвующих в формировании грамматических форм слов на уровне текстов эпоса, являются парными. В пределах данной группы наиболее функционально сильными являются согласные к, т с суммарной долей 36,8%, сильными - согласные д, б, п с суммарной долей 32,2%, слабыми - согласные г, с, ж, ч, ш, з с суммарной долей 30,7%, самыми слабыми -согласные х, в, ф с суммарной долей 0,32%, которые встречаются исключительно в иноязычных заимствованиях;

2) сонорные согласные:

н 296 248 29,52 %

р 220 752 22,00 %

л 213 553 21,28 %

й 124 771 12,43 %

м 105 505 10,51 %

ц 42 561 4,24 %

Всего: 1 003 390 100 %

Несмотря на то, что в состав сонорных входят только шесть согласных, их функциональная сила довольно велика, а именно: общая частота - 1003390, доля - 40,0%. Одновременно в пределах данной группы наиболее функционально сильным является дентальный носовой н с долей 29,5 %, сильными - согласные р, л с суммарной долей 43,3%, слабыми - согласные й, м с суммарной долей 13,0%, наиболее слабым - велярный носовой ц с суммарной долей 4,2%.

Заметим, что для полной верификации статистических характеристикфункционально наиболее сильных сонантов н, р, л требуется дополнительное исследование на базе словоформ,

представленных в полном корпусе эпоса. Тем не менее, предварительно можно предположить, что функциональной активности этих сонорных способствуют следующие факторы:

а) активность аффиксов типа -нын, -ны, -ныкы, -ган с анлаутом и ауслаутом на н в агглютинативном механизме всех тюркских языков;

б) многочисленность производных и непроизводных основ нанв этих же языках.

Таким образом, представленные здесь фоностатистические данные о сфере употребления согласных звуков в эпосе «Манас» в варианте Жусупа Мамая безусловно являются неполными, которые требуют дальнейшего изучения на разных уровнях лингвистической парадигмы.

4. Признак звонкости-глухости. Данный признак артикуляционно основывается на наличие или отсутствие голоса при произношении согласных. По этому признаку согласные делятся на группы звонких и глухих согласных [2, с. 114].

Частотность и доля употребляемости глухих согласных звуков в тексте эпоса определяются так:

к 316 935 34,12%

т 231 237 24,89%

п 151 270 16,28%

с 98 424 10,60%

ч 65 102 7,01%

ш 61 416 6,61%

х 4 421 0,48%

ф 89 0,01%

Всего: 928 894 100%

Следовательно, доля глухих согласных составляет 37,26%всех парных согласных, употребленных в тексте эпоса. Из всех глухих согласных самый сильный - к, сильные - т, п, слабые - с, ч, ш, самые слабые - х, ф.

Частотность и доля употребляемости звонких согласных звуков характеризуется следующим образом:

д 166 143 29,62%

б 162 136 28,91%

г 109 894 19,59%

ж 76 050 13,56%

з 46 538 8,30%

в 112 0,02%

Всего: 560 873 100 %

Как видим, доля звонких согласных составляет 22,49%всех парных согласных, зафиксированных в эпосе. Из всех звонких согласных функционально наиболеесильными являются согласные д, б, сильными - согласные г, ж; слабым - согласный з, самым слабым -согласный в.

Таким образом, если принять общую частоту (1 489 767) всех парных согласных за 100,0%, то соотношение глухих и звонких согласных выглядит так: общая частота глухих - 928894, доля-62,35%; общая частота звонких - 560873, доля -37,65%. Это значит, что функционально глухие согласные почти 2 раза сильнее, чем звонкие согласные.

Список литературы

1. Аладьина О.И., Веракша Т.В., Корнилов А.А., Федорова Г.А. Изучаем русскую грамматику. - Санкт-Петербург, 2000. - 104 с.

2. Вагнер К.Р. К вопросу об истоках и классификациях английских метеорологических народных примет // Вестник развития науки и образования. 2009. № 4. С. 65-69.

3. Изотова Н.В.О диалоге как фрагменте художественного текста // Предложение и слово Вторая Международная научная конференция: межвузовский сборник научных трудов. Под общей редакцией Э.П. Кадькаловой. 2002. С. 123-125.

4. Садыков Т., Шаршембаев Б., Шерова А. О фоностатистике словаря // Наука, новые технологии и инновации Кыргызстана. 2017. № 6. С. 191-194.

5. Симонова О.А., Ситникова А.Ю., Семилеева И.А.Урбанонимы сургута и способы их перевода на английский язык // Перевод в меняющемся мире Материалы Международной научно-практической конференции. 2015. С. 272-276.

6. Ходанен Л.А. Миф в художественном мире М. Ю. Лермонтова. - Кемерово, 2008. - 104 с.

7. Панков Ф.И. Позиции адвербиальных синтаксем (фрагмент функционально-коммуникативной лингводидактической модели русской грамматики) // Вестник Московского университета. Серия 9: Филология. 2006. № 4. С. 1-34.

i Надоели баннеры? Вы всегда можете отключить рекламу.