Научная статья на тему 'О слоговой структуре слов узбекского языка'

О слоговой структуре слов узбекского языка Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
632
103
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

In the article concepts of uzbek word structure and uzbek syllable structure are introduced. On the basis of statistical processing to a representative sampling, made up by various uzbek texts, 1613 different syllable structures of uzbek words and 6 different structures of uzbek syllables are brought to light.

Текст научной работы на тему «О слоговой структуре слов узбекского языка»

ДОКЛАДЫ АКАДЕМИИ НАУК РЕСПУБЛИКИ ТАДЖИКИСТАН ___________________2007, том 50, №7____________

ИНФОРМАТИКА

УДК 410:31+414.7+943.75

Ш.А.Шарипов

О СЛОГОВОЙ СТРУКТУРЕ СЛОВ УЗБЕКСКОГО ЯЗЫКА

(Представлено академиком АН Республики Таджикистан З.Д.Усмановым 28.12.2007 г.)

Слогом, согласно определению, называется минимальная произносительная единица речи, состоящая из одного или нескольких звуков, которые образуют тесное фонетическое единство [1]. В соответствии с несколько иной эквивалентной интерпретацией, слог - это звук или сочетание звуков в слове, произносимых одним толчком выдыхаемого воздуха [2].

Для изучения закономерностей узбекского языка, связанных с понятием слога, воспользуемся, следуя [3], понятием слоговой структуры слова. Пусть Ж - какое-либо слово, представляющее собой определенную последовательность букв. Замещая в нем гласные буквы символом б, а согласные - символом И (букву “й” считаем согласной), мы тем самым преобразуем слово Ж в упорядоченную совокупность Ж,,,к . Такое преобразование назовем (в,Ь)-кодированием слова Ж, а получаемый результат, то есть запись Ж*к - слоговой структурой слова Ж . Очевидно также, что всякому слову Ж ставится в соответствие один и только один образ Ж,,,ь . В свою очередь, по существу и для любого естественного языка, всякому Жх й соответствует одновременно несколько слов Ж . Это значит, что различные слова с одинаковым числом букв могут обладать одинаковой слоговой структурой. Например, словам “хизмат”, “Тошкент” и тому подобным соответствует одна и та же структура “Ив^вЬ”.

Результаты, формулируемые в дальнейшем, основаны на статистической обработке репрезентативной выборки, составленной из фрагментов произведений Ш.Рашидова (“Аликулнинг саргузашти” - 9 стр.), А.Мухтора (“Найманча азалдан косиблар махдлласи” - 10 стр.), Д.Алимова (“Маданиятимиз тарихи” - 9 стр.), А.Кодирий (“Ут-ган кунлар” - 10 стр.), ДДодирий (“Отам ^акида” - 9 стр.), Х,.Еулома (”Даёт самоклари” - 10 стр.), О.Ёкубова (’’Улугбек хазинаси” - 9 стр.), Н.Думбадзе (”Абадият конуни” - 11стр.), Х.Тухтабоева (”Сарик девни миниб” - 10 стр., Т.Малика (”Бир кеча бир куча”, ”Самарканд хаёли” - 19 стр.), Ч.Айтматова (”Кдйта куриш” -10 стр.), С.Айни (“Куллар” - 250 стр.), из газет и журналов, а также узбекские тексты из 1п1егпе1 (250 стр.).

Объем репрезентативной выборки составил 625 стр., содержащих 273190 слов. В дальнейшем образы этих слов, то есть соответствующие им слоговые структуры, представленные множеством {{ й } ,стали объектом статистического анализа.

1. На множестве {^*й) обнаружено 1613 различных слоговых структур узбекских

слов, при этом 1 и 24 - размерности минимальной и максимальной структур слов соответственно.

2. Получено статистическое распределение структур, то есть установлено соответствие между слоговыми структурами слов и частотами их встречаемости в текстах на узбекском языке.

Таблица 1

№ % № % № %

1 ЬбЬбЬ ЬбЬ ЬбЬЬбЬ ЬбЬЬб Ьб ЬбЬб ЬбЬбЬб бЬбЬ ЬбЬбЬбЬ ЬбЬбЬЬб ЬбЬЬбЬб 8.674 12 бЬЬбЬ 2.027 23 бЬЬбЬб 0.931

2 7.866 13 ЬбЬЬбЬбЬ 2.005 24 бЬбЬбЬ 0.907

3 6.456 14 ЬбЬбЬЬбЬ 1.954 25 ЬбЬбЬбЬбЬ 0.864

4 5.539 15 бЬб 1.944 26 бЬбЬб 0.849

5 3.946 16 бЬЬб 1.784 27 бЬбЬЬбЬ 0.834

6 3.778 17 ЬбЬбЬбЬб 1.720 28 бЬЬбЬбЬ 0.833

7 3.473 18 ЬбЬЬбЬЬб 1.532 29 бЬбЬЬб 0.793

8 3.278 19 ЬбЬЬбЬбЬб 1.315 30 б 0.751

9 2.856 2.256 2.233 20 21 22 ЬдЬЬдЬЬдЬ ЬбЬЬ бЬ 1.221 1.156 1.066 31 ЬбЬбЬбЬЬб 0.708

10

11

3. Обнаружено, что 11 структур осуществляют 50%-е, а 31 структуры -75%-е покрытие узбекских текстов. Эти данные представлены в табл. 1. В первой колонке дается номер структуры (в порядке убывания частоты её встречаемости), во второй - запись самой структуры и в третьей - процент её встречаемости в текстах. Отметим, что первые 11 наиболее часто встречающиеся структуры закрашены серым цветом.

4. Обнаружено, что 79 структур осуществляют 90%-е покрытие узбекских текстов. Эти данные представлены в продолжении таблицы. Кроме того, 150 структур встретились 259589 раз и составили 95%-е покрытие текстов.

5. Каждая из 150 структур разделялась на слоги “вручную” (в согласии с разделением на слоги тех слов, которые подпадали под те или иные структуры). Выявлено всего лишь шесть различных структур слогов - б, бЬ, Ьб, ЬбЬ, бЬЬ и ЬвЬЬ.

6. Частота встречаемости упомянутых структур среди 655545 слогов, полученных при разбиении на слоги 273190 слов, принадлежавших 150 различным слоговым структурам узбекских слов, указана в табл. 2.

Из представленных статистических данных видно, что двухбуквенные слоги типа га, ла, ки, на, ни, та, ме, ва, ту (в символьной записи - Ьб) и тому подобные являются наиболее часто встречающимися, а трехбуквенные слоги типа аср, исо, инг авж, абд, адл, акс, агл (в символьной записи - бЬЬ) и тому подобные - особо редкими.

Продолжение таблицы 1

№ % № >Н % № >Н %

32 0.706 48 0.366 64 0.186

33 0.571 49 Ь8ЬЬ8ЬЬ8Ь8 0.356 65 Ь8Ь8Ь8ЬЬ 0.186

34 0.546 50 Ь8Ь8ЬЬ8Ь8Ь8 0.337 66 8Ь8ЬЬ8ЬЬ8 0.184

35 0.538 51 8ЬЬ8Ь8ЬЬ8Ь 0.306 67 8ЬЬ8Ь8ЬЬ8 0.176

36 0.496 52 ЬдЬЬЬдЬ 0.291 68 8Ь8ЬЬ8Ь8Ь8 0.174

37 0.474 53 ЬдЬдЬЬдЬЬ 0.279 69 ЬдЬЬдЬдЬЬ 0.171

38 0.467 54 Ь8ЬЬ8Ь8Ь8Ь8 0.273 70 ЬдЬЬдЬЬдЬЬдЬ 0.167

39 0.460 55 Ь8ЬЬ8ЬЬ8ЬЬ8 0.272 71 8Ь8Ь8ЬЬ8 0.164

40 Ь8Ь8ЬЬ8Ь8Ь 0.450 56 Ь8Ь8ЬЬ8ЬЬ8Ь 0.269 72 Ь8Ь8Ь8Ь8Ь8Ь 0.158

41 Ь8ЬЬ8Ь8ЬЬ8 0.441 57 8ЬЬ8Ь8Ь8Ь 0.256 73 8Ь8Ь8Ь8Ь8 0.158

42 8ЬЬ8Ь8Ь8 0.441 58 8Ь8ЬЬ8ЬЬ 0.248 74 Ь8Ь8Ь8Ь8ЬЬ8 0.148

43 8Ь8ЬЬ 0.439 59 Ь8ЬЬ8ЬЬ8Ь8Ь 0.233 75 Ь88Ь 0.148

44 ЬдЬЬдЬЬ 0.435 60 Ь8ЬЬ8ЬЬ8Ь8Ь8 0.224 76 Ь8ЬЬЬ8Ь8 0.140

45 Ь8Ь8ЬЬ8ЬЬ8 0.424 61 ЬдЬЬдЬЬдЬЬ 0.215 77 Ь8Ь88Ь 0.128

46 Ь8ЬЬЬ8 0.405 62 8Ь8Ь8Ь8Ь 0.215 78 8Ь8ЬЬ8Ь8Ь 0.127

47 Ь8ЬЬ8Ь8ЬЬ8Ь 0.372 63 Ь8Ь8Ь8ЬЬ8ЬЬ 0.210 79 8ЬЬ8Ь8ЬЬ8ЬЬ8 0.124

Таблица 2

Слоги в символьной записи Частота встречаемости в % Частота встречаемости, абсолютная величина

б 3.820 25044

бЬ 7.083 46433

Ьб 49.846 362765

ИбЬ 35.908 235 391

бЬИ 0.564 3699

ИвЬИ 2.778 18 213

7. Отметим также, что 2 двухбуквенных слога Ьб и бЬ совместно с трехбуквенным слогом ИбЬ составляют подавляющую часть слогов узбекского языка. Кроме того, 2.7 - средняя размерность слогов в узбекском слове.

8. Частота встречаемости узбекских слов в зависимости от числа букв представлена в

табл. 3.

Таблица 3

Длина слова (число букв) 1 2 3 4 5 6 7 8 9 10 11 12

Кол. слоговых структур 2 4 8 13 22 42 51 75 97 125 157 165

Длина слова (число букв) 13 14 15 16 17 18 19 20 21 22 23 24

Кол. слоговых структур 170 163 151 125 94 80 38 15 9 5 3 2

9. В табл. 4 представлены данные о частоте встречаемости узбекских слов с тем или иным количеством слогов.

Таблица 4

Количество слогов в слове 1 2 3 4 5 б 7 S 9 10

Частота встречаемости в% 15.32 3б.39 26.S9 14.31 5.4 1.41 0.29 0.05 0.005 0.002

Технологический университет Таджикистана Поступило 28.12.2007 г.

ЛИТЕРАТУРА

1. Советский энциклопедический словарь. М.: Советская энциклопедия, 1980, 1600 с.

2. Ожегов С.И. Словарь русского языка. М.: Русский язык, 1984, 816 с.

3. Усманов З.Д., Худойбердиев Х.А. - ДАН РТ, т.49, № 6, 2006, с. 489-492.

Ш.А.Шарипов

ДАР БОРАИ СОХТИ ^И^ОГИИ КАЛИМА^ОИ УЗБЕКИ

Дар мак;ола мафх,уми сохти калимах,ои узбекй ва х,ичох,ои узбекй оварда шуда-анд. Дар асоси коркарди омории интихобе, ки аз матнх,ои гуногуни бо забони узбекй навишта шуда иборатанд, 1613 намуди гуногуни сохти хдчогии калимах,ои узбекй ва 6 намуди сохти хдчои калимах,ои узбекй дарёфт карда шуданд.

Sh.A.Sharipov

ON A SYLLABLE STRUCTURE OF UZBEK WORDS

In the article concepts of uzbek word structure and uzbek syllable structure are introduced. On the basis of statistical processing to a representative sampling, made up by various uzbek texts, 1613 different syllable structures of uzbek words and 6 different structures of uzbek syllables are brought to light.

5S4

i Надоели баннеры? Вы всегда можете отключить рекламу.