ДОКЛАДЫ АКАДЕМИИ НАУК РЕСПУБЛИКИ ТАДЖИКИСТАН ___________________2007, том 50, №7____________
ИНФОРМАТИКА
УДК 410:31+414.7+943.75
Ш.А.Шарипов
О СЛОГОВОЙ СТРУКТУРЕ СЛОВ УЗБЕКСКОГО ЯЗЫКА
(Представлено академиком АН Республики Таджикистан З.Д.Усмановым 28.12.2007 г.)
Слогом, согласно определению, называется минимальная произносительная единица речи, состоящая из одного или нескольких звуков, которые образуют тесное фонетическое единство [1]. В соответствии с несколько иной эквивалентной интерпретацией, слог - это звук или сочетание звуков в слове, произносимых одним толчком выдыхаемого воздуха [2].
Для изучения закономерностей узбекского языка, связанных с понятием слога, воспользуемся, следуя [3], понятием слоговой структуры слова. Пусть Ж - какое-либо слово, представляющее собой определенную последовательность букв. Замещая в нем гласные буквы символом б, а согласные - символом И (букву “й” считаем согласной), мы тем самым преобразуем слово Ж в упорядоченную совокупность Ж,,,к . Такое преобразование назовем (в,Ь)-кодированием слова Ж, а получаемый результат, то есть запись Ж*к - слоговой структурой слова Ж . Очевидно также, что всякому слову Ж ставится в соответствие один и только один образ Ж,,,ь . В свою очередь, по существу и для любого естественного языка, всякому Жх й соответствует одновременно несколько слов Ж . Это значит, что различные слова с одинаковым числом букв могут обладать одинаковой слоговой структурой. Например, словам “хизмат”, “Тошкент” и тому подобным соответствует одна и та же структура “Ив^вЬ”.
Результаты, формулируемые в дальнейшем, основаны на статистической обработке репрезентативной выборки, составленной из фрагментов произведений Ш.Рашидова (“Аликулнинг саргузашти” - 9 стр.), А.Мухтора (“Найманча азалдан косиблар махдлласи” - 10 стр.), Д.Алимова (“Маданиятимиз тарихи” - 9 стр.), А.Кодирий (“Ут-ган кунлар” - 10 стр.), ДДодирий (“Отам ^акида” - 9 стр.), Х,.Еулома (”Даёт самоклари” - 10 стр.), О.Ёкубова (’’Улугбек хазинаси” - 9 стр.), Н.Думбадзе (”Абадият конуни” - 11стр.), Х.Тухтабоева (”Сарик девни миниб” - 10 стр., Т.Малика (”Бир кеча бир куча”, ”Самарканд хаёли” - 19 стр.), Ч.Айтматова (”Кдйта куриш” -10 стр.), С.Айни (“Куллар” - 250 стр.), из газет и журналов, а также узбекские тексты из 1п1егпе1 (250 стр.).
Объем репрезентативной выборки составил 625 стр., содержащих 273190 слов. В дальнейшем образы этих слов, то есть соответствующие им слоговые структуры, представленные множеством {{ й } ,стали объектом статистического анализа.
1. На множестве {^*й) обнаружено 1613 различных слоговых структур узбекских
слов, при этом 1 и 24 - размерности минимальной и максимальной структур слов соответственно.
2. Получено статистическое распределение структур, то есть установлено соответствие между слоговыми структурами слов и частотами их встречаемости в текстах на узбекском языке.
Таблица 1
№ % № % № %
1 ЬбЬбЬ ЬбЬ ЬбЬЬбЬ ЬбЬЬб Ьб ЬбЬб ЬбЬбЬб бЬбЬ ЬбЬбЬбЬ ЬбЬбЬЬб ЬбЬЬбЬб 8.674 12 бЬЬбЬ 2.027 23 бЬЬбЬб 0.931
2 7.866 13 ЬбЬЬбЬбЬ 2.005 24 бЬбЬбЬ 0.907
3 6.456 14 ЬбЬбЬЬбЬ 1.954 25 ЬбЬбЬбЬбЬ 0.864
4 5.539 15 бЬб 1.944 26 бЬбЬб 0.849
5 3.946 16 бЬЬб 1.784 27 бЬбЬЬбЬ 0.834
6 3.778 17 ЬбЬбЬбЬб 1.720 28 бЬЬбЬбЬ 0.833
7 3.473 18 ЬбЬЬбЬЬб 1.532 29 бЬбЬЬб 0.793
8 3.278 19 ЬбЬЬбЬбЬб 1.315 30 б 0.751
9 2.856 2.256 2.233 20 21 22 ЬдЬЬдЬЬдЬ ЬбЬЬ бЬ 1.221 1.156 1.066 31 ЬбЬбЬбЬЬб 0.708
10
11
3. Обнаружено, что 11 структур осуществляют 50%-е, а 31 структуры -75%-е покрытие узбекских текстов. Эти данные представлены в табл. 1. В первой колонке дается номер структуры (в порядке убывания частоты её встречаемости), во второй - запись самой структуры и в третьей - процент её встречаемости в текстах. Отметим, что первые 11 наиболее часто встречающиеся структуры закрашены серым цветом.
4. Обнаружено, что 79 структур осуществляют 90%-е покрытие узбекских текстов. Эти данные представлены в продолжении таблицы. Кроме того, 150 структур встретились 259589 раз и составили 95%-е покрытие текстов.
5. Каждая из 150 структур разделялась на слоги “вручную” (в согласии с разделением на слоги тех слов, которые подпадали под те или иные структуры). Выявлено всего лишь шесть различных структур слогов - б, бЬ, Ьб, ЬбЬ, бЬЬ и ЬвЬЬ.
6. Частота встречаемости упомянутых структур среди 655545 слогов, полученных при разбиении на слоги 273190 слов, принадлежавших 150 различным слоговым структурам узбекских слов, указана в табл. 2.
Из представленных статистических данных видно, что двухбуквенные слоги типа га, ла, ки, на, ни, та, ме, ва, ту (в символьной записи - Ьб) и тому подобные являются наиболее часто встречающимися, а трехбуквенные слоги типа аср, исо, инг авж, абд, адл, акс, агл (в символьной записи - бЬЬ) и тому подобные - особо редкими.
Продолжение таблицы 1
№ % № >Н % № >Н %
32 0.706 48 0.366 64 0.186
33 0.571 49 Ь8ЬЬ8ЬЬ8Ь8 0.356 65 Ь8Ь8Ь8ЬЬ 0.186
34 0.546 50 Ь8Ь8ЬЬ8Ь8Ь8 0.337 66 8Ь8ЬЬ8ЬЬ8 0.184
35 0.538 51 8ЬЬ8Ь8ЬЬ8Ь 0.306 67 8ЬЬ8Ь8ЬЬ8 0.176
36 0.496 52 ЬдЬЬЬдЬ 0.291 68 8Ь8ЬЬ8Ь8Ь8 0.174
37 0.474 53 ЬдЬдЬЬдЬЬ 0.279 69 ЬдЬЬдЬдЬЬ 0.171
38 0.467 54 Ь8ЬЬ8Ь8Ь8Ь8 0.273 70 ЬдЬЬдЬЬдЬЬдЬ 0.167
39 0.460 55 Ь8ЬЬ8ЬЬ8ЬЬ8 0.272 71 8Ь8Ь8ЬЬ8 0.164
40 Ь8Ь8ЬЬ8Ь8Ь 0.450 56 Ь8Ь8ЬЬ8ЬЬ8Ь 0.269 72 Ь8Ь8Ь8Ь8Ь8Ь 0.158
41 Ь8ЬЬ8Ь8ЬЬ8 0.441 57 8ЬЬ8Ь8Ь8Ь 0.256 73 8Ь8Ь8Ь8Ь8 0.158
42 8ЬЬ8Ь8Ь8 0.441 58 8Ь8ЬЬ8ЬЬ 0.248 74 Ь8Ь8Ь8Ь8ЬЬ8 0.148
43 8Ь8ЬЬ 0.439 59 Ь8ЬЬ8ЬЬ8Ь8Ь 0.233 75 Ь88Ь 0.148
44 ЬдЬЬдЬЬ 0.435 60 Ь8ЬЬ8ЬЬ8Ь8Ь8 0.224 76 Ь8ЬЬЬ8Ь8 0.140
45 Ь8Ь8ЬЬ8ЬЬ8 0.424 61 ЬдЬЬдЬЬдЬЬ 0.215 77 Ь8Ь88Ь 0.128
46 Ь8ЬЬЬ8 0.405 62 8Ь8Ь8Ь8Ь 0.215 78 8Ь8ЬЬ8Ь8Ь 0.127
47 Ь8ЬЬ8Ь8ЬЬ8Ь 0.372 63 Ь8Ь8Ь8ЬЬ8ЬЬ 0.210 79 8ЬЬ8Ь8ЬЬ8ЬЬ8 0.124
Таблица 2
Слоги в символьной записи Частота встречаемости в % Частота встречаемости, абсолютная величина
б 3.820 25044
бЬ 7.083 46433
Ьб 49.846 362765
ИбЬ 35.908 235 391
бЬИ 0.564 3699
ИвЬИ 2.778 18 213
7. Отметим также, что 2 двухбуквенных слога Ьб и бЬ совместно с трехбуквенным слогом ИбЬ составляют подавляющую часть слогов узбекского языка. Кроме того, 2.7 - средняя размерность слогов в узбекском слове.
8. Частота встречаемости узбекских слов в зависимости от числа букв представлена в
табл. 3.
Таблица 3
Длина слова (число букв) 1 2 3 4 5 6 7 8 9 10 11 12
Кол. слоговых структур 2 4 8 13 22 42 51 75 97 125 157 165
Длина слова (число букв) 13 14 15 16 17 18 19 20 21 22 23 24
Кол. слоговых структур 170 163 151 125 94 80 38 15 9 5 3 2
9. В табл. 4 представлены данные о частоте встречаемости узбекских слов с тем или иным количеством слогов.
Таблица 4
Количество слогов в слове 1 2 3 4 5 б 7 S 9 10
Частота встречаемости в% 15.32 3б.39 26.S9 14.31 5.4 1.41 0.29 0.05 0.005 0.002
Технологический университет Таджикистана Поступило 28.12.2007 г.
ЛИТЕРАТУРА
1. Советский энциклопедический словарь. М.: Советская энциклопедия, 1980, 1600 с.
2. Ожегов С.И. Словарь русского языка. М.: Русский язык, 1984, 816 с.
3. Усманов З.Д., Худойбердиев Х.А. - ДАН РТ, т.49, № 6, 2006, с. 489-492.
Ш.А.Шарипов
ДАР БОРАИ СОХТИ ^И^ОГИИ КАЛИМА^ОИ УЗБЕКИ
Дар мак;ола мафх,уми сохти калимах,ои узбекй ва х,ичох,ои узбекй оварда шуда-анд. Дар асоси коркарди омории интихобе, ки аз матнх,ои гуногуни бо забони узбекй навишта шуда иборатанд, 1613 намуди гуногуни сохти хдчогии калимах,ои узбекй ва 6 намуди сохти хдчои калимах,ои узбекй дарёфт карда шуданд.
Sh.A.Sharipov
ON A SYLLABLE STRUCTURE OF UZBEK WORDS
In the article concepts of uzbek word structure and uzbek syllable structure are introduced. On the basis of statistical processing to a representative sampling, made up by various uzbek texts, 1613 different syllable structures of uzbek words and 6 different structures of uzbek syllables are brought to light.
5S4