Научная статья на тему 'Словоизменительные типы в калмыцком языке в свете автоматической обработки текстов (на примере имени существительного)'

Словоизменительные типы в калмыцком языке в свете автоматической обработки текстов (на примере имени существительного) Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
237
21
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Oriental Studies
Scopus
ВАК
Ключевые слова
НАЦИОНАЛЬНЫЙ КОРПУС КАЛМЫЦКОГО ЯЗЫКА / МОРФОЛОГИЧЕСКАЯ МОДЕЛЬ КАЛМЫЦКОГО ЯЗЫКА / ИМЕНА СУЩЕСТВИТЕЛЬНЫЕ / АВТОМАТИЧЕСКАЯ ОБРАБОТКА ТЕКСТОВ / NATIONAL CORPUS OF THE KALMYK LANGUAGE / MORPHOLOGICAL MODEL OF THE KALMYK LANGUAGE / NOUNS / AUTOMATIC PROCESSING OF TEXTS

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Куканова Виктория Васильевна

Статья посвящена описанию словоизменительных типов в калмыцком языке в свете автоматической обработки текстов на примере имени существительного. Выявленные словоизменительные типы необходимы для создания морфологического анализатора. Продолжение данной статьи будет опубликовано в следующем номере «Вестника Калмыцкого института гуманитарных исследований РАН».

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Куканова Виктория Васильевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Infl ectional Types of the Kalmyk Language in the light of Automatic Processing of Texts (by giving illustrations of nouns)

The article is devoted to the description of infl ectional types of the Kalmyk language in the light of automatic processing of texts by giving illustrations of nouns. The revealing infl ectional types are necessary for the creation of morphological parsing. The second part of this article will be published in the next issue of the «Vestnik of the Kalmyk Institute for Humanities»

Текст научной работы на тему «Словоизменительные типы в калмыцком языке в свете автоматической обработки текстов (на примере имени существительного)»

М.: Азбуковник, 2009. [электронный ресурс] // http://dict.ruslang.ru/freq.php (дата обращения: 15.04.2012).

Ринчинов О. С. Корпус бурятского языка и прикладные задачи компьютерной лингвистики // Состояние и перспективы развития бурятского языка. Мат-лы форума бурятского языка. Улан-Удэ, 2009. С. 88-89.

Сказание о хождении в тибетскую страну мало-дербетовского Бааза-бакши / пер. и коммент.

А. М. Позднеева. СПб., 1897. 18 + 130 + 120 с.

Шайкевич А. Я. Количественные методы в языкознании // Лингвистический энциклопедический словарь / под ред. В. Н. Ярцевой; Ин-т языкознания АН СССР. М.: Сов. энцикл., 1990. С. 231.

УДК 81'33 ББК 81.23

СЛОВОИЗМЕНИТЕЛЬНЫЕ ТИПЫ В КАЛМЫЦКОМ ЯЗЫКЕ В СВЕТЕ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ТЕКСТОВ (на примере имени существительного)

В. В. Куканова

Как известно, создание корпуса того или иного языка и его развитие является одной из актуальнейших задач современной лингвистики, в частности и калмыцкого языкознания, поскольку решается судьба языка как средства познания и коммуникации. Для того чтобы корпус «заработал», требуется пройти несколько шагов, связанных не только со сбором репрезентативного текстового материала, его филологической выверки. Одной из первых лингвистических задач является создание морфологического анализатора — программы, приводящей словоформу к начальной форме с приписыванием ей той или иной грамматической информации (грамма-тем), которую несет данная единица в тексте.

Для реализации этого программного продукта необходима разработанная система словоизменительных типов. Если речь идет о флективных языках, то выделение словоизменительных типов не вызывает никаких недоумений со стороны лингвистов. Система склонения и спряжения здесь более разнообразна и отличается нестандартностью выражения тех или иных граммем. Так, например, для русского языка насчитывается около 10 глагольных словоизменительных классов [Русская грамматика 1980: 647-661] и несколько видов аффиксов для выражения одной и той же граммемы. Если же говорить об агглютинативных языках, каким является калмыцкий язык, то имеются «сложности» выделения словоизменительных типов, так как они здесь более регулярны, единообразны и стандартны [Булыгина, Крылов 1990].

Во-первых, главной особенностью подобных языков является теоретическая возможность присоединения в строгом порядке неограниченного количества слово-

изменительных аффиксов и частиц к основе слова. Во-вторых, определенный тип парадигмы выделяют на основе общей системы выражения грамматических категорий определенными словоизменительными аффиксами и наличия сходных морфонологических процессов, а также частеречной принадлежности, в пределах которой действует тот или иной образец склонения (к примеру, в русском языке существуют субстантивное, адъективное и местоименное склонения)1.

В калмыцком языке имеет место четкое противопоставление именного и глагольного словоизменения: для каждого из них существуют неомонимичные аффиксы (сразу же оговоримся: речь идет только о формантах, выражающих определенные грамматические категории имени и глагола). Для всех именных частей речи — существительных, местоимений (за исключением некоторых форм с супплетивными основами), числительных — используются те же самые словоизменительные аффиксы для выражения категорий числа2, падежа и др. По сути,

1 Е. С. Кубрякова и П. А. Соболева выделяют пять следующих обязательных признаков морфологической парадигмы: 1 - «наличие константной лексемы, выражающей в парадигме идею тождества слова самому себе во всех его видоизменениях, и переменных формантов»; 2 - «наличие константного набора грамматических значений, облигаторного для каждой из фиксируемых форм парадигмы и повторяемого от формы к форме с обязательным изменением одного из них»; 3 - «фиксированное количество переменных грамматических значений»; 4 - «для выражения каждого из грамматических значений (или набора) в парадигме <.. .> специальный формант»; 5 - «отношения производности, фиксируемые парадигмой» (например, косвенные падежи относительно исходной формы) [Кубрякова, Соболева 1979: 9].

2 Категория числа в халха-монгольском языке, по мнению С. А. Крылова, схожа с категорией уменьши-

можно выделить единое склонение для именных частей речи.

Думается, что алгоритм работы морфологического анализатора для агглютинативного языка должен строиться на анализе слова слева направо (от начала к концу слова), поскольку основа в калмыцком языке в основном неизменяема, за исключением ряда слов, о которых мы скажем ниже. К тому же морфонологическая трансфомато-рика в основе или на стыке основы и аффикса достаточно предсказуема, например, если слово заканчивается на -н3, то происходит его усечение при соединении аффикса в определенных падежах: яман ‘коза’ ^ яма-г ‘козу’4. В калмыцком языке словоизменительные аффиксы могут совпадать со словообразовательными, а это, как известно, ведет к появлению омонимичных разборов. Например, баг-ла (деминутивный суффикс

-ла от мотивирующего слова баг ‘связка, узел, пучок) и баг-ла (аффикс комитатива (соединительного падежа) -ла ‘с группой, с отрядом, с кучей’).

В-третьих, морфотактические правила одинаковы для сочетания как основы со

тельности в русском языке [Крылов 2004: 84]. Другими словами, аффиксы множественности являются больше словообразовательными, нежели формообразующими формантами. Данная категория не является в целом грамматической, поскольку тесно не связана с синтаксическим устройством халха-монгольского языка. И в калмыцком языке категория множественности не всегда выражается грамматически, часто в этом участвуют лексические средства, несущие в своем значении множественность, например счетно-количественные и неопределенно-количественные слова: далахвн ‘много овец’ и арвн кун ‘десять человек’. Как и в халха-монгольском, в калмыцком языке существуют аффиксы, которые, помимо множественности, выражают еще и дополнительное семантическое значение — значение собирательности. Пожалуй, вопрос о статусе показателей множественного числа пока еще остается открытым и требует отдельного исследования, но при этом мы не отрицаем эту точку зрения и даже, более того, склоняемся к ней.

3 Традиционно конечный -н называют «неустойчивым» в силу того, что она исчезает при присоединении определенных аффиксов. С. А. Крылов в хал-ха-монгольском языке классифицирует его как «тематический» элемент {=п=}, который выполняет разные функции — структурную (соединяет лексему определенного класса с граммемой), системную (сигнализирует о принадлежности лексемы к определенному словоизменительному классу — тематическому, носовому, типу), дифференцирующую (является единственным средством различения некоторых падежных форм) [Крылов 2004: 123]. С. С. Сай считает, что он «расширяет основу» существительного и является маркером номинатива [Сай 2009: 639].

4 Значения слов, а также примеры приводятся по

Калмыцко-русскому словарю [1977].

словоизменительным аффиксом, так и словоизменительного аффикса с другим аффиксом, т. е. при словоизменении (склонении и спряжении) на морфемных швах происходят одни и те же процессы. Так, например, интерфиксация в интервокальной позиции: суукад ‘сидя’, кекэтэ ‘литый, налитый’ и такакар ‘курицей’, эврэкэс ‘от (из) своего’.

Несмотря на все это, мы, тем не менее, попытались установить словоизменительные типы в калмыцком языке. Данная публикация носит предварительный характер; ее целью является ознакомление заинтересованных специалистов с выявленными на материале обратного словаря словоизменительными типами по существительному в свете автоматической обработки текста, поскольку объем разобранных лексических единиц в обратном словаре (об объеме см. ниже), как нам представляется, не может дать полного описания формальной модели калмыцкой морфологии. К тому же некоторые речевые факты, зафиксированные в письменных текстах, несколько противоречат нормативным схемам словоизменения, что говорит о постоянно развивающейся системе языка, поиске носителями языка, в данном случае, грамматических норм и складывании кодифицированного литературного языка. Например, в текстах, подготовленных для Национального корпуса калмыцкого языка, встречаются разные формы множественного числа одного и того же слова, образованные при помощи различных аффиксов -д, -муд: вагон ^ вагод, вагон ^ вагонмуд.

Объектом исследования выступила линейная последовательность букв, (или «словоформы <...>, взятые в принятой орфографической записи» [Еськова и др. 1971: 4]), что обусловлено задачей создания морфологического анализатора для автоматической обработки письменных текстов. При выявлении словоизменительных типов нас интересовали только те изменения, которые имели отражение в орфографической записи слов, например чередование обычных кратких гласных и долгих гласных (то и тооИин). Надо сказать, что письменная и устная формы калмыцкого языка настолько далеки друг от друга, что создается впечатление, что это два совершенно разных языка, даже не родственных друг другу. Данная проблема порождена тем, что на письме не обозначаются так называемые «неясные гласные»5, хотя

5 В нашей работе мы, вслед за В. И. Рассадиным [см., например: Рассадин, Трофимова 2011: 102], не-

уже достаточно давно доказан их фонемный статус на экспериментальном материале [Биткеев 1975: 126]. Следовательно, все чередования, происходящие в слове при его словоизменении, не учитывались, если они не отражались в письменном виде. Например, чередование <а/#> в формах именительного падежа (Nom) тосн [tosan] и родительного падежа (Gen) тосна [tosna].

Обратный словарь создавался на базе словника Калмыцко-русского словаря под редакцией Б. Д. Муниева [1977]. Он позволил легко определить частеречную принадлежность слов и модели словоизменительных классов калмыцкого языка, например, слова, которые заканчиваются на -х, являются в основной своей массе глаголами. Рядом стоящие лексические единицы имеют сходную парадигму словоизменения, на стыке основы и словоизменительных аффиксов в словах происходят те же самые морфонологические процессы [Белоногов 1967; Зализняк 1987: 9]. Первоначально словник включал более 25 тыс. входов, т. е. вокабул, но в ходе анализа список слов значительно уменьшился, поскольку из него были извлечены все словоформы, например Genitive, Ablativ и другие падежные формы, а также атрибутивные формы глагола (причастия и деепричастия), которые использовались авторами словаря в качестве заглавного слова словарной статьи. Были выделены и соответственно сформированы лексиконы следующих частей речи: ADJ (Имя прилагательное/Adjective), ADV (Наречие/Adverb), CONJ (Союз/Conjunction), INJ (Междометие/Interjection), N (Имя суще ствительное/Noun), NUM (Числительное/Numeral), PART (Частица/Particle), POST (Послелог/Postposition), PRON (Местоимение/Pronoun), V (Глагол/Verb) и U (Неизвестная грамматическая категория/ Unknown category). Группа неизменяемых

ясные гласные в транскрипции обозначаются как [а], [е] и [i] («А», где А — это основной алломорф, «“» — показатель краткости). Традиционно для их обозначения используются символы [ъ] и [ь], с чем мы принципиально не согласны, поскольку это совершенно другие знаки. Они являются разделительными знаками, показателями мягкости предыдущего согласного и грамматической формы, т. е. выполняют другие функции. Поскольку обучение калмыцкому языку начинается уже после русского языка, то это может привести к появлению путаницы в сознании детей: для них они нулевые знаки, которые ничего не обозначают. Мы также не согласны с обозначением неясных гласных в виде символов «ы» и «е» по тем же самым причинам.

слов6 (наречия, послелоги, союзы, междометия, частицы) далее не подвергалась анализу, поскольку они не имеют парадигм словоизменения, хотя к некоторым словам могут присоединяться частицы разной функциональной нагруженности (поссесив-ные, вопросительные и др.).

Ряд лексем был продублирован в обратном словаре, поскольку часть из них имеет различную частеречную принадлежность, по своей семантической и грамматической сути являясь грамматическими омонимами: в отличие от русского языка, в котором происходят совпадения в рамках одной словарной статьи, в калмыцком языке имеет место совпадение форм разных грамматических классов. В словаре они получили дополнительные индексы, сигнализирующие о том, что данная единица может иметь несколько вариантов разбора в зависимости от контекста (та же самая операция проводилась при обработке лексических омонимов). Например, модн ‘дерево’ и модн ‘деревянный’. Для их разграничения (снятия омонимии) можно использовать контекст, т. е. учитывать окружение анализируемой единицы: если справа стоит существительное, то,

6 Противопоставление неизменяемых и изменяемых классов слов в калмыцком языке не продуктивно, поскольку почти все части речи имеют потенциальную возможность изменения, присоединения или перехода из одной части речи в другую, при этом последний процесс коренным образом влияет на грамматические и дистрибутивные характеристики слов в контекстах (ср.: «части речи не могут быть строго делимы на изменяемые и неизменяемые...» [Котвич 1929: 86]). Примечательно, что еще в начале XX в.

В. Л. Котвич отметил, что слов действительно «неизменяемых» немного в калмыцком языке (см.: «Вообще совершено неизменяемых слов в калмыцком языке имеется очень мало: если в каком-либо положении слово не изменяется, то в другом положении оно может принять приставку соответствующую склонению или спряжению, и таким образом сделаться изменяемым. Неизменяемыми остаются только служебные частицы и междометия» [Котвич 1929: 86]). Что касается наречий, послелогов, то они могут присоединять к себе аффиксы поссевности (в традиционной терминологии лично-притяжательные частицы). Например, на ‘на этой стороне, на эту сторону’ и на-нь ‘на этой стороне’ (колын на ‘на эту сторону реки’ — хотна мал колын нань йовна ‘скот хотона находится на этой стороне реки’), деер ‘на, возле, около; пока; вместе с, с; при’ и деер-нь ‘пока’ (эцкин эмнь карлкн деер бээх ‘присутствовать при смерти отца’ — твмриг халун деернь давт ‘куй железо, пока горячо’). Поэтому некоторые части речи можно назвать условно неизменяемыми. По нашим наблюдениям, к прилагательным могут присоединяться аффиксы сказуемости (речь не идет о субстантивированных прилагательных), а к наречиям и послелогам — аффиксы поссесивности. К собственно неизменяемым принадлежат только частицы, междометия и звукоподражания (идеофоны).

скорее всего, анализируемая единица является прилагательным.

Именные части речи принадлежат к классу изменяемых слов. Традиционно выделяют четыре типа склонения: простое, склонение с двойным падежом (т. н. двойное склонение), склонение с возвратной частицей (т. н. возвратное склонение) и склонение с притяжательной частицей [Грамматика калмыцкого языка 1983: 101116]. В простом склонении в свою очередь выделяются три типа: на неустойчивый -н, на гласную и согласную. При классифицировании материала авторами грамматики учитывались состав и качество конечных звуков основы слова [Грамматика калмыцкого языка 1983: 104].

С. М. Трофимова считает, что в калмыцком языке четко противопоставлены два типа склонения: неопределенное и определенное. К первому относится простое склонение, а к последнему — возвратное и двойное, поскольку частицы, присоединяемые к словоформе, выполняют функции артиклей [Трофимова 2009: 106-107]. Об этом пишет и С. А. Крылов, считая, что «монгольский язык, как и другие алтайские, продвинулся по шкале грамматикализации притяжательных местоимений еще дальше, чем западноевропейские языки. В результате этого продвижения сами притяжательные местоимения подверглись мощному процессу генерализации, транспозиции и десемантизации: они играют уже не только и не столько роль показателей притя-жательности в собственном смысле слова, сколько роль показателей определенности, топикальности и субстантивации. Но такой процесс свойственен всем грамматическим категориям, так что сам факт наличия у притяжательных показателей вторичных (непритяжательных) функций на самом деле парадоксальным образом демонстрирует их грамматикализованный характер» [Крылов 2012: 94-95].

Е. Ц. Манджеева выделяет три типа склонения. По ее мнению, к первому типу склонения относятся имена существительные с консонантным неустойчивым -н, ко второму — имена существительные с консонантной основой (кроме основ на неустойчивый -н) и вокалической основой на редуцированный гласный, к третьему

— имена существительные с вокалической основой на долгий гласный [Манджеева 2010: 15].

Выявленные в нашей работе словоизменительные типы именного склонения различаются в основном финалями основы, системой изменений на стыке основы и словоизменительного аффикса или словоизменительного аффикса с другим аффиксом, а также трансформацией основы. Критериями для выделения типов именного словоизменения в обратном словаре послужили: количество основ, конечная буква (в некоторых случаях конечный звук), морфо-нологические процессы на стыке основы и словоизменительного аффикса (отраженные в знаковой структуре слова), аффикс множественного числа (сочетание семантического фактора с фонетическим), сингармонизм. В качестве вспомогательной информации для выделения парадигм именного словоизменения использовались данные о происхождении слов, длине слова в буквах, одушевленность/неодушевленность.

«Всякая парадигма (для существительных — падежная парадигма) содержит неизменяемую часть, общую всем составляющим ее словоформам, и изменяемую часть, т. е. часть, отличающую одни словоформы от других. Для одних существительных польского языка неизменяемая часть парадигмы тождественна основе, а изменяемая часть — падежным флексиям; у других — к изменяемой части относится не только флексия, но и часть основы, обычно ее последний слог» [Толстая 1998: 95]. Подобное можно сказать и о парадигмах калмыцкого языка, поскольку здесь также сосуществуют неизменяемая и изменяемая части — основа и аффиксы. Все субстантивные основы7 в калмыцком языке можно подразделить на изменяемые и неизменя-

7 Считается, что «именительный падеж служит корнем для всех прочих падежей, а сам не имеет никакой отличительной частицы» [Бадмаев 1968: 221; см. также: Грамматика калмыцкого языка 1983: 104]. Г. Д. Санжеев, напротив, выдвигает иную точку зрения, которая заключается в том, что основа и именительный падеж не совпадают [Санжеев 1953: 140]. Как показал наш материал исследования, основа именительного падежа не является базой для образования всех остальных падежных форм. К примеру, слова, в которых происходят чередования, демонстрируют, что для образования косвенных форм используется второй вариант основы, и это мы говорим только о «видимых», отраженных в буквенном составе, чередованиях, а если взять слова, в которых происходят чередования звуков, не отраженных в письме, то можно с уверенностью сказать, что для образования падежных форм используются совершенно разные основы, которые не совпадают с основой именительного падежа.

емые. Первые подвержены изменениям и • имеют несколько вариантов: слово может иметь два или четыре стемма. В основе могут происходить следующие модификации: удвоение гласной, усечение финали основы и их разнообразные сочетания. Как уже говорилось выше, работа лемматиза-тора должна строиться на анализе основы • к аффиксам, поэтому основным критерием мы выбрали количество основ при выделе- • нии словоизменительных типов, затем по • значимости следует финаль основы — вокалическая или консонантная — и транс-фоматорика на стыке основы и аффикса, а при выделении парадигм множественного числа — все выше перечисленное и аффикс множественного числа.

Все существительные объединяются в один грамматический разряд, в котором все слова являются изменяемыми, в отличие от русского языка8. Что касается слов Singularia ТапШт и Р1игаНа ТапШт, то, вслед за А. А. Зализняком, подобные слова мы признаем имеющими оба числа: образование форм единственного и множественного чисел имеет потенциальный характер, «практически не употребляется, но при необходимости все же может быть построено и будет правильно понято» [Зализняк 1987: 5].

Для удобства работы была разработана специальная система помет, которая схематично характеризует слово изменитель ную парадигму. Информация распределена по четырем «полям», каждое из которых отделено пометой «/», за исключением первого (разделителем здесь служит «-»). В первом поле указывается принадлежность словоизменительного типа к той или иной части речи, например N или V

Во втором поле отмечается следующая информация: количество основ, обозначаемое римскими цифрами (если слово имеет один вариант основы, т. е. последняя неизменяема, было принято решение не обозначать количество), а также финаль основы — вокалическая Г или консонантная С. Во втором поле в скобках конкретизируется информация об изменениях в основе или ее конце (разделителем служит помета «_»). Также в некоторых случаях используется помета «\», которая обозначает оператор «или». Пометы второго поля следующие:

8 Напомним, в русском языке существует группа

неизменяемых слов, у которых признается омонимия

всех падежных форм и обоих чисел [Зализняк 1987: 5].

S — стем с указанием конечной финали: Г — вокалическая финаль основы;

А — «неясная» гласная, не обозначаемая на письме;

С — консонантная финаль основы (при необходимости информация конкретизируется);

S* — стем с удвоенной гласной в основе;

SН —основа с усеченной основой;

S*Н — стем с удвоенной гласной и усеченной конечной согласной.

Третье поле дополнительное, оно может использоваться для конкретизации той или иной информации о склонении или спряжении. Например, если парадигма описывает имя существительное, то здесь указывается возможный9 аффикс множественного чис-ла10. Данная система помет «говорящая»: в ней схематично закодирована информация о соответствующей парадигме. Можно легко догадаться о содержании образца склонения или спряжения. К примеру, парадигма под названием М-4С^*и)/д. Здесь закодирована информация о словоизменительном типе, согласно которому существует 4 варианта основы, заканчивающейся на согласную, в скобках конкретизируется информация о модификациях в основе: происходит удвоение гласной (чередование), усечение консонантной финали; дополнительно указывается аффикс множественности -д.

Единственное число Специальных аффиксов для выражения единственного числа в калмыцком языке не существует, т. е. налицо нулевой знак, или нулевой формант для выражения единственного числа. В системе падежных аффиксов (см. таблицу 1) существует дифференци-

9 Не все имена существительные в калмыцком языке могут иметь множественное число, так же как и в русском. Это так называемые Singu1aria ТаПит, однако мы старались указывать гипотетический плюральный аффикс. Все наши информанты указали, что при необходимости будут использовать аналитические средства для выражения множественности. Например, умшлкн ‘чтение’ — тавн умшлкн ‘пять чтений’. Но если искусственно присоединить аффикс множественного числа, предположим, к отглагольным существительным, то словоформа будет выглядеть, по данным информантов, следующим образом: умшлкс — умшлкд. Заметим, что правильным будет второй вариант, а при образовании первого произошло усечение основы и был присоединен аффикс -с к основе слова, заканчивающейся на сочетание согласных букв (в звуковом оформлении это консонантновокалическое сочетание [1уап]).

10 В кодировании парадигм используется твердорядный вариант.

ация только в Gen, Dat и отчасти в Acc, в остальных падежах имеет место небольшое различие, что создается появлением интерфиксов (-h-, -г-) в интервокальной позиции, а в Com и Ass дифференциация вообще отсутствует (не считая алломорфов). Формы именительного (Nom) и винительного (Acc) падежей могут иметь омонимичные нулевые аффиксы, различить которые можно только в контексте.

Таблица 1. Таблица словоизменительных падежных аффиксов калмыцкого языка

№ Падеж11 Словоизменительный падежный аффикс

1. Nom (номинатив/ именительный падеж) -0

2. Gen (генитив/ родительный падеж) -a, -э, -я, -ш, -гт, -ын, -hm, -н

3. Dat (датив/ дательно-местный падеж) -д, -m

4. Acc (аккузатив/ винительный падеж) ^г, -г^, -ыг, -г, -0

5. Instr (инструменталис/ орудный падеж) -ap, ^p, -я^, -hap, -hэp, -гap, -гэp

6. Com (комитатив/ со единительный падеж) ^a, -лэ

7. Ass (ассоциатив/ совместный падеж) -ma, ^э

8. Abl (аблатив/ исходный падеж) -ac, -э^ -hac, ^c, -гac, -гэc

9. Dir (директив/ направительный падеж) -yp, -Yp, -™p, -hyp, -hyp, ^yp, ^yp

10. Term (терминатив/ предельный падеж)12 - , -

11. Voc (вокатив/ звательный падеж) -a, -э

11 Сначала приводятся принятые в работе сокращения названий падежей (использовалась разработанная система помет из [Сай 2009: 638]), затем в скобках — расшифровка и традиционное название.

12 Предельный и звательный падежи, как правило, не выделяются в системе склонений, поскольку существуют семантические ограничения в их образовании и в речи они используются крайне редко [Грамматика калмыцкого языка 1983: 102]. Эти падежи не входят в основню парадигму и далее не разбираются.

Множественное число

Множественное число образуется при помощи присоединения к основе плюральных аффиксов -д13, -нр, -муд, -муд, -с, -уд, -уд, -чуд, -чуд, -нуд, -нуд14, а потом уже присоединяется падежный аффикс. Их употребление зависит от финали основы и семантического фактора. Так, аффикс -нр присоединяется к словам, обозначающим людей, профессию, родственные отношения15. Как показывает материал словарей [Павла Дорж 1973; Тода-ева 2001] и текстов художественной литературы, данный аффикс, наряду с другими, используется при образовании множественного числа у слов, обозначающих национальную принадлежность: например, адыг ‘адыгеец’

— адыгейцнр ‘адыгейцы’.

Во множественном числе не сохраняется разнообразие парадигм, как в единственном числе. Если говорить об «основах» множественного числа , то надо отметить, что все они заканчиваются на консонантный звук, что и создает небольшое сходство парадигм множественного числа: к аффиксу множественного числа присоединяются одинаковые падежные форманты (алломорфы). Но это только на первый взгляд. Имеет значение, какой аффикс используется для образования множественного числа, вернее его финаль,---д или -р/-с

(см. таблицу 2). Формы именительного (№ш) и винительного (Асс) падежей также могут иметь нулевые аффиксы, что делает их омонимами. В Dat словоизменительные аффиксы и для мягкого, и для твердого типов словоизменения совпадают (везде -т).

Схемы и комментарий к словоизменительным типам

Изменяемая основа

I. Парадигма, в которой основа слова имеет два варианта. Подразделяется также

13 Данный плюральный аффикс в торгутском говоре заменяют на -с, а также может выступать в соединении с другими аффиксами (-уд, -уд) [Убушаев 2006: 8].

14 Аффикс -нуд (-нуд) редко используется, но как вариант существует и в большейстепени является словообразующим формантом, поскольку употребляется для образования этнонимов: харнуд ‘черные’, шарнуд ‘желтые’ [Грамматика калмыцкого языка 1983: 99].

15 Н. Н. Убушаев считает, что аффикс -нр может присоединяться только к одушевленным существительным [Убушаев 2006: 5].

16 Понятие «основы» в работе используется условно. По сути, основой является «совокупность основ словоформ» [Лопатин 1977: 109], т. е. без словоизменительных аффиксов. Но в данном случае речь идет о «неизменяемой» части слова уже с или без плюрального аффикса, к которой присоединяются падежные аффиксы.

на вокалнческни и консонантный подтипы. Первый имеет либо только мягкиИ, либо твердыИ вариант, поскольку гласные звуки подчиняются закону сингармонизма.

Таблица 2. Парадигмы множественного числа

№ Падеж I II

П p p д ф жный икс Падежный аффикс

м Т м Т

1. Nom 1 — — о cd н cd 4 с 5 V X я cd « о Я о — —

2. Gen Основа мн. числа на --ин -ын -ин --ин

3. Dat -т -т

4. Acc -0 -0 -0 -0

--иг -ыг -иг --иг

5. Instr -зр -ар -зр -ар

б. Com -лз -ла -лз -ла

7. Ass -тз -та О -тз -та

S. Abl -зс -ас -зс -ас

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

9. Dir -ур -ур -ур -ур

Вокалический подтип

Основа заканчивается на гласные -а, -э, -и, -е, -о, -в, -у, -у Здесь выделяется две частные парадигмы: N-2T(S*)/c и N-2T(S*)/wp, различающиеся лишь плюральным аффиксом. Те слова, которые имеют финали -а, -о, -у, могут присоединять только твердорядные аффиксы, а те основы, которые заканчиваются на гласные -э, -и, -е, -в, -у, — только мягкорядные аффиксы (см. таблицу 3)- Этот образец объединяет в основном односложные слова, состоящие из одной или двух букв (СГ или Г). В основе происходит чередование обычной краткой гласной и долгой гласной, при этом, когда к слову присоединяются падежные аффиксы Gen, Instr, Abl и Dir, происходит интерфиксация основы. В Nom единственного и множественного чисел используется основа с обычным гласным (недолгим), а в остальных падежах — вторая основа с долгой гласной. В парадигме N-2r(S*)/c противопоставлены основы именительного и винительного немаркированного падежей и основы косвенных падежей, а в парадигме N-2r(S*)/np — основы единственного и множественного чисел номинатива и аккузатива, а также основы косвенных падежей (за исключением аккузатива немаркированного) и основа номинатива в единственном числе.

Консонантный подтип

N-2rC(Sa)/d. В эту группу входят слова, которые заканчиваются на вокалическо-кон-

сонантное сочетание ГС, при этом конечный согласный -н исчезает при словоизменении. Обычно данные слова имеют следующие финали :

-ан18;

-эн;

-ун;

-ун;

-ян;

-ин;

-он19;

-юн.

N-2CC(SH)/d20. К этой группе относятся слова, заканчивающиеся на сочетание согласных, один из которых это неустойчивый -н. Выделяются две частные парадигмы: твердый и мягкий. Слова заканчиваются, как правило, на21:

-дн ([dan]/[den]);

-гн ([gen]);

-вн ([van]/[ven]);

-мн ([man]/[men]);

-сн ([san]/[sen]);

-щн ([3&n]/[3enj);

-тн ([tan]/[ten]);

-хн ([qan]/[qen]);

-цн ([can]/[cen]);

-кн ([kan]/[ken]);

-чн ([can]/[cen]);

-шн ([san]/[sen]);

-зн ([zan]/[zen]);

17 Имеется ряд слов-«исключений» из этого образца по причине необозначения неясных гласных на конце слова, что ведет к путанице и отсутствию жестких формальных правил в классифицировании материала по склонениям.

18 В эту подгруппу частично входят заимствованные слова, однако здесь налицо конкуренция плюральных аффиксов. По орфографическим правилам все слова, которые заканчиваются на -н, также теряют его при изменении [Орфографические правила ... 2000: 73]. Текстовый материал и материалы словарей противоречат этому правилу. Определенных тенденций в усечении финали выявить не удалось.

19 Слова в основном заимствованные через русский язык.

20 В отдельную парадигму Ы-2СС(8)/чуд выделяется ряд слов, у которых, помимо аффикса -д, может присоединяться -чуд, без усечения финали. См. подробно об этой парадигме во второй части статьи.

21 Исключение составляют слова, которые заканчиваются на неясный гласный, который на письме не обозначается, что и порождает трудности в отнесении того или иного слова к определенной парадигме. По этой причине была создана дополнительная графа, в которой дается упрощенная транскрипция. Уже впоследствии при сортировке материала по обратному индексу слова, заканчивающиеся одинаково на неясный гласный, оказывались рядом. Это во многом упростило работу.

Таблица 3. Парадигмы вокалического подтипа с изменяемой основой

№ Падеж N-2r(S*)/c N-2r(S*)/Hp

Ед. число Мн. число Ед. число Мн. число

1. Nom бу-03 бу-с бв-0 4 бвв-нр

2. Gen буу-кин буу-с-ин бвв-кин бвв-нр-ин

3. Dat буу-д буу-с-т бвв-д бвв-нр-т

4. Acc бу-0 буу-г буу-с-0 буу-с-иг бв-0 бвв-г бвв-нр-0 бвв-нр-иг

5. Inst буу-Ьар буу-с-ар бвв-кэр бвв-нр-эр

6. Com буу-ла буу-с-ла бвв-лэ бвв-нр-лэ

7. Ass буу-та буу-с-та бвв-тэ бвв-нр-тэ

8. Abl буу-кас буу-с-ас бвв-кэс бвв-нр-эс

9. Dir буу-Ьур буу-с-ур бвв-кур бвв-нр-ур

Бу — ‘ружье’; бв — ‘шаман’

По этому образ-заканчивающие ся

• -йн ([yin]);

• -Ьн ([yan]/[yen]);

• -лн ([lan]/[len]);

• -рн ([ran]/[ren]).

N-2CC(S^hH)/—(n/c?f цу склоняются слова, на -лЬн. Парадигма неполная: не имеет форм множественного числа, — хотя, как мы писали выше, пытались указать гипотетический аффикс множественного числа, однако текстовый материал, который использовался во время подготовки обратного словаря, свидетельствует о том, что у девербативов отсутствует множественное число23.

N-2C(SbH)/d. Склоняется только одно слово уньн ‘жердь’ согласно нашему словнику.

N-2C(S*F/Cmr)/Myd. Этот образец объединяет односложные слова, состоящие из двух или трех букв (ГС). В основе также происходит чередование обычной краткой и долгой гласной. Заканчивается на -р/-с/-ш/-г и присоединяет аффикс множественного числа -муд.

N-2C(S*B)/c. К этой группе относятся односложные слова, состоящие из двух или трех букв (ГС). В основе также происходит чередование обычной краткой и долгой гласной. Заканчивается на -в и присоединяет аффикс множественного числа -с.

N-2C(S*B/H)/Myd. По данному образцу изменяются в основном односложные слова по структуре (С)ГС. Происходит трансформация основы: он — оон ‘год’ Заканчивает-

22 Помета «—(д/с?)» обозначает затрудненность образования форм множественного числа, в скобках высказываются предположения по поводу возможного плюрального аффикса.

23 Ср. с данными русского языка: не все деверба-тивы могут иметь форму множественного числа, но

гипотетически можно образовать ее, используя стандартные флексии.

ся на -л/-н и присоединяет аффикс множественного числа -муд.

Ы-2С(Б*м)/муд. Этот образец объединяет односложные слова, состоящие из двух или трех букв (ГС). Заканчивается на -м и присоединяет аффикс множественного числа -муд. В основе происходит чередование обычной краткой и долгой гласной.

Парадигмы падежных окончаний для последних четырех словоизменительных типов приведены ниже в таблице 4.

II. Парадигма, в которых основа слова имеет четыре варианта (Ы-4(8*н)/д). Так, вариантами стеммов слова хвн ‘овца’ являются, например: хвн — хвв — хв — хввн. Данная парадигма объединяет существительные, финали которых консонантные: все слова заканчиваются на -н, который исчезает при добавлении определенного аффикса (см. схему ниже в таблице 5). В основе слова происходит удвоение гласной буквы как показателя долгой гласной в первом слоге. Данная парадигма имеет две разновидности: а) твердый вариант и б) мягкий вариант. В основном к этой группе принадлежат односложные слова с закрытым слогом, состоящие из 3 букв.

Результаты исследования по выделению парадигм в калмыцком языке носят предварительный характер, при расширении материала (как словника, так и языковых фактов, отраженных в текстах) они будут уточняться и дополняться. Вместе с тем уже выявленные словоизменительные классы позволят создать морфологический анализатор под управлением информационной среды StarLing24. В статье, подготовленной

24 Информационная среда StarLing создана С. А. Старостиным (1953-2005), а позже усовершенствована Ф. С. Крыловым.

Таблица 4. Парадигма падежных окончаний (изменяемая основа с чередованием)

№ Падеж М-2С(Б*г/с/ш/Г)/муд М-2С(Б**)/с М-2С(Б*л/н)/шуд М-2С(Б*М)/муд

М Т М Т М Т М Т

1. Кош — — — —

2. Gen -ин -ин -ин -ын -ин

3. Dat -т -т -д -д -д

4. Асс -иг -иг -иг ыг -иг

-0 -0 -0 -0

5. Inst -эр -ар -эр -ар -эр -ар -эр -ар

6. Сот -лэ -ла -лэ -ла -лэ -ла -лэ -ла

7. Ass -тэ -та -тэ -та -тэ -та -тэ -та

8. АЬ1 -эс -ас -эс -ас -эс -ас -эс -ас

9. Dir -УР -ур -ур -ур -ур -ур -ур -ур

Таблица 5. Парадигмы Ы-4(3*н)/д

№ Падеж Ед. число Мн. число Ед. число Мн. число

М Т

Кош хон-0 хе-д дун-0 ду-д

Gen хоен-э хее-д-ин дуун-а дуу-д-ын

Dat хоон-д хее-д-т дуун-д дуу-д-т

Асс хее-г хее-д-иг -г дуу д дуу-д-ыг

хе-0 хее-д-0 ду-0 ду-д-0

Inst хее-кэр хее-д-эр дуу-кар дуу-д-ар

Сот хеен-лэ хее-д-лэ дуун-ла дуу-д-ла

Ass хее-тэ хее-д-тэ дуу-та дуу-д-та

АЬ1 хеен-эс хее-д-эс дуун-ас дуу-д-ас

Dir хеен-ур хее-д-ур дуун-ур дуу-д-ур

к публикации в следующем номере журнала, будут рассмотрены парадигмы слов с неизменяемой основой, а также парадигмы двойного, возвратного и притяжательного склонений.

Значения используемых символов

«[ ]» — фонологическая запись; «{ }» — морфоно-логическая запись; «#» — нулевой знак с переменной фонологической репрезентацией; «0» — нулевой аффикс; «\» — знак, разделяющий альтернативные формы; «С» — любая согласная; «Г» — любая гласная; «А» — неясная гласная; «—» — отсутствие форм множественного числа.

Литература

Бадмаев Б. Б. Сопоставительная характеристика склонений в Заяпандитской письменности и в современном калмыцком языке // Развитие науки в Калмыцкой АССР (мат-лы науч. сессии, посвящ. 50-летию Великого Октября). Ч. II: Серия филологии. Элиста: КНИИЯЛИ, 1968.С. 219-226.

Белоногов Г Г., Давыдова И. М. О возможности определения грамматических классов слов по

буквенным кодам слов // Научно-техническая информация. Сер. 2: Информатика / ВИНИТИ. 1967. № 8. С. 20-26.

Биткеев П. Ц. Проблемы фонетики калмыцкого языка (Квантитативные и квалитативные изменения гласных). Элиста: Калм. кн. изд-во, 1975. 170 с.

Булыгина Т. В., Крылов С. А. Склонение // Лингвистический энциклопедический словарь / под ред. В. Н. Ярцевой. М.: Советская энциклопедия, 1990. С. 456.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Грамматика калмыцкого языка: фонетика и морфология. Элиста: Калм. кн. изд-во, 1983. 336 с.

Есъкова Н. А., Мельчук И. А., Санников В. 3. Формальная модель русской морфологии. I. Формообразование существительных и прилагательных. Предварительные публикации / Проблемная группа по экспериментальной и прикладной лингвистике. М.: Ин-т русского языка АН СССР, 1971. 71. с.

Зализняк А. А. Предисловие // Зализняк А. А. Грамматический словарь русского языка: Словоизменение: около 100 000 слов. 3-е изд., сте-

реотип. М.: Изд-во «Русский язык», 1987. С. 3-10.

Калмыцко-русский словарь / под ред. Б. Д. Муние-ва. М.: Изд-во «Русский язык», 1977. 768 с.

Котвич В. Л. Опыт грамматики калмыцкого разговорного языка. Изд. 2-е. Ржевнице у Праги, 1929. 418 с.

Крылов С. А. Структурно-вероятностная модель современного монгольского языка (на базе Генерального корпуса монгольского языка) // Урало-алтайские исследования. 2012. № 1(6). С. 78-105.

Крылов С. А. Теоретическая грамматика современного монгольского языка и смежные проблемы общей лингвистики. Ч. 1: Морфе-мика, морфонология, элементы фонологической трансформаторики (в аспекте общей теории морфологических и морфонологи-ческих моделей. М.: Изд-во Вост. лит. РАН, 2004. 479 с.

Кубрякова Е. С., Соболева П. А. О понятии парадигмы в формообразовании и словообразовании // Лингвистика и поэтика: сб. науч. ст. М.: Наука, 1979. С. 5-23.

Лопатин В. В. Русская словообразовательная мор-фемика. Проблемы и принципы описания. М.: Наука, 1977. 315 с.

Манджеева Е. Ц. Морфемные модели слов в современном калмыцком языке (на материале имен существительных): автореф. дисс. ... канд. фил. наук. Элиста, 2010. 26 с.

Орфографические правила и Орфографический словарь калмыцкого языка / отв. ред. Э. У. Омакаева. Элиста: Калм. кн. изд-во, 2000. 480 с.

Очир-Горяева М. А. О значении коня и овцы в обрядовой культуре кочевников // Монголоведение:

сб. науч. тр. Вып. 5. Элиста: КИГИ РАН, 2011.

С. 126-138.

Павла Дорж. Чикэр бичлЪнэ толь. 2-гч Ьарц. Элст: Хальмг дегтр ЬарЬач, 1973. 240 с.

Рассадин В. И., Трофимова С. М. Сравнительное исследование звукового строя языков дербетов Калмыкии и Монголии // Вестник Калмыцкого института гуманитарных исследований. 2011. № 2. С. 99-107.

Русская грамматика: научные труды. В 2-х тт. / отв. ред. Н. Ю. Шведова; репринтное изд. Т. 1: Фонетика, Фонология, Ударение, Интонация, Словообразование, Морфология. М.: Ин-т русского языка РАН, 2005. 784 с.

Сай С. С. Грамматический очерк калмыцкого языка // Исследования по грамматике калмыцкого языка / ред. С. С. Сай, В. В. Баранова, Н. В. Сердобольская (ACTA LINGUISTICA PETROPOLITANA. Труды Института лингвистических исследований РАН, 2009. Т. V, ч. 2). СПб.: Наука, 2009. С. 622-709.

Санжеев Г. ДСравнительная грамматика монгольских языков / отв. ред. С. Д. Дылыков. Т. I. М.: Изд-во Академии наук СССР, 1953. 240 с.

Тодаева Б. X. Словарь языка ойратов Синьцзяна (по версиям песен «Джангара» и полевым записям автора) / КИГИ РАН. Элиста: Калм. кн. изд-во, 2001. 493 с.

Толстая С. М. Морфонология в структуре славянских языков. М.: Изд-во «Индрик», 1998. 320 с.

Трофимова С. М. Грамматические категории именных основ в монгольских языках (семантикофункциональный аспект). Элиста: Изд-во КГУ, 2009. 282 с.

Убушаев Н. Н. Категория множественности в калмыцких говорах // Вестник Калмыцкого института гуманитарных исследований. Вып. 20. Элиста: НПП «Джангар», 2006. С. 5-12.

i Надоели баннеры? Вы всегда можете отключить рекламу.