Научная статья на тему 'Лингвистическая сложность категории числа в татарском языке: постановка проблемы'

Лингвистическая сложность категории числа в татарском языке: постановка проблемы Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
289
29
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
TATAR LANGUAGE / LINGUISTIC COMPLEXITY / CATEGORY OF NUMBER / GRAMMAR / GRAMMATICAL MEANING / ТАТАРСКИЙ ЯЗЫК / ЯЗЫКОВАЯ СЛОЖНОСТЬ / КАТЕГОРИЯ ЧИСЛА / ГРАММАТИКА / ГРАММАТИЧЕСКОЕ ЗНАЧЕНИЕ

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Галиева Альфия Макаримовна, Невзорова Ольга Авенировна

Вопросы, связанные с разработкой методики оценки языковой сложности в последние десятилетия активно ставятся в зарубежном языкознании. Анализ литературы показывает, что концепт «языковая сложность» имеет разные интерпретации и с трудом поддается формализации и анализу. Исследователи выделяют различные критерии для анализа языковой сложности и получают порой противоположные результаты для одного и того же языка. В статье впервые ставится задача определения лингвистической сложности татарского языка и выделения количественных (измеряемых и сравниваемых) параметров этой сложности на примере категории числа, которая на первый взгляд кажется совершенно простой (бинарной) грамматической категорией, легко поддающейся параметризации. В статье анализируются также основные способы концептуализации числовых форм, специфические для татарского и тюркских языков, описываются основные значения форм множественного числа. Регулярность татарского словоизменения и его агглютинативный характер, единообразный характер маркирования форм множественного числа у субстантивов и глаголов, жесткие правила выбора алломорфов значительно упрощают кодирование множественного числа. Тем не менее, интерпретации лексем, содержащих и не содержащих аффикс множественного числа, может осуществляться только на основе информации о контекстуальном окружении анализируемой словоформы и внешних знаний о мире, что значительно усложняет правила для интерпретации форм числа в татарском языке.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Галиева Альфия Макаримовна, Невзорова Ольга Авенировна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

LINGUISTIC COMPLEXITY OF THE CATEGORY OF NUMBER IN TATAR: ON THE PROBLEM

In recent decades, the issues, related to the development of methods for assessing linguistic complexity, have been the focus of foreign linguistics. An analysis of the literature on the subject shows that the concept linguistic complexity has different interpretations, thus it is difficult to formalize and analyse it. Researches identify different criteria used to analyse linguistic complexity, as a result they come to different conclusions about the same language. The paper aims to define linguistic complexity of the Tatar language and to distinguish quantitative (measurable and comparable) parameters of this complexity based on the category of number, which seems to be a very simple (binominal), easily parameterized grammatical category. The paper also analyses basic ways of conceptualizing numerical forms that are specific to the Tatar and Turkic languages and describes the basic meanings of the plural forms. The coding of the plural form is greatly simplified by the regularities of Tatar derivation and its agglutinative character, the uniform character of marking plurals of nominal words and verbs, and the strict rules of selecting allomorphs. Nevertheless, interpretations of lexemes with or without plural affixes are possible only by taking into account their contextual environment and the knowledge of the external world, which makes the rules of interpreting number forms in Tatar quite complicated.

Текст научной работы на тему «Лингвистическая сложность категории числа в татарском языке: постановка проблемы»

ФИЛОЛОГИЯ И КУЛЬТУРА. PHILOLOGY AND CULTURE. 2016. №2(44)

УДК 811.512.145; 81'366.53

ЛИНГВИСТИЧЕСКАЯ СЛОЖНОСТЬ КАТЕГОРИИ ЧИСЛА В ТАТАРСКОМ ЯЗЫКЕ: ПОСТАНОВКА ПРОБЛЕМЫ

© Альфия Галиева, Ольга Невзорова

LINGUISTIC COMPLEXITY OF THE CATEGORY OF NUMBER IN TATAR: ON THE PROBLEM

Alfiya Galieva, Olga Nevzorova

In recent decades, the issues, related to the development of methods for assessing linguistic complexity, have been the focus of foreign linguistics. An analysis of the literature on the subject shows that the concept linguistic complexity has different interpretations, thus it is difficult to formalize and analyse it. Researches identify different criteria used to analyse linguistic complexity, as a result they come to different conclusions about the same language.

The paper aims to define linguistic complexity of the Tatar language and to distinguish quantitative (measurable and comparable) parameters of this complexity based on the category of number, which seems to be a very simple (binominal), easily parameterized grammatical category.

The paper also analyses basic ways of conceptualizing numerical forms that are specific to the Tatar and Turkic languages and describes the basic meanings of the plural forms.

The coding of the plural form is greatly simplified by the regularities of Tatar derivation and its agglutinative character, the uniform character of marking plurals of nominal words and verbs, and the strict rules of selecting allomorphs. Nevertheless, interpretations of lexemes with or without plural affixes are possible only by taking into account their contextual environment and the knowledge of the external world, which makes the rules of interpreting number forms in Tatar quite complicated.

Keywords: Tatar language, linguistic complexity, category of number, grammar, grammatical meaning.

Вопросы, связанные с разработкой методики оценки языковой сложности в последние десятилетия активно ставятся в зарубежном языкознании. Анализ литературы показывает, что концепт «языковая сложность» имеет разные интерпретации и с трудом поддается формализации и анализу. Исследователи выделяют различные критерии для анализа языковой сложности и получают порой противоположные результаты для одного и того же языка.

В статье впервые ставится задача определения лингвистической сложности татарского языка и выделения количественных (измеряемых и сравниваемых) параметров этой сложности на примере категории числа, которая на первый взгляд кажется совершенно простой (бинарной) грамматической категорией, легко поддающейся параметризации.

В статье анализируются также основные способы концептуализации числовых форм, специфические для татарского и тюркских языков, описываются основные значения форм множественного числа.

Регулярность татарского словоизменения и его агглютинативный характер, единообразный характер маркирования форм множественного числа у субстантивов и глаголов, жесткие правила выбора алломорфов значительно упрощают кодирование множественного числа. Тем не менее, интерпретации лексем, содержащих и не содержащих аффикс множественного числа, может осуществляться только на основе информации о контекстуальном окружении анализируемой словоформы и внешних знаний о мире, что значительно усложняет правила для интерпретации форм числа в татарском языке.

Ключевые слова: татарский язык, языковая сложность, категория числа, грамматика, грамматическое значение.

1. Введение

В последние десятилетия в зарубежной лингвистике появляются многочисленные работы, посвященные теоретическому осмыслению фено-

мена языковой сложности (language complexity, linguistic complexity) и поиску практических способов оценки этой сложности (см. список литературы в конце статьи). Если непрофессионалы в

области лингвистики на базе интуиции, обыденных или энциклопедических знаний склонны выделять языки более «сложные» и более «простые», в профессиональном лингвистическом сообществе до сих пор преобладает точка зрения, что все языки мира имеют примерно одинаковую степень структурной сложности, и возможно, что такая точка зрения требует серьезной коррекции (см. об этом: [Кш!еге, с. 1-2], McWhorther, с. 133], [Бесегга-БопасЬе, Лшепе8-Ьоре2, с. 4] и др.).

В науке имеются различные подходы к определению сложности объектов и систем, которые можно свести к двум основным типам:

1) сложность как характеристика объективных (структурных, динамических и пр.) свойств системы;

2) сложность как характеристика не объекта, а процесса познания (с учетом набора субъективных факторов).

Л. А. Растригин указывает следующие основные свойства сложных объектов:

1 . Отсутствие необходимого математического описания.

2. «Зашумленность» сложных систем, которая обусловлена не столько наличием специальных генераторов случайных помех, сколько сложностью объекта и вытекающим из нее неизбежным обилием второстепенных процессов. Поэтому поведение объекта зачастую оказывается неожиданным для исследователя.

3. «Нетерпимость» к внешнему управлению.

4. Нестационарность сложной системы, которая проявляется в дрейфе характеристик системы, в изменении ее параметров, в эволюции сложной системы во времени.

5. Невоспроизводимость экспериментов со сложной системой, что связано прежде всего с зашумленностью и нестационарностью сложной системы [Растригин, с. 45- 46].

Перечисленные автором свойства сложных систем и объектов в целом применимы и для характеристики языка, но с рядом оговорок. Так, эксперименты с языком невоспроизводимы в том смысле, что результаты, полученные на основе анализа разных текстов и наборов текстов, могут существенно различаться, что обусловлено сложным взаимодействием системных, функциональных, индивидуально-авторских и других факторов.

По отношению системы к воздействиям извне разные подсистемы языка ведут себя по-разному, и можно выделить подсистемы двух типов:

• открытые (лексика - в языке легко появляются новые слова, лексическая семантика - у слов появляются новые значения);

• закрытые (в аспекте синхронии грамматика языка является закрытой системой: новые грамматические категории и грамматические значения не возникают).

Как промежуточную область можно рассматривать уровень словообразования: в языке легко образуются новые слова, но, как правило, по моделям, допускаемым самой системой языка.

Постановка вопроса о языковой сложности требует разработки дефиниции и объективных критериев оценки этой сложности. Очевидно, что степень сложности может существенно различаться с учетом того, кто будет оценивать язык, в рамках какой лингвистической теории и на данных какого уровня и формы (письменной или устной) языка будет производиться оценка.

Мы считаем, что разработка морфологически размеченных корпусов может послужить одним из инструментов измерения количественно выражаемых параметров сложности. В связи с этим возникает необходимость поиска и обоснования критериев и измеряемых параметров языковой сложности на данных грамматики. Данная статья представляет собой первый шаг к осмыслению феномена языковой сложности на материале категории числа татарского языка. Текстовые примеры извлечены из Татарского национального корпуса «Туган тел». Перевод татарских примеров на русский язык выполнен авторами статьи.

Статья имеет следующую структуру: часть 2 представляет краткий обзор литературы по проблеме; часть 3 описывает факторы, влияющие на лингвистическую сложность; часть 4 представляет анализ категории числа с точки зрения лингвистической сложности; в части 5 представлены основные выводы по проведенному исследованию.

2. Краткий обзор имеющихся подходов

Несмотря на то, что концепт «языковая сложность» кажется интуитивно ясным, он с большим трудом поддается формализации и анализу. Исследователи предлагают различные критерии и параметры языковой сложности и получают порой противоположные результаты для одного и того же языка.

В статье А. Бердичевского представлен обзор работ зарубежных исследователей последних 1015 лет, посвященных теоретическому осмыслению и описанию феномена языковой сложности. Он отмечает, что, несмотря на разнообразие имеющихся подходов и результатов, можно выделить три основных вывода, которые подтверждаются большинством исследований. Во-первых, распространенное представление о том, что все языки одинаково сложны, неверно. Более того, можно не только ранжировать языки по

сложности, но и пытаться измерить сложность языка - или, по крайней мере, фрагмента языка -количественно. Наконец, такие измерения, а также некоторые качественные исследования показывают, что сложность языка зависит от влияния социальных факторов [Бердичевский, с. 101].

В качестве отправной точки для нашего исследования выделим 3 работы. В диссертации В. Кустерса «Языковая сложность. Влияние социальных изменений на глагольное словоизменение» изучается влияние экстралингвистических факторов на внутреннюю структуру языка. На материале глагольного словоизменения ряда языков (арабского, кечуа, суахили, индоевропейских языков Скандинавии) показывается, что значительное увеличение количества говорящих, для которых язык не является родным, а также рост внешних контактов языкового сообщества ведет к упрощению морфологической структуры [Kusters].

В монографии О. Даля [Dahl] дано методологически значимое разграничение понятий «сложность» (complexity), «затратность» (cost), «трудность» (difficulty) и «исходные требования» (demandingness). По мнению исследователя, «сложность» - теоретический конструкт, нацеленный на измерение «объективной» сложности языка, важный с точки зрения обработки языка, но не зависящий от того, кто изучает язык. Понятия «затратность» и «трудность» существенны (релевантны) для взрослых, изучающих язык. «Затратность» измеряется количеством ресурсов - энергии, денег, времени и т. п., которые субъект расходует для достижения цели (то есть для изучения языка). Зачастую происходит путаница между «сложностью» и «затратностью», хотя связь между ними не является прямой. «Трудность» всегда определяется субъектом и зависит от поставленных задач. И, наконец, термин «исходные требования» может послужить связующим звеном между «сложностью» и «трудностью» (так, любой человеческий язык высокотребователен - его может выучить только человеческое существо, но не обязательно «труден», например, с точки зрения ребенка, изучающего родной язык) [Dahl, с. 39-40].

В первом тематическом сборнике статей «Языковая сложность. Типология, контакт, изменение» (2008), изданном под редакцией M. Miestamo, K. Sinnemäki и F. Karlsson^ [Miestamo, Sinnemäki и Karlsson], представлены материалы конференции «Approaches to Complexity in Language» (Хельсинки, 2005). Статьи поделены на тематические секции, которые отражают основную проблематику конференции: типология и теория; контакт и изменение; креольские языки и

пиджины. Из этого сборника наибольший интерес для нас представляет статья P. Juola «Оценка лингвистической сложности» [Juola, 2008], в которой анализируются дефиниции языковой сложности, данные в литературе, и показываются способы измерения сложности. Автор в качестве основного критерия рассматривает фактор сжимаемости текстов.

На основании имеющихся исследований можно сказать, что языковая сложность является одним из значимых концептов современного языкознания; авторы работ отмечают, что сложность может быть рассмотрена на разных уровнях: для языка в целом и отдельных его подсистем, сложность поддается сравнению и оценке; параметры сложности должны быть учтены в лингвистической теории.

3. Параметры сложности: попытка определения

Понятие «сложность» концептуализируется и описывается в различных областях по-разному. Для конкретизации этого понятия необходимо учитывать особенности внутренней организации системы, ее эволюцию, взаимодействие с внешним миром и т. п. При этом следует иметь в виду, что все многообразие внутренних связей объекта на практике достаточно трудно не только описать и параметризовать, но часто и обнаружить. Особенно это замечание существенно для такого сложного и многомерного явления, как язык.

В данной статье будет идти речь о формализуемых и измеряемых параметрах лингвистической сложности.

Выявление сложности языка предполагает поиск объективно оцениваемых, измеряемых и сопоставляемых параметров сложности.

Для определения абсолютной сложности многие исследователи ([Dahl], [Juola, 2008] и некоторые другие) используют понятия теории информации, ключевым из которых является кол-могоровская сложность. Она может быть определена как способ измерения количества информации в строке - как длина алгоритма, необходимого для описания / генерирования данной строки [Juola, 2008, с. 91]. Количественно выражаемым параметром языковой сложности, по мнению автора, может выступать сжимаемость файлов [Там же, с. 92].

Мак-Уортер [McWhorter] при оценке языковой сложности опирается на следующее допущение: «данная область некоторой грамматики сложнее той же области другой грамматики в той же степени, в которой она содержит больше выражаемых поверхностно (overt) различий и / или правил» (цит. по: [Бердичевский, с. 107]). Данное

допущение автором иллюстрируется следующим образом.

1. Инвентарь фонем является тем более сложным, чем большее число маркированных членов он имеет.

2. Синтаксис одного языка тем сложнее, чем большее число правил он требует (например, фактором осложнения может быть асимметрия между главными и подчиненными предложениями).

3. Одна грамматика является более сложной, чем другая, в той степени, в какой она дает явное и грамматикализованное выражение большему числу мелких семантических и / или грамматических различий, чем другая.

4. Словоизменительная (флективная) морфология делает грамматику более сложной, чем иная, применительно к большинству случаев [McWhorter, с. 135-137].

По нашему мнению, к морфологическим факторам, оказывающим влияние на сложность, могут быть отнесены следующие:

• единообразие (универсальность) средств для выражения лингвистической категории (граммемы) для слов разных грамматических классов;

• регулярность средств выражения грамматической категории или граммемы (отсутствие исключений из правил);

• многообразие грамматических категорий и граммем разных типов;

• характер и степень лингвистической избыточности;

• длина аффиксальных цепочек в пределах словоформы;

• свободный или фиксированный порядок элементов в пределах лингвистической единицы (словоформы, словосочетания, предложения);

• трудности интерпретации словоформ, содержащих или не содержащих тот или иной аффикс.

Рассмотрим эти параметры более подробно в следующей части работы на примере категории числа в татарском языке.

4. Категория числа с точки зрения лингвистической сложности

Категория числа в татарском языке - одна из достаточно простых категорий: она двучленна и состоит из граммемы единственного числа и граммемы множественного числа.

Наличие универсального маркера множественного числа для имен и глаголов значительно упрощает систему словоизменения и описание системы грамматики:

(1) балалар уйныйлар

ребенок-РЬ играть-РКЕ8_3, РЬ

'дети играют'.

Таблица 1 дает общее представление о распределении словоформ с аффиксом множественного числа по частям речи в корпусе (данные с неснятой грамматической омонимией).

Таблица 1.

Распределение словоформ с аффиксом

множественного числа в Татарском _национальном корпусе_

Часть речи Количество словоформ

Существительные 673000

Глаголы 255000

Прилагательные 78000

Местоимения 44000

Противопоставление форм единственного и множественного числа формально (морфологически) реализуется противопоставлением форм, имеющих и не имеющих аффикс -ЛАр, который присоединяется непосредственно к основе существительных перед аффиксами падежей и принадлежности. Ср.: (2) и (3):

(2) китабымнан китап-POSSJ, ABL 'из моей книги'

(3) китапларымнан китап-PL, P0SS_1, ABL ' из моих книг'

В глагольных словоформах стандартный аффикс множественного числа присоединяется после залоговых и временных аффиксов:

(4) кайтартканнар вернуть-CAUS, CAUS, PST_IND, PL 'заставили вернуться [кого-либо] '

В действительности интерпретация форм, имеющих и не имеющих аффикса множественного числа, является не столь однозначной, и вопрос требует дальнейшего исследования.

Основным значением форм множественного числа, как и в русском языке, является обозначение аддитивной множественности - расчлененной множественности однородных индивидуализированных объектов в противоположность их единичности (см.: пример (2)).

Спецификой тюркских языков является значение ассоциативной множественности, когда выделяется центральный объект и обозначаются (но не называются) периферийные объекты; значение ассоциативной множественности определяется как «X и другие подобные ему объекты» [Плунгян, с. 282]:

(5) Маратлар Марат-PL

'Марат и его близкие'.

В контексте устной речи разграничение аддитивной и ассоциативной множественности не вызывает труда, так как они отличаются ударением:

(6) энилЭр 'мамы' (аддитивная множественность);

(7) энИлэр 'мама и те, с кем она живет', 'папа и мама' (ассоциативная множественность).

В качестве периферийного значения множественного числа можно назвать еще одно значение, в контексте данной работы обозначим его как экспрессивную множественность; ее легче всего продемонстрировать на примере лексем, выражающих единичные понятия, например, солнце (8-10):

(8) Кайда соц ул нурлы тацнар, ай, кояшлар (солнце-РЬ) балкыйлар? (Х. Такташ) [Татарский национальный корпус] - Где эти лучистые зори, когда сияли луна и солнце?

(9) Кояшларыц (солнце-РЬ, Р088_2) белэн кил син мица (Р. Ахметзянов) [Там же] - Приходи ко мене вместе со своим солнцем.

(10) Кояшлары (солнце-РЬ, Р088_3) белэн якты безнец халык (Р. Яхина) [Там же] - Наш народ светел своим солнцем.

В большей части обнаруженных примеров с лексемой с аффиксом множественного числа, выражающей экспрессивную множественность, объекту дается положительная оценка, хотя выявлены отдельные примеры со сниженной экспрессией.

Тип значения множественного числа на структуру аффиксальной цепочки не влияет.

Образование форм множественного числа осуществляется в системе татарского языка на регулярной основе - только при помощи одного аффикса -ЛАр, который имеет конкретную реализацию в виде алломорфов -лар/-лэр, -нар/-нэр; выбор алломорфов детерминирован фонетически и подчиняется правилам дополнительной дистрибуции. Алломорфия для разных частей речи описывается одними и теми же правилами.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Следует оговорить, что аффикс -ЛАр все же выражает не любую множественность. Так, образование личных (и мотивированных личными) форм местоимений и глаголов в парадигме множественного числа имеет свою специфику, обусловленную семантически: мы есть 'я + кто-то', а не 'много я'; аналогично вы есть обычно 'ты + кто-то', но не обязательно 'много ты' (речь не обязательно идет об участниках коммуникации). Поэтому для 1-го и 2-го лица местоимений и глаголов стандартный показатель множественного числа не работает (можно отметить, что данное явление семантически ближе не к аддитивной, а, скорее, к ассоциативной множественности, по-

скольку группа объектов формируется вокруг центрального субъекта, но здесь работает еще важный дейктический фактор - этот центральный субъект является участником коммуникации), и используются оригинальные синкретические формы, совмещающие значение числа и лица.

(11) мин барам - без барабыз

я идти-РКЕ8, 180 мы идти-РКЕ8, 1РЬ

'я иду' - 'вы идете'.

Такие личные формы также сами по себе достаточно регулярны (но имеется некоторая спецификация по временам глагола).

Важным критерием для оценки лингвистической сложности является регулярность образования словоформ. Как известно, «основным свойством, необходимым для того, чтобы значение могло выражаться морфологически, является способность данного значения модифицировать достаточно большое число других значений (или, иначе, способность его носителя сочетаться с достаточно широким классом языковых единиц)» — свойство «всеобщности» [Плунгян, с. 103].

Хотя об абсолютной регулярности образования форм множественного числа в татарском языке говорить нельзя, следует отметить, что данные формы в татарском языке более частотны и регулярны, чем в русском языке, где многие слова, лексические значения которых не предполагают противопоставления по признаку «единичность - множественность» (в частности, названия отвлеченных качеств и действий, веществ, имена собственные, слова, обозначающие единичные объекты), обычно не присоединяют аффикс множественного числа. Это связано с тем, что татарское множественное число имеет не только значение стандартной расчлененной множественности, но и может выражать другие типы значений, например, ассоциативную или экспрессивную множественность (см. примеры (5. 7-10)), что приводит к сокращению количества реальных дефектных числовых парадигм в татарском языке.

Совершенно очевидно, что увеличение количества грамматических категорий и граммем значительно усложняет систему языка и правила ее описания. Так, использование принципиально двух разных типов предикативного отрицания: морфологического для глаголов (кайтты 'вернулся' - кайт-ма-ды 'не вернулся') и лексического для именных частей речи (матур тYгел -'не красивый'; таш тYгел - 'не камень') требует отдельной спецификации правил для каждого случая и критериев их различения (см. об этом: [Галиева, Замалетдинов]. В то же время отсутствие морфологических категорий грамматическо-

го рода и одушевленности значительно упрощает систему татарского языка.

Так как категория числа в татарском языке бинарна, парадигмы имеют стандартный двучленный вид.

Одним из факторов, влияющих на лингвистическую сложность, мы считаем характер и степень лингвистической избыточности. Грамматическая избыточность определяется как внутреннее системное свойство языка, «когда два или более элемента (features) исполняют одну и ту же функцию» [Ernst-Jan, Gillette].

В силу того, что маркер множественного числа универсальный (один и тот же для именных и глагольных форм), в контексте аффикс часто дублируется:

(12) балалар чабалар бала-PL бежать-PRES, PL 'дети бегут'.

Стремлением избежать такой избыточности обусловлено широкое использование форм глагола без аффикса множественного числа, если слово, обозначающее агенса, примыкает непосредственно глагольной словоформе (13-14):

(13) балалар чаба бала-PL бежать-PRES 'дети бегут'

(14) чапкан балалар бежать-PCP_PS бала-PL 'бегущие дети'

Форма без аффикса множественного числа в ряде случаев даже обязательна, например, для препозитивных причастий (14), что обусловлено отсутствием словоизменения у препозитивных атрибутивных слов в татарском языке.

Тенденция к опущению аффикса характерна для однородных конструкций:

(15) урман, кыр, болыннарда лес, поле, луг-PL, LOC

'в лесах, на полях, на лугах'. Стремлением к избежанию избыточности можно объяснить также конструкции, где по смыслу и формально аффикс -ЛАр может или должен быть использован дважды, но в действительности используется только один раз, например:

(16) юл кырыйларында дорога край-PL, POSS_3, LOC ' по краям дорог'

(17) елга яралары река берег-PL, POSS_3 'берега рек'.

Для правильной интерпретации подобных форм требуется хорошее знание языка и ситуации / контекста.

Следствием стремления избежать лингвистической избыточности является то, что отсутствие аффикса множественного числа у словоформы не указывает однозначно на представление объекта в количестве, равном одному. В татарском языке даже у существительных с выраженной противопоставленностью по числу, в конкретном словоупотреблении не имеющих аффикс -ЛАр, возможна как соотнесенность с реальной единичностью, так и отсутствие такой соотнесенности, так как интерпретация может включать контекстуальные элементы, указывающие на множественность, за пределами словоформы.

С точки зрения исследования языковой сложности имеет значение также длина аффиксальных цепочек в пределах словоформы. Стремлением избежать слишком громоздких словоформ, состоящих из очень длинных цепочек, можно объяснить то, что примеры дублирования одного и того же аффикса в пределах словоформы достаточно редки:

(18) Ислам дэYлэтлэре вэкимэренэ фести-валънец эчтэлеге ошаса, башка иллэрдэгелэр (страна-РЬ, ЛТТЯ_ЬОС, РЬ) абруе ускэнгэ монда килергэ тели (Радио "Азатлык", 24 мая 2012 г.) [Татарский национальный корпус] - Если представителям мусульманских стран нравится содержательная часть фестиваля, эти иностранцы хотят ехать сюда за славой.

(19) Ульяновск влкэсендэ чыгучы «Омет» га-зетасы чит твбэклэрдэгелэр (местность-РЬ, ЛТТЯ_ЬОС, РЬ) арасында иц влкэннэренец берсе (Родной край, 31 мая 2016 г.) [Там же] - Газета «Эмет», выходящая в Ульяновской области, -одна из старейших газет, выходящих за пределами Республики Татарстан.

Так как татарская словоформа характеризуется строгим расположением элементов, имеются ограничения на сочетаемость аффикса множественного числа с другими аффиксами. Так, аффикс множественного числа может стоять в абсолютном конце слова, за ним могут стоять аффиксы посессивности, падежей, вопросительно-сти, симилятива и некоторые другие.

Заключение

Языковая сложность является одним из значимых концептов современной лингвистической теории, и требуется разработка специальной методологии для оценки и сравнения уровня сложности отдельных языков в целом и их подсистем.

Квантифицируемые (измеряемые) характеристики языков являются чрезвычайно важными с точки зрения оценки их сложности. Задача вычисления частотности грамматических категорий и распределение алломорфов на массиве корпус-

ных данных можно считать первым шагом для оценки языковой сложности.

В статье впервые ставится задача определения лингвистической сложности татарского языка и выделения количественных (измеряемых и сравниваемых) параметров этой сложности на примере категории числа. В работе анализируются также основные способы концептуализации числовых форм, специфические для татарского и тюркских языков, и выделяются аспекты категории числа, значимые с точки зрения оценки сложности.

Регулярность словоизменения и его агглютинативный характер, единообразный характер маркирования форм множественного числа у субстантивов и глаголов, отсутствие лексической и грамматической избирательности при формировании форм множественного числа, жесткие правила выбора алломорфов свидетельствуют об относительной лингвистической простоте категории числа в татарском языке.

Тем не менее интерпретация лексем, содержащих аффикс множественного числа, должна осуществляться на основе знаний о внешнем мире и контекстуального окружения, что привносит дополнительную сложность в процесс интерпретации словоформ с аффиксом множественного числа. Отсутствие строгой соотнесенности форм множественного числа с реальной множественностью объектов, многозначность форм с аффиксом множественного числа являются также факторами, вносящими дополнительную сложность.

Исследование выполнено при финансовой поддержке РФФИ (проект № 15-07-09214 «Разработка математических моделей и методов визуализации корпусных данных».

Список литературы

Бердичевский А. Языковая сложность (linguistic complexity) // Вопросы языкознания. 2012. № 5. С. 101-124.

Галиева А. М., Замалетдинов Р. Р. Морфологическая природа отрицательного слова тYгел в татарском языке // Филология и культура. Philology and Culture. 2016. № 1(43). С. 41-47.

Плунгян В. А. Общая морфология: введение в проблематику. М.: Едиториал, УРСС, 2003. 384 c.

Растригин Л. А. Адаптация сложных систем. Методы и приложения. Рига: Зинатне, 1981. 375 с.

Татарский национальный корпус «Туган тел». URL: http://corpus.antat.ru (дата обращения: 15.03.16).

Becerra-Bonache L., Jimenes-Lopez M. D. A grammatical inference model for measuring language complexity //Advances in Computational Intelligence - 13 th International Work-Conference on Artificial Neural Networks,

IWANN 2015, Palma de Mallorca, Spain, June 10-12, 2015. Proceedings, Part I. 2015. Pp. 4-17.

Dahl O. The growth and maintenance of linguistic complexity. Amsterdam: John Benjamins Publishing, 2004. 336 p.

Ernst-Jan C. Wit, Gillette M. What is linguistic redundancy .URL: http://www.math.rug.nl/~ernst/ linguis-tics/redundancy3.pdf (дата обращения: 15.03.2016).

Juola Р. Assessing Linguistic Complexity. // Mi-estamo M., Kaius S., Fred K. (eds.). Language Complexity: Typology, Contact, Change. Amsterdam: John Benjamins Press, 2008. Pp. 89-108.

Juola P. Measuring linguistic complexity: The morphological tier. Journal of Quantitative Linguistics. № 5(3). 1998. Pp. 206-213.

Kusters W. Linguistic complexity. Netherlands Graduate School of Linguistics. 2003. 411 p.

McWhorter J. The world's simplest grammars are creole grammars // Linguistic typology. 2001. 5(2-3). Pp. 125 - 166.

Miestamo M., Kaius S., Fred K. (eds.). Language Complexity: Typology, Contact, Change. Amsterdam: John Benjamins Press, 2008. 375 p.

References

Becerra-Bonache, L., Jimenes-Lopez, M. D. (2015). A Grammatical Inference Model for Measuring Language Complexity //Advances in Computational Intelligence -13th International Work-Conference on Artificial Neural Networks, IWANN 2015, Palma de Mallorca, Spain, June 10-12, 2015. Proceedings, Part I. Pp. 4-17. (In English)

Berdichevskii, A. (2012). Iazykovaia slozhnost' (linguistic complexity). [Linguistic Complexity]. Voprosy iazykoznaniia, No. 5, pp. 101-124. (In Russian)

Dahl, O. (2004). The Growth and Maintenance of Linguistic Complexity. 336 p. Amsterdam, John Benjamins Publishing. (In English)

Ernst-Jan, C. Wit, Gillette, M. (1998). What is Linguistic Redundancy? URL: http://www.math.rug.nl/ ~ernst/linguistics/redundancy3 .pdf (accessed:

15.03.2016). (In English)

Galieva, A. M., Zamaletdinov, R. R. (2016). Mor-fologicheskaia priroda otritsatel'nogo slova tYgel v tatar-skom iazyke [Morphological Nature of the Word tugel in Tatar]. Filologiia i kul'tura. Philology and Culture, 2016. No. 1(43), pp. 41-47. (In Russian)

Juola, R. (2008). Assessing Linguistic Complexity. // Miestamo M., Kaius S., Fred K. (eds.). Language Complexity: Typology, Contact, Change. Pp. 89-108. Amsterdam, John Benjamins Press. (In English)

Juola, P. (1998). Measuring Linguistic Complexity: The Morphological Tier. Journal of Quantitative Linguistics, No. 5(3), pp. 206-213. (In English)

Kusters, W. (2003). Linguistic Complexity. 411p. Netherlands Graduate School of Linguistics. (In English)

McWhorter, J. (2001). The World's Simplest Grammars are Creole Grammars. Linguistic Typology, 2001, No. 5 (2-3), pp. 125-166. (In English)

Miestamo, M., Kaius, S., Fred, K. (eds.) (2008). Language Complexity: Typology, Contact, Change. 375 p. Amsterdam, John Benjamins Press. (In English)

Plungian, V. A. (2003). Obshchaia morfologiia: vve-denie v problematiku [General Morphology: Introduction]. 384 p. Moscow, Editorial, URSS. (In Russian)

Rastrigin, L. A. (1981). Adaptatsiia slozhnykh sistem. Metody i prilozheniia [Adaptation of Complex Systems.

Methodology and Applications]. 375 p. Riga, Zinatne. (In Russian)

Tatarskii natsional'nyi korpus «Tugan tel» [Corpus of the Tatar Language "Tugan tel"]. URL: http://corpus.antat.ru (accessed: 15.03.16). (In Tatar).

The article was submitted on 04.05.2016 Поступила в редакцию 04.05.2016

Галиева Альфия Макаримовна,

кандидат философских наук, ведущий научный сотрудник, НИИ «Прикладная семиотика» АН РТ,

420111, Россия, Казань,

Лево-Булачная,36а

aшgalieva@gшail.coш

Galieva Alfiya Makarimovna,

Ph.D. in Philosophy, Senior Researcher,

the Research Institute of Applied Semiotics of TR AS,

36a Levo-Bulachnaya Str.,

Kazan, 420111, Russian Federation.

[email protected]

Невзорова Ольга Авенировна,

кандидат технических наук,

заместитель директора,

НИИ «Прикладная семиотика» АН РТ,

420111, Россия, Казань,

Лево-Булачная,36а

onevzoro@gшail.coш

Nevzorova Olga Avenirovna,

Ph.D. in Technical Sciences, Vice-Director of the Research Institute of Applied Semiotics of TR AS, 36a Levo-Bulachnaya Str., Kazan, 420111, Russian Federation. [email protected]

i Надоели баннеры? Вы всегда можете отключить рекламу.