Научная статья на тему 'АКТУАЛЬНЫЕ НАПРАВЛЕНИЯ СОВРЕМЕННЫХ ЛИНГВОСТАТИСТИЧЕСКИХ ИССЛЕДОВАНИЙ'

АКТУАЛЬНЫЕ НАПРАВЛЕНИЯ СОВРЕМЕННЫХ ЛИНГВОСТАТИСТИЧЕСКИХ ИССЛЕДОВАНИЙ Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
2
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
формальный метод / формально-структурный подход / структура языка / модель языка / уровень языка / лингво-математическое моделирование / formal method / formal-structural approach / the structure of language / language model / language level / linguistic and mathematical modeling

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Улыбышева А.С., Носорева Н.Г.

В данной статье отражены результаты анализа современных исследований в области прикладной лингвистики с целью изучения проблем формализации языковых единиц, а также формирования понимания возможностей использования математических методов при описании и изучении языковой модели.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ACTUAL DIRECTIONS OF MODERN LINGUOSTATISTICAL RESEARCHES

In this article are reflected the results of analysis of modern researches in the field of applied linguistics to study problems of formalization of linguistic units, and formation of understanding of the possibilities of using mathematical methods for describing and studying the language models.

Текст научной работы на тему «АКТУАЛЬНЫЕ НАПРАВЛЕНИЯ СОВРЕМЕННЫХ ЛИНГВОСТАТИСТИЧЕСКИХ ИССЛЕДОВАНИЙ»

Улыбышева А. С.

студентка, Южный федеральный университет

Носорева Н.Г.

ст. преподаватель кафедры перевода и информационных технологий в лингвистике,

Южный федеральный университет

АКТУАЛЬНЫЕ НАПРАВЛЕНИЯ СОВРЕМЕННЫХ ЛИНГВОСТАТИСТИЧЕСКИХ

ИССЛЕДОВАНИЙ

ACTUAL DIRECTIONS OF MODERN LINGUOSTATISTICAL RESEARCHES

Ulybysheva A.S.

student, the South federal university Nosoreva N. G.

senior teacher of the department of translation and information technologies in linguistics, the South _ federal university

АННОТАЦИЯ

В данной статье отражены результаты анализа современных исследований в области прикладной лингвистики с целью изучения проблем формализации языковых единиц, а также формирования понимания возможностей использования математических методов при описании и изучении языковой модели.

ABSTRACT

In this article are reflected the results of analysis of modern researches in the field of applied linguistics to study problems of formalization of linguistic units, and formation of understanding of the possibilities of using mathematical methods for describing and studying the language models.

Ключевые слова: формальный метод, формально-структурный подход, структура языка, модель языка, уровень языка, лингво-математическое моделирование.

Keywords: formal method, formal-structural approach, the structure of language, language model, language level, linguistic and mathematical modeling.

В современной лингвистике структурный подход к изучению языка, а также быстро развивающиеся технологии по обработке текстового материала, позволяют проводить лингвистические исследования, основной задачей которых является моделирование языка на разных его уровнях. Формальные методы исследования внутренней структуры языка позволяют исследовать и описывать структуру языка, механизмы функционирования составных его элементов, а также отношения между этими элементами с целью вскрытия вероятностной сущности языка, а также изучения возможности применения знания о статистических закономерностях языка к решению практических задач в таких, например, областях как машинный перевод, корпусная лингвистика и т.д. Возросшее число лингвистических исследований с применением математических методов вызывает интерес к тому, какого рода формулируются лингвистические задачи, их прикладной характер и практическое применение.

Данная статья посвящена анализу результатов современных исследований в области прикладной лингвистики с целью изучения проблем формализации языковых единиц, попытки классифицировать результаты лингвостатистических исследований по принципу соотношения прикладной задачи и языкового уровня, на котором они решаются, по принципу диахронии, а также изучение корпусов текстов, на которых решались поставленные задачи. Анализируемый материал представляет собой выборочную совокупность текстов, отражающих результаты исследовательских работ, построенную на корпусе научной электронной библиотеки диссертаций и составляет 53 работы, основным научным методом исследования которых является формальный метод.

Формально-структурный подход к изучению языковой структуры предполагает выделение и решение частных лингвостатистических задач на таких языковых уровнях, как фонемный, морфемный, лексический, и синтаксический. Исходя из наших наблюдений, было выявлено, что внимание лингвистов-исследователей уделялось изучению как какому-то одному из языковых уровней, так и совокупности двух или более языковых уровней. Согласно работам Пешковского А., Петерсона Н., Сухотина В., Потебня А., лексика является центральной частью языка, именующей, формирующей и передающей знания о каких-либо объектах, явлениях [4]. Лексика представляет собой наиболее открытую и подвижную сферу языка, в рамках которой можно наблюдать процесс порождения новых слов, а также фиксировать моменты вывода лексики из активного употребления. Нарастающая сфера человеческих знаний, прежде всего, закрепляется в словах и их значениях, благодаря чему лексических приобретений в языке становится все больше, а это в свою очередь, согласно Виноградову В.В., Фортунатову Ф.Ф., находит свое отражение в функционировании синтаксических конструкций [2]. Анализ материала исследования показал, что как раз чаще всего изучению подвергались синтаксический и лексический уровни языка. Более того, анализ наблюдения подтвердил связь взаимодействия элементов лексического и синтаксического уровней, которая проявляется чаще чем на других уровнях, поскольку лексический уровень отражает словарный состав языка, позволяя изучать лексическое значение слов, определять их сочетаемость и функцию в предложении, а синтаксический отражает строй языка и речи, позволяя изучать строение словосочетаний и предложений, взаимодействие различных частей речи внутри этих предложений и словосочетаний.

В ходе изучения содержания научных работ было выяснено, что самым непроработанным языковым уровнем является морфемный. Данный языковой уровень является менее подвижным и открытым, чем другие, является более статичным и имеет меньше тенденций к изменяемости и наполняемости, т. к., по мнению Касевича В.Б., морфология обладает относительной автономией, а посему меньше других взаимодействует с остальными уровнями языка [3]. Это подтверждает идею о том, что морфемный уровень является переходным, поскольку большинство работ отражают результаты решения задачи, в которых морфемный уровень исследуется в связке с другими уровнями языка.

Помимо оценки распределения интереса лингвистов к выбору изучения того или иного языкового уровня, нам немаловажно было изучить вопрос разнообразия поставленных задач лингвоста-тистических исследований. Так, на фонемном уровне мы выделили такие задачи как: выявление основных особенностей речи; определение речевых жанров; выявление типичных коммуникативных ситуаций. Учитывая, что процент работ, в которых исследовался фонемный уровень, равен девяти, поэтому в данной ситуации не приходится и наблюдать большого разнообразия формулировок задач.

На морфемном уровне нами была выделена следующая группа задач общего характера: разработка формальных методов для автоматизированного анализа текста, построение модели анализа теста, разработка и описание модели переводного учебного глоссария английских глагольно-имен-ных терминосочетаний для определенного типа дискурса. Небольшой процент работ, всего четыре, также не позволяет нам определить все разнообразие полета исследовательской мысли специалистов данной области.

Список выделенных задач на лексическом уровне наиболее разнообразен и интересен: изучение и анализ существующих современных формальных методов автоматической обработки естественного языка; исследование существующих подходов к построению систем автоматического поиска информации; исследование существующих подходов к автоматизации смыслового анализа текстов на естественном языке; формулировка критериев оценки сходства смыслового содержания кон-тентов и построение алгоритмов сопоставления; исследование тематической, жанрово-стилистической и композиционной специфики научных тезисов как особого жанра; рассмотрение лексикографических способов и средств описания; анализ современных автоматизированных обучающих лингвистических систем; определение механизмов понимания речи с точки зрения возможности их дальнейшего моделирования; описание модели понимания речи на основе определения механизмов понимания речи, определение ее основных характеристик; рассмотрение методов и алгоритмов, которые могут быть применены при моделировании процессов понимания.

Работ, исследующих данный языковой уровень, самое наибольшее количество, поэтому здесь мы можем наблюдать большое разнообразие задач, которые направленны на изучение состава лексики и не только.

В рамках синтаксического уровня исследователи ведут свои разработки в таких направлениях, как: методология синтаксического анализа теста; описание природы причин, вызывающих синтаксическую неоднозначность; классификация и исследование свойств потенциально возможных неоднозначных сочетаний; исследование свойств линейной структуры русских предложений; написание алгоритма, моделирующего синтаксическую структуру анализируемых единиц текста. Таким образом, анализ и изучение круга ставящихся задач позволяет понять масштабы возможностей использования математических методов при изучении языковой модели, а также расширить границы понимания того, какого рода лингвистические исследования проводятся на данный момент развития современной прикладной лингвистики.

Классификация работ по диахроническому признаку показала, что изучения языка с помощью формального метода приходится на 1978-2011 года, при этом пик использования данного метода приходится на 2005-2009 года. Анализ научной литературы, а также контекста электронных ресурсов показал, что за этот период времени создается огромное количество специализированных, тематических электронных корпусов текстов, как отклик на технологические возможности персонального компьютера по обработке больших объемов текстов. Изучение материала, на котором проводились лингвостатистические исследования, показало, что в 18-ти процентах работ использовались корпусные технологии, а сами исследования проводились непосредственно на корпусах текстов, среди которых мы отметили Национальный корпус русского языка - 8% работ; Уральский корпус русского языка - 2% работ; Корпус юридических документов - 4% работ; Корпус спонтанной коммуникации в русскоязычном чате - 2% работ; Корпус современных американских экономических текстов -2% работ.

Анализ оставшейся выборочной совокупности научных работ показал абсолютное разнообразие в выборе материала для изучения: художественные тексты - 11 % работ, различные нормативные документы - 6% работ, публицистическая литература -4% работ, аудиозаписи военной деловой речи - 2% работ, технические тексты - 9% работ. Можно сделать вывод о том, что формальный метод является универсальным, т.к. его можно использовать для исследований на материале совершенно различных текстов, даже аудиозаписей и решать с его помощью широкий круг задач. Однако нам не представилось возможности описать полную структуры материалов исследования, так как было обнаружено, что в 23 % работах материал вообще не был представлен и описан. Тем не менее, наше исследование позволяет нам сформировать мнение о том, что просмотренные работы охватывают весь спектр отношений между элементами языковой структуры, как парадигматических, так и синтагматических, хотя и отмечается некая неравномерность их репрезентации.

Таким образом, анализ результатов современных исследований в области прикладной лингвистики позволил нам не только изучить актуальные

проблемы в области формализации языковых единиц, но и понять масштабы возможностей использования математических методов в области лингво-математического моделирования, а также расширить границы понимания того, на каком уровне развития находится современная прикладная лингвистика.

Список литературы

1. Научная электронная библиотека диссертаций и авторефератов [Электронный ресурс] / Каталог научных работ в Российском интернете. - ООО

"Научная электронная библиотека", г. Санкт-Петербург. Режим доступа: http://www.dissercat.com.

2. Виноградов В. В. Лексикология и лексикография: Избр. тр. / В.В. Виноградов; Отв. ред. |и авт. предисл.1 В.Г. Костомаров; АН СССР, Отд-ние лит. и яз. - М.: Наука, 1977.

3. Касевич В. Б. Семантика. Синтаксис. Морфология. М.: Наука, 1988.

4. Пешковский А. М. Избранные труды / под-гот. к печ., вступ. ст. и коммент. И. А. Василенко и И. Р. Палей. - М.: Учпедгиз, 1959.

Шарина С.И.

Институт гуманитарных исследований и проблем малочисленных народов Севера СО РАН, зав. сектором эвенской филологии, к.ф.н.

ИЗЪЯВИТЕЛЬНОЕ НАКЛОНЕНИЕ В НИЖНЕКОЛЫМСКОМ ГОВОРЕ ЭВЕНСКОГО

ЯЗЫКА

THE INDICATIVE MOOD IN NIZHNEKOLYMSKY DIALECT OF THE EVEN LANGUAGE

Sharina S.I.

Institute of humanitarian researches and Problems of the minorities peoples of the North of the Siberian Branch of the Russian Academy of Science, Section Head of Even philology, сandidate ofphilology sciences

АННОТАЦИЯ

В статье рассматривается парадигма изъявительного наклонения глагола в нижнеколымском говоре эвенского языка, которая включает формы настоящего, прошедшего и две формы будущего времени - ближайшее будущее, или будущее I, и отдаленное будущее, или будущее II время. Выявляется, что в нижнеколымском говоре парадигма изъявительного наклонения обнаруживает диалектные особенности, обусловленные фонетическими, морфологическими семантическими различиями.

Материалом для написания данной статьи послужили полевые материалы автора, собранные во время полевых экспедиций в Нижнеколымском районе Республики Саха (Якутия) в 2013-2015 годах.

ABSTRACT

The article deals with the paradigm of the indicative mood of the verb in the Lower Kolyma dialect of the Even language, which includes the forms of the present, the past and two forms of the future tense - the near future, or the future I, and the distant future or the future II time. It is revealed that in the Lower Kolyma dialect the paradigm of the indicative mood is revealed by dialectal features caused by phonetic, morphological, semantic differences.

The material for the writing this article the author served as field data collected during field expeditions in the Lower Kolyma region of the Republic of Sakha (Yakutia) in 2013-2015.

Ключевые слова: эвенский язык, нижнеколымский говор, глагол, наклонение, диалектные особенности.

Keywords: Even language, Nizhnekolymsky dialect, verb, indicative, dialect features.

Нижнеколымский говор эвенского языка относится к тем говорам и диалектам, которые до сих не имеют систематического описания, поэтому новые материалы по неисследованному говору представляют интерес не только для диалектологов и лексикографов, но и имеют большое значение для задачи фиксации и документации исчезающих языков коренных малочисленных народов Севера.

Категория наклонения в эвенском языке выражает отношение действия к действительности. Изъ-

явительное наклонение выражает реальное действие и не имеет специального показателя [4, с. 132].

Парадигма изъявительного наклонения глагола в нижнеколымском говоре эвенского языка включает формы настоящего, прошедшего и две формы будущего времени - ближайшее будущее, или будущее I, и отдаленное будущее, или будущее II время, как и в аллаиховском говоре [1, с.49].

Формы спряжения глагола в настоящем времени (презенсе) представлены в таблице 1.

Таблица 1

Спряжение глагола в настоящем времени изъявительного наклонения

Исходная форма Основа на гласный Основа на согласный Основа на -н

hадай 'знать' будэй 'дать' миалдай ' проснуться' иттэй ' видеть' и^ай дойти' гундэй 'сказать'

1 л. ед. ч. hарам бурэм миалдам иттэм иhрам гунэм

2 л. ед.ч. hанди бунди миаланди ичэнди иhанди гунэнди

3 л. ед.ч. hан бун миалдан иттэн иhран гунни

1 л. мн.ч. hарап бурэп миаллап иттэп иhрап гунэп

2 л. мн.ч. hаh буh миалаh ичиh иhаh ^roh

3 л. мн.ч. hар бур миалда иттэ иhра гун

i Надоели баннеры? Вы всегда можете отключить рекламу.