Научная статья на тему 'Основные направления прикладных лингвистических исследований в Республике Таджикистан'

Основные направления прикладных лингвистических исследований в Республике Таджикистан Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
244
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТАДЖИКСКИЙ ЯЗЫК / КОГНИТИВНАЯ ЛИНГВИСТИКА / КОРПУСНАЯ ЛИНГВИСТИКА / СТРУКТУРНАЯ ТИПОЛОГИЯ / КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА / МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА / THE TAJIK LANGUAGE / COGNITIVE LINGUISTICS / CORPUS LINGUISTICS / STRUCTURAL TYPOLOGY / COMPUTER LINGUISTICS / MATHEMATICAL LINGUISTICS

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Одинаев А. А.

В статье представлен обзор наиболее значимых направлений в исследованиях по прикладной лингвистике за последние пять лет. Цель заключается в попытке обобщения и оценке исследовательских работ, проводимых как отдельными учеными (лингвистами, математиками и программистами), так и группами исследователей на территории Республики Таджикистан.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE MAIN TRENDS OF APPLIED LINGUISTIC RESEARCHESIN THE REPUBLIC OF TAJIKISTAN

The article provides a brief overview of the most significant trends of researches in the field of applied linguistics conducted in the last five years by both individual scientists and research groups in the Republic of Tajikistan. The novelty of the article is determined by an attempt to summarize and evaluate researches conducted by scientists in the sphere of philology and linguistics, mathematics and programming related to linguistics.

Текст научной работы на тему «Основные направления прикладных лингвистических исследований в Республике Таджикистан»

УДК 81'33 А. А. Одинаев

аспирант кафедры теоретического и прикладного языкознания филологического факультета Российско-Таджикского (славянского) университета, Республика Таджикистан, г. Душанбе e-mail: [email protected]

ОСНОВНЫЕ НАПРАВЛЕНИЯ ПРИКЛАДНЫХ ЛИНГВИСТИЧЕСКИХ ИССЛЕДОВАНИЙ В РЕСПУБЛИКЕ ТАДЖИКИСТАН

В статье представлен обзор наиболее значимых направлений в исследованиях по прикладной лингвистике за последние пять лет. Цель заключается в попытке обобщения и оценке исследовательских работ, проводимых как отдельными учеными (лингвистами, математиками и программистами), так и группами исследователей на территории Республики Таджикистан.

Ключевые слова: таджикский язык; когнитивная лингвистика; корпусная лингвистика; структурная типология; компьютерная лингвистика; математическая лингвистика.

A. A. Odinaev

Postgraduate student, Russian-Tajik Slavic University, Dushanbe, Tajikistan e-mail: [email protected]

THE MAIN TRENDS OF APPLIED LINGUISTIC RESEARCHES IN THE REPUBLIC OF TAJIKISTAN

The article provides a brief overview of the most significant trends of researches in the field of applied linguistics conducted in the last five years by both individual scientists and research groups in the Republic of Tajikistan. The novelty of the article is determined by an attempt to summarize and evaluate researches conducted by scientists in the sphere of philology and linguistics, mathematics and programming related to linguistics.

Key words: the Tajik language; cognitive linguistics; corpus linguistics; structural typology; computer linguistics; mathematical linguistics.

Закрепление таджикского языка в качестве государственного согласно Конституции, а также принятие в Республике Таджикистан в 2009 г. Закона о языке стали поворотным событием в жизни страны. Внедрение ряда законодательных актов и специальных программ, способствующих расширению сферы использования таджикского языка в различных общественных, научных, государственных и иных

областях, явилось стимулирующим фактором для начала проведения в Республике прикладных лингвистических исследований по изучению и практическому применению всего массива и аналитического инструментария государственного языка.

Целью статьи является обзор и критическая оценка основных направлений в области прикладных лингвистических исследований, проводимых в настоящее время учеными (коллективами ученых) на территории Республики Таджикистан.

Анализ рецензируемых электронных источников, а также публикуемых в Республике Таджикистан сборников материалов научных международных, региональных, республиканских, межвузовских конференций и «круглых столов», научных вестников, монографий, сборников и статей позволил выявить ряд ключевых направлений в области прикладной лингвистики, по которым ведется активная исследовательская деятельность. Исходя из этого, основными магистральными направлениями подобного рода исследований можно назвать когнитивную лингвистику, корпусную лингвистику, прикладные аспекты структурной типологии и компьютерной (математической) лингвистики. Подробное рассмотрение каждого из данных направлений позволит оценить состояние и перспективы развития прикладной лингвистики в Республике Таджикистан на современном этапе.

Направление исследований в области когнитивной лингвистики, которое до сих пор в Таджикистане либо отсутствовало, либо носило фрагментарный характер, на сегодняшний день представлено коллективом исследователей, работающих под научным руководством профессора Д. М. Искандаровой на кафедре теоретического и прикладного языкознания Российско-Таджикского (славянского) университета. В настоящее время в рамках перспективного плана научно-исследовательской работы кафедры ведутся многочисленные изыскания в области когнитивной лингвистики в направлении разработки концептов «судьба», «путь», «семья», «женщина», «ум», «ложь», «измена», «еда» и т. д. на материале разноструктурных языков (например, таджикского, русского, китайского, французского) в сопоставительном плане. Исследования затрагивают такие важные проблемы, как ментальность, языковая личность (в том числе билингва), ценностные доминанты, стереотипы и т. д. Актуальность подобных исследований обусловлена современной тенденцией к интеграции

различных областей лингвистических исследований, необходимостью использования данных о когнитивных процессах в изучении различных аспектов дискурсивной деятельности, психо-, этно- и социолингвистики, а также компьютерной лингвистики, с учетом проблем создания искусственного интеллекта [9].

Анализируя данное направление в проведении научных исследований, следует отметить, что оно является сравнительно молодым, однако быстро развивающимся в лингвистической науке Таджикистана, что обусловливает наличие небольшого количества законченных исследовательских работ когнитивной направленности и отсутствие их широкой известности. Вместе с тем, имеющиеся результаты исследований позволили выпустить первый в стране сборник статей по данному направлению «Исследования по когнитивной лингвистике» [9], монографии Иоанны Будны «Концепт время в языковом сознании индоевропейских народов» [1], Анны Пак «Сопоставительное исследование концепта красота в китайском и русском языках» [10].

Другим важнейшим направлением прикладных исследований является корпусная лингвистика. Она направлена на разработку общих принципов создания лингвистических корпусов данных с применением новейших компьютерных технологий, а также на оптимизацию гносеологической функции языка, что является одной из перспективных областей прикладной лингвистики [11]. Следует отметить несколько статей профессора Д. М. Искандаровой, в которых содержится анализ состояния, проблем и перспектив развития корпусной лингвистики в Республике Таджикистан [6-8]. Прежде всего, стоит отметить, что, судя по имеющимся данным, в настоящее время корпусы текстов таджикского языка либо обладают недостаточным объемом, либо находятся на стадии разработки. Однако, по утверждениям некоторых исследователей, университет Хельсинки уже конкретно располагает корпусом из 87654 слов, а Мардумиён и Парвоз анонсируют корпус даже из 500000 слов. Самый большой и единственный корпус в свободном доступе предлагается в проекте Leipzig Corpora Collection, который состоит из 100000 таджикских предложений, что соответствует приблизительно 1,8 млн слов. Иранский лингвист Хамид Хасани заявил, что готовит таджикский корпус в 1 млн слов. Имеется также информация, что и Академия наук Таджикистана уже владеет корпусом из 10 млн слов. К сожалению, по крайней мере, последний из упомянутых корпусов не отвечает многим предъявляемым к ним требованиям [5].

В данной связи хотелось бы отметить ряд исследований, представленных в проекте на сайте Терминологического комитета АН Республики Таджикистан, где размещены корпусы классиков таджикско-персидской поэзии Рудаки, Фирдавси, Мавлоно, Хафиза, Саъди Шерази, а также современных таджикских поэтов Лоика Шерали и Мумина Каноата. Создатели и разработчики корпуса отмечают, что Комитет по терминологии при Академии наук Республики Таджикистан совместно со Школой информационной и коммуникационной технологии проектируют и создают корпус национального таджикского языка. Намечается разработка корпуса таджикского языка на базе не менее 10 млн слов с использованием таджикских текстов.

В рамках исследований в области корпусной лингвистики стоит упомянуть также и о совместных исследованиях чешских специалистов Яна Помикалека, Вита Сухомела, Павела Шмерка и таджикского ученого Гулшана Довудова в направлении создания корпуса таджикских текстов, проводящихся при Масариковом университете (Чехия). По их данным, корпус текстов современного таджикского языка включает 50 млн слов. Тексты для корпуса были отобраны из Интернета с применением различных подходов.

Таким образом, можно прийти к заключению, что направление корпусной лингвистики в Таджикистане на материале таджикского языка, так же как когнитивная лингвистика, находится на стадии становления. Результаты свидетельствуют об интересе к развитию данного направления как со стороны отдельных ученых, так и со стороны государственных учреждений. Вместе с тем, несмотря на большое количество усилий, прилагаемых к созданию корпуса текстов на таджикском языке, подобного корпуса текстов, удовлетворяющего потребностям прикладных лингвистических исследований и соответствующего всем стандартам, предъявляемым к такого рода полнотекстовым базам данных, на сегодняшний день не создано.

Прикладные исследования в области структурной типологии таджикского языка носят, скорее, фрагментарный характер и представлены, в основном, небольшим количеством работ, носящих междисциплинарный характер, значительная часть которых выполнена в рамках исследований по компьютерной лингвистике. В этой связи стоит отметить монографическое исследование А. Ю. Фомина «Основы структурной типологии лексико-морфологической системы

таджикского языка» [17], которое было выполнено в рамках проекта по созданию компьютерного приложения таджикско-персидской конверсии графических систем письма, осуществленного совместно с З. Д. Усмановым и Л. А. Гращенко [15].

Среди крупных исследований в данной области, имеющих большой потенциал практического применения и осуществленных в последнее время, можно назвать также работу Р. Д. Салимова «Структура и семантика односоставных предложений в русском и таджикском языках» [12]. Сюда же можно отнести не получившую широкого распространения работу А. Ю. Фомина по глоттохронологическому исследованию дивергенции таджикского, дари и персидского языков [16].

Как уже отмечалось выше, прикладные исследования по данному направлению не имеют массового характера. Следует отметить большое количество диссертаций, монографий и статей в рамках направления структурной типологии и сопоставительного языкознания, публикующихся и защищающихся в научной среде Таджикистана, которые носят скорее теоретический характер и пока, к сожалению, никак не реализованы в прикладном плане.

Направление компьютерной (математической) лингвистики представлено целой научной школой под руководством академика АН Республики Таджикистан, профессора, доктора физико-математических наук З. Д. Усманова. Именно в данном направлении концентрируется основная масса научных публикаций и практического внедрения, в виде программных продуктов, прикладных лингвистических исследований, проводимых на материале таджикского языка. Результаты исследований являются неотъемлемой частью перспективной программы информатизации общества на базе таджикского языка, необходимость решения которой непосредственно связана с определением места нашей страны в современном мире в эпоху глобализации.

Анализ научных публикаций последнего периода [2-4; 13-15] позволил констатировать наличие ряда значительных достижений в области компьютерной лингвистики, которые нашли свое воплощение в конкретных программных продуктах и касались не только проблематики внутриязыковых преобразований таджикских текстов, но также и в области межъязыковой коммуникации.

Тематика исследований в сфере разработки и совершенствования средств внутриязыкового согласования текстов для таджикского языка

представлена работами Л. А. Гращенко по согласованию таджикских шрифтов [2], К. С. Бахтеева по созданию унифицированного символьного препроцессора таджикских текстов [3], О. М. Солиева и Х. Ху-добердиева по реализации поддержки таджикского языка системами проверки правописания пакета Microsoft Office [13].

Направление межъязыковых преобразований текстов представлено следующими исследовательскими проектами [2-4; 13-15]:

1. Разработка и совершенствование средств конверсии графических систем письма между фарси, дари и таджикским языками. С 2009 г. группой ученых (З. Д. Усманов, Л. А. Гращенко и А. Ю. Фомин) велась разработка программного комплекса по реализации таджикско-персидской конверсии графических систем письма. К 2011 г. основная часть данных исследований была завершена, а в 2012 г. был уже разработан обратный конвертер [2-4]. Практическая ценность данных разработок, помимо собственно функционала конверсии текстов, состоит в разработке вспомогательного инструментария по оценке доли заимствований из арабского и европейских языков в таджикских текстах, который может применяться в отдельных лингвистических исследованиях.

2. Разработка системы машинного перевода с языков фарси и дари на русский язык. Л. А. Гращенко начата разработка системы машинного перевода с языков фарси и дари на русский язык «Папирус». К настоящему времени уже разработана и апробирована система графематического анализа персидского языка.

3. Исследование межморфемных отношений узбекского и таджикского языка. Группой исследователей уже начата разработка средств автоматического установления межморфемных соответствий языковой пары таджикского и узбекского языков для последующей реализации межъязыкового преобразователя.

4. Исследование афганского языка (пушту и фарси). А. Ю. Фоминым начаты исследования в направлении установления взаимосвязей персидско-таджикского языкового кластера и афганского языка (пушту) на предмет применимости методов языковой трансформации.

5. Вспомогательные исследования в рамках разработки средств машинного перевода с таджикского на русский язык. В рамках реализации системы машинного перевода с таджикского языка на русский Л. А. Гращенко совместно с Д. Д. Собировым проводились вспомогательные исследования автоматического распознавания

глагольных конструкций таджикского зыка. Получена предварительная статистика распределения различных глаголов и элементов глагольных конструкций по таджикским текстам.

Таким образом, направление компьютерной лингвистики в Таджикистане добилось значительных результатов, однако необходимо также отметить факт отсутствия широкого внедрения результатов исследований и продуктов разработок данного сегмента научной деятельности в практику. Многие исследования рассматриваются как перспективные, однако находятся на начальном этапе своего воплощения, что также отражается на оценке их значимости как прикладного продукта.

В заключение следует отметить также зарождение новых перспективных направлений в прикладных лингвистических исследованиях в Республике Таджикистан, например, в таких областях, как психолингвистика (фоносемантический анализ таджикского языка) и судебная лингвистика.

СПИСОК ЛИТЕРАТУРЫ

1. Будна И. Концепт «время» в языковом сознании индоевропейских народов. - Душанбе, 2006. - 101 с.

2. Гращенко Л. А. Клиент удаленной автоматизации согласования компьютерных шрифтов таджикского языка // Доклады Академии наук Республики Таджикистан. - 2011. - Т. 54. - № 4. - С. 367-370.

3. Гращенко Л. А. Комплекс средств автоматизации межъязыковых преобразований текстов для центрально-азиатского региона // Новые информационные технологии в автоматизированных системах : материалы XVI науч.-практ. семинара. - 2013. - № 16. - С. 283-286.

4. Гращенко Л. А., Фомин А. Ю. Опыт реализации средств таджикско-персидской конверсии графических систем письма // Доклады Академии наук Республики Таджикистан. - 2008. - Т. 51. - № 8. - С. 580-583.

5. ДовудовГ., ПомикалекЯ., Сухомел В., Шмерк П. Об автоматизированном создании корпуса таджикского языка // Перспективы развития фундаментальных и прикладных лингвистических исследований в РТ. Автоматизация лингвистических исследований : материалы «Круглого стола». -Душанбе, 2012. - С. 8-14.

6. Искандарова Д. М. Корпус Рудаки и его лингвистическая обработка // Рудаки и становление таджикского литературного языка : материалы Междунар. науч.-практ. конф., посв. 1150-летию Рудаки и Году таджикского языка. - Душанбе : РТСУ, 2008. - С. 31-38.

7. ИскандароваД. М. Создание национального корпуса таджикского языка: проблемы и пути решения // Забон - рукни тоат (мачмуаи маколахо). -Китоби 6. - Душанбе, 2013. - С. 39-48.

8. Искандарова Д. М. Проект по созданию корпусов параллельных текстов как одна из наиболее актуальных задач отечественного языкознания // Актуальные проблемы филологии : материалы Республиканской науч.-практ. конф. - Душанбе, 2013. - С. 162-171.

9. Исследования по когнитивной лингвистике : сб. ст. - Вып. 1. - Душанбе : РТСУ, 2013. - 120 с.

10. Пак А. Сопоставительное исследование концепта «красота» в китайском и русском языках. - Душанбе, 2009. - 174 с.

11. Потапова Р. К. Основные тенденции развития многоязычной корпусной лингвистики // Речевые технологии. - 2009. - № 2-3. - С. 92-114.

12. Салимов Р. Д. Структура и семантика односоставных предложений в русском и таджикском языках. - Душанбе : Ирфон, 2009. - 404 с.

13. Усманов З. Д. Информация о результатах научной школы Таджикистана по компьютерной лингвистике в 2011 г. // Новые информационные технологии в автоматизированных системах. - 2012. - № 15. - С. 154-156.

14. Усманов З. Д., Довудов Г. М. Частотный морфемный словарь таджикского литературного языка // Доклады Академии наук Республики Таджикистан. - 2010. - Т. 53. - № 4. - С. 257-262.

15. Усманов З. Д., Гращенко Л. А., Фомин А. Ю. Информационные основы автоматизированной таджикско-персидской транслитерации // Известия Академии наук Республики Таджикистан. - 2008. - № 1 (130). - С. 20-26.

16. Фомин А. Ю. Глоттохронологическое исследование дивергенции таджикского, дари и персидского языков. - Душанбе, 2011. - 34 с.

17. Фомин А. Ю. Основы структурной типологии лексико-морфологической системы таджикского языка. - Душанбе, 2012. - 121 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.