Научная статья на тему 'ПРИКЛАДНЫЕ ЛИНГВИСТИЧЕСКИЕ ИССЛЕДОВАНИЯ В РЕСПУБЛИКЕ ТАДЖИКИСТАН: СОСТОЯНИЕ И ПЕРСПЕКТИВЫ'

ПРИКЛАДНЫЕ ЛИНГВИСТИЧЕСКИЕ ИССЛЕДОВАНИЯ В РЕСПУБЛИКЕ ТАДЖИКИСТАН: СОСТОЯНИЕ И ПЕРСПЕКТИВЫ Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
125
23
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТАДЖИКСКИЙ ЯЗЫК / КОГНИТИВНАЯ ЛИНГВИСТИКА / КОРПУСНАЯ ЛИНГВИСТИКА / СТРУКТУРНАЯ ТИПОЛОГИЯ / КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА / МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Одинаев Аджмал Ахтамович

В статье приводится краткий обзор наиболее значимых направлений в области прикладной, корпусной и компьютерной лингвистики за последние пять лет на территории Республики Таджикистан. Основу обзора составляют публикации коллективов и отдельных ученых Академии наук и различных столичных вузов республики. В результате обобщения фактов автор заключает, что на фоне высоких достижений в области компьютерной лингвистики, перспективными в Таджикистане являются работы по психолингвистике и юрислингвистики.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

REVIEW OF MAIN DIRECTIONS OF APPLIED LINGUISTIC RESEARCH IN REPUBLIC OF TAJIKISTAN

The article provides an overview of the most important areas of research in the field of applied and computational linguistics cabinet and over the last five years in the territory of the Republic of Tajikistan. The basis of the review make publishing groups and individual scientists of the Academy of Sciences and various universities of the capital of the republic. The summary of facts the author concludes that against the backdrop of high achievements in the field of computational linguistics, promising in Tajikistan are working on legal linguistics and psycholinguistics.

Текст научной работы на тему «ПРИКЛАДНЫЕ ЛИНГВИСТИЧЕСКИЕ ИССЛЕДОВАНИЯ В РЕСПУБЛИКЕ ТАДЖИКИСТАН: СОСТОЯНИЕ И ПЕРСПЕКТИВЫ»

ЗАБОНШИНОСИ (ЯЗЫКОЗНАНИЕ)

ПРИКЛАДНЫЕ ЛИНГВИСТИЧЕСКИЕ ИССЛЕДОВАНИЯ В РЕСПУБЛИКЕ ТАДЖИКИСТАН: СОСТОЯНИЕ И ПЕРСПЕКТИВЫ

Одинаев А. А.

Российско-Таджикский (славянский) университет

Лингвистические исследования различного уровня проводились на территории Республики Таджикистан (РТ) в течение длительного промежутка времени, начиная с вхождения страны в состав СССР. Однако по-настоящему поворотными событиями в жизни страны стало обретение Таджикистаном независимости, закрепление в Конституции таджикского языка в качестве государственного и принятие в 2009 году закона «О языке».

За последнее десятилетие значительно расширилась сфера практического использования таджикского языка в общественных, научных, государственных и иных областях, что связано с разработкой и утверждением руководством РТ ряда законодательных актов и специальных программ. В свою очередь, это явилось стимулирующим фактором для начала проведения в Республике в отношении государственного языка прикладных лингвистических исследований с применением всего доступного ученым арсенала инструментов.

Целью настоящей статьи является краткий обзор, анализ и критическая оценка основных направлений прикладных лингвистических исследований, проводимых в настоящее время учеными и их коллективами на территории Республики Таджикистан. Стоит отметить, что в основу данного обзора легли исследования, проводимые при Академии наук РТ и в различных вузах города Душанбе - столицы Таджикистана. Автор не претендует на полноту проведенного обзора, поскольку он не мог охватить всё научное сообщество Республики, занимающееся вопросами прикладной лингвистики в силу отсутствия доступа к публикациям ряда ученых по данной тематике.

Анализ рецензируемых печатных и электронных публикаций, сборников материалов международных, республиканских, межвузовских научных конференций и круглых столов в сопоставлении с наукометрическими данными Российского индекса научного цитирования (РИНЦ, www.elibrary.ru), позволил выявить ключевые направления прикладной лингвистики в Таджикистане, в которых ведется активная исследовательская деятельность. Такими направлениями можно считать когнитивную, корпусную, компьютерную (математическую) лингвистику, а также прикладные аспекты структурной типологии, психолингвистики и юрислингвистики.

Далее подробно рассмотрим каждое из данных направлений для оценки состояния и перспектив развития прикладной лингвистики в РТ на современном этапе.

Направление когнитивной лингвистики, которое до сих пор в Таджикистане, либо отсутствовало, либо носило фрагментарный характер, на сегодняшний день представлено целым коллективом исследователей, работающих под научным руководством д.ф.н., профессора Д.М. Искандаровой при кафедре теоретического и прикладного языкознания Российско-Таджикского (славянского) университета (РТСУ). Сегодня в рамках перспективного плана научно-исследовательской работы кафедры ведутся многочисленные исследования в области когнитивной лингвистики. В частности, на материале разноструктурных языков (таджикского, русского, китайского, французского и других) в сопоставительном плане разрабатываются концепты «судьба», «путь», «семья», «женщина», «ум», «ложь», «измена», «пища» и т.п. Исследователи затрагивают важные аспекты ментальности, языковой личности, билингвизма, ценностных доминант, стереотипов и т.д. Актуальность подобных исследований обусловлена современной тенденцией к интеграции различных областей лингвистических исследований, необходимостью использования данных о когнитивных процессах в изучении аспектов дискурсивной деятельности, психолингвистики, этно- и социолингвистики, а также компьютерной лингвистики, с учетом проблем создания искусственного интеллекта [9].

Анализируя данное исследовательское направление, необходимо отметить, что оно является сравнительно молодым, но быстро прогрессирующим в лингвистической науке в Таджикистане. Это обуславливает наличие небольшого количества законченных работ когнитивной направленности и отсутствие их широкой известности. С другой стороны, имеющиеся результаты исследований позволили выпустить первый в стране сборник статей «Исследования по когнитивной лингвистике» [9], монографии «Концепт «время» в языковом сознании индоевропейских народов» [1] и «Сопоставительное исследование концепта «красота» в китайском и русском языках» [10]. Активно работают в направлении когнитивной лингвистики магистранты при кафедре теоретического и прикладного языкознания филологического факультета РТСУ.

Другим важнейшим направлением прикладных исследований является корпусная лингвистика, направленная на разработку общих принципов создания лингвистических корпусов с применением новейших компьютерных технологий. Также решается задача оптимизации гносеологической функции языка, что является одной из перспективных областей прикладной лингвистики. Стоит отметить несколько статей профессора Д.М. Искандаровой, в которых содержится анализ состояния, проблем и перспектив развития корпусной лингвистики в РТ [6-8]. Судя по имеющимся данным, в настоящее время корпуса текстов таджикского языка либо обладают недостаточным размером, либо находятся на стадии разработки. Однако, по утверждениям некоторых исследователей, университет Хельсинки уже располагает корпусом из 87 654 слов, а Мардумиён и Парвоз анонсируют корпус даже из 500 000 слов. Самый большой и единственный корпус в свободном доступе предлагается в проекте Leipzig Corpora Collection, который состоит из 100 000 таджикских предложений, что соответствует приблизительно 1,8 млн. словам. Иранский лингвист Хамид Хасани заявил, что подготавливает таджикский корпус в 1 млн. слов. Имеется также информация, что и Академия наук Таджикистана уже владеет корпусом из 10 млн. слов. К сожалению, по крайней мере, последний из упомянутых корпусов не отвечает многим предъявляемым к ним требованиям [5].

В данной связи хотелось бы отметить ряд исследований, представленных на сайте Терминологического комитета Академии наук РТ, где размещены корпусы классиков таджикско-персидской поэзии Рудаки, Фирдавси, Мавлоно, Хафиза, Саъди Шерази, а также современных таджикских поэтов Лоика Шерали и Мумина Каноата. Создатели и разработчики корпуса отмечают, что Комитет по терминологии при Академии наук Республики Таджикистан совместно со Школой информационной и коммуникационной технологии проектируют и создают корпус национального таджикского языка. Намечается довести объем корпуса таджикского языка до 10 миллионов словоупотреблений [17].

В рамках корпусной лингвистики также стоит упомянуть о совместных исследованиях чешских специалистов Яна Помикалека, Вита Сухомела, Павела Шмерка и таджикского ученого Гулшана Довудова в направлении создания корпуса таджикских текстов, проводящихся при Масариковом университете (Чехия). По их заявлениям ими был собран корпус текстов современного таджикского языка, состоящий из 50 млн. слов. Тексты для корпуса были отобраны из интернета с применением различных подходов.

Направление корпусной лингвистики в Таджикистане находится в начале своего развития, но имеющиеся результаты показывают заинтересованность в данном направлении, как отдельных ученых, так и государственных учреждений. Несмотря на большое количество усилий, прилагаемых к созданию корпуса текстов на таджикском языке, на сегодняшний день не создано такого корпуса текстов, который удовлетворял бы потребностям прикладных лингвистических исследований и стандартам полнотекстовых баз данных. Особой проблемой составления корпусов таджикских текстов является их разметка для извлечения метаданных.

Прикладные исследования в области структурной типологии таджикского языка носят скорее фрагментарный характер. Они представлены, в основном, небольшим количеством работ, значительная часть из которых была выполнена в рамках исследований по компьютерной лингвистике, т.е. являются междисциплинарными. В этой связи стоит отметить монографическое исследование А.Ю. Фомина «Основы структурной типологии лексико-морфологической системы таджикского языка», которое было выполнено в рамках проекта по созданию компьютерного приложения

таджикско-персидской конверсии графических систем письма, осуществленного совместно с З.Д. Усмановым и Л.А. Гращенко [16].

Также среди крупных последних исследований в данной области, имеющих большой потенциал практического применения, можно назвать работу Р.Д. Салимова «Структура и семантика односоставных предложений в русском и таджикском языках» [11].

В эту же категорию можно отнести работу А.Ю. Фомина по глоттохронологическому исследованию дивергенции таджикского, персидского и дари языков [16]. Хотя данная работа не получила широкого распространения, ее полнотекстовый вариант находится в свободном доступе в научной электронной библиотеке (elibrary.ru).

Одним из перспективных направлений в области разработки новых методик в области прикладной лингвистики, также можно отметить целое научное направление, разрабатываемое А.Ю. Фоминым по поиску новых возможностей языковых преобразований среди языков иранской группы [20]. Данным вопроса посвящен ряд публикаций, в том числе и на международных конференциях [21]. Большинство работ по данной тематике опубликовано в журнале «Перспективы развития фундаментальных и прикладных лингвистических исследований в Республике Таджикистан» (www.persis.tj).

Отметим, что прикладные исследования в данном направлении лишены массовости. Значительное число диссертаций, монографий и статей по структурной типологии и сопоставительному языкознанию, публикуемых и защищаемых в Таджикистане, носят скорее теоретический характер и пока никак не реализованы на практике.

Направление компьютерной (математической) лингвистики представлено целой научной школой под руководством Академика АН РТ, профессора, д.ф.-м.н. З.Д. Усманова. Именно в данном направлении концентрируется основная масса публикаций и практических внедрений в виде программных продуктов обработки информации на таджикском языке. Эти результаты являются неотъемлемой частью обширной области информатизации таджикского языка, необходимость решения которой непосредственно связана с позиционированием нашей страны в современном мире в эпоху глобализации.

Анализ публикаций последних лет [2-4, 12-14] показал наличие значительных достижений в области компьютерной лингвистики, которые нашли свое отражение в конкретных разработках, и касаются не только проблематики внутриязыковых преобразований таджикских текстов, но и межъязыковой коммуникации и взаимодействия.

Исследования в области разработки и совершенствования средств внутриязыкового согласования текстов для таджикского языка представлена работами Л.А. Гращенко по согласованию таджикских шрифтов [2], К.С. Бахтеева по созданию унифицированного символьного препроцессора таджикских текстов [3], О.М. Солиева и Х. Худобердиева по реализации поддержки таджикского языка системами проверки правописания пакета Microsoft Office [12].

Д.Д. Собировым, в частности, создан лабораторный стенд для исследования глагольных конструкций таджикского языка и предложены модели для автоматического распознавания глагольных конструкций [19], что позволит заложить основы синтаксического анализа при решении задач машинного перевода в будущем. Им же предложен дополнительный признак к известной классификации таджикских глаголов - по частоте встречаемости. Таким образом, выделяют частотные и редкие глаголы, последние, в свою очередь, подразделяются на устаревшие и неизвестные (не внесенные в словари).

Направление межъязыковых преобразований текстов представлено следующими исследовательскими проектами [2-4, 12-14]:

1. Разработка и совершенствование средств конверсии графических систем письма между фарси, дари и таджикским языками. С 2009 года группой ученых (З. Д. Усманов, Л.А. Гращенко и А.Ю. Фомин) велась разработка программного комплекса по реализации таджикско-персидской конверсии графических систем письма. К 2011 году основная часть данных исследований была завершена, а в 2012 уже был разработан обратный конвертер [2-4]. Практическая ценность данных разработок, помимо собственно функционала конверсии текстов, состоит в создании вспомогательного

инструментария по оценке доли заимствований из арабского и европейских языков в таджикских текстах, который может применяться в отдельных лингвистических исследованиях.

2. Разработка системы машинного перевода с языков фарси-дари на русский язык. Л.А. Гращенко начата разработка системы машинного перевода с языков фарси и дари на русский язык «Папирус». К настоящему времени уже разработана и апробирована система графематического анализа персидского языка.

3. Исследование межморфемных отношений узбекского и таджикского языка. Группой исследователей уже начата разработка средств автоматического установления межморфемных соответствий языковой пары таджикского и узбекского языков для последующей реализации межъязыкового преобразователя.

4. Исследование афганского языка (пушту и фарси). А.Ю. Фоминым начаты исследования в направлении установления взаимосвязей персидско-таджикского языкового кластера и афганского языка (пушту) на предмет применимости методов языковой трансформации.

5. Вспомогательные исследования в рамках разработки средств машинного перевода с таджикского на русский язык. В рамках реализации системы машинного перевода с таджикского языка на русский язык, Л.А. Гращенко совместно с Д.Д. Собировым проводились вспомогательные исследования автоматического распознавания глагольных конструкций таджикского зыка. Получена предварительная статистика распределения различных глаголов и элементов глагольных конструкций по таджикским текстам.

На протяжении 2011-2014 гг. в рамках школы по компьютерной лингвистике под руководством академика АН Республики Таджикистан З.Дж. Усманова проводился комплекс взаимосвязанных исследований по решению частных задач автоматизации в целях разработки перспективных систем машинного перевода [18].

Как видно, направление компьютерной лингвистики в Таджикистане добилось значительных результатов, однако также необходимо сказать, об отсутствии широкого внедрения и использования результатов и продуктов исследования данного сегмента научной деятельности в общество. Многие исследования находятся только на начальном этапе и рассматриваются как перспективные, что также отражается на оценке их значимости, как прикладного продукта.

В заключение стоит отметить также и зарождение новых перспективных направлений прикладных лингвистических исследований в РТ, в таких областях, как психолингвистика, а именно направление фоносемантического анализа таджикского языка, и появившийся ряд работ по юрислингвистике.

Литература:

1. Будна Иоанна. Концепт «время» в языковом сознании индоевропейских народов. -Душанбе, 2006. - 101 с.

2. Гращенко Л.А. Клиент удаленной автоматизации согласования компьютерных шрифтов таджикского языка // Доклады Академии наук Республики Таджикистан. - 2011. - том 54, №4. - С. 367-370.

3. Гращенко Л. А. Комплекс средств автоматизации межъязыковых преобразований текстов для центрально-азиатского региона // Новые информационные технологии в автоматизированных системах: материалы шестнадцатого научно-практического семинара. - 2013. - №16. - С. 283-286.

4. Гращенко Л.А., Фомин А.Ю. Опыт реализации средств таджикско-персидской конверсии графических систем письма // Доклады Академии наук Республики Таджикистан. - 2008. -том 51, №8. - С. 580-583

5. Довудов Г., Ян Помикалек, Вит Сухомел, Павел Шмерк. Об автоматизированном создании корпуса таджикского языка // Материалы круглого стола «Перспективы развития фундаментальных и прикладных лингвистических исследований в РТ. Автоматизация лингвистических исследований». - Душанбе, 2012. - С. 36.

6. Искандарова Д.М. Корпус Рудаки и его лингвистическая обработка//Материалы межд. Научно-практической конференции «Рудаки и становление таджикского литературного языка», посвященной 1150-летию Рудаки и Году таджикского языка.- Душанбе: РТСУ, 2008. - С. 31-38

7. Искандарова Д.М. Создание национального корпуса таджикского языка: проблемы и пути решения// Забон - рукни тоат (мачмуаи маколахо) - Китоби 6. - Душанбе, 2013 - С.39-48

8. Искандарова Д.М. Проект по созданию корпусов параллельных текстов как одна из наиболее актуальных задач отечественного языкознания// Актуальные проблемы филологии. Материалы республиканской научно-практической конференции - Душанбе, 2013. -С.162-171

9. Исследования по когнитивной лингвистике - вып. 1 (Сборник статей) - Душанбе: РТСУ, 2013. - 120 с.

10. Пак А. Сопоставительное исследование концепта «красота» в китайском и русском языках. - Душанбе, 2009. - 174 с.

11. Салимов Р.Д. Структура и семантика односоставных предложений в русском и таджикском языках. - Душанбе: Ирфон, 2009. - 404 с.

12. Усманов З.Д. Информация о результатах научной школы Таджикистана по компьютерной лингвистике в 2011 г. // Новые информационные технологии в автоматизированных системах. - 2012. - №. 15 - с. 154 -156.

13. Усманов З.Д., Довудов Г.М. Частотный морфемный словарь таджикского литературного языка // Доклады Академии наук Республики Таджикистан. - 2010. - Т.53, № 4. - С. 257-262.

14. Усманов З.Д., Гращенко Л.А., Фомин А.Ю. Информационные основы автоматизированной таджикско-персидской транслитерации // Известия Академии наук Республики Таджикистан - №1(130) - 2008. - С. 20-26.

15. Фомин А.Ю. Глоттохронологическое исследование дивергенции таджикского, дари и персидского языков. - Душанбе, 2011. - 34 с.

16. Фомин А.Ю. Основы структурной типологии лексико-морфологической системы таджикского языка. - Душанбе, 2012. - 121 с.

17. Центр информационных и коммуникационных технологий Академии наук Республики Таджикистан: официальный сайт [Электронный ресурс]. - Режим доступа: http://www.termcom.tj

18. Гращенко Л.А., Клышинский Э.С., Тумковский С.Р., Усманов З.Д. Концептуальная модель системы русско-таджикского машинного перевода // Доклады Академии наук Республики Таджикистан - 2011. - том 54, №4. - С. 279-285.

19. Гращенко Л.А., Собиров Д.Д. Модели и алгоритм распознавания глаголов в предложениях таджикского языка // Доклады Академии наук Республики Таджикистан. -2012. - том 55. - №2. - С. 120-125.

20. Фомин, А.Ю. Проблемы языковой трансформации на примере языков иранской группы / А.Ю. Фомин // Актуальные проблемы филологии. - Душанбе: РТСУ, 2013. - с. 191-195.

21. Фомин, А.Ю. Состав, состояние и перспективы развития лексики современных языков дари и пушту в Афганистана / А. Ю. Фомин // 12-я Международная научная конференция «Язык, культура и общество на перекрестке цивилизаций» 18.03.2015. - Изд. Университета Цукуба, 2015. - с 85-88.

ПРИКЛАДНЫЕ ЛИНГВИСТИЧЕСКИЕ ИССЛЕДОВАНИЯ В РЕСПУБЛИКЕ ТАДЖИКИСТАН: СОСТОЯНИЕ И ПЕРСПЕКТИВЫ

В статье приводится краткий обзор наиболее значимых направлений в области прикладной, корпусной и компьютерной лингвистики за последние пять лет на территории Республики Таджикистан. Основу обзора составляют публикации коллективов и отдельных ученых Академии наук и различных столичных вузов республики. В результате обобщения фактов автор заключает, что на фоне высоких достижений в области компьютерной лингвистики, перспективными в Таджикистане являются работы по психолингвистике и юрислингвистики.

Ключевые слова: таджикский язык, когнитивная лингвистика, корпусная лингвистика, структурная типология, компьютерная лингвистика, математическая лингвистика.

REVIEW OF MAIN DIRECTIONS OF APPLIED LINGUISTIC RESEARCH IN REPUBLIC OF

TAJIKISTAN

The article provides an overview of the most important areas of research in the field of applied and computational linguistics cabinet and over the last five years in the territory of the Republic of Tajikistan. The basis of the review make publishing groups and individual scientists of the Academy of

Sciences and various universities of the capital of the republic. The summary of facts the author concludes that against the backdrop of high achievements in the field of computational linguistics, promising in Tajikistan are working on legal linguistics and psycholinguistics.

Keywords: tajik language, cognitive linguistics, corpus linguistics, structural typology, computer linguistics, mathematical linguistics.

Сведения об авторе: Одинаев Аджмал Ахтамович, аспирант кафедры теоретического и прикладного языкознания Российско-Таджикского (славянского) университета, e-mail: o-ajmal@hotmail.com

About author: Odinaev Ajmal Ahtamovich, post-gradute student of the theoretical and applied linguistic of Russian and Tajik (Slovanic) University

НЕКОТОРЫЕ ОСОБЕННОСТИ МОРФОЛОГИЧЕСКИХ ТЕРМИНОВ ДРЕВНЕАНГЛИЙСКОГО ЯЗЫКА

Джаматов С.

Таджикский государственный педагогический университет имени С. Айни

Становление морфологической терминологии восходит, как хорошо известно, к глубокой древности. Следует отметить, что каждое конкретное явление языка, с одной стороны, связано исторической преемственностью с определенными предшествующими явлениями, которые представляют собой те или другие фазы развития данного явления, а с другой стороны, связано определенными отношениями с одновременно с ним существующими явлениями [3, с. 6]. Действительно, термин и слова, относящееся к тому или иному разделу грамматики являются конкретными явлениями и единицами каждого языка.

Древнеанглийский язык, в отличие от современного языка, характеризуется более развитой системой окончаний (флексий), совместно (синтетически) выражающих грамматические значения, и отсутствием составных (так наз. «аналитических») форм [3, с. 210].

Изучение значения древнеанглийских терминов имеет свою достаточно длительную традицию. Значения древнеанглийских терминов рассматривались в сравнительных изысканиях в пределах группы германских, или, шире, индоевропейских языков, в которых сопоставлялись все зафиксированные значения разных языков.

Среди довольно многочисленных работ немецких ученных, посвященных изучению содержательной стороны древнеанглийского слова отчетливо выделяются три направления. Представители одного из них основывается на том, что значение древнеанглийского слова - это прежде всего его этимологическое значение [6, с. 112].

Сторонники другого направления, и в частности Г. Шабрам, считают, что значение древнеанглийского слова следует определять из отношений, существующих в самом этом языке. Метод контекстологического анализа провозглашается как единственно надежный способ определения значения древнеанглийского слова [13, с. 251].

Лингвисты-сторонники третьего направления-не ограничивались изучением одной понятийной группы слов, а ставили пред собой задачу специфику древнеанглийского слова в целом. Прежде всего следует назвать работу Лео Шокинга [14, с. 8], который в ней отмечал неточность представлений людей того времени относительно значений слов, и использование терминов, относящихся к «имени существительному», например, отсутствие классификации существительного по значению и т.д.

Относительно использования некоторых морфологических терминов древнеанглийского языка, относящееся к «noun - исм (существительное)», выдающий языковед В. Н. Ярцева в своем учебнике «Историческая морфология английского языка» высказала следующее: «Рассматривая существительное древнеанглийского языка в составе его парадигмы, мы находим как характерный признак передачи грамматических значений существительного (рода, числа и падежа) формообразование очень разветвленного типа, основывающееся в первую очередь на синтетических приемах» [5, с. 60]. Из настоящей цитаты нам стало известно, что морфологический

i Надоели баннеры? Вы всегда можете отключить рекламу.