Научная статья на тему 'Поддержка коренных народов под угрозой исчезновения путем разработки языковых компьютерных средств: о проекте ФинУгРевита'

Поддержка коренных народов под угрозой исчезновения путем разработки языковых компьютерных средств: о проекте ФинУгРевита Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
137
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЯЗЫКИ КОРЕННЫХ НАРОДОВ / INDIGENOUS LANGUAGES / ФИННО-УГОРСКИЕ ЯЗЫКИ / FINNO-UGRIC LANGUAGES / СОЦИОЛИНГВИСТИКА / SOCIOLINGUISTICS

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Феньвеши Анна

С развитием и распространением цифровых технологий, домены использования языка также значительно изменились, и цифровое использование языка стало отдельным доменом. Использование языка в этом новом, цифровом домене имеет существенное значение для миноритарных и коренных языков, так как их цифровое выживание зависит от их присутсвия и использования в цифровом домене для поддержки чего специалисты внутри и за пределами языкового сообщества могут сделать очень многое. Далее обсуждается, каким образом может быть оказана поддержка в целом, и приводится, в частности, пример международного совместного проекта, ФинУгРевита, целью которого является предоставить такую поддержку финно-угорским коренным языкам России.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SUPPORT OF ENDANGERED INDIGENOUS PEOPLES BY PROVIDING COMPUTATIONAL LANGUAGE TOOLS: ON FINUGREVITA PROJECT

With the development and spread of digital technology, domains of language use have also changed considerably, the use of language in digital communication becoming a separate domain as well. Language use in this new digital domain is of essential importance for minority and indigenous languages, since their digital survival rests on their digital presence and use something that professionals inside and outside the language community can do very much to support. This paper discusses ways in which support can be provided in general, and presents, in particular, the example of an international collaborative project, FinUgRevita, which aims to provide such support to endangered indigenous Finno-Ugric languages in Russia.

Текст научной работы на тему «Поддержка коренных народов под угрозой исчезновения путем разработки языковых компьютерных средств: о проекте ФинУгРевита»

ЯЗЫК. КУЛЬТУРА. ЭТНОС

Феньвеши Анна*

ПОДДЕРЖКА КОРЕННЫХ НАРОДОВ ПОД УГРОЗОЙ ИСЧЕЗНОВЕНИЯ ПУТЕМ РАЗРАБОТКИ ЯЗЫКОВЫХ КОМПЬЮТЕРНЫХ СРЕДСТВ: О ПРОЕКТЕ ФИНУГРЕВИТА

SUPPORT OF ENDANGERED INDIGENOUS PEOPLES BY PROVIDING COMPUTATIONAL LANGUAGE TOOLS: ON FINUGREVITA PROJECT

С развитием и распространением цифровых технологий, домены использования языка также значительно изменились, и цифровое использование языка стало отдельным доменом. Использование языка в этом новом, цифровом домене имеет существенное значение для миноритарных и коренных языков, так как их цифровое выживание зависит от их присутсвия и использования в цифровом домене - для поддержки чего специалисты внутри и за пределами языкового сообщества могут сделать очень многое. Далее обсуждается, каким образом может быть оказана поддержка в целом, и приводится, в частности, пример международного совместного проекта, ФинУгРевита, целью которого является предоставить такую поддержку финно-угорским коренным языкам России.

Ключевые слова: языки коренных народов, финно-угорские языки, социолингвистика

With the development and spread of digital technology, domains of language use have also changed considerably, the use of language in digital communication becoming a separate domain as well. Language use in this new digital domain is of essential importance for minority and indigenous languages, since their digital survival rests on their digital presence and use - something that professionals inside and outside the language community can

* Феньвеши Анна, директор института исследований Англии и Америки Университета Сегеда (Венгрия), доктор лингвистики. E-mail: fenyvesi@lit.u-szeged.hu

Anna Fenyvesi — Director of Institute of English and American Studies (University of Szeged, Hungary).

do very much to support. This paper discusses ways in which support can be provided in general, and presents, in particular, the example of an international collaborative project, FinUgRevita, which aims to provide such support to endangered indigenous Finno-Ugric languages in Russia.

Keywords: indigenous languages, Finno-Ugric languages, sociolinguistics

За прошедшие четверть века цифровые технологии изменили многие аспекты нашей жизни - и употребление языка не является исключением. С распространением использования электронной почты, всемирной паутины, мобильных технологий и коммуникации при помощи цифровых каналов, в жизни большинства людей появился новый домен языка, который мы ниже будем называть «цифровое использование языка». Хотя он в большом количестве случаев реализуется в устной разновидности, значительная его часть принадлежит письменной разновидности и подразумевает как чтение, так и письмо (в том числе имейлы, текстовые сообщения, чат, блоги]. В самом деле, оценки показывают, что, используя эти электронные виды коммуникации, в настоящий момент мы читаем и пишем больше, чем до их появления [1, С. 183]. Благодаря этому, письменные формы цифровой коммуникации стали чрезвычайно важным аспектом использования языка, которому должно быть посвящено особое внимание специалистов, работающих с двуязычными языковыми сообществами, будь то редакторы или авторы цифровых газет, компьютерные лингвисты или ученые-информатики, разрабатывающие компьютерные языковые инструменты, или представители социальных наук, изучающие роль языка в различных аспектах общественной жизни.

Понятие о домене языка широко используется в исследованиях, посвященных дву- и многоязычным сообществам, с тех пор как Фишман [2, С. 441] заимствовал его в качестве теоретического концепта. Фишман первоначально различает пять доменов - семья, общение с друзьями, религия, образование и работа. Этот набор доменов до сегодняшнего дня широко используется социолингвистами для описания типов языкового поведения билингвов в отношении использования их соответственных языков в качестве показателя сохранения языка или языковой ассимиляции по сравнению с предыдущими поколениями: например, о языковой ассимиляции можно говорить в том случае, если старшее поколение использует миноритарный язык во всех пяти доменах, среднее - только в семье, с друзьями и в церкви, а младшее - только в семье (это тип языковой ассимиляции за три поколения, наблюдающийся во многих иммигрантских обществах в США]. Число обсуждаемых доменов у большинства авторов выше (ср. несколько примеров у Грожан [3, С. 29] «родители, дети, братья и сестры, дальние родственники, работа, спорт, религия, школа, магазины, друзья, развлечения / досуг, хобби и т. д.»; у Бевер [4] «общественный домен»; у Эпенгина [5, С. 160], «экономика»].

Однако при любом числе различаемых доменов, по ряду соображений, кажется неизбежным, чтобы «цифровой домен», т. е. использование языка в коммуникации при помощи цифрового канала, рассматривался и был признан отдельным доменом использования языка.

Цифровое использование языка стало важным аспектом пользования языком: оно объединяет различные формы как формального, так и неформального общения (ни в коем случае не ограничиваясь последним], в него входят ранее не существовавшие функции пользования языком (ср. ведение блогов], и, как на то уже указывают некоторые результаты, оно может представлять принципиально новые модели использования языка, отличающиеся от традиционных аспектов использования языка билингвами. Например, Хубер показал [6], что в то время как Канадские венгры первого поколения в традиционных доменах - семья, друзья, религия - чаще используют венгерский язык, чем это делают их дети второго поколения, в цифровом домене использования венгерского языка (имейлы, интернет] наоборот - последние превосходят своих родителей, тем самым демонстрируя, что цифровое использование языка может стать важным фактором сохранения языка для молодого поколения с «родным цифровым». Башарина [7] также показала, что цифровой домен использования языка может предоставить пространство для пользователей коренного языка саха в Якутии, где новые формы старых жанров, а также новые повествовательные жанры способствуют укреплению языкового сообщества носителей языка саха, их культурно-языковому приспособлению, модернизации и оживлению.

В своей насыщенной обильными эмпирическими данными и тщательными математическими расчетами работе Корнаи [8] выдвигает положение о том, что участью многих современных языков - в первую очередь тех, которые существуют в качестве миноритарных и/или коренных языков - будет цифровая смерть, если только носителям этих языков (и поддерживающим их специалистам] не удастся удовлетворить нескольким критериям первостепенной важности, таким как, например, наличие сообщества цифрово-грамотных пользователей языка и Википедии на данном языке.

Возможность использования местных миноритарных языков в цифровом домене, разумеется, зависит от ряда факторов, начиная от технического (существование оборудования и программного обеспечения и доступ к нему], продолжая образовательным (грамотность в традиционном смысле и в цифровой сфере], личным (присутствие цифрово-грамотных пользователей языка, заинтересованных в использовании языка в данном домене] и заканчивая факторами престижа (считают ли пользователи языка свой миноритарный язык «достойным» усилий, направленных на то, чтобы использовать его в цифровых каналах]. Все эти аспекты представляют собой арены, где пользователям миноритарного языка могут оказать поддержку как члены их собственного общества, например, языковые активисты, так и специалисты «извне»: ученые-информатики и компьютерные

лингвисты, разрабатывающие компьютерные языковые инструменты для миноритарных языков, педагоги, лингвисты и т. д. Норвежский центр исследования «Гиеллатекно» ^е1^екпо] демонстрирует хороший пример такого подхода: его компьютерные специалисты разрабатывают и вводят в обиход широкий спектр средств для изучения языка, двуязычные словари, морфологические и синтаксические анализаторы и игры для языка саами и других миноритарных финно-угорских языков, находящихся под угрозой исчезновения (ср. http://giellatekno.uit.no/].

Проект «Компьютерные средства для ревитализации финно-угорских языков, находящихся под угрозой исчезновения, ФинУгРевита» был создан в 2013 году с целью предоставления коренным финно-угорским языкам России, находящимся под угрозой исчезновения, таким как удмуртский и мансийский, специальных компьютерных языковых средств и помощи носителям этих языков в использовании коренных языков в цифровом домене (http://www.ieas-szeged.hu/finugrevita/].

Проект выполняется двумя группами исследователей - одна в Хельсинкском Университете, Финляндия (ведущий исследователь - Роман Янгарбер], другая в Сегедском Университете, Венгрия (ведущий исследователь - Анна Феньвеши) - в состав которых входят финноугроведы, компьютерные лингвисты и социолингвисты. Проект осуществляется при поддержке Финской Академии Наук (АКА] и Всевенгерского Фонда Научных Исследований (ОТКА), период выполнения: 1 сентября 2013 г. - 31 августа 2017 г.

Оба языка, которыми занимается проект, удмуртский и мансийский, согласно классификации ЮНЕСКО [9] находятся под угрозой исчезновения, хотя степень этой угрозы неодинаковая. Удмуртский принадлежит к числу языков «в некоторой степени» под угрозой ичезновения, так как, согласно результатам последней всероссийской переписи населения 2010 года, 60% (или примерно 300,000 человек] из 552,000 этнических удмуртов говорят на языке [10], распространенном в Удмуртской Республике (или Удмуртии], расположенной на запад от Урала. Несмотря на то, что он является официальным языком Удмуртии, его реальный статус и права в общественной сфере ограничены: он используется в большей мере в семейном домене и в общении с друзьями. Тем не менее, в Удмуртии удмуртский язык употребляется в СМИ, в образовательных и культурных сферах, а также в Интернете (например, он является одним из трех финно-угорских миноритарных языков, которые поддерживаются в ВКонтакте]. Мансийский принадлежит к числу языков под серьезной угрозой ичезновения, имея менее 1,000 носителей из 12,000 этнических манси [10]. Мансийский язык распространен преимущественно на территории Ханты-мансийского автономного округа (неформально также известного под названием Югра] в Западной Сибири, на восток от Урала. У данного языка нет какого-либо официального статуса даже в пределах автономного округа, тем не менее, он в некоторой мере употребляется в СМИ, сфере образования и культуры Югры, преимущественная же сфера функционирования семейный домен и домен общения с друзьями. Возможно, неожиданным образом для такого

маленького языка, мансийский язык употребляется в Интернете: газета Луима Се-рипос, выходящая каждые две недели, также имеет свою Интернет-версию.

В социолингвистическом плане сообщество носителей обоих языков в данный момент переживает языковую ассимиляцию, т. е. экспансию мажоритарного языка, русского, в ущерб коренным языкам, с тех пор как их предки попали под господство России в XVI - XVII вв., и продолжая испытывать мощную ассимиляцию и русификацию в советскую эпоху [11]. Открытие в 1970-х годах нефтяных и газовых месторождений в регионах, где говорят на мансийском и удмуртском повлекло за собой заселение рабочей силы из других частей страны, и в результате, регионы стали многоязыковыми, а манси - меньшинством даже в своем автономном округе. Число жителей, относящих себя к удмуртскому народу, упало с 640,000 в 2002 г. до 552,000 в 2010 г., в то время как доля носителей языка снизилась с 67% до 59% за тот же период. Также, в то время как число считающих себя принадлежащими к народу манси поднялось за тот же период с 11,500 в 2002 г. до 12,300 в 2010 г., доля носителей упала с 23% до всего лишь 7.65% [10].

Главной целью проекта ФинУгРевита является разработка открытых специальных компьютерных языковых средств в свободном доступе: электронных словарей, морфологических и синтаксических анализаторов, языковых игр, а также средств обучения. Работа по компьютерной лингвистике для создания данного инструментария началась и находится в процессе.

В дополнение к работе по компьютерной лингвистике, в рамках проекта проводится два онлайн-опроса. Целью первого, запущенного в июне 2014 года, является исследовать использование компьютерных языковых средств Гиеллатекно ^е1^екпо) для саами, чтобы проанализировать обратную связь пользователей относительно пользования этими средствами и степень удовлетворенности ими. Результаты будут полезны как для того, чтобы разработчики могли усовершенствовать созданные ими средства, так и для того, чтобы проект ФинУгРеви-та мог извлечь уроки из опыта сообщества пользователей средствами, схожие с которыми наш проект собирается использовать в будущем.

Другой опрос, который разработчики проекта собираются запустить осенью 2014 года, относится к социолингвистике и имеет цель представить цифровое использование языка носителей удмуртского и мансийского. Конкретно, путем опроса будет собрана у носителей удмуртского и мансийского социолингвистическая информация и информация по использованию языка, касательно того, какие языки они используют в разных формах общения через цифровые каналы, т. е. пользование мобильными телефонами, имейлы, серфинг, чатинг, блогинг, комментарии, пользование соцальными сетями, создавание интернет-содержания и т. д. Надеемся, что на основе информации о том, когда носители используют миноритарный язык (удмуртский/мансийский], мажоритарный язык (русский], и/ или другие языки (английский, или другой миноритарный язык, распространенный в России] исследователи проекта смогут взглянуть изнутри на привычки

исползования языка носителями, на их потребности в компьютерных языковых средствах для миноритарных языков, и вообще, будут лучше понимать модели использования языка в цифровом домене носителями этих коренных языков, находящихся под угрозой исчезновения.

Цифровой домен, как мы показали выше, приобрел ключевое значение в использовании языка дву- и многоязычными лицами, в особенности с точки зрения миноритарных языков. Им необходима помощь, если они стремятся к «цифровому выживанию» (используя термин Корнаи [8]), хотя самая важная предпосылка такого выживания, вероятно, решимость со стороны самих носителей языка избежать языковой ассимиляции и/или цифровой смерти - то, чего специалист «извне» никогда не сможет достичь, каким бы он решительным и профессиональным ни был.

Литература

1. Baron, Naomi S. 2008. Always on: Language in an online and mobile world. Oxford: Oxford University Press.

2. Fishman, Joshua A. 1972. Domains and the relationship between micro- and macroso-ciolinguistics. In: Gumperz, John J., and Dell Hymes, eds. Directions in sociolinguistics: The ethnography of communication. Oxford: Blackwell, 435-453.

3. Grosjean, François. 2010. Bilingual life and reality. Cambridge, MA: Harvard University Press.

4. Bever, Olga. 2011. Multilingualism and language policy in post-Soviet Ukraine: English, Ukrainian and Russian in linguistic landscapes. http://www.irex.org/sites/default/files/ BeverSTG2011%20Final%20report.pdf; Date of access: August 28, 2014.

5. Opengin, Ergin. 2012. Sociolinguistic situation of Kurdish in Turkey: Sociopolitical factors and language use. International Journal of the Sociology of Language, 217: 151-180.

6. Huber, Maté. 2013. Intergenerational transmission of Hungarian as a heritage language in Canada: The macrosociolinguistics of the Hungarian community in Hamilton, Ontario. Szeged: University of Szeged, BA thesis.

7. Basharina, Olga. 2013. The extent of the Sakha language on the internet: Digital genres and language revitalization. Paper presented at the MinorEuRus conference, Helsinki, December 15-17, 2013.

8. Kornai, Andras. 2013. Digital language death. PLoS ONE, 8, e77056. doi:10.1371/jour-nal.pone.0077056.

9. UNESCO. 2010. Atlas of the world's languages in danger. http://www.unesco.org/new/ en/culture/themes/endangered-languages/atlas-of-languages-in-danger/; Date of access: April 19, 2014.

10. Russian census 2010. http://www.perepis-2010.ru/results_of_the_census; Date of access: April 22, 2014.

11. Bakro-Nagy, Marianne. Forthcoming. Uralic languages. Revue Belge de Philologie et d'Histoire.

i Надоели баннеры? Вы всегда можете отключить рекламу.