УДК 81'322; 004.934; 004.912 ББК 81.1
Алексей Юрьевич Мордовин,
кандидат филологических наук, Иркутский государственный лингвистический университет (Иркутск, Россия), e-mail: [email protected]
Лингвистическое исследование как неотъемлемая часть применения национальных корпусов текстов в обучении иностранным языкам
В статье рассматриваются вопросы использования корпусов текстов в обучении иностранным языкам. В то время, как потенциально возможные способы использования корпусов для обучения иностранным языкам распадаются на две группы: иллюстративносправочные (не-эвристические) и исследовательские (эвристические), среди исследователей доминирует мнение о ценности исследовательской составляющей работы с корпусами как способа самостоятельного установления фактов языка. Поскольку ни один национальный корпус текстов не может, по определению, претендовать на соотнесенность с языковым опытом каждого из носителей данного языка, органический корпус текстов выступает единственно возможной целостной и антропоцентричной коллекцией текстов. Следовательно, автор делает вывод, что при применении корпусов текстов в обучении языку необходимо учитывать, что чрезмерное использование корпусного подхода для изучения языка в ущерб опосредованным языковым компетенциям может сопровождаться прагматическим дискомфортом.
Ключевые слова: корпусы текстов, корпусная лингвистика, обучение иностранному языку, лингвистическое исследование
Alexey Yuryevich Mordovin,
Candidate of Philology, Doctoral Student, Irkutsk State Linguistic University (Irkutsk, Russia), e-mail: [email protected]
Linguistic Research - an Essential Part of Applying National Text Corpora
in Teaching Foreign Languages
The article considers issues related to use of text corpora in teaching foreign languages. While potential methods of using corpora for teaching foreign languages can be classified into two groups: illustrative-reference (non-heuristic) and research (heuristic), an opinion dominates among researchers that the research component of operating with corpora constitutes the greatest value being a means to establish facts of language independently. Since no national corpus may, by definition, claim to be correlated with the language experience of every native speaker of a given language, then the organic text corpus appears as the only possible integral and anthro-pocentric collection of texts. Therefore, when text corpora are being applied in teaching foreign languages, one must consider that excessive use of corpus approach to the detriment of mediated language competences may be associated with pragmatic discomfort.
Keywords: text corpora, corpus linguistics, teaching foreign languages, linguistic research.
В ходе интеграции современных информационных технологий в различные аспекты обучения языку и исследования языка закономерно возрастает популярность применения корпусов текстов и корпусного подхода в целом при обучении языку. Целью данной статьи является попытка описать модели применения корпуса текстов в обучении языку, указать на методологические свойства и параметры, определяющие в таком случае исследовательский характер научения языку.
Корпусы текстов и корпусная лингвистика продолжают оставаться достаточно «моло-
дой» отраслью. При этом само определение корпуса текстов, как коллекции отобранных по определённой методике и представленных в электронном виде текстов, не вызывает существенных разногласий среди исследователей. Из числа дискуссионных на данный момент вопросов можно отметить жанровую полноценность национальных корпусов текстов. Так, В. В. Рыков указывает, что «корпус текстов может рассматриваться как достаточно сложно организованная онтология речевой деятельности, отражающая в себе всё жанровое разнообразие представленного в
274
© А. Ю. Мордовин, 2012
нём рода словесности (например - устную, письменную или печатную речь), и занимает промежуточное положение между реальными коммуникативными процессами в обществе, которые он представляет, и формализованной лингвистической теорией, для которой он является источником для исследования» [2].
В ряде случаев может возникать жанровый дисбаланс корпуса текстов, претендующего на отображение всего богатства употребления языка за определённый период времени, который оценивается составителями и аналитиками как некоторая данность. В стремлении за размером корпуса, составители жертвуют «неудобными» или «затратными» жанрами, методами сбора материала. Кроме того, наблюдается отсутствие единообразия классификации жанров, перекрещивание различных категорий между собой, а также «выпадение» определённых вариантов наличия/отсутствия жанрообразующего признака, которое автоматически приводит к не включению того или иного жанра в корпус.
Таким образом, полемика относительно жанровой сбалансированности корпуса текстов имеет своей первопричиной стремление к максимальной репрезентативности корпуса, что, в свою очередь, как раз и необходимо для того, чтобы корпус текстов заслуживал статус «организованной онтологии речевой деятельности» (жанрово-полноценный корпус ^ репрезентативный корпус ^ адекватное отражение онтологии)
Несмотря на отсутствие единства мнений относительно критериев качества репрезентативности корпусов текстов, вполне очевидно, что уже достигнутые практические результаты деятельности по составлению национальных корпусов текстов могут и должны применяться в обучении иностранным языкам, поскольку представляют собой не только аутентичный, структурированный и организованный, но также легко доступный языковой материал [1; 3; 4; 5]. Перечислим некоторые конкретные способы применения корпусов в обучении.
В концепции Дж. Лича, всё разнообразие способов использования корпусов в обучении языку распадается на 2 группы: прямые или эвристические методы изучения/исследования языка и косвенные или не-эвристические [8]. Первая группа подразумевает изучение языка через его неопосредованное исследование, в англоязычном мире известное как data-driven learning (DDL), вторая - путём косвенного применения, а именно - в качестве источников хороших примеров из реальной речи.
Авторский коллектив Британского национального корпуса [7] полагает, что корпус может и должен применяться в качестве:
• справочного материала для учителя;
• в качестве учебного пособия в классе;
• для замены/дополнения языковой интуиции учителя;
• для того, чтобы поставить в равные условия учителей - носителей и не носителей языка;
• в качестве учебного пособия для самостоятельных занятий;
• для самостоятельного изучения фактов языка/культуры;
• проверка гипотез;
• создание гипотез;
• для оспаривания фактов, предложенных преподавателем.
Рекомендуется использовать корпус текстов для решения следующих задач:
• подготовка информативных материалов: разъяснения значений на материале корпусов;
• подготовка иллюстративных материалов: примеры из корпуса, например, конкордансы;
• разработка заданий и упражнений на основе корпусов (в бумажном и электронном виде);
• применение корпусов в качестве основы для правки результатов работы учащихся и для обратной связи с ними.
Виды деятельности, которые целесообразно осуществлять с применением корпусов текстов:
• контрастивный анализ (лексикограмматические исследования);
• виды деятельности, связанные с изучением словоформ (data-driven learning);
• виды деятельности, направленные на исследование значения (значение отдельных слов, синонимия, семантическая акцентуация, культурные ассоциации);
• виды деятельности, направленные на развитие определённых навыков (например, разработка стратегий чтения);
• справочная деятельность (корпус как справочное пособие по литературному письму);
• исследовательская деятельность (исследование вариативности, лингвокультурные исследования, Предметно-Языковое Интегрированное Обучение - CLIL).
Нетрудно заметить, что и эта подробная классификация способов применения корпусов текстов учителем и обучающимися по-прежнему укладывается в дихотомию Дж. Лича:
Прямые / эвристические методы / виды деятельности Непрямые / не-эвристические методы / виды деятельности
корпус как справочный материал для учителя, самостоятельное изучение фактов языка/культуры (проверка и создание гипотез), оспаривание данных преподавателя, использование корпусов в качестве основы для правки и обратной связи, контрастивный анализ, изучение словоформ, исследование аспектов значения, исследование вариативности, лингвокультурные исследования в качестве учебного пособия в классе для замены/дополнения языковой интуиции учителя, компенсации её недостаточности, подготовка информативных материалов: разъяснения значений на материале корпусов, подготовка иллюстративных материалов: примеры из корпуса, разработка заданий и упражнений на основе корпусов
Одной из сложностей, связанных с применением прямых (эвристических) методов, является превращение процесса обучения языку из научения от языковой компетенции человека или группы людей в процесс лингвистического исследования. В современных публикациях эти два вида деятельности, на наш взгляд, недостаточно разграничены, хотя имеют существенные методологические различия.
Например, для «обучения через исследование» (data-driven learning) предполагается применение корпусов «для установления отношения форма - содержание... Обучение языку можно рассматривать как индуктивный процесс, связывающий значение с формой. Учащийся, использующий корпус, каждый раз не просто находит информацию, но и принимает самостоятельное и ответственное решение, как её трактовать и классифицировать. В этом смысле корпус является не источником примеров для подражания, но инструментом для построения выборок языковых данных для исследования. В конкордансах учащиеся обнаруживают новые, неизвестные и интересные им слова и структуры, которые увлекают их дальше в корпус, каждого своим собственным, уникальным путём. Изучающий язык становится исследователем, первооткрывателем, которому в ходе путешествия приходится решать бесконечное множество задач» [6, цит. по неопубл. переводу на сайте НКРЯ].
Ср. также: «использование аутентичного материала корпусов позволяет исследователям, не владеющим изучаемым языком, выдвигать свои собственные предположения и гипотезы, находя для них достоверные обоснования, самостоятельно делать выводы и обобщения, не обращаясь к знаниям и языковой интуиции носителей английского языка» [9, с. 8]. Также: «основная цель данного подхода - научить учащихся самостоятельно извлекать из аутентичного материала различного рода лингвистическую информацию об особенностях его употребления. Студен-
ты, как правило, работают индивидуально в компьютерном классе, используют специальные компьютерные программы и без помощи преподавателя анализируют интересующие их лингвистические явления. Согласно этому подходу учащемуся следует развивать умение учиться, он должен выступать в роли исследователя, самостоятельно решать задачи, связанные с осознанием языковой формы» [4, с. 65].
Помимо обеспечения инновационных способов понимания смысла, обучение языку с помощью корпусов призвано расширить границы языковой нормы: «Корпус - это не навязывание нормы, а наоборот, своего рода прививка против некритичного принятия языковых явлений и относящихся к ним формулировок» [6].
На практике это означает, что человек, не имеющий ещё достаточной языковой компетенции даже в пределах языкового кода, должен превратиться в исследователя и первооткрывателя, готового, несмотря на недостаточное знание языка, на серьезные аналитические усилия, характерные для исследователя-лингвиста. Что может заставить изучающего язык выбрать этот путь?
Неочевидность ответа на этот вопрос понятна и авторам рекомендаций от Британского национального корпуса. Они признают, что поскольку изучающие язык - не лингвисты, то задачей при использовании корпуса текстов в обучении не может быть полное описание данных или максимально возможное обобщение выводов / степень абстракции. Напротив, предполагается, что задачей корпуса является дать студентами полезные частичные (неполные) обобщения, создать запоминающийся исследовательский опыт и повысить их энтузиазм в изучении языка. Иначе говоря, утверждают представители Британского национального корпуса, ученик должен извлечь из корпуса нечто, характеризуемое как релевантное, легко запоминающееся, характерное для языка и не слишком абстрактное.
Отклоняясь от темы нашего рассуждения, следует отметить, что определённый энтузиазм наиболее вероятно возникает за счёт иллюзии конечности языка, оформленного в корпус, и иллюзии «управляемости». Поскольку в соответствии с популярным современным принципом менеджмента «управлять можно только тем, что можно измерить», ощущение относительной конечности, предсказуемости, просчитываемости языка не может не повышать самооценку изучающего.
Таким образом, среди мнений авторов рекомендаций по применению корпусов в обучении языку прослеживается определённое диалектическое противоречие: с одной стороны, изучающий язык человек не является исследователем и не должен решать задачи исследовательского характера. С другой стороны, определённая степень исследовательского подхода к языку при его обучении может быть полезной. Вполне понятно, что однозначного ответа на вопрос о том, где находится «золотая середина», нет и быть не может. Гораздо больший интерес для нашего исследования представляет проблема того, почему, собственно, такая диалектическая связь возникает именно применительно к корпусному материалу, и каковы её методологические предпосылки.
Дело в том, что, во-первых, каждый носитель определённого языка не может не являться членом некоторой группы - «дискурсивного сообщества» по Дж. Суэйлзу [10]. Во-вторых, в течение срока своей жизни каждый такой носитель порождает сам и выступает реципиентом определённого количества текстов. Таким образом, можно утверждать, что в течение жизни каждого носителя языка образуется два подкорпуса текстов: 1) корпус порождённых текстов (всё сказанное или написанное индивидом за срок жизни); 2) корпус воспринятых текстов (все фактически услышанные или прочитанные за срок жизни индивида тексты). Оба подкорпуса возникают именно в том дискурсивном сообществе или сообществах, участником которых является носитель языка. Назовём это сочетание двух подкорпусов «органическим корпусом текстов».
С онтологической точки зрения, органический корпус текстов выступает единственно возможной целостной и антропоцентрич-ной коллекцией текстов, не нуждающейся в каких-либо внешних критериях целостности, и свободной от любых количественных и статистических категорий. Идеальным бесконеч-
но великим национальным корпусом является совокупность органических корпусов текстов всех носителей данного языка.
Следовательно, ни один национальный корпус текстов не может, по определению, претендовать на соотнесённость с языковым опытом каждого из носителей данного языка. В противоположность органическому, т. е. естественному корпусу текстов, любой национальный корпус является статистическим, т. е. с точки зрения носителя языка - неестественно деперсонифицированным.
При кажущейся общности используемого языкового кода, различные дискурсивные сообщества будут различаться структурой ценностей, предметной релевантностью областей общения и способами использования языка. Из этого следует два принципиально важных вывода относительно использования корпусов в обучении языку.
Во-первых, являясь статистическим продуктом, национальный корпус текстов действительно способен точно указать на текущее состояние развития тех или иных синтагматических отношений в изучаемом языке в виде «среза» по обширному диапазону дискурсивных сообществ. Синтагматические отношения следует понимать широко: это могут быть любые просчитываемые и линейные параметры, как самого языкового кода, так и индивидуально обусловленные модели его использования, т. е. грамматические явления и устойчивые варианты сочетания смыслов.
Во-вторых, попытки использовать корпус для анализа значений как элементов парадигматических структур неизбежно приводят к контекстуально-травматичным ситуациям, которые эквивалентны попаданию человека в неожиданную коммуникативную ситуацию в пределах неизвестного дискурсивного сообщества. Эти попытки требуют от пользователя корпуса существенных и необоснованных усилий на временную адаптацию к дискурсивному сообществу и интерпретацию контекста высказывания. Иначе говоря, языковые усилия на герменевтическое толкование смысла в обрывках контекста, который, как правило, весьма трудноуловим в рамках корпуса, идут вопреки принципу языковой экономии, и не компенсируются ценностью полученного результата. При прочих равных слагаемых, в бытовой ситуации изучения иностранного языка для интерпретации значения будет гораздо более целесообразно обратиться к опосредованной языковой компетенции - т. е. к словарю, чем предпринять
трудоёмкую операцию по интерпретации ряда контекстов и, в лучшем случае, достигнуть равного результата.
Аналогичным вопросом задаются составители Британского национального корпуса: нужно ли получать ценой исследовательских усилий ту информацию, которая, по сути, доступна в формате словаря? Возможно, соглашаются они, однако корпус даёт:
• больше информации о частности/дистрибуции явлений;
• больше примеров;
• доступ к более широким контекстам;
• практические навыки самостоятельного поиска ответов на вопросы о языке (выделение наше - А. М.);
• случайные интересные находки.
«Корпус призывает к непредвзятости - вы
регулярно находите ответы не на те вопросы, с которых вы начинали поиск ... однако в процессе вы много чему учитесь» [7].
Параллельно с этим, единственной онтологически обоснованной моделью освоения языка является научение от определённого индивида или их группы, однако всегда в пределах некоторого одновременно допустимого числа языковых сообществ. Если речь идёт о первичном научении языку - это семья, круг сверстников в институтах социализации, региональное/социальное дискурсивное сообщество. В случае научения языку как иностранному - это более широкий, однако также вполне определённый круг дискурсивных сообществ, который определяется форматом и целью обучения, возрастом и т. д.
Эти наблюдения подводят нас к выводу о недостаточно чёткой дифференциации двух видов деятельности: собственно обучения языку и изучения (исследования) языка. Первый заключается в приобретении языко-
вой компетенции в пределах языка онтологически обусловленного круга языковых сообществ, тогда как второй - это осознанное и мотивированное наблюдение того или иного языкового явления на «срезе» множества усреднённых дискурсивных контекстов. При этом второй вид деятельности объективно не может предшествовать первому.
Граница между применением корпусов в обучении языку и для исследования языка характеризуется нестабильностью и субъективностью. При этом прослеживается следующая тенденция - чем более активный исследовательский подход занимает человек, изучающий язык, к процессу изучения, тем на более раннем этапе возможно включение в структуру обучения языку исследовательских, не-иллюстративных и «прямых», по Дж. Личу, корпусных методов.
Таким образом, при применении корпусов текстов в обучении языку необходимо осознавать необходимость в определённой «прагматической гигиене». Это означает, что неотъемлемым свойством работы с корпусом, в том числе с целью изучения языка, является неопосредованный контакт с большим числом неестественных для изучающего языка человека языковых сообществ. В то время как успешное решение соответственных задач исследовательского характера может благоприятно сказываться на мотивации к изучению языка, следует понимать, что чрезмерное увлечение такими способами изучения языка в ущерб опосредованным языковым компетенциям (языковой опыт преподавателя, словарь и т. д.) может сопровождаться синдромом «прагматической травмы», т. е. дискомфорта от необходимости реализации неоправданно большого герменевтического усилия для установления языковых фактов.
Список литературы
1. Мустайоки А. Роль корпусов в лингвистических исследованиях и преподавании языков // Национальный корпус русского языка и проблемы гуманитарного образования : материалы междунар. науч. конф. Москва, 19-20 апреля 2007. М., 2007. С. 58-60.
2. Рыков В. В. Корпус текстов как семиотическая система и онтология речевой деятельности. URL : http://www.dialog-21.ru/Archive/2004/Rykov.htm (дата обращения : февраль 2012 г.).
3. Соснина Е. П. Корпусная лингвистика и корпусный подход в обучении иностранному языку. URL : http://ling.ulstu.ru/linguistics/resourses/literature/articles/ corpus_linguistics_language_teaching/ (дата обращения : январь 2012 г.).
4. Толстова Т. В. Корпусная лингвистика в обучении английскому языку делового общения // Вопросы прикладной лингвистики : сб. науч. трудов. М. : РУДН, 2009. С. 63-67.
5. Янда Л. А. Студенты-пользователи Национального корпуса русского языка // Национальный корпус русского языка и проблемы гуманитарного образования. М.,
2007. С. 60-73.
6. Bernardini S. Corpora in the classroom. An overview and some reflections on future developments. In: Sinclair, John McH., ed. How to use corpora in language teaching. -Amsterdam [u. a. ] : Benjamins, 2004. VI, 307 S. (Studies in corpus linguistics; 12).
7. BNC. URL : http://www.natcorp.ox.ac.uk/Wkshops/2008-06-singapore (дата обращения : февраль 2012 г.).
8. Leech G. Teaching and language corpora: A convergence. In A. Wichmann,
S. Fligelstone, A. M. McEnery, & G. Knowles (Eds.), Teaching and Language Corpora (pp. 1-23). London : Longman.
9. Simpson R. Corpus Linguistics in North America / R. Simpson, J. M. Swales. Ann Arbor: The University of Michigan Press. 2001.
10. Swales J. M. Genre Analysis: English in Academic and Research Settings. Cambridge: Cambridge University Press, 1990. 260 p.
Spisok literatury
1. Mustajoki A. Rol’ korpusov v lingvisticheskih issledovanijah i prepodavanii jazykov // Nacional’nyj korpus russkogo jazyka i problemy gumanitarnogo obrazovanija : materialy mezhdu-nar. nauch. konf. Moskva 19-20 aprelja 2007. M., 2007. S. 58-60.
2. Rykov V. V. Korpus tekstov kak semioticheskaja sistema i ontologija rechevoj dejatel’nosti.URL:http://www.dialog-21.ru/Archive/2004/Rykov.htm(data obrashchenija : fevral' 2012 g.).
3. Sosnina E. P. Korpusnaja lingvistika i korpusnyj podhod v obuchenii inostrannomu
jazyku. URL : http://ling.ulstu.ru/linguistics/resourses/literature/articles/corpus_
linguistics_language_teaching/ (data obrashchenija : janvar' 2012 g.).
4. Tolstova T. V. Korpusnaja lingvistika v obuchenii anglijskomu jazyku delovogo obwenija // Voprosy prikladnoj lingvistiki : sbornik nauchnyh trudov. M.: RUDN, 2009.
S. 63-67.
5. Janda L. A. Studenty-pol'zovateli Nacional'nogo korpusa russkogo jazyka // Nacional'-nyj korpus russkogo jazyka i problemy gumanitarnogo obrazovanija. M., 2007.
S. 60-73.
6. Bernardini S. Corpora in the classroom. An overview and some reflections on future developments. In: Sinclair, John McH., ed. How to use corpora in language teaching. -Amsterdam [u. a. ] : Benja-mins, 2004. VI, 307 S. (Studies in corpus linguistics; 12).
7. BNC. URL : http://www.natcorp.ox.ac.uk/Wkshops/2008-06-singapore (data obrashchenija : fevral' 2012 g.).
8. Leech G. Teaching and language corpora: A convergence. In A. Wichmann,
S. Fligelstone, A. M. McEnery, & G. Knowles (Eds.), Teaching and Language Corpora (pp. 1-23). London : Longman.
9. Simpson R. Corpus Linguistics in North America / R. Simpson, J. M. Swales. Ann Arbor: The Uni-versity of Michigan Press. 2001.
10. Swales J. M. Genre Analysis: English in Academic and Research Settings. Cambridge: Cam-bridge University Press, 1990. 260 p.
Статья поступила в редакцию 18 февраля 2012 г.