Научная статья на тему 'LC-технологии в исследовании освоения языка'

LC-технологии в исследовании освоения языка Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
237
50
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
УЧЕБНЫЙ КОРПУС / LC-ТЕХНОЛОГИИ / ИНТЕРФЕРЕНЦИЯ / ИНТЕРЪЯЗЫК / ПЕРЕПРОИЗВОДСТВО ГРАММАТИЧЕСКИХ СТРУКТУР / LEARNER CORPUS / LC TECHNOLOGIES / INTERFERENCE / INTERLANGUAGE / STRUCTURE OVERUSE

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Камшилова Ольга Николаевна

Обобщается опыт использования учебных корпусов текстов (LC) в исследовании освоения чужого языка и оцениваются новые перспективы применения LC-технологий. Анализируется результат корпусного анализа грамматических структур в речи русских школьников, изучающих английский язык.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

LC-Technologies in Language Acquisition Studies

The paper reviews the use of Learner Corpora in foreign language acquisition studies and new prospects for LC technologies. It also focuses on a corpus analysis of some grammatical structures in Russian EFL schoolchildren speech.

Текст научной работы на тему «LC-технологии в исследовании освоения языка»

REFERENCES

1. Avramov K. V., Mihlin Ju. V Nelinejnaja dinamika uprugih sistem. Modeli, metody, javlenija. M.; Izhevsk: NITs «Reguljarnaja i haoticheskaja dinamika», 2010. T. 1.

2. Anishchenko V S. Znakomstvo s nelinejnoj dinamikoj. M.: Izd-vo LKI, 2013.

3. Butikov E. I. Neobychnoe povedenie majatnika pri sinusoidal'nom vneshnem vozdejstvii. Chast' 2. // Komp'juternye instrumenty v obrazovanii. 2008. № 2. S. 24-36.

4. Gritchenko V T., Macipura V T., Snarskij A. A. Vvedenie v nelinejnuju dinamiku: Haos i fraktaly. M.: Izd-vo LKI, 2007.

5. KlumovaI. N. Igra «Zhizn'« // Kvant. 1974. № 9. S. 26-30.

6. Kozlov V. V., Trewev D. V. Billiardy. Geneticheskoe vvedenie v dinamiku sistem s udarami. M., 1991.

7. Kondrat'ev A. S., Ljaptsev A. V Fizika. Zadachi na komp'jutere. M.: Fizmatlit, 2006.

8. Ljaptsev A. V. «Kvantovanie» v zadachah nelinejnoj dinamiki. Chslennyj eksperiment i interpretatsa // Izvestija RGPU im. A. I. Gertsena. № 147. 20. S. 161-175.

9. Ljaptsev A. V Strannyj attraktor v prostejshej mehanicheskoj sisteme // Komp'juternye instrumenty v obrazovanii. 2010. № 6. S. 57-66.

10. Popov S. E. Metodicheskaja sistema podgotovki uchitelja v oblasti vychislitel'noj fiziki: Mono-grafija. Nizhnij Tagil: NTGSPA, 2005.

11. Haken G Sinergetika. M.: Mir, 1980.

О. Н. Камшилова LC-ТЕХНОЛОГИИ В ИССЛЕДОВАНИИ ОСВОЕНИЯ ЯЗЫКА

Обобщается опыт использования учебных корпусов текстов (LC) в исследовании освоения чужого языка и оцениваются новые перспективы применения LC-технологий. Анализируется результат корпусного анализа грамматических структур в речи русских школьников, изучающих английский язык.

Ключевые слова: учебный корпус, LC-технологии, интерференция, интеръязык, перепроизводство грамматических структур.

O. Kamshilova

LC-Technologies in Language Acquisition Studies

The paper reviews the use of Learner Corpora in foreign language acquisition studies and new prospects for LC technologies. It also focuses on a corpus analysis of some grammatical structures in Russian EFL schoolchildren speech.

Keywords: learner corpus, LC technologies, interference, interlanguage, structure overuse.

Учебные корпусы текстов (Learner Corpora, далее LC) изначально создавались с целью мониторинга и анализа ошибок, допускаемых при овладении инофонами чужим языком. Корпусные технологии позволили обнаружить наиболее распространенные ошибки в словоупотреблении и словообразовании, характер которых заставил пересмотреть содержание многих обучающих материалов, поскольку выявленные отклонения от нормы свидетельствовали о влиянии интерференции родных языков инофонов и так называемой «промежуточной грамматики», или интеръязыка, от чего не предупреждает ни один традиционный учебник или учебный словарь. Таким образом, известная поговорка «на ошибках

учатся» достаточно точно характеризует появление новых методик, подкрепленных материалом представительных эмпирических баз данных. На основе исследований в LC создаются словари и учебники нового типа, включающие комментарии, предупреждающие такие ошибки [3; 5].

Почти 30-летний опыт работы с LC показал, что потенциал их далеко не исчерпан. Отметим основные направления в совершенствовании LC-технологий.

• При сохранении основных принципов проектирования и строительства LC развитие технологий предлагает новые форматы и процедуры. Некоторые корпусы включают аудио-и видеоматериалы, сканы и pdf-файлы оригинальных рукописей информантов, что требует разработки процедур их встраивания в корпус и инструментов дальнейшей обработки.

• Кроме обязательной морфологической и синтаксической разметки, возникает необходимость в просодической разметке аудио- и видеоматериалов. Новые запросы создателей LC сегодня — семантическая и дискурсивная разметки.

• Специфическая для LC задача — разметка ошибок (error tagging). Комплекс проблем, которыми занимаются сегодня, связан с классификацией ошибок и стандартизацией их кодирования. Достаточно трудоемкой задачей считается и сам процесс обнаружения ошибок в тексте, который обычно проводится вручную.

• Создание LC начиналось с письменных текстов на английском языке. Сегодня LC активно создаются на материале разных языков как иностранных — венгерского, румынского, финского, эстонского, чешского и других. Технологии LC используются также в исследовании языка детей-билингвов, родных языков «потенциальных» билингвов — школьников, живущих в зонах контактирующих языков, например немецкого и итальянского на севере Италии (см., например, доклады Dickinson, Ledbetter; Durst, Szabo; Gerstenberger; Ivaska; Kikerpill, Klaas-Lang, Praakli; Stindlova, Rosen; Alderson; Glasnieks, Abel, Lyding в [6]).

• Накопление корпусных данных и совершенствование разметки обусловливает обращение к статистическим процедурам обработки извлекаемой информации. Применение статистических методов позволяет строить гипотезы и доказательно обосновывать тенденции, характеризующие процесс освоения чужого / родного языка (см. Min et al., Lee et al. в [6]).

• Большинство известных LC фиксируют определенный этап языковой компетенции. Новое направление в LC — создание лонгитюдных корпусов, накопление текстов одного и того же автора (авторов) в течение некоторого времени, что позволяет представить процесс овладения языком в динамике.

• LC перестают быть только базой для извлечения ошибок, но становятся полезным и эффективным средством обучения. Примером последнего может быть обучающая система Т. Кобба, созданная на основе оригинального учебного корпуса *.

В России строительство учебных корпусов текстов и использование их в лингвистических исследованиях только набирает силу. Одним из первых опытов такого рода можно считать Санкт-Петербургский учебный корпус текстов школьников, изучающих английский язык SPbEFL LC**, созданный на филологическом факультете РГПУ им. А. И. Герцена [1]. Работы по сбору материала и строительству корпуса начались еще в 2007 г. Сегодня корпус — одна из основных баз лингвистических исследований по направлению «корпусная лингвистика» на кафедре образовательных технологий в филологии. Основным назначением применений корпусных технологий остается поиск и систематизация специфических для русскоговорящих ошибок, вызываемых как интерференцией родного языка, так и

более общими причинами, связанными с так называемой «переходной грамматикой», или интеръязыком — явлением, характерным для процесса овладения чужой грамматикой через собственные временные конструкты и «правила». Рассмотрим некоторые данные корпуса, позволяющие наблюдать особенности иноязычной речи русских школьников, которые в обычной учебной практике не корректируются и не предупреждаются дидактическими материалами.

Можно выделить два главных аспекта, определяющих эффективность использования LC, — это извлечение и классификация ошибок. Работа с грамматическими ошибками, например, должна находить и систематизировать не только те, которые обнаруживаются по формальным (морфологическим) признакам, но и не имеющие таковых, что делает ошибки второго рода нераспознаваемыми зачастую даже при анализе вручную. Они обнаруживаются только при накоплении достаточно большого эмпирического материала. Речь идет о так называемом «перепроизводстве» (overuse) грамматических структур, характерной черте интеръязыка.

Исследования процесса овладения чужим языком показали, что иностранцы, говорящие / пишущие на английском языке, чаще других используют структуру SVC (с субъектным предикативом — John is a student/clever) со связкой be [4]. Перепроизводство этой базовой структуры отмечается и в петербургском корпусе. В речи носителей языка она также высокочастотна, особенно в разговорной речи и в академической прозе [2, с. 437]. Показательно заполнение компонентов структуры в речи носителей: позиция субъектного предикатива С в разговорной речи преимущественно замещается существительным (более 50%) в отличие от академических (научных, учебных) текстов, где фиксируется абсолютное преимущество прилагательного [2, с. 446].

Тексты петербургского корпуса относятся к разговорному регистру, но демонстрируют тенденцию, характерную для академического, т. е. формального, стиля: в позиции С преобладает прилагательное (около 59%), доля существительного заметно ниже (около 36%):

Таблица 1

Заполнение позиции предикатива (С) в текстах корпуса SPbEFL LC

Прилагательное (AP) Существительное (NP) Словосочетание с предлогом (PP) Прида очное предложение (CO Инфини ив (InfP)

779 475 18 40 13

S<BE> C

(1325 hits)

Обращение к данным корпуса аутентичных английских текстов LSWE (Longman Spoken and Written English Corpus) [2, c. 44б] дает возможность сравнить наиболее частотные предикативные прилагательные и существительные в речи носителей языка и в текстах русских школьников из SPbEFL LC (табл. 2 и 3).

Таблица 2

Сравнение высокочастотных предикативных прилагательных с учетом регистра

SPbEFL LWSEC Conversation (per million) Academic (per million)

(1) good (2)good Over 200 Over 20

(4) different (5) different Over 40 Over 100

(12) difficult (7) difficult Over 100

Примечание: в скобках указан ранг в первой дюжине предикативных прилагательных.

Таблица 3

Сравнение высокочастотных предикативных существительных

SPbEFL LWSE (conversation)

1. proper name crap

2. idea proper name

3. thing home

4. friend no way

5. problem people

6. webster matter

7.film thing

8. place time

9. child /children trouble

10. dog way

Только три прилагательных из петербургского корпуса попадают в первую дюжину высокочастотных предикативных прилагательных в текстах носителей языка (good, different, difficult — табл. 2). Причем высокая частота different и difficult в речи носителей фиксируется в академическом (формальном) регистре, но не в разговорном. В этом легко убедиться при обращении к другим английским корпусам текстов, например к авторитетному Британскому национальному корпусу (BNC). Сравнение употреблений прилагательного difficult в текстах корпуса SPbEFL с примерами из BNC делает разницу в регистрах очевидной:

SPbEFL LC

But from another sight, it's very difficult today to buy a flat.

They think to keep a dog in a flat is difficult, because it need care, food, place and somebody

For example, it won't be very difficult to organize a party.

BNC

The striking head is difficult to parallel stylistically, and the teeth seem to have been cut with an abrasive wheel which would not have been available in the Americas before the Spanish conquest (Science and the past. London: British Museum Press, 1991).

She deserves our respect and admiration, but she is difficult to like (London: The Daily Telegraph plc, 1992, Arts material).

Similarly, different nucleotides could have strung together to form primitive nucleic acid; but it is difficult, now, to see how that primitive nucleic acid could have replicated itself efficiently, without the help of some primitive protein 9 (Global ecology. Tudge, Colin. London: Natural History Museum Publications, 1991).

Употребление прилагательных формального стиля в речи школьников — явное нарушение нормы, которое в практике обучения языку не осознается как ошибка и не корректируется.

Очевидно, что информанты корпуса испытывают влияние родного языка — прилагательное трудный имеет широкую сочетаемость как в атрибутивной, так и в предикативной функции: трудная задача / тема, трудный язык / спектакль, трудные жильцы; выборы / экзамены были трудными, учеба была трудной, расставаться было трудно (примеры из НКРЯ). Перепроизводство (overuse) структур с difficult в этом случае можно рассматривать как явное свидетельство «своей грамматики», интерференции родного языка, однако с точки зрения характера интерференции важно понять, почему из пары английских синонимов с общим значением «трудный» difficult и hard, обладающих нюансировкой по отношению к значению и регистру, информанты корпуса отдают предпочтение именно прилагательному difficult. Ср.:

difficult, hard, challenging, demanding, taxing, testing — something that is not easy and requires a lot of effort or skill to do

hard, strenuous, arduous, grueling, punishing — something that needs a lot of physical strength or effort***

И почему также из всех модальных глаголов со значением возможности они выбирают can, а со значением долженствования — must? Вероятно, ответ на этот вопрос следует искать в методическом обеспечении обучения иностранному языку. Причем не столько в содержании справочных и учебных материалов — как видно из примера выше, современные словари содержат точную информацию о значении слова и его потенциальной сочетаемости, ситуации употребления и регистре, — сколько в разработке технологий обучения, ориентированных на предупреждение ложных решений, к которым приводят стратегии интеръязыка. Определить эти ложные решения возможно именно с помощью обращения к данным учебных корпусов.

Сравнение частотных списков существительных в роли субъектного предикатива (табл. 3) обнаруживает больше совпадений: высокий ранг имен собственных, прономинального thing. Сопоставимы общереферентные употребления child /children и people, оценочные problem и trouble. Однако список top-существительных в LWSE носит ярко выраженный модальный («attitudinal, marking the stance of the speaker» [2, c. 450]) характер, в то время как в списке SPbEFL находим имена с нейтральной оценкой (friend, film, Webster, dog). Оценочный компонент в текстах информантов корпуса SPbEFL чаще выражен прилагательным-определением к предикативному существительному (a good / favourite / expensive / new film). Таким образом, можно предположить, что авторы петербургского корпуса, в

отличие от носителей языка, для выражения оценки предпочитают использовать предикативные и атрибутивные прилагательные.

Говоря о базовой структуре SVC в речи информантов корпуса, нельзя не отметить, что достаточно часто наблюдается пропуск связки — явное свидетельство интерференции родного языка, — который нередко фиксируется самими информантами с помощью тире:

One of this technologies — internet

My favorite group — Gorod 312

The most popular animals — dogs and cats

Кроме того, в ходе анализа контекстов со связкой be были обнаружены ошибки другого рода, хорошо известные практикующим преподавателям английского языка:

I'm totally agree with them.

I'm prefer pizza, meat, fish and others I'm study in art-school

Ошибки этого типа являются контаминацией, смешением базовых структур — высокочастотной S <BE> C со структурами SV, SVO и с другими. Это явная форма промежуточной грамматики, которая встречается в текстах разных жанров у информантов с разными родными языками (в собственно петербургском и калифорнийском подкорпусах):

... it’s depend on how much people have a good responsibil (CA Essay)

It’s can make human get sich. (CA Essay)

... it’s can be right some people who work well... (CA Essay)

But, in any case it's depend on person (SPb Essay)

I hope that it's wouldn't last for long time (SPb Monologue)

As for me I'm always go to internet. I'm play online games (SPb Essay)

Очевидно, что перепроизводство, как признак интеръязыка, здесь носит иной характер и связано с заученными формами настоящего времени связки be, которые в традиционных учебниках по грамматике даются вместе с формами личных местоимений. Это еще один серьезный повод к тому, чтобы пересмотреть технологии обучения иностранному языку, ориентируя их на предупреждение вмешательства внутренней грамматики.

Поиск проявлений переходной грамматики в текстах корпуса обнаружил как явные отклонения от норм английской грамматики (ошибки в употреблении связки, например), так и не явные, «не типичные», хотя количественная оценка таких ошибок говорит об очевидных тенденциях, которые до сих пор не учитываются в дидактических материалах. Элементарные базовые структуры английского языка, которые должны быть хорошо усвоены при уровне владения языком intermediate и upper-intermediate, в речевых произведениях школьников подвергаются воздействию переходной грамматики, которая либо нарушает правила наполнения компонентов базовых структур, что не всегда препятствует коммуникации, либо приводит к очевидным ошибкам. Обнаруживать и корректировать последние представляется более очевидным делом, чем управлять вариациями первого типа. Именно они создают «иностранный акцент» в речи инофонов при внешнем впечатлении грамотности. Лингвистическая интерпретация этих вариаций может быть полезна в рамках теории коммуникации на естественных языках, интерференции, в когнитивных исследованиях. С методической точки зрения данные о характерных чертах интеръязыка у русских школьников полезно учитывать при создании дидактических материалов и обучающих

108

технологий. Определить ложные решения в речи инофонов помогают корпусные технологии.

SPbEFL LC — открытый ресурс, его объем постепенно растет. Пополнение корпуса возможно в том направлении, которого требуют новые исследовательские задачи, которые, в свою очередь, определяются и формулируются на основе анализа извлеченных из корпуса данных. Накопленный «отрицательный» материал представляет собой уникальный источник и доказательную базу для изучения реальных проблем, которые возникают у русскоязычных школьников при овладении английским языком как иностранным. Учет кор -пусных данных должен стать естественным условием при разработке новых обучающих и контрольных материалов.

Сегодня корпус SPbEFL LC может быть использован для доступа к полнотекстовым данным, для копирования любого фрагмента корпуса, для выборки по параметрам авторов текста (возраст, пол, родной язык) и параметрам самих текстов (жанр, тема), для работы с рекомендованными программами, для пополнения корпуса (с помощью сервиса Corpus Builder). В планах развития корпуса — разметка ошибок и лонгитюдные исследования.

Помимо исследовательских задач SPbEFL LC позволяет реализовать образовательные задачи, поскольку является эффективным обучающим ресурсом, в процессе которого формируются и развиваются межпредметные связи и знания. Работа с корпусом учит студента самостоятельно, на основе наблюдения и анализа предварительных данных определять объект своего исследования, формулировать его цель и гипотезу, критически отбирать текстовые инструменты, адекватные характеру объекта и поставленной цели, анализировать результаты исследования и планировать их практическое применение, работать в экспертных группах.

Совершенно очевидно, что в практике создания и использования LC последовательно меняются и корректируются задачи — от описательных и объяснительных к прикладным, а именно: от накопления и систематизации данных об ошибках, исследования системных характеристик интеръязыка и языковых процессов освоения чужого / родного языка к пониманию того, что данные LC могут стать основой обучающих систем и материалов. Однако первичная цель создания таких корпусов — накопление «отрицательного материала», выявление и анализ ошибок, позволяющие вести разносторонний мониторинг процессов овладения языком, — остается по-прежнему актуальной.

ПРИМЕЧАНИЯ

* См. разделы Tutorial и Teachers на сайте Compleat Lexical Tutor — URL: http://www.lextutor.ca/

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

** SPbEFL LC (Корпус текстов петербургских школьников, изучающих английский язык) — URL: www.spbeflcorp.ru

*** Толкования из Oxford Learner’s thesaurus. A dictionary of synonyms — Oxford University press, 2009 (выделено мною. — О. К ).

СПИСОК ЛИТЕРАТУРЫ

1. Камшилова О. Н. Учебный корпус текстов: потенциал, состав, структура. СПб.: Книжный Дом, 2012. 58 с.

2. Biber D., Johansson S., Leech G, Conrad S., Finegan E. Longman Grammar of Spoken and Written English. Harlow: Longman, 1999. P.450.

3. Cambridge Advanced Learner’s Dictionary. Сambridge University Press, 2008.

4. Hinkel E. Simplicity without elegance: Features of sentences in L1 and L2 Academic texts // TESOL Quarterly. 2003. Vol. 37. No. 2. P. 275-300.

5. Jeffries A., ClandfieldL., Benne R. R. Global Upper Intermediate Coursebook. Macmillan, 2012.

6. Learner language. Learner corpora. Abstracts. — Oulu, Oulun yliopisto. October 5-6, 2012. — URL: http://www.oulu.fi/hutk/sutvi/oppijankieli/LLLC/LLLC2012_ abstracts.pdf

7. Mauranen A. The Corpus of English as Lingua franca in Academic Settings // TESOL Quarterly. 2003.Vol. 37, No. 3. P. 515-527.

REFERENCES

1. Kamshilova O. N. Uchebnyj korpus tekstov: potentsial, sostav, struktura. SPb.: Knizhnyj Dom, 2012.

58 s.

2. Biber D., Johansson S., Leech G., Conrad S., Finegan E. Longman Grammar of Spoken and Written English. Harlow: Longman, 1999. P.450.

3. Cambridge Advanced Learner’s Dictionary. Cambridge University Press, 2008.

4. Hinkel E. Simplicity without elegance: Features of sentences in L1 and L2 Academic texts // TESOL Quarterly. 2003.Vol. 37. No. 2. P. 275-300.

5. Jeffries A., ClandfieldL., Benne R. R. Global Upper Intermediate Coursebook. Macmillan, 2012.

6. Learner language. Learner corpora. Abstracts. — Oulu, Oulun yliopisto. October 5-6, 2012. — URL: http://www.oulu.fi/hutk/sutvi/oppijankieli/LLLC/LLLC2012_ abstracts.pdf

7. Mauranen A. The Corpus of English as Lingua franca in Academic Settings // TESOL Quarterly. 2003. Vol. 37. No. 3. P. 515-527.

И. А. Кудрявцева

АКТУАЛЬНОСТЬ РАЗВИТИЯ СОДЕРЖАНИЯ ОБУЧЕНИЯ ТЕОРЕТИЧЕСКОМУ ПРОГРАММИРОВАНИЮ

Автором рассматривается обоснование актуальности развития содержания обучения теоретическому программированию, под которым понимается наука о математических моделях понятия «программа», и включающая следующие разделы: Х-ис-числение, теория комбинаторов, теория типов, теория категорий, формальная семантика языков программирования.

Ключевые слова: содержание обучения, теоретическое программирование, парадигма программирования, квантовая модель сознания, междисциплинарный подход, по-лидисциплинарный подход, трансдисциплинарный подход.

I. Kudryavtseva

The Relevance of Theoretical Programming Learning Content Development

The development of the content of Theoretical programming course is discussed. The course deals with mathematical models of the concept of «program», and includes the following topics: lambda calculus, type theory, combinators theory, theory of categories, formal semantics of programming languages.

Keywords: learning content, theoretical programming, programming paradigm, quantum model of consciousness, interdisciplinary approach, multidisciplinary approach, transdiscipli-nary approach.

i Надоели баннеры? Вы всегда можете отключить рекламу.