Научная статья на тему 'В ожидании «Другой» лингвистики: идея национального корпуса и «Революция» в языкознании'

В ожидании «Другой» лингвистики: идея национального корпуса и «Революция» в языкознании Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
397
70
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОРПУС / КОРПУСНАЯ ЛИНГВИСТИКА / BRITISH NATIONAL CORPUS / БРИТАНСКИЙ НАЦИОНАЛЬНЫЙ КОРПУС / КОНТЕКСТ / CONTEXT / КОНКОРДАНС / РЕГИСТР / ЛЕВЫЙ И ПРАВЫЙ КОЛЛОКАТЫ СЛОВА / КОЛЛОКАЦИЯ / CORPUS-BASED LINGUISTICS

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Перевезенцева Ю. С., Атрощенко С. А.

Статья посвящена анализу проблемы использования лингвистического корпуса для исследовательской работы и обучения иностранным языкам. В качестве объекта изучения авторами статьи был выбран Британский национальный корпус. Анализ основных характеристик корпуса и одной из наиболее употребительных лексем английского языка – ring – позволили выявить не только преимущества, но и ограниченность корпуса в изучении языка.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PENDING «ANOTHER» LINGUISTICS: IDEA OF NATIONAL CORPUS AND «REVOLUTION» IN STUDY OF LANGUAGE

The article is devoted to the problem of using corpus in the research and teaching of foreign languages. The authors of the article have chosen British National Corpus as a target of research. Study corpus’ general characteristics and one of the most useful lexical item – ring – gives an opportunity to show up both uniqueness and unconvincing of corpus to study/research the language.

Текст научной работы на тему «В ожидании «Другой» лингвистики: идея национального корпуса и «Революция» в языкознании»

УДК 811.111

Ю.С. Перевезенцева

канд. пед. наук, доцент, кафедра иностранных языков, ФГБОУ ВПО «Нижегородский государственный технический университет им. Р.Е. Алексеева»

С.А. Атрощенко

канд. пед. наук, доцент, кафедра иностранных языков, ФГБОу ВПО «Нижегородский государственный университет им. Н.И. Лобачевского»

В ОЖИДАНИИ «ДРУГОЙ» ЛИНГВИСТИКИ: ИДЕЯ НАЦИОНАЛЬНОГО КОРПУСА И «РЕВОЛЮЦИЯ» В ЯЗЫКОЗНАНИИ

Аннотация. Статья посвящена анализу проблемы использования лингвистического корпуса для исследовательской работы и обучения иностранным языкам. В качестве объекта изучения авторами статьи был выбран Британский национальный корпус. Анализ основных характеристик корпуса и одной из наиболее употребительных лексем английского языка - ring - позволили выявить не только преимущества, но и ограниченность корпуса в изучении языка.

Ключевые слова: корпус, корпусная лингвистика, Британский национальный корпус, контекст, конкорданс, регистр, левый и правый коллокаты слова, коллокация.

Yu.S. Perevezentseva, Nizhni Novgorod State Technical University n.a. R.E. Alekseev

S.A. Atroshchenko, Lobachevsky State University of Nizhniy Novgorod

PENDING «ANOTHER» LINGUISTICS: IDEA OF NATIONAL CORPUS AND «REVOLUTION» IN STUDY OF

LANGUAGE

Abstract. The article is devoted to the problem of using corpus in the research and teaching of foreign languages. The authors of the article have chosen British National Corpus as a target of research. Study corpus' general characteristics and one of the most useful lexical item - ring - gives an opportunity to show up both uniqueness and unconvincing of corpus to study/research the language.

Keywords: corpus-based linguistics, British National Corpus, context.

В последнее время у многих ученых-филологов вызывает интерес вопрос о перспективах развития лингвистического познания. Не исключено, что одной из причин его возникновения стало содержание лекции известного российского лингвиста В.А. Плунгяна, в которой он высказывает мысль о том, что «современная лингвистика должна быть лингвистикой корпусов. Корпус позволяет понять, каков язык на самом деле, а не каким мы хотим, чтоб он был. Корпус произвел колоссальную революцию. Корпус вернул лингвистике ее настоящий, полноправный объект» [1]. Позиция В.А. Плунгяна получила широкий отклик, особенно среди методистов и преподавателей иностранного языка. Появилось достаточное количество научных статей, сообщающих о важности и необходимости использования корпусов в обучении [2, 3, 4]. Вкратце основные их преимущества были изложены в учебном пособии В.П. Захарова «Корпусная лингвистика»:

1) большой (репрезентативный) объем корпуса гарантирует типичность данных и обеспечивает полноту представления всего спектра языковых явлений;

2) данные разного типа находятся в корпусе в своей естественной контекстной форме, что создает возможность их всестороннего и объективного изучения;

3) однажды созданный и подготовленный массив данных может использоваться многократно многими исследователями и в различных целях;

4) спрос на корпусные данные совпал с появлением соответствующих технических возможностей [5, c. 3-4].

Однако нельзя забывать, что вышеизложенные преимущества в ряде случаев могут являться таковыми лишь теоретически. Процесс формирования корпуса - чрезвычайно трудоемкий процесс (можно вспомнить Чешский национальный корпус, с созданием которого возникло множество трудностей; Национальный корпус русского языка, работа над которым ведется достаточно продолжительный период). В силу обстоятельств любой проект корпуса может оказаться неприемлемым или до конца нереализованным. Кроме того, о корпусах нельзя говорить в общем и целом. Каждый из них по-своему уникален и поэтому заслуживает отдельного внимания и обсуждения.

В данной статье анализируется один из наиболее известных корпусов английского языка, по образцу которого создавались многие другие, - Британский национальный корпус - British National Corpus (BNC) [6]. В ходе его исследования были поставлены следующие задачи: охарактеризовать корпус в целом; выявить потенциал корпуса для исследовательской работы, а также в обучении иностранному языку на примере лексемы ring.

Объем корпуса составляет 100 млн слов. Разработан он был в Оксфордском университете при участии Ланкастерского университета и Британской библиотеки. Работа над созданием корпуса продолжалась с 1991 по 1994 годы. Тексты, представленные в Британском национальном корпусе, отбирались по трем основным критериям: время, область, которую данный текст описывает, и тип издания. По времени все тексты принадлежат приблизительно одному периоду, начиная с 1975 года, исключения делались для развлекательной литературы, поскольку некоторые из произведений очень популярны и сейчас.

В BNC присутствуют литературные произведения с 1964 года, что подтверждает синхроничность корпуса. К области развлекательной литературы принадлежит 25% текстов. 75% письменных текстов были заимствованы из информативных изданий (наука, искусство, коммерция и финансы, досуг, социология и мировое обозрение). Учитывались также размер (количество слов), тема, обсуждаемая в тексте, имя автора, возраст, пол, место рождения, место жительства, возрастная группа людей, для которых предназначался данный текст, а также уровень сложности текста.

Подкорпус, представляющий письменный английский язык, включает в себя газеты, периодические научные издания и журналы, издаваемые для различных возрастов, популярную научную фантастику, опубликованные и неопубликованные письма, школьные и университетские сочинения и многое другое.

Подкорпус устной речи включает речь добровольно вызвавшихся участвовать в проекте людей разного возраста, проживающих в разных частях Великобритании и принадлежащих к различным социальным слоям. Весь подкорпус устной речи разделен на две примерно равные части:

1) демографическую часть, содержащую транскрипции спонтанных, естественных диалогов;

2) контекстно-управляемую часть (часть, в которой важную роль играет контекст), содержащую записи, сделанные на публичных мероприятиях.

Полный доступ к корпусу в режиме on-line отсутствует. В этом режиме доступны далеко не все возможности поискового интерфейса, поставляемого вместе с полной версией корпуса, выдача ограничивается 50 случайными примерами.

Существует доступ к версии корпуса, разработанной Марком Дэвисом [7]. Мы проиллюстрируем возможности корпуса BNC на примере лексемы ring, поскольку она является одной из наиболее употребляемых в английском языке. В частности, это подтверждается данными о частотности ring в корпусе, составляющим около 6694 случаев.

Сравним частотность употребления лексемы ring в разных регистрах. Таблица 1 включает в себя непосредственные подсчеты и нормированные подсчеты. Непосредственные подсчеты показывают количество случаев встречаемости слова в каждом регистре. Однако эти регистры включают различное количество слов. Поэтому сравнение непосредственных подсчетов нельзя использовать в качестве критерия для вывода о большей или меньшей частотности слова в одном регистре по сравнению с другим. Достоверные основания для сравнения по регистрам обеспечивают нормированные подсчеты, которые преобразуют количество случаев встречаемости слова по стандартной шкале, обычно в пересчете на 1 млн словоупотреблений.

Таблица 1 - Частотность лексемы RING в определенных регистрах

Регистр Примерное количество слов в регистре Непосредственные подсчеты для ring (количество слов) Нормированные подсчеты (количество случаев встречаемости на 1 млн словоупотреблений)

Разговорная речь 9.963.663 1558 156,37

Художественная литература 15.909.312 1920 120,68

Журналы 7.261.990 515 70,92

Газеты 10.466.422 694 66,31

Научно-популярная литература 16.495.185 634 38,44

Научная литература 15.331.668 301 19,63

Разное 20.835.159 1072 51,45

Как видно из таблицы 1, наибольшей является частотность слова ring в разговорной речи (156,37 случаев встречаемости на 1 млн словоупотреблений).

Программа конкордансов может создавать список частотности слов, который обыкновенно пред-

ставляется в алфавитном порядке в зависимости от порядка встречаемости слова. В корпусе можно произвести подсчеты частотности для каждой грамматической формы слова (рис. 1). Так, на 1000 примеров словоупотребления слово ring встречается как нарицательное существительное 592 раза, как имя собственное - 4 раза, как глагол - 404 раза.

Part of speech coloring: пол ртапоип (йрй noun idjetH ^ iflfcb рнрийм

Sit HXS IjIB m l (iiivjMlf Snoin fa Witt ■■ ÜÜS h-UDi KO* ■■ *t лшймиИм

533 m Wime A 6 City Ceta jfpriï, 1 mik , Йп£ ÜMij âpjrmï, 2 m'es .1 DETAILED

SM BW S.WcKtjKW A В 'i fa Mityjfll S M , faî '1 vif fart

595 JIG l_rai ; l ntersertw if (W vi tafai jüjj tod if «vent î gaq

55fc M WjeHsp_irii!rjE;(irt t, ( campln ! tum rigfe auto ЙЩ icd , Hçlihand lue ta go over

Si? FMI SjfttiijjitiaifW h i And er si! ; Niv p ;o do ;t jsA Ш Die |мкнеч . Wy tikes ibûii

Рисунок 1 - Подсчеты частотности для каждой грамматической формы слова

Лексема ring образует большое количество сочетаний. Проанализируем коллокаты (collocates) слова. Для каждой коллокации (collocation) существует сильная тенденция ассоциироваться с одним смыслом или значением. Поэтому выделяя наиболее частые коллокации слова, можно проанализировать его значения.

В таблице 2 приведены коллокаты из 100-словного списка для слова ring в таких регистрах, как научная и художественная литература.

Таблица 2 - Частые коллокаты ring в двух регистрах корпуса

Научная литература Художественная литература

Левые коллокаты

inner 13 'Il 99

wedding 11 wedding 52

outer 8 engagement 19

gold 7 gold 19

Правые коллокаты

road 3 me 55

laser 3 him 46

electrodes 3 back 26

round 3 round 16

Из данных, представленных в таблице, следует, что слово inner является наиболее частым левым коллокатом для ring в научной литературе, а me - частым правым коллокатом в художественной литературе.

Корпусы позволяют исследовать значения слов путем использования конкордансов. Анализ смысла слова можно исследовать, просмотрев списки конкордансов, которые показывают данные словосочетания.

В корпусе BNC информация о лексеме и ее коллокатах представлена следующим образом: по каждому регистру указывается source information - источник информации, включающий дату, а также expanded context - расширенный контекст. Например, для коллокатов ring в художественной литературе можно отметить интересные сходства и различия со словосочетаниями в научной литературе. Так, совместное употребление wedding ring (явно в значении - обручальное кольцо) и gold ring (в значении - золо-

тое кольцо) очень похоже в двух регистрах. Наши выводы подтверждаются следующими примерами конкордансов:

Регистр - художественная литература Регистр - научная литература

Source information: (1985-1994), It might have been Jerusalem. Healy, Thomas. Edinburgh: Polygon Books, 1991, pp. 1-81. 3119 s-units. Expanded context: 'Always fucking trouble,' he said.' If it's not one thing it is another.'' It's not my fault,' Phillis said,' we were robbed.' Rab pulled on his trousers. He looked for the time. But a naked wrist.' The bastard's stole my watch,' he said.' They were in here tae.' Rab rubbed his eyes.' They must hiv been. I was wearing my watch when I went tae bed.'' I've still got my wedding ring.' Phillis (her fingers had thickened, sudden weight) now wore her ring, on a length of string, around her neck.' Then ye're lucky.'' I would have felt them,' Phillis said.' I never felt a thing,' Rab said.' They could hiv cut my throat I never felt a thing.' Phillis barefoot (she had great long dirty toes) in a tom dressing gown.' They might hiv killed the snapper' Source information: (1985-1994), Investigating society. Robert G. Burgess (ed.) Harlow: Longman Group UK Ltd, 1989, pp. 32-171. 1622 s-units Expanded context: post J.B. Oh God, yes. R.B. You did what every teacher does and that is you dressed differently. J.B. I was wearing this jumper. (laughs) R.B. I don't remember that. But you dressed differently, I remember that and you also wore a wedding ring. J.B. Yes. I did yes. Deliberately. R.B. Can you tell me... J.B. (laughs) R.B. Can you tell me why? J.B. Because Father Curtis was there and I thought you know he won't want some married woman who goes round not wearing a wedding ring in charge of all these kids will he? Even though I thought the job was really mine I thought I had to create the impression of somebody who was, you know, above board, for, you know, the Catholics. R.B. Had anybody said anything to you about doing that? J.B. No. No, well you see I wear a ring intermittently like I'm wearing that one today. R.B. Yes. Well as you waved your hand through the air I saw that ring there you

Source information: (1985-1994), On the edge. Cross, Gillian. Oxford: OUP, 1989, pp. 66-170. 3470 s-units. Expanded context: and thought he was the handsomest boy they had ever seen....' AC4 Day Five -- Thursday 11th August # 6.30am #' Where are you off to?' Joe shot out of the milking house as Jinny came past. Even in wellingtons, he could move as lightly as a squirrel. Jinny looked down guiltily.' Just thought I'd have a walk.' Joe watched her for a second, his long finger delicately turning the gold ring in his ear. Then he shrugged.' You can get in and do the milking. Then I should be able to get the roots hoed before breakfast. That'll put me half a morning ahead, and I could do with that.' It wasn't fair. She had forced herself out of bed especially early, without waking Oz, just so that she could have a spare half-hour or so to take a walk up Back Clough Dale. And here was Joe, brushing her plans Source information: (1985-1994), Minoans: life in Bronze Age Crete. Castleden, Rodney. London: Routledge & Kegan Paul plc, 1993, pp. 68-157. 1498 s-units. Expanded context: of worship and submission. Professor Stylianos Alex-iou reminds us that there were other divine boys who survived from the religion of the pre-Hellenic period -Linos, Plutos, and Dionysos -- so not all the young male deities we see depicted in Minoan works of art are necessarily Velchanos. Jacquetta Hawkes (1968) suggests that perhaps there were once seashore shrines dedicated to a Sea Goddess. If so, they have been washed away by the sea. Nilsson (1949), thinking along the same lines, proposes that there was a Goddess of Navigation. A gold ring from the port of Mochlos shows a goddess sailing on a boat with a shrine apparently built on to the afterdeck (de-leted:figure) conveying a portable shrine from one coastal site to another. The lost' Ring of Minos' similarly showed a priestess steering a shrine-laden boat across a bay (Figure 39). On the rocky shore in the background, no less than three separate shrines or temples were shown, one with a presiding goddess indicating the sacral horns on her altar, and two with sacred trees growing out

Однако коллокация ring round является примером того, как пара сочетающихся слов может ассоциироваться с разными смыслами в разных регистрах. Рассмотрим примеры конкордансов:

Регистр - художественная литература Регистр - научная литература

Source information: (1985-1994), Love over gold. James, Susannah. London: Corgi Books, 1993, pp. 115-290. 4105 s-units. Expanded context: ,though everyone knew that what she was really chasing was the ravaged-looking thriller writer she had met at the launch of his last book and slept with the very same night. Felicity had come out in a severe facial rash and spent the time either screaming or staring fixedly at the paper-knife on her desk.' It's probably that face pack you put on,' Alexandra said.' Write it up.'' I can't do that unless I know for sure, can I?' shrieked Felicity.' They could sue.'' Ring round some of the other magazines and see if the same thing's happened to them,' suggested Alex.' The manufacturers are bound to have sent samples to other people, not just us.'' That's an idea.'' And for heaven's sake give me that paperknife.'' But supposing it hasn't happened to anyone else,' Felicity said.' Supposing I'm the only one?'' Then it could be something you ate, couldn't it? Source information: (1985-1994), Explaining and understanding international relations. Smith, S and Hollis, M. New York: OUP, 1991, pp. 1-113. 1519 s-units. Expanded context: any retreat, as in quantum theory in physics or for the philosophical reasons in the last chapter, is reluctant. But the most obvious fact about the social world is that what happens in it has meaning for the inhabitants. Here are four senses in which this is true and which do not apply to the atoms studied in physics or chemistry, even if biologists might want to use some concept of meaning when thinking about animals. First, people find meaning in their experience. Here we should distinguish between signs and symbols. When we say that a ring round the moon means rain, we refer to a connection in nature. A ring round the moon is a natural sign of or evidence of rain to come, just as a paw print in the dust is a sign that an animal has passed by. When we say that a flag at half-mast means that someone has died, we refer to a social convention that death shall be marked in this way. Natural signs and social symbols might seem to form a continuum, marked by the presence of

Как видно из приведенных примеров, в художественной литературе пара ring round используется в значении глагола «окружать», а в научной литературе - в значении словосочетания по схеме «имя существительное с предлогом» «кольцо вокруг».

Таблица 3 - Взаимная оценка для коллокатов слова ring

Коллокаты Процент от всех вхождений коллоката со словом ring Взаимная оценка

Левые коллокаты

'Il 0.28 5.34

wedding 4.41 9.31

engagement 4.77 9.42

inner 1.10 7.30

gold 0.54 6.27

outer 1.35 7.60

Правые коллокаты

me 0.11 3.98

road 0.48 6.11

him 0.07 3.41

back 0.07 3.26

round 0.12 4.13

electrodes 1.66 7.90

laser 0.30 5.43

Важнейшим типом парадигматических отношений в лексике являются семантические, а соответствующие им объединения слов по значению - на основе их тесной взаимосвязи и взаимозависимости в содержательном плане, на основе той или иной связи обозначаемых ими понятий - занимают первостепенное место в анализе лексики. В таблице 3 представлена информация о взаимных оценках для колло-катов (The Mutual Information score for the collocates). Как правило, оценка в 3,0 единицы [8] или выше показывает семантическую связь в паре.

В целом Британский национальный корпус, сформированный на основе разнообразных источников, обладает огромными возможностями для использования его в исследовательской работе: исследователь-филолог или человек, изучающий язык, может увидеть многообразие употребления английских слов (нами была рассмотрена одна из наиболее часто используемых лексем - ring), причем в самых различных областях человеческой жизни.

Однако корпус, созданный 19 лет назад, статичен и не способен указать на текущее состояние языка. Поэтому для человека, который не имеет достаточных языковых навыков, корпус станет неудобным тем, что потребует от него невероятных интеллектуальных усилий, чтобы растолковать слова или выражения из обрывков текстов. При изучении языка для общения на бытовом уровне представляется более удобным обратиться к словарю, чем выполнять трудоёмкие манипуляции по интерпретации контекстов. В связи с этим, корпусные технологии, имея несомненные преимущества, тем не менее пока не могут претендовать на то, чтобы стать новой парадигмой обучения английскому языку или его исследования.

Список литературы:

1. Плунгян В.А. Почему современная лингвистика должна быть лингвистикой корпусов [Электронный ресурс]. - Режим доступа: http://www.polit.ru/lectures/2009/10/23/corpus/html

2. Чернякова Т.А. Использование лингвистического корпуса в обучении иностранному языку // Язык и культура. - 2011. - № 4. - С. 127-132.

3. Сысоев П.В. Лингвистический корпус в методике обучения иностранным языкам // Язык и культура. - 2010. - №1. - С. 99-111.

4. Евстигнеев М.Н. Структура ИКТ-компетентности учителя иностранного языка // Язык и культура. - 2011. - №1 (13). - С. 119-125.

5. Захаров В.П. Корпусная лингвистика: учебно-метод. пособие. - СПб., 2005. - 48 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6. British National Corpus [Electronic resource]. - URL: http://www.natcorp.ox.ac.uk/

7. BYU-BNC British National Corpus [Electronic resource]. - URL: http://corpus.byu.edu/bnc/

8. BYU-BNC British National Corpus. Mutual Information [Electronic resource]. - URL: http://corpus.byu.edu/MutualInformation.asp

i Надоели баннеры? Вы всегда можете отключить рекламу.