Научная статья на тему 'Использование лингвистического корпуса в обучении языку'

Использование лингвистического корпуса в обучении языку Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
272
47
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Academy
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Использование лингвистического корпуса в обучении языку»

ФИЛОЛОГИЧЕСКИЕ НАУКИ

ИСПОЛЬЗОВАНИЕ ЛИНГВИСТИЧЕСКОГО КОРПУСА В ОБУЧЕНИИ ЯЗЫКУ

1 2 3

Раупова Л.Р. , Сайфуллаева Р.Р. , Хамраева Х.Х. , Зарипбоева Н.М.4

1 Раупова Лайло Рахимовна - доктор филологических наук, профессор, кафедра теории искусства, Ташкентский государственный университет узбекского языка и литературы;

2Сайфуллаева Раъно Рауфовна - доктор филологических наук, профессор, кафедра узбекского языка и литературы, Национальный университет Узбекистана;

3Хамраева Хулкар Хамидуллаевна - кандидат филологических наук, кафедра теории искусства, Ташкентский государственный университет узбекского языка и литературы;

4Зарипбоева Нафосат Маратовна - студент, факультет дошкольного образования и психологии, Университет Пучон, Ташкент, Республика Узбекистан

На протяжении многих столетий причиной войн между странами являлось непонимание культуры, религии, традиций. Современное цивилизованное общество требует от нас достаточного уровня владения механизмами межкультурной коммуникации.

Процесс информационной глобализации все более заметен в мировом сообществе. Уровень информационно-технологического развития влияет на состояние экономики, качество жизни людей, национальную безопасность и роль государства в мировом сообществе. Процесс информатизации также коснулся и системы образования. В настоящее время основная задача в данной области - это улучшение качества учебного процесса и применение современных информационных технологий для повышения уровня образования. Одним из таких примеров является Интернет. Глобальная сеть сегодня занимает около 50% межличностного общения. А ведь именно оно является целью обучения [1. С. 122]. Общаясь, человек должен уметь понимать представленную информацию, эффективно и понятно строить свою речь. Не менее важно уметь извлекать нужную информацию из прочитанного или услышанного. Каждая речь, письменная или устная, должна находиться в рамках культурных традиций данного общества. Трудно представить, что деловая статья, написанная без учета этих параметров, может быть воспринята серьезно. Следовательно, успех межъязыкового общения напрямую зависит от уровня сформированности иноязычной коммуникативной компетенции [2. С. 83].

Таким образом, проблема обучения эффективной речи остается актуальной в современном образовании. Существует много подходов к решению этой проблемы. Некоторые из них решают ее с учетом произошедших изменений в обществе и науке. По мнению П.В. Сысоева [3. С. 175], одним из способов является обучение языку, основанное на традиционной риторической тренировке, или обучение на основе образцов. В связи с тем что изобилие текстов представлено в электронной форме и находится в свободном доступе в Интернете, самым большим корпусом можно считать сам Интернет (Web as Corpus), а средствами доступа к этому корпусу являются поисковые машины, например Google. Корпус - это информационно -справочная система, основанная на собрании текстов на некотором языке в электронной форме. Но тексты в Интернете хаотичны, лингвистически интересный запрос часто сложно или невозможно сформулировать с помощью языка запросов поисковой машины, по результатам поиска нельзя оценить представительность

45

выборки (какие тексты не были выложены в сеть или не были найдены данной поисковой системой) и т.д. [4. С. 92]. По этой причине были созданы национальные лингвистические корпусы. Корпусная лингвистика использует моно- и многоязычные корпусы текстов, которые нередко аннотированы лингвистически значимой информацией, например, о частях речи, леммах, морфологических признаках, синтаксической структуре, семантической интерпретации.

Национальный корпус создается лингвистами (специалистами по так называемой корпусной лингвистике, быстро развивающейся современной области языкознания) для научных исследований и обучения языку. Большинство крупных языков мира уже имеет свои национальные корпуса, различающиеся по полноте и уровню научной обработки текстов. Британский национальный корпус (BNC) является общепризнанным образцом. На него ориентированы многие другие современные корпуса. Национальный корпус имеет две важные особенности. Во-первых, он характеризуется представительностью, или сбалансированным составом текстов. Это означает, что корпус содержит по возможности все типы письменных и устных текстов, представленные в данном языке (художественные разных жанров, публицистические, учебные, научные, деловые, разговорные, диалектные и т.п.), и что все вышеуказанные тексты входят в корпус по возможности пропорционально их доле в языке соответствующего периода. Следует иметь в виду, что хорошая представительность достигается только при значительном объеме корпуса (десятки и сотни миллионов словоупотреблений).

Во-вторых, корпус содержит особую дополнительную информацию о свойствах входящих в него текстов (так называемую разметку, или аннотацию). Разметка - это главная характеристика корпуса. Она отличает корпус от простых коллекций (или «библиотек») текстов, в изобилии представленных в Интернете. Для составителей Национального корпуса такие факторы, как увлекательность или полезность книги, ее высокие художественные или научные достоинства являются важными, но не первостепенными. Национальный корпус, в отличие от электронной библиотеки,- это не собрание «интересных» или «полезных» текстов для изучения языка. А такими могут оказаться, наряду с классическими произведениями художественной литературы, и роман второстепенного писателя, и запись обычного телефонного разговора, и типовой договор аренды и т.п.

Впервые лингвистический корпус был создан в 1960-е гг. в Брауновском университете (США) на машинном носителе. У. Френсис и Г. Кучера спроектировали его как набор из пятисот двух тысячесловных прозаических печатных текстов американского варианта английского языка. Тексты принадлежали пятнадцати наиболее массовым жанрам англоязычной печатной прозы США. Один из авторов, У. Френсис, употребил слово «корпус» в значении «совокупность текстов, считающаяся представительной для данного языка, диалекта или другого подмножества языка, предназначенная для лингвистического анализа». Появление Брауновского лингвистического корпуса в 1963 г. вызвало всеобщий интерес и оживленные дискуссии. Прежде всего, они коснулись принципов отбора текстов и состава потенциально решаемых посредством данного корпуса задач.

Корпус должен с максимальной объективностью представить разнообразие изучаемого явления и в то же время дать объективную картину применения этого явления в речевой практике носителя языка [3. С. 164].

Именно это свойство лингвистического корпуса можно и нужно применять в образовательном процессе при обучении лексики на старшей ступени. Применение лингвистического корпуса при обучении техники перевода тоже немаловажно. Итак, лингвистический корпус - это система текстов, расположенных на машинном источнике и объединенных по различным параметрам (язык, жанр, стиль, отрасль). Программа, которая помогает анализировать большие массивы текстов и выявлять в них закономерность применения лексических единиц, - «конкорданс». Конкорданс

46

осуществляет поиск конкретного словосочетания, слова или грамматического явления в корпусе. После этого открывает в новом окне заданное количество фрагментов текстов, содержащих нужные единицы. На основе полученных сведений можно сделать вывод о функциях, употреблении и применении заданной нами единице в конкретном языковом пространстве.

Национальный корпус предназначен в первую очередь для обеспечения научных исследований лексики и грамматики языка, а также тонких, но непрерывных процессов языковых изменений, происходящих в языке на протяжении сравнительно небольших периодов - от одного до двух столетий. Еще одна функция корпуса -предоставление всевозможных справок, относящихся к указанным областям (лексика, грамматика, акцентология, история языка). Современные компьютерные технологии многократно упрощают и ускоряют процедуры лингвистической обработки больших массивов текстов. Раньше исследователь мог лишь просматривать тексты и вручную выписывать из них нужные примеры; эта предварительная (но абсолютно неизбежная) деятельность была очень трудоемкой и не позволяла обрабатывать большие массивы материала. Теперь ограничений на объем анализируемого материала и скорость поиска информации в нем по существу нет, а это означает, что в распоряжении исследователя оказываются колоссальные массивы текстов самого разного типа. Теперь подлинно научные описания грамматического строя языков, а также авторитетные академические словари - практически все без исключения -должны составляться на основе корпусов этих языков. Учет корпусных данных оказывается крайне желательным (если не строго обязательным) и при многих других более специальных научных исследованиях.

Список литературы

1. Баранов А.Н. Автоматизация лингвистических исследований: корпус текстов как лингвистическая проблема // Русистика сегодня, 1998. № 1-2. С. 179-191.

2. Баранов А.Н. Проблема репрезентативности корпуса данных (на примере политической метафорики) // Труды Международного семинара «Диалог - 2001» по компьютерной лингвистике и ее приложениям. Аксаково, 2001.

3. Сысоев П.В. Интегративное обучение грамматике: исследование на материале английского языка // Иностранные языки в школе, 2003. № 6. С. 25-31.

4. Сысоев П.В. Лингвистический корпус в методике обучения иностранным языкам // Язык и культура, 2010. № 1. С. 99-111.

i Надоели баннеры? Вы всегда можете отключить рекламу.