Научная статья на тему 'Квантитативный анализ лексического охвата, плотности и повторяемости в корпусе учебника английского языка'

Квантитативный анализ лексического охвата, плотности и повторяемости в корпусе учебника английского языка Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
530
87
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОРПУСНЫЙ ПОДХОД / ЯЗЫКОВОЙ КОРПУС / УЧЕБНИК АНГЛИЙСКОГО ЯЗЫКА / ЛЕКСИЧЕСКИЙ ОХВАТ / ЛЕКСИЧЕСКАЯ ПЛОТНОСТЬ / ИНДЕКС ПОВТОРЯЕМОСТИ / CORPUS APPROACH / LANGUAGE CORPUS / TEXTBOOK OF ENGLISH / LEXICAL COVERAGE / LEXICAL DENSITY / RECYCLING INDEX

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Карамнов Антон Сергеевич

В статье рассматривается процедура осуществления лингвистической оценки учебника английского языка с позиций корпусного подхода. Получение и изучение количественных языковых данных позволяет составить представление об охвате частотной лексики и плотности новых слов, а также индексе повторяемости лексики в корпусе учебника.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Quantitative analysis of lexical coverage, density and recycling in an English textbook corpus

The article looks at the framework of the linguistic evaluation of an English textbook from the corpus approach standpoint. Acquiring and analyzing the quantitative language data allows to create a better picture of the lexical coverage, lexical density and recycling index in a textbook corpus.

Текст научной работы на тему «Квантитативный анализ лексического охвата, плотности и повторяемости в корпусе учебника английского языка»

УДК 372.881.111.1

ББК 74.268.1

Карамнов Антон Сергеевич

аспирант

кафедра лингвистики и лингводидактики Институт филологии Тамбовский государственный университет имени Г.Р. Державина

г. Тамбов Karamnov Anton Sergeyevich Post-graduate Department of Linguistics and Linguodidactics Institute of Philology Tambov State University named after G.R. Derzhavin k.a.s.89@mail.ru

Квантитативный анализ лексического охвата, плотности и повторяемости в корпусе учебника английского языка

Quantitative analysis of lexical coverage, density and recycling in an English textbook corpus

В статье рассматривается процедура осуществления лингвистической оценки учебника английского языка с позиций корпусного подхода. Получение и изучение количественных языковых данных позволяет составить представление об охвате частотной лексики и плотности новых слов, а также индексе повторяемости лексики в корпусе учебника.

The article looks at the framework of the linguistic evaluation of an English textbook from the corpus approach standpoint. Acquiring and analyzing the quantitative language data allows to create a better picture of the lexical coverage, lexical density and recycling index in a textbook corpus.

Ключевые слова: корпусный подход, языковой корпус, учебник английского языка, лексический охват, лексическая плотность, индекс повторяемости.

Key words: corpus approach, language corpus, textbook of English, lexical coverage, lexical density, recycling index.

Постановка проблемы. Среди множества образовательных ресурсов, доступных в настоящее время для использования в процессе обучения иностранному языку, учебник не теряет своей актуальности и расценивается как непременный компонент современной образовательной среды.

В связи со столь значительной ролью, которую учебники продолжают играть на занятиях по иностранному языку, возрастают и требования к их качеству. Это подтверждается тем фактом, что экспертиза образовательных ресурсов,

включающих учебники и учебные пособия, относится к наиболее динамически развивающимся областям [4; 5].

Изучение научно-методической литературы показывает, что экспертиза методической, дидактической и психологической стороны учебных изданий довольно эффективна [1; 2]. В то же время оценка непосредственно лингвистической стороны учебных изданий по английскому языку, в основе которой также лежит субъективный анализ, интуиция и профессиональная компетентность авторского коллектива, еще далека от совершенства.

В этом плане могут оказаться полезными инструменты объективного количественного анализа, а именно корпусные технологии, которые позволяют проводить квантитативные исследования на материале больших массивов текста, включая разные уровни языковой системы.

гп /• V-»

1ак, изучение лексической наполненности учебника английского языка на основе корпусного подхода может способствовать получению более объективной языковой картины и служить основанием для модификации содержательного компонента учебного издания.

Терминологический аппарат. Корпусные технологии извлечения и анализа текстовых данных относятся к предметной области корпусной лингвистики, которая изучает язык посредством анализа его фактических аутентичных употреблений. Корпусная лингвистика тесно связана с квантитативной лингвистикой, в русле которой проводятся количественные исследования на материале больших массивов данных. Полученные результаты при этом подвергаются как количественной, так и качественной интерпретации.

Массив текстов различных жанров и стилей, собранный из множества естественных случаев употребления языка, созданный с учетом определенных критериев и хранящийся в электронном виде называется языковым корпусом.

Корпусные менеджеры, то есть программы управления языковым корпусом, позволяет пользователям быстро находить и извлекать требуемую информацию из массива текстовых данных (например, TextLexCompare).

Результативность работы с языковыми корпусами напрямую зависит от степени предварительной обработки их содержания. Такая обработка обычно начинается с процедур токенизации и лемматизации текстового наполнения корпуса. Тогда корпус текстов может анализироваться как совокупность токенов, т.е. отдельно стоящих лексических единиц, или как совокупность типов (types), т.е. неповторяющихся лексических единиц. Другими словами, если в тексте корпуса пять раз встречается слово ‘textbook’ в разных предложениях, оно может расцениваться как пять токенов или один тип.

Содержание и ход исследования. Предметом данного исследования является извлечение и изучения количественных языковых данных на уровне лексики и материале корпуса учебника английского языка.

Исходя из необходимости достижения цели, заключающейся в лингвистической оценке лексической наполненности учебника английского языка, задачи данного исследования включают: а) изучение охвата частотной лексики в корпусе учебника; б) измерение плотности новых слов в корпусе учебника; в) определение индекса повторяемости лексики в корпусе учебника.

Источником фактического материала для создания экспериментального корпуса послужил учебник английского языка 2007 года выпуска для школьников среднего звена общеобразовательных учреждений с начальным уровнем владения языком. Структурно учебник разделен на десять модулей; по сложности он соответствует уровню A1 по общеевропейской шкале.

Подготовительный этап исследования включал в себя процедуру конструирования корпуса Книги для студента УМК по иностранному языку (подробнее см. [3]) и составление референтных списков слов для последующего сравнительного анализа.

Процессуальный этап состоял из последовательности шагов по установлению количественных соответствий между лексическим содержанием обучения, заложенным в учебнике, и выбранными референтными списками слов. В

добавление к этому, сравнительный анализ проводился между частями корпуса учебника, соответствующими лексическому содержанию его модулей.

Источником референтного материала стал список слов BNL (ВШиго§1и-№и£еМ^1в^, который на данный момент является наиболее репрезентативным и сбалансированным перечнем общеупотребительной и академической лексики [6], а также лексическое содержание обучения в соответствии с общеевропейскими уровнями владения английским языком [8].

Заключительный этап исследования был посвящен систематизации и интерпретации полученных данных, подведению итогов и составлению рекомендаций по совершенствованию лексической наполненности учебника.

Результаты исследования. Рассмотрим, какие результаты были получены в ходе количественной оценки корпуса учебника английского языка по трем направлениям анализа: охвату частотной лексики, плотности новых слов и индексу повторяемости лексики.

Для изучения охвата частотной лексики в корпусе учебника английского языка его содержание было сопоставлено с частью списка слов ВМЦ включающей лексику уровня А1. Полученные данные приведены в таблице 1.

Таблица 1. Охват частотной лексики в корпусе учебника

Список слов Число типов в списке слов Имеется в корпусе учебника Отсутствует в корпусе учебника Примеры отсутствующих слов

BNL0 123 106 17 above, himself, somebody, without

BNL1 687 485 202 afraid, bank, church, doctor, poor

BNL2 270 136 134 bottle, cry, glad, fork, loud, wife, zero

BNL3 16 16 0 —

BNL4 7 6 1 Christmas

BNL5 4 2 2 airplane

BNL6 2 0 2 horn, lion

BNL7 28 19 9 cattle, deer, monkey, picnic, vacation

Итого 1137 770 367

Результаты, представленные в таблице, дополнительно разбиты на подуровни ВКЬ0, ВКЫ и т.д. в соответствии с возрастающей степенью сложности лексики в рамках категории А1.

Из таблицы следует, что около70% наиболее частотной лексики находит свое отражение в корпусе учебника. Вместе с тем, имеется некоторый пласт часто употребляемых в речи словарных единиц, которые не были найдены в анализируемом издании. Большую часть таких слов (примеры даны в таблице) составляют единицы подуровней ВКЫ и BNL2, 29,4% и 49,6% соответственно.

Следующее направление анализа - измерение плотности новых слов в корпусе учебника. Для этого используется формула, выражающая отношение неизвестных типов, возникающих в корпусе одного модуля учебника по сравнению с корпусом предыдущих модулей, к уже известным типам.

Так, например, чтобы рассчитать плотность новых слов для пятого модуля, необходимо поделить количество новых типов, которых не встречались ранее в предыдущих модулях, на суммарное количество типов из корпуса первых четырех модулей учебника.

В таблице 2 отмечены полученные результаты для всех модулей учебника, начиная со второго, так как в первом модуле все типы считаются неизвестными, и их не с чем сравнивать.

Таблица 2. Плотность новых слов в корпусе учебника

Модуль учебника I II III IV V VI VII VIII IX X

Число новых типов 274 303 231 228 256 172 322 206 209 167

Показатель плотности новых слов - 1,11 0,40 0,28 0,25 0,13 0,22 0,12 0,10 0,06

Представленные в таблице 2 показатели свидетельствуют о том, что число новых типов в каждом модуле учебника не всегда последовательно отражает приблизительно одинаковую величину, что особенно видно при сопоставлении второго и третьего, пятого, шестого и седьмого модулей. Это, в свою очередь, влияет на показатели плотности новых слов. Коэффициент, приближающийся к нулю, говорит о том, что плотность новых слов в модуле учебника низкая, в то

время как коэффициент, близкий к единице, указывает на высокую концентрацию новых слов по сравнению с предыдущими модулями.

Другим инструментом оценки лексической наполненности книги является определение индекса повторяемости, который выражается в процентах и устанавливается при поочередном сопоставлении содержания корпуса одного модуля учебника с последующим. Формула определения индекса повторяемости выражается отношением общих для двух модулей токенов к числу токенов второго модуля.

В таблице 3 представлен индекс повторяемости лексики для всех модулей учебника, начиная со второго.

Таблица 3. Индекс повторяемости лексики в корпусе учебника

Модуль учебника II III IV V VI VII VIII IX X

Индекс повторяемости лексики, % 46,27 59,52 58,33 60,05 56,87 47,71 55,28 58,40 62,62

Полученные данные в отношении повторяемости лексики в корпусе учебника английского языка варьируются в диапазоне 46-63%. При этом, установленные показатели не отражают последовательного увеличения от одного модуля к другому.

Обсуждение результатов и рекомендации. В направлении изучения охвата частотной лексики в корпусе учебника было выявлено, что учебное издание, которое позиционируется как соответствующее содержанию общеевропейских компетенций владения иностранным языком на уровне А1, покрывает лишь 70% соответствующей лексической выборки.

В направлении измерения плотности новых слов в корпусе учебника было установлено, что концентрация незнакомой лексики от одного модуля к другому показывает резкие колебания показателей, и хотя тенденция к ее снижению прослеживается по мере приближения к последнему модулю, это происходит непоследовательно.

В направлении определения индекса повторяемости лексики в корпусе учебника была обозначена предельная величина, равная 63%. Руководствуясь данными исследований, которые устанавливают оптимальный индекс повторяемости лексики на уровне 95% [7], можно говорить о том, что этот компонент реализован в учебнике в недостаточной степени.

В связи с полученными данными и сделанными выводами могут быть сформулированы рекомендации по:

а) увеличению доли общеупотребительной лексики в корпусе учебника;

б) более тесной интеграции тематики и содержания модулей учебника;

в) сокращению малоупотребительной и редко повторяющейся лексики в пользу увеличения индекса повторяемости.

Заключение. Технологии анализа лексической наполненности учебника английского языка на основе корпусного подхода показывает свою эффективность в изучении охвата частотной лексики, измерении плотности новых слов и определение индекса повторяемости лексики, создавая таким образом условия для более объективной оценки языкового содержания учебной книги.

Библиографический список

1. Арутюнов, А. Р. Теория и практика создания учебника русского языка для иностранцев [Текст] / А. Р. Арутюнов. - М. : Русский язык, 1990. - 168 с.

2. Бим, И. Л. Методика обучения иностранным языкам как наука и теория школьного учебника [Текст] / И. Л. Бим. - М. : Русский язык, 1977. - 288 с.

3. Карамнов, А. С. Модель создания корпуса учебника английского языка [Текст] / А. С. Карамнов // Научный диалог. - 2013. - № 2 (14). - С. 59-69.

4. Крулехт, М. В. Экспертные оценки в образовании [Текст] / М. В. Кру-лехт, И. В. Тельнюк. - М. : Издательский центр «Академия», 2002. - 112 с.

5. Ясвин, В. А. Образовательная среда [Текст] : от моделирования к проектированию / В. А. Ясвин. - М. : Смысл, 2001. - 365 с.

6. Hancioglu, N. Through the looking glass and into the land of lexico-grammar [Text] / N. Hancioglu, S. Neufeld, J. Eldridge // English for Specific Purposes. - 2008. - Vol. 27. - P. 459-479.

7. Laufer, B. What percentage of text-lexis is essential for comprehension? [Text] / B. Laufer // Special language: From humans thinking to thinking machines / Eds. C. Lauren, M. Nordman. - Clevedon: Multilingual Matters, 1989. P. 316-323.

8. Neufeld, S. LexiCLIL [Electronic resource] : a lexical syllabus for the Common European Framework for English / S. Neufeld, J. Eldridge. - Access mode: http://ru.scribd.com/doc/20386024/Common-English-Lexical-Framework.

Bibliography

1. Arutyunov, A. R. Theory and practice of creating a textbook of Russian for foreigners [Text] / A. R. Arutyunov. - M. : Russian language, 1990. - 168 p.

2. Bim, I. L. ELT methodology as a science and theory of the school textbook [Text] / I. L. Bim. - M. : Russian language, 1977. - 288 p.

3. Karamnov, A. S. Model of English textbook corpus creation [Text] / A. S. Karamnov // Scientific dialogue. - 2013. - № 2 (14) : Pedagogics. - P. 59-69.

4. Krulekht, M. V. Expert evaluation in education [Text] / M. V. Krulekht, I. V. Telnyuk. - M. : Publishing centre “Academia”, 2002. - 112 c.

5. Yasvin, V. A. Educational environment [Text] : from modeling to construction / V. A. Yasvin. - M. : Smysl, 2001. - 365 p.

6. Hancioglu, N. Through the looking glass and into the land of lexico-grammar [Text] / N. Hancioglu, S. Neufeld, J. Eldridge // English for Specific Purposes. - 2008. - Vol. 27. - P. 459-479.

7. Laufer, B. What percentage of text-lexis is essential for comprehension? [Text] / B. Laufer // Special language: From humans thinking to thinking machines / Eds. C. Lauren, M. Nordman. - Clevedon: Multilingual Matters, 1989. P. 316-323.

8. Neufeld, S. LexiCLIL [Electronic resource] : a lexical syllabus for the Common European Framework for English / S. Neufeld, J. Eldridge. - Access mode: http://ru.scribd.com/doc/20386024/Common-English-Lexical-Framework.

i Надоели баннеры? Вы всегда можете отключить рекламу.