Научная статья на тему 'Квантитативные и качественные методы исследования в прикладной лингвистике'

Квантитативные и качественные методы исследования в прикладной лингвистике Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
22691
1969
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КАЧЕСТВЕННЫЕ И КОЛИЧЕСТВЕННЫЕ МЕТОДЫ / ДИСКУРС / МНОГОФАКТОРНЫЙ АНАЛИЗ / QUALITATIVE AND QUANTITATIVE METHODS / DISCOURSE / MULTIFACTOR ANALYSIS

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Кащеева Анна Владимировна

В статье рассматриваются понятие квантитативных методов, различия между квантитативными и качественными методами, виды квантитативных методов и их применение в лингвистике, а также предлагаются пути использования квантитативных методов в методике преподавания иностранных языков.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

QUANTITATIVE AND QUALITATIVE METHODS OF RESEARCH IN APPLIED LINGUISTICS

The article deals with the notion of quantitative methods, the differences between quantitative and qualitative methods and the ways they are used in linguistics and language teaching.

Текст научной работы на тему «Квантитативные и качественные методы исследования в прикладной лингвистике»

СОВРЕМЕННАЯ ЛИНГВИСТИКА И ЛИТЕРАТУРОВЕДЕНИЕ

КВАНТИТАТИВНЫЕ И КАЧЕСТВЕННЫЕ МЕТОДЫ ИССЛЕДОВАНИЯ

В ПРИКЛАДНОЙ ЛИНГВИСТИКЕ

А. В. КАЩЕЕВА

В статье рассматриваются понятие квантитативных методов, различия между квантитативными и качественными методами, виды квантитативных методов и их применение в лингвистике, а также предлагаются пути использования квантитативных методов в методике преподавания иностранных языков.

Ключевые слова: качественные и количественные методы, дискурс, многофакторный анализ.

История возникновения квантитативных методов в науке относится к началу XX в., когда естественнонаучные и социальные исследования прибегали к количественным подсчетам. К середине XX в. наблюдалось преобладание статистических методов над другими способами количественной обработки данных, хотя все методы назывались количественными. Постепенно квантитативные методы в науке нашли свою нишу, и в настоящее время достаточно большое количество исследователей видят принципиальную разницу между качественными и квантитативными (количественными) методами.

Квантитативными называют статистические методы, такие, например, как дисперсионный анализ и нормальное распределение, кластерный и факторный анализ, регрессионно-корреляционный анализ. Отличительной особенностью квантитативных методов является то, что сбор данных происходит еще до начала процедуры самого исследования. В исследуемом явлении выделяются параметры, подлежащие измерению, которые называются переменными. При этом исследователь не может с точностью определить степень важности той или иной переменной для исследуемого явления. Возможно после использования квантитативного метода в ходе анализа выяснится, что одна или несколько переменных не влияют совсем или влияют в малой степени на общую характеристику исследуемого объекта, а другие являются определяющими. Все полученные в ходе сбора данных количественные показатели оформляются в виде матрицы, которая затем исследуется с помощью одного или нескольких статистических методов. По результатам статистических ис-

следований проводится интерпретационный анализ полученных данных.

Поскольку любое исследование направлено на изучение содержания объекта и его внутренней структуры, то понятно в этой связи образное определение, данное Золтаном Дерньеи [2]. Автор называет квантитативные методы «смыслом в цифрах» (meaning in numbers), подразумевая, что качественные характеристики объекта имеют цифровое выражение не только в единичном ряду, но и во взаимосвязи.

Существуют определенные различия между квантитативными и качественными методами (quantitative vs. qualitative) [2]. Качественные исследования в большей степени подразумевают сбор данных, результатом которого являются нецифровые результаты и анализ с помощью нестатистических методов. К ним можно отнести исследования изображений, письменных текстов или записей устных текстов, в ходе которых исследователь пытается выявить единый общий смысл. В лингвистике примерами качественных методов могут служить конверсационный и этнографический анализ.

Квантитативные методы означают работу с матрицей цифровых данных, анализируемую с помощью статистических законов. Объектом исследования также может являться текст, однако в числовом выражении данные квантитативного анализа однозначны, а интерпретировать результаты можно только с точки зрения обозримых закономерностей.

Тем не менее, есть мнение о том, что оба подхода есть не что иное, как разные способы сбора данных [5]. Другое видение заключается в том,

что различают квантитативные и качественные и смешанные методы. Последние означают использование обоих подходов на разных стадиях исследования: стадии сбора данных и стадии анализа.

Различая два подхода, можно назвать следующие особенности их проявления в исследовательской парадигме [2].

Относительно категоризации квантитативный подход означает предопределенную систему категорий в цифровом выражении, в то время как качественный допускает подвижные вербальные категории.

Если говорить об учете индивидуальных проявлений исследуемых объектов, то справедливо утверждать, что для этого больше подходят качественные методы, потому что квантитативные в большей степени описывают стандартизованные образцы и средние величины.

Помимо этого, стоит учитывать, на что опирается исследователь, прибегая к тому или иному подходу. Используя квантитативные методы, он опирается на формализованную систему статистики и математических формул. Качественный подход в большей степени задействует природную интуицию исследователя [2]. Очевидно, что система, лежащая в основе каждого из подходов, свидетельствует в пользу большей объективности данных, полученных путем использования квантитативных методов.

Итак, суммируя характеристики квантитативных методов исследования, можно перечислить следующие:

- использование числовых данных (матрицы значений, математические формулы, лежащие в основе статистических процедур);

- использование стандартизованных процедур обработки данных (статистика);

- выделение переменных или категорий исследуемых характеристик объекта до стадии исследования;

- оперирование усредненными показателями для обозначения переменных, практическое игнорирование индивидуальных показателей с крайним значением;

- обобщение на стадии анализа и стремление к выявлению универсальных закономерностей.

На наш взгляд, основным преимуществом квантитативных методов является их точность и однозначность результатов. Точность измерений с большой долей вероятности позволяет подтверждать или опровергать выдвигаемые гипотезы. Этот метод систематичен и легко контролируем, поскольку математический аппарат уже содержится в статистической программе. Кроме того,

процесс подсчета достаточно экономичен по сравнению с подготовкой матрицы, он чаще всего выполнятся на компьютере с помощью пакета 81ай8йса [1]. Эти преимущества значительно расширяют границы использования квантитативных методов.

В то же время, выбор переменных и подсчет значений каждой переменной может занять достаточный промежуток времени. Кроме того, в ряде областей исследования как, например, в лингвистике, полученные данные могут вызвать у исследователя трудность интерпретации. Безусловно и то, что усреднение показателей внутри группы позволяет говорить, в первую очередь, о тенденциях, а не об индивидуальных проявлениях и разнообразии исследуемых явлений.

В настоящее время не существует единой схемы описания исследований, проводимых с помощью квантитативных методов, однако последовательность, представленная З. Дерньеи, кажется нам вполне логичной и универсальной по сравнению с другими видами исследований [2]. Она включает участников эксперимента, материалы или способы, процедуру и анализ данных.

Как правило, количество участников в исследованиях, проводимых с помощью квантитативных методов, достаточно большое. Различают массив и выборку данных. Под массивом подразумевают весь объем исследуемого явления, а выборкой называют ту часть, которая достаточна для получения репрезентативных результатов. Существует практика ограничения минимального количества участников или случаев. Для факторного анализа количество участников или случаев должно быть не менее 100, для корреляционного -не менее 30, а для простого сравнения достаточно и 15, но эти цифры являются относительными. Естественно, чем больше объем выборки, тем достовернее результаты анализа. Так, для исследования текста с помощью нейронных сетей необходимо иметь несколько сотен случаев.

Говоря об исследованиях в области прикладной лингвистики, стоит дополнительно обозначить следующие немаловажные факторы: уровень владения языком, образовательная программа или курс, академическая успеваемость участников, количество обучающихся в группе, время, проведенное в языковой среде.

К материалам относят тексты, анкеты, дидактические материалы. При использовании анкет важно учитывать, проводился ли пилотный опрос, был ли он анонимным, как он был модифицирован. Описание процедуры исследования - это условия проведения измерений, они перекликаются

с предыдущим пунктом. В лингвистических исследованиях важно указать, был ли использован перевод при проведении исследования.

Анализ данных является второй основной фазой исследования. Он позволяет сделать выводы о закономерностях и проблемных вопросах в отношении выдвигаемой гипотезы. Кроме того, он позволяет выделить те переменные, которые не были использованы или коррелируют в большей или меньшей степени с другими переменными.

Популярность квантитативных методов позволила со временем сформироваться направлению в лингвистике, называемому квантитативной лингвистикой (quantitative linguistics). Это одно из направлений прикладной лингвистики, которое занимается изучением языка с помощью статистических методов. Методы, известные в математической статистике, позволяют изучать законы и структуру языка и изменения в системе языка. Примером могут служить законы, по которым изменялся язык в процессе исторического развития или те, которые характеризуют современные тенденции в языке.

Выводы, полученные в результате статистических исследований, могут не только иметь описательный характер, но и оказывать влияние на существующие теории функционирования и развития языка. Конечной целью квантитативной лингвистики является формулирование законов, по которым функционирует язык с помощью математического аппарата. Квантитативная лингвистика чаще всего в настоящее время имеет прикладной характер, не соотнося свои выводы с фундаментальными научными исследованиями.

Методы квантитативной лингвистики применимы к разным системам языка: фонетической, орфографической, лексической и грамматической, однако чаще всего они используются в лексикологии для изучения качественного состава словаря и получении информации о частотности или правильности употребления слов.

Основным объектом, к которому применимы статистические методы, и в котором осуществляется выборка, является текст. Текст разбивается на несколько выборок, каждая длиной в n лингвистических элементов. Цели изучения текста с помощью статистики тоже бывают разными. Например, текст можно исследовать для дешифровки, извлечения информации, которая скрыта в силу того, что язык или письменность неизвестны, что характерно для древних рукописей. Статистика в этом случае помогает установить наиболее устойчивые сочетания языковых единиц и расшифровать языковой код.

Другой целью использования лингвистической статистики для изучения образцов текстов является установление авторства. В этом случае может возникнуть необходимость сравнения нескольких текстов для установления того, который из них принадлежит автору, или определения авторства для каждого из выбранных текстов.

Еще одним примером применения лингвистической статистики в тексте является исследование стилистических особенностей, которые использует автор текста, что можно сделать применительно и к лексике, и к грамматике.

Тем не менее, исследования текста и контекста могут затрагивать и более широкую выборку, такую как языковой корпус - электронную базу данных о случаях использования языка, позволяющую осуществлять выборку в большем массиве на основании разнообразия использования языковых единиц.

На основании закономерностей, выявленных с помощью квантитативных методов, были сформулированы некоторые законы, касающиеся величин и распределения языковых явлений. Законы диверсификации и распределения указывают на то, что частота появления и распределения определенных языковых форм (звуков, слов, слогов, предложений) подчинена законам статистики. В отношении лексики справедлив закон Мартина, согласно которому степень обобщения значения обратно пропорциональна количеству дефиниций слова. Другой закон (Менцерата-Альтмана) затрагивает структурный аспект, согласно ему длина общей конструкции (например, слова) обратно пропорциональна длине ее составляющих (слогов).

Поскольку текст является основным объектом квантитативных исследований в лингвистике, мы решили применить их к письменному дискурсу, продуктом которого является текст. Большинство современных исследований дискурса опираются на традиционные методы анализа, и поэтому правильнее говорить о необходимости применения смешанных методов в исследовании письменного дискурса.

Среди традиционных подходов в исследовании дискурса известны изучение дискурса как диалога или структурных знаний (Cook), изучение контекста, правил когерентности и когезии (Brown and Yule, Celce-Murcia), изучение взаимосвязи дискурс-анализа с преподаванием иностранных языков (McCarthy and Carter, Hatch) [3]. Это лишь некоторые из существующих концептуальных подходов к изучению дискурса, многие из которых подразумевают использование качественных методов на этапе анализа эксперимен-

тальных данных. Очевидно, что квантитативный подход в рамках существующих концепций дискурса является достаточно редким исследовательским методом или отсутствует.

Если проецировать разницу в качественном и квантитативном подходах вообще на анализ дискурса, справедливо заметить, что квантитативный подход позволяет осуществлять надежный, контролируемый, объективный, ориентированный на результат обобщенный анализ групп языковых явлений. Для качественного анализа характерна процедура естественного наблюдения, субъективность результатов, дексриптивность, валидность, широкий диапазон данных [3]. Если принимать во внимание традиционное видение дискурса как процесса или как результата, то очевидно, что квантитативный подход ориентирован на результат, а качественный - на процесс.

По мнению А. Лазаратон, квантитативные методы позволяют определить частотность языковых явлений, а качественные - выявить их причину. Такое деление представляется нам достаточно условным, поскольку многомерный статистический анализ подразумевает исследование внутренних связей объекта, а, следовательно, позволяет выявить структурные взаимосвязи внутри дискурса и описать тенденции взаимодействия различных дискурсивных категорий.

Другая позиция была высказана Д. Ньюнаном относительно критерия контроля в квантитативном и качественном подходах. Он полагает, что разница в выборе подхода состоит в том, чтобы определить, в какой степени необходимы, с одной стороны, избирательность, а с другой - влияние на изучаемый объект [3; 4]. Избирательность означает выбор дискурсивных характеристик, подлежащих анализу. В связи с этим Д.Ньюнан группирует особенности, присущие исследовательским методам, в форме двух оппозиций: «высо-кая-низкая избирательность», «вмешательство/влияние-невмешательство» [4]. Из предлагаемой автором схемы можно сделать вывод о том, что квантитативные методы, к которым из упомянутых можно отнести контроль и измерение, характеризуются высокой степенью избирательности. В свою очередь, качественные методы наблюдения и интервью можно отнести к группе с низкой избирательностью.

В отношении дискурса Д. Ньюнан предлагает дополнительные критерии разделения квантитативного и качественного подходов: способ получения данных (естественный или искусственно созданный), вид дискурса (устный или письменный), единицы анализа (лингвистические или экс-

тралингвистические) [4]. На наш взгляд, выделенные параметры соотносятся со схемой описания квантитативных методов, потому что характеризуют участников, материалы, способы и процедуру исследования.

Говоря о виде дискурса, стоит отметить, что материалом для большинства исследований с помощью квантитативных методов является устный дискурс. Точнее, транскрипции аудиозаписей, выполненные с помощью традиционных правил орфографии, которые далее исследуются с помощь дисперсионного анализа. В частности, в одном из диссертационных исследований квантитативный подход использован в аспекте социолингвистики [3]. Автор анализировала влияние социокультурных факторов на проявление (распределение, дисперсию) языковых вариаций у англоговорящих детей, изучавших испанский язык на протяжении пяти месяцев. В качестве исследовательских методов были выбраны наблюдения, интервью и анкетирование, которые, согласно классификации Д. Ньюнана, можно отнести к группе с низкой избирательностью. В итоге автор пришла к выводу, что особенности иноязычного устного дискурса зависят от переменных говорящего, вида выполняемой им деятельности (учебный или неформальный дискурс), а также цели и содержания задания.

В этом же исследовании автор сочетала разные виды многофакторного анализа, дисперсионный и регрессионный, что позволило выявить пограничные факторы, которые повлияли на распределение величин.

В собственной практике преподавания английского языка мы также предприняли попытку использования квантитативных методов для анализа письменного дискурса. Участниками эксперимента выступили студенты 4 курса института филологии ТГУ имени Г. Р. Державина, профессионально изучающие английский язык четвертый год и владеющие языком на уровне С1. Материалом для квантитативного анализа выступили творческие письменные работы в формате «выразите свое мнение» на тему «Хотели бы Вы, чтобы Ваш ребенок был гениальным?» объемом до 350 слов. Нами анализировался учебный письменный дискурс, созданный студентами на занятиях.

Был выбран первый, один из самых сложных для оценивании критериев оценивания письменных работ - содержание, составной частью которого является соответствие письменной работы заданной теме. Главным показателем полноты и релевантности содержания всегда является лексическое наполнение. Следовательно, в качестве

переменных выступили 10 наиболее частотных слов в каждом из сочинений, выявленных с помощью программы Wordle. Они составили столбцы матрицы. В строках матрицы были указаны случаи, то есть, эссе конкретных студентов.

Посчитав с помощью поисковика Word количество словоупотреблений каждого слова в каждом из случаев, мы получили матрицу. В первоначальном виде она выглядела достаточно громоздкой по горизонтали за счет того, что некоторые из слов, выявленных как наиболее частотные в отдельных сочинениях, не употреблялись в других. Поэтому мы решили удалить те столбцы, которые имели положительное значение только в одной из строк. В результате из анализа были ис-

ключены слова psyche, baby, smart, educate, often, appropriate, hope, world. В конечном виде матрица выглядела следующим образом в программе Sta-tistica [І] (рис. І).

Далее мы осуществили с помощью пакета Statistica факторный анализ матрицы. В первый раз было задано З фактора с вращением исходных данных. В результате в первом факторе наиболее частотными стали слова, выделенные на рисунке 2 красным цветом и те, которые имели факторные нагрузки более 0,5: want, know, happy, talent, special, care, people, every. Второй фактор составили слова gifted, ordinary, ability, kid, child, bring, love. В третьем факторе приобрели больший вес слова life, protect, peer, world, every, view, child.

Рис. 1. Матрица словоупотреблений в программе Statistica

Рис. 2. Факторный анализ матрицы

На основании полученных данных мы можем интерпретировать факторы, повлиявшие на распределение слова таким образом. Вероятно, к первому можно отнести понятия, обозначающие характеристики людей вообще и каждого в отдельности (талантливый, счастливый, особенный) и их потребность в знаниях и заботе.

Второй фактор раскрывает характеристики и способности ребенка. Третий фактор включает бо-

лее обобщенные понятия, он свидетельствует о действиях, которые могут совершаться в отношении ребенка. Назовем условно эти три фактора характеристики людей, характеристики ребенка, взаимосвязь ребенка и общества.

Для уточнения интерпретированных нами трех факторов мы провели дополнительный факторный анализ, ограничив количество факторов двумя (рис. 3).

Рис. 3. Дополнительный факторный анализ

Из рисунка видно, что наиболее частотными являются две группы слов. К первой относятся child, parents, every, happy, talent, special, world, care. Ко второй группе относятся слова happy, kid, know, ability, ordinary, raise, bring, gifted. Интерпретируя полученную информацию, мы пришли к выводу, что первый фактор условно можно назвать фактором «талантливый ребенок в семье и окружающем мире», а второй - «что значит быть талантливым и как этого добиться».

С лингвистической точки зрения факторы выступают в роли концептов, раскрытых в содержании письменных работ. Полученные данные на основе факторного анализа письменных работ студентов по заданной теме позволили говорить о том, что концепты, обозначенные первым и вторым фактором, являлись наиболее типичными. К сожалению, не было зафиксировано многообразия факторов, что может быть свидетельством недостаточной проработки студентами сопутст-

вующих тем. Тем не менее, содержание работ полностью соответствует заявленной теме.

Далее мы приводим результаты кластерного анализа той же матрицы данных, которые позволяют наглядно проследить, какие слова в студенческих работах более всего близки по смыслу и какие группы они образуют (рис. 4). В качестве графика была выбрана вертикальная дендрограмма.

Дендрограмма на рисунке 4 означает, что вверху рисунка находятся наиболее общие классы слов. Поперечные линии показывают, какие классы объединяются по степени близости значений. В нижней части рисунка кубики обозначают самые близкие по сочетаемости слова. Таким образом, можно говорить, что самые крупные классы образуются понятия ми «ребенок», «гений», «родители», «ребенок, его способности, взаимоотношения с другими людьми». Очевидно, что понятие «ребенок» чаще всего выражается только с помощью слова child, в то время как остальные понятия включают более разнообразную лексику.

Интересно, что наиболее типичными явились сочетания слов: society and different; peer and point of view; every, time and ability; special and care; life and protect; know and people, bring and gifted. Они достаточно прозрачно отражают мысли, высказанные в письменных работах в поддержку собственных аргументов. Одновременно сочетание tal-

Приведенные примеры многофакторного анализа письменных работ в группе студентов позволяют сделать наиболее общие выводы в отношении критерия содержания и выявить типичные особенности. В то же время, каждая из работ может быть проанализирована в лексическом плане для более объективного оценивания. Возможен и сравнительный анализ двух работ в том случае, если преподаватель сомневается в объективности оценивания их содержания. Помимо этого, продукт письменного дискурса может быть проанализирован с точки зрения грамматических конструкций, дискурсивных маркеров, типов предложений и использованных приемов когезии текста.

Подводя итог, следует отметить, что квантитативный и качественный подходы в прикладной лингвистике тесно взаимодействуют, при этом каждый из них имеет свои отличительные особенности. Квантитативный подход пока не нашел широкой популярности у исследователей, но име-

ent and happy явилось достаточно необычным. Его можно трактовать как мнение о том, что талант приносит человеку счастье. Итак, анализ дендрограммы позволяет говорить, что все аспекты темы были раскрыты в письменных работах, а также позволяет обобщить аргументы, выдвинутые студентами.

ет неоспоримые преимущества, позволяющие точно сгруппировать данные и объективно оценить результаты исследования с помощью статистических методов. Квантитативный подход может означать использование нескольких методов анализа в рамках одного исследования. К недостаткам данного подхода можно отнести трудоемкость на стадии сбора данных и некоторую субъективность в интерпретации результатов многомерного анализа. В методике преподавания иностранных языков квантитативные методы могут быть полезны для исследования общих и индивидуальных результатов обучения, учебных материалов и эффективности использования разных типов заданий.

Литература

1. Электронный учебник по статистике. URL: http://www.statsoft.ru

14

12

10

Дендрограмма для 29 перемен. Метод одиночной связи Евклидово расстояние

~і--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-1-г-

ct

Ф

гД

Ю

О

о;

о

і—

о

о

05

0_

(Л (Л и

.== С ^

с ф £.

О eg ТЗ ^ Ф

•с

■О

о

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

о

с

^ ф (/)

ф

ф

О ф — .

га то 'о

^ ^ ф ^ ф

^ ф Е =

"Я. > +3 -Q

о ф то

ф

Ф‘0ФФФФФТО

У :т X тт S— — *5..

CL > ^ Я <и -Q о О

(О ~ ±г

и а.

Рис. 4. График результатов кластерного анализа матрицы

в

б

4

2

0

2. Domyei Z. Research Methods in Applied Linguistics. OUP. 2007.

3. Lazaraton A. Quantitative and qualitative approaches to discourse analysis // Annual Review of Applied Linguistics. 2002. № 22.

4. Nunan D. Research Methods in Language Learning. CUP., 1992.

5. Richards L. Handling Qualitative Data: A Practical Guide. London. 2005.

* * *

QUANTITATIVE AND QUALITATIVE METHODS OF RESEARCH IN APPLIED LINGUISTICS

A. V. Kascheyeva

The article deals with the notion of quantitative methods, the differences between quantitative and qualitative methods and the ways they are used in linguistics and language teaching.

Key words: qualitative and quantitative methods, discourse, multifactor analysis.

i Надоели баннеры? Вы всегда можете отключить рекламу.