Научная статья на тему 'ПУТИ ПОВЫШЕНИЯ ВАЛИДНОСТИ И ПОВТОРЯЕМОСТИ ЭКСПЕРИМЕНТАЛЬНЫХ ПЕДАГОГИЧЕСКИХ ИССЛЕДОВАНИЙ'

ПУТИ ПОВЫШЕНИЯ ВАЛИДНОСТИ И ПОВТОРЯЕМОСТИ ЭКСПЕРИМЕНТАЛЬНЫХ ПЕДАГОГИЧЕСКИХ ИССЛЕДОВАНИЙ Текст научной статьи по специальности «Науки об образовании»

CC BY
177
15
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПЕДАГОГИЧЕСКИЙ ЭКСПЕРИМЕНТ / НЕПАРАМЕТРИЧЕСКИЕ ВЫБОРКИ / ДИЗАЙН ЭКСПЕРИМЕНТА / ВАЛИДНОСТЬ ЭКСПЕРИМЕНТА / ПОВТОРЯЕМОСТЬ ЭКСПЕРИМЕНТА

Аннотация научной статьи по наукам об образовании, автор научной работы — Абитов Р.Н.

Актуальность статьи обусловлена необходимостью совершенствования математико-статистического аппарата как основного инструмента доказательства педагогических гипотез. Целью статьи является выявление путей повышения валидности и повторяемости экспериментальных педагогических исследований. Автором проведен разбор педагогических диссертаций на предмет критического анализа их экспериментальной части. Выявлен ряд проблем экспериментальной части диссертационных исследований связанных с: неправильным использованием мер центральной тенденции и методов сравнения выборок, использованием ранговых шкал уровней компетенции без проверки доверительных интервалов, отсутствием проверки достоверности однородности выборок в начальном этапе эксперимента. Предложен ряд путей решения этих проблем с помощью: использования непараметрических статистических критериев; комплексного представления параметров выборки (медиана, квартили, процентили); деления мультимодальных выборок; использования психофизического закона Вебера-Фехнера для ранговых шкал; использования непараметрических критериев Уилкоксона и Манна-Уитни, вместо критерия Хи-квадрат. Даны авторские рекомендации для планирования и реализации педагогического эксперимента. Статья может быть интересна педагогам-исследователям а также аспирантам педагогических специальностей.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON THE WAYS TO INCREASE THE VALIDITY AND REPEATABILITY OF EXPERIMENTAL PEDAGOGICAL RESEARCH

The relevance of the article lies in the need for improving the statistical apparatus as the main means of proving pedagogical hypotheses. The purpose of the article is to identify ways of increasing the validity and repeatability of experimental pedagogical studies. The author examined pedagogical theses for a critical analysis of their experimental part. A number of problems of the experimental part of the theses were revealed: the improper use of central tendency measures and methods for comparing samples, the use of ranking scales of competence levels without verification of confidence intervals, the lack of verification of uniformity of samples in the initial stage of the experiment. A number of solutions to these problems are proposed to implement in the pedagogical research: the use of non -parametric statistical criteria; a comprehensive presentation of the sample parameters (median, rent, percentiles); division of multimodal samples; use of the psycho-physical law of Weber-Fechner for rank scales; use of Wilcoxon’s non-parametric and Mann-Whitney tests instead of Chi-square criterion. Recommendations on the proper the design of the experiment are given. The article might be interesting to educators, as well as doctorate students of pedagogical specialties.

Текст научной работы на тему «ПУТИ ПОВЫШЕНИЯ ВАЛИДНОСТИ И ПОВТОРЯЕМОСТИ ЭКСПЕРИМЕНТАЛЬНЫХ ПЕДАГОГИЧЕСКИХ ИССЛЕДОВАНИЙ»

Общие вопросы педагогики

УДК 37.012.4

Пути повышения валидности и повторяемости экспериментальных педагогических исследований

On the ways to increase the validity and repeatability of experimental pedagogical research

Абитов Р.Н., Казанский государственный архитектурно-строительный университет, rouslan.abitov@gmail.com

Abitov R., Kazan state university of architecture and engineering, rouslan.abitov@gmail.com DOI: 10.51379/KPJ.2022.154.4.009

Ключевые слова: педагогический эксперимент, непараметрические выборки, дизайн эксперимента, валидность эксперимента, повторяемость эксперимента.

Keywords: pedagogical experiment, non-parametric samples, experimental design, experimental validity, experimental repeatability.

Аннотация. Актуальность статьи обусловлена необходимостью совершенствования математико-статистического аппарата как основного инструмента доказательства педагогических гипотез. Целью статьи является выявление путей повышения валидности и повторяемости экспериментальных педагогических исследований. Автором проведен разбор педагогических диссертаций на предмет критического анализа их экспериментальной части. Выявлен ряд проблем экспериментальной части диссертационных исследований связанных с: неправильным использованием мер центральной тенденции и методов сравнения выборок, использованием ранговых шкал уровней компетенции без проверки доверительных интервалов, отсутствием проверки достоверности однородности выборок в начальном этапе эксперимента. Предложен ряд путей решения этих проблем с помощью: использования непараметрических статистических критериев; комплексного представления параметров выборки (медиана, квартили, процентили); деления мультимодальных выборок; использования психофизического закона Вебера-Фехнера для ранговых шкал; использования непараметрических критериев Уилкоксона и Манна-Уитни, вместо критерия Хи-квадрат. Даны авторские рекомендации для планирования и реализации педагогического эксперимента. Статья может быть интересна педагогам-исследователям а также аспирантам педагогических специальностей.

Abstract. The relevance of the article lies in the need for improving the statistical apparatus as the main means of proving pedagogical hypotheses. The purpose of the article is to identify ways of increasing the validity and repeatability of experimental pedagogical studies. The author examined pedagogical theses for a critical analysis of their experimental part. A number ofproblems of the experimental part of the theses were revealed: the improper use of central tendency measures and methods for comparing samples, the use of ranking scales of competence levels without verification of confidence intervals, the lack of verification of uniformity of samples in the initial stage of the experiment. A number of solutions to these problems are proposed to implement in the pedagogical research: the use of non -parametric statistical criteria; a comprehensive presentation of the sample parameters (median, rent, percentiles); division of multimodal samples; use of the psycho-physical law of Weber-Fechner for rank scales; use of Wilcoxon's non-parametric and Mann-Whitney tests instead of Chi-square criterion. Recommendations on the proper the design of the experiment are given. The article might be interesting to educators, as well as doctorate students of pedagogical specialties.

Введение. Педагогика всегда опиралась на математический аппарат как один из инструментов доказательств ее гипотез. Педагогика как научная дисциплина призвана

снабжать практику достоверными результатами реализации технологий, которые должны работать на практике. Не секрет, что многие «рецепты» проведения эксперимента были

унаследованы педагогикой из других общественных наук:

- выбор размера контрольной и экспериментальной выборок с использованием определенных статистических методов определения, зависящих от размера «эффекта», который мы хотим измерить;

- соблюдение «принципа единственного различия» т.е. равенства всех условий эксперимента между сравниваемыми выборками, за исключением измеряемых показателей; правильный выбор единиц измерения;

- методы статистической проверки достоверности различия между выборками.

Однако вместе с вышеупомянутыми правилами проведения эксперимента, педагогика унаследовала также и ряд таковых, которые на первый взгляд кажутся валидными, однако не учитывают особенности педагогических исследований при применении полученных данных на практике[1;2;5-8]. К этим особенностям, прежде всего, относятся:

- трудность получения параметрической выборки на всех этапах эксперимента, особенно в среде высшего образования, где уже был проведен положительный отбор испытуемых при поступлении в вуз, и распределение имеет высокую вероятность асимметричного смещения выборок;

- частая мультимодальность педагогических выборок ввиду разного уровня базовой подготовки;

- малые выборки по сравнению с другими дисциплинами, где статистика является основным инструментом доказательства научных гипотез (биология, медицина, социология, психология);

- ориентация на оценку качества, то есть гарантированного результата педагогической

технологии, а не только на статистически достоверный сдвиг выборки;

- необходимость анализа всего спектра выборки, а не среднего результата.

Цель исследования: выявление путей повышения валидности и повторяемости экспериментальных педагогических

исследований.

Задачи исследования:

- составление списка потенциальных проблем экспериментальной части педагогических исследований;

- подготовка и составление выборки педагогических исследований;

- анализ экспериментальной части диссертационных исследований, дополнение списка потенциальных проблем;

- критический анализ каждой из проблем;

- предложение путей решения, в случаях, если это возможно.

Материалы и методы исследования. Была проанализирована экспериментальная часть всех диссертаций, размещенных в открытом доступе, и защищенных в период с 1.06.2021 по 31.08.2021 по педагогическим специальностям. Всего диссертаций — 89; из них защищенные в советах, подчиненных ВАК Минобрнауки — 85; в советах, самостоятельно присуждающих степени — 4. Диссертации без эксперимента не рассматривались. Каждая диссертация могла содержать одну или несколько проблем одновременно.

Результаты исследования. Давайте проанализируем каждую из этих проблем и предложим оптимальные решения по большинству из них, см. таблицу 1.

Проблема экспериментальной обработки данных Количество вхождений % вхождений

Нет замечаний к экспериментальной части диссертации 18 20,2

Нет упоминания, какая мера центральной тенденции используется 3 3,5

Явное указание использования среднего арифметического без проверки нормальности распределения и/или от явно несимметричной выборки 4 4,7

Использование Критерия Стьюдента без проверки на нормальность распределения и/или проверки на однородность стандартного отклонения выборок 4 4,7

Авторская ранговая шкала без проверки на достоверность разницы предложенных рангов (хотя бы в пределах 95% доверительного интервала) 49 57

Нет проверки достоверности разницы/однородности между выборками на начальном и финальном этапах эксперимента как внутри выборок, так и между контрольной и экспериментальной выборками 39 45,3

Таблица 1. -Распределение проблем педагогических исследований

Нет упоминания, какая мера центральной тенденции используется

Не самая распространенная погрешность описания результатов исследования (3,5% вхождений). Данная погрешность исходит, вероятно, из предпосылок, что среднее арифметическое является само собой разумеющимся показателем характеристики выборки, либо простой оплошностью исследователя.

Явное указание использования среднего арифметического без проверки нормальности

распределения и/или от явно несимметричной выборки

Проблемой здесь является то, что среднее арифметическое теряет смысл, если вычисляется от асимметричного распределения [4, с.72]. Использование показателя среднего

арифметического как основной характеристики асимметричного распределения также может представить педагогическое исследование в невыгодном свете, так как разница средних в типичном результате «визуально» проигрывает разнице медиан, см. рисунок 1.

Распределение в начале эксперимента

Исследуемый

показатель (компетенция)

Рисунок 1. -Разница мер центральной тенденции распределений в начале и в конце эксперимента

Куда более адекватными характеристиками несимметричного распределения можно было бы назвать моду (самый часто встречаемый показатель), либо медиану (делит площадь плотности распределения ровно пополам). Однако в педагогических исследованиях необходимо отходить от представления лишь одного показателя меры центральной тенденции и переходить на стандарты анализа данных, принятых в психологии, медицине, биологии.

Например, если на всех этапах педагогического эксперимента достоверно определяется нормальность распределения (важно, чтобы под этот критерий подходили и контрольная и экспериментальная выборки на начальном и финальном этапе эксперимента), то необходимо представлять не только сам показатель среднего арифметического, но также и

показатель стандартного отклонения, из которого легко вычисляется доверительный интервал.

В случае если любая из выборок не проходит проверку на нормальность распределения необходимо комплексно использовать такие показатели как:

- пятый процентиль выборки (как минимум 95% испытуемых достигает этого уровня компетенции);

- нижний квартиль выборки (как минимум 75% испытуемых достигает этого уровня компетенции);

- медиана (как минимум половина испытуемых достигают этого уровня компетенции);

- среднее арифметическое (в асимметричной выборке этот показатель сам по себе ничего не значит, однако позволяет понять в

какую сторону и насколько сильно смещена асимметрия распределения);

- верхний квартиль выборки (как минимум 25% испытуемых достигает этого уровня компетенции);

- девяносто пятый процентиль выборки (как минимум 5% испытуемых достигает этого уровня компетенции).

- межквартильный и межпроцентильный размах (разница между нижним и верхним квартилями, а также разница между пятым и девяносто пятым процентилем).

На рисунке 2 представлены гипотетические результаты педагогического эксперимента с непараметрическими выборками в виде диаграмм «боксплот» или «ящик и с усами» и их интерпретация. На начальном этапе контрольная и экспериментальная выборки имеют идентичные характеристики. На правой части рисунка 2 мы наблюдаем значительное различие между контрольной и экспериментальной выборками, которое следует проверять непараметрическими тестами (и-критерий Манна-Уитни для независимых выборок, Т-критерий Уилкоксона внутри выборок). Однако педагогу-исследователю не следует останавливаться на

доказательстве альтернативной или нулевой статистической гипотезы.

Первое, на что стоит обратить внимание на — смещение медианы относительно среднего арифметического; смещение медианы выше относительно среднего говорит о положительной динамике освоения учебного материала гораздо лучше, чем сравнение мер центральной тенденции.

Также следует обратить особенное внимание на показатели нижнего квартиля и пятого процентиля, поскольку эти показатели определяют качество подготовки обучаемого. Можно представить себе гипотетическую ситуацию, когда выборки проходят проверку на достоверность разницы средних и медиан, и эта разница довольно солидная, при этом существует достаточно большая группа «отстающих» и за счет высокого результата «отличников» это отставание нивелируется. Подобная ситуация приводит к тому, что проверяемая педагогическая гипотеза применима лишь к «средним» и «успевающим», но не к «отстающим». «Провисание» нижнего квартиля и пятого процентиля «вниз» поможет легко обнаружить подобную ситуацию.

Рисунок 2. -Графическое представление гипотетических результатов педагогического

эксперимента и их интерпретация

Как уже говорилось ранее, мультимодальные выборки являются отражением разного уровня базовой подготовки испытуемых, что может

косвенно подтверждаться однородностью контрольных и экспериментальных

мультимодальных выборок на начальном этапе

эксперимента — то есть выборки, будучи таковыми, проходят статистическую проверку на однородность. Тем не менее, даже комплексный тип анализа, описанный выше (медиана, квартили, смещение среднего), не будет отражать характеристики выборки.

В таком случае имеет смысл разделить одну мультимодальную на несколько выборок, см. рисунок 3. Однако при использовании такого метода у исследователя возникнет ряд проблем:

- сокращение выборок приведет к уменьшению «мощности» критериев сравнения

выборок и ошибкам второго рода при проверке статистических гипотез;

- потеря результатов, находящихся между модами (заштрихованная часть рисунка 3, и, следовательно, еще большее увеличение вероятности ошибок второго рода;

- в настоящий момент не существует какой-либо конвенциональной методики деления мультимодальной выборки на несколько маленьких;

- отсутствие понимания каким образом можно подвести результаты нескольких выборок под «общий знаменатель».

Наиболее острой, по мнению автора, является проблема отсутствия методики разделения мультимодальной выборки на несколько отдельных. Решению данной проблемы автор посвятит следующие публикации.

Что касается обобщения результатов, педагогам-исследователям следует воздержаться от использования среднего арифметического. В

таблице 2 представлено сравнение использования среднего арифметического и среднего геометрического в качестве обобщающего показателя для различных выборок гипотетического исследования. Здесь мы можем видеть, что среднее геометрическое адекватнее отражает вклад прироста слабой выборки, чьи результаты возросли в 15 раз.

Таблица 2. - Сравнение среднего арифметического и среднего геометрического как обобщающих показателей

Начальный этап, баллы Финальный этап, баллы Прирост, %

Слабая выборка 1 15 1500

Сильная выборка 10 15 150

Среднее арифметическое 5,5 15 273

Среднее геометрическое 3,2 15 474

Следует оговориться, что доказательство статистической достоверности разницы нужно производить в каждой выборке отдельно, ввиду того, что тестов значимости разницы средних

геометрических не существует. Даже наличие подобного теста мало что изменило бы, поскольку в этом случае сравнивались бы средние из средних, что сокращает выборку до

минимума (по сути обобщающие средние становятся индивидуальными результатами).

Использование Критерия Стьюдента без проверки на нормальность распределения и/или проверки на однородность стандартного отклонения выборок

Критерий Стьюдента предъявляет довольно строгие требования к выборкам: все сравниваемые выборки должны достоверно принадлежать нормальному распределению; все сравниваемые выборки должны иметь достоверно идентичные стандартные отклонения [3]. В случае несоблюдения этих условий результаты проверки на достоверность разницы между выборками все еще остаются валидными, однако вырастает вероятность ошибки второго рода (ложное принятие Н0-гипотезы), и возрастает она тем больше, чем больше вероятность непринадлежности выборок к нормальному распределению.

Авторская ранговая шкала без проверки на достоверность разницы предложенных рангов

Самая распространенная особенность педагогических исследований (57% вхождений). Чаще всего она представлена в виде трех рангов

(высокий, средний и низкий уровни) измеряемых компетенций, при этом для рангов (уровней компетенции) даются вербальные дескрипторы. Довольно часто в педагогических исследованиях интервал этих уровней, выраженный в количественных переменных (баллах, % от выполненных заданий и т.д.), не имеет под собой каких либо математических обоснований. Например, являются ли границы уровня доверительным интервалом вероятности зависимости конкретного показателя

педагогической компетенции. В таком случае для достоверного применения подобной шкалы необходимо было бы произвести экспертную оценку всей исследуемой выборки, где использовался бы доверительный интервал (95% или 99%) в качестве «определителя» границ уровней компетенции, что сильно усложняет методику исследования, так как, помимо «солидной» выборки исследуемых для статистически достоверного определения уровня необходимо также и выборка экспертов, позволяющая определить необходимый доверительный интервал, см. рисунок 4.

Рисунок 4. - Схема определения уровней компетенции с помощью метода экспертных оценок

Поэтому, для того чтобы облегчить задачу деления на уровни, можно использовать метод определения уровней без экспертных оценок. Для этого можно воспользоваться психофизическим законом Вебера-Фехнера [9]:

(1)

, где

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8 - субъективная величина ощущения;

I - величина (интенсивность) раздражителя (стимула);

К и С - константы.

Данный эмпирический закон устанавливает взаимосвязь между интенсивностью

раздражителя и его восприятием. Закон утверждает, что более высокий уровень восприятия достигается, если уровень раздражителя кратно больше на величину основания натурального логарифма. Для

адекватного представления уровней необходим первичный показатель в виде количественной переменной со шкалой от 0 до 100 баллов, которая будет основываться на сложности заданий. В целях создания такой шкалы можно использовать показатель сложности,

вычисленный по модели Г. Раша [10], который представляет из себя:

(2)

, где

5i - уровень сложности задания;

X - средняя доля правильных ответов задания.

Найдя уровень сложности каждого задания, мы теперь можем представить математическое обоснование для весов баллов каждого конкретного задания по следующей формуле, где экспонента уровня сложности конкретного задания делится на сумму экспонент уровней сложности всех заданий:

(3)

, где

Р; - долевой вес задания

- уровень сложности задания. Суммируя веса тестовых заданий в баллах, мы получаем стобалльную шкалу, в которой максимальный результат отражает успешное

выполнение всех заданий; нулевой результат — невыполнение всех заданий; промежуточный результат — успешное выполнение одного или нескольких заданий. При этом вес каждого задания в баллах прямо пропорционален его сложности, рассчитанной по формуле 2.

На рисунке 5 представлены два варианта уровневых шкал, построенных на основе закона Вебера-Фехнера. Левая шкала рисунка 4 описывает классическую трехуровневую ранговую шкалу. Формула справа от нее определяет верхний порог каждого уровня (Ь — верхний порог уровня в баллах, п — номер уровня). На левой шкале мы видим, что каждый более высокий уровень больше предыдущего приблизительно в 2,7 раза, т.е. кратно основанию натурального логарифма. Правая шкала, вместе с формулой определения верхнего порога уровней, является более дробным вариантом левой, для случаев, когда педагогу-исследователю необходимо более точное определение движения испытуемых по уровням компетенции, либо для случаев, когда испытуемые в основной массе не достигают высоких или низких уровней. Нулевой уровень (выделен штриховкой на обеих шкалах); где разница между уровнями уже довольна мала, и их порог не может адекватно округляться до целочисленных значений; может использоваться педагогом-исследователем либо как зона погрешности измерений, либо как результаты, принадлежащие первому уровню.

Рисунок 5. - Схема определения уровней логарифмической шкалы

Ранговая шкала также имеет еще один недостаток. На рисунке 6 продемонстрировано два варианта, каким образом гипотетически одинаковый финальный результат может быть достигнут разными путями. В варианте 1 изменения затронули и низкий, и средний уровни — 30 испытуемых повысили свой уровень с

низкого до среднего; такое же количество повысило свой уровень со среднего до высокого. В варианте 2 же изменения затронули лишь низкий уровень, при этом 30 испытуемых достигли высокого уровня. Тем не менее эти два варианта имеют идентичный конечный результат.

Рисунок 6. -Разные пути получения идентичного результата на финальном этапе эксперимента

Предлагается два пути решения различения этих двух ситуаций:

- использование одного или нескольких промежуточных этапов измерения, для более точного определения движения внутри выборки;

- использование Т-критерия Уилкоксона и и-критерия Манна-Уитни, вместо критерия подобияX ■

Второй способ представляется наиболее оптимальным, поскольку не предполагает промежуточных измерений, которых следует избегать ввиду того, что чем чаще проводятся измерения испытуемых, тем больше возникает эффект «натренированности на задание» (аналогия «эффекта наблюдателя» в физике), который вносит искажение в результат. Однако для проверки выборок необходимо совершить определенные манипуляции с данными. На рисунке 7 схематически описано, каким образом

нужно конвертировать результаты, подходящие для проверки критерием X', в подходящие для проверки критериями Уилкоксона и Манна-Уитни. Поскольку уровни компетенции являются рангами — необходимо конвертировать номинативные переменные в ранговые. Например, 8 наблюдений низкого уровня нужно превратить в 8 переменных с показателем «1»; 4 наблюдения среднего уровня — в 4 переменные с показателем «2»; одно наблюдение — в переменную с результатом «3» и т.д.

Таблица 3 показывает, что использование критерия Уилкоксона позволяет уловить разницу между вариантами изменения внутри выборки рисунка 6, поскольку критерий %2 направлен на сравнение подобия, в то время как Т-критерий Уилкоксона и и-критерий Манна-Уитни сравнивают сдвиг всех результатов внутри выборки (4,9-10-15 против 2,3-10-8).

Рисунок 7. -Конверсия номинативной шкалы в ранговую для проведения непараметрических тестов Таблица 3. - Сравнение критерия х2 и Т-критерия Уилкоксона

Сравниваемые выборки р-показатели значимости разницы

Критерий х2 Т-критерий Уилкоксона

начальный этап эскперимента/конечный этап эксперимента (вариант 1) 8,3-10-7 4,9-10-15

начальный этап эскперимента/конечный этап эксперимента (вариант 2) 8,3-10-7 2,3-10-8

Нет проверки достоверности

разницы/однородности между выборками на начальном и финальном этапах эксперимента как внутри, так и между контрольной и экспериментальной выборками

Очень важный, но, тем не менее, часто игнорируемый аспект педагогического исследования (45,3% вхождений), тесно связанный с соблюдением принципа единственного различия, сообразно которому в эксперименте могут проверяться либо статистически однородные выборки на разных педагогических технологиях, либо одна технология на статистически гетерогенных выборках. Рисунок 8 показывает 3 возможных варианта исхода эксперимента.

I вариант представляет собой случай, когда контрольная и экспериментальная выборки являются достоверно однородными в начале эксперимента (верна нулевая статистическая гипотеза) и достоверно различающимися в конце эксперимента (верна альтернативная

статистическая гипотеза), что является

идеальным исходом для педагогического эксперимента, поскольку экспериментальная педагогическая технология достоверно показала лучшую эффективность. II вариант представляет собой случай, когда контрольная и экспериментальная выборки являются достоверно однородными в начале и конце эксперимента (верна нулевая статистическая гипотеза в обоих случаях). В III варианте рассматривается случай, когда экспериментальная и контрольная выборки имеют достоверные различия уже на начальном этапе эксперимента. В подобном случае финальные результаты эксперимента при проверке разных педагогических технологий не имеют практического смысла, поскольку нарушается принцип единственного различия. Поэтому педагогам-исследователям

рекомендуется проверять первоначальные выборки на однородность, и показатель вероятности однородности выборок при этом должен быть относительно высоким (р>0,8), а не минимально достоверным (р>0,05).

Рисунок 8. -Вариантырезультатов эксперимента в контрольной и экспериментальной группах

Заключение.

- Меры центральной тенденции как основные и единственные характеристики выборки дают слабое представление об эффективности педагогических технологий. В то время как комплексное представление выборки (среднее арифметическое, медиана, квартили, 5-й и 95-й процентили) позволяют всеобъемлюще анализировать «движение» внутри выборки, не ориентируясь только на успеваемость «среднестатистического» испытуемого.

- В случае мультимодальности имеет смысл разделить большую выборку на несколько малых, ориентируясь на моды как меры центральной тенденции. Общепринятых методов деления мультимодальных выборок не существует, однако автор посвятит данной проблеме следующие публикации.

- По мнению автора, следует с осторожностью использовать шкалы, основанные на вербальных дескрипторах рангов, поскольку

это влечет за собой использование метода экспертных оценок с солидной выборкой экспертов. Наиболее оптимальным способом деления выборки на ранги является использование логистической шкалы сложности тестового задания (по Г. Рашу), и дальнейшее ее деление на уровни сообразно психофизическому закону Вебера-Фехнера.

- Использование критерия X для сравнения ранговых шкал влечет за собой потерю информации о внутреннем движении элементов выборки. Для преодоления этого ограничения предлагается использовать критерий Уилкоксона и критерий Манна-Уитни.

- По мнению автора, всегда следует проверять контрольную и экспериментальные выборки в начале эксперимента на однородность, в противном случае возникает риск того, что результаты эксперимента не будут иметь практического смысла.

Результаты исследования могут быть использованы при планировании и осуществлении педагогического эксперимента. Предлагаемые автором рекомендации позволят: более точно выявлять закономерности изменений

внутри выборки; повысить валидность и повторяемость исследований; избежать наиболее часто повторяющихся ошибок использования математического аппарата, как главного инструмента доказательной педагогики.

Литература:

1. Донской А.Г. Применение метода метаанализа в гуманитарных и педагогических исследованиях / А.Г. Донской [и др.] // Вестник Томского государственного педагогического университета. - 2021. - № 5(217). - С. 78-89.

2. Ибрагимов Г.И. Эксперимент в педагогических исследованиях: проблемы и перспективы / Г.И. Ибрагимов // Казанский педагогический журнал. -2004. - № 1. - С. 3-11.

3. Корнеев А., Кричевец А. Условия применимости критериев Стъюдента и Манна-Уитни / А. Корнеев, А. Кричевец // Психологический журнал. - 2011. - № 1(32). - С. 97-110.

4. Реброва О. Описание статистического анализа данных в оригинальных статьях. Типичные ошибки / О. Реброва // Журнал неврологии и психиатрии им. С.С. Корсакова. - 2010. - № 11(110). - С. 71-74.

5. Сластенин В. Некоторые проблемы педагогических исследований / В. Сластенин // Сибирский педагогический журнал. - 2006. - № 1. - C. 25-35.

6. Яковлев Е.В. Педагогический эксперимент: квалиметрический аспект: монография / Е.В. Яковлев. - Челябинск: Издательство ЧГПУ, 1998. - 136 с.

7. Яковлев Е.В., Яковлева Н.О. Педагогический эксперимент в диссертационных исследованиях / Е.В. Яковлев, Н.О. Яковлева // Современная высшая школа: инновационный аспект. - 2011. - № 1. - C. 52-63.

8. Croll P. Statistical inference in educational research // Educational Research. - 1984. - № 3(26). - C. 217-219.

9. Fechner G. T. Elemente der psychophysik / G. T. Fechner, Breitkopf u. Hartel, 1860.

10. Rasch G. An item analysis which takes individual differences into account // British journal of mathematical and statistical psychology. - 1966. - № 1(19). - C. 49-57.

References:

1. Donskoy A.G. Application of the meta-analysis method in humanitarian and pedagogical research / A.G. Donskoy [and etc.] // Bulletin of the Tomsk State Pedagogical University. - 2021. - № 5(217). - C. 78-89.

2. Ibragimov G.I. Experiment in pedagogical research: problems and perspectives / G.I. Ibragimov // Kazan Pedagogical Journal. - 2004. - № 1. - C. 3-11.

3. Korneev A., Krichevets A. Conditions for the applicability of Student and Mann-Whitney criteria / A. Korneev, A. Krichevets // Psychological journal. - 2011. -№ 1(32). - C. 97-110.

4. Rebrova O. Description of statistical data analysis in original articles. Typical mistakes / O. Rebrova // Journal of Neurology and Psychiatry named after S.S. Korsakov. -2010. - № 11(110). - C. 71-74.

5. Slastenin V. Some problems of pedagogical research

/ V. Slastenin // Siberian Pedagogical Journal. - 2006. 1. - C. 25-35.

6. Yakovlev E.V. Pedagogical experiment: qualimetric aspect: monograph / E.V. Yakovlev. - Chelyabinsk: ChGPU Publishing House, 1998. - 136 p.

7. Yakovlev E.V., Yakovleva N.O. Pedagogical experiment in dissertation research / E.V. Yakovlev, N.O. Yakovleva // Modern Higher School: Innovative Aspect. -2011. - № 1. - C. 52-63.

8. Croll P. Statistical inference in educational research // Educational Research. - 1984. - № 3 (26). - C. 217-219.

9. Fechner G. T. Elemente der psychophysik / G. T. Fechner, Breitkopf u. Hartel, 1860.

10. Rasch G. An item analysis which takes individual differences into account // British journal of mathematical and statistical psychology. - 1966. - № 1 (19). - C. 49-57.

5.8.1. Общая педагогика, история педагогики и образования (13.00.01 - Общая педагогика, история педагогики и образования)

Сведения об авторе:

Абитов Руслан Назилович (г. Казань, Россия), кандидат педагогических наук, доцент кафедры иностранных языков ФГБОУ ВО Казанский государственный архитектурно-строительный университет, e-mail: rouslan.abitov@gmail.com

i Надоели баннеры? Вы всегда можете отключить рекламу.