contractual forms and others. Revealed the importance of elective courses in the possibility to contribute in-depth ecological and geographical knowledge of specialists of economic profile to make better decisions in economic activity.
Key words: continuity, principles of environmental education, ecological and geographical knowledge, environmental consciousness, geography, ecology, economy, course selection, university, industries.
Original article submitted 09.10.2015; revision submitted 16.10.2015
Il'gizar T. Gaisin, Doctor of Pedagogical Sciences, Professor of the Department of Theory and Methodology of Geographical and Environmental Education.
Renat I. Gaisin, Ph.D., Assistant Professor of the Department of Theory and Methodology of Geography and Environmental Education.
Svetlana I. Beketova, Ph.D., Assistant professor of the Department of Theory and Methodology of Geography and Environmental Education.
УДК 378.14
СТАТИСТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ТЕСТИРОВАНИЯ СТУДЕНТОВ
Ю.В. Гуменникова1, Е.Н. Рябинова2, Р.Н. Черницына3
Самарский государственный университет путей сообщения 443066, г. Самара, Первый Безымянный переулок, 18 E-mail: gumennikuv@yandex.ru
2Самарский государственный технический университет 443100, г. Самара, ул. Молодогвардейская, 244 E-mail: eryabinova@mail.ru
3Самарский государственный университет путей сообщения 443066, г. Самара, Первый Безымянный переулок, 18 E-mail: y-abc@mail.ru
Приводится статистическая обработка результатов тестирования студентов, участвующих в эксперименте, проводимом кафедрой высшей математике в Самарском государственном университете путей сообщения, поскольку полученные в результате тестирования данные (коэффициенты усвоения учебной информации), которые принимаются за случайные величины, представляют собой множество чисел, в которых трудно выявить какую-либо закономерность их изменения (варьирования). Построенный интервальный вариационный ряд, вычисленные наиболее важные числовые характеристики случайной величины - выборочная средняя (среднее арифметическое значение признака выборочной совокупности), выборочная дисперсия (среднее арифметическое квадратов отклонений наблюдаемых значений признака от их средних значений) и выборочное среднее квадратическое отклонение дали возможность построить гистограмму относительных частот - ступенчатую фигуру, состоящую из прямоугольников,
Юлия Валериевна Гуменникова, кандидат физико-математических наук, доцент кафедры «Высшая математика».
Елена Николаевна Рябинова, доктор педагогических наук, профессор кафедры «Высшая математика и прикладная информатика».
РузиляНябиулловна Черницына, старший преподаватель кафедры «Высшая математика».
основаниями которых служат частичные интервалы, а высоты равны плотности относительной частоты. Площадь гистограммы равна сумме всех относительных частот, т.е. единице. Соединив соседние середины верхних сторон прямоугольников гистограммы отрезками прямых, получили ломаную линию, называемую линией эмпирической плотности. По виду линии эмпирической плотности выдвинута статистическая гипотеза о нормальном законе распределения случайной величины. Для проверки выдвинутой гипотезы использовался один из критериев согласия - специально подобранная случайная величина, точное или приближенное распределение которой известно. Критерий Пирсона %2, состоящий в сравнении эмпирических и теоретических частот, попадает в «область принятия гипотезы», следовательно, рассматриваемая случайная величина подчинена нормальному закону распределения. Это дает возможность определить его неизвестные параметры, оценить неизвестное математическое ожидание (среднее значение коэффициента усвоения учебной информации) с помощью найденной по данным выборки выборочной средней. Оценка вероятности попадания случайной величины в интервал научения, характеризующий недостаточность в усвоении учебного материала, позволяет сделать вывод, что примерно 30 % студентов будут нуждаться в дополнительной самообразовательной деятельности для достижения удовлетворительного формирования инвариантной самообразовательной компетентности. Подбор нормальной кривой распределения позволяет также построить шкалу успешности обучения, то есть практически реализовать стандартные оценки.
Ключевые слова: самообразовательная компетентность, самообразовательная деятельность, выборочное среднее, математическое ожидание, выборочная дисперсия, гистограмма относительных частот, функция распределения, гипотеза, доверительный интервал, шкала успешности обучения, шкала процентилей, Х-шкала, балльная шкала.
Опытно-экспериментальные исследования в педагогике часто являются единственным способом подтверждения эффективности той или иной новой методики по сравнению с уже известной, т.к. отсутствие аксиоматики и адекватного формального аппарата не позволяют сделать однозначного вывода о преимуществе одной методики перед другой [1].
Анализ педагогических исследований последнего времени показывает, что при осознании необходимости использования статистических методов они тем не менее либо не используются вообще, либо часто используются некорректно [2]. Так, в большинстве работ нет никаких упоминаний об измерении и обработке экспериментальных данных.
В данной работе проводится статистическая обработка результатов применения модели адаптивной профессиональной подготовки [3], ориентированной на приспособление системы обучения к индивидуальным особенностям обучающихся. Изложенные в работе методы математической статистики позволяют получить количественную оценку качества усвоения учебного материала. С этой целью построен интервальный вариационный ряд, вычислены числовые характеристики, построены гистограмма относительных частот и линии эмпирической и теоретической плотности, сформулирована и подтверждена гипотеза о виде закона распределения, вычислены доверительные интервалы для определения неизвестного математического ожидания, рассчитан необходимый объем ресурса внешней поддержки, построена шкала успешности обучения.
Эффективность технологии организации самообразовательной деятельности студентов исследуется с помощью эксперимента, проведенного преподавателями кафедры «Высшая математика» в Самарском государственном университете путей сообщения (СамГУПС) в 2013-2015 учебных годах. В нем приняли участие 338 сту-
дентов СамГУПСа, специальностей «Строительство железных дорог (СЖД)» и «Экономика (Э)», которых распределили на две группы - экспериментальную и контрольную. В экспериментальную вошли группы СЖД 31, СЖД 32, Э 31, Э 32, Э 41, Э 42 общим количеством 170 человек; в контрольную - СЖД 33, СЖД 34, Э 33, Э 34, Э 43, Э 44 общим количеством 168 человек. Случайность распределения студентов по учебным группам обеспечивает репрезентативность (представительность) выборки. При этом экспериментальная и контрольная группы были сравнимы по основным показателям равенства начальных условий, что показал первоначальный тест, составленный в рамках школьной программы. По завершению эксперимента с использованием учебно-методических пособий [4, 5] в экспериментальной группе было проведено контрольное тестирование. Его результаты представляют собой выборку объемом 170 элементов. В качестве случайной величины Х (СВХ), примем коэффициент усвоения учебной информации отдельным студентом К у [3-5]
Ку = N, КУ е[0;1]
где Ыпр - количество правильно выполненных учебных элементов теста, N - общее
количество учебных элементов в тесте. Введем следующие обозначения:
п = 170 - количество студентов в экспериментальной группе (объем выборки); xi - значение Ку (варианта);
П - величина, показывающая сколько раз появлялось данное значение х{ в выборке (частота варианты);
п
wi = — - относительная частота варианты; п
— - размах варьирования СВХ;
— = Хтах — хшт = 1 •
И = — - шаг интервала, где к - целое число, обозначающее количество к
частичных интервалов, к = 10 , И = 0,1.
wl
--плотность частоты.
И
Полученные в результате тестирования данные (коэффициенты Ку)
представляют собой множество чисел, в которых трудно выявить какую-либо закономерность их изменения (варьирования), поэтому данные подвергают статистической обработке [6-13]. Строим интервальный вариационный ряд, т. е. ранжированной совокупности вариант х{, разбитой на частичные интервалы с шагом
И = 0,1 ставим в соответствие их частоты п{, относительные частоты wi и плотности
wi
частот — (табл. 1).
И
Интервальный ряд распределения
Таблица 1
х 0-0,1 0,1-0,2 0,2-0,3 0,3-,04 0,4-0,5 0,5-0,6 0,6-0,7 0,7-0,8 0,8-0,9 0,9-1
п. 0 0 1 1 3 10 23 61 47 24
0 0 0,006 0,006 0,018 0,059 0,135 0,359 0,276 0,141
Ч И 0 0 0,06 0,06 0,18 0,59 1,35 3,59 2,76 1,41
х 0,05 0,15 0,25 0,35 0,45 0,55 0,65 0,75 0,85 0,95
В последней строке этой таблицы приведены значения величины х. - середины частичных интервалов \х.; хг+1 ]
х=х+х+1
2
необходимые для дальнейших вычислений.
Вычислим наиболее важные числовые характеристики СВХ - выборочную среднюю хв (среднее арифметическое значение признака выборочной совокупности), выборочную дисперсию Ов (среднее арифметическое квадратов отклонений наблюдаемых значений признака от их средних значений хв ) и выборочное среднее квадратическое отклонение ( по формулам:
в
к
Ех. • п.
' ' 130 9
х = -=130,9 = 0,77;
в п 170
Е(х - хв}■ п 2672
Д = -= 2672 = 0,0157;
в п 170
(в =л/А = 0,125.
Построим гистограмму относительных частот - ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы
Г -1 УУ.
\xi; хг+1 ] длиной И, а высоты равны плотности относительной частоты — . Заметим,
И
что площадь гистограммы равна сумме всех относительных частот, т.е. единице. Соединив соседние середины верхних сторон прямоугольников гистограммы отрезками прямых, получим ломаную линию, называемую линией эмпирической плотности/*(х) (рис. 1).
По виду линии эмпирической плотности выдвигаем статистическую гипотезу о законе распределения СВХ.
Н0: СВХ подчинена нормальному закону распределения с плотностью распределения
-(х-хв )2
1 2
/(х) = —= • е 2(2
(V 2р
Построим линию теоретической плотности / (х) по следующим точкам:
/шах (Хв ) = Г~- = „ . - , - , = 3,195 ;
ТЫ 2р 0,125 • 2,506
/пер(хв ±(в) = = 0с = 1,942;
(ТЫ 2ле 0,125 • 4,118
-,2
— (1—0,077)
/(1) =-1--е 201252 = 0,604.
0,125 • 2,506
Для проверки выдвинутой гипотезы Но используем один из критериев согласия - специально подобранную случайную величину, точное или приближенное распределение которой известно. Воспользуемся критерием Пирсона С, состоящим в сравнении эмпирических и теоретических частот. Теоретические частоты вычислим по известному алгоритму.
1. Нормируем СВХ, т. е. переходим к величине
7 = ,
вычисляем концы интервалов
Т
7 = xi хв ; 7 = xi+l хв
Т Т
А 1 \ 1Г
1 1 1
2 /Г._____
\ / / Г
/ / 1 / \
/ \ ^
К
0.05 0,15 0,25 0,35 0.45 0,55- 0.65 О,ТЕ- 0.Е5 0,95 1.05 1,15 1,25
Рис. 1. 1 - гистограмма относительных частот, 2 - линия эмпирической плотности / (х) . 3 - линия теоретической плотности распределения / (х)
2. Теоретические вероятности р. попадания СВХ в интервал (х.; х.+1) определим по формуле
р.0 = Ф(1М) -Ф(Х),
где
1 2 -— Ф(2) = -= [ е" 2 йх;
Ф(Х) - функция Лапласа, находится по таблице [3; 5; 13]. 3. Находим искомые теоретические частоты п.0:
п0 = п • р.0.
Результаты наблюдений п. и вычислений п.0 после объединения интервалов с частотами п1 < 5 приведены в табл. 2.
Таблица 2
Эмпирические и теоретические частоты
1 2 3 4 5
п. 15 23 61 47 24
14,773 34,136 52,207 43,52 25,364
Вычислим наблюдаемое значение критерия у
У =
/С набл
Е (п. - п0)
2:
набл ' 2
п
где S - число интервалов в табл. 2.
Ул = 5,468.
Критическое значение критерия укр находим по таблице «Критические точки распределения у2» [3; 5; 13], задаваясь уровнем значимости а = 0,01. Уровень
значимости - это вероятность ошибки 1-го рода, т. е. вероятность того, что верная гипотеза будет отвергнута. Число степеней свободы к вычислим по формуле
к = 8 -1 - г,
где г - число параметров предлагаемого распределения, для нормального закона их два: выборочная средняя хв и выборочное среднее квадратическое отклонение (в . Итак, к = 5 -1 - 2 = 2.
Укр (к ,а) =Ур (2;0,01) = 9,2.
Таким образом, получаем неравенство
2 2 Унабл Укр ,
т. е. вычисленное значение критерия попадает в «область принятия гипотезы», следовательно, гипотеза Н 0 : «СВХ подчинена нормальному закону распределения» принимается.
Вообще для определения закона распределения нужно располагать достаточно обширным статистическим материалом, порядка нескольких сотен отчетов
(наблюдений) [14]. Мы же пока имеем дело со статистическим материалом ограниченного объема - 170 наблюдений, однако, поскольку гипотеза о нормальном распределении подтверждена, можно определить его неизвестные параметры, например, оценить неизвестное математическое ожидание а (среднее значение коэффициента усвоения Ку) с помощью найденной по данным выборки выборочной
средней хв. Очевидно, что чем меньше разница d между ними, тем точнее определен неизвестный параметр.
\a — хв | < d, где d > 0 - точность оценки.
Методы математической статистики не позволяют категорически утверждать, что а попадает в интервал (хв — d, хв + d) , называемый доверительным интервалом, можно лишь говорить о вероятности g, с которой это неравенство выполняется. g -надежность оценки, задается наперед, числом, близким к единице. Выберем g = 0,95 . Для нормального закона распределения имеем
p(х — a <d) = 2ф1
s
заменив Х на хв, s на —j=, получаем
4n
p( хв—a <d)=2Ф
s
■■ 2Ф(г).
В нашем случае Ф($) = 0,475. По таблице значений функции Лапласа [11, 14, 15] находим ^ = 1,96 и точность оценки
d = ^ = 0,019.
Ш
Т. к. хв = 0,77, то доверительный интервал имеет вид (0,751; 0,789), т. е. в 95
случаях из 100 средний коэффициент усвоения Ку попадает в этот интервал.
Подбор нормальной кривой распределения N хв ,Ов) позволяет также построить шкалу успешности обучения, т. е. практически реализовать стандартные оценки [16]. Оценим вероятность попадания СВХ в интервал научения Ку [0; 0,7),
характеризующий недостаточность в усвоении предложенной учебной информации. На этом этапе студент требует постоянного внимания преподавателя, т. е. ему необходима внешняя поддержка в виде дополнительных учебных заданий и консультаций. По известной формуле вероятность попадания СВХ в заданный интервал для нормального распределения вычисляется следующим образом:
Гь-хг} /а-х л
s.
— Ф
в
s
P(a < х <ß) = Ф
V J V ~в
где а = 0; ß = 0,7; хв = 0,77 , se = 0,125 .
P = 0,2977 » 30%.
Учитывая полученный результат, можно сделать вывод, что примерно 30 % студентов будут нуждаться в дополнительной самообразовательной деятельности для достижения удовлетворительного формирования инвариантной самообразовательной компете нтно сти.
Аналогичным образом можно определить вероятность попадания Ку в любой интервал (xi; xi+1). Так, для совокупности значений СВХ, попавших в интервал хв ± 3ов, такая вероятность равна 0,9973 (правило трех сигм). Можно оценить подобную вероятность и для интервалов хв ± 2ов и хв ±Ое (рис. 2).
0,9973
_3О - 2л _О 0,77 + О + 2л + 3О
Рис. 2. Вероятность попадания Ку в интервалы хв ± 3ов, хв ± 2ов и хв ±Ов
0,1
Классы
16 30
70
99
Шкала
1 1 1 1111111 1 10 20 40 60 1 и 1 1 80 90 98 процентилеи
(шкала 1)
Р0,1 Р25 Р|50 Р75 Р99,9 2-шкала
3,0 1 -2,0 -1,0 0 +1,0 +2,0 +3,0 (шкала 2)
1 1 1 2 3 4 5
0 0,387 0,5 0,613 1 шкала 3
Рис. 3. Шкалы и их соотношение
2
Использование стандартных оценок и единичного нормального распределения М(0,1) позволяет вычислить не только общий процент случаев, приходящихся на соответствующий интервал, но и определить, на сколько отстоит любое значение
СВХ от хв. Для этого используем шкалу процентилей - равноинтервальную шкалу, в которой интервалы группируются по принципу равенства накопленных частот, и 2-шкалу, позволяющую отнести каждого обучаемого в один из четырех непересекающихся классов оценок с вероятностью 0,25, для чего весь интервал (0,1) разбивается на подинтервалы (0; 0,387], (0,387; 0,5], (0,5; 0,613], (0,613; 1], границы которых соответствуют процентилям Р0,ь Р25 , Р50 , Р75 , Р99,9 (шкалы 1 и 2 на рис. 3).
Для качественной интерпретации стандартных показателей шкалы отнесем каждого обучающегося в один из непересекающихся классов 2-оценок - класс 2, класс 3, класс 4 и класс 5 (шкала 3 на рис. 3). Таким образом, знание закона распределения СВХ позволяет в дальнейшем проводить группировку объектов по 2-шкале с последующим переходом к балльной шкале, где все объекты исследуемой группы отнесены к конкретному классу оценок.
СПИСОК ЛИТЕРАТУРЫ
1. Ительсон Л.Б. Математические и кибернетические методы в педагогике. - М.: Просвещение, 1964. - 268 с.
2. Новиков Д.А. Статистические методы в педагогических исследованиях. - М.: М3 -Пресс, 2004. - 67 с.
3. Рябинова Е.Н. Адаптивная система персонифицированной профессиональной подготовки студентов технических вузов. - М.: Машиностроение, 2009. - 258 с.
4. Рябинова Е.Н., Черницына Р.Н. Организация самообразовательной деятельности студентов при изучении кривых второго порядка. - Самара: СамГУПС, Порто-принт, 2014. - 204 с.
5. Курушина С.Е. Формирование самообразовательных компетенций студентов при изучении матриц: Учеб-метод. пособие / С.Е. Курушина, В.П. Кузнецов, Е.Н. Рябинова, Р.Н. Черницына. - 2-е изд., испр. - Самара: СамГУПС, 2015. - 159 с.
6. Ащепкова Л.Я. Материалы к семинару по обработке результатов тестирования / Региональный центр проблем качества при ДВГУ - Владивосток, 2001.
7. Айвазян С.А., Мхитарян В.С. Прикладная статистика в задачах и упражнениях. - М.: ЮНИТИ, 2001. - 270 С.
8. Гласс Дж., Стенли Дж. Статистические методы в педагогике и психологии. - М.: Прогресс, 1976. - 496 с.
9. Грабарь М.И., Краснянская К.А. Применение математической статистики в педагогических исследованиях: Непараметрические методы. - М.: Педагогика, 1997. - 136 с.
10. Сидоренко Е.В. Методы математической обработки в психологии. - СПб.: Речь, 2007. -350 с.
11. Справочник по прикладной статистике. В 2 т. Т. 2 / Пер. с англ. под. ред. Э. Ллойда, У Ледермана, С. А. Айвазяна, Ю.Н. Тюрина. - М.: Финансы и статистика, 1990. - 526 с.
12. Суходольский Г.В. Математико-психологические модели деятельности. - СПб.: Петрополис, 1994. - 64 с.
13. Суходольский Г.В. Основы математической статистики для психологов. - Л.: ЛГУ, 1972. -428 с.
14. Вентцель Е.С. Теория вероятностей и математическая статистика. - М.: Наука, Физма-тгиз, 1969. - 579 с.
15. Гмурман В.Е. Теория вероятностей и математическая статистика. - М.: Высшая школа, 2003. - 479 с.
16. Михеев В.И. Моделирование и методы измерений в педагогике. - Эдиториал УРСС, 2010. - 224 с.
Поступила в редакцию 17.10.2015; в окончательном варианте 24.10.2015
UDC 378.14
STATISTICAL PROCESSING OF RESULTS OF TESTING OF STUDENTS
Yu. V. Gumennikova1, E.N. Ryabinova2, R.N. Chernitsina3
1,3 Samara State University of Railways
18, First Unnamed lane, Samara, 443066
E-mail: gumennikuv@yandex.ru
E-mail: y-abc@mail.ru
2 Samara State Technical University
244, Molodogvardejskaya str., Samara, 443100
E-mail: eryabinova@mail.ru
Provides statistical analysis of the results of testing of students involved in the experiment conducted by the Department of Higher Mathematics at the Samara State University of Railways, since the resulting test data (rates of assimilation of educational information), which are taken as random variables are a set of numbers, which is difficult to detect any pattern of change (variation). Built interval variation series calculated the most important numerical characteristics of random variable - the sample mean (arithmetic mean value of the flag of sample), the sample variance (the arithmetic average of the squared deviations of the observed values of the trait from their average values) and sample standard deviation was given the opportunity to build a histogram of relative frequencies - a stepped shape consisting of rectangles whose bases are partial intervals, and the height equal to the density of the relative frequency. The area of the histogram is equal to the sum of all the relative frequencies, ie, unit. Combining adjacent mid-upper side of the rectangle of the histogram line segments, we received a broken line, called line empirical density. By type of line empiric density statistic put forward the hypothesis of normal distribution of the random variable. To test this hypothesis using one of the criteria for approval - a specially selected random variable, exact
or approximate distribution, is known. Pearson C , which consists in comparing empirical and theoretical frequencies falls into the "region of acceptance of the hypothesis ", is therefore considered a random variable subject to the normal distribution law. This makes it possible to determine its unknown parameters to estimate the unknown expectation (average rate of assimilation of educational information) found using a sample according to the sample average. Assessment of the probability that a random value within the range of learning, characterized by a deficiency in the assimilation of educational material, leads to the conclusion that about 30% of students will require more self-educational activity to achieve a satisfactory invariant form of self-competence. Selection of the normal distribution curve also allows you to build a scale of success of training, that is practiced standard estimates.
Key words: of self-competence, self-educational activity, the sample mean, expectation, sample variance, histogram of relative frequency distribution function, the hypothesis, the confidence interval, the scale of the success of training, the scale of percentiles, Z-scale point scale.
Original article submitted 17.10.2015; revision submitted 24.10.2015
Yulia V. Gumennikova, Candidate of Physical and Mathematical Sciences, Associate Professor of the Department of Higher Mathematics.
Elena N. Ryabinova, Doctor of Pedagogical Sciences (P.D.), Professor, Chair of the Department of Higher Mathematics and Applied Informatics.
Ruzilya N. Chernitsina, Senior Teacher, Chair of the Department of Higher mathematics.