Научная статья на тему 'Оценка уровня подготовленности и качества измерительных тестовых материалов с помощью интерактивной формы Test_Results'

Оценка уровня подготовленности и качества измерительных тестовых материалов с помощью интерактивной формы Test_Results Текст научной статьи по специальности «Науки об образовании»

CC BY
648
44
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОГНИТИВНАЯ СОСТАВЛЯЮЩАЯ КОМПЕТЕНЦИИ / ОЦЕНКА УРОВНЯ ПОДГОТОВЛЕННОСТИ ОБУЧАЮЩЕГОСЯ / ОЦЕНКА КАЧЕСТВА ТЕСТА / COGNITIVE COMPONENT OF COMPETENCE / ASSESSMENT OF THA STUDENT / TEST QUALITY ASSESSMENT

Аннотация научной статьи по наукам об образовании, автор научной работы — Стариченко Борис Евгеньевич, Гизатуллин Марат Галимянович, Истомина Елена Александровна

В статье обсуждается неправомочность построения заключений о качестве сформированности компетенций на основании измерений с использованием фондов оценочных средств, имеющихся, согласно требованиям ФГОС ВО, в рабочих программах учебных дисциплин. Показано, что реально можно вести речь об оценке уровня сформированности только части когнитивной составляющей компетенции, которая формируется в рамках данной дисциплины. При этом удобным методом измерения является тестирование, а методы оценивания уровня обученности учащихся и статистические характеристики качества тестовых заданий и теста в целом должны строиться на основе классической теории педагогических измерений. Приведено и обосновано обобщение подходов к обработке результатов тестирования классической теории тестов на ситуацию, когда выполнение отдельного тестового задания оценивается не по дихотомической шкале. При этом «классический» вариант получается как предельный случай обобщенного. Подробно изложено описание интерактивной экранной формы Test_Results, разработанной на кафедре информационно-коммуникационных технологий в образовании УрГПУ на основе MS Excel. Представлен пример работы с экранной формой Test_Results, и дана интерпретация полученных результатов обработки. Сформулированы правила, на основании которых преподаватель может сформировать заключение по завершении обработки результатов тестирования. Starichenko Boris Evgenyevich,

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по наукам об образовании , автор научной работы — Стариченко Борис Евгеньевич, Гизатуллин Марат Галимянович, Истомина Елена Александровна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ASSESSMENT OF THE LEVEL OF READINESS AND QUALITY OF TEST MATERIALS USING THE ONLINE FORM TEST_RESULTS

. The article discusses the incompetence of evalution of students’ knowledge by means of the tests which, according to Federal State Educational Standard requirements are included in the programs of disciplines. It is shown that it is really possible to talk about evaluation only of a part of the cognitive component of competence, which is formed in the certain discipline. A convenient method of measurement is a test, while methods for assessment of the level of training of students and statistical characteristics of the quality of the test questions and test as a whole should be based on the classical theory of educational measurement. A generalization of the approaches to the test results processing according to the classical test theory to a situation is provided, where the implementation of a single test task is estimated not on the dichotomous scale. The "classic" version is obtained as a limiting case of the generalized. The description of the interactive screen form Test_Results developed at the Department of Informational and Communicational Technologies in Education of the Ural State Pedagogical University on the basis of MS Excel is given. The example of work with the screen form Test_Results and the interpretation of the results of processing are given. The rules under which the teacher can form an opinion on the completion of the processing of test results are formulated.

Текст научной работы на тему «Оценка уровня подготовленности и качества измерительных тестовых материалов с помощью интерактивной формы Test_Results»

УДК 378.147:378.637

ББК Ч448.902.684.3: Ч448.908 ГРНТИ 14.35.07 Код ВАК 13.00.08

Стариченко Борис Евгеньевич,

доктор педагогических наук, профессор, заведующий кафедрой информационно-коммуникационных технологийв образовании; Уральский государственный педагогический университет; 620017, г. Екатеринбург, пр-т Космонавтов, 26; e-mail: [email protected].

Гизатуллин Марат Галимянович,

кандидат технических наук, доцент кафедры информационного обеспечения органов внутренних дел, Уральский юридический институт МВД России; 620057, г. Екатеринбург, ул. Корепина, 66; e-mail: [email protected].

Истомина Елена Александровна,

методист лаборатории инновационных образовательных технологий, Екатеринбургское суворовское военное училище МО РФ; 620062, г. Екатеринбург, ул. Первомайская, 88; e-mail: [email protected].

ОЦЕНКА УРОВНЯ ПОДГОТОВЛЕННОСТИ И КАЧЕСТВА ИЗМЕРИТЕЛЬНЫХ ТЕСТОВЫХ МАТЕРИАЛОВ С ПОМОЩЬЮ ИНТЕРАКТИВНОЙ ФОРМЫ TEST_RESULTS

КЛЮЧЕВЫЕ СЛОВА: когнитивная составляющая компетенции, оценка уровня подготовленности обучающегося, оценка качества теста.

АННОТАЦИЯ. В статье обсуждается неправомочность построения заключений о качестве сформи-рованности компетенций на основании измерений с использованием фондов оценочных средств, имеющихся, согласно требованиям ФГОС ВО, в рабочих программах учебных дисциплин. Показано, что реально можно вести речь об оценке уровня сформированности только части когнитивной составляющей компетенции, которая формируется в рамках данной дисциплины. При этом удобным методом измерения является тестирование, а методы оценивания уровня обученности учащихся и статистические характеристики качества тестовых заданий и теста в целом должны строиться на основе классической теории педагогических измерений. Приведено и обосновано обобщение подходов к обработке результатов тестирования классической теории тестов на ситуацию, когда выполнение отдельного тестового задания оценивается не по дихотомической шкале. При этом «классический» вариант получается как предельный случай обобщенного. Подробно изложено описание интерактивной экранной формы Test_Results, разработанной на кафедре информационно-коммуникационных технологий в образовании УрГПУ на основе MS Excel. Представлен пример работы с экранной формой Test_Results, и дана интерпретация полученных результатов обработки. Сформулированы правила, на основании которых преподаватель может сформировать заключение по завершении обработки результатов тестирования.

Starichenko Boris Evgenyevich,

Doctor of Pedagogy, Professor, Head of Department of Informational and Communicational Technologies in Educational; Ural State Pedagogical University, Ekaterinburg, Russia.

Gizatullin Marat Galimyanovich,

Candidate of Sciences (Technical), Associate Professor, Department of Information Support of the Internal Affairs, Ural Law Institute of the Ministry of the Internal Affairs of Russia; Ekaterinburg, Russia.

Istomina Elena Aleksandrovna,

Methodologist, Laboratory of Innovative Educational Technologies, Ekaterinburg Suvorov Military School of the Ministry of Defence of the Russian Federation; Ekaterinburg, Russia.

ASSESSMENT OF THE LEVEL OF READINESS AND QUALITY OF TEST MATERIALS USING THE ONLINE FORM TEST_RESULTS

KEYWORDS: cognitive component of competence, assessment of tha student, test quality assessment.

ABSTRACT. The article discusses the incompetence of evalution of students' knowledge by means of the tests which, according to Federal State Educational Standard requirements are included in the programs of disciplines. It is shown that it is really possible to talk about evaluation only of a part of the cognitive component of competence, which is formed in the certain discipline. A convenient method of measurement is a test, while methods for assessment of the level of training of students and statistical characteristics of the quality of the test questions and test as a whole should be based on the classical theory of educational measurement. A generalization of the approaches to the test results processing according to the classical test theory to a situation is provided, where the implementation of a single test task is estimated not on the dichotomous scale. The "classic" version is obtained as a limiting case of the generalized. The description of the interactive screen form Test_Results developed at the Department of Informational and Communica-tional Technologies in Education of the Ural State Pedagogical University on the basis of MS Excel is given. The example of work with the screen form Test_Results and the interpretation of the results of processing are given. The rules under which the teacher can form an opinion on the completion of the processing of test results are formulated.

Постановка проблемы исследования

Развитие и совершенствование системы образования как в России, так и за рубежом теснейшим образом связано с понятием «качество образования». Многими авторами отмечается многоаспектность этого понятия [з; 9; 10]. В программном документе ЮНЕСКО «Реформа и развитие высшего образования» определены три критерия качества образовательной деятельности:

а) качество персонала, которое определяется степенью академической квалификации преподавателей и научных сотрудников образовательных организаций высшего образования;

б) качество подготовки обучающихся;

в) качество инфраструктуры и «физической учебной среды» образовательных организаций высшего образования, охватывающее «всю совокупность условий» их функционирования [14].

Одним из важнейших инструментов обеспечения качества в отечественной системе высшего образования являются Федеральные государственные образовательные стандарты высшего образования (ФГОС ВО), в которых с той или иной степенью детализации нашли отражение все перечисленные выше критерии. В данной статье предполагается затронуть лишь один из аспектов, связанный с оценкой качества подготовки обучающихся в ходе обучения.

В ФГОС ВО указывается, что для осуществления процедур текущего контроля успеваемости и промежуточной аттестации обучающихся образовательная организация должна создать фонды оценочных средств (ФОС), позволяющие оценить достижение запланированных в образовательной программе результатов обучения и уровень сформированности заявленных в образовательной программе компетенций [4; 7]. Структура ФОС для проведения промежуточной аттестации обучающихся по дисциплине (модулю) или практике описана в Приказах МОиН РФ (19.12.2013 № 1367 и 27.11.2015 № 1383) [11; 12, ст. 21]. ФОС включает:

• перечень компетенций с указанием этапов их формирования в процессе освоения образовательной программы;

• описание показателей и критериев оценивания компетенций на различных этапах их формирования, описание шкал оценивания;

• типовые контрольные задания или иные материалы, необходимые для оценки знаний, умений, навыков и (или) опыта деятельности, характеризующих этапы формирования компетенций в процессе освоения образовательной программы;

• методические материалы, определяющие процедуры оценивания знаний, умений, навыков и (или) опыта деятельности, характеризующих этапы формирования компетенций.

С практической реализацией данных положений сопряжен целый ряд проблем, в том числе, научного характера:

• в упомянутых выше ФГОС ВО произведено отождествление понятий «качества подготовки» и «уровень подготовки», что, как отмечается в работе М. Б. Челышковой, совершенно неправильно [15]. Как показывают зарубежные исследования, оценка качества подготовки требует применения специальных методов (method S-P lines [17], authentic assessment [16], «balanced» assessment, performance assessment [18] и др.), которые не используются в оценочной практике отечественных образовательных организаций высшего образования. Таким образом, реально посредством ФОС в лучшем случае можно выявить уровень подготовки, но не ее качество;

• директивно нигде не зафиксирована и не стандартизирована методика определения уровня сформированности компетенций;

• отсутствуют механизмы, пользуясь которыми можно было бы установить ва-лидность используемых контрольных материалов и доказать, что с их помощью действительно измеряется уровень сформиро-ванности заявленных компетенций;

• как правило, компетенции формируются при изучении нескольких дисциплин, а ФОС имеет дисциплинарную основу и входит в рабочую программу конкретного учебного предмета. Проведенные в его рамках педагогические измерения не дают достаточных оснований для заключения о сформированности компетенций.

В целом, мы разделяем мнение, изложенное в работах И. Н. Елисеева [5] и Н. Ф. Ефремовой [6], что компетенцию можно представить как совокупность трех компонентов: когнитивного, интегративно-деятельностного и личностного. Когнитивный компонент определяет уровень знание-вой базы и интеллектуального развития обучающегося. Интегративно-деятельностный компонент отражает способность применения обучающимся накопленных знаний и способов действий при решении практических задач. Личностный компонент проявляется в отношении обучающегося к осуществляемой деятельности.

Наиболее формализованным и поэтому простым с технологической точки зрения оказывается измерение сформированности когнитивного компонента. Во-первых, из общего перечня знаний, относящихся к

© Стариченко Б. Е., Гизатуллин М. Г., Истомина Е. А., 2016

компетенциям, всегда можно выделить те, что формируются в данной дисциплине, и проверять только их. Во-вторых, чаще всего измерительным инструментом является тест, а методом - технология тестирования (бланкового или компьютерного).

В настоящее время технологиями тестирования пользуются практически все преподаватели. При этом с грамотной и корректной обработкой результатов тестирования знаком далеко не каждый, поскольку она основывается на положениях математической статистики и теории педагогических измерений. Это, в свою очередь, не обеспечивает должной валидности результатов, правильной их интерпретации и, как следствие, адекватности построенных заключений. Освоение математического аппарата преподавателями, не имеющими достаточной подготовки, затруднительно. В настоящей статье предполагается достаточно простое решение проблемы, ориентированное на человека без какой-либо специальной математической подготовки. При этом требуют уяснения некоторые стартовые позиции.

Обобщение классической теории педагогических измерений

1. Уровень владения компетенцией (или ее составляющей) является скрытым (латентным) параметром и прямому измерению не поддается. Современные подходы к оценке уровня подготовки обучающегося и расчету характеристик измерительных материалов основываются на одной из двух теорий: классической теории тестов [1; 15] или теории латентных переменных (IRT - Item Response Theory). Сразу следует отметить, что применение математических моделей IRT требует весьма значительных выборок испытуемых, намного превышающих по объему те, с которым реально имеет дело преподаватель образовательной организации высшего образования (20-100 человек). По указанной причине практическую значимость имеют методы оценивания, построенные на основе классической теории тестов.

2. Результаты тестирования всегда оформляются в виде таблицы (матрицы), строки которой формируются по фамилиям испытуемых, а столбцы - по номерам тестовых заданий. В ячейке на пересечении строки (i) и столбца (j размещается результат выполнения i-м отвечавшим j-го задания (xj). В классическом тестировании для оценки выполнения тестового задания используется дихотомическая шкала, то есть Xij может принимать одно из двух значений: 1 - если задание было выполнено; 0 - если ответ испытуемого не совпал с эталонным или совпал частично. Вместе с тем, многие системы компьютерного тестирования позволяют определить долю

выполнения тестового задания. Например, задание множественного выбора содержит 5 вопросов, из которых обучающийся верно ответил на 4. При классическом подходе к оцениванию он получит за ответ о; при этом доля правильности ответа составляет 0,8. Ясно, что оценка по доле правильности более точно отражает знания тестируемого. Следовательно, в расчетных схемах необходимо предусмотреть возможность внесения в таблицу значений Ху промежуточных между о и 1. Следует заметить также, что дихотомическая шкала является предельным случаем «дольной», поэтому более общим следует считать ситуацию, когда в матрице результатов представлены доли правильности.

3. В соответствии с определением В. С. Аванесова, педагогический тест -«система заданий возрастающей трудности специфической формы, позволяющая выявить и измерить качество, уровень и структуру знаний испытуемого в определенной области содержания» [2]. Другими словами, педагогический тест представляет собой единство трех систем:

• содержательной системы знаний, описываемой языком проверяемой учебной дисциплины;

• формальной системы заданий возрастающей трудности;

• статистических характеристик заданий и результатов испытуемых.

Трудность заданий - системный признак, на основании которого отдельные задания объединяются в тест. Следовательно, при разработке теста преподаватель должен предусмотреть включение в него заданий разной трудности. Опыт практической разработки свидетельствует о том, что достаточно выделения трех уровней трудности (аи а2, аз). В тестах, предназначенных для промежуточной аттестации, нужно ориентироваться на следующие соотношения: количество заданий с трудностью аг и должно составлять 60-70%, а3 - 30-40%; максимум должен приходиться на задания с трудностью а2 [13]. Для последующей обработки результатов тестирования важно, чтобы трудность была выражена числом, располагающимся на пропорциональной шкале.

4. В классической теории тестирования при дихотомической оценочной шкале в качестве индивидуального показателя успешности выполнения теста принята сумма баллов, набранных испытуемым по всем тестовым заданиям. Будем считать, что имеется N испытуемых, а тест содержит М заданий. Тогда индивидуальные набранные баллы для каждого обучающегося X,; N определяются суммированием по строкам матрицы результатов:

м

X =1

x

]=1

Однако, как оговаривалось выше, тестовые задания имеют различную трудность - простое же суммирование уравнивает вклады от выполнения простых и трудных заданий в общем результате.

Ситуация может быть скорректирована, если использовать суммирование с весовым коэффициентом, в качестве которого принять трудность задания:

X, =1

]=1

При использовании матрицы, в которой Хц имеет смысл доли правильности выполнения тестового задания, в качестве индивидуального результата может быть принята средняя доля выполнения теста. Без учета трудностей заданий она определится простым усреднением долей по отдельным заданиям: 1 м

X =—У х. .

г м у ] у

С учетом трудности в качестве весового множителя:

м

X..

j=i

■ ajx'j

м

j=i

5. Обработка матрицы результатов по столбцам позволяет выявить статистические характеристики отдельных тестовых заданий и теста в целом. Алгоритмы обработки известны и подробно описаны (см., например, учебное пособие М. Б. Челышковой [15]). Они допускают простое обобщение на ситуацию, когда в матрице результатов находятся доли выполнения. Более того, упрощается расчет валидности тестового задания: для традиционной оценки требовалось вычислять коэффициент бисериальной корреляции (или же точечно-бисериальный коэффициент), поскольку хц измерялись по дихотомической шкале, а Xi - по интервальной. В случае матрицы с долями выполнения оказывается достаточным определить коэффициент линейной корреляции Пирсона.

Работа с формой Test_Results

На кафедре информационно-коммуникационных технологий в образовании УрГПУ на основе прикладного программного продукта MS Office Excel разработана интерактивная экранная форма Test_Results, в которую заложены все необходимые алгоритмы обработки - преподавателю требуется лишь ввести матрицу тестирования и уметь правильно интерпретировать результаты вычислений.

Начальной информацией, которая должна быть введена в форму до начала обработки, является:

• организационные данные о тесте и тестирующем: название теста, ФИО преподавателя, дата тестирования и пр. - эти сведения будут отображены в протоколе тестирования;

• количество тестовых заданий и число испытуемых - на основании этих значений будет строиться шаблон матрицы результатов;

• критическая доля правильности выполнения задания - величина в интервале от 0,3 до 1 (шаг 0,1) - посредством нее преподаватель устанавливает границу доли правильности, ниже которой задание будет считаться невыполненным, и во всех расчетах его оценка будет приниматься «о» (хотя в матрице будет указано ненулевое значение). Если задать этот параметр равным 1, реализуется дихотомическая шкала;

• числовые значения трудности для трех категорий заданий: простое, средней трудности и трудное. Значения задаются по пропорциональной шкале, например, если задать: «простое» - 1, «среднее» - 2, «трудное» - 3, то вклад выполненного трудного задания в общую оценку будет в 3 раза больше, чем у простого, и в 1,5 раза больше, чем у среднего;

• трудности для всех тестовых заданий (по оценке преподавателя - назовем ее «назначенная») - устанавливаются выбором из 3-х допустимых категорий - соответствующие числовые значения используются формой уже на этапе расчета. По умолчанию для всех заданий установлено значение трудности «простое» - его следует оставить, если учет трудности в расчетах не предусматривается;

• оценочная шкала - имеется возможность выбора шкалы оценивания первичных баллов: 5-балльная, 100-балльная или произвольная; в случае 5-балльной шкалы возможна настройка соответствия между итоговой средней долей правильности и балльной оценкой.

Пример заполненной начальной страницы представлен на рисунке 1.

После ввода исходных сведений нажимается экранная кнопка «Сформировать таблицу», после чего на новом листе «Результаты» открывается заготовка протокола тестирования с организационными сведениями и шаблоном матрицы тестирования. Заполнение матрицы возможно либо вручную, либо копированием результатов, если применялась система компьютерного тестирования, в которой предусмотрено их сохранение. Матрица может заполняться как дихотомическими результатами, так и долями выполнения заданий. После этого пользователь должен нажать экранную клавишу «Расчет». Будет произведена следующая обработка данных в матрице:

Рис. 1

Данные на начальной странице формы Test_Results

• индивидуальные показатели успешности:

- взвешенная средняя доля правильности выполнения теста каждым испытуемым (X,);

- балльная оценка в соответствии с выбранной ранее шкалой (ф);

• групповые показатели успешности (отражаются на новом листе «Итоги»):

- доли испытуемых, попавших в разные категории успешности по баллам;

- гистограмма распределения испытуемых по категориям успешности;

• статистические характеристики тестовых заданий:

- статистическая трудность заданий (рд) (средняя доля невыполнения тестового задания);

- дискриминативная способность тестового задания (В]), определенная по методу крайних групп. Размер группы - от 10% до 30% общего количества испытуемых -выбирается автоматически в зависимости от объема выборки протестированных;

- валидность тестового задания (У]),

выражаемая коэффициентом корреляции между индивидуальным профилем ответа обучающегося и профилем итоговых средних долей правильности;

• статистические характеристики теста в целом:

- коэффициент корреляции между профилем назначенных преподавателем трудностей заданий и статистической трудностью, полученной на основании ответов испытуемых. Это значение не вычисляется, если назначенная трудность всех заданий одинакова;

- надежность теста, определяемая методом расщепленных частей и выражаемая коэффициентом Спирмена-Брауна (Н) [8].

На рисунке 2 приведен пример страницы формы Test_Results с заполненной матрицей тестирования, индивидуальными результатами и итогами вычисления статистических характеристик тестовых заданий. На рисунке 3 продемонстрирована страница формы с групповыми результатами и статистическими параметрами теста в целом.

В С в Р С Н 1 и К 1 М N О Р О т и V «V X

1 2 3 Таблица результатов тестирования по теме: Базы данных. СУБД.

5 Уч. заведение ЕкСВУ Группа 11 -в Дисциплина Информатика

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7 Преподаватель Васильев В. В. Дата тестирования 20.05.16 1 Расчет

8

9 Задание 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 X в

10 Фамилия 1 2 2 3 1 з 1 3 1 2 1 з 2 I 3 2 2 3 1 2

11 Курсант 1 1 0.75 1 0,8 0 0,25 1 0,4 1 1 1 0 0.25 0,75 0,4 1 1 0,5 1 1 0,60 3

12 Курсант 2 1 0,5 1 1 1 0,5 0,75 0 1 1 1 0,6 1 0,5 0,6 1 1 1 1 0,5 0,75 4

13 Курсант3 1 1 1 0,4 1 0.5 1 0 1 1 0.5 0,8 1 0.25 0.6 0.5 0.25 0.75 0.25 0.75 0,62 3

14 Курсант 4 0,75 1 1 0,6 1 1 0,5 0,4 1 1 1 0,4 0,5 0,75 1 1 1 1 0.25 1 0,50 4

15 Курсант 5 1 0,5 1 1 1 1 1 0.8 1 1 1 0,8 1 1 1 1 1 0,6 1 1 0,91 5

16 Курсант 6 0,5 1 1 0 0.25 0 0,2 0,25 1 0,25 0 1 0,5 0 0,25 1 0,25 1 0.25 0,31 2

17 Курсант 7 0.25 1 1 0 1 0 1 0,6 1 1 0,75 0 1 1 0 0.75 1 0 1 1 0,54 3

18 Курсант 8 1 1 0,5 1 1 0,75 0,5 0,4 1 0,5 1 0,6 1 1 0.8 1 0,75 0,4 1 1 0,77 4

19 Курсант 9 1 1 1 0,8 1 1 1 0,4 1 1 1 1 0.75 0,75 0,8 1 1 1 1 1 0,90 5

20 Курсант 10 1 1 1 0.8 1 0,5 1 0.4 1 1 1 1 0.25 1 0.6 1 1 0,75 1 1 0,80 4

21 Курсант 11 1 0.25 1 0,4 0.25 0,5 1 0,2 1 1 1 0 0.75 0,75 0.6 1 0,25 0,25 1 1 0,51 3

22 Курсант 12 0,75 1 1 0,4 1 0,75 1 1 1 1 0,75 0 1 0,75 0.8 0,75 0,75 0,5 1 1 0,76 4

23 Курсант 13 1 1 0.75 0,8 1 1 1 0,8 1 0,75 1 0,8 1 1 1 1 1 0,8 1 1 0,91 5

24 Курсант 14 0,75 1 1 0,4 0.25 0,25 0.25 0 0 1 0 0,8 0 0,5 0.2 0 1 0,25 1 0,75 0,39 2

25 Курсант 15 0 1 1 0,6 0,75 0,25 1 0 1 1 1 0,6 0 0,75 0,2 1 1 0,5 1 0,25 0,53 3

27 Доля выполнения qj 0,78 0,85 0,95 0,6 0,72 0,5 0,78 0,35 0,87 0,95 0,8 0,49 0,67 0,73 0,55 0,8 0,83 0,52 0,87 0,8

28 Стат. трудность р^ 0,22 0,15 0,05 0,40 0,28 0,50 0,22 0,65 0,13 0,05 0,20 0,51 0.33 0,27 0,45 0,20 0,17 0,48 0,13 0,20

29 Дискриминативная способность ТЗ В, 0,38 0,12 -0,06 0,45 0,81 0,88 0,38 0,60 0,50 -0,06 0,50 0,40 0,38 0,25 0,80 0,50 0,25 0,72 -0,25 0,56

30 Балидность 0.53 -0.02 -0.29 0,74 0,73 0,88 0,51 0,57 0.67 -0.29 0.70 0.51 0,30 0.50 0,88 0,70 0.17 0,71 -0.08 0.58

зз

где: X - средняя доля выполнения теста (2 - количество баллов за тест

Рис. 2

Вторая страница формы Test_Results

Рис. 3

Третья страница формы Test_Results

По завершении обработки результатов тестирования преподаватель должен построить заключения, касающиеся качества использованных тестовых заданий и теста в целом на основании следующих правил:

1. Тестовые задания со статистической трудностью Рд < 0,2 являются слишком простыми для проверяемого контингента и должны быть изъяты из теста. Аналогично, изъятию подлежат задания с р] > 0,8 как слишком трудные.

2. Задания считаются приемлемыми, если их дискриминативная способность Б] > 0,3. Если Б] меньше, но близка к 0,3, можно попытаться изменить или уточнить формулировку задания. При Б] < 0,2 и тем более при отрицательных показателях задание подлежит исключению из теста.

3. Оценка валидности задания позволяет судить о том, насколько задание пригодно для работы в соответствии с общей целью создания теста. Поскольку целью является дифференциация обучающихся по уровню подготовки, то валидные задания должны четко отделять хорошо подготовленных от слабо подготовленных испытуемых. Согласно М. Б. Челышковой [15], критическое значение валидности заданий V] составляет 0,5 - при меньших значениях задание следует изъять из теста.

4. Коэффициент корреляции назначенной и статистической трудности позволяет выявить степень согласованности оценок преподавателем и обучающимися. Показатель ниже 0,7 свидетельствует о значительном расхождении в оценках трудности заданий, что требует от преподавателя выявления причин расхождения.

5. Надежность теста зависит от подбора заданий с точки зрения их взаимосогласованности; внутренняя однородность теста показывает, что его задания одинаково измеряют одно и то же свойство. В целом надежность считается хорошей при Н » 0,8. При Н > 0,9 надежность оценивается как очень высокая.

В частности, относительно результатов тестирования, представленных на рисунках 1 -3, можно заключить следующее:

1. Структура теста соответствует требованиям: доля трудных заданий 30%, максимум распределения трудностей приходится на задания со средней трудностью.

2. Задания 2, 3, 10, 17 и 19 следует изъять из теста как слишком простые, низкой (и даже отрицательной) дискриминативной способностью и валидностью. Задание 14 с дискриминативной способностью 0,25 можно пыталься улучшить за счет более четкой формулировки.

3. Коэффициент корреляции профилей назначенной и статистической трудности

имеет среднее значение 0,69, что свидетельствует о неполном соответствии оценок трудности заданий преподавателем-разработчиком и тестируемыми.

4. Надежность теста в целом высокая Ш = 0,92).

5) Распределение учащихся по градациям успешности подобно нормальному.

В заключение обзора порядка работы с формой Test_Results следует добавить, что после заполнения матрицы результатов преподаватель может изменять данные на начальной странице (оценку сложности заданий, балльную шкалу, минимальный показатель трудности задания). После таких изменений нужно на странице «Результаты» повторно нажать экранную клавишу «Расчет» - вычисления будут произведены с обновленными начальными значениями.

Заключение

По итогам обсуждения, проведенного в данной статье, представляется целесообразным акцентировать внимание на следующем:

1. Используя традиционно принятые в образовательной организации высшего образования методы контроля, преподаватель может измерить только уровень подготовки обучающихся, но не качество подготовки, поэтому использование в нормативных документах термина «качество подготовки» представляется не вполне корректным.

2. Реально дисциплинарные ФОС позволяют определить лишь когнитивную составляющую компетенций и только в той части, которая формируется в данной дисциплине. Вести речь о ФОС как средстве оценки сформированности компетенций в целом не представляется возможным.

3. Сформированность когнитивной составляющей компетенций в рамках изучаемой дисциплины удобно определять посредством тестирования. При этом измерительный тест должен быть разработан преподавателем в соответствии с правилами проектирования тестов (см., например, [13]), в частности, с обязательным использованием заданий различной трудности.

4. Обработку результатов тестирования удобно осуществлять с помощью интерактивной экранной формы Test_Results, использование которой не требует от преподавателя знания алгоритмов обработки - ему достаточно ввести исходные данные и правильно интерпретировать результаты обработки.

5. Тест может быть охарактеризован значительным числом статистических параметров (не все из них отражены в форме Test_Results). Отбор произведен из соображений минимальной достаточности для выявления характеристик качества тестовых заданий и теста в целом, на основании

которых преподаватель может делать за- значении при уже введенной матрице ре-

ключение о валидности результатов приме- зультатов позволяет преподавателю моде-

нения его теста и при необходимости кор- лировать индивидуальные итоги, напри-

ректировать тест. мер, добиваясь лучшего согласования на-

6. Возможность изменения начальных значенной и статистической трудностей.

ЛИТЕРАТУРА

1. Аванесов В. С. Теоретические основы разработки заданий в тестовой форме : пособие для профессорско-преподавательского состава высшей школы. М. : МГТА, 1995- 95 с.

2. Аванесов В. С. Композиция тестовых заданий. 3 изд. М. : Центр тестирования, 2002. 217 с. URL: http: //testolog.narod.ru (дата обращения 11.05.2016).

3. Брызгалина Е. В. Проблемы оценки качества образования: теория и практика. URL: http://www.chem.msu.ru/rus/books/2012/science-education-2012/124.pdf (дата обращения 11.05.2016).

4. Гизатуллин М. Г. Измерители, способствующие определению сформированности компетенций обучающихся образовательной организации высшего образования // Наука и образование : материалы II Международной научно-практической конференции. Москва, 25 ноября 2014 г. М., 2014. С. 52-54.

5. Елисеев И. Н. Методология оценки уровня компетенций студента // Информатика и образование. 2012. № 4 (233). С. 1-6. URL: http://www.labrate.ru/20121120/eUseev_i_n_stud_competencies.pdf (дата обращения 11.05.2016).

6. Ефремова Н. Ф. Формирование и оценивание компетенций в образовании : монография. Ростов н/Д. : Аркол, 2010. 386 с.

7. Костюченко К. Л., Мухачев С. В. зD-модель оценки качества подготовки обучающихся образовательной организации системы МВД России // Правоохранительные органы: теория и практика. 2015. № 2. С. 95-98.

8. Лиманова Л. В., Муратова Л. А. Анализ качества теста из курса высшей математики по теме «Линейная алгебра, аналитическая геометрия» // Вестник Самарского государственного технического университета. Серия: Психолого-педагогические науки. 2015. № 2 (26). С. 113-121.

9. Некрасов С. Д. Проблема оценки качества профессионального образования специалиста // Университетское управление: практика и анализ. 2003. № 1 (24). С. 42-45.

10. Новиков А. М., Новиков Д. А. Как оценивать качество образования? URL: http://www.anovikov.ru/artikle/kacth_obr.htm (дата обращения 11.05.2016).

11. Об утверждении Положения о практике обучающихся, осваивающих основные профессиональные образовательные программы высшего образования: приказ Министерства образования и науки РФ от 27.11.2015 № 1383. URL: http://ivo.garant.rU/#/document/71288178/paragraph/11:5/ (дата обращения 11.05.2016).

12. Об утверждении Порядка организации и осуществления образовательной деятельности по образовательным программам высшего образования - программам бакалавриата, программам специалитета, программам магистратуры: приказ Министерства образования и науки РФ от 19.12.2013 № 1367. URL: http://ivo.garant.rU/#/document/70603294/paragraph/1:2/ (дата обращения 11.05.2016).

13. Стариченко Б. Е., Мамонтова М. Ю., Слепухин А. В. Методика использования информационно-коммуникационных технологий в учебном процессе. Ч. 3. Компьютерные технологии диагностики учебных достижений : учебное пособие / Под ред. Б. Е. Стариченко / Урал. гос. пед. ун-т. Екатеринбург, 2014. 178 с.

14. Реформа и развитие высшего образования. Программный документ. Париж : Изд-во ЮНЕСКО. 1995. 49 с.

15. Челышкова М. Б. Теория и практика конструирования педагогических тестов : учебное пособие. М. : Логос. 2002. 432 с.

16. Bateson D., Nicol C., Achroeder T. Alternative Assessment and Tables of Specification for the Third International Mathematics and Science Study. ICC 64, 1991.

17. Keeves J. P. (Ed.) Educational Research, Methodology and Measurement: An International Handbook. Oxford: Pergamon Press, 1988.

18. Task Group on Assessment and Testing Report. National Curriculum. Department of Education and Science, 1988.

LITERATURA

1. Avanesov V. S. Teoreticheskie osnovy razrabotki zadaniy v testovoy forme : posobie dlya professorsko-prepodavatel'skogo sostava vysshey shkoly. M. : MGTA, 1995. 95 s.

2. Avanesov V. S. Kompozitsiya testovykh zadaniy. 3 izd. M. : Tsentr testirovaniya, 2002. 217 s. URL: http://testolog.narod.ru (data obrashcheniya 11.05.2016).

3. Bryzgalina E. V. Problemy otsenki kachestva obrazovaniya: teoriya i praktika. URL: http://www.chem.msu.ru/rus/books/2012/science-education-2012/124.pdf (data obrashcheniya 11.05.2016).

4. Gizatullin M. G. Izmeriteli, sposobstvuyushchie opredeleniyu sformirovannosti kompetentsiy obuchayushchikhsya obrazovatel'noy organizatsii vysshego obrazovaniya // Nauka i obrazovanie : materialy II Mezhdunarodnoy nauchno-prakticheskoy konferentsii. Moskva, 25 noyabrya 2014 g. M., 2014. S. 52-54.

5. Eliseev I. N. Metodologiya otsenki urovnya kompetentsiy studenta // Informatika i obrazovanie. 2012. № 4 (233). S. 1-6. URL: http://www.labrate.ru/20121120/eliseev_i_n_stud_competencies.pdf (data obrashcheniya 11.05.2016).

6. Efremova N. F. Formirovanie i otsenivanie kompetentsiy v obrazovanii : monografiya. Rostov n/D. : Arkol, 2010. 386 s.

7. Kostyuchenko K. L., Mukhachev S. V. 3D-model' otsenki kachestva podgotovki obuchayushchikhsya obrazovatel'noy organizatsii sistemy MVD Rossii / / Pravookhranitel'nye organy: teoriya i praktika. 2015. № 2. S. 95-98.

8. Limanova L. V., Muratova L. A. Analiz kachestva testa iz kursa vysshey matematiki po teme «Lineynaya algebra, analiticheskaya geometriya» // Vestnik Samarskogo gosudarstvennogo tekhnicheskogo universiteta. Seriya: Psikhologo-pedagogicheskie nauki. 2015. № 2 (26). S. 113-121.

9. Nekrasov S. D. Problema otsenki kachestva professional'nogo obrazovaniya spetsialista // Universitetskoe upravlenie: praktika i analiz. 2003. № 1 (24). S. 42-45.

10. Novikov A. M., Novikov D. A. Kak otsenivat' kachestvo obrazovaniya? URL: http://www. anovikov.ru/artikle/kacth_obr.htm (data obrashcheniya 11.05.2016).

11. Ob utverzhdenii Polozheniya o praktike obuchayushchikhsya, osvaivayushchikh osnovnye professional'nye obrazovatel'nye programmy vysshego obrazovaniya: prikaz Ministerstva obrazovaniya i nauki RF ot 27.11.2015 № 1383. URL: http://ivo.garant.ru/#/document/71288178/paragraph/11:5/ (data obrashcheniya 11.05.2016).

12. Ob utverzhdenii Poryadka organizatsii i osushchestvleniya obrazovatel'noy deyatel'nosti po obrazovatel'nym programmam vysshego obrazovaniya - programmam bakalavriata, programmam spetsialiteta, programmam magistratury: prikaz Ministerstva obrazovaniya i nauki RF ot 19.12.2013 № 1367. URL: http://ivo.garant.ru/#/document/70603294/paragraph/1:2/ (data obrashcheniya 11.05.2016).

13. Starichenko B. E., Mamontova M. Yu., Slepukhin A. V. Metodika ispol'zovaniya informatsionno-kommunikatsionnykh tekhnologiy v uchebnom protsesse. Ch. 3. Komp'yuternye tekhnologii diagnostiki uchebnykh dostizheniy : uchebnoe posobie / Pod red. B. E. Starichenko / Ural. gos. ped. un-t. Ekaterinburg, 2014. 178 s.

14. Reforma i razvitie vysshego obrazovaniya. Programmnyy dokument. Parizh : Izd-vo YuNESKO. 1995. 49 s.

15. Chelyshkova M. B. Teoriya i praktika konstruirovaniya pedagogicheskikh testov : uchebnoe posobie. M. : Logos. 2002. 432 s.

16. Bateson D., Nicol C., Achroeder T. Alternative Assessment and Tables of Specification for the Third International Mathematics and Science Study. ICC 64, 1991.

17. Keeves J. P. (Ed.) Educational Research, Methodology and Measurement: An International Handbook. Oxford: Pergamon Press, 1988.

18. Task Group on Assessment and Testing Report. National Curriculum. Department of Educa-tion and Science, 1988.

Статью рекомендует д-р пед. наук М. В. Лапенок

i Надоели баннеры? Вы всегда можете отключить рекламу.