Модели и процедуры измерения и оценивания результатов критериально-ориентированного тестирования

Туровская Алиса Олеговна

Туровская А.О. Модели и процедуры измерения и оценивания результатов критериально-ориентированного..

Literature

1. Alexandrov, J. I. Learning and memory: system prospect// Simonov second readings / Ed. I.A Shevlev, etc. - Moscow, 2004. - P. 3-51.

2. Anisov, A. M. Properties of time // Logic researches. Fascicle 8. — Moscow, 2001. — P. 5-25.

3. Ashmarin, I. P., Kruglikov, R. I. Peptide, training, memory (polyfunctionality principle) // Neurochemistry, 1983. — book 2. — № 3.

4. Batuev, A. S. Physiology of the high nervous activity and sensing systems : Textbook for high schools. — St.-Petersburg, 2005.

5. Verbitsky, A. A. Active training in the high school: the contextual approach. — Moscow, 1991.

6. Verbitsky, A. A. New educational paradigm and contextual training. — Moscow, 1999.

7. Grechenko, T. N, Sokolov, E. N. Neurophysiology of memory and training // Mechanisms of memory. — Leningrad, 1987. — P. 132-171.

8. Grechenko, T. N. Psychophysiology of memory // Bases of psychophysiology / Under the editorship of J. M. Aleksandrov. — Moscow, 1997.

9. Danilova, N. N. Psychophysiology : Textbook for high schools. / N.N. Danilova — M, 2004.

10. Kiseleva, O. O. Time and pedagogical reality // the Person in pedagogy and psychology. — Petropavlovsk-Kamchatka, 2001.

11. Kozyrev, N. A. About possibility of the experimental research of time properties / Kozirev N.A. The favor works. — Leningrad, 1991.

12. Maklakov, A. G. General Psychology : Textbook for high schools. — St.-Petersburg, 2004.

13. Rean, A. A, Bordovskaja, N. V., Ro%um, S. I. Psychology and pedagogy. — St.-Petersburg, 2008.

14. Smirnov, V. M, Budilina, S. M. Physiology of sensing systems and higher nervous activity : Manual for students of high educational institutions. — Moscow, 2003.

15. Strelnikova, J. J., Solntsev, V. O. Anatomy of central neural systems: Manual. — St.-Petersburg,

2009.

16. Ukhtomsky, A. A. Dominant. — St.-Petersburg, 2002.

17. Grzywacz, N. M., Burgi, P. Y. Toward a biophysically plausible bidirectional Hebbian rule / / Neural Comput. — 1998, Apr.1; 10 (3). — P. 499-520.

18. Mark, R. Sequental biochemical steps in memory formation: evidence from the use of metabolic inhibitors / / Brain mechanisms in memory and learning: from the single neuron to man / Ed. / M.A.B. Brazier. — N.Y., 1979. — P. 197-215.

19. Nader, K Response to Arshavsky: Challenging the old views // TINS. 2003. — V 26. — P. 466-468.

20. Squire, Larry R., Kandel, Eric R. Memory: From Mind to Molecules Publisher: W H. Freeman Company Pub. — January 1998. — P.19

1 Работа выполнена при поддержке Российского гуманитарного научного фонда (РГНФ), грант 08-06-00799а.

2 Синапс (от греч. synapsis — контакт) — это специализированные структурные соединения между клетками (в данном случае — нейронами), обеспечивающие возбуждающие, тормозные и трофические влияния между ними.

3 Медиатор — химическое вещество (ацетилхолин, норадреналин, серотонин, дофамин, g-аминомасляная кислота и др.), образующееся в теле нейрона или в нервном окончании, необходимое для передачи сигнала в синапсах.

4 Нейропептид — химическое вещество белковой природы, синтезируемое в нейроне.

УДК 371.322.8 А.О. Туровская*

Модели и процедуры измерения и оценивания результатов критериально-ориентированного тестирования

В статье рассмотрены недостатки существующих методов оценки результатов критериально-ориентированного педагогического контроля знаний и предложены модели и процедуры, обеспечивающие объективность, дифференцированность и критериальную валидность оценки результатов тестирования знаний.

Ключевые слова: критериально-ориентированное тестирование, педагогическое измерение и оценивание результатов, независимые и вложенные тестовые задания.

* Туровская, Алиса Олеговна, младший научный сотрудник ЗАО "Фирма "Пассат"; г. Санкт-Петербург, ул. Разводная, д. 15, тел. (812) 427-20-21.

* Turovskaya, Alisa, Junior colleague of "Passat Firm" JSC (Scientific and Manufacturing Company «Passat», closed-type JSC), Sankt-Petersburg, Razvodnaya, 15.

Психология

A.O. Turovskaya*. Model and procedures of measurement and estimation of results of the criterion-referenced testing.

In article lacks of existing methods of an estimation of results of the criterion-referenced pedagogical control of knowledge are considered and models and the procedures providing objectivity, distinctiveness and concurrent validity estimations of results of testing of knowledge are offered.

Keywords: the criterion-referenced testing, pedagogical measurement and the estimation of the results independent and enclosed test task.

Педагогическое тестирование определяется как «один из наиболее стандартизованных и объективных методов контроля и оценивания знаний, умений и навыков испытуемого, который лишен таких традиционных недостатков других методов контроля знаний, как неоднородность требований, субъективность экзаменаторов, неопределенность системы оценок и т.п.» [1].

Однако указанное положение об объективности педагогического тестирования не может быть полностью распространено на критериально-ориентированные тесты, позволяющие оценить уровень подготовленности (учебных достижений) испытуемых в конкретной предметной области по не связанному с процедурой тестирования внешнему критерию. Так, из основных форм закрытых тестовых заданий в современных компьютерных системах тестирования (КСТ) объективно оцениваются только задания в форме «одиночный выбор», когда испытуемый должен выбрать один вариант ответа из нескольких предложенных. В остальных формах заданий процедура объективного измерения результатов тестирования заменяется процедурой субъективной идентификации этих результатов по правилам, установленным преподавателем или разработчиком теста. К таким формам закрытых критериально-ориентированных тестовых заданий относятся:

1) форма «множественный выбор», когда испытуемый должен выбрать несколько вариантов ответа из нескольких предложенных;

2) форма «соответствие», когда тестируемому нужно упорядочить два списка таким образом, чтобы они соответствовали друг другу;

3) форма «упорядоченный список», когда тестируемому нужно упорядочить список в определенном порядке.

Для формы «множественный выбор» В.С. Аванесов в [2] рекомендует за полностью правильное решение дать три балла, за каждую ошибку снимать один балл. Если ошибок больше трех, то давать 0 баллов. М.Б. Челышкова [3] рекомендует за полностью выполненное задание с выбором нескольких верных ответов давать 1 балл и 0 баллов за хотя бы один неверный ответ. В.Ю. Переверзев в [4] описывает метод «частичного балла» (partial credit), в котором за каждый правильно выбранный ответ дается 1 балл, за неправильно выбранный ответ — 0 баллов. Штрафные баллы в этом методе не предусмотрены. По мнению В.С. Кима [5], использование заданий с выбором одного верного ответа предпочтительней, и лучше заменять одно задание с выбором нескольких верных ответов на несколько заданий с выбором одного верного ответа. Аналогичные рекомендации имеют место и в отношении тестовых заданий в формах «соответствие» и «упорядоченный список».

Для устранения указанных выше недостатков процедур измерения результатов критериально-ориентированного тестирования в КСТ предлагается использовать данные теории распознавания образов [6]. Приступая к изложению предлагаемых методов измерения и оценивания результатов выполнения критериально-ориентированных тестов в формах «множественный выбор», «соответствие» и «упорядоченный список», необходимо отметить, что как перечисленные формы закрытых тестовых заданий, так и производные от них формы, как показано в [9], могут быть сведены к двум базовым формам: множество (неупорядоченное множество) элементов или список (упорядоченное множество). Поэтому дальнейшее описание предлагаемых процедур измерения и оценивания результатов критериально-ориентированного тестирования приводится в отношении последних двух базовых форм тестовых заданий.

Постановка задачи оценки ответа типа «Множество». Пусть дано множество МО (рис. 1), характеризующие ответ испытуемого, и множество Мэ, характеризующие эталонный ответ.

С д/' ( K=Л/ пМ. V J

Рис. 1. Диаграмма Эйлера-Венна для множеств V, M , МЭ

Туровская А.О. Модели и процедуры измерения и оценивания результатов критериально-ориентированного.

Пусть для Мр М, выполнено условие

_ (М0сК)л(Мэ_ЕК) __(1)

где: V- {й.} (/= 1,у; V < оо), М0 = {а,}(/ = \,п, п < у), Мэ = {<з,}(/ = 1 ,т,т<\).

Требуется оценить ответ испытуемого в традиционной 4-балльной шкале.

Решение задачи. Оценим расстояние г между множествами М0 и Мэ. Для этого введем следующую метрику: 1) г = [0,1]; 2) г = 0, если М0 и Мэ состоят из одних и тех же элементов, т.е. эквивалентны М0 □ Мэ (если М0 = 0 и Мэ = 0,то М0 □ Мэ); 3) г = 1, если МопМэ=0;4)О<г<1, если М0 п Мэ * 0.

Тогда расстояние между М0 и Мэ может быть определено как

1 * , *

г = г =1--= 1--;

МН 1 7 5

/ М + П-Л г ^

г = 0 при т-п~ 0

где: /4 - число элементов в подмножестве АТ = М0 (Л Мэ (число одинаковых элементов в М() и Мд), I — п + т — к — число элементов в подмножестве Ь =М0 иМэ (общее число неповторяющихся элементов подмножеств М0 и М,^.

В теории системно-информационного анализа [7] введено понятие неупорядоченности как меры различия какого-либо выбранного параметра х. в отношении эталона порядка х , которая стремится к нулю при х.—>х . Оценка (2) соответствует этому понятию, что позволяет организовать процедуру оценивания измеренных результатов по схеме, предложенной А.Н. Печниковым в [8]:

1. Абсолютная неупорядоченность ответа испытуемого оценивается как:

Ч = * (3)

2. Рассчитывается оценка испытуемого в традиционной 4-балльной шкале:

5

^ = 1о§2

Че,Р, + ЯР2 + ЧуогРъ '

(4)

где: qв — величина q, соответствующая оценке «отлично»; q — величина q, соответствующая оценке «неудовлетворительно»; S = 25^ = 32^ — коэффициент, адаптирующий количественное выражение балла оценки к традиционной 4-балльной шкале; р1,р2,р) — ОД — логические операторы (Д = 1 при ^ < qв■p2 = 1 при q^! <ц< р} = 1 при q >

В области определения оценки г < г < г формула (4) примет вид:

(5)

Применение формул (2-5) обеспечивает возможность настройки балла оценки на систему предпочтений преподавателя за счет изменения q¡¡ или

Постановка задачи оценки ответа типа «Список». Пусть выборочные ответы Х0 вида «Список» и соо тветствующий им эталон Хэ определены на исходном множестве V следующим образом:

Г = ХэиМ;

(Хэ={а],а2,...,ап...,ак})л

Хэ=рк =

^ 1, 2, ..., /,..., к ^

МФр'

'11

1, 2, ..., и,..., 5 |

(/ = 1, Л);

(и = 1,5)

(6)

Необходимо определить оценку ЛГ(Х0, X^ ответа X испытуемого в традиционной 4-балльной шкале.

Решение задачи. Для решения подобных задач применяется метод Кендалла [6], который обеспечивает получение оценок г — [0,1], соответствующих понятию расстояния (но работоспособен только при одинаковых числе и номенклатуре элементов в списках), и метод Фора (работоспособен при любом наборе элементов, но неоднозначен и исключает нормирование оценок, т.е. их представление в традиционной 4-балльной шкале). Предлагается метод, базирующийся на модели (2) оценки ответа типа «Множество», методе Кендалла и процедуре создания пустых элементов, применяемой в методе Фора.

В соответствии с (6) список Х0 может содержать элементы вида Ьи, на которых не может быть определено отношение порядка. Поэтому в общем случае расчет оценки ЛГ(Х(), Х.^ предлагается производить в четыре этапа.

Этап 1. Оценка неупорядоченности q¡ (X , Х.^) ответа испытуемого (списка Х0) относительно эталона (списка Х^) по номенклатуре элементов. Списки ХГ) и Хэ рассматриваются как неупорядоченные множества, а неупорядоченность их номенклатуры оцешгвается по формулам (2, 3).

Этап 2. Оценка неупорядоченности (Х(), Х^) ответа испытуемого (списка Х(>) относительно эталона (списка Х,^ по упорядоченности элементов.

Психология

В соответствии с (6) списки Х() и X. имеют вид

X0={afbt},- (7)

1, k —

0' = U), (8)

Хэ=Рк =

Kat,a2,...,ar..,akJ

где: i = 0,t(t<k), u = 0,g(g<s).

Произведем в списке Х0 замену всех элементов вида bи на пустой элемент 1 (процедура, применяемая в методе Фора), обладающий свойством

Va( еХ0->а,=А. (9)

В случае к < п — t + ¿дополним список X, элементами ..., д, равными 1, а в случае к> п — t + J — список Х0 элементами д..., ае равными L Списки Х() и Х0 примут вид перестановок, которые имеют одинаковый состав элементов, а значит, могут быть корректно оценены по методу Кендалла:

1. Определяются коэффициенты сравнения:

+1 при хи>х,к

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ЛИ~] при *»<х*, где / < к. (10)

0 при хи=х1к

2. Рассчитывается расстояние (нормированная оценка Кендалла):

Г = --■ (11)

2 п(п-\)ик v 7

Оценка rJX(), Х;)) по формуле (11) формально и по смыслу соответствуют понятию 1геупорядоченности, откуда в соответствии с (3) q2(X0, X^ = г .

Этап 3. Оценка общей неупорядоченности q — f (qp q^ ответа испытуемого (списка X) относительно эталонного ответа (списка Х^.

Общая неупорядоченность ответа вида «Список» определяется как

q = 1 - (1 - qX 1- q). _ ^ (12)

Этап 4. Определение оценки выборочного ответа типа «Список» в традиционной 4-балльной шкале. Оценка рассчитывается путем подстановки в (4, 5) значения q, определенного по (12).

Список литературы

1. ОСТ Т 1.1. Педагогические тесты, термины и определения. Отраслевой стандарт (первая редакция). — М.: Министерство образования РФ, 2001. — 13 с. (с сайта http://bank.orenipk.ru/).

2. Аванесов, B.C. Форма тестовых заданий. — М.: Центр тестирования, 2005. — 156 с.

3. Чеяъшкова, М.Б. Теория и практика конструирования педагогических тестов : учебное пособие. - М.: Логос, 2002. - 432 с.

4. Переверзев, В.Ю. Технология разработки тестовых заданий : справочное руководство. — М.: Е-Медиа, 2005. - 265 с.

5. Ким, В. С. Тестирование учебных достижений: монография. — Уссурийск: 11здательство УГПИ, 2007.-214 с.

6. Фор, Л. Восприятие и распознавание образов / пер. с фр. / под ред. Г.П. Катыса. — М.: Машиностроение, 1989. — 272 с.

7. Горский, Ю.М. Системно-информационный анализ процессов управления. — Новосибирск: Наука. Сиб. отд-ние, 1988. — 268 с.

8. Печников, А.Н. Теоретические основы психолого-педагогического проектирования автоматизированных обучающих систем. — Петродворец: ВВМУРЭ, 1995. — 326 с. (с сайта http:// pedlib.ru/).

9. Карпова, II.П. Исследование и разработка подсистемы контроля знаний в распределенных автоматизированных обучающих системах : дис. ... канд. техн. наук. — М.: МГИЭМ, 2002. — 239 с.

Literature

1. Pedagogic tests, terms and definitions. Branch standard (the first edition)) — Moscow, 2001.

2. Avanesov, V. S. Form of test tasks - Moscow, 2005.

3. Tchelyshkova, M. B. Theory and practice of pedagogical tests constructing. — Moscow, 2002.

4. Perever^ev, V. J. Technology of test tasks constructing. — Moscow, 2005.

5. Kim, V..S. Testing of study achievements. — Ussurijsk, 2007.

6. For, A. Perception and recognition of images. — Moscow, 1989.

7. Gorsky, J.M. System and information analysis of processes of control. — Novosibirsk, 1988.

8. Pechnikov, A.N. Theoretic fundamentals of psychological and pedagogical constructing of automated educational systems. — Petergof, 1995.

9. Karpova, LP. Research and constructing of knowledge control subsystem in allocated automated educational systems. — Moscow, 2002.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Туровская Алиса Олеговна

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Туровская Алиса Олеговна

Model and procedures of measurement and estimation of results of the criterion-referenced testing

Текст научной работы на тему «Модели и процедуры измерения и оценивания результатов критериально-ориентированного тестирования»