Научная статья на тему 'ЕГЭ: как учесть погрешность баллов и снизить ошибку педагогического оценивания'

ЕГЭ: как учесть погрешность баллов и снизить ошибку педагогического оценивания Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
73
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕСТ / ТЕСТОВЫЙ БАЛЛ / ЕГЭ / ПОГРЕШНОСТЬ ИЗМЕРЕНИЯ / МАТЕМАТИЧЕСКИЕ МОДЕЛИ ПЕДАГОГИЧЕСКИХ ИЗМЕРЕНИЙ / PARTIAL CREDIT MODEL / TEST / TEST SCORES / EXAM / MEASUREMENT ERROR / MATHEMATICAL MODELS OF EDUCATIONAL MEASUREMENT

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Деменченок Олег Гениевич

В статье предложена методика оценки нижнего предела погрешности баллов Единого государственного экзамена (ЕГЭ), основанная на анализе количества и структуры заданий ЕГЭ, а также математической модели Partial Credit Model (PCM). Описана практическая реализация методики в электронной таблице Microsoft Excel. Показана слабая пригодность баллов ЕГЭ для обеспечения справедливого конкурса абитуриентов при зачислении в вузы.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

USE: how to account for the error scores and reduce error of teachers assessment

The article proposes a method of estimating the lower limit of the error score for Unified State Examination (USE), based on an analysis of number and structure of the tasks USE, as well as mathematical model of Partial Credit Model (PCM). We describe the practical implementation of techniques in a spreadsheet Microsoft Excel. It shows weak USE indicators to ensure fair competition of applicants for the admission to universities.

Текст научной работы на тему «ЕГЭ: как учесть погрешность баллов и снизить ошибку педагогического оценивания»

ЕГЭ: как учесть погрешность баллов и снизить ошибку педагогического оценивания

Олег Гениевич Деменчёнок,

начальник кафедры математики и информатики Восточно-Сибирского института МВД России, доцент, кандидат технических наук

• тест • тестовый балл • ЕГЭ, погрешность измерения • математические модели педагогических измерений • Partial Credit Model •

Проблемная ситуация

Результаты измерений из-за погрешностей всегда несколько отличаются от истинного значения измеряемой величины. Анализ погрешностей педагогических измерений приобретает особую актуальность ввиду косвенного характера измерения — уровни подготовленности обучаемых и параметры тестовых заданий определяются расчётным путём на основе выбранной модели измерения — и невозможности проверки полученных результатов. Поэтому учёт допущенной погрешности является необходимым условием корректности педагогического измерения.

На необходимость учёта погрешности измерений, проведения экспертизы качества контрольных материалов единого государственного экзамена неоднократно указывали многие авторы1. Однако в свидетельство о результатах ЕГЭ выставляются окончательные баллы по общеобразовательным дисциплинам, без указания погрешности измерения. Это правомерно только в том случае, когда погрешность измерения не превышает 0,5 балла (т.е. погрешность ме-

__________________ нее половины цены

1 Аванесов В.С. Являются ли КИМы ЕГЭ методом! педагогических измерений? // ПедагогИческие измерения. № 3. 2007. С. 3-26; : Хлебников В. Краткий анализ технологии и результатов единого государственного экзамена (ЕГЭ) // Педагогические измерения. № 4. 2008. С. 25-40.

2 Тейлор Дж. Введение в теорию ошибок: Пер. с англ. М.: Мир, 1985. 272 с.

деления шкалы)2.

В противном случае следует либо явно указать погрешность измерения (например, 76 ± 12 баллов), либо увеличить цену деления шкалы (на-

пример, до двадцати баллов: 0, 20, 40 ... 80, 100 баллов). К сожалению, организаторы ЕГЭ не придают гласности отчёты с анализом погрешности результатов ЕГЭ. Независимые эксперты не могут провести такой анализ из-за завесы секретности, окутавшей ЕГЭ.

Практически вся значимая информация

о ЕГЭ включена в перечень сведений конфиденциального характера, в том числе:

• критерии оценивания по предметам;

• оригиналы бланков ЕГЭ, их электронные изображения и ксерокопии;

• экзаменационные материалы, протоколы проверки заданий с развёрнутыми ответами;

• итоговые протоколы;

• аналитические и информационные материалы;

• свидетельства о результатах ЕГЭ выпускников — участников ЕГЭ;

• бланки апелляций по результатам ЕГЭ, решения конфликтной комиссии;

• резервные копии баз данных ЕГЭ.

Доступ к указанной информации ограничен в соответствии с законодательством Российской Федерации. Эти материалы запрещается публиковать в открытой печати, переписке, использовать в передачах по радио и телевидению, в публичных выступлениях. Гриф конфиденциальности делает процедуру ЕГЭ абсолютно непрозрачной, что снижает степень доверия к результатам ЕГЭ.

Однако конфиденциальность сведений ЕГЭ не является преградой для анализа погреш-

Знищ......шиш,......МАРНОЕША

ности самой применяемой технологии. Эту погрешность можно найти, исходя из количества и структуры заданий ЕГЭ, а также математической модели. Такое исследование способно «пролить свет» на реальные возможности ЕГЭ как инструмента педагогического измерения.

Примерная структура контрольных материалов ЕГЭ

В качестве примерной структуры экзамена ЕГЭ принят демонстрационный вариант контрольных материалов 2010 года по математике, подготовленный Федеральным институтом педагогических измерений и утверждённый директором этого института А.Г. Ершовым 21.07.2009 года3 (сайт официального информационного портала ЕГЭ, http://www1.ege.edu.ru/images/stories/ с1ето_2010/та_с1ето_2010.рс11).

Экзаменационная работа состоит из двух частей, включающих 18 заданий.

Часть 1-я включает 12 заданий с кратким ответом (В1 — В12) базового уровня по материалу курса математики. За правильный ответ на задание части 1-й ставится один балл, а за неверный ответ или отсутствие ответа — 0 баллов.

Часть 2-я (С) содержит шесть сравнительно трудных заданий по материалу школьного курса математики. Максимальная оценка за задания второй части:

• за первое и второе задание — 2 балла (за частично правильный ответ — 1 балл);

• за третье и четвёртое задание — 3 балла (частично правильный ответ — от 1 до 2-х баллов);

• за пятое и шестое задание — 4 балла (частично правильный ответ — от 1 до 3-х баллов).

Полное и безошибочное выполнение всех заданий этого варианта ЕГЭ соответствует 30 баллам.

Надо отметить, что варианты контрольных материалов и по некоторым другим общеобразовательным дисциплинам обладают подобной структурой.

Параметры оценки погрешности измерений

В соответствии с примерной структурой контрольных материалов ЕГЭ для проведения пробных расчётов примем модель метода измерения (теста), включающего 18 заданий, из которых:

— 12 дихотомических заданий (т.е. заданий, оцениваемых 0 или 1 баллом);

— 6 политомических заданий (максимальный балл за первое и второе задание — 2 балла, за третье и четвёртое — 3 балла, пятое и шестое — 4 балла).

К сожалению, нет никаких сведений о возможном распределении уровней трудности заданий. Автор полагает, что истинное распределение становится известным только после проведения ЕГЭ, так как для определения уровней трудности заданий нужна достаточно представительная статистика ответов школьников, а получить такие данные до проведения ЕГЭ трудно ввиду конфиденциальности заданий. Поэтому в первом приближении примем распределение уровней трудности заданий в для пробных расчётов, близких к равномерному:

— 12 дихотомических заданий равномерно распределены по уровню трудности от — 5 до 2 (шаг равен 7/11, т.е. в1 = -5; в2 = -4,36; в3 = -3,73 ... в11 = 1,36; в12 = 2);

— 6 политомических задания имеют уровень трудности первого шага Pj 1=1 (где j = 13, 14 ... 18 — порядковый номер задания) и максимальный уровень трудности, равный 5. Остальные уровни трудности этих заданий равномерно распределены от 1 до 5, что соответствует следующим значениям уровней трудности:

в13 1=1 в14 1=1 в15 1=1 в16 1=1 в 17 1=1 в18 1=1

в13 2=5; в 14 2=5;

в 15 2=3; в 15 3=5; в16 2=3; в16 3=5; в 17 2=2,33; в 17 3=3,67; в„ 4=5; в 18 2=2,33; в 18 3=3,67; в 18 4=5.

Математическая модель

Согласно находящейся на сайте официального информационного портала ЕГЭ (www1. ege.edu.ru) инфор-

3 Демонстрационный вариант контрольных измерительных материалов I единого государственного экзамена 2010 года по математике. М.: Федеральное государственное научное учреждение «Федеральный институт педагогических измерений», 2009. 18 с.

мации, результаты выполнения заданий обрабатываются в рамках модификации модели Раша с произвольными промежуточными категориями выполнения тестового задания, известной в англоязычной литературе как Partial Credit Model.

PCM — это наиболее известная математическая модель педагогических измерений, с градацией степени правильности ответа (т.е. с возможностью учёта частично правильных ответов)4:

S (e, -p, )

k=0

e

П ijo = X j l

J ^ S (e,-p, )

S ek=0 l=0

(1)

где Пх — вероятность достижен ия результата ху (т.е. того, что тестируемый / выполнит ровно х шагов и получит х баллов в задании у); х=0, 1... ху ...хтаху_ количество шагов; хтаху _ максимально возможное количество баллов за задание у;

Pjo = 0, S(Єі-Pjo) = 0.

4 Wright

Analysis:

Например, для задания, максимально оцениваемого двумя баллами, вероятности получения одного и двух баллов соответственно равны:

е-р, в Н1

1 + ee'Pl + ee"Pl • ee_P2 ’ e9-pi • e6-p2 1 + ee-p1 + ee-p1 • ee-p2 .

(2)

(З)

Если максимальная оценка задания равна трём баллам, имеем

е-в,

в Н1

п

'1

1 . e-ft . e-p1 e-p, . e-p1 e-p2 e-p3 1 + e 1 + e 1 • e 2 + e 1 • e 2 • e 3

ee_P1 • ee_P2

,e-p1 і ,,e-p1 ^,e-p2 і ,,e-p1 ^e-p2 ,,e-P3

e

+ e

e

e

e9_p1 • e0_p2 • e9_p3

з , , e-ft . e-p1 e-p, . e-p1 e-p2 e-p3

1 + e 1 + e 1 • e 2 + e 1 2 • " 3

(4)

(5)

(6)

e

e

Аналогичным образом можно применить уравнение Partial Credit Model (1) для анализа заданий с большим количеством градаций степени правильности ответа.

Для оценки стандартной ошибки измерения уровня подготовленности испытуемого / используется формула5:

(7)

1

B.D., Masters G.N. Rating Scale Rasch Measurement. Chicago: Mesa Press, 1982. 204 p.

m / xmax j (x I max j 4 2 ^

S Si 2 •* ji - Sl •Kj l

j=1 l=1 l=1

V V ) )

5 Там же

где m — число тестовых заданий.

Знищ.........шиш,.........ДИАГНОСТИКА

Для заданий, максимально оцениваемых двумя баллами, уравнение (7) принимает вид:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 - (8)

S1 + 4п,2 -(, 1 + 2п,2))

j=l

Запишем уравнение (7) для заданий, максимально оцениваемых тремя и четырьмя баллами:

1

(9)

09 і =-

09 і =

j", і + 4п, 2 + 9п, 3 -", 1 + 2п, 2 + 3п; 3 ))

j=1

1

(10)

Х"« 1 + 4п, 2 + 9", 3 +66 ", 4 -" 1 + 2", 2 + 3", 3 + 4", 4 ) )

j=1

Оценки стандартной ошибки измерения уровня подготовленности испытуемого для анализа заданий с большим количеством градаций степени правильности ответа находятся аналогичным образом.

Для дихотомических заданий (xmax / = 1) формула (7) существенно упрощается: І 1 1

о

ei

S П,, і -п, і2 )

j=1

S". i(i-п« i)

j=1

(11)

S p (і - P)

j=1

где Пт = Рц____вероятность получения испытуемым / одного балла в задании у, что для ди-

хотомического задания соответствует вероятности правильного ответа испытуемого / на задание у.

Вероятность правильного ответа для дихотомического задания может быть найдена по модели Георга Раша6:

e

1

(12)

1 + e

1 + e

-(ei-P j)

Расчёт стандартной ошибки измерения уровня подготовленности

Все расчёты выполним в электронной таблице Microsoft Excel. Это позволит любому желающему перепроверить полученные результаты или провести оценку погрешности измерений для другой структуры контрольных измерительных материалов ЕГЭ.

Сначала введём исходные данные (см. рис. 1) — идентификаторы заданий (строка 2) и испытуемых (столбец А), используя для простоты нумерацию. Примем, что уровни подготовленности выпускников 0 меняются от —

5 до 5 с шагом 0,5 (столбец В). Уровни трудности 12 дихотомических заданий равномерно распределены от — 5 до 2 (шаг равен 7/11. Т.е., Р;=-5; Р2=-4,36 ... Р12=2). Для политомических заданий

6 Rasch G. Probabilistic models for some intelligence and attainment tests. — Copenhagen, Denmark: Danish Institute for Educational Research, 1960.

введём все принятые ранее уровни трудности отдельных шагов, например: значения Р15 7=1; Р15 2=3; Р15 3=5 поместим в ячейки S3, Т3 и из (рис.1).

A B C D E S T U

2 ф и н (С (С со 2 ф и н (С (С со Задание 3 Задание 15

3 -5 -4,36 -3,73 1 3 5

4 Выпускник 1 -5

5 Выпускник 2 -4,5

6 Выпускник 3 -4

24 Выпускник 21 5

Рис.1. Ввод исходных данных

Далее рассчитаем вероятности правильных ответов. Для этого готовим форму (рис.2), аналогичную форме ввода данных, и вводим расчётные формулы. Для дихотомических заданий в ячейку С29 запишем формулу (12) в соответствии с правилами Microsoft Excel =1/ (1+EXP(C$3-$B4)) и скопируем содержимое С29 в диапазон ячеек C29:N49.

Для политомических заданий расчётные формулы составляются на основе уравнений (1-6). Так, для 15 задания, которое оценивается тремя баллами, в ячейки S29, T29 и U29 запишем:

• =EXP($B4-S$3)/(1+EXP($B4-S$3)+EXP($B4-S$3)*EXP($B4-T$3)+EXP($B4-S$3)*EXP($B4-T$3)*EXP($B4-U$3))

• =EXP($B4-S$3)*EXP($B4-T$3)/(1+EXP($B4-S$3)+EXP($B4-S$3)*EXP($B4-T$3)+EXP($B4-S$3)*EXP($B4-T$3)*EXP($B4-U$3))

• =EXP($B4-S$3)*EXP($B4-T$3)*EXP($B4-U$3)/(1+EXP($B4-S$3)+EXP($B4-S$3)*EXP($B4-T$3)+EXP($B4-S$3)*EXP($B4-T$3)*EXP($B4-U$3))

Затем скопируем содержимое S29:U29 в диапазон S29:U49.

Аналогично вводятся формулы для других политомических заданий.

A B C D E S T U

27 е и н а д а З 2 е и н а д а З 3 е и н а д а З Задание 15

28 П1 П1 П1 П1 П2 П3

29 Выпускник 1 0,5 0,35 0,22 0 0 0

30 Выпускник 2 0,62 0,47 0,32 0 0 0

31 Выпускник 3 0,73 0,59 0,43 0 0 0

49 Выпускник 21 1 1 1 0,1 0,5 0,5

Рис.2. Расчёт вероятностей правильных ответов

Эшштаь....шиш,......мариоиша

Осталось найти погрешности измерений. Для этого запишем входящие в уравнение (7) слагаемые в диапазон С4:АС24. Так, в ячейку С4 введём =С29*(1 — С29), что соответствует выражению Р17(1 — Р17), затем скопируем содержимое С4 в диапазон дихотомических заданий С4№4.

Слагаемые уравнения (7) для политомических заданий составляются на основе уравнений (8-10). Например, для 15 задания в ячейку S4 запишем =S29+4*T29+9*U29-^29+2*Т29+3*и29) 2 и скопируем полученную формулу в диапазон S4:S24. Слагаемые остальных заданий вводятся аналогично.

Теперь рассчитаем стандартную ошибку измерения уровня подготовленности, для чего в ячейку АJ4 введём =1/СУММ(С4:АМ4) 0,5 и скопируем эту формулу в диапазон AJ4:AJ24. Результаты свидетельствуют о нелинейном характере зависимости стандартной ошибки измерения о от уровня подготовленности 0 (рис.3). Стандартная ошибка минимальна при уровне подготовленности, равном 2 логитам о(2)=0,52; максимальна при 0 = — 5, достигая значения о( — 5)=1,04.

а

V 1

0,8 -

0,4 -

0,2 1111 1111

5 -4 -3 -2 -1 0 1 2 3 4 5

Рис.3. Зависимость стандартной ошибки измерения от уровня подготовленности

Оценка погрешности измерений в баллах

Результаты выполнения выпускником заданий ЕГЭ переводятся в стобалльную шкалу сле дующим образом7. Если участник ЕГЭ не выполнил ни одного задания и получил ноль первичных баллов, он получает ноль баллов.

Если участник ЕГЭ верно выполнил все задания и получил максимально возможный первичный балл, он получает сто баллов. Баллы остальных участников ЕГЭ вычисляются с помощью линейного преобразования:

7 Методика шкалирования результатов ЕГЭ в 2008 году. М.: Федеральная служба по надзору в сфере образования; и науки, 2008. 2 с.; http://www1.ege.edu.rU/content/ view/431/166/

о

ОКРУГЛ

100

ґб 0 + 8 0-94 0 . л

max w min

0 -0 •

max min

-1'бё 0<0 min

-1'бё 0min <0 <0г 1бё 0 >0_

(13)

где Ї — балл, 0 — оценка уровня подготовленности участника ЕГЭ в логитах, 0тп — оценка в логитах, соответствующая одному исходному баллу, 0тах — оценка в логитах, соответствующая исходному баллу, на единицу меньшему максимально возможного.

Нетрудно заметить, что по уравнению (13) интервалу уровней подготовленности 0тп ... 0тах соответствует диапазон от 6 до 94 баллов ЕГЭ:

t (0 min) = ОКРУГЛ

t (0 max) = ОКРУГЛ

б Є + 8 -0,

94 .0т

0 -0 •

max min

б-Є + 8 Є - 94-0т

б(0 max -0 min )

0 -0

0 -0 •

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

max min

94 (0 max -0 min ) 0_ -0„,„

= б,

= 94.

Таким образом, баллы ЕГЭ могут принимать одно из 90 значений: 0; 6; 7; 8 ... 93; 94; 100.

Коэффициент линейного преобразования (коэффициент масштабирования оценки в логитах) по формуле (13) равен:

88

a = 0-----. (14)

max min

Тогда стандартная ошибка измерения балла ЕГЭ может быть найдена из выражения:

88 О

о, = а О =

0 -0 •

max min

(15)

Результат такого преобразования показан на рис. 4. Форма графика совпадает с формой линии графика рис.3, что объясняется линейностью преобразования. Стандартная ошибка измерения балла ЕГЭ изменяется в пределах от 4,6 до 9,2 балла.

t

Результаты теоретического исследования хорошо согласуются с немногочисленными опубликованными данными. Так, в работе В. Хлебникова8 приведена зависимость стандартной ошибки измерения от баллов ЕГЭ 2004 года по русскому языку (рис.5). Разумеется, полного совпадения графиков рис.4 и рис.5 нет — его и не может быть, поскольку это стандартные ошибки измерений, выполненных по разным общеобразовательным дисциплинам и разным наборам заданий ЕГЭ. Однако числовые значения достаточно близки, что косвенно подтверждает корректность предлагаемой методики оценки погрешности результатов ЕГЭ.

Подбор уровней трудности для набора заданий, обеспечивающего минимальную стандартную ошибку измерения

8 Хлебников В. Краткий анализ технологии и результатов единого государственного экзамена (ЕГЭ) // Педагогические измерения. 2008. № 4. С. 25-40.

Самый точный измерительный инструмент даёт минимальную ошибку при измерении любого объекта. Следовательно, лучшим следует признать тот набор заданий, при котором стандартная ошибка минимальна для испытуемого с любым уровнем подготов-

Знищ..шиш,.шншш

ленности. Формально это условие можно записать в виде:

тах^Д8;,Р1...Р)ит ))—>тт при /=1 ...и-

(16)

Попробуем найти этот идеальный вариант. Для этого в ячейку AI26 введём формулу =MAKC(AI4:AI24), которая находит максимальное значение стандартной ошибки измерения о. Далее следует подобрать уровни трудности всех заданий таким образом, чтобы минимизировать значение AI26. Встроенное в электронную таблицу Microsoft Excel средство Поиск решения легко справляется с подобными задачами. В окне Поиска решения указываем целевую ячейку AI26, диапазон изменяемых ячеек C3:AF3 (в этих ячейках хранятся значения уровней трудности всех заданий) и отмечаем направление поиска, равное минимальному значению (рис.6).

Кроме того, ограничим пределы изменения уровней трудности заданий интервалом [ — 5; 5], а для политомических заданий укажем, что уровень трудности каждого последующего шага должен быть больше уровня трудности шага предыдущего. Для увеличения точности решения можно с помощью кнопки Параметры увеличить принятое по умолчанию предельное число итераций и уменьшить относительную погрешность численного решения.

Результаты поиска решения сведены в таблицу 1. С помощью такого набора заданий можно практически выровнять ошибку для всего интервала измерения: стандартная ошибка измерения находится в сравнительно узком интервале значений о = 0,62.. .0,66, что соответствует стандартной ошибке тестового балла at= 5,5... 5,8 баллов (рис.7).

Очевидно, что реальное распределение уровней трудности заданий будет отличаться от идеального с точки зрения точности варианта, так как:

• уровни трудности заданий определяются после проведения ЕГЭ. На этапе формирования наборов заданий эти уровни неизвестны, поэтому целенаправленный’

10

4

2 -

10

20

30

40

50

60

70

80

90 100

Рис. 4. Зависимость стандартной ошибки измерения от балла ЕГЭ

10

20

30

40

50

60

70

80

90 100

Рис. 5. Стандартная ошибка измерения ЕГЭ 2004 года по русскому языку (по данным В.А. Хлебникова)

Поиск решения

Установить целевую ячейку: |$А1$26

Равной: ' максимальному значению

(• минимальному значению гИзменяя ячейки:

|$C$3:$AF$3

Ограничения:

значению:

и Предположить |

$АА$3 <= $АВ$3 $АС$3 <- $AD$3 $AD$3 <- $АЕ$3 $АЕ$3 <= $AF$3 $С$3 >=* -5 tD$3 >= -5

ж Добавить |

J J

Изменить

Удалить

Выполнить

Закрыть

Параметры

Восстановить

Справка

Рис. 6. Ввод параметров поиска решения

Таблица 1

Уровни трудности заданий, обеспечивающие минимизацию ошибки измерения

№ Уровень № Уровень № Уровень

задания трудности задания трудности задания трудности

1 -4,47 2 -4,45 3 -4,46

4 -4,46 5 -4,45 6 -4,43

7 -4,46 8 -4,35 9 -4,49

10 -2,18 11 0,95 12 1,39

13 в13 1=-1,51 в« 2=3,78 14 в 14 1=-1,51 в 14 2=3,78 15 в* 1=-1,25 в15 2=1,81 в 15 3=4,20

16 Р16 1=-1,25 в16 2=1,81 в16 3=4,20 17 в171=-0,55 в 17 2=1,78 в 77 3=4,78 в 17 4=4,83 18 в 18 1=-0,55 в 18 2=1,78 в 18 3=4,78 в 18 4=4,83

Рис. 7. Результаты минимизации стандартной ошибки тестового балла

подбор заданий по уровню трудности невозможен;

• даже при наличии достаточной статистики ответов на политомические задания представляется весьма проблематичным подбор нужного количества таких заданий с уровнями трудности каждого шага, полностью совпадающими со значениями, найденными при минимизации стандартной ошибки измерения.

Поэтому найденная минимальная стандарт-

---------------------- ная ошибка тестово-

9 Айвазян С.А., Мхитарян В.С. Приклад- го балла О = 5,5...

ная статистика и основы эконометрики. 5,8 — это предель-

ная точность, кото-

рую теоретически можно достичь при заданном количестве и структуре заданий ЕГЭ, а также математической модели оценивания. Рост реальной стандартной ошибки тестового балла может быть обусловлен:

• неоптимальностью распределения уровней трудности заданий реального варианта ЕГЭ;

• неравноценностью (непараллельностью) заданий отдельных вариантов ЕГЭ;

• субъективностью оценивания экспертами заданий части С. Так, считается допустимым расхождение оценок экспертов за задание части С, не превышающее одного балла. Для рассматриваемого варианта ЕГЭ часть С содержит шесть заданий, поэтому допустимое расхождение может достигнуть шести баллов.

Оценка минимальной погрешности измерения

Стандартная ошибка тестового балла о, характеризует случайную ошибку педагогического измерения. Оценка погрешности измерения (ошибки нахождения балла ЕГЭ) связана со стандартной ошибкой зависимостью9:

М = £-О,

(17)

М.: ЮНИТИ, 1998.

где е — аргумент функции Лапласа, при котором она равна половине выбранного значения вероятности а (табличная величина, например: а = 0,68 соответствует е = 1,0; а

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ЭЮТШ;.шиш,..шншш

= 0,90 соответствует е = 1,65; а = 0,997 соответствует е = 3,0 и т.д.).

Балл абитуриента по ЕГЭ должен рассматриваться не как конкретное числовое значение, а как интервал вида t ± At. Например, в рассмотренном выше идеальном с точки зрения точности варианте тестовому баллу , = 63 соответствует стандартная ошибка А,=5,78. Это означает:

— с вероятностью 68% балл по ЕГЭ этого выпускника находится в интервале , = 63 ± 15,78 (или 57,2 ... 68,8);

— с вероятностью 90% , = 63 ± 1,655,78 = 63 ± 9,5 (или 53,5 ... 72,5);

— с вероятностью 99,7% , = 63 ± 35,78 (или 45,6 ... 80,4).

Для наглядности зависимость доверительного интервала балла ЕГЭ от уровня подготовленности абитуриента при а = 0,90 приведена на рис. 8. Баллу ЕГЭ соответствует не линия, а полоса шириной 19 баллов. Такова наилучшая теоретически достижимая точность при использовании технологии ЕГЭ — ошибка плюс-минус 9,5 балла. При этом результат, равный 59 баллам, нельзя отличить от 50 баллов (или от 68 баллов), так как различие результатов меньше погрешности измерений.

Практическая пригодность балла ЕГЭ

Сейчас основным назначением баллов ЕГЭ стало обеспечение справедливого конкурса абитуриентов при зачислении в вузы.

Приёмные комиссии вузов учитывают баллы по общеобразовательным предметам, которые выставляются в свидетельствах о результатах ЕГЭ без указания погрешности измерения. Погрешность определения балла не учитывается, и преимущество даже в один балл оказывается решающим для зачисления в вуз, что существенно влияет на судьбу абитуриента.

При этом реальная погрешность тестового балла многократно превышает неявно заявляемую ошибку ±0,5 балла. Для рассмотренного демонстрационного варианта контрольных материалов единого государственного экзамена 2010 года по математике нижний предел стандартной ошибки балла

t±At

Рис. 8. Зависимость доверительного интервала балла ЕГЭ от уровня подготовленности выпускника при а = 0,90

для всего интервала измерения равен 5,5 балла. Соответствующий нижний предел погрешности ЕГЭ при доверительной вероятности 90% равен 9,1 балла.

Высокая погрешность баллов ЕГЭ в определённой степени нивелирует различие результатов выпускников. Например, при указанной погрешности нет оснований призна- \

вать различие между 60 и 69 баллами, пос- \

кольку различие меньше погрешности измерения.

Таким образом, баллы ЕГЭ ограниченно пригодны для обеспечения конкурса абитуриентов при зачислении в вузы.

Выводы

1. Разработанная методика позволяет оценить нижний предел погрешности баллов ЕГЭ на основе анализа количества и структуры заданий ЕГЭ, а также математической модели Partial Credit Model.

2. Реальная погрешность баллов ЕГЭ многократно превышает неявно заявляемую ошибку ±0,5 балла.

3. Без учёта погрешности измерения тестовый балл ЕГЭ слабо пригоден для обеспечения справедливого конкурса абитуриентов при зачислении в вузы.

4. Для полного решения задач ЕГЭ необходима оценка погрешности баллов каждого выпускника, а также оптимизация количества и структуры заданий с целью снижения ошибки педагогического оценивания. □

i Надоели баннеры? Вы всегда можете отключить рекламу.