О сертификации качества педагогических тестовых материалов

Шихова Ольга Федоровна

УДК 371.26 ББК 74.00 Ш 65

О СЕРТИФИКАЦИИ КАЧЕСТВА ПЕДАГОГИЧЕСКИХ ТЕСТОВЫХ МАТЕРИАЛОВ

О. Ф. Шихова

Ключевые слова: тестирование, сертификация, педагогические тестовые материалы, содержательность, репрезентативность, латентность, когнитивность, валидность.

Резюме: В статье рассматриваются этапы и критерии сертификации качества педагогических тестовых материалов.

Совершенствование процесса тестирования с целью повышения его эффективности - одна из актуальных проблем российского образования. Ее появление связано с резким увеличением масштабов тестирования, введением государственных образовательных стандартов (ГОС), требующих модернизации систем контроля и оценки качества подготовки обучающихся.

С целью совершенствования аттестационных тестовых технологий Министерством образования Российской Федерации был издан приказ о сертификации качества педагогических тестовых материалов (ПТМ), предусматривающий, в том числе, и подготовку документов, регламентирующих саму процедуру сертификации. Опубликованы также Временное положение о сертификации качества ПТМ и методические указания по подготовке их к этой процедуре [5].

Согласно Временному положению, цель сертификации заключается в повышении качества образования за счет совершенствования педагогических тестовых материалов, которые применяются для оценки знаний обучающихся в учебных заведениях Российской Федерации. При этом последовательно решаются две задачи: выявление и фиксация достигнутого уровня качества сертифицируемых тестовых материалов и разработка рекомендаций, определяющих методику совершенствования ПТМ.

Процедура сертификации качества ПТМ осуществляется в два этапа. На первом производится экспертиза тестовых материалов, предусматривающая не только оценку качества их содержания и статистических характеристик, но и оценку правильности форм заданий в ПТМ. На втором этапе педагогическим тестовым материалам, прошедшим экспертизу и удовлетворяющим утвержденным требованиям к их качеству, выдается сертификат качества, который дает право на использование ПТМ для оценки знаний обучающихся.

При подготовке педагогических тестовых материалов к процедуре сертификации авторы должны самостоятельно оценить качество их содержания,

проверить соответствие заданий требованиям тестовой формы и выявить статистические характеристики ПТМ. Причем при проведении их содержательной экспертизы рекомендуется (согласно методическим указаниям [5]) использовать следующие критерии:

• полнота отображения материала образовательной программы при отборе содержания ПТМ;

• правильность пропорций, выбранных при отображении разделов предмета (содержательных линий);

• полнота охвата требований государственных образовательных стандартов в ПТМ;

• соответствие содержания заданий знаниям, умениям и навыкам, запланированным для проверки в спецификации ПТМ;

• значимость содержания каждого задания ПТМ для целей проверки.

Однако методика расчета перечисленных критериев в вышеназванных

документах не приводится и, следовательно, на практике они будут определяться в основном интуитивно, без учета факторов, формирующих качество ПТМ. Между тем перечисленные критерии так или иначе характеризуют ва-лидность тестовых материалов, то есть степень соответствия структуры и содержания ПТМ задачам и целям педагогического контроля. Исследователи выделяют множество различных видов валидности (содержательная, соответствия, прогностическая и т. д.), но, по сути, важнейшими для педагогического тестирования являются два вида: по содержанию и по критерию [4].

Содержательная валидность определяет «репрезентативность содержания дидактического теста выборке измеряемой области навыков и знаний учебного предмета» [3, с. 21]. При определении содержательной валидности необходимо установить степень соответствия заданий теста цели диагностики, в качестве которой могут выступать требования ГОСов; требования к профессиональной подготовке; установленные уровни обученности и т. п.

Критериальная валидность (или валидность соответствия) показывает соответствие между результатами тестирования и другими формами контроля, но с использованием в них тех же заданий, что и в тесте.

Количественной мерой валидности служит обычно коэффициент корреляции Пирсона или коэффициент связи ф (фи), данные для расчета которых получаются путем оценки группой опытных независимых экспертов предъявляемых им ПТМ по тому или иному критерию.

Однако, как показывает опыт, необходимых условий для организации педагогической экспертизы ПТМ и математико-статистической обработки ее результатов в большинстве вузов нет. Кроме того, большая часть преподавателей вообще не владеет основами тестологии. Поэтому процедура определения

валидности, характеризуемой набором вышеназванных критериев, должна быть достаточно проста и понятна.

Предлагаемый подход [2, 8] отвечает этим условиям, он достаточно универсален и позволяет не только количественно выразить установленные критерии, но и оперативно определить их. В качестве основных предлагаются такие критерии, как «Содержательность» (в), «Репрезентативность структуры» (£?), «Репрезентативность ГОС» (в), «Латентность» (Щ) и «Когнитивность» (X).

Критерий «Содержательность» определяет полноту отображения материала образовательной программы в содержании тестовых заданий и рассчитывается по формуле:

Ыр

где N - число дескрипторов (базовых понятий, терминов, формул и т. п.) в тезаурусе учебной программы (учебный тезаурус - это множество дескрипторов и множество связей между ними [6]); N - число дескрипторов в тезаурусе ПТМ.

Значение данного критерия можно существенно повысить за счет расширения тезауруса педагогических тестовых материалов путем создания интегрированных, многофункциональных тестовых заданий.

Критерий «Репрезентативность структуры» позволяет сопоставить количество тестовых заданий в ПТМ по отдельным разделам (или темам) учебного предмета с объемом (в часах) этих разделов (или тем), то есть характеризует правильность пропорций при отображении в тесте разделов учебного предмета. Рассчитывается данный критерий по формуле:

Я = 1-

ГК к

к ь

V я я

где V - объем (в часах) учебного предмета;

V - объем (в часах) к-го диагностируемого модуля (например, одного из разделов физики);

Ь3 - общее количество заданий в тесте,

Ьк - количество заданий для диагностики к-го модуля.

Если 1?>1, то количество тестовых заданий в ПТМ по данному разделу (или теме) завышено. Если 1?<1, то количество заданий в тесте по данному разделу занижено. Таким образом, рассчитав критерий «Репрезентативность

структуры», можно провести соответствующую корректировку теста, стремясь приблизить значения этого критерия к единице.

Критерий «Репрезентативность ГОС» устанавливает соответствие содержания тестовых материалов требованиям государственного образовательного стандарта по изучаемой дисциплине с учетом модели специалиста, то есть характеризует полноту охвата требований ГОС в ПТМ. Рассчитывается этот критерий по формуле:

Т

Тс

где Тв - количество требований к специалисту в ГОС (или дисциплинарных требований к студенту);

Т - количество требований, диагностируемых с помощью ПТМ.

Критерий «Латентность» характеризует пригодность тестовых материалов для диагностики уровней обученности в соответствии с выбранной таксономической моделью обучения как способа описания диагностируемых целей обучения. Это может быть шестиуровневая модель Б. Блума («знание», «понимание», «применение», «анализ», «синтез», «оценка»), четырехуровневая - В. П. Беспалько («узнавание», «воспроизведение», «эвристический», «творческий»), трехуровневая - ЗУН («знания», «умения», «навыки») и другие. Термин «Латентность» введен в связи с тем, что уровень обученности относится к латентным (скрытым) параметрам, ответственным за фиксируемые в опыте тестовые результаты. Предлагаемый критерий позволяет определить соответствие содержания заданий в тесте - знаниям, умениям и навыкам, запланированным для проверки в спецификации ПТМ, и рассчитывается по формуле:

Ь-К 1т

где /т - общее количество уровней обученности в выбранной модели обучения; ^ - количество уровней обученности, диагностируемое тестом.

Критерий «Когнитивность» позволяет выявить пригодность ПТМ для оценки сформированности у обучаемых определенных видов знаний по классификации Б. Блума - Р. Гагна - В. С. Аванесова [1]. Этот классификатор сформулирован исключительно для решения задач педагогического измерения и не образует пока полной классификационной системы, но его использование позволяет более аргументированно подойти к отбору педагогических тестовых материалов. ПТМ должны разрабатываться с учетом принципа «возрастающей

трудности» учебного материала и включать задания для проверки сформиро-ванности как простейших знаний (знание названий, имен, фактов, определений и т. п.), так и алгоритмических, системных, вероятностных, метод ологиче-ских и т. п. знаний.

Рассчитывается критерий «Когнитивность» по формуле:

К=К

км

где Км - общее количество видов знаний в принятой модели обучения; Ка - количество видов знаний, диагностируемых с помощью ПТМ.

Данный критерий может учитываться при моделировании адаптивных тестов, позволяющих соотносить уровень подготовленности тестируемых с трудностью тестовых заданий.

К дополнительным критериям можно отнести: «Адаптивность» (мера соответствия среднего логита трудности заданий среднему логиту уровня обу-ченности в выборке); «Профильность» (характеризует распределение заданий в ПТМ по схеме «возрастающей трудности» с целью повышения дифференцирующей способности тестовых материалов); «Системность» (характеризует разнообразие применяемых форм тестовых заданий, типов дидактических тестов, видов тестирования и оптимальность количества заданий в ПТМ); «Верифици-руемость» (повторяемость результатов диагностики в различных выборках, статистическая надежность результатов диагностики) и др. [2, 8, 7].

Совокупность предлагаемых критериев сводит к минимуму влияние субъективных факторов при отборе и сертификации педагогических тестовых материалов. Это свойство ПТМ называется «объективированностью».

Общая оценка объективированности (качества) ПТМ может быть произведена по формуле:

т] = С^ + С2Я + СъО + СЛЬ + С5К, где С1 + С5 - соответствующие весовые коэффициенты, то есть коэффициенты «важности» критериев 1-5; их сумма должна быть равна единице (ус-

5

ловие нормировки: = 1).

1=1

Критерии 1-5 и их весовые коэффициенты определяются методом групповых экспертных оценок (ГЭО) [6]. В отличие от обычных комиссий в методе ГЭО эксперты работают независимо друг от друга, процедура отбора и опроса экспертов, разработка анкет и обработка полученных экспертных оценок про-

изводятся по определенному алгоритму в соответствие с требованиями ГОСТ 23554.1-79 [9].

Критерии с незначительными весовыми коэффициентами могут быть исключены при окончательной оценке ПТМ.

Процедура объективизации ПТМ будет заключаться в увеличении численных значений критериев за счет корректировки тестов с учетом результатов педагогического эксперимента. Все это позволит подготовить тестовые материалы к сертификации и, тем самым, будет способствовать повышению эффективности педагогического контроля в любом образовательном учреждении.

Литература

1. Аванесов В. С. Композиция тестовых заданий. - 2 - е изд. - М.: Изд-во «Адепт», 1998. - 217 с.

2. Лебедева Е. Н. Методические рекомендации по сертификации дидактических тестов для диагностики уровня обученности студентов / Под ред.

B. С. Черепанова. - Ижевск: Изд-во ИжГСХА, 1998. - 37 с.

3. Мирошниченко А. А., Казаринов А. С., Култышева А. Ю. Технология адаптационной валидности: Учебное пособие. - Глазов: Изд-во ГГПИ, 1999. -62 с.

4. Нейман Ю. М., Хлебников В. А. Введение в теорию моделирования и параметризации педагогических тестов. - М., 2000. - 168 с.

5. О сертификации качества педагогических тестовых материалов: Приказ МО РФ от 17.04.2000 г. № 1122 // Вестник образования. - 2000. - № 11.

6. Черепанов В. С. Экспертные оценки в педагогических исследованиях. - М.: Педагогика, 1989. - 152 с.

7. Черепанов В. С., Шихова О. Ф., Шихов Ю. А., Любимова О. В. К вопросу о конструировании педагогических тестов на основе квалитативной технологии // Педагогические измерения в России: Материалы конф. - М., 2002. -

C. 59-63.

8. Шихова О. Ф., Габдуллина Л. А. Критерии для оценки объективированности педагогических контрольных материалов / / Образование и наука. -2000. - № 3 (5). - С. 82-85.

9. Экспертные методы оценки качества промышленной продукции. Основные положения. ГОСТ 23554.0-79. Организация и проведение экспертной оценки качества продукции. ГОСТ 23554. 1-79. Обработка значений экспертных оценок качества продукции. ГОСТ 23554.2-81. - М.: Изд-во стандартов, 1979; 1980; 1981.

О сертификации качества педагогических тестовых материалов Текст научной статьи по специальности «Науки об образовании»

Аннотация научной статьи по наукам об образовании, автор научной работы — Шихова Ольга Федоровна

Похожие темы научных работ по наукам об образовании , автор научной работы — Шихова Ольга Федоровна

Текст научной работы на тему «О сертификации качества педагогических тестовых материалов»