Научная статья на тему 'Методология организации тестирования на основе алгоритмов планирования и обработки двухуровневых многофакторных экспериментов'

Методология организации тестирования на основе алгоритмов планирования и обработки двухуровневых многофакторных экспериментов Текст научной статьи по специальности «Науки об образовании»

CC BY
247
60
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ФАКТОРЫ ЗНАНИЯ / KNOWLEDGE FACTORS / ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА / EXPERIMENT PLANNING / ДВУХУРОВНЕВЫЕ МНОГОФАКТОРНЫЕ ЭКСПЕРИМЕНТЫ / TWO-LEVEL MULTIFACTOR EXPERIMENTS / ВАРЬИРОВАНИЕ ФАКТОРОВ / МАТРИЦА ПЛАНИРОВАНИЯ / PLANNING MATRIX / FACTOR VARIABILITY

Аннотация научной статьи по наукам об образовании, автор научной работы — Нейдорф Рудольф Анатольевич, Обухова Елена Николаевна

Исследуется декомпозиция знаний на множество «микрознаний», допускающих однозначную двоичную тестовую оценку. В таком случае задание теста формулируется как набор микрознаний ответов, совокупно раскрывающих уровень знания определённого подраздела. Это позволяет представить разработку набора ответов на тестовый вопрос как задачу исследования многофакторной зависимости. Таким образом, процесс разработки набора ответов можно рассматривать с позиций планирования многофакторного двухуровневого эксперимента. При таком подходе создание теста и оценка его результатов хорошо формализуются и становятся доступны преподавателям, не специализирующимся на разработках тестовых заданий. Методика проиллюстрирована примером построения и применения тестов для оценки уровня знаний по теории автоматического управления. Статистическая обработка результатов тестирования показала уровень знаний испытуемых, а также степень доверия тестирующего к осознанности ответа.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по наукам об образовании , автор научной работы — Нейдорф Рудольф Анатольевич, Обухова Елена Николаевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Testing design methodology based on two-level multifactor experiment planning and data processing

The decomposition of knowledge into an array of “micro-knowledge” permitting a single-valued binary test score is studied. In this case, the test task is formulated as a set of micro-knowledge responses jointly revealing the knowledge level of the specific subsection. It allows presenting the development of a set of responses to a test question as the objective of investigating the multifactor dependence. Thus, the development process of a set of responses can be considered from the perspective of planning a multifactor two-level experiment. This approach allows a good formalization of the test construction, and its result estimation which becomes available to the teachers who do not specialize in the test task development. The method is illustrated by an example of the test construction, and application to assess the knowledge level on the automatic control theory. The data statistics has shown the respondents’ knowledge level, as well as the degree of a tester’s belief to the response awareness.

Текст научной работы на тему «Методология организации тестирования на основе алгоритмов планирования и обработки двухуровневых многофакторных экспериментов»

УДК 517.977:62 й01 10.12737/4539

Методология организации тестирования на основе алгоритмов планирования и обработки двухуровневых многофакторных экспериментов*

Р. А. Нейдорф, Е. Н. Обухова

Исследуется декомпозиция знаний на множество «микрознаний», допускающих однозначную двоичную тестовую оценку. В таком случае задание теста формулируется как набор микрознаний ответов, совокупно раскрывающих уровень знания определённого подраздела. Это позволяет представить разработку набора ответов на тестовый вопрос как задачу исследования многофакторной зависимости. Таким образом, процесс разработки набора ответов можно рассматривать с позиций планирования многофакторного двухуровневого эксперимента. При таком подходе создание теста и оценка его результатов хорошо формализуются и становятся доступны! преподавателям, не специализирующимся на разработках тестовых заданий. Методика проиллюстрирована примером построения и применения тестов для оценки уровня знаний по теории автоматического управления. Статистическая обработка результатов тестирования показала уровень знаний испытуемых, а также степень доверия тестирующего к осознанности ответа.

Ключевые слова: факторы/ знания, планирование эксперимента, двухуровневые многофакторные эксперименты, варьирование факторов, матрица планирования.

Введение. Несмотря на определённые достижения в развитии тестирования, разработка методики составления тестовых материалов является на данном этапе сложной междисциплинарной проблемой [1]. Трудность внедрения тестовых методик в практику работы образовательных учреждений объясняется, в первую очередь, отсутствием у педагогов достаточной профессиональной подготовки в составлении и применении тестовых заданий. Не всегда у педагогов есть возможность освоить эти технологии. В связи с этим весьма актуальной становится задача формализации построения тестовых заданий, позволяющих сохранить высокую оценочную способность тестов. При этом важно, чтобы самостоятельно разрабатывать тесты могли преподаватели, не обладающие высокой квалификацией в данной области [2, 3].

Постановка задачи. Одной из характеристик тестового задания является количество допустимых ответов из множества предложенных. Если возможен один ответ на вопрос, тестируемый имеет оценку, выраженную долей полного знания. При этом повышается вероятность угадывания правильного ответа, вследствие чего невозможно достоверно оценить результаты тестирования.

Таким образом, для эффективной оценки подготовки по изучаемой дисциплине испытуемому с неуверенными знаниями необходимо дать возможность выбора нескольких вариантов ответов, кажущихся ему близкими к правильному. При этом не исключается возможность выбора одного ответа. В этом случае оценка знания формируется как выборочная совокупная из оценок содержательности указанных тестируемым ответов. Такой подход даёт возможность оценить степень случайности выбора ответов, которая характеризует неуверенность знаний тестируемого. Это обусловлено тем, что возникает возможность оценить близость по содержанию выбранных ответов. Слишком разнородные по оценкам ответы будут указывать на неуверенность знаний, а однородные — на близость испытуемого к истинным знаниям.

Сущность предлагаемого метода решения проблемы. Процесс разработки тестового вопроса рассматривается как построение строки, включающей п символьных переменных, обозначающих различные микрознания [4, 5]. По введённой ранее парадигме, каждому микрознанию

* Работа выполнена по теме № 2.3.13 «Метод сбалансированной дискретизации для задач имитационного моделирования динамических процессов в распределённых объектах» в рамках выполнения госзадания Минобрнауки России в части НИР.

может быть сопоставлено два варианта ответов: правильный — Yes и неправильный — No. Тогда возможный набор вариантов ответов на тестовый вопрос становится аналогичным матрице планирования многофакторного двухуровневого эксперимента, если положительный ответ — Yes заменить на +1, а отрицательный ответ — No на -1 (табл. 1).

Таблица 1

Кодовые строки-ответы и их оценки для n-факторного теста

№ строки х1 х2 х m y

1. x11= 1 x12 =1 x = 1 1m n (1)

2. -1 (0) 1 1 n - 1 (0,...)

i xi1 xi2 x.. i] x. im n - i (m)

n -1 (0) -1 (0) -1 (0) 0 (0)

Таким образом, варьируя ответы на микрознания на двух уровнях, можно получить набор строк-ответов на полный вопрос теста, реализующий все их возможные сочетания по аналогии с полным факторным экспериментом. Если количество микрознаний п выбрано, то можно найти количество различных полных ответов по формуле [6]:

N = 2к, (1)

где N — число опытов, к— число факторов, 2 — число уровней.

При оценке знаний тестируемого удобнее неправильный ответ оценивать нулём (нулевое знание), поэтому в таблице значение -1 удобно заменить на нули (указаны в скобках). Таким образом, из микрознаний как из факторов составляется вопрос-строка, а множество ответов на неё представляется как набор строк, составленных из элементов-ответов, принимающих значения 0 или 1. Варьирование ответов на этих двух уровнях позволяет реализовать полное множество строк-ответов возможных сочетаний элементов-ответов [7]. В связи с этим для микрознаний удобно, используя терминологию планирования эксперимента, применять термин «фактор знания».

Оценку у (обозначение у взято по аналогии с символом отклика в плане факторного эксперимента [6, 7]) для каждой строки возможного ответа на тестовый вопрос можно вычислять двумя способами. Первый — как абсолютную сумму оценок элементов-ответов по микрознаниям. Второй — как взвешенную относительно количества факторов сумму (указана в скобках), т. е. абсолютную сумму, делённую на количество элементов. Поэтому в более общем варианте оценки ответа взвешенной суммой по формуле

X

]=1

x

i]

у= (2)

' т

полностью правильный ответ на вопрос теста будет оценён как «1», полностью неправильный — «0», а частично правильный — дробным числом 0 < у/ < 1.

Факторный подход к построению теста помогает доступно и однозначно формализовать процедуру построения теста и оценки его результатов. Однако с ростом числа составляющих вопрос факторов знаний число вариантов ответов растёт согласно (1) в показательной зависимости.

Это ограничивает объём вопроса по составу включённых факторов знаний (следует избегать построения излишне громоздкого теста, запутывающего испытуемого).

Рассмотренные условия формирования ответов на вопросы теста, содержащие n факторов знания, можно записать в виде матрицы планирования многофакторного эксперимента, где строки соответствуют различным вариантам ответов, а столбцы — значениям факторов знаний [6-8]. Если вопросы в тесте отображают заложенные в них микрознания, то построенная таким образом матрица является универсальным инструментом построения вариантов ответов на весь тест в целом.

Необходимо заметить, что перечень подобного рода вопросов организован регулярным образом. Поэтому испытуемый, многократно проходивший тест, может понять закономерность порядка вопросов. Для устранения этого недостатка следует использовать другой приём метода планирования эксперимента — рандомизацию, т. е. перестановку в произвольном порядке строк табл. 1 — ответов теста [6, 7]. Тогда последовательность строк при повторных тестированиях будет отличаться от расположения строк в табл. 1. Например, i= 7, 4, 9, 2, 5, 1, 6... Этот стандартный приём теории планирования экспериментов позволяет уменьшить влияние на результаты опытов временного тренда, а в практике построения факторных тестов он даёт возможность снизить влияние адаптируемости испытуемых к тестам с регулярной структурой.

Кроме того, используя рандомизацию, можно увеличить количество комбинаторных вариантов последовательностей одинаковых ответов на один и тот же тестовый вопрос. В результате для небольшого набора ответов можно использовать полный комбинаторный набор вариантов ответов на каждый вопрос. Тогда количество одинаковых по содержанию, но различных по структуре вариантов тестовых ответов будет определяться по формуле вычисления количества перестановок (Р) из n по n — РЩ= n!. В этом случае рандомизацию можно использовать для организации случайной последовательности вариантов при запросе очередного теста.

Для n = 4 количество комбинаций из набора одинаковых ответов составит 24, однако для n = 8 — уже 40320. Таким образом, для n > 5 целесообразно всё-таки прибегать к рандомизации факторной таблицы.

Примеры применения факторного подхода к составлению тестов. Пример составления двухфакторного тестового задания. По передаточной функции типового динамического звена W(p) = 6,8/p найти значения вещественной и мнимой составляющих

частотной передаточной функции.

Данное тестовое задание базируется на знании освоенных ранее разделов дисциплины. Необходимо знать следующее.

1. Способ перевода передаточной функции из операторной в частотную форму представления. Для этого производится замена p = jco.

2. Способ приведения дробно-рациональной функции комплексной переменной к стандартной форме записи. Для этого числитель и знаменатель умножаются на функцию, сопряжённую знаменателю. В числителе выделяются вещественная и мнимая части, и они почленно делятся на ставший вещественным знаменатель.

При этом условии в приведённом выше вопросе можно выделить два фактора знания.

Iii \J \J \J \J U I

. Нахождение вещественной составляющей полученной частотной передаточной функции (ЧПФ) путём освобождения от мнимой составляющей в знаменателе и деления вещественной части числителя на вещественный знаменатель.

2. Нахождение мнимой составляющей той же ЧПФ делением мнимой части числителя на вещественный знаменатель.

Выделенным факторам знаний сопоставляются правильные ответы:

- вещественная составляющая ЧПФ — Re{ш (уш)} = Re 11• 6,8•ш| = Re { о - у • 6,8 • ш1} = 0;

- мнимая составляющая ЧПФ — 1т{ш (уш)} = 1т |о - у • — 1 =-6,8 • ш-1.

Неправильные ответы формируются с учётом характерных ошибок, допускаемых студентами по данному материалу. Важно также придерживаться принципа правдоподобия, когда в ответе присутствуют структуры и константы, связь которых с содержанием вопроса хорошо просматривается, например:

- вещественная составляющая ЧПФ — Re {Ш (_/ш)} = 6,8 ;

- мнимая составляющая ЧПФ — 1т {Ш (уш)} = ш-1.

Комбинируя факторы знания — правильные и неправильные ответы, можно составить все возможные строки ответов тестового задания, представленные ниже.

1. Вещественная составляющая: Re {Ш (уш)} = 0; мнимая составляющая: 1т {Ш (уш)} = - 6,8уш-1.

2. Вещественная составляющая: Re {Ш (уш)} = 6,8; мнимая составляющая: 1т {Ш (!'ш)} = = - 6ДдоЛ

3. Вещественная составляющая: Re {Ш (уш)} = 0; мнимая составляющая: 1т {Ш (уш)} = - 6,8уш-1.

4. Вещественная составляющая: Re {Ш (уш)} = 6,8; мнимая составляющая: 1т {Ш (!'ш)} = = - 6,8 уш-1.

В этих строках содержится абсолютно правильный ответ на вопрос, содержащий два верных ответа по факторам знаний и абсолютно неправильный ответ, содержащий два неверных ответа и два полуправильных ответа, содержащие один верный и один неверный ответы по факторам знаний. Если варианты правильных ответов по факторам знаний обозначить +1, а неправильный --1, то сведённые в таблицу варианты ответов образуют структуру, аналогичную матрице планирования полного факторного эксперимента (табл. 2).

Таблица 2

Таблица кодовых строк-ответов и их оценок для двухфакторного теста

№ строки х1 Х2 у1

1. 1 1 1

2. -1 (0) -1 (0) 0

3. 1 -1 (0) 0,5

4. -1 (0) 1 0,5

Имея ввиду, что отрицательного знания быть не может, а минимально возможное знание может быть нулевым, естественно сместить весовые оценки отрицательных ответов к нулевому значению (в таблице — в скобках). Тогда каждой строке ответов можно сопоставить коэффициент, определяемый, например, как среднее от совокупности ответов (обозначенный в табл. 2 как у).

Возможны и другие способы количественной оценки результата такого тестирования, но здесь выбран наиболее простой, естественный и понятный.

Аналогичным образом можно подойти к составлению трёхфакторного тестового задания, которое будет содержать строку с тремя факторами знаний [4, 5, 8].

Пример составления полного трёхфакторного тестового задания. По передаточной функции апериодического звена W (p) = 1/(5р +1) найти значения модуля и фазы частотной передаточной функции, а также представить её в показательной форме.

В данном тестовом задании присутствуют три фактора знания.

1. Умение аналитически находить амплитудно-частотную характеристику. Для этого выделяются вещественная и мнимая составляющие ЧПФ. Затем они вводятся в формулу, определяющую модуль ЧПФ A (ш) = W (j)| = л/Re2+Im2 .

2. Умение аналитически находить фазочастотную характеристику. Для этого выделяются вещественная и мнимая составляющие ЧПФ. Затем они вводятся в формулу, определяющую аргумент ЧПФ ф (ш) = arg W (jw) = arctg (Im/ Re).

3. Умение представить частотную передаточную функцию в показательной форме с использованием рассчитанных значений модуля и аргумента ЧПФ по формуле W (jw) = A(ш) • е;ф(ш).

Соответственно факторам знаний сопоставляются правильные ответы:

- амплитудно-частотная характеристика ЧПФ — A(w) = 1/V1 + 25ш2 ;

- фазочастотная характеристика ЧПФ — ф (ш) = - arctg (5ш);

- показательная форма ЧПФ — W (jw) = (i/Vi + 25ш2) • e j arctg5w .

Аналогично приведённому выше двухфакторному тестовому заданию составляются неправильные ответы — также на основе распространённых неправильных ответов и по принципу правдоподобия:

- амплитудно-частотная характеристика ЧПФ A (ш) = 1/ (1 + 5ш2);

- фазочастотная характеристика ЧПФ ф (ш) = arctg (5ш )2;

- показательная форма ЧПФ W (jш) = (5ш/(1 + 5ш2)) • e;'.

Комбинируя между собой верные и неверные ответы по факторам знания всеми возможными способами, получаем полный трёхфакторный тест, состоящий из 8 строк ответов.

1) АЧХ — A(m) = 1/V1 + 25ш2 ; ФЧХ — ф(ш) = -arctg(5ш); показательная форма — W (jco) = (VV1 + 25ш2) • ej are,g5<0 .

2) АЧХ — A(ш) = 1 (1 + 5ш2); ФЧХ — ф(ш) = arctg(5ш)2; показательная форма — W (j-ш) = (5ш/(1 + 5ш2)) • ej arct9ш .

3) АЧХ — A^) = 1/V1 + 25ш2 ; ФЧХ — ф(ш) = arctg(5ш) ; показательная форма — W (jco) = (VV1 + 25ш2) • e ] arct95ш .

4) АЧХ — A (ш) = 1 (1 + 5ш2); ФЧХ — ф (ш) = - arctg (5ш); показательная форма — W (ju) = (VV1 + 25ш2) • e ] arct95ш .

5) АЧХ — A^) = 1/V1 + 25ш2 ; ФЧХ — ф(ш) = -arctg(5ш); показательная форма — W (j-ш) = (5ш/(1 + 5ш2)) • ej arct9ш .

6) АЧХ — А(м) = 1/ (1 + 5м2); ФЧХ — ф (м) = аг^д (5м)2; показательная форма — W (ум) = (^1 + 25м2) • е ] агс'д5м .

7) АЧХ — А (м) = 1/ (1 + 5м2); ФЧХ — ф(м) = -aгctg(5м); показательная форма — W (ум) = (5м/(1 + 5м2)) • еу агсЛдм .

8) АЧХ — А(м) = 1Д/Т + 25м2; ФЧХ — ф(м) = аг^д(5м) ; показательная форма — W (ум) = (5м/(1 + 5м2)) • еу агсЛдм .

Аналогично предыдущему примеру на вопрос по каждому фактору знания можно дать правильный и неправильный ответы. Поэтому варьирование ответов по трём факторам знания на двух уровнях также позволяет применить матрицу планирования полного факторного эксперимента для полного трёхфакторного теста, представленную в табл. 3.

Таблица 3

Таблица кодовых строк-ответов и их оценок для 3-факторного теста

№ строки х1 Х2 Х3 У,

1. 1 1 1 1

2. -1 (0) -1 (0) -1 (0) 0

3. 1 -1 (0) 1 0,67

4. -1 (0) 1 1 0,67

5. 1 1 -1 (0) 0,67

6. -1 (0) -1 (0) 1 0,33

7. -1 (0) 1 -1 (0) 0,33

8. 1 -1 (0) -1 (0) 0,33

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таким образом, методика составления тестов на основе планирования факторного эксперимента позволяет конструировать трёхфакторные тестовые задания, содержащие 8 строк ответов. Необходимо отметить важное преимущество таких тестов: увеличение количества факторов знаний приводит к общему увеличению числа ответов — и вероятность угадывания правильного ответа уменьшается. Тест получается более содержательным в смысле градации уровня знаний тестируемого, так как включает уже две дробные оценки знаний, соответствующие двум правильным ответам из трёх (0,67) и одному правильному ответу (0,33). В таком случае при пороге знания 0,6 ответивший на два вопроса получит зачёт по тесту, т. е. вероятность сдачи зачёта (прохождения теста) составляет 0,5. В двухфакторных тестах такая вероятность составляет 0,25.

Однако трёхфакторные тесты имеют и недостатки. Они получаются достаточно громоздкими. Это увеличивает время на ответ, и тестируемый испытывает повышенную психологическую нагрузку. Соответственно, растёт вероятность случайной ошибки, ведь внимание рассредоточено на восемь строк ответов.

В связи с этим для упрощения процедуры тестирования был предложен подход [6], при котором каждое полное трёхфакторное тестовое задание декомпозируется на усечённые трёх-факторные тестовые задания (аналог дробных реплик в теории планирования экспериментов). Сущность такого подхода кратко освещена ниже.

Разбиение полного трёхфакторного теста на усечённые дробные реплики. Принцип формирования усечённого дробного тестового задания заключается в том, что необходимо составить дробную реплику из четырёх вариантов ответов [6]. При этом реплика обязательно должна содержать правильный и неправильный ответы, т. к. категорически нельзя лишать тестируемого

возможности продемонстрировать полное знание вопроса или его отсутствие. В связи с этим строки ответов, имеющие различные оценки по сумме факторов знаний, комбинируются друг с другом таким образом, что в каждом усечённом тестовом задании присутствуют строки ответов с оценками 0,33 и 0,67. Такой принцип также кажется обязательным, поскольку наличие двух неполных ответов с оценками 0,67 повышает вероятность завышения оценки за счёт угадывания, а наличие двух неполных ответов с оценками 0,33 гарантированно и, возможно, неоправданно занижает оценку выбирающего второй ответ в дополнение к правильному. Иными словами, необходимо чтобы в тесте содержался весь спектр ответов. Так, в усечённом тестовом задании, приведённом ниже, помимо абсолютно правильной и неправильной строки ответа имеются строки с оценками, составляющими 0,33 и 0,67 балла, которые соответствуют срокам № 5 и № 7 в полном трёхфакторном тестовом задании.

Пример составления усечённого трёхфакторного тестового задания. По передаточной функции апериодического звена V (р) = 1/ (5р +1) найти значения модуля и фазы комплексной передаточной функции и представить её в показательной форме.

1) АЧХ — А(ш) = 1Д/1+25Ш2; ФЧХ — ф (ш) = -агЛд (5ш); показательная форма —

V (уш) = (1Д/1 + 25ш2) • е ] агс'д5ш .

2) АЧХ — А(ш) = 1 (1 + 5ш2); ФЧХ — ф (ш) = ап^д (5ш)2; показательная форма —

V (уш) = (5ш/(1 + 5ш2)) • е; агс'дш .

3) АЧХ — А(ш) = 1/л/1 + 25ш2 ; ФЧХ — ф (ш) = -агЛд (5ш); показательная форма —

V (уш) = (5ш/(1 + 5ш2)) • еу агс'дш .

4) АЧХ — А (ш) = 1 (1 + 5ш2); ФЧХ — ф(ш) = -агЛд(5ш); показательная форма —

V (уш) = (5ш/(1 + 5ш2)) • еу агс'дш .

Строки ответов сводятся в табл. 4, где правильные ответы на факторы знания х1, х2 и

х3 кодируются +1, а неправильные--1. Каждая строка ответов имеет определённый весовой

коэффициент, обозначенный у,.

Таблица 4

Таблица кодовых строк-ответов и их оценок для усечённого 3-факторного теста

№ строки х1 х2 х3 У,

1. 1 1 1 1

2. -1 (0) -1 (0) -1 (0) 0

3. 1 1 -1 (0) 0,67

4. -1 (0) 1 -1 (0) 0,33

При повторном использовании данного тестового задания строки табл. 5 в результате рандомизации с большой вероятностью будут расположены в последовательности, отличной от табл. 4 согласно вышеизложенной теории.

Примеры использования факторного тестирования. По составленным двухфакторным заданиям были проведены тестирования в группах, изучающих дисциплину «Теория автоматического управления». Перед испытуемыми ставилась задача выбора правильной строки ответов. Не-

уверенные в собственных знаниях учащиеся могли выбрать два наиболее правильных, на их взгляд, ответа. По результатам тестирования рассчитывались:

- оценки (в среднем) знаний, продемонстрированных учащимися;

- степень доверия тестирующего к знаниям учащихся, с учётом их неуверенности.

Таблица 5

Рандомизированная таблица 3-факторного теста

№ строки х1 Х2 Х3 У,

3. 1 1 -1 (0) 0,67

1. 1 1 1 1

4. -1 (0) 1 -1 (0) 0,33

2. -1 (0) -1 (0) -1 (0) 0

Пример двухфакторного тестирования. В табл. 6 приведён результат тестирования с использованием двухфакторных тестовых заданий. Статистическая обработка тестовой выборки производилась в соответствии с известным математическим аппаратом, используемым для обработки результатов экспериментов [9]. В различных формах статистическую обработку используют при сдаче единых экзаменов в России [1] и за рубежом [2, 3].

Таблица 6

Результаты тестирования и расчёт средних оценок знаний

Номер тестируемого (у)

1 2 3 4 5 6 7 8 9 10 11

т—1 <и У1 1 0,5 0,5 1 1 0 0,5 0,5 1 0 1

X го У 2 1 1 0,5

го го Балл 1 1 0,75 0,75 1 0,75 0 0,5 0,5 1 0 1

13 £ Дисп. 1 — 0,125 0,125 — 0,125 — — — — — —

СКО1 0 0,35 0,35 0 0,35 0 0 0 0 0 0

см <и У1 1 0,5 1 1 1 1 0,5 0 0,5 0,5 1

X го С! У 2 0,5

го го Балл 2 1 0,5 1 1 1 1 0,5 0 0,5 0,5 1

13 £ Дисп. 2 — 0 — — — — — — — — —

СКО 2 — 0 0 0 0 0 0 0 0 0 0

со <и У1 1 0,5 1 0,5 0 1 0,5 0 0,5 0,5 1

X го У 2 1 0 0

го го Балл 3 1 0,5 1 0,5 0,5 1 0,25 0 0,25 0,5 1

13 Дисп. 3 — — — — 0,5 — 0,125 — — —

£ СКО 3 0 0 0 0 0,7 0 0,35 0 0,35 0 0

IV <и У1 1 0 1 1 0,5 1 1 0 0,5 0 0,5

X го У2 0,5 0,5

го го Балл 7 1 0 1 1 0,5 1 0,75 0,25 0,5 0 0,5

ь Дисп. 7 0,125 — — —

£ СКО 7 0 0 0 0 0 0 0,35 0,35 0 0 0

Сред. оценка 0,92 0,46 0,96 0,85 0,82 0,78 0,57 0,25 0,39 0,35 0,78

Дисп. по тесту — 0,017 0,017 — 0,089 — 0,035 0,017 0,017 — —

СКО по тесту 0 0,13 0,13 0 0,29 0 0,18 0,13 0,13 0 0

В табл. 6 введены следующие обозначения: у — оценка выбранной строки ответа; балл — среднее значение оценок выбранных тестируемым строк ответов; дисп. — дисперсия по тестовому заданию; СКО — среднее квадратическое отклонение от оценки по тестовому заданию; сред. оценка — средняя суммарная оценка за тест.

По результатам двухфакторного тестирования были построены столбчатые гистограммы, представленные на рис.

- □ +СКО Опенка Ш -С ECO

0,8 ■ § 0,'E- ■ я И —

- - - - 1

- -

0,2 ■ -

12 14 5 6 7В Тестируемые 9 110 11

Рис. Иллюстрация оценок знаний и степени их неуверенности, полученных с использованием двухфакторных тестовых заданий

Столбчатые диаграммы построены по полученным усреднённым оценкам тестируемых по всему тесту. От средней оценки, полученной за тест, вверх и вниз отложено значение средне-квадратического отклонения. Сформированный диапазон указывает на область возможных значений оценки знаний и характеризует неуверенность ответа тестируемого студента. Так, например, у испытуемых, выбравших в качестве ответов по одной строке в каждом тестовом задании, дисперсия и соответствующее ей СКО, показывающее степень неуверенности знаний, равны нулю [10]. Это указывает на уверенность частичных знаний как по отдельному тестовому заданию, так и по тесту в целом, которую наглядно иллюстрируют столбчатые диаграммы под номерами 1, 4, 6, 10, 11 (см. рис.).

По результатам тестируемых, проявивших неуверенность и указавших две строки ответов, построены столбчатые гистограммы под номерами 2, 3, 5, 7, 8, 9. В данном случае неуверенность знаний характеризует значение дисперсии или её среднеквадратического отклонения от ожидаемой усреднённой оценки. Из построенных столбчатых диаграмм видна обратная зависимость статистических характеристик и степени доверия, т. е. чем больше среднеквадратическое отклонение от усреднённой оценки знаний по тесту, тем меньше доверия к таким знаниям. Выводы. Рассмотренные примеры демонстрируют хороший уровень формализации и удобство составления тестов на основе методики многофакторного планирования двухуровневых экспериментов. Кроме того, хорошо формализуется оценка результатов теста, что повышает его объективность.

Важным нововведением является допущение своеобразной «нечёткости» ответа на вопрос теста. Его следствие — двухпараметрическая оценка результата теста: оценка неполного знания и степени уверенности этого знания.

Результаты тестирований с использованием двухфакторных и трёхфакторных заданий подтвердили положительную роль факторности теста, помогающей ранжировать испытуемых с неуверенными знаниями. Библиографический список

1. Ефремова, Н. Ф. Тестовый контроль в образовании / Н. Ф. Ефремова. — Москва : Логос : Университетская книга, 2007. — 386 с.

2. Curriculum Frameworks for Mathematics and Science / general editor D. Robitalle // TIMMS Monograph № 1. — Vancouver : Pacific Educational Press, 2003. — 616 p.

3. Measuring student knowledge and skills. A New Framework for Assessment / Organization for Economic Co-operation and Development (OECD). — Paris : OECD Publications Service, 1999. — 84 p.

4. Нейдорф, Р. А. Методология построения тестов на основе алгоритма планирования двухуровневых многофакторных экспериментов [Электронный ресурс] / Р. А. Нейдорф, Е. Н. Обухова // Информационные технологии в управлении: сб. тр. V Российской междунар. конф. — Санкт-Петербург, 2012. — 1 электрон. опт. диск (CD-ROM).

5. Нейдорф, Р. А. Методика составления тестовых заданий на основе алгоритма планирования двухуровневых многофакторных экспериментов и анализ их использования в образовательном процессе [Электронный ресурс] / Р. А. Нейдорф, Е. Н. Обухова // Методики и технологии обеспечения и оценки качества образования: сб. мат-лов междунар. науч. конф. (Киев, 26-28 июня). — Киров : МЦНИП, 2013. — 1 электрон. опт. диск (CD-ROM).

6. Чернова, Н. А. Статистические методы планирования экстремальных экспериментов / Н. А. Чернова, В. В. Налимов. — Москва : Наука, 1965. — 340 с.

7. Адлер, Ю. П. Планирование эксперимента при поиске оптимальных условий / Ю. П. Адлер, Е. В. Маркова, Ю. В. Грановский. — Москва : Наука, 1976. — 274 с.

8. Нейдорф, Р. А. Анализ применения трёхфакторных дробных тестов в учебном процессе / Р. А. Нейдорф, Е. Н. Обухова // Математические методы в технике и технологиях — ММТТ-26 : сб. тр. XXVI междунар. науч. конф. / под общ. ред. А. А. Большакова. — Нижний Новгород, 2013. — Т. 9, секция 11. — С. 320-323.

9. Вентцель, Е. С. Теория вероятностей и её инженерные приложения / Е. С. Вентцель, Л. А. Овчаров. — 3-е изд. — Москва : Академия, 2003. — 464 с.

10. Нейдорф, Р. А. Методика статистического расчёта балла тестируемого с выделением области неуверенности знаний [Электронный ресурс] / Р. А. Нейдорф, Е. Н. Обухова // Системный анализ, управление и обработка информации : сб. тр. IV Междунар. науч. семинара (п. Дивно-морское, 29 сент. — 3 окт. 2013). — 1 электрон. опт. диск ^D-ROM).

Материалы поступили в редакцию 02.07.2013.

References

1. Yefremova, N. F. Testovyy kontrol v obrazovanii. [Test check in education.] Moscow: Logos: Universitetskaya kniga, 2007, 386 p. (in Russian).

2. Robitalle, D., gen. ed. Curriculum Frameworks for Mathematics and Science. TIMMS Monograph № 1. Vancouver: Pacific Educational Press, 2003, 616 p.

3. Measuring student knowledge and skills. A New Framework for Assessment. Organization for Economic Co-operation and Development (OECD). Paris: OECD Publications Service, 1999, 84 p.

4. Neydorf, R. А., Obukhova, E. N. Metodologiya postroyeniya testov na osnove algoritma plani-rovaniya dvukhurovnevykh mnogofaktornykh eksperimentov. [Methodology of test construction based on planning algorithm for two-level multifactor experiments.] Informatsionnyye tekhnologii v upravlenii: sb. trudov V Rossiyskoy mezhdunar. konf. [Information technologies in management: Proc. V Rus. Int. Sci. Conf.] 1 electronic optical disc (CD-ROM). Saint Petersburg, 2012 (in Russian).

5. Neydorf, R. А., Obukhova, E. N. Metodika sostavleniya testovykh zadaniy na osnove algoritma planirovaniya dvukhurovnevykh mnogofaktornykh eksperimentov i analiz ikh ispolzovaniya v obrazovate-lnom protsesse. [Methods of test task preparation based on planning algorithm for two-level multifactor experiments, and analysis of their application in educational process.] Metodiki i tekhnologii obespecheniya i otsenki kachestva obrazovaniya: sb. materialov mezhdunar. nauch. konf. (Kiyev, 26-28 iyunya). [Methods and technologies of ensuring and assessing quality of education: Proc. Int. Sci. Conf. Kiev, 26-28 June.] 1 electronic optical disc (CD-ROM). Kirov: MTsNIP, 2013 (in Russian).

6. Chernova, N. A., Nalimov, V. V. Statisticheskiye metody planirovaniya ekstremalnykh eksperimentov. [Statistical methods of extreme experiment planning.] Moscow: Nauka, 1965, 340 p. (in Russian).

7. Adler, Y. P., Markova, E. V., Granovsky, Y. V. Planirovaniye eksperimenta pri poiske optimal-nykh usloviy. [Experiment design in search for optimal conditions.] Moscow: Nauka, 1976, 274 p. (in Russian).

8. Neydorf, R. A., Obukhova, E. N. Analiz primeneniya trekhfaktornykh drobnykh testov v uchebnom protsesse. [Analysis of three-factor fractional test application in educational process.] Ma-tematicheskiye metody v tekhnike i tekhnologiyakh — MMTT-26: sb. trudov XXVI mezhdunar. nauch. konf. [Bolshakov, A. A., ed. Mathematical methods in engineering and technologies — MMTT-26: Proc. XXVI Int. Sci. Conf.] Nizhny Novgorod, 2013, vol. 9, sec. 11, pp. 320-323 (in Russian).

9. Ventzel, E. S., Ovcharov, L. A. Teoriya veroyatnostey i yeye inzhenernyye prilozheniya. [Probability theory and its engineering applications.] 3rd ed. Moscow: Akademiya, 2003, 464 p. (in Russian).

10. Neydorf, R. A., Obukhova, E. N. Metodika statisticheskogo rascheta balla testiruyemogo s vydeleniyem oblasti neuverennosti znaniy [Statistical methods of testee's credit points calculation with selection of knowledge uncertainty]. Sistemnyy analiz, upravleniye i obrabotka informatsii: sb. trudov IV Mezhdunar. nauch. seminara (p. Divnomorskoye, 29 sent. — 3 okt. 2013) [System analysis, management, and information processing: Proc. IV Int. Sci. Seminar (Divnomorskoye, 29 Sept. — 3 Oct.)] 1 electronic optical disc (CD-ROM) (in Russian).

TESTING DESIGN METHODOLOGY BASED ON TWO-LEVEL MULTIFACTOR EXPERIMENT PLANNING AND DATA PROCESSING*

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

R. A. Neydorf, E. N. Obukhova

The decomposition of knowledge into an array of "micro-knowledge" permitting a single-valued binary test score is studied. In this case, the test task is formulated as a set of micro-knowledge responses jointly revealing the knowledge level of the specific subsection. It allows presenting the development of a set of responses to a test question as the objective of investigating the muttifactor dependence. Thus, the development process of a set of responses can be considered from the perspective of planning a muttifactor two-level experiment. This approach allows a good formalization of the test construction, and its result estimation which becomes available to the teachers who do not specialize in the test task development. The method is illustrated by an example of the test construction, and appiication to assess the knowledge level on the automatic control theory. The data statistics has shown the respondents' knowledge level, as well as the degree of a tester's belief to the response awareness. Keywords: knowledge factors, experiment planning, two-level multifactor experiments, factor variability, planning matrix.

* The work is done on 2.3.13 theme "Balanced discretization method for tasks of dynamic process simulation modeling in distributed objects" within the frame of the Ministry of Education and Science of the Russian Federation thematic research plan.

i Надоели баннеры? Вы всегда можете отключить рекламу.