Научная статья на тему 'Математическая модель оценки результатов тестирования'

Математическая модель оценки результатов тестирования Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1151
142
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бочко С. Б., Изимов М. У.

В статье обсуждаются проблемы образовательной деятельности и улучшения ее качества. Предлагается методика построения математической модели оценки качества тестирования, основанная на системном анализе образовательного процесса. Предлагаемая модель учитывает сложность заданий, входящих в тест, время и вес ответа

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The paper discusses the problems of educational activities and improvement of educational quality. We propose the method of construction of.mathematical model of estimate of testing quality, based on system analysis of educational process. The suggested model takes making up the test and duration and weight of reply.

Текст научной работы на тему «Математическая модель оценки результатов тестирования»

Вестник ТГПУ. 2004. Выпуск б (43). Серия: ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ

nuni FuncE(num,l,M)

4707 х*(х+х*х)+(х*х)/(х/х-х/х)

4708 х*(х+х*х)+(х)/х

4709 х*(х+х*х)+(хУ(х*х+х*х)

47 Ю х*(х+х*х)+(х)/(хфх+х)

4711 х*(х+х*х)+(х)/(х*х+х/х)

• • • • • •

1948695 (х/х-х/хУ(х/х+х/х)-(х-х)*(х*х+х*х)

1948696 (хУх-х/хУ(х/х+х/х)-(х-х)*(х*х+х)

1948697 (х/х-х/хУ(х/х+х/х)-(х-х)*(х*х+х/х)

1948698 (х/х-х/хУ(х/х+х/х)-(х-х)ф(х-гх*х)

ных объектов (возможно бесконечную). Запишем основные этапы метода построения генерирующею алгоритма:

1. Проводятся исследования с целью прямого преобразования информационной модели в фиксированное дерево И/ИЛИ.

2. Если прямого преобразования не найдено или оно не эффективно, то проводятся исследования с целью получения алгоритма построения дерева И/ИЛИ.

3. Проводятся исследования свойств полученного дерева И/ИЛИ или алгоритма построения.

4. Производятся исследования, связанные с удалением бесконечностей (рекурсии) и ограничением глубины рекурсии.

Данный метод был использован для разработки алгоритмов генерации тестовых заданий в компьютерных учебных программах [12].

Литература

1. Гульден Я.. Джексон Д. Перечислительная комбинаторика. М.. 1990

2. Стенли Р. Перечислительная комбинаторика. М., 1990

3. Akl S.G. A comparison of combination generation methods II ACM Trans, of Math. Software. 1981. № 7.

4. AW S.G. Adaptive and optimal parallel algorithms for enumerating permutations and combinations II The Computer J. 1987. № 30

5. Slagle J.R. A heuristic program that solves symbolic integration problems in freshmen calculus IIE. Feigenbaum and J. Feldman, editors. Computer and Thought, pages 192-203, McGraw-Hill. N.-Y., 1963.

6. Nilsson N. Principles of artifical intelligence. Spring Veriag. 1983.

7. Ефимов Е.И. Решатели интеллектуальных задач. М.. 1982.

8. Братко И. Программирование на языке Пролог для искусственного интеллекта. М., 1990.

9. Ландо С.К Комбинаторика. М.. 1994.

10. Makinen Е. Ranking and unranking left szilard languages. University of Tampere. Depanament of Computer Science, Series of Publications AA-1997-2, Jan.. 1997.

11. Axo А.. Ульман Дж. Теория синтаксического анализа, перевода и компиляции. Т. 1. М.. 1978.

12. Кручинин В.В. Генераторы в компьютерных учебных программах. Томск, 2003.

УДК 519.711.3

С.Б. Бочки, М.У. Ишиов

МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ОЦЕНКИ РЕЗУЛЬТАТОВ ТЕСТИРОВАНИЯ

Братский государственный технический университет

В связи с повышением интенсивности образовательного процесса и увеличением доли самостоятельной работы студентов возрастают и требования к эффективности подачи учебного материала и контролю знаний. Причем это относится как к студентам очной, заочной и дистанционной форм обучения, так и к специалистам, проходящим переподготовку и повышающим свою квалификацию. В первую очередь это связано с образовательными задачами, направленными на повышение учебной активности обучающихся и эффективности механизмов контроля. Л создание электронных обучающих и контролирующих систем

- это один из наиболее перспективных направлений решения подобных задач. Простым и в то же время эффективным и обязательным компонентом таких систем является подсистема тестирования. В статье рассматриваются вопросы разработки математической модели оценки результатов теста на основе системного анализа различных типов тестов и требований к ним.

Тест - это система заданий, следовательно, как и любая система, обладает составом, целостностью и структурой. Тест состоит из набора заданий, правил применения, оценок за выполнение заданий, выходных рекомендаций. Под целостностью понимается взаимосвязь заданий: ни одно из заданий не может быть изъято из теста без потери качества. Структура теста определяется способом связи заданий между собой. Чаще всего используется факторная структура, когда каждое задание связано с другими через общее содержание и общую часть вариации тестовых результатов.

Проявлению системных качеств способствует единая дисциплинарная общность заданий. Совокупность таких заданий образует гомогенный тест, если измеряется какое-либо одно качество (свойство). Время выступает как еще один системообразующий фактор, так как одним из наиболее важных требований к тестам является возможность использования их для быстрого и точного оценивания больших кон-

С. Б. Бочко. М.У. Изимов. Математическая модель оценки результатов тестирования

тингеитов испытуемых. Требование экономии времени является естественным в различных массовых процессах, в частности в образовании. И с этой точки зрения, наиболее эффективным является использование тестов с одним или несколькими правильными ответами.

Одним из главных достоинств единого государственного экзамена (ЕГЭ) является обеспечение унифицированного подхода к оценке результатов экзамена. И. на наш взгляд, такой подход необходимо использовать в течение всего процесса обучения - начиная вступительными экзаменами и заканчивая выпускными квалификационными экзаменами. Последний тезис предполагает наличие централизованной базы данных (тестов), основным требованием к которой является ее представительность, базирующаяся на возможности ее пополнения и обновления.

Под эффективным тестом чаще всего понимается тест, наиболее точно соответствующий критериям эффективности (качества). Качество теста определяется его содержанием, мерой его надежное™ и валидностью полученных результатов. При отборе содержания теста используются следующие критерии:

- значимость - включение в тест наиболее важных. ключевых (структурных) элементов знания;

- научная достоверность - включение объективно истинных элементов знания, поддающихся некоторой рациональной аргументации;

- соответствие уровню современного состояния науки и техники;

- репрезентативность;

- вариативность содержания;

- системность содержания;

- комплексность и сбалансированность содержания;

- взаимосвязь содержания и формы - форма тестового контроля определяет содержание;

- дифференцирующая способност ь теста;

- соответствие целям тестирования и т.д.

Для оценки результатов тестирования /?7' предлагается использовать следующую формулу:

О)

где /- индекс, соответствующий номеру задания; Л'~ количество заданий теста; а, - сложность /-го задания; р, - коэффициент, учитывающий время ответа на /'-е задание; <ру- вес у-го ответа в /-м задании; ф,-оптимальное время ответа на /-е задание.

Чтобы исключит ь фактор случайного «попадания» на правильный ответ, <ру можно задать следующим образом:

О, если выбран ответ «не знаю», а/ /Ь-, если выбран правильный ответ, -с.!Ь

(2)

*>р если выоран неправильный ответ.

где а - количество правильных отвегов: Ь - общее количество отвегов; с - количество неправильных ответов.

Чтобы учесть время ответа, р, можно задать следующим образом:

1, если время ответа <= ф,,

Р, (ф,) = 0.5, если время ответа > 3 * ф., (3)

(/,/ф()' \ во всех остальных случаях, где / - время ответа па ¡-е задание; ф,- эталонное время ответа.

Предложенная модель оценки результатов тестирования обладает рядом достоинств, к которым в первую очередь можно отнести:

- исключается факгор случайного «попадания» на правильный ответ;

- используются все данные, полученные при тестировании, в частности, неверные ответы, которые несут больше информации об уровне знаний тестируемого, чем верные ответы:

- учитывается время отвега (скорость ответа);

- при увеличении выборки N (количество заданий) увеличивается надежность и валидность теста, например, при использовании заданий, предполагающих ответ «да» или «нет» и использующих вопросы одинаковой сложности б в предположении, чго испытуемый выбирает ответы случайным образом, традиционные методики оценки результатов тестирования дают величину б*N/2; оценка, выполненная по нашей методике, дает величину 0;

- увеличивается шкала оценки результатов, например, для теста, описанного в предыдущем пункте, традиционные методики оценки задают эту шкалу отрезком [0, N*6], при использовании нашей методики эта шкала задается отрезком [-2*^*6, 2*А,Г*5].

Предложенная методика оценки результатов тестирования использована нами в программе «Генератор тест ов», которая написана на языке СИ. Программа относится к категории «свободно распространяемое ПО», и ее можно «скачать» с сайта Братского государственного технического университета (brstu.ru).

i Надоели баннеры? Вы всегда можете отключить рекламу.