Научная статья на тему 'Модели и процедуры интервальной оценки результатов контроля знаний в компьютерных системах тестирования ВМФ'

Модели и процедуры интервальной оценки результатов контроля знаний в компьютерных системах тестирования ВМФ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
124
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНТЕРВАЛЬНАЯ ОЦЕНКА / ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ / БИНОМИНАЛЬНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ / INTERVAL ESTIMATION / CONFIDENCE INTERVALS / BINOMIAL DISTRIBUTION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Печников Д.А.

В данной статье рассматривается существующие и перспективные модели и процедуры интервальной оценки результатов контроля знаний в компьютерных системах с применением биноминального закона распределения и геометрического распределения, как частного случая отрицательного биноминального распределения. С целью перейти от точечных оценок эмпирической частости к адекватным теоретически обоснованным оценкам вероятности правильного действия, которые имеют количественно оцениваемый доверительный интервал. В тенденциях развития ТОС ВМФ отмечается следующий ряд основных противоречий: 1) между ростом возможностей ТОС как средств моделирования управляемых объектов и неизменностью их дидактических характеристик; 2) между необходимостью индивидуализации процесса подготовки и ограниченными психофизиологическими возможностями обучающих по управлению обучением в группах с количественным составом более 5-7 обучаемых; 3) между ростом числа и сложности задач управления обучением и неизменностью психофизиологических возможностей руководителей обучения. В качестве средства разрешения этих противоречий рассматривается автоматизация в ТОС ВМФ функций управления обучением.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Печников Д.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Models and procedures for interval evaluating the results of control of knowledge in computer systems testing of Navy

To implement effective military and professional training of Navy specialists, a corresponding educational and material base is needed. As a result of the reduction in the 1990s in the branches of the military-industrial complex developing weapons and equipment for the Navy, the latest models of this technology are now produced not in batches, but in individual copies. The question of the production of training and training samples is not worth it at all. Under these conditions, only virtual analogues of military equipment and weapons, developed by means of information technology, i.e., training and training systems (TOS), can be considered as the only means capable of providing military-professional training. At the modern level of the development of information technologies, testing is the only universal technical means of monitoring the knowledge of students. Procedures for knowledge control in modern computer testing systems do not meet the requirements for them according to the following characteristics: 1) the absence of the possibility of evaluating the error of the test results; 2) the absence of the possibility of stopping testing when the specified reliability of its results is achieved. In order to effectively implement the means of operational criteria-based pedagogical control of knowledge in the process of training specialists of the Navy and to enable joint analysis and processing of evaluations of learning outcomes, it is advisable to implement the following practical recommendations: 1. Formulating the teacher's preferences system regarding the quality of trainee training and the teacher's preferences system in relation to The significance of single test tasks in the test should be considered as the most important The essential steps in preparing a test for practical use. 2. The teacher who first enters the input of his preference systems should check their actual compliance on a sample of 5-10 such test results that cover the full range of possible outcomes (from fully faithful to completely incorrect). The presence of the developed and presented models provides the possibility of setting and solving the task of developing models and procedures for managing the process of criterion-oriented testing, ensuring the efficiency of this process.

Текст научной работы на тему «Модели и процедуры интервальной оценки результатов контроля знаний в компьютерных системах тестирования ВМФ»

Оригинальная статья/Original article_

УДК 371.3:681.51

DOI: http://doi.org/10.20914/2310-1202-2018-1-97-104_

Модели и процедуры интервальной оценки результатов контроля знаний в компьютерных системах тестирования ВМФ

_Денис А. Печников 1 19pda72@bk.ru_

j Военно-морская академия им. Адмирала Флота Советского Союза Н.Г. Кузнецова, Ушаковская набережная, 17/1, г. Санкт-Петербург, 197045, Россия

Реферат. Для осуществления эффективной военно-профессиональной подготовки специалистов ВМФ необходима соответствующая учебно-материальная база. В результате сокращения в 1990 годы отраслей военно-промышленного комплекса, разрабатывающих технику и вооружения для ВМФ, новейшие образцы этой техники теперь изготовляются не сериями, а отдельными экземплярами. Вопрос о производстве учебных и тренировочных образцов не стоит вообще. В этих условиях в качестве единственного средства, способного обеспечить военно-профессиональную подготовку, могут рассматриваться только виртуальные аналоги образцов военной техники и вооружения, разрабатываемые средствами информационных технологий, т. е. тренажерно-обучающие системы (ТОС). На современном уровне развития информационных технологий тестирование является единственным универсальным техническим средством текущего контроля знаний обучаемых. Процедуры контроля знаний в современных компьютерных системах тестирования не соответствуют предъявляемым к ним требованиям по следующим характеристикам: 1) отсутствию возможности оценки погрешности результатов тестирования; 2) отсутствию возможности прекращения тестирования при достижения заданной достоверности его результатов. Для эффективного внедрения средств оперативного критериально-ориентированного педагогического контроля знаний в процесс подготовки специалистов ВМФ и обеспечения возможности совместного анализа и обработки оценок результатов обучения, целесообразно реализовать следующие практические рекомендации: 1. Формулировку системы предпочтений преподавателя в отношении качества подготовки обучаемых и системы предпочтений преподавателя в отношении значимости единичных тестовых заданий в тесте следует рассматривать в качестве наиболее ответственных этапов подготовки теста к практическому использованию. 2. Преподавателю впервые производящему ввод своих систем предпочтений следует проверить их фактическое соответствие на выборке из 5-10 таких результатов выполнения теста, которые покрывают весь спектр возможных результатов (от полностью верных до полностью неверных). Наличие разработанных и представленных моделей обеспечивает возможность постановки и решения задачи разработки моделей и процедур управления процессом критериально-ориентированного тестирования, обеспечивающих оперативность этого процесса.

Ключевые слова: интервальная оценка, доверительный интервал, биноминальный закон распределения_

Models and procedures for interval evaluating the results of control of _knowledge in computer systems testing of Navy_

_Denis A. Pechnikov 1 19pda72@bk.ru_

j Naval Academy named after Admiral of the Fleet of the Soviet Union N.G. Kuznetsov, Ushakov embankment, 17/1, St. Petersburg,

197045, Russia_

Summary.To implement effective military and professional training of Navy specialists, a corresponding educational and material base is needed. As a result of the reduction in the 1990s in the branches of the military-industrial complex developing weapons and equipment for the Navy, the latest models of this technology are now produced not in batches, but in individual copies. The question of the production of training and training samples is not worth it at all. Under these conditions, only virtual analogues of military equipment and weapons, developed by means of information technology, i.e., training and training systems (TOS), can be considered as the only means capable of providing military-professional training. At the modern level of the development of information technologies, testing is the only universal technical means of monitoring the knowledge of students. Procedures for knowledge control in modern computer testing systems do not meet the requirements for them according to the following characteristics: 1) the absence of the possibility of evaluating the error of the test results; 2) the absence of the possibility of stopping testing when the specified reliability of its results is achieved. In order to effectively implement the means of operational criteria-based pedagogical control of knowledge in the process of training specialists of the Navy and to enable joint analysis and processing of evaluations of learning outcomes, it is advisable to implement the following practical recommendations: 1. Formulating the teacher's preferences system regarding the quality of trainee training and the teacher's preferences system in relation to The significance of single test tasks in the test should be considered as the most important The essential steps in preparing a test for practical use. 2. The teacher who first enters the input of his preference systems should check their actual compliance on a sample of 5-10 such test results that cover the full range of possible outcomes (from fully faithful to completely incorrect). The presence of the developed and presented models provides the possibility of setting and solving the task of developing models and procedures for managing the process of criterion-oriented testing,

ensuring the efficiency of this process._

Keywords:interval estimation, confidence intervals, binomial distribution_

Для цитирования Печников Д.А. Модели и процедуры интервальной оценки результатов контроля знаний в компьютерных системах тестирования ВМФ // Вестник ВГУИТ. 2018. Т. 80. № 1. С. 97-104. (М:10.20914/2310-1202-2018-1-97-104

For citation

Pechnikov D.A. Models and procedures for interval evaluating the results of control of knowledge in computer systems testing of Navy. Vestnik VGUIT [Proceedings of VSUET]. 2018. vol. 80. no. 1. pp. 97-104. (in Russian). doi:10.20914/2310-1202-2018-1-97-104

Введение

Для того чтобы осуществлять военно-профессиональную подготовку специалистов ВМФ необходима соответствующая учебно-материальная база. Основу такой базы раньше всегда составляли действующие учебные и тренировочные образцы военной техники и вооружения, которые ранее поступали в военно-морские учебные заведения в достаточном количестве и обеспечивали необходимый уровень как теоретической, так и практической подготовки будущих офицеров ВМФ. В результате резкого сокращения в 1990 годы отраслей военно-промышленного комплекса, разрабатывающих технику и вооружения для ВМФ, новейшие образцы этой техники и вооружений теперь изготовляются не сериями, а отдельными экземплярами. Вопрос о производстве учебных и тренировочных образцов не стоит вообще. В этих условиях в качестве единственного средства, способного обеспечить военно-профессиональную подготовку, могут рассматриваться только виртуальные аналоги образцов военной техники и вооружения, разрабатываемые средствами информационных технологий, т. е. трена-жерно-обучающие системы (ТОС) ВМФ.

В тенденциях развития ТОС ВМФ отмечается следующий ряд основных противоречий:

1) между ростом возможностей ТОС как средств моделирования управляемых объектов и неизменностью их дидактических характеристик;

2) между необходимостью индивидуализации процесса подготовки и ограниченными психофизиологическими возможностями обучающих по управлению обучением в группах с количественным составом более 5-7 обучаемых;

3) между ростом числа и сложности задач управления обучением и неизменностью психофизиологических возможностей руководителей обучения. В качестве средства разрешения этих противоречий рассматривается автоматизация в ТОС ВМФ функций управления обучением.

Ключевой функцией, без автоматизации которой нельзя автоматизировать все остальные функции управления обучением, является функция педагогического контроля качества подготовки обучаемых.

Качество реализации в ТОС ВМФ функции контроля качества подготовки различно в отношении знаний и действий (умений и навыков) обучаемых.

В направлении автоматизации функции оценивания деятельности выполнен целый ряд исследований (Челышкова М.Б [31], Вадзинский Р.Н [3], Ю.А. Ветров [4], Ю.Ф. Волынец [5], В.Н. Иванов [8], В.Д. Мосин [11], Д.А. Печников [13-15], АН. Платов [16], В.Ю. Пузырев [17], А.А. Ско-ров [19], А.М. Стручков [20], Е В. Хекерт

[23, 24], О.Е. Чудаков [25], К.Ю. Шилов [26], Н.В. Щербаков [27] Kaftandjieva, F [36]), Wim J. van derLinden [37] завершившихся созданием оригинальной автоматизированной системы оценки, которая прошла испытания и внедряется в программное обеспечение перспективных ТОС ВМФ.

В направлении автоматизации функции оценивания знаний выполнено менее значительное число исследований. Первая их группа (В.Н. Наумов [12], А.Н. Ханников [29], П.В. Филиппов [28]) носит поисковый характер и ориентирована на создание технологий искусственного интеллекта. На совершенствование моделей и процедур тестирования направлена вторая группа исследований (Р.Р. Туктаров [21], А.О. Туровская [22]), которые были направлены на совершенствование моделей и процедур оценивания отдельных видов тестовых заданий и не касались вопросов управления процессом тестирования.

На достижение целей контроля усвоения знаний в ТОС ВМФ ориентирована компьютерная система тестирования военного назначения (КСТ ВН) "Система автоматизированного контроля (САК)", которая входит в состав комплекса программ инструментальных средств (КПИС) "Медиатор". Эта КСТ является типичным представителем современных КСТ и полностью соответствует современному уровню их развития.

ГОСТ РВ 51540-2005 [6] и ГОСТ РВ 15.205-2004 [7] определяют КСТ по функциональному предназначению как продукцию двойного назначения и относятся КСТ к комплектующим изделиям межотраслевого применения (КИМП), представляющим собой "изделие военной техники (ВТ), предназначенное для выполнения определенных технических функций в составе изделий ВТ или их составных частей, создаваемое не для конкретного изделия ВТ по самостоятельным комплектам и не подвергаемое изменениям в процессе создания изделий ВТ, в котором его применяют". В соответствии с классификациями, приведенными в ГОСТ РВ 51540-2005 [6] и ГОСТ Р 50-60580-93 [7], КСТ должны быть необходимо отнесены к изделиям ВТ, которые входит в категорию учебно-тренировочных средств, принадлежащих к учебной военной техники как виду военной техники.

Основная часть

В настоящее время в компьютерных системах тестирования наибольшее распространение получили тестовые задания закрытого типа с единственным верным ответом. Задания этого типа применяются не менее чем в 92% случаев. В рассматриваемых тестовых заданиях успешность выполнения задания оценивается

путем установления факта совпадения ответа обучаемого с заранее заданным правильным вариантом ответа. Любой другой вариант ответа является неправильным. Для последующей статистической обработки результаты (верно-не верно) выполнения таких тестовых заданий представляются представляет в виде дихотомическая переменной (0 - 1).

Безошибочность (правильность) ответов обучаемого определяется в виде показателя частности В, который имеет вид:

п

Е '

В = ^^ (1)

п

где 1 (1 = 1, п) - номер тестового задания, п - общее число тестовых заданий, ' (' = 0,1) результат выполнения отдельного тестового задания в тесте ' = 1 - верный ответ, ' = 0 -неверный ответ.

Все существующие модели и процедуры обработки результатов выполнения систем тестовых заданий основаны на точечной оценке вида (1). Эти точечные оценки результатов тестирования не обеспечивают оперативность процедуры и не вполне обеспечивают достоверность результатов тестирования. Ниже предлагаются модели и процедуры интервальной оценки результатов выполнения систем тестовых заданий тестовые задания закрытого типа с единственным верным ответом.

Предлагаемые модели и процедуры базируются на том факте, что показатель "правильность" является дихотомической переменной, а процедура его определения в процессе решения обучаемым тестирующей выборки из п заданий соответствует схеме Бернулли.

Схемой Бернулли называется последовательность независимых в совокупности испытаний, в каждом из которых возможны лишь два исхода - "успех" и "неудача", при этом успех в одном испытании происходит с вероятностью р е (0,1), а неудача - с вероятностью q = 1 - р.

"Схема Бернулли лежит в основе таких целочисленных распределений, как биномиальное, геометрическое и отрицательное биномиальное [4].

Для корректного применения схемы Бер-нулли должны быть выполнены следующие условия [1]: 1) каждое испытание имеет ровно два исхода, условно называемых успехом и неудачей; 2) независимость испытаний: результат очередного эксперимента не должен зависеть от результатов предыдущих экспериментов; 3) вероятность успеха должна быть постоянной (фиксированной) для всех испытаний.

Выполнение первого условия определяется характеристиками самих систем тестовых заданий закрытого типа с единственным верным ответом, в которых результаты выполнения задания обозначаются дихотомической переменной j. (j. = 0,1) . Выполнение второго условия обусловливается независимостью тестовых заданий в тесте и возможностью их предъявления в случайном порядке. Выполнение третьего условия обеспечивается тем, фактом, что в процессе тестирования обучаемым никаких новых сведений об объектах тестируемой предметной области не сообщается.

Примем допущение о том, что вероятность правильного выполнения тестовых заданий обучаемым определяется только знаниями обучаемого о тестируемой предметной области и не зависит ни от каких-либо других факторов (например, от фактора угадывания). Если принятое допущение выполняется, то выполняется и третье условие соответствия процедуры тестирования схеме Бернулли. В соответствии с принятым допущением безошибочность выполнения тестовых заданий обучаемым характеризуется некоторой постоянной вероятностью p = const правильного выполнения задания и соответствующей ей вероятностью q = 1 — p ее неправильного выполнения.

Пусть в результате решения обучаемым выборки из n тестовых заданий получен вектор (примеры векторов приведены в таблице 1)

J ~ vл, ■ ■ ■, J,, ■ ■ ■, Jn), (2), в котором jt = 0,1 есть оценки успешности выполнения соответствующего задания (j. = 1 - задание выполнено без ошибок, j = 0 - задание выполнено с ошибками). Требуется оценить вероятность p безошибочной деятельности.

Таблица 1.

Некоторые варианты векторов результатов тестирования для n = 12

Table 1.

Some variants of vectors of test results for n = 12

Вариант Option j1 j2 j3 j4 j5 j6 j7 j8 j9 j10 j11 j12

1 1 1 1 1 1 1 1 1 1 1 1 1

2 0 0 0 0 0 0 1 1 1 1 1 1

3 1 1 1 1 1 1 0 0 0 0 0 0

4 1 0 1 0 1 0 1 0 1 0 1 0

5 0 1 0 1 0 1 0 1 0 1 0 1

6 1 1 0 0 0 0 0 0 0 1 1 1

7 1 1 0 0 1 1 1 1 1 0 1 1

8 1 1 1 1 0 1 1 1 0 1 1 1

9 1 1 1 1 0 0 0 1 1 1 1 0

10 1 1 0 1 1 0 0 1 1 0 1 0

Рассмотрим те законы распределений, которые могут быть использованы для интервальной оценки вероятности р безошибочного выполнения тестовых заданий.

Как отмечалось выше, эмпирические данные, полученные по схеме Бернулли, подчиняются законам таких целочисленных распределений, как биномиальное, геометрическое и отрицательное биномиальное. "Механизм возникновения этих распределений определяется тем способом, которым обрывается последовательность испытаний Бернулли" [4].

Биномиальное распределение имеет место в тех случаях, когда последовательность испытаний Бернулли обрывается после проведения фиксированного числа п испытаний. При этом под биномиальной случайной величиной X понимается число успехов в серии из п испытаний Бернулли.

Вероятность Р(7) появления вектора 3 при биномиальном распределении оценивается как:

Р(3) = Скпрп—кдк при Ск = п' , (3)

к!(п - к)!

где 3 - рассматриваемый вариант (вектор) результатов тестирования; р - вероятность безошибочного выполнения тестового задания, д = 1 — р - вероятность выполнения задания с ошибкой, к - число заданий, выполненных с ошибкой, п - общее число заданий, п — к -число заданий, выполненных без ошибок.

Отрицательное биномиальное распределение имеет место в тех случаях, когда последовательность испытаний обрывается сразу же после т-ого успеха. При этом рассматриваются две случайные величины: случайная величина Z - число неудач, предшествовавших т-ому успеху, и случайная величина Ж - общее число испытаний до т-ого успеха (включая т-ый успех).

Вероятность Р(3) появления вектора 3 при отрицательном биномиальном распределении оценивается как:

Р(3) = С+ т—1Ртд при С = (г + т —11)!, (4)

г !(т — 1)!

где 3 - рассматриваемый вариант (вектор) результатов тестирования; р - вероятность безошибочного выполнения тестового задания, д = 1 — р - вероятность выполнения задания с ошибкой, г - число заданий, которые выполнены с ошибкой и предшествуют т-ому успеху.

Геометрическое распределение является частным случаем отрицательного биномиального распределения и возникают при обрыве серии испытаний сразу же после первого успеха или неудачи. При этом рассматриваются две

случайные величины: случайная величина X - число неудач (успехов), предшествовавших первому успеху (неудаче), и случайная величина У - число испытаний до первого успеха (неудачи). Сам успех (неудача) может включаться и не включаться в число У .

Геометрическое распределение - это единственное дискретное распределение со свойством отсутствия памяти (последействия): знание об отсутствии успеха (неудачи) в предыдущих опытах никак не влияет на распределение оставшегося числа опытов до появления успеха (неудачи).

При геометрическом распределении вероятность Р(3; = 1) появление вектора

3(7 = 1; г = 1, п) оценивается как:

Р(3; ]г = 1) = ркд, (5)

а вектора 3(= 0; г = 1, п) как

Р(3; ]г = 0) = дкр, (6)

где р - вероятность безошибочного выполнения задания, д = 1 — р - вероятность выполнения

задания с ошибкой, Н (к = 1, п) - номер 1 последнего задания, выполненного без ошибки или, наоборот, с ошибкой (число "неудач (ошибок)" до первого "успеха" или число "успехов" до первой "неудачи (ошибки)".

В целях интервальной оценки вероятности р безошибочного выполнения тестовых заданий целесообразно использовать те законы распределения, которые принципиально обеспечивают

обработку любого числа (г, г = 1, +<ю) тестовых

заданий. Такому требованию соответствуют только законы биномиального и геометрического распределения.

Закон отрицательного биномиального распределения может быть использован для оценивания результатов тестирования только после появления т-ого успеха. При его использовании минимальная длина оцениваемого вектора 3 лежит в пределах г + т < 3 < +<ю . Другими словами, при самом благоприятном стечении обстоятельств отрицательное биномиальное распределение обеспечит возможность оценки результатов тестирования только при числе г = г + т выполненных заданий, а при самом неблагоприятном -не обеспечит никогда.

Введем понятие вектора п непрерывного результата (успеха или неудачи), под которым будем понимать любую часть вектора (1), каждый из элементов которой равен 1 или 0: если все элементы вектора равны 1 (у. = 1) -

<Becmmi^®TyWlC/&oceedmßs ofVSVET, Ж 80, № 1, 2018-

вектор п непрерывного успеха, если все элементы вектора равны 0 ( /. = 0) - вектор п непрерывной неудачи. Например, в таблице 1 для 6 варианта вектора J это вектора = (/,. /2)

, п2 =

Уз ' ЗА, ' 35 ' ] 6' ' ' 39 ) '

п3 =

и 10 ' Лг) .

Вероятность появления вектора (1) можно оценивать с двух позиций:

1) как вероятность события Ь, заключающееся в том, что при выполнении п заданий обучаемым было достигнуто (п — к) успехов (допущено к ошибок);

2) как вероятность события Н , заключающегося в появлении в векторе (1) т векторов непрерывного результата.

Вероятность Р(Ь) наступления события Ь оценивается по биномиальному закону (2). Соответственно при определении доверительного интервала (ДИ) для оценок вероятности р успешного выполнения тестового задания корректно использование следующих формул оценки доверительных интервалов биномиального распределения:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1) оценка точного ДИ [2, 3]:

( (п — к)

\

(n - к) + (к + 1)F2(k+1)

,2( n-k ),1-е/ 2

(П - к + 1)F2(n-k+1),2k,1-е/2

к + (n - к + 1)F2(n-k+1),2k,1-е/2

(7)

где п - число испытаний, к - число ошибок, а Ff - квантиль порядка а распределения Е

с/, g степенями свободы;

2) оценка приближенного ДИ в соответствии с центральной предельной теоремой, когда при больших п распределение биномиальной случайной величины будет близко к нормальному [2, 3]

(

Р * -U1-/2

Р *(1 - p*)

Р * +щ

Р *(1 - Р*)

Л

n - к

-- и

n

1-/2

(n - к)к n - к

+ и

n

n

1-S/2

(n - к)к

(8)

n

/

гк «

где р * - оценка эмпирической частости правильного выполнения тестовых заданий; м1-е/2 - квантили стандартного нормального распределения порядка 1 — е /2.

Оценим вероятность события Н , которое заключается в появлении в векторе (2) т векторов непрерывного результата.

В соответствии с введенным выше понятием вектора и, непрерывного результата события пз 1=II появления таких векторов относятся к категории попарно несовместных событий. Поэтому вероятность Р(Н) любого из вариантов их реализаций (см. табл. 1) оценивается по формуле:

Р(Н) = Р(к ^... ^к ^••• ^К) =

= Ph) +... P(h) +... P(hm)

, (9)

где 5 (я = 1, т; т < п) - номер вектора непрерывного результата; п - число выполненных тестовых заданий.

В (8) вероятности Р(к) оцениваются по геометрическому закону в соответствии с (5, 6)

| рка при I = 1;

Р(к) = \ V р ^ ;, (10)

[я р при ]г =0 гдер - вероятность безошибочного выполнения задания, д = 1 — р - вероятность выполнения

задания с ошибкой, h (h = 1, (n - к)) - номер i последнего задания, выполненного без ошибки или, наоборот, с ошибкой (число "неудач (ошибок)" до первого "успеха" или число "успехов" до первой "неудачи (ошибки)".

Для оценки в (9, 10) неизвестного параметра p предлагается использовать метод максимального правдоподобия, при котором в качестве оценки вероятности р принимается ее значение

£> = argmax /(м^-шутахР(Н), (11)

Р е(0,1) Р е (0,1)

максимизирующее вероятность P(H) появления при выполнении п тестовых заданий вектора и-yjl,...,ji,...,jn) , включающего т(т = \,п) векторов ns непрерывного результата.

Каждый из полученных векторов ns непрерывного результата позволяет по (10) получить оценку p с ошибкой as: p . Соответственно функция W(p, p) правдоподобия (совместной плотностью вероятности) для любой из реализаций события H = ^hs может быть представлена в виде

W (ps, p) =П P(h) =

s=1

s=l s=m

=П P(h+ )П P(h-)=p'q

s=1 s=l

при t > 0, к > 0,

(12)

<Becmmi^®TyWlC/&oceedmßs ofVSVEX Ж 80, № 1, 2018-

где р - вероятность безошибочного выполнения тестового задания, q = 1 — р - вероятность выполнения задания с ошибкой, к - число заданий, выполненных с ошибкой, ^ - число заданий, выполненных правильно, п = t + к -общее число выполненных заданий, 5 (^=1, т) - номера векторов непрерывного

результата, 5 (5 = 1, /) - номера векторов п^

непрерывного успеха, $($ = 1 + \,т) - номера

вектор непрерывной неудачи.

Например, для представленного в таблице 1 варианта 6 вектора и , включающего вектора п, = ^, Л ), «2 = и3, Л > к > 76>Л, к, 7э ) и «з = Ую 1^12) • Функция (11) имеет вид

К (Л, Р) = П Р(^) =

^=1 .

= Р(Н1)Р(И2)Р(ИЪ) = р2 q7 Р3 = Р5q7 Если рассматриваемый вектор является единичным вектором непрерывного успеха (в таблице 1 вариант 1) или непрерывной

неудачи п,, то такие вектора оцениваются по формуле (10).

Поиск р целесообразно реализовать путем решения следующей задачи нелинейного программирования

pn-k+\qk+1

►max,

p

p G (0,1), k = 1, П

(13)

Для решения (12) можно использовать стандартную функцию "Solve (Поиск решения)" MicrosoftExcel.

ДИ оценки p может быть определен как

(

p(1 - Р)

Р - Ч-е/2\ -, Р -

Р(1 - Р)

(14)

Сравним оценки обучаемых, полученные обычным путем на основе предлагаемых моделей.

Пусть обучаемыми выполнено 13 заданий и получены результаты, приведенные в таблице 1. Оценки этих результатов тестирования приведены в таблице 2.

Оценки результатов тестирования, приведенных в таблице 1 Evaluation of test results given in table 1

Таблица 2. Table 2.

Точечная Интервальные оценки Interval estimates

№ оценка по модели (2.1) на основе биномиального распределения based on binomiall distribution на основе геометрического распределения on the basis of geometric distribution

варианта option n n- к к 1 m-1 Point estimate by the model Вероятнейшее значение по (2.3) The most Границы ДИ по (2.7) The boundaries of CI by (2.7) Вероятнейшее значение по (2.13) The most Границы ДИ по (2.14) The boundaries of the CI by (2.14)

(2.1) probable value according to (2.3) Нижняя Lower Верхняя Upper probable value according to (2.13) Нижняя Lower Верхняя Upper

1 12 12 0 1 0 1,000 1,000 0,735 1,000 0,923 0,754 1,000

2 12 6 6 1 1 0,500 0,500 0,211 0,789 0,500 0,182 0,818

3 12 6 6 1 1 0,500 0,500 0,211 0,789 0,500 0,182 0,818

4 12 6 6 6 6 0,500 0,500 0,211 0,789 0,500 0,182 0,818

5 12 6 6 6 6 0,500 0,500 0,211 0,789 0,500 0,182 0,818

6 12 5 7 2 1 0,417 0,417 0,152 0,723 0,400 0,089 0,711

7 12 9 3 3 2 0,750 0,750 0,428 0,945 0,647 0,343 0,951

8 12 10 2 4 2 0,833 0,833 0,516 0,979 0,667 0,367 0,966

9 12 8 4 2 2 0,667 0,667 0,349 0,901 0,625 0,317 0,933

10 12 7 5 4 4 0,583 0,583 0,277 0,848 0,550 0,234 0,866

Оценки, приведенные в таблице 2, свидетельствуют, что применение предлагаемых моделей оценки результатов тестирования обеспечивает переход от точечных оценок эмпирической частости к адекватным теоретически обоснованным оценкам вероятности правильного действия, которые имеют количественно оцениваемый ДИ.

Поскольку задачи текущего контроля решаются непосредственно в процессе обучения и имеют целью выработку адресных обучающих воздействий, то процесс критериально-ориентированного тестирования должен занимать минимум времени. Иначе говоря, к самому процессу критериально-ориентированного тестирования, а также процедурам обработки и презентации его результатов должно быть предъявлено требование оперативности.

Оперативность процедур обработки и отображения результатов действий обучаемых проблем не вызывает, поскольку полностью обеспечивается за счет быстродействия аппаратно-программных средств КСТ. А вот оперативность самой процедуры тестирования соответствующего обеспечения не имеет. Поэтому условия и методы ее реализации требуют более подробного рассмотрения.

Наличие моделей (3, 7, 13, 14) интервальной оценки результатов тестирования обеспечивает возможность постановки и решения задачи разработки моделей и процедур управления процессом критериально-ориентированного тестирования, обеспечивающих оперативность этого процесса.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ЛИТЕРАТУРА

1 Аванесов В.С. Проблема формы тестовых заданий. URL: ЬИр:/Ле81:о^.пагоЛги/ТЬеогу32.Ь1т1

2 Ван дер Варден Б.Л. Математическая статистика. М.: Изд-во Иностранной литературы, 1960. 436 с. URL: http://www.twirpx.com/fi1e / 275786/

3 Вадзинский Р.Н. Справочник по вероятностным распределениям. СПб.: Наука, 2001. 295 с. URL: http:// налекцию. рф/content / 786

4 Буравлев А.И., Переверзев В.Ю. Выбор оптимальной длины педагогического теста и оценка надежности его результатов // Открытое образование. 1999. N° 2. С. 23 -26. URL: http://www.e-joe.ru/sod / 99/2_99/st160.htm1

5 Ветров Ю.А. Повышение качества тактической подготовки офицеров запаса ВМФ на основе рационального использования компьютерных технологий обучения. СПб: БГТУ "Военмех", 1999. 193 с.

6 Волынец Ю.Ф. Концепция, принципы построения и функционирования инфологической автоматизированной среды подготовки специалистов ВМФ. Петродворец: ВМИРЭ, 1999. 199 с.

7 ГОСТ РВ 51540-2005. Военная техника. Термины и определения. М.: Стандартинформ, 2011. -12 с. URL: http://www.twirpx.com/fi1e / 1699773/

8 ГОСТ РВ 15.205-2004. Система разработки и постановки продукции на производство. Военная техника. Порядок выполнения опытно-конструкторских работ по созданию комплектующих изделий межотраслевого

Выводы

На современном уровне развития информационных технологий тестирование является единственным универсальным техническим средством текущего контроля знаний обучаемых. Процедуры контроля знаний в современных компьютерных системах тестирования не соответствуют предъявляемым к ним требованиям по следующим характеристикам: 1) отсутствию возможности оценки погрешности результатов тестирования; 2) отсутствию возможности прекращения тестирования при достижения заданной достоверности его результатов.

Для эффективного внедрения средств оперативного критериально-ориентированного педагогического контроля знаний в процесс подготовки специалистов ВМФ и обеспечения возможности совместного анализа и обработки оценок результатов обучения, полученных компьютерных систем тестирования и преподавателем, целесообразно реализовать следующие практические рекомендации:

1. Формулировку системы предпочтений преподавателя в отношении качества подготовки обучаемых и системы предпочтений преподавателя в отношении значимости единичных тестовых заданий в тесте следует рассматривать в качестве наиболее ответственных этапов подготовки теста к практическому использованию.

2. Преподавателю впервые производящему ввод своих систем предпочтений следует проверить их фактическое соответствие на выборке из 5-10 таких результатов выполнения теста, которые покрывают весь спектр возможных результатов (от полностью верных до полностью неверных).

применения. М.: Стандартинформ, 2005. 65 с. URL: http://www.twirpx.com/fi1e / 520927/

9 Иванов В.Н. Метод автоматизированной оценки качества профессиональной деятельности в корабельных автоматизированных системах. Петродворец: ВМИРЭ, 1999. 187 с.

10 Кремер НШ. Теория вероятностей и математическая статистика. М.: Юнити-Дана, 2004. 573 с. URL: http://www.e-joe.ru/sod / 99/2_99/st160.htm1

11 Крокер Л., Алгина Дж. Введение в классическую и современную теорию тестов. М.: Логос, 2010. 668 с. URL: http://www.twirpx.com/fi1e / 1346290/

12 Мосин В.Д. Моделирование процесса адаптивного управления деятельностью курсантов в ходе практического обучения на автоматизированных тренажерах. Петродворец: ВМИРЭ, 1999. 164 с.

13 Наумов В.Н. Теоретические основы представления содержания профессиональной подготовки специалистов ВМФ в интеллектуальных обучающих системах. Петродворец: ВВМУРЭ им. А.С. Попова, 1994. 296 с.

14 Печников А.Н. Комплекс методов и моделей оценки качества и эффективности деятельности операторов вооружения и военной техники в тренажерно-обучающих системах ВМФ. СПб.: СПбГЭТУ, 2011. 343 с.

15 Печников А.Н., Ветров Ю.А Проектирование и применение компьютерных технологий обучения. Ч. 1. Концепция систем автоматизированного обучения и моделирование процессов деятельности. СПб: БГТУ, 2002. 195 с.

16 Печников А.Н., Стручков А.М., Хекерт Е.В. и др. Генератор оценки: Свидетельство о государственной регистрации программ для ЭВМ № 2009613362 от 26.06.2009.

17 Платов А.Н. Автоматизация управления контролем подготовки на тренажерах ВМФ. СПб: ЦНИИ МО РФ, 2000. 125 с.

18 Пузырев В.Ю. Диагностика деятельности операторов корабельных электромеханических систем в специализированных тренажерах ВМФ. Новороссийск: НГМА, 2005. 129 с.

19 ГОСТ Р 5060580-93. Система разработки и постановки продукции на производство. Термины и определения. М.: ВНИИстандарт, URL: http://gostrf.com/normadata / 1/4293827/4293827526.htm

20 Скоров А.А. Методологические основы использования компьютерных технологий обучения в процессе профессиональной подготовки специалистов ВМФ. Петродворец: ВМИРЭ, 2001. 318 с.

21 Стручков А.М. Проектирование компьютерных систем обучения и интеллектуального тренажа. Петродворец: ЗАО "Фирма "Пассат", 2002. 166 с.

REFERENCES

1 Avanesov V.S. Problema formy [The problem of the form of test tasks] Available at: http://tes-tolog.narod.ru/ThErou32.html (in Russian)

2 Van der Waerden B.L. Mtematicheskaya statis-tika [Math statistics] Moscow, Publishing House of Foreign Literature, 1960. 436 p. Available at: http://www.twirpx.com/file/275786 (in Russian)

3 Vadzinsky R.N. Spravochnik [Handbook of probability distributions] Saint-Petersburg, Science, 2001. 295 p. Available at: http: // налекцию. рф / content / 786 (in Russian)

4 Buravlev A.I., Pereverzev V.Yu. Choice of the optimal length of the pedagogical test and evaluation of the reliability of its results. Otkrytoe obrazovanie [Open Education] 1999. no. 2. pp. 23 - 26. Available at: http://www.e-joe.ru/sod/ 99 / 2_99 / st160.html (in Russian)

5 Vetrov Yu.A. Povyshenie kachestva taktich-eskoi podgotovki [Improving the quality of tactical training of Navy reserve officers based on the rational use of computer learning technologies] Saint-Petersburg, BSTU "Voenmeh", 1999. 193 p. (in Russian)

6 Volynets Yu.F. Kontseptsiya, printsipy postroeniya I funktsionirovaniya [The concept, principles of construction and functioning of the informational automated environment for training specialists of the Navy] Petrodvorets, VMIRE, 1999. 199 p. (in Russian)

7 GOST RV 51540-2005. Voennaya tekhnika [State standard 51540-2005 Military equipment. Terms and Definitions] Moscow, StandardInform, 2011. 12 p. Available at: http://www.twirpx.com/file/1699773 (in Russian)

8 GOST RV 15.205-2004. Sistema azrabotki I postanovki [State standard 15.205-2004 System for the development and production of products for production. Military equipment. The order of performance of developmental works on creation of completing products of interbranch application] Moscow, Standartinform, 2005. 65 p. Available at: http://www.twirpx.com/file/520927 / (in Russian)

СВЕДЕНИЯ ОБ АВТОРАХ Денис А. Печников к.т.н., доцент, докторант, Военно-морская академия им. Адмирала Флота Советского Союза Н.Г. Кузнецова, Ушаковская набережная, 17/1, г. Санкт-Петербург, 197045, Россия, 19pda72@bk.ru

КРИТЕРИЙ АВТОРСТВА Денис А. Печников полностью подготовил рукопись и несет ответственность за плагиат

КОНФЛИКТ ИНТЕРЕСОВ Автор заявляет об отсутствии конфликта интересов.

ПОСТУПИЛА 22.01.2018 ПРИНЯТА В ПЕЧАТЬ 19.02.2018

9 Ivanov V.N. Metod avtomatizirovannoi otsenki kachestva [The method of automated assessment of the quality of professional activity in shipborne automated systems] Petrodvorets, VMIRE, 1999. 187 p. (in Russian)

10 Kremer N.Sh. Teoriya veroyatnostei I matematich-eskaya statistika [Theory of Probability and Mathematical Statistics] Moscow, Unity-Dana, 2004. 573 p. Available at: http://www.e-joe.ru/sod/99 / 2_99 / st160.html (in Russian)

11 Crocker L., Algina J. Vvedenie v klassicheskuyu i sovremennuyu teoriyu testov [Introduction to the classical and modern theory of tests] Moscow, Logos, 2010. 668 p. Available at: http://www.twirpx.com/file/ 1346290 (in Russian)

12 Mosin V.D. Modelirovanie protsessa adaptivnogo upravleniya [Modeling the process of adaptive management of cadets' activities in the course of practical training on automated simulator] Petrodvorets, VMIRE, 1999. 164 p. (in Russian)

13 Naumov V.N. Teoreticheskie osnovy predstavleniya soderzhaniya professioal'noi podgotovki [Theoretical bases of representation of the content of professional training of specialists of the Navy in intellectual training systems] Petrodvorets, VVMURE, 1994. 296 p. (in Russian)

14 Pechnikov A.N. Kompleks metodov i modelei otsenki [A set of methods and models for assessing the quality and efficiency of the activities of weapons and military equipment operators in the training and training systems of the Navy] Saint-Petersburg, SPbGETU, 2011. 343 p. (in Russian)

15 Pechnikov A.N., Vetrov Yu.A. Proektirovanie i primenenie komp'yuternykh tekhnologii [Design and application of computer learning technologies. Part 1. The concept of automated learning systems and the modeling of activity processes] Saint-Petersburg, BSTU, 2002. 195 p. (in Russian)

16 Pechnikov A.N., Struchkov A.M., Heckert E.V. et al. Generator otsenki [Evaluation generator: Certificate of state registration of computer programs No. 2009613362 of 26.06.2009] (in Russian)

17 Platov A.N. Avtomatizatsiya upravleniya kontrilem [Automation of control of training control on simulators of the Navy] Saint-Petersburg, Central Research Institute of the Ministry of Defense of the Russian Federation, 2000. 125 p. (in Russian)

18 Puzyrev V.Yu. Diagnostika deyatel'osti opera-torov [Diagnostics of the activity of operators of ship electromechanical systems in specialized simulators of the Navy] Novorossiysk, NGMA, 2005. 129 p. (in Russian)

19 GOST R 5060580-93. Sistema razrabotki i postanovki [System for the development and production of products for production. Terms and Definitions] Moscow, VNIIstandart. Available at: http://gostrf.com/normadata / 1/4293827 / 4293827526.htm (in Russian)

20 Skorov A.A. Metodologicheskie osnovy ispol'zovaniiya komp'yuternykh [Methodological bases of using computer training technologies in the process of professional training of Navy specialists] Petrodvorets, VMIRE, 2001. 318 p. (in Russian)

21 Struchkov A.M. Proektirovanie kompyuternykh sistem obucheniya [Designing of computer training systems and intellectual training] Petrodvorets, Passat, 2002. 166 p. (in Russian)

INFORMATION ABOUT AUTHORS Denis A. Pechnikov Cand. Sci. (Engin.), associate professor, doctoral, Naval Academy named after Admiral of the Fleet of the Soviet Union N.G. Kuznetsov, Ushakov embankment, 17/1, St. Petersburg, 197045, Russia, 19рdа72@bk.ru

CONTRIBUTION Denis A. Pechnikov completely prepared the manuscript and is responsible for plagiarism

CONFLICT OF INTEREST The author declare no conflict of interest. RECEIVED 1.22.2018 ACCEPTED 2.19.2018

i Надоели баннеры? Вы всегда можете отключить рекламу.