Научная статья на тему 'RILP-Multi для расчета предельных оценок параметров индикаторов бутстреп-методом'

RILP-Multi для расчета предельных оценок параметров индикаторов бутстреп-методом Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
94
47
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «RILP-Multi для расчета предельных оценок параметров индикаторов бутстреп-методом»

из файлов или отредактировать список исследуемых ЧДП, области их допустимых значений и провести парное экспертное сравнение ценности ЧДП с помощью заданной качественной измерительной шкалы и сформированного ОЧТ парных оценок, после чего на основе сопряженной числовой шкалы произвести расчет КСЦ частных показателей и сохранить их в специальных файлах. Перед началом работы данного и следующих модулей пользователь должен задать две опции - тип вычисляемых ИДП (с учетом или без учета требований к значениям ЧДП), а также форму ввода исходных данных - при помощи клавиатуры непосредственно в АС или путем импорта из заранее подготовленной таблицы MS Excel. В АС реализован поэтапный принцип решения диагностической задачи (реализации описанной методики) с возможностью его остановки и возобновления по желанию пользователя, а также возможностью на ряде этапов использовать те или иные ранее введенные данные, хранящиеся в ASCII-файлах с различными расширениями.

Программные модули «Расчет интегральных диагностических показателей на основе весов частных показателей», «Расчет интегральных диагностических показателей с учетом разницы значений частных показателей» и «Расчет динамических интегральных диагностических показателей» вычисляют системы ИДП (1)-(4). При этом результаты измерения значений ЧДП для обследуемых в моменты ti и t2 вводятся в программу с различных листов таблицы MS Excel.

К плюсам методики и используемых в ней систем ИДП относится учет в них достоинств и недостатков ПФС обследуемых, а также баланса между ними, учет сравнительной ценности ЧДП, независимость ИДП от номенклатуры, особенностей ЧДП и их измерительных шкал, ясный содержательный смысл, хорошая интерпретируе-

мость полученных результатов, простая структура и алгоритмы расчета, возможность использования для оценки ПФС обследуемых в фиксированный момент и во временной динамике, при наличии и отсутствии априорных экспертных требований к значениям ЧДП.

Важной особенностью методики является отсутствие в ней вычислительных процедур и алгоритмов, понимание которых требует от пользователей - врачей, психологов, социологов - глубоких знаний в теории измерений, математической статистике, матричной алгебре, теории многокритериального принятия решений, что отличает методику от многих ИДП и вычислительных схем, описанных, например, в [1, 2]. Методика и разработанная на ее основе АС могут использоваться специалистами и должностными лицами как самостоятельно, так и вместе с другими методиками анализа медицинских, психологических и социологических данных для повышения обоснованности принимаемых решений.

Литература

1. Толстова Ю.Н. Измерение в социологии: курс лекций. М.: ИНФРА, 1998. 224 с.

2. Экспертные оценки: методы и применение : обзор / Д.С. Шмерлинг [и др.] // Статистические методы анализа экспертных оценок. М.: Наука, 1977. С. 85-95.

3. Ермаков А.Е. Методика расчета коэффициентов сравнительной ценности диагностических показателей // Программные продукты и системы. 2010. № 4 (92). С. 177-183.

4. Ермаков А.Е., Найденова К.А., Григорьева Н.М. Использование интегральных показателей для оценки текущего психологического и физиологического состояния военнослужащих и его временной динамики // Военная профилактическая медицина. Проблемы и перспективы: матер. 1-го съезда воен. врачей медико-профилакт. профиля ВС РФ. СПб: ВМедА, 2002. С. 515-518.

5. Ермаков А.Е. Методика сравнительной оценки психического и физиологического состояния обследуемых с помощью систем интегральных показателей В кн.: Актуальные проблемы военной медицины: избран. тр. НИЦ академии // Вестн. РВМедА (приложение). 2009. № 3 (27). С. 60-67.

УДК 519.87:004.9

RILP-Multi ДЛЯ РАСЧЕТА ПРЕДЕЛЬНЫХ ОЦЕНОК ПАРАМЕТРОВ ИНДИКАТОРОВ БУТСТРЕП-МЕТОДОМ

И.Н. Елисеев, к.т.н.; И.И. Елисеев; А.В. Фисунов

(Южно-Российский государственный университет экономики и сервиса, г. Шахты, emQßssu-iu)

В статье описывается алгоритм работы программного комплекса для расчета предельных значений латентных параметров индикаторов диагностических тестов по результатам их выполнения, представленным в виде дихотомической переменной.

Ключевые слова: тест, индикатор теста, латентный параметр, бутстреп-метод.

Точный расчет латентных параметров индикаторов диагностических тестов, предназначенных

для контроля качества образовательного процесса, является необходимым условием обеспечения эф-

фективности управления качеством образования в учреждениях профессионального образования. Параметры рассчитываются путем обработки результатов тестирования достижений студентов в учебе или результатов анкетирования различных аспектов воспитательной деятельности с помощью теории латентных переменных (теории IRT) [1]. При небольшом числе участников матрица результатов тестирования (выборка) оказывается тоже небольшой. Поэтому трудность заданий и индикаторов рассчитывается с большой погрешностью, что не позволяет с приемлемой точностью определить качество подготовки обучаемых и снижает эффективность управления образовательным процессом.

Для повышения точности расчета латентных параметров по выборкам малого объема в работе [2] предложено использовать бутстреп-метод, суть которого заключается в размножении исходной матрицы результатов, формировании из размноженных данных большого количества бутстреп-матриц и в их обработке. Выполнение этой процедуры вручную требует больших затрат труда и времени, что создает непреодолимое препятствие для практического использования такого подхода.

Целью настоящей работы является разработка алгоритма и ПО для расчета предельных оценок латентных параметров индикаторов диагностических тестов на основе бутстреп-метода в условиях ограниченного объема экспериментальных данных.

Для реализации поставленной цели на базе программного комплекса RILP-1 [3], ранее созданного в Южно-Российском государственном университете экономики и сервиса (г. Шахты), был разработан программный комплекс RILP-МиШ (Свид. об офиц. регистр. прогр. для ЭВМ № 2010611111 от 05.02.2010), предназначенный для подготовки данных, на основе которых производится расчет предельных оценок параметров индикаторов по результатам тестирования ограниченного объема. К алгоритмам расчета латентных параметров индикаторов и участников тестирования по матрице ответов студентов, которые используются в RILP-1, добавлен алгоритм для размножения исходной матрицы малого объема и расчета оценок параметров индикаторов бутстреп-методом. На основе полученных данных осуществляется расчет предельных оценок параметров индикаторов. Блок-схема алгоритма показана на рисунке 1.

На начальном этапе осуществляются загрузка программы в оперативную память компьютера и настройка инструментов для обработки результатов тестирования ограниченного объема.

На втором этапе в одном из форматов -*.pm, *.dat или *.Ш - производится загрузка файла, в котором хранятся результаты тестирования

Формирование общей матрицы

да

Процесс перемешивания данных в общей матрице

Рис. 1. Блок-схема алгоритма формирования и обработки бутстреп-матриц

в виде матрицы. Первый столбец состоит из фамилий участников тестирования, все остальные элементы матрицы - это ответы каждого из участников на индикаторы теста. Ответы могут отображаться либо в дихотомическом виде (1 - правильный ответ, 0 - неправильный), либо в виде цифр от 1 до п, где п - количество вариантов ответов на каждое задание (индикатор). Во втором случае в последней строке матрицы указываются номера правильных ответов.

Третий этап - загрузка и настройка параметров размножения исходной матрицы, которые задаются в двух формируемых файлах - Ми1^а-ta. Ш и MultiDataConst.txt.

В файле MultiData.txt в следующем порядке указываются:

- количество проектов;

- их названия;

- способ формирования бутстреп-матриц (путем случайного выбора или путем нарезки);

- количество перемешиваний т строк размноженной матрицы;

- число формируемых бутстреп-матриц п;

- количество строк N в бутстреп-матрицах.

В файле MultiDataConst.txt содержится следующая информация:

- количество новых проектов;

- название проекта, из которого будут считы-ваться данные;

- способ формирования бутстреп-матриц;

- название нового проекта;

- количество бутстреп-матриц в новом проекте;

- количество строк в каждой бутстреп-матрице нового проекта.

Файл MultiData.txt используется программой в тех случаях, когда для каждого проекта создается своя общая матрица. Если же проекты создаются из одной общей матрицы, используется файл MultiDataConst.txt.

После загрузки всех необходимых данных программой комплекса RILP-Multi осуществляется формирование общей матрицы (этап четыре). Для этого исходная матрица размножается по строкам путем копирования первоначальной матрицы К раз (число К считывается из файла настроек), а полученные матрицы совмещаются по столбцам.

На пятом этапе производится перемешивание строк общей матрицы: программа случайным образом поочередно выбирает из общей матрицы по две строки, которые меняются местами. Число таких пар строк определяется заданным в файле MultiData.txt количеством перемешиваний т. Если значение параметра т равно нулю, данный этап работы алгоритма пропускается.

Для облегчения поиска полученных данных в корневом каталоге программы создаются каталоги для вывода бутстреп-матриц, результатов обработки проектов и хранения технической информации (шестой этап).

Седьмой этап алгоритма предусматривает сохранение на жестком диске текстовых файлов с информацией о настройках, при которых был получен каждый проект после размножения. Эти файлы используются программой для дальнейшей обработки данных.

На восьмом этапе из общей матрицы формируются бутстреп-матрицы в соответствии с заданными в файлах MultiData.txt и MultiDataConst.txt параметрами: количеством бутстреп-матриц п в проекте и числом строк N в каждой матрице. Если число строк в бутстреп-матрице не задано, оно выбирается равным числу строк исходной матрицы по умолчанию. Возможны три способа получения бутстреп-матриц: 1) программа формирует бутстреп-матрицы путем случайного выбора строк общей матрицы с их возвратом; 2) строки общей матрицы выбираются также случайно, но обратно в матрицу не возвращаются; 3) бутстреп-матрицы получаются путем их последовательной «нарезки»

из размноженной матрицы.

Каждый из полученных проектов бутстреп-матриц сохраняется в созданных ранее каталогах (этап девять).

На десятом этапе обрабатываются полученные проекты, результаты сохраняются в специальных папках каталогов.

Дальнейшая обработка данных и расчет предельных оценок трудностей заданий выполняются с использованием Excel.

Апробация программного комплекса RILP-Multi проводилась на матрице результатов тестирования размером 50x42, кратность размножения которой варьировалась от 1 до 50000. Количество извлекаемых бутстреп-матриц изменялось от 5 до 5000, число строк в бутстреп-матрицах - от 0,4k до 4k, где k - количество строк исходной матрицы.

Результаты апробации показали высокую надежность работы комплекса в различных режимах обработки исходной матрицы. На рисунке 2 в качестве примера приведен график зависимости

—(Б)»

оценки выборочного среднего трудности ^ одного из заданий педагогического теста от числа извлекаемых бутстреп-матриц в проекте n, а на рисунке 3 - гистограмма распределения значений

ß

(Б)*

10 25 50 75 100 200 400 600 000 1000 1200 1400 1600 1000 2000 Ц

Примечание: прямой линией показано значение оценки трудности ß задания, рассчитанное по исходной матрице.

Рис. 2. Зависимость ß® от n для одного из заданий теста

Рис. 3. Гистограмма распределений бутстреп-значений ß(f) (n=500)

Р(Б)*, полученных с помощью комплекса ШЬР-МыШ.

Таким образом, предложенный алгоритм и созданный на его основе программный комплекс ЫЬР-МиШ обеспечивают получение из исходной матрицы результатов тестирования заданного количества бутстреп-матриц, обработку их с использованием методов математической статистики и теории латентных переменных, а также расчет предельных оценок латентных параметров индикаторов диагностических тестов в условиях ограниченного объема экспериментальных данных. Использование программного комплекса позволит повысить точность калибровки средств диагностики результатов образовательной деятельности

в учреждениях профессионального образования, обеспечить проведение мониторинга и повышение эффективности управления качеством образования.

Литература

1. Нейман Ю.М., Хлебников В.А. Введение в теорию моделирования и параметризации педагогических тестов. М.: Прометей, 2000. 169 с.

2. Елисеев И.Н. Исследование предельных оценок латентных переменных по выборкам малого объема // Методы и алгоритмы принятия эффективных решений: матер. Междунар. науч. конф. (МАПР-09). Таганрог, ТТИ ЮФУ, 2009. Ч. 2. С. 29-35.

3. Елисеев И.Н., Елисеев И.И., Фисунов А.В. Программный комплекс RILP-1 // Программные продукты и системы. 2009. № 2. С. 178-181.

УДК 519.688

ЭФФЕКТИВНАЯ ПРОГРАММНАЯ РЕАЛИЗАЦИЯ ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЯ

Д.М. Балихин (Thomson Reuters, удаленный сотрудник, Торонто, Канада,

dmitry. balikhin@live.ru)

В статье описывается реализация алгоритма одномерного дискретного вейвлет-преобразования для максимально быстрой обработки на современном компьютере. Предложены дальнейшие методы ускорения выполнения вейв-лет-преобразования на компьютере.

Ключевые слова: вейвлет-преобразование, алгоритм, реализация, методы, сигнал, звук, программа.

Вейвлет-преобразования используются для решения широкого класса задач, в которых анализируется нестационарный сигнал. Наиболее известны задачи, связанные со сжатием информации, подавлением шумов, обработкой и синтезом сигналов, анализом изображений, обработкой электрокардиограмм, анализом сейсмологических данных.

Для решения задач, в основе которых лежат вейвлет-преобразования, необходима быстрая компьютерная реализация алгоритма разложения и восстановления сигнала. Эффективная реализация алгоритма позволит применять вейвлет-преобразования в программах, работающих в режиме реального времени, например, для вейвлет-преобразования голосового трафика, идущего от Уо1Р--клиента.

Пусть имеется сигнал 8(1).

Определение. Вейвлет - это функция ф(11) 6 6 Ь2 (Е) с нулевым средним значением

+да

/ у £) dt = 0. (1)

—да

В результате масштабирования ф на величину т и сдвига на к получаем семейство таких функций (см. [1]):

л/ш

ft - ш

(2)

Пространство Ь2 (Е) можно описать через иерархические вложенные подпространства УтсЬ2(Е), т=0, ±1, ±2, ..., которые не пересекаются, а их объединение в пределе дает Ь2 (Е). Для пространства У0 существует функция ффеУ0, называемая масштабирующей, ее целочисленные сдвиги по аргументу образуют ортонормирован-ный базис пространства У0:

Фо,к=ф(1-к), к=0, ±1, ±2, ... (3)

При разложении функции на вейвлетные ряды для заданного уровня т используют функцию

да да да

«(1)= £ Ст,кфк№+ X Е От,к Утк№, (4)

к=—да т=—да к=—да

где Ст,к, Бт,к - аппроксимирующие и детализирующие коэффициенты вейвлет-преобразования.

Значения коэффициентов вычисляются следующим образом [2]: I* да

Ст,к= I вффткф Л, (5)

т —да

3(1)Утк(1)^ . (6)

/•а

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Dm,k= J

а

i Надоели баннеры? Вы всегда можете отключить рекламу.