Александр Александрович Рыбанов, доцент, заведующий кафедрой информатики и технологии программирования Волжского политехнического института (филиал) Волгоградского государственного технического университета, кандидат технических наук
ПРОЦЕДУРА КВАНТОВАНИЯ КАК ОСНОВА ПОВЫШЕНИЯ КАЧЕСТВА УЧЕБНОГО МАТЕРИАЛА
Существующие в настоящее время системы дистанционного обучения Мооё1е, Шаэ, С1аго1те, АМог и другие не предоставляют разработчикам дистанционных учебных курсов возможность оценки качества учебного контента. Между тем, оценка учебного контента направлена не только на выявление достоинств и недостатков учебной информации, но и на принятие решения о необходимости и оптимальных условиях его использования в процессе дистанционного обучения1.
Квантование — это разбиение учебной информации на элементарные фрагменты (учебные единицы, шаги, кадры) различного назначения (информационные, тренирующие, контролирующие, управляющие), направленное на уменьшение сложности усвоения смыслов, содержащихся в каждом фрагменте учебной информации2. Объём текстовой информации в этих фрагментах должен быть ограничен.
Процесс квантования — это преобразование: Т' =/(Т), где Т = Т.\. = (1, п) — учебная информация, предназначенная для квантования, Т — логически законченный фрагмент учебной информации ; Т;Т' = (Т\ = (1, п ) — представление учебной информации, где Т' — квант учебной информации, поставленный в соответствие фрагменту Т..
Принцип системного квантования учебной информации предполагает учёт следующих закономерностей: учебная информация большого объёма запоминается с трудом; учебная информация, представленная компактно в определённой системе, лучше вос-
1 Аванесов B.C. Применение заданий в тестовой форме и квантованных учебных текстов в новых образовательных технологиях // Педагогические измерения, 2012, № 2, C. 75-91.
2 Рыбанов А.А. Автоматизированные анализ качества процесса обучения по результатам тестирования знаний на основе диаграмм Парето. // Дистанционное и виртуальное обучение, 2009, № 8, C. 54-59.
118
принимается; выделение в учебной информации смысловых единиц способствует эффективному запоминанию.
Учитывая то, что квант T.' учебной информации должен содержать наиболее информативную часть фрагмента T, требования к кванту учебной информации можно формализовать следующим образом: квант T.' учебной информации должен обладать более низкой избыточностью и большей энтропией, чем T.; квант T.' учебной информации по объёму должен быть меньше соответствующего ему фрагмента T. учебной информации: |T.'| < |T.|.
Процесс построения педагогом кванта T.' для фрагмента T. учебной информации состоит из следующих этапов:
1) подготовительный (чтение и осмысление фрагмента T. учебной информации);
2) аналитический (выделение основных смысловых единиц (предложения, слова, словосочетания), построение структуры кванта T.' для фрагмента T. учебной информации);
3) непосредственное построение кванта T.' для фрагмента T. учебной информации (выделенные ранее единицы располагаются в единый вторичный текст в соответствии со структурой кванта T.').
В качестве смысловых единиц кванта T.' для фрагмента T. учебной информации могут быть использованы: у^ — полное (без изменений) ключевое предложение исходного текста T.; у2 — перефразированное ключевое предложение исходного текста T; у3 — предложение из ключевых слов и словосочетаний исходного текста T.; у4 — предложение, обобщающее несколько предложений исходного текста T..
Качественно подготовленные квантованные учебные тексты обеспечивают понимание учебного материала у большинства учащихся, в силу того, что деление материала на части заметно сужает объём непосредственно воспринимаемой информации и смыслов в каждом фрагменте, делая тем самым постигаемым смыслы всего учебного текста. А работа с заданиями в тестовой форме к таким текстам обеспечивает усвоение содержания каждого текста. Поэтому формирование системы количественных критериев для оценки качества квантования учебной информации является актуальной задачей. Одно из направлений решения данной задачи — использование методов квантитативной лингвистики. Квантитативные характеристики текста могут составлять основу данной системы критериев.
Квантитативная лингвистика (quantitative linguistics) — одно из направлений прикладной лингвистики, которое занимается изучением языка с помощью статистических методов. Преимуществом квантитативных методов изучения текстов является их точность и однозначность результатов.
Важной является задача автоматизированного подсчёта значений квантитативных характеристик текста. Программная реализация автоматизированного определения ряда квантитативных характеристик текста возможна на основе библиотеки морфологического анализа phpMorphy (http://phpmorphy.source-forge.net), реализованной на платформе PHP.
Среди множества квантитативных характеристик текста рассмотрим следующие: квантитативные характеристики употребления частей речи; квантитативные характерис-
ОБРАЗОВАТЕЛЬНЫЕ ТЕХНОЛОГИИ. № 3/2014
119
тики удобочитаемости текста; квантитативные характеристики разнообразия текста.
С помощью библиотеки рИрМогрИу могут быть определены следующие квантитативные характеристики употребления частей речи в тексте:
• индекс аналитичности — отношение числа служебных слов к общему числу слов в тексте;
• индекс глагольности — отношение числа глаголов к числу слов в тексте;
• индекс субстантивности — отношение числа существительных к числу слов в тексте;
• индекс адъективности — отношение числа прилагательных к числу слов в тексте;
• индекс местоименности — отношение числа местоименных слов к числу слов в тексте;
• индекс автосемантичности — отношение числа значащих слов;
• индекс незнаменательности — отношение числа незнаменательных слов к числу слов в тексте;
• индекс именной лексики — отношение суммы чисел существительных и прилагательных к числу слов в тексте.
Среди квантитативных характеристик удобочитаемости текста можно выделить: среднюю длину слова в слогах и среднюю длину предложения в словах. Данные характеристики являются статистическими параметрами, которые используются в формулах для оценки удобочитаемости и необходимы для расчёта индекса формальной удобочитаемости. Эти параметры легко поддаются количественному выражению и пригодны для автоматической оценки.
Следует различать формальную удобочитаемость текста Я^огт(1), являющегося функцией только от параметров самого учебного контента I, и его индивидуальную удобочитаемость (1,и), которая зависит как от характеристик учебного контента I, так и от свойств читателя и. Для количественной оценки формальной удобочитаемости можно использовать индекс Ю. Тулдава3, рассчитываемый по формуле:
я (—,— = •—, (3)
где Я (г , ] ) — индекс формальной удобочитаемости (рисуно—к: 1), . — средняя длина слова в слогах, ] — средняя длина предложений в словах. Формула (3) разработана на основе закономерности, наблюдаемой в разных языках. Поэтому формула Ю. Тулда-ва предназначена для анализа текста на разных языках. Чем меньше значение Я (I , ] ), тем лучше для восприятия текст.
Квантитативные характеристики разнообразия текста описываются коэффициентами лексического и синтаксического разнообразия.
Коэффициент лексического разнообразия формируется из отношения числа лексем к общему числу слов текста:
K = —
lex
(1)
где К1е% — коэффициент лексического разнообразия; Ь — число лексем (словоформ)
3 Tuldava J. About Measurement of Text Difficulties. In: Proc. Of Tartu State University, 1975, P. 102-120.
120
в тексте; Ж — число слов в тексте (единицы между пробелами). Чем выше значение К, тем выше лексическое разнообразие текста.
Коэффициент синтаксического разнообразия вытекает из отношения числа предложений к числу слов данного текста:
К
яуп
1 — — 1 —,
(2)
где К — коэффициент синтаксического разнообразия; Б — число предложений; Ж— число слов в тексте. Чем больше значение К , тем многословнее в целом предложения данного текста, а следовательно, выше возможность разнообразия синтаксических отношений между словами в составе отдельного предложения.
В результате квантования происходит сжатие предложений исходного текста при помощи приёмов: исключение (у^), замена (у2) и слияние (у^), что приводит к изменению квантитативных характеристик текста. Результаты эксперимента, проведённого на коллекции учебных текстов, позволяют сделать следующие выводы: 1. Значение индекса К (г , ] ) для квантованного текста меньше, чем для исходного.
2. Значение коэффициента лексического разнообразия для квантованного текста несколько выше, чем для исходного.
3. Значение коэффициента синтаксического разнообразия для квантованного текста несколько ниже, чем для исходного.
4. Сравнительный анализ значений индексов формальной удобочитаемости, а также коэффициентов лексического и синтаксического разнообразия для соответствующих фрагментов исходного и квантованного текстов позволяет определить фрагменты квантованного текста, для которых необходимо повторное выполнение процедуры квантования учебной информации.
Предлагаемая система квантитативных характеристик (1-3) учебного контента применима к слабоструктурированным текстам. Данная система критериев неприменима к формулам, таблицам, графическим и мультимедийным объектам. Учитывая, что данные объекты, как правило, не подлежат квантованию, система квантитативных характеристик (1-3) может успешно применяться в составе автоматизированных систем проектирования учебного контента.