Научная статья на тему 'Диагностика индивидуальных траекторий обучения решению задач по математике'

Диагностика индивидуальных траекторий обучения решению задач по математике Текст научной статьи по специальности «Науки об образовании»

CC BY
148
72
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОИСК РЕШЕНИЯ ЗАДАЧ / БИОЛОГИЧЕСКАЯ ОБРАТНАЯ СВЯЗЬ / ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ / АДАПТИВНОЕ ПОВЕДЕНИЕ / DECISION SEARCH / BIOLOGICAL FEEDBACK / TRAINING WITH A REINFORCEMENT / ADAPTIVE BEHAVIOUR

Аннотация научной статьи по наукам об образовании, автор научной работы — Дьячук Павел Петрович

В статье рассматривается компьютерная система, с помощью которой можно исследовать адаптивное поведение обучающихся. Приведены данные эксперимента диагностики индивидуальных различий обучающихся при прохождении динамических компьютерных тестов адаптации в вербальных проблемных средах.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Diagnostics of individual learning trajectories in solving mathematical tasks

In the given article the computer system which can be used to investigate adaptive behaviour of trainees is considered. The data of an experiment in diagnostics of individual trainees' adaptive distinctions revealed by special dynamic computer tests are considered.

Текст научной работы на тему «Диагностика индивидуальных траекторий обучения решению задач по математике»

ДИАГНОСТИКА ИНДИВИДУАЛЬНЫХ ТРАЕКТОРИЙ ОБУЧЕНИЯ РЕШЕНИЮ ЗАДАЧ ПО МАТЕМАТИКЕ

Поиск решения задач, биологическая обратная связь, обучение с подкреплением, адаптивное поведение.

Педагогические теории индивидуализации обучения [Берулава М.Н., Берулава Г. А., 1999, с. 1], как правило, основываются на личностно ориентированном подходе к организации процесса обучения. В основе личностно ориентированного подхода лежит требование к системе обучения, заключающееся в том, что она должна обучать с учетом индивидуальных особенностей учащихся или студентов. Для этого личностно ориентированная система обучения должна адаптироваться к обучаемому.

В компьютерных адаптивных обучающих системах предполагается создание модели обучаемого и соответствующей адаптации к параметрам и структуре этой модели. Если цели обучения не достигаются, то система должна изменять модель обучаемого так, чтобы после соответствующей адаптации по параметрам и структуре измененной модели обучаемого снова попытаться достигнуть целей обучения. С компьютерным вариантом решения проблемы адаптации системы обучения к обучающемуся можно познакомиться в работе [Растри-гин, 1981].

Однако практически нигде не анализируется другой подход к проблеме повышения эффективности и качества обучения. Этот подход тоже можно назвать личностно ориентированным, но с одним лишь важным отличием, заключающимся в том, что не система обучения адаптируется к индивидуальным особенностям обучаемого, а сам обучаемый, проявляя индивидуальность, должен адаптироваться к системе обучения. Адаптация обучаемого к системе обучения реализуется в основном при самостоятельной работе. Поэтому обучаемого точнее называть обучающимся, подчеркивая активный характер его учебной деятельности. Самостоятельная учебная деятельность является проявлением поисковой активности обучающегося, которая характеризует действия человека в условиях неопределенности среды. Если неопределенность задачной ситуации велика, то поисковая активность падает вплоть до формирования у обучающегося состояния обученной беспомощности. Управлять поисковой активностью обучающегося можно, регулируя степень неопределенности ситуаций, возникающих при решении задач. Однако внешним управлением осуществлять регулирование поисковой активностью человека сложно, так как нет информации о потенциале внутреннего состояния обучающегося. Более эффективно это делать посредством создания условий для саморегулирования обучающимся неопределенности проблемной среды. Поисковая активность в этом случае является активным способом адаптации обучающегося к проблемной среде или к системе обучения.

Важной характеристикой индивидуальных особенностей учебной деятельности обучающихся является выбор стратегии решения задач, который в значительной степени определяется контекстом, руководствуясь которым студенты решают задачи. Внешний контекст предполагает, что студент в своей деятельности опирается на сигналы (реакцию) среды, то есть на внешнее подкрепление своей деятельности. Опора на внутренний контекст предполагает, что студент в деятельности не нуждается в реакции (подкреплении) среды. Его учебная деятельность осуществляется в уме, с опорой на собственное мышление.

В настоящей работе рассматривается система управления адаптивным поведением обучающегося решению математических задач и дается классификация индивидуальных траекторий самостоятельного обучения решению задач.

В работах [Дьячук, 2005; Дьячук, Лариков, 2007] описаны динамические компьютерные тесты-тренажеры, в которых предложено решение проблемы управления поисковой активностью обучающегося решению задач, а на соответствующий способ обучения и диагностики обучаемости получен патент изобретения [Дьячук, Лариков, 2007].

При разработке динамических компьютерных тестов-тренажеров учитывалось, что учебная деятельность всегда направлена на получение субъективно нового опыта. Приобретенный опыт выражается в том, что при повторном решении той же или аналогичной задачи уменьшается количество ошибок и совершенствуется структура системы действий обучающегося. Как правило, учебная деятельность при самостоятельном научении решению задач носит итеративный характер, то есть обучающиеся научаются безошибочному решению, решая последовательность одинаковых или аналогичных задач. Однако иногда возникают ситуации, когда они не только не могут научиться безошибочному решению задач, но и не могут просто решить задачу. Это может являться основной причиной неуспешного обучения.

Проблема неуспешного обучения решению задач обусловлена тем, что обучающийся не в состоянии отличать текущее состояние решения задачи от целевого и, соответственно, не может осуществлять целенаправленную деятельность по поиску решения задачи. Главными причинами этого являются: во-первых, отсутствие или недостаточное множество действий (операций), задающих функцию преемника, которая позволяет переходить при решении задачи от одной ситуации к другой; во-вторых, отсутствие у обучающихся представлений о цели для данного типа задач.

Для того чтобы этого не произошло, необходимо организовать биологическую обратную связь (БОС) между обучающимся и компьютерной системой, которая обеспечивает условия для поиска решения задач [Дроздова, Дьячук, 2009]. Как показано ниже, создание БОС для процесса поиска решения задач основано на применении информационных технологий и теории поиска решения задач в пространстве состояний [Рассел, 2006].

Пространство состояний задачи отображается в виде множества ситуаций и системой кнопок, задающих функцию определения преемника. Нажатие кнопки соответствует тому или иному действию, которое переводит задачу из текущей ситуации в следующую. Последовательность действий можно рассматривать как путь, который проходит обучающийся в процессе поиска решения задачи. По мере научения путь, проходимый обучающимся, приближается к оптимальному, т. е. его деятельность становится безошибочной.

Из рис.1 видно, что пространство состояний задачи конструирования графика линейной функции представляет собой граф, вершины которого находятся в узлах квадратных решеток. Каждой вершине соответствуют два числа (к, Ь) . Первое число соответствует к - тангенсу угла - наклонная графика, второе число - Ь - показывает, насколько поднят или опущен график линейной функции вдоль оси Оу . Квадратные решетки соответствуют разным знакам к. На рис. 1 штриховая линия показывает оптимальную траекторию перехода из начального состояния в целевое.

Рис. 1. Граф пространства состояний решения задачи по преобразованию графика линейной функции из начального состояния (1,0) в целевое (-1/3, -1)

Если положить, что действия имеют длину (стоимость), равную 1, то оптимальная траектория имеет длину, или «стоимость», равную 4. Сплошная линия показывает неоптимальную траекторию перехода из начального в целевое состояние. Обучающийся в самом начале своей деятельности совершил два неправильных действия и удалился от целевого состояния на 6 действий. Длина этой траектории равна 8.

Рис. 2. Траектории деятельности: 1 - оптимальная траектория -4 действия; 2 - неоптимальная траектория - 8 действий

На рис. 2 приведены графики оптимальной и неоптимальной траекторий деятельности обучающихся. Вертикальная ось ^ задает номер состояния задачи. Расстояние до цели определится как

L = Ъ - Ъг

(3)

где 20 - минимальное расстояние между начальным и целевым состояниями, расстояние

до цели L является важным параметром поискового поведения обучающегося решению задач. Вывод на экран дисплея датчика «расстояние до цели» позволит обучающемуся корректировать поиск решения задачи, исправляя ошибочные действия до тех пор, пока не будет достигнуто целевое состояние.

В качестве примера рассмотрим адаптивное поведение обучающегося решению алгоритмических задач по математике. Для этого используем БОС, в основе функционирования которой лежит обучение с подкреплением [Редько, 2008]. В обучении с подкреплением рассматривается поведение как реального животного, так и искусственного анимата, взаимодействующего с внешней средой. В нашем случае роль внешней (проблемной) среды играет пространство состояний, а взаимодействие происходит в процессе поиска решений обучающимся. Как указывалось выше, механизм обучения с подкреплением обусловлен наличием дополнительной петли

обратной связи обучающегося с проблемной средой (рис. 3). Как показано В.Г Редько, в текущей ситуации S(t) обучающийся выполняет действие а0Х получает подкрепление г(1) и попадает в следующую ситуацию S(t + 1); 1=1,2,... [Редько, 2008].

Рис. 3. Схема обучения с подкреплением

Подкрепление г(0 может быть положительным (награда) или отрицательным (наказание). Дополнительная петля обратной связи включает в себя действие а(1:) и соответствующее подкрепление гО).

Подкрепление г(1:) осуществляется через датчик «расстояние до цели» и соответствующей «рожицы». Правильное действие означает приближение к цели, радостная «рожица» - положительное подкрепление, неправильное действие приводит к удалению от цели и, соответственно, к недовольному выражению «рожицы».

Таким образом, после выполнения каждого действия проблемная среда немедленно возвращает сигнал обратной связи. Эта обратная связь принимает форму скалярного числового значения, которое может рассматриваться как оценка действия. Правильное действие оценивается числом +1, неправильное------1. На интуитивном уровне можно предположить, что

благоприятное действие получает положительную обратную связь, а неблагоприятное - отрицательную обратную связь. Сигнал обратной связи, поступающий из среды, принято называть сигналом вознаграждения. В нашем случае этот сигнал передается через датчик «расстояние до цели». Обучающийся, используя БОС, находит приемлемый способ действий или операций в каждом состоянии. В этом состоят обучение и, соответственно, адаптивное поведение или учебная деятельность.

Для диагностики индивидуальных различий обучающихся решению математических задач были разработаны: а) компьютерная система, моделирующая проблемную среду с БОС в виде датчика «расстояние до цели»; б) компьютерный диагностический комплекс процессуальных характеристик учебной деятельности обучающегося на основе контент-анализа продуктов деятельности. В качестве математической задачи была взята проблема преобразования графиков функций У = ^х) на примере квадратичной функции

у = а(х - х0)2 + у0. Начальное состояние задачи задавалось графиком функции у = х2. На экране дисплея график у = х был представлен в виде объекта, который можно перемещать вдоль осей Ох и Оу , можно деформировать график, сдвигая и раздвигая ветви параболы, изменяя тем самым коэффициент а, переворачивать относительно оси. При этом компьютерная система вычисляет величину L при каждом действии или преобразовании параболы. Адаптивное поведение обучающегося состоит в том, что при итеративном научении доля правильных действий возрастает, приближаясь к 1. При этом ограничений на вре-

менные ресурсы не накладывалось. Количество заданий ограничивалось числом 50, то есть полагалось, что если при выполнении 50 заданий не произошло адаптации, то у обучающегося недостаточная обучаемость математике [Дьячук, 2005].

Для того чтобы обучающийся мог видеть то, как протекает процесс адаптации, были введены 10 уровней адаптации. Уровень адаптации соответствует доле правильных действий, совершаемых обучающимся. Например: 5 уровень соответствует доле правильных действий р £ [0.5;0.б). Уровни адаптации отображались на экране дисплея набором дискретных датчиков и выполняли роль мотивационных управляющих воздействий. Как уже говорилось выше, адаптивное поведение наблюдается тогда, когда каждое действие обучающегося подкрепляется (положительно или отрицательно) реакцией проблемной среды. В нашем случае подкрепление идет через БОС - датчик «расстояние до цели».

Задача эксперимента состояла в выяснении механизмов адаптивного поведения обучающихся. Предполагалось, что адаптация обучающихся может происходить: а) с опорой на внешний контекст; б) с опорой на внутренний контекст. Опора на внешний контекст предполагает, что в адаптивном поведении обучающихся реакция среды играет существенную роль и стоит убрать датчик «расстояние до цели», обучающийся начнет делать ошибки и уровень его адаптации понизится. Опора на внутренний контекст предполагает, что реакция среды играет несущественную вспомогательную роль в научении решению задач. В случае когда датчик «расстояние до цели» убирается, уровень адаптации не меняется, то есть остается десятым. На рис. 4 приведены кривые движения обучающихся по уровням самостоятельности учебной деятельности, полученные в режиме непрерывного подкрепления с последующим выключением датчика «расстояние до цели» и выполнением задания без реакции среды или подкрепления. Из рис. 4 можно сделать вывод о том, что индивидуальные траектории обучения решению задач по математике существенно отличаются друг от друга и зависят о выбора стратегии.

На рис. 5 приведена гистограмма распределения обучающихся по уровням адаптации после выключения датчика «расстояние до цели», построенная на множестве студентов, адаптивное поведение которых вывело их на 10 уровень.

а)

б)

Рис. 4. Кривые научения или адаптации

к проблемным средам: а) с опорой на внешний контекст; б) с опорой на внутренний контекст.

N - номер уровня, і - номер задания

Рис. 5. Гистограмма распределения испытуемых по уровням адаптации после выключения датчика «расстояние до цели»

по достижении ими 10 уровня.

К - относительная доля испытуемых, і - номер уровня

Видно, что основная часть студентов (около 45 %) обучается с опорой на внешний контекст, то есть их учебная деятельность нуждается в постоянном подкреплении. 18 % студентов после выключения датчика остались на 10 уровне адаптации. Эти студенты обучаются с опорой на внутренний контекст и не нуждаются во внешних подкреплениях. Остальные студенты (37 %) распределились между 1 и 10 уровнями.

Библиографический список

1. Берулава М.Н., Берулава Г.А. Технология индивидуализации обучения на основе учета когнитивного стиля. Сочи: Изд. НОЦ РАО, 1999. 34 с.

2. Дьячук П.П. Динамические компьютерные системы управления и диагностики процесса обучения: монография / Краснояр. гос. пед. ун-т им. В.П. Астафьева. Красноярск, 2005. 344 с.

3. Дроздова Л.Н., Дьячук П.П. Способ организации биологической обратной связи с детектором ошибок мозга в процессе научения // Моделирование неравновесных систем, 2009. С. 80-82.

4. Дьячук П.П., Лариков Е.В. Способ обучения и диагностики обучаемости / Патент на изобретение № 2294144. Государственный реестр изобретений РФ 27 февраля 2007.

5. Рассел С., Норвиг П. Искусственный интеллект: современный подход: пер. с англ. 2-е изд. М.: Изд. дом «Вильямс», 2006. 1408 с.

6. Растригин Л.А. Адаптация сложных систем. Рига: Зинатне, 1981. 375 с.

7. Редько В.Г. Модели адаптивного поведения - биологически инспирированный подход к искусственному интеллекту // Искусственный интеллект и принятие решений. 2008. № 2. С. 13-22.

i Надоели баннеры? Вы всегда можете отключить рекламу.