ПСИХОЛОГИЯ
УДК 159.9
А.Ю. Агафонов, С.Н. Бурмистров, P.A. Сханов, М.Г. Филиппова *
ЭФФЕКТЫ НАУЧЕНИЯ В УСЛОВИЯХ ПРОТИВОРЕЧИВОЙ ОБРАТНОЙ СВЯЗИ**
В статье описаны процедура и результаты экспериментального исследования, направленного на установление зависимости эффективности научения от противоречивой обратной связи. В эксперименте использовались задачи зрительно-моторной координации. Показано, что в условиях противоречивой обратной связи существует выраженная тенденция принимать за собственный результат лучший из предъявленных альтернатив. Использование такой стратегии тем не менее приводит к повышению эффективности научения. Кроме того, обнаружено, что повторяющиеся ошибки играют важную роль в процессе научения, обеспечивая повторение наиболее точных реакций.
Ключевые слова: научение, обратная связь, повторяющиеся ошибки.
Одной из наиболее масштабных проблем в психологии до сих пор остается проблема научения. Пожалуй, одним из первых понятие «научение» в своих теоретических построениях стал использовать Э.Л. Торндайк.«Научение» он определял как процесс и результат приобретения индивидуального опыта. В дальнейшем это понятие получило большое количество определений и различных трактовок. В наиболее общем виде этим термином принято описывать изменения потенциальной возможности поведения, происходящие из опыта [6].
Из целого ряда теорий, стремящихся описать и объяснить факты научения, выделяют подход Б.Ф. Скиннера. В анализе процесса научения Б.Ф. Скиннер руководствовался прин-
* © Агафонов А.Ю., Бурмистров С.Н., Сханов P.A., Филиппова М.Г., 2013 Агафонов Андрей Юрьевич (ayagafonov@yandex.ru), Бурмистров Сергей Николаевич (burm33@mail.ru), кафедра общей психологии; Сханов Руслан Александрович (ruslanshan@mail.ru), кафедра психологии развития Самарского государственного университета, 443011, Российская Федерация, ул. Акад. Павлова, 1.
Филиппова Маргарита Георгиевна (box4fox@yandex.ru), факультет психологии Санкт-Петербургского государственного университета, 199034, Российская Федерация, г. Санкт-Петербург, Университетская наб., 7—9.
** Статья подготовлена в рамках исследовательских проектов, поддержанных РФФИ (проект № 13-06-00416) и РГНФ (проект № 12-06-00457).
ципом простоты. Он считал, что построение сложных теорий не облегчает понимание простых процессов, а научение рассматривал в духе бихевиоризма — как совокупность реакций, возникающих в ответ на стимульные воздействия. Данная проблема также привлекала научный интерес КЛ. Халла В схему классического бихевиоризма (3-Я) он добавил «промежуточные переменные» — гипотетические процессы, опосредующие поведенческую реакцию. В контексте обсуждаемой проблематики нельзя не отметить также И.П. Павлова, который внес значительный вклад в разработку проблемы научения. Согласно его теории, в основании любого вида научения лежит условный рефлекс, который формируется в результате сочетания условного и безусловного раздражителей. Особенностью образования психического опыта в отличие от физиологического рефлекса является большее число условий, влияющих на результат, т. е. на интегральный эффект научения [2]. В свою очередь, гештальтисты во главе с М. Вертгеймером показали, что новый опыт нельзя объяснить лишь путем анализа простейших элементов, входящих в него. Первичными психическими образованиями, организующими новый опыт, являются целостные структуры (гештальты). Существует много и других теорий и концепций, которые в той или иной степени затрагивают проблему научения. Так, например, Ж. Пиаже определял «научение» как приспособительную функцию организма, которая направлена на адаптацию в постоянно меняющейся среде. А. Бандура расширил понятие «научение», добавив в него новую область: научение через наблюдение.
Большинство исследователей, анализирующих процесс научения, одним из важнейших механизмов формирования нового знания считают «обратную связь». Вообще говоря, любой осознанный опыт информирует субъекта познания и деятельности о предыдущем познавательном или поведенческом акте, после чего становится возможной коррекция действий с учетом полученной информации. Важность учета обратной связи в понимании динамики и эффективности научения признают психологи практически всех направлений.
Выделяют разные виды обратной связи. Так, например, различают положительную и отрицательную обратную связь; адекватную (истинную) и ложную; нейтральную и эмоционально значимую и т. п. При всем разнообразии оснований, на которых можно классифицировать обратную связь, основными видами предлагается считать достоверную и ложную, а также отрицательную и положительную [4].
Адекватная обратная связь далеко не всегда оказывается эффективной в плане научения. Например, в случае тенденциозных, повторяющихся ошибок, осознание ошибки вовсе не гарантирует ее последующего исправления. Феномен устойчивых ошибок означает, что тенденция к последействию ошибочных реакций (выборов, решений) выражена сильнее, чем корректирующие воздействия, направленные на исправление ошибочных действий. Поэтому резонно допустить, что увеличение размера ошибки, о которой информирует ложная обратная связь, может оказывать более выраженный корригирующий эффект за счет того, что при осознании ошибки большей величины будет увеличиваться и сила коррекции. Действительно, ранее было продемонстрировано, что ложная обратная связь, которая информирует субъекта о большей величине ошибки по сравнению с действительно совершенной ошибкой, является действенным средством повышения эффективности научения при решении простейших когнитивных задач [1].
Объяснение различий настоящих и полученных ранее результатов может состоять в том, что рассматриваемые эксперименты имели существенные процедурные отличия: тогда как в предыдущем исследовании обратная связь задавалась однозначно, в последнем случае существовала возможность выбора самими испытуемыми лучшей или худшей для себя альтернативы. Существование такой возможности, по всей видимости, не может быть приравнено к негативной обратной связи.
Таблица 1
Описательные статистики в группах с более и менее точной альтернативой выбора
Описание Группа с менее точной альтернативой, чем собственный результат Группа с более точной альтернативой, чем собственный результат
Среднее отклонение (по модулю) 32 25
Станд. отклонение 18 12
Станд. ошибка среднего 1,09 0,6
Заслуживает внимания тот факт, что по результатам настоящего исследования испытуемые обеих групп (с альтернативой выбора более или менее точного результата по сравнению с собственным) оказались склонны считать истинной обратной связью лучший результат из двух предложенных альтернатив, вне зависимости от точности собственных реакций (с2 = 5,74, ёГ = 1, р = 0,017).
Так, больше 65 % испытуемых в той и другой группе идентифицировали более точные (т. е. близкие к цели) результаты как собственные.
Настоящее исследование выполнено в контексте изучения влияния обратной связи на результаты когнитивной деятельности и, в частности, на эффективность исправления устойчивых ошибок. В эксперименте использовалась противоречивая обратная связь. Иначе говоря, испытуемый в процедуре эксперимента вынужден был сам выбирать из двух предъявленных тот результат решения экспериментальной задачи, который отражает реальное положение дел, т. е. действительно полученный им результат. В данном случае испытуемый выполнял однотипные экспериментальные задачи в диссонансных условиях получения обратной связи о результатах их решения.
Процедура. В эксперименте приняло участие 44 добровольца с нормальным зрением в возрасте от 18 до 46 лет. Процедура проводилась индивидуально с каждым испытуемым в изолированном помещении. Испытуемые были поделены на две группы. Перед началом процедуры испытуемым объявлялось, что целью эксперимента является исследование научения при решении задач «реакция на движущийся объект». Для проведения самой процедуры была разработана специальная компьютерная программа, позволяющая устанавливать следующие параметры: угол обзора движения перемещающегося объекта по окружности в каждой попытке, скорость движения объекта, коэффициент отклонения дополнительной (ложной) обратной связи, диаметр окружности.
Испытуемый располагался перед экраном монитора персонального компьютера. Перед началом выполнения экспериментального задания испытуемый знакомился со следующей инструкцией: «Точка движется по окружности с постоянной скоростью. После прохождения какой-то части окружности движение точки станет недоступным для восприятия. Ваша задача — остановить точку в том месте, откуда она начала движение, т. е. после прохождения всей окружности. Начало движения точки в каждой пробе и остановка осуществляеються две позиции: одна из них отражает Ваш действительный результат, другая — ложный».
Первые пять попыток составляли тренировочную серию, далее шла контрольная серия, состоящая из 50 попыток. Стартовая позиция была обозначена в виде красной
точки размером 8 пикселей (примерно 4 мм) на сером фоне. Точка располагалась в центре правой половины монитора. После нажатия клавиши «пробел» от красной точки начинала движение желтая точка такого же размера. Желтая точка двигалась по воображаемой окружности (сама окружность не просматривалась) по часовой стрелке. Диаметр окружности составлял 340 пикселей (19,5 см). Время прохождения всей окружности при установленной скорости — около 4 сек. После прохождения части окружности движение точки становилось недоступным для наблюдения. Место на воображаемой окружности, в котором движение точки становилось невидимым, выражалось пятью значениями: 140, 160, 180, 200, 220 градусов от стартовой позиции. Каждое из этих значений встречалось в контрольной серии по 10 раз. Эти условия варьировались в случайном порядке. Остановка движения точки в «невидимой зоне» осуществлялась повторным нажатием клавиши «пробел». После ее нажатия испытуемому демонстрировались два варианта результата выполненного задания. Один из вариантов отражал действительный результат, т. е. положение движущейся точки на воображаемой окружности в момент ее остановки; другой вариант представлял собой результат увеличения (в первой группе) или уменьшения (во второй группе) на 25 % величины действительного отклонения от координаты «цели». Иначе говоря, если, например, испытуемый первой экспериментальной группы нажимал «пробел» в момент, когда желтая точка прошла 340 из 360 градусов полной окружности, ему демонстрировались два варианта: один на отметке 340 градусов, другой на отметке 335 градусов. Последняя величина рассчитывалась по формуле:
У=360±((360-Х)*1,25), где X — это действительный результат, а У — результат с увеличенным на 25 % отклонением от «цели».
Для второй экспериментальной группы вместо коэффициента 1,25 применялся коэффициент 0,75. Здесь ложный результат был всегда на 25 % ближе к искомой цели, чем действительно показанный испытуемым. Таким образом, в том случае, если испытуемый нажимал «пробел» до того, как точка полностью опишет окружность, фиксировалась ошибка «ложной тревоги», а если испытуемый останавливал движущуюся точку после той позиции, с которой началось ее движение в данной пробе, то фиксировалась ошибка «запаздывания».
Действительно показанный испытуемым результат на протяжении всей серии был показан как заштрихованный круг диаметром 4 мм. Ложная обратная связь представляла собой круг с выделенным контуром, без штриховки, также диаметром 4 мм. В случае абсолютно точного попадания оба круга демонстрировались наложенными друг на друга.
После выполнения серии заданий от испытуемого требовалось выбрать из двух кругов (со штриховкой или без) тот, который во всех попытках, по мнению испытуемого, отражал его настоящий результат. По каждому испытуемому фиксировались следующие параметры: отклонение от цели в каждой пробе и выбор одного из двух предъявленных результатов.
Результаты и их обсуждение. Учитывая полученные ранее данные, согласно которым использование метода обратной связи с преувеличением совершаемых испытуемыми ошибок может позитивно отражаться на процессе научения (Агафонов, Сха-нов, Филиппова, 2013), первоначально наше внимание было сконцентрировано на сопоставлении средней точности реакций в двух группах, а именно в группах, где ложная обратная связь преувеличивает или преуменьшает ошибку испытуемого.
Поскольку в ходе процедуры эксперимента испытуемые могли останавливать световое пятно, как до цели (ошибки «ложной тревоги»), так и уже после цели (ошибки «запаздывания»), для вычисления среднего отклонения от цели и расчета точности реакций использовались значения отклонения, взятые по модулю.
Результаты эксперимента показали, что, вопреки полученным ранее данным и нашим ожиданиям, в группе с ложной обратной связью, преуменьшающей ошибку испытуемого, реакции оказалась значимо точнее по сравнению с таковыми в группе с ложной обратной связью, преувеличивающей эту ошибку (1 = 5,2; ёГ = 2; р < 0,001).
Таблица 2
Процент испытуемых, угадавших / не угадавших собственный результат в группах с более и менее точной альтернативой выбора
Описание Группа с менее точной альтернативой, чем собственный результат Группа с более точной альтернативой, чем собственный результат
Угадавшие собственный результат 32% 68,4%
Не угадавшие собственный результат 68,0% 31,6%
Как можно видеть по таблице 2, в группе с менее точной альтернативой, чем собственный результат, верных ответов практически в 2 раза больше, чем ошибочных, тогда как в группе с более точной альтернативой, напротив, верных ответов в 2 раза меньше, чем ошибочных. Полученные результаты демонстрируют выраженную тенденцию испытуемых считать собственным лучший результат из предложенных альтернатив.
Для уточнения полученных данных вся выборка испытуемых была разделена на 4 подгруппы в соответствии с тем, попал ли тот или иной испытуемый в группу с менее или более точной альтернативой, а также в соответствии с правильностью или ошибочностью выбора им собственного ответа. В результате те, кто угадал свой ответ в группе с менее точной альтернативой, были названы нами условно «реалистичные оптимисты»; те, кто не угадал свой ответ в группе с менее точной альтернативой, — «нереалистичные пессимисты»; те, кто угадал свой ответ в группе с более точной альтернативой, — «реалистичные пессимисты», и, наконец, те, кто не угадал свой ответ в группе с более точной альтернативой, — «нереалистичные оптимисты» (см. табл. 3).
Таблица 3
Условные обозначения выделенных подгрупп
Описание Группа с менее точной альтернативой Группа с более точной альтернативой
Угадавшие свой результат Реалистичные оптимисты Реалистичные пессимисты
Не угадавшие свой результат Нереалистичные Пессимисты Нереалистичные оптимисты
Разделив испытуемых на отмеченные подгруппы, мы проверили, испытуемые каких подгрупп являются более точными. Логично было бы предположить, что испытуемые, выбравшие результат, менее точный из двух предложенных (т. е. «нереалистичные и реалистичные пессимисты»), являются более критичными, а потому и более точными, нежели испытуемые, опознавшие более близкий к цели результат как собственный. Однако полученные результаты не подтвердили это предположение (рис. 1).
Рис. 1. Среднее отклонение от цели в сравниваемых подгруппах
Значимые различия между группами: IV и I (t = 7,3; df = 1498; p< 0,001) IV и II (t = 4,3; df = 1048; p< 0,001) IV и III (t = 7,9; df = 948; p < 0,001)
Как можно видеть по приведенному рисунку, более точными оказались вовсе не пессимисты, а оптимисты, причем «нереалистичные», т. е. выбравшие более близкий к цели результат вместо своего настоящего. Именно эта подгруппа испытуемых продемонстрировала наименьшее отклонение от цели, значимо отличающееся от всех остальных сравниваемых подгрупп.
Объяснение полученных результатов мы склонны видеть в том, что испытуемые подгруппы «нереалистичные оптимисты» используют стратегию упования на лучшее, которая в конечном итоге оказывается более эффективной по сравнению с другими используемыми стратегиями, в том числе со стратегией точности (как, например, у «реалистичных оптимистов»). Предположительно, стратегия «нереалистичных оптимистов» становится эффективной за счет позитивных эмоций, которые испытывают испытуемые, веря в лучшее достижение, в результате чего экспериментальная деятельность осуществляется ими как бы на повышенно позитивном эмоциональном фоне. Данная интерпретация полученных результатов может быть проверена в дальнейших исследованиях путем изучения самооценки эмоционального фона испытуемых разных подгрупп.
Полученные данные связаны с проблемой принятия решений в ситуации неопределенности, разрабатываемой такими учеными, как Д. Канеман и А. Тверски [8], Р.Е. Нисбетт [7] и др. Эти исследователи обнаружили, что, несмотря на возможность серьезных ошибок, различные эвристики мышления, вызванные ограниченными возможностями обработки информации, в целом полезны, а также, что решения могут быть необъективными, но тем не менее оптимальными. Как справедливо отмечает Е.А. Сергиенко [3], оптимальными подобные решения делают те преимущества, которые человек получает в результате принятия таких решений. К таким преимуществам относится экономия когнитивных усилий, улучшение эмоционального состояния и повышение
эффективности последующих действий. На наш взгляд, в нашем исследовании мы имеем дело как раз с таким случаем.
Причем, как можно заметить по полученным данным, интерпретация обратной связи оказывает влияние на последующие реакции непосредственно сразу, как бы задавая планку для дальнейших реакций. Для иллюстрации этого можно привести кривые научения в каждой из рассматриваемых подгрупп (рис. 2).
«Реалистичные оптимисты»
«Реалистичные пессимисты»
«Нереалистичные пессимисты»
«Нереалистичные оптимисты»
Рис. 2. Кривые научения в сравниваемых подгруппах
Под непосредственным действием обратной связи подразумевается то, что она влияет на каждую следующую реакцию, а не проявляется в каком бы то ни было накопительном эффекте. Так:, например, группа «нереалистичных оптимистов» не отличается более выраженным процессом научения, однако непосредственно сразу после прохождения тренировочной серии она начинает демонстрировать более точные реакции, нежели другие сравниваемые группы. Полученный результат согласуется с ранее полученными данными, где также было выявлено непосредственное действие обратной связи [1].
Отсутствие какого-либо эффекта научения продемонстрировала группа «нереалистичных пессимистов», что мы также предположительно связываем с пониженным эмоциональным фоном, а это может иметь взаимосвязи с личностными особенностями. Данное предположение также может стать основанием для дальнейших экспериментальных исследований.
Отдельное внимание при обработке результатов было уделено повторяющимся ошибкам. Сопоставлялось среднее число повторяющихся ошибок во всех сравнивае-
мых подгруппах. Повтором считалось воспроизведение одним и тем же испытуемым своего прежнего ответа, причем необязательно в следующих друг за другом пробах. Показатели среднего числа повторов приведены ниже.
10,0 10,5 11,0 11,5 12,0 12,5 13,0 13,5 14,0
Рис. 3. Среднее число повторов в сравниваемых подгруппах
Значимые различия между группами: IV и I (1 = -2,4; аГ = 28; р< 0,035) IV и III (1 = -2,6; аГ = 17; р < 0,019)
Как оказалось, испытуемые подгруппы «нереалистичные оптимисты» также совершили наибольшее число повторных реакций. Иными словами, эти испытуемые чаще остальных возвращаются к своим прежним гипотезам, перебирают их. Целесообразность повтора прежних реакций мы предполагаем в том случае, если эти реакции являются более точными, нежели остальные.
Для проверки этого предположения мы сопоставили точность всех повторяющихся и остальных реакций во всех 4 сравниваемых подгруппах. Результаты этого сравнения представлены на рис. 4.
подгруппа
^■'реаАиСТнчньй СЛТимнйТ ибрвалиСТГ№#мй пессимист _ реалистичный пессимист
15,00-
нет есть
повторная ошибка
Рис. 4. Среднее отклонение на повторных и остальных реакциях в сравниваемых подгруппах
Как можно видеть по рисунку, точность повторных ошибок во всех группах больше, нежели точность других реакций. Именно на повторах мы наблюдаем наименьшее отклонение от цели. Полученные данные свидетельствуют о том, что повторяющиеся ошибки играют важную роль в процессе научения и перекликаются с полученными нами ранее данными, где на примере воспроизведения длин отрезков было показано, что тенденцию к повторению имеют как раз более точные ответы [5]. А это говорит о важной роли повторных ошибок в процессе научения.
По результатам исследования были сделаны следующие выводы:
1. Существует выраженная тенденция принимать за собственный результат лучший из предъявленных альтернатив.
2. Использование такой стратегии, несмотря на необъективность, тем не менее обеспечивает эффективное выполнение когнитивной деятельности, отражая, предположительно, склонность человека выбирать путь наименьшего сопротивления в направлении к поставленной цели.
3. Эффективность научения предположительно обеспечивается за счет образования каузальной последовательности: вера в собственные достижения — позитивные эмоции — лучший результат когнитивной деятельности.
4. Повторяющиеся ошибки играют важную роль в процессе научения, обеспечивая повторение наиболее точных реакций.
Библиографический список
1. Агафонов А.Ю., Сханов Р.А., Филиппова М.Г. Когнитивная активность в условиях действия обратной связи различного типа // Известия Самарского научного центра Российской академии наук. 2013. Т. 15. № 2(3). С. 667—672.
2. Павлов И.П. Двадцатилетний опыт объективного изучения высшей нервной деятельности (поведения) животных. М., 1973.
3. Сергиенко Е.А. Оценочные суждения: взгляд на себя со стороны. URL: http:// www.elitarium.ru.2006.
4. Сханов Р.А., Макаров А.В. Когнитивные ошибки и способы их исправления // Известия Самарского научного центра Российской академии наук. 2013. Т. 15. № 2(2). С. 413-416.
5. Сханов Р.А., Филиппова М.Г., Ворожейкин И.В., Макаров А.В. Ошибки в процессе научения при разных способах оценки эталона // Психологические исследования: сб. науч. работ. 2013.
6. Хегенхан Б., Олсон М. Теории научения. СПб., 2004.
7. Nisbett R., Borgida E., Crandall R., Reed H. Popular induction: Information is not necessarily informative // Judgments under uncertainty: Heuristics and biases / eds. D. Kahneman, P. Slovic, A. Tversky. Cambridge University Press, 1982. P. 101-116.
8. Tversky A., Kahneman D. Judgement under uncertainty: heuristics and biases // Science. 1974. Vol. 185. P. 1124-1131.
A.Yu. Agafonov, S.N. Burmistrov, R.A. Skhanov, M.G. Filippova* EFFECTS OF LEARNING IN TERMS OF CONFLICTING FEEDBACK
This article describes the process and results of an experimental study to establish the relation between effectiveness of learning and contradictory feedback. The tasks of hand-eye coordination were used in the experiment. It is shown that in the context of conflicting feedback there is a strong tendency to take the best result of the presented alternatives as their own. Using such strategy, however, leads to increased efficiency of learning. Furthermore, it was found that repeated errors play an important role in learning, providing the most accurate repetition of reactions.
Key words: learning, feedback, repeated errors.
* Agafonov Andrey Yurievich (ayagafonov@yandex.ru), Burmistrov Sergey Nikolaevich (burm33@mail.ru), the Dept. of General Psychology; Shanov Ruslan Alexandrovich (ruslanshan@mail.ru), the Dept. of Psychology of Development, Samara State University, 443011, Russian Federation.
Filippova Margarita Georgievna (box4fox@yandex.ru), faculty of Psychology, Saint-Petersburg State University, Saint-Petersburg, 199034, Russian Federation.