Две динамические модели научения типа «Кошка Торндайка»

Гавриков Владимир Леонидович; Хлебопрос Рем Григорьевич

ПСИХОЛОГИЯ

В.Л. Гавриков, Р.Г. Хлебопрос

ДВЕ ДИНАМИЧЕСКИЕ МОДЕЛИ НАУЧЕНИЯ ТИПА «КОШКА ТОРНДАЙКА»

«Кошка Торндайка», «проблемный ящик», уравнение Ферхюльста, фазовый портрет уравнения,

нелинейная модель, линейная модель.

В настоящее время понятию «научение» может придаваться двойной смысл. Так, одно из определений его подчеркивает, что научение - это «феномен приобретения нового опыта или его конечный результат» [Резникова 2005: 32]. С другой стороны, научение (обучение) может быть интерпретировано как «показатель темпа и качества усвоения знаний, умений и навыков» [Холодная 2002: 246].

Такое двойное понимание научения сложилось исторически и характеризуется, в частности, тем, что большинство достижений и открытий науки о поведении сделаны в рамках понимания научения как результата, когда основные вопросы исследования звучат как «можно ли или нельзя научить?», «почему можно или нельзя научить?».

Вместе с тем этап открытий неизбежно должен сопровождаться также и более тонким анализом, в центре которого стоит интерес к научению как процессу, который разворачивается во времени по определенным законам, а основные вопросы звучат: каким образом можно описать процесс во времени и каковы механизмы того, чтобы процесс протекал именно таким образом? Тем более что со времен Э. Гатри и Э. Торндайка происходило накопление количественных данных о динамике процесса научения. На основе понимания процесса могли также разрабатываться методики достижения результата научения, как в случае пороговой техники дрессировки Э. Гатри.

В настоящей работе мы рассматриваем процесс научения, который можно условно отнести к типу «кошка Торндайка», а основным средством анализа являются инструменты качественной теории динамических систем. Методы теории динамических систем хорошо зарекомендовали себя при анализе различных природных, в том числе биологических объектов [Исаев, Хлебопрос 1973; Исаев и др., 1984; Ризниченко, Рубин 1993; Strogatz 2000].

Важной составляющей этих инструментов является фазовый портрет - графоаналитический способ представления динамики некоторой системы. В основе метода фазовых портретов лежит предположение о том, что между текущим состоянием системы и скоростью изменения этого состояния существует некоторая зависимость, которая может быть выражена какой-либо функцией. Характер и структура этой функции и представляют собой внутренний движущий механизм, определяющий динамику системы.

Если Х - некоторая значимая характеристика системы, то X - ее производная по времени, соответствующая скорости изменения этой характеристики. Например, если Х - объем знаний по какому-либо предмету, то X - скорость, с которой этот объем знаний изменяется.

Знак X (положительный либо отрицательный) определяет, соответственно, увеличивается или уменьшается Х со временем. Таким образом, в плоскости Х- X можно представить себе кривую зависимости между характеристикой и скоростью ее изменения и наглядно увидеть движение системы с течением времени. В положительной области X характеристика (Х) будет всегда возрастать, в отрицательной - уменьшаться. Случаи, когда X = 0, называются точками равновесия, так как в них система (во всяком случае рассматриваемая ее характеристика) не меняется. Точки равновесия могут быть как устойчивыми, так и неустойчивыми. К первым система самопроизвольно приближается, от вторых - отдаляется.

Например, если связь между X и Х выражается некоторой функцией/ (X), как на рис. 1, то в этом случае существует одна устойчивая точка равновесия, к которой значения характеристики Х системы будут со временем стремиться. Зная вид функции / (X), можно иногда вычислить, каковы будут форма зависимости X (), где I - время, и ее свойства. Вычисление вида X @) и ее исследование являются одной из главных целей анализа в теории динамических систем.

Рис. 1. Вид гипотетического фазового портрета некоторой системы с одной из траекторий, описываемой функцией f (X). При данной форме функции система (ее характеристика Х) будет стремиться приблизиться к единственной точке равновесия, в ко-

Как известно, в конце XIX в. Э. Торндайком [Thorndike 1898] производились эксперименты, в которых изучались способности животных к научению с помощью экспериментальной установки, получившей название «проблемный ящик» (puzzle box). В серии опытов с кошками замерялось время, в течение которого кошка может освободиться из «проблемного ящика», при этом кошке давалось много последовательных попыток освободиться из ящика. Типичный вид зависимости между временем освобождения и номером попытки показан на рис. 2. В главе 2 своей книги Торндайк приводит следующую последовательность замеров времени (в секундах), потраченного одной из кошек на освобождение: 160, 30, 90, 60, 15, 28,

f(X)

0

торой X = 0

CD

S

| 150

о

ю

о

Число попыток

Рис. 2. Динамика способности кошки выбираться из проблемного ящика Торндайка. Опубликовано в книге E.L. Thorndike «Animal intelligence» (1898)

Основные обозначения и допущения, сделанные нами в ходе анализа, выглядят следующим образом:

1) основная переменная, характеризующая научение кошки, T - время освобождения;

2) полагаем номер попытки точкой физического времени t; это справедливо, если осуществлять попытки освобождения через равные промежутки времени;

3) зависимость T от T имеет, по меньшей мере один корень (точку равновесия); об этом свидетельствует тот факт (рис. 2), что при больших T модуль скорости T1 велик, а затем при малых T T ® 0 .

Целью анализа является поиск функции, которая бы хорошо описывала эмпирические данные и содержала бы разумно интерпретируемые параметры. Поиск возможной формы зависимости T (t) начинается с моделирования зависимости T от T - T (T), что позволяет выдвинуть гипотезы о механизмах, определяющих динамику T (t). В дальнейшем предпринимаются попытки интегрировать T (T) стандартными математическими средствами и получить явный вид зависимости T (t).

Рассмотрим два варианта (модели) представления функции T (T), каждый из которых включает два содержательных параметра:

в виде нелинейного (квадратного) приближения - aT2 +bT;

в виде линейного приближения - bT + c .

Нелинейное приближение T = - aT2 + bT (1)

Выражение вида (1) является известным уравнением Ферхюльста, предложенным и использованным Пьером Ферхюльстом в 1838 г. для описания динамики людского народонаселения. В дальнейшем уравнение Ферхюльста активно использовалось, в частности, в математической экологии для моделирования динамики биологических популяций.

Уравнение (1) задает фазовый портрет системы в виде кривой на рис. 3.

т

Рис. 3. Фрагмент фазового портрета уравнения (1)

Значение Т = — является корнем уравнения (1) и, соответственно, точкой равновесия. Эта

точка является устойчивой, так что состояние системы стремится к ней с течением времени. Решение уравнения (1) может быть представлено в виде:

Т

ЪТп

аТ0 + (- аТ0 + Ь)е ъ‘

(2)

Функция (2) является уравнением логистической кривой, которая в зависимости от значения начального условия Т0 описывает либо ограниченный рост (рис. 4а), либо экспоненциальное затухание (рис. 4б). В том и другом случаях имеется Ъ/а - асимптотический предел. Модель ограниченного роста широко использовалась при моделировании динамики, например числа микроорганизмов в среде с фиксированным запасом питательных веществ, при этом асимптота часто интерпретировалась как «емкость среды».

Рис. 4. Графики решения уравнения (1) в зависимости от первоначального значения Т0. Отношение параметров Ъ/а представляет собой асимптотический предел динамики

В математический экологии исследователей интересовал в основном интервал, где Т > 0 . Нас же здесь интересует интервал Т < 0, так как время освобождения из ящика по мере научения убывает. В контексте данной работы представляет интерес использование логистической кривой для аппроксимации эмпирических данных типа рис. 2. При этом к интерпретируемым параметрам относится отношение Ъ/а, которое обозначает предельную теоретическую границу обученности.

Линейное приближение Т = - аТ + Ъ (3)

Фазовый портрет уравнения (3) выглядит, как на рис. 5.

Т

Рис. 5. Фрагмент фазового портрета уравнения (3)

Интегрирование (3) дает решение:

Ь - (- аТ0 +Ь)е~

Т

а

(4)

которое описывает либо экспоненциально затухающий рост (рис. 6, нижний график), либо экспоненциально затухающее падение (рис. 6, верхний график) в зависимости от начальных условий Т0. И тот и другой вариант динамики асимптотически стремится к уровню Ь/а. Представляет интерес использование варианта экспоненциально затухающего падения для описания рассматриваемого вида научения. Здесь также имеется теоретический предел обученности, выражаемый соотношением Ь/а.

Рис. 6. Графики решения уравнения (3). Отношение параметров Ь/а представляет собой асимптотический предел динамики

Использование исходных уравнений (1) и (3) должно быть оправдано какими-либо соображениями - почему модель Т (т) может быть представлена именно таким образом или какой содержательный смысл может нести форма этой модели.

Прежде всего, важно вспомнить, как сам Торндайк описывал процесс научения в его экспериментах с кошками. Кошка, помещенная в проблемный ящик, подвержена большому числу разнообразных стимулов - так Торндайк обозначил множество разнообразных действий, которые спонтанно осуществляет кошка в стремлении преодолеть дискомфорт. Те действия, которые не приводят к освобождению, постепенно (в серии попыток) отбраковываются. Те же действия, которые оказываются успешными с точки зрения освобождения, ассоциативно связываются с преодолением дискомфорта и начинают осуществляться чаще. Таким образом, дело выглядит так, что действия подвергаются своего рода селекции (отбору), и этот процесс требует иногда длительной серии попыток.

Обе рассматриваемые модели - (1) и (3) - своей структурой описывают две противоборствующие тенденции. При этом положительные члены (ЬТ и Ь) соответствуют тому, что препятствует скорости научения, а отрицательные (-аТ2 и - аТ) - тому, что способствует более

быстрому научению. Скорость изменения времени освобождения остается на протяжении всего времени отрицательной (научение прогрессирует), но соотношение членов уравнения со временем изменяется так, что становится значимой тенденция торможения роста обученности.

Нелинейная модель (1) говорит о том, что научение ухудшается (замедляется) пропорционально уже достигнутому уровню обученности. Это может быть интерпретировано таким образом, что чем больше кошка «узнает», тем больше она может и забыть.

Прогресс научения в нелинейной модели описывается как пропорциональность отрицательному квадрату текущего уровня обученности, что допускает некоторую геометрическую интерпретацию. Представим себе, что кошка может осуществлять множество действий в разных направлениях горизонтальной плоскости, которые ориентированы на внешние объекты, находящиеся на разнообразных от нее расстояниях, как внутри ящика, так и вне его. Все множество этих действий далее составляет некоторый виртуальный круг, а его площадь, таким образом, является количественной мерой этого множества. Сначала и довольно быстро начинают «вымирать» наиболее бесполезные действия, направленные на удаленные объекты (например, мяуканье и вой), затем действия, направленные на более близкие объекты, и так далее. Таким образом, площадь виртуального круга возможных действий сокращается по мере того, как кошка начинает ограничиваться все более близкими целями.

Аналогичную геометрическую интерпретацию допускает и линейная модель (3) с той разницей, что ухудшение научения в ней предполагается как постоянный процесс, независимый от текущего уровня обученности. В то же время прогресс в обучении полагается как пропорциональный линейной функции текущего уровня - так, как будто исходный арсенал кошки представляет собой множество возможных действий, направленных примерно в одну сторону, но на разно удаленные объекты.

В том и другом случаях прогресс научения практически затормаживается, когда в распоряжении кошки остаются только те действия, которые ей «представляются» равновероятно успешными.

Торндайк пришел к выводу, что существо типа кошки может обучаться необычным для нее действиям, но делает это методом проб и ошибок. Иначе сформулировав эту мысль, можно предположить, что ряд биологических видов будет принадлежать к типу научения, который может быть назван «кошка Торндайка». Существа этого типа осваивают сложную действительность путем отбора (селекции) мнемонических правил из имеющегося у них репертуара, а не посредством проникновения в сущность ситуации с позиций более или менее общих принципов. В результате быстро отселектировав наиболее неуспешные способы решения проблемы, они в дальнейшем прогрессируют в научении все медленнее.

Когда две модели одинаково хорошо описывают какое-либо явление, как правило, предпочтительней оказывается та, которая проще. Отчасти это соображение лежало в основе мотивации, чтобы рассмотреть наряду с нелинейной также и линейную модель. Как видно из рис. 4 (справа) и 6 (верхний график), с точки зрения описания динамики уменьшения времени освобождения в зависимости от количества попыток нелинейное приближение (1) не вносит в модель ничего качественно нового по сравнению с линейным приближением (3).

Для того чтобы определить, насколько хорошо решения моделей (функции (2) и (4)) описывают эмпирические данные, была проведена численная аппроксимация опубликованной Торндайком последовательности времен освобождения в одной из серий его исследования. В силу свойств экспоненты как функции эта последовательность была сдвинута так, что первый замер соответствовал моменту времени 0 и далее с интервалом в единицу времени. Параметры аппроксимации были в обоих случаях идентичными, а именно функция потерь -наименьшая сумма квадратов отклонений, количество итераций - 500. В таблице, а также на рис. 7 приводятся результаты аппроксимаций.

Таблица

Результаты аппроксимации эмпирических данных логистической и экспоненциальной функциями

Параметр аппроксимации Логистиче ская функция (2) Экспоненциальная функция (4)

Объясненная доля дисперсии 0,8309 0,7793

Коэффициент детерминации 0,9115 0,8827

Параметр модели То 155,05 139,10

Параметр модели а 0,0075 0,4958

Параметр модели Ь 0,0397 5,7617

Оценка асимптоты (Ь/а), с 5,2933 11,6210

Несмотря на то что качественно функции (2) и (4) обладают одними и теми же свойствами, логистическая кривая дает несколько лучшие результаты аппроксимации, чем экспоненциальная. Оценка начального условия Т0 по логистической кривой ближе к наблюдавшемуся в опыте, объясненная доля дисперсии и коэффициент детерминации выше, чем в случае экспоненциальной кривой. Таким образом, в данном случае использование более сложной (нелинейной) модели выглядит оправданным.

Аппроксимация логистической функцией дает оценку предельного уровня научения в пределах 5-6 секунд. Это означает, что данная кошка даже при гораздо большем числе попыток в среднем не улучшит свой результат более, чем предсказано асимптотой модели.

Методы динамического моделирования позволяют заново обратиться к историческим достижениям, сделанным психологией на рубеже XIX - XX вв. Эксперименты Торндайка, направленные на изучение феноменов научения, вошли в классику науки о поведении, но, с нашей точки зрения, были осмыслены только на качественном, принципиальном уровне. Между тем их потенциал может быть также раскрыт при применении количественных подходов и средств математического моделирования.

0 5 10 15 20 25

Число попыток

Рис. 7. Графическое представление результатов аппроксимации эмпирических данных с помощью логистической (2) и экспоненциальной (4) функций. Точками на графике показаны результаты измерений, опубликованные Торндайком

С помощью техники фазовых портретов можно сформулировать гипотезы о внутренних механизмах научения, которые результируются в конечном итоге в наборах конкретных эмпирических измерений. Гипотеза Торндайка о том, что в процессе научения происходит селекция стимулов-действий может быть посредством геометрического представления использована для обоснования структуры рассмотренных моделей. В данной работе нами были исследованы две динамические модели (нелинейная и линейная), которые позволяют проанализировать классические результаты Торндайка, полученные в экспериментах с кошками. Квадратичная форма зависимости скорости научения от достигнутого уровня приводит к известной модели Ферхюльста. Сопоставление качества аппроксимаций нелинейной и линейной моделей показывает, что логистическая модель Ферхюльста и в области исследований научения дает неплохие результаты.

Вместе с тем, очевидно, что рассмотренные динамические модели отражают только некоторый усредненный тренд в эмпирических данных, оставляя колебания вокруг этого тренда на счет необъясненной дисперсии. Может ли в этих колебаниях быть найден содержательный смысл, имеющий отношение к данному виду научения, должно быть выявлено в специальных исследованиях.

Библиографический список

1. Исаев А.С., Хлебопрос Р.Г. Принцип стабильности в динамике численности лесных насекомых // Докл. АН СССР. 1973. Т. 208. № 1. 225-228.

2. Исаев А.С., Хлебопрос Р.Г., Недорезов Л.В., Кондаков Ю.П., Киселев В.В. Динамика численности лесных насекомых. Новосибирск: Наука, 1984. 223 с.

3. Резникова Ж.И. Интеллект и язык животных и человека. Основы когнитивной этологии: учебное пособие для вузов. М.: Академкнига, 2005. 518 с.

4. Ризниченко Г.Ю., Рубин А.Б. Математические модели биологических продукционных процессов. М., 1993. 301 с.

5. Холодная М.А. Психология интеллекта. Парадоксы исследования. 2-е изд., перераб. и доп. СПб.: Питер, 2002. 272 с.

6. Strogatz S. Non-linear Dynamics and Chaos: With applications to Physics, Biology, Chemistry and Engineering, Perseus Books, 2000.

7. Thorndike E. L. (1898). Animal intelligence: An experimental study of the associative processes in animals. Psychological Review Monograph Supplement. 2(8). P. 297.

Две динамические модели научения типа «Кошка Торндайка» Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Гавриков Владимир Леонидович, Хлебопрос Рем Григорьевич

Похожие темы научных работ по математике , автор научной работы — Гавриков Владимир Леонидович, Хлебопрос Рем Григорьевич

Two dynamic models of learning based on E. Thorndike's «cat- in- the box» experiment

Текст научной работы на тему «Две динамические модели научения типа «Кошка Торндайка»»