КОНФИГУРАЦИОННЫЕ И КАТЕГОРИАЛЬНЫЕ ХАРАКТЕРИСТИКИ ЗРИТЕЛЬНОГО ВОСПРИЯТИЯ СХЕМАТИЧЕСКИХ ФИГУР*
Ч.А. ИЗМАЙЛОВ
Кафедра психофизиологии Московский государственный университет им. М.В. Ломоносова Ул. Большая Никитская, 4, 103009 Москва, Poccwi
Ю.А, ЧУДИНА
Кафедра педагогики и психологии Российский университет дружбы народов Ул. Миклухо-Маклая, 6, 117198 Москва, Россия
В работе сравниваются две геометрические модели, построенные методом многомерного шкалирования для двух типов оценок воспринимаемых различий между одними и теми же стимулами - схематическими изображениями циферблата часов. В одной экспериментальной серии стимулы были представлены испытуемым как специфические конфигурации, составленные из линий разной ориентации, и испытуемые оценивали конфигурационные различия между стимулами, а в другой - как циферблат часов с различными значениями времени суток, и испытуемые оценивали различия по категории «время суток». Полученные геометрические пространства анализировались в терминах двухканальной сферической модели различения стимулов Соколова и Измайлова.
В результате анализа было показано, что конфигурационные различия между стимулами полностью описываются двумя сферическими координатами в трехмерном евклидовом пространстве. На этом основании делается вывод, что распознавание паттернов такого типа осуществляется трехканальной нейронной сетью, детектирующей две конфигурационные характеристики стимулов. Одна сферическая координата точки-стимула в этой модели представляет величину угла между линиями-стрелками на схематическом циферблате часов, а другая - ориентацию биссектрисы этого угла. Сравнение этих данных с исследованиями различения каждой из этих конфигурационных характеристик (величины угла и ориентации линий) по отдельности показывает, что данная нейронная сеть различения схематических конфигураций является результатом специфического взаимодействия двух двухканальных сетей, детектирующих каждую из этих характеристик по отдельности. Таким образом, можно предположить, что распознавание сложных конфигураций (pattern recognition) осуществляется в зрительной системе по иерархическому принципу формирования сложных сетей из однотипных двух-
Авторы выражают благодарность проф. E.H. Соколову за полезное обсуждение полученных результатов. Работа финансировалась РФФИ, грант № 01-06-80160а и РГНФ, грант № 01-06-00179а.
канальных механизмов, детектирующих отдельные конфигурационные признаки стимула.
Геометрическая модель категориальных различий между схематическими изображениями циферблата часов существенно отличается от модели различен™ конфигураций. Она представляет собой двумерное евклидово пространство, в котором точки, обозначающие различные стимулы, располагаются на окружности в точном соответствии с показаниями времени линиями-стрелками на циферблате часов. Оси этого категориального пространства не имеют никакой связи с осями конфигурационного пространства, что служит основанием предположения, что между конфигурацией и категорией зрительного образа связь не генетическая, а языковая.
Ключевые слова: восприятие формы, оценки попарных различий, схематические фигуры, многомерное шкалирование, детекторы конфигурационных признаков, двух-канальная нейронная сеть, зрительная категоризация.
Введение
Зрительное восприятие формы предметов связано с двумя аспектами функционирования зрительной системы. С одной стороны, это детектирование внешней границы, выделение фигуры из фона, поэлементная спецификация внутренней структуры, иначе говоря, анализ конфигурации или паттерна изображения (pattern récognition). С другой стороны, - восприятие формы (form perception), или формирование зрительной категории - целостного предметного образа, имеющего определенное значение в контексте зрительного опыта, аналогично тому, как слово имеет значение в контексте речевого опыта. Обозначим первый аспект восприятия формы как конфигурационный, а второй -как категориальный.
Для иллюстрации этих положений рассмотрим плоскость, заполненную случайным набором множества ахроматических точек разной светлоты, и лежащий на этой плоскости равносторонний прямоугольник с двумя диагоналями, образующими четыре треугольника, окрашенные в разные цвета. Конфигурационный аспект восприятия формы этого изображения связан с детектированием цветовых полей, границы между цветной и ахроматической, областями, границы между разноцветными полями, текстуры разных участков и т. д. Категориальный аспект связан с видением паттерна как целостного предмета, например, плоского квадрата с разноцветными участками, на сером фоне, либо трехмерной пирамиды с вершиной, направленной к наблюдателю.
В экспериментальных исследованиях восприятия эти аспекты обозначаются по-разному: как сенсорные и перцептивные процессы, как анализ и синтез, как детектирование локальных признаков и гностических единиц. Разделение этих аспектов предполагает, что за каждым из них лежит самостоятельный механизм зрительной системы, и разные подходы предусматривают различное процессиро-вание этих механизмов - иерархическое, параллельное, последовательное и т. д. Однако во всех случаях предполагается, что зрительная категория, как целостный, предметный зрительный образ, генетически связана с конфигурацией, т. е. с паттерном первичных графических элементов, синтез которых формирует зрительную категорию [Грановская, Березная, 1974; Линдсей, Норман, 1974; Уин-стон, 1978; Фомин и др., 1979; Глезер, 1985; Шевелев и др., 2000].
В данной работе делается попытка рассмотреть проблему отношений между этими механизмами в процессе восприятия путем построения отдельной геометрической модели для каждого механизма, и их последующего сравнения в единых математических терминах.
Для решения этой задачи применяется метод многомерного шкалирования больших (надпороговых) различий между стимулами, позволяющий построить на основе оценок межстимульных различий геометрическую модель, в которой стимулы представлены точками некоторого пространства так, чтобы межточечные расстояния максимально соответствовали воспринимаемым различиям между стимулами [Торгерсон, 1958; Шепард, 1962; Терехина, 1985]. Существенным достоинством этого метода является возможность интерпретировать оси координат полученного пространства как специфические нейронные каналы зрительной системы, которые участвуют в процессе различения стимулов [Измайлов и др., 1989]. Поскольку пространственные и метрические характеристики модели основываются только на воспринимаемых различиях между стимулами, то для одних и тех же стимулов можно построить разные модели, в зависимости от того, какие различия между стимулами оценивает испытуемый: конфигурационные или категориальные.
Это дает возможность сопоставить данные конфигурационных и категориальных различий как по формальным характеристикам моделей (размерности пространства, положении точек в пространстве, метрике межстимульных различий), так и по содержательной интерпретации осей полученного пространства.
Для решения этой задачи особое значение имеет подборка стимулов. Одна и та же группа стимулов должна обладать несовпадающей структурой конфигурационных и категориальных различий. Оптимальный случай такого несовпадения состоит в том, что два стимула, имеющие минимальное конфигурационное различие, в то же время максимально отличаются по категориальным признакам, и, наоборот, стимулы имеющие максимальное конфигурационное сходство, семантически должны существенно различаться. В качестве стимулов, отвечающих этим условиям, использовались схематические изображения циферблата часов, обозначающих разное время положениями двух линий-стрелок, которые выходили из центра под разными углами. Цель исследования - сравнение двух субъективных пространств, основанных на оценках различий в пространственной конфигурации углов, образованных двумя линиями в овале, и на оценках различий по времени, заданном общим положением стрелок на схематическом изображении циферблата часов.
Методика
Испытуемые. Всего в эксперименте участвовало шесть человек в возрасте 20-35 лет, из них три женщины и трое мужчин. Всех разделили на две группы, в каждую из которых входили испытуемые обоего пола.
Стимуляция. Стимулы (рис. 1) представляли собой овал с двумя линиями разной длины: схематическое изображение циферблата с часовой и минутной стрелками. Внутри овала были отмечены черточками четыре значения времени,
которые соответствовали 3, 6, 9 и 12 часам. Для эксперимента были выбраны шесть положений часовой стрелки и четыре - минутной стрелки. Всего получи-
ли 24 изображения циферблата часов. Положения стрелок были выбраны так, чтобы часовая и минутная стрелки не сливались, а всегда образовывали углы разной величины.
Процедура предъявления стимулов. Стимулы изображались на экране компьютера белыми линиями на темном фоне. Они предъявлялись последовательно парами, и испытуемый оценивал различия между двумя стимулами в паре по 9-бальной шкале, где один - минимальное различие между стимулами, а девять - максимальное. Оценки вводились в компьютер нажатием одной из девяти числовых клавиш клавиатуры.
Каждый стимул в паре появлялся на экране в течение 0,5 с. Между предъявлениями стимулов в паре в течение 0,5 с экспонировался темный фон. Число возможных пар стимулов равно п(п-1)/2, где п = 24. Одинаковые стимулы в паре не предъявлялись. Каждая пара стимулов экспонировалась на экране по 10 раз для каждого испытуемого. Предъявление стимулов в паре и чередование пар осуществлялось в квазислучайном порядке.
Инструкция. Одной группе испытуемых давали инструкцию оценивать конфигурационные различия между стимулами. Стимулы характеризовались как овалы с двумя по-разному ориентированными линиями. По этой инструкции испытуемый должен был оценивать различие между фигурами, образованными линиями на паре овалов. Испытуемые второй группы должны были оценить только временные различия между стимулами. Здесь стимулы характеризовались как циферблат часов, с минутной и часовой стрелками. При этом испытуемых обеих групп просили давать оценку как можно быстрее, ориентируясь на первое зрительное впечатление. Для того чтобы не допустить вычисления различий во времени, как разностей числовых значений, три четверти стимулов «показывали» не круглое время, а часы с минутами (рис. 1).
Результаты и их обсуждение
В результате опытов для каждого испытуемого была получена треугольная матрица попарных различий между стимулами. Элементом матрицы была средняя оценка по 10 предъявлениям данной пары. Матрицы испытуемых каждой группы проверялись на коррелированность, и после этого производилось усреднение данных по каждой группе отдельно. В итоге экспериментальные данные, усредненные по предъявлениям и испытуемым, представляли собой две матрицы оценок конфигурационных и категориальных различий между стимулами. Они представлены в табл. 1 как нижний левый и верхний правый треугольники соответственно.
Многомерное шкалирование данных. Обе матрицы анализировались неметрическим методом многомерного шкалирования по алгоритму Гутмана [Те-рехина, 1985]. В результате анализа для каждой матрицы были вычислены координаты точек, представляющих стимулы в п-мерном евклидовом пространстве. Оси координат в каждом пространстве упорядочивались в соответствии с максимальным размахом значений по оси.
Схематические изображения циферблата часов, используемые в качестве стимулов для получения матрицы субъективных различий между этими изображениями. Цифрами обозначены номера стимулов.
Таблица 1
Матрица конфигурационных (левый нижний треугольник) и категориальных (правый верхний треугольник) субъективных различий между схематическими изображениями циферблата часов
(Номера строк и столбцов матрицы соответствуют номерам стимулов на рис. 1)
№ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
1 3,4 2,1 3,5 4,1 4,2 3,9 3,8 3,8 4,3 4,6 4,4 4,8 5,3 5Д 5,1 4,5 5,2 5,4 4,5 4,6 5,3 5,3 4,8
2 5,6 3,5 2,3 3,6 4,4 4,8 3,9 3,7 3,5 4,1 3,6 5,0 5,7 5,2 5,5 4,5 5,2 5,4 5,2 4,7 4,9 5,6 5,0
3 5,9 3,1 2,2 3,7 3,9 4,0 4,0 3,9 4,5 3,9 4,3 5,1 5,3 5,2 4,6 4,7 5,3 5,4 4,6 4,4 5,5 5,0 4,8
4 3,3 6,0 7,0 4,5 4,2 3,7 3,4 4,1 4,5 4,2 4,2 5,1 5,3 5,4 5,5 4,5 5,1 5,1 4,9 4,6 5,3 4,9 4,7
5 3,4 5,5 6,0 3,7 3,7 3,0 3,0 3,8 4,0 3,9 3,4 4,9 5,4 5,1 4,7 5Д 5,4 5,5 5,3 5,4 5,2 5,4 5,5
6 5,7 3,2 4,6 6,2 4,7 3,3 2,4 4,1 3,8 3,9 3,6 5,4 4,5 4,8 4,6 4,8 5,1 5,3 4,5 5,2 4,8 5,6 4,7
7 6,5 4,4 3,4 6,7 5,8 зд 2,5 2,1 3,6 3,5 3,3 5,0 5,0 5,0 4,2 5,5 5,5 5,1 5,2 4,9 5,0 4,8 4,5
8 4,0 5,5 5,8 3,1 3,9 5,8 5,6 3,4 4,1 3,7 3,7 5,0 5,1 4,9 4,9 5,8 5,6 5,2 5,2 4,8 5,5 5,7 5,0
9 4,3 5.4 6,1 4,5 3,4 5Д 5,9 4,0 2,4 3,5 1,7 5,0 5,2 4,6 4,4 5,2 5,2 5,0 5,3 5,1 4,7 5,5 4,9
10 6,1 4,5 5,2 6,4 5,5 2,9 3,7 6,2 5,7 3,4 2,3 4,6 4,5 4,5 4,0 5,1 5,2 5,0 4,8 5,6 4,9 5,3 5,3
11 6,5 4,8 4,9 7,0 5,5 3,6 3,5 6,7 6,5 3,6 2,2 4,6 4,8 4,7 4,5 4,6 4,6 4,7 5,0 5,5 5,2 5,1 5,5
12 5,2 5,4 5,6 4,4 4,9 6,2 5,4 3,3 3,9 6,7 6,4 4,9 4,6 4,5 4,8 4,7 5,3 5,0 5,0 5,1 5,0 5,2 5,5
13 6,2 7,0 6,6 5,9 6,4 7,2 6,5 6,0 5,7 7,4 6,9 5,7 2,6 2,1 з,з 3,7 3,8 4,1 3,8 4,1 4,3 4,2 4,0
14 7,0 6,0 6,7 7,4 7,2 5,5 5,1 7,1 6,8 4,5 4,0 6,6 5,7 2,9 2,7 4,2 4,1 3,8 4,2 3,8 4,0 4,3 4,0
15 7,4 6,5 6,9 7,5 7,7 6,2 5,9 7,7 7,5 4,9 5,3 7,5 6,0 2,9 3,8 4,2 4,1 3,9 4,0 4,5 4,1 4,0 4,1
16 6,1 6,8 6,5 6,1 6,3 6,3 6,4 6,0 6,1 7,0 6,4 6,0 3,1 5,0 5,1 3,7 3,6 3,9 4,2 4,4 4,4 4,2 3,8
17 5,2 7,0 6,8 5,1 5,3 7,3 6,9 5,9 6,2 7,3 6,9 6,0 3,3 5,6 5,4 3,3 2,0 2,6 3,7 3,6 4,1 3,6 2,2
18 7,2 6,0 6,1 7,0 7,3 5,8 5,7 7Д 6,7 5,2 4,9 6,3 5,9 3,1 4,2 4,8 5,2 2,0 2,8 4,0 2,3 3,9 4,4
19 6,6 6,5 6,8 6,4 7,2 5,5 6,1 7,0 7,3 5,3 5,5 7,0 5,3 3,2 3,7 4,4 4,8 2,8 2,0 4,0 4,1 4,0 4,1
20 5,2 7,3 7,0 5,1 5,3 7,5 6,9 5,7 6,6 6,9 6,4 6,8 4,2 5,4 4,5 2,8 3,3 5,1 4,3 3,8 4,0 4,9 3,6
21 4,7 7,3 7,0 4,8 5,7 6,9 7,1 5,7 5,7 7,2 7,0 6,2 4,3 5,7 5,6 4,2 зд 6,0 5,0 3,2 2,1 3,8 3,2
22 7,1 5,7 6,3 6,9 7,0 5,9 5,7 6,2 6,6 5,8 5,7 6,1 5,3 4,6 4,8 4,4 5,2 3,7 4,6 5,8 5,2 4,5 2,9
23 7,0 6,6 6,3 6,0 6,4 6,5 6,0 6,6 7,0 6,5 6,1 7,1 4,8 4,3 4,1 3,1 4,7 3,8 3,2 3,6 4,9 3,4 2,6
24 5,5 7,6 7,5 5,1 6,1 7,5 7,3 5,3 6,4 6,9 7,3 6,6 5,7 5,5 4,4 3,6 4,2 5,9 4,7 2,7 3,1 5,9 5,2
Первая задача, которую необходимо решить для каждого из двух пространств - это определение минимальной размерности, при которой межточечные расстояния достаточно хорошо соответствуют оценкам в исходной матрице различий. В данной работе для оценки этого соответствия используются два показателя «стресс» и коэффициент корреляции Пирсона. «Стресс» характеризует отклонение полученных данных от исходных, а коэффициент корреляции, наоборот, их близость друг к другу, поэтому решение определяется минимальным значением «стресса» при максимально возможном коэффициенте корреляции. В табл. 2 приведены значения этих показателей в зависимости от размерности пространства для оценок конфигурационных и категориальных различий. Они показывают, что, например, одномерное решение для категориального пространства характеризуется большим «стрессом» (в = 0,49) и низким коэффициентом корреляции (г = 0,46). Такое решение явно неприемлемо. При двумерном решении «стресс» значительно снижается (в = 0,17) и растет коэффициент корреляции (г = 0,86). Это решение существенно лучше, но и третье измерение продолжает эту тенденцию на улучшение (в = 0,09 и г = 0,92). Дальнейшее увеличение размерности уже практически не меняет этих показателей. Из этого следует, что для построения пространства надо рассматривать не менее трех измерений. Это не значит, что итоговое пространство будет обязательно трехмерным, поскольку кроме этих формальных критериев минимальной размерности необходимо использовать и содержательные критерии, которые обосновывают каждую ось координат по содержательным характеристикам воспринимаемых стимулов {Шепард, Кэрролл, 1966; Измайлов и др., 1989].
Сферическая модель различения стимулов. Главным основанием для содержательной интерпретации осей в наших работах является двухканальная сферическая модель различения сигналов [Измайлов и др., 1998], в которой каждая физическая характеристика стимулов, значимая для их зрительного различения, кодируется в зрительной системе человека двухканальной нейронной сетью. Эти два канала взаимосвязаны реципрокным образом так, что сумма квадратов числовых показателей активности каналов равна константе. Математически эта связь выражается уравнением окружности на двумерной евклидовой плоскости [Фомин и др., 1979; Измайлов и др., 1998]. Две декартовы координаты этой плоскости представляют два нейронных канала зрительной системы, а сферическая координата - сенсорную характеристику, которая является выходом этой двухканальной нейронной сети.
Процесс различения стимулов, имеющих несколько значимых физических характеристик, осуществляется соответствующим числом двухканальных сетей, которые могут работать параллельно и независимо, а могут взаимодействовать, образуя многоканальную сеть. В последнем случае сферическая модель различения таких сложных стимулов представляет собой гиперсферу в евклидовом пространстве, размерность которого зависит только от числа сферических координат, которые имеют однозначную связь с субъективными характеристиками стимулов [Измайлов и др. 1989; ЬтаНоу, БокоЬу, 1991].
Сферичность полученного пространства оценивается по величине коэффициента вариации, который характеризует отклонение экспериментальных данных от уравнения сферы. С этой целью для всех точек полученной конфигурации проверяется гипотеза, что они лежат на одной и той же к-мерной поверхно-
сти, имеющей постоянную положительную кривизну. Для каждой конфигурации точек - стимулов в пространстве определяется геометрический центр. Теоретически эта центральная точка должна находиться на равном расстоянии от всех точек, представляющих стимулы. Поскольку экспериментальные данные содержат случайные ошибки, эти расстояния (радиусы) будут случайно варьировать, поэтому центр сферы определяется так, чтобы дисперсия радиусов была минимальной. Для решения используется итерационная процедура, которая минимизирует дисперсию радиальных расстояний, сдвигая точку центра. Полученная минимальная дисперсия характеризует разброс радиальных расстояний всех точек (т. е. толщин)' сферического слоя, в котором располагаются экспериментальные точки). Нормированное выражение этого разброса (отношение стандартного отклонения радиусов к среднему радиусу) и есть коэффициент вариации. В табл. 2 приводятся значения коэффициентов вариации для обоих типов пространств в зависимости от размерности. По данным этой таблицы видно, что размерность евклидова пространства и для конфигурационного, и для категориального пространства не превышает трех измерений.
Таблица 2
Показатели, характеризующие пространственную модель, основанную на конфигурационных и категориальных оценках попарных различий между схематическими циферблатами часов
№ п/п Тип пространства Конфигурационное Категориальное
1 Размерность 1 2 3 4 1 2 3 4
2 Стресс, б 0,46 0,23 0,17 0,08 0,49 0,17 0,09 0,08
3 Коэффициент корреляции, г 0,63 0,77 0,87 0,90 0,46 0,86 0,92 0,94
4 Средний радиус 1,79 1,93 2,00 1,72 1,87 2,00
5 Стандартное отклонение 0,16 0,11 0,11 0,18 0,16 0,10
6 Коэффициент вариации, % 8,9 6,0 5,5 10,3 8,7 5,0
Исходя из этих формальных и содержательных критериев, в полученном трехмерном пространстве устанавливаются те сферические координаты, которые однозначно связаны с субъективными характеристиками стимулов. Рассмотрим вначале конфигурационное пространство.
Сферическая модель различения конфигураций. На рис. 2-а приведена проекция точек-стимулов на плоскость двух первых координат. Число у каждой точки соответствует номеру стимула на рис. 1. На графике видно, что все точки распределились по четырем квадрантам плоскости в соответствии с ориентацией биссектрисы угла, образованного линиями стрелок: вверх-вправо, вверх-влево, вниз-вправо и вниз-влево. Образцы этих углов показаны в соответствующих квадрантах. Для обоснования этого соответствия на рис. 2-6 приводится график зависимости сферической координаты каждой точки (которая вычислялась в радианах, как горизонтальный угол радиус-вектора точки по часовой стрелке, и откладывалась по оси ординат графика) от ориентации биссектрисы угла (ось абсцисс). График на рис. 2-6 показывает практически линейную связь
между этими характеристиками, из чего можно сделать вывод о том, что зрительно воспринимаемая ориентация угла, образованного двумя лучами, определяется направлением биссектрисы этого угла, т. е. ориентацией всей фигуры.
Конфигуративное пространство стимулов Проекция на горизонтальную плоскость
-1,2 -|-1-)-1-(-г-1
-1,2 -0,8 -0,4 0,0 0,4 0,8 1,2 Ориентация угла "влево-вправо"
а
а 2 £
6 -
£ 5
Б :
а 4
3 -
2 -
I 1
г о ч
Связь первой сферической координаты конфигуративного пространства с ориентацией стимула
I*
• I
• •
• •
60 120 180 240 300 360 Ориентация биссектриссы угла между линиями-стрелками, градусы
Рис. 2. Проекция точек-стимулов на плоскость двух первых координат
Трехмерное конфигурационное пространство стимулов. Рис. 2-а - проекция точек-стимулов на горизонтальную плоскость трехмерного конфигурационного пространства. Положение точек на плоскости определяется двумя декартовыми координатами, которые представляют два оппонентных механизма (канала) зрительной системы, связанных с детекцией ориентации «угла» (паттерна, образованного линиями стрелками на рис. 1): влево-вправо (ось абсцисс) и вверх-вниз (ось ординат). На этой плоскости все точки-стимулы располагаются на одной окружности в строгом соответствии с ориентацией угла, образованного линиями-стрелками. Это показывает график зависимости сферической координаты точки-стимула, измеренной как горизонтальный угол точки на плоскости, от биссектрисы «угла», характеризующей зрительную ориентацию стимула (рис. 2-6).
Это значит, что два канала детекции такого конфигурационного признака стимула, как «ориентация», связаны между собой уравнением сферы
Проекция точек на вертикальную плоскость трехмерного пространства показана на рис 3-я. Расположение точек-стимулов по вертикальной координате на этой плоскости показывает, что эта координата монотонно связана с величиной угла между линиями-стрелками. Внизу плоскости расположены стимулы с минимальным углом между линиями-стрелками (номера 15 и 24 на рис. 1), а вверху - с максимальным углом (номера 12 и 3 на рис. 1). Это значит, что вторая сферическая координата полученного пространства должна быть связана с этим физическим признаком. Для проверки этого соответствия был построен график зависимости вертикального угла точки-стимула (вычисленный, как arceos ХЗ) от величины угла между линиями-стрелками (ось абсцисс), который приводится на рис. 3-6. График представляет собой монотонную (практически линейную) функцию, что свидетельствует о правильности интерпретации второй сферической координаты полученного пространства, как субъективной оценки величины угла.
Проекция тех же точек-стимулов, что на рис. 2-а, на вертикальную плоскость трехмерного конфигурационного пространства. Сферическая координата точки-стимула на этой плоскости (arceos ХЗ) характеризует второй конфигурационный признак стимула - величину угла между линиями-стрелками на схематическом циферблате часов. Адекватность этой интерпретации подтверждается графиком на рис. 3-6, который выявляет строгую линейную связь между величиной угла между линиями-стрелками (ось абсцисс) и значением второй сферической координаты точки в трехмерном конфигурационном пространстве.
Таким образом, построенная модель различения конфигураций в виде двумерной сферической поверхности в трехмерном евклидовом пространстве позволяет сказать, что спецификация стимулов, представляющих две линии, выходящие из одной точки по разным направлениям во фронтальной плоскости, осуществляется в зрительной системе двумя конфигурационными характеристиками - величиной угла и ориентацией его биссектрисы.
В соответствии со сферической моделью сенсорных систем каждая такая характеристика должна кодироваться в зрительной системе отдельной двухка-нальной нейронной сетью [Измайлов и др., 1998]. Из полученного в данном случае трехмерного евклидова пространства следует, что одновременное различение двух конфигурационных характеристик осуществляется сетью, в которую
Конфигуративное пространство стимулов Проекция на вертикальную плоскость
-0,8 -0,4 0,0 0,4 0,8 Направление угла "влево-вправо"
а
с
о и
Э1
а 2 X Л ч о X X
V со
Связь второй сферической координаты конфигурационного пространства с величиной угла между линиями-стрелками
3,0
Р) X
и 2
о х
и ч
и X
а
2,5
2,0
1,5-
1,0-
0,5
! I
—I—
30
60 90 120 150
18
Величина угла между линиями-стрелками на циферблате, градусы
Рис. 3. Проекция точек на вертикальную плоскость трехмерного пространства
каждая двухканальная система включается специфическим образом. Чтобы ответить на вопрос, как именно соединяются эти две двухканальные системы в общую сеть, необходимо полученные данные сравнить с результатами многомерного шкалирования субъективных различий между стимулами, которые представляли собой каждую из этих характеристик в отдельности, т. е. воспринимаемых различий между линиями разной ориентации, с одной стороны [ЬшаПоу, БокоЬу, 1990; Измайлов и др., 2003], и воспринимаемых различий между величинами углов, независимо от ориентации их во фронтальной плоскости, с другой стороны [Измайлов и др., 1988; ЬшаПоу, БокхЯоу, 1990]. Необходимые данные были взяты из наших ранних работ по многомерному шкалированию оценок межстимульных различий для каждой из этих характеристик в отдельности. В этих работах для каждой из этих характеристик было получено двумерное евклидово пространство, в котором точки-стимулы располагались так, что сферическая координата точки в этом пространстве точно соответствовала анализируемой характеристике стимула.
Так, двумерная сферическая модель ориентации, полученная в этих работах, в точности совпадает с двумерной проекцией трехмерного пространства, представленной на рис. 2-а. Функции, связывающие соответствующие координаты двух сферических моделей, представлены уравнениями (1) и (2) для второй и первой осей пространства.
где х - это ось координат пространства различения конфигураций из схематических часовых циферблатов;
X - ось координат пространства различения ориентаций линии.
Коэффициенты в этих уравнениях определяются тем, что ориентация линии во фронтальной плоскости меняется от 0 до 180°, тогда как ориентация углов (также, как ориентация отрезков, и вообще, любой фигуры) меняется от 0 до 360°. Отсюда следует, что пространство различения ориентаций линии, полученное в работах [Izmailov, Sokolov, 1990; Измайлов и др., 2003], можно рассматривать, как подпространство (проекцию на одну из плоскостей) в геометрической модели различения конфигураций, построенной в данной работе.
Точно так же полученную в работе [Измайлов и др., 1988; Izmailov, Sokolov, 1990] сферическую модель различения углов можно рассматривать как подпространство более общего пространства различения конфигураций, полученного в данной работе. В работе [Izmailov, Sokolov, 1990] углы-стимулы также менялись по величине и по ориентации, но испытуемый оценивал только угловые различия, не обращая внимания на ориентацию. На рис. 4-а приводится пространство различения углов из работы [Izmailov, Sokolov, 1988], а на рис. 4-б - двумерное подпространство различения углов, построенное по данным, представленным на рис. 2-а и 3-а. Первая ось координат этого подпространства XI прямо соответствует координате ХЗ общего пространства (3), а вторая ось координат - Х2 получена, как проекция евклидовой плоскости Х1Х2 общего пространства на прямую (длина радиус-вектора точки на плоскости (4).
(1)
(2)
(3)
= y[x>xl-
(4)
Сравнение графиков на рис. 4-а и 4-6 показывает прямое соответствие результатов, полученных в обеих работах.
Сравнение сферической модели различения углов (рис. 4-а), построенной на основе оценок попарных различий между стимулами, представляющими собой два соединяющиеся одним концом отрезка [Izmailov, Sokolov, 1983], и двумерного пространства различения углов (рис. 4-6), выведенного из сферической модели различения конфигураций, представляющих схематический циферблат часов.
Каждый из этих конфигурационных признаков (ориентация фигуры во фронтальной плоскости и величина угла между линиями) кодируется в зрительной системе двухканальной моделью. В случае объединения этих сетей в общую сеть, кодирующую двухпараметрический образ, размерность новой сферической модели, представляющей эту общую сеть, позволяет сделать некоторые выводы о взаимосвязи между сетями. В данном случае, как показывают (3) и (4), две сети (детекции ориентации угла и детекции величины угла) объединяются так, что один из каналов, участвующих в детекции величины угла, замещается специфическим (4) вкладом двух каналов ориентации. Это приводит к тому, что две отдельные двухканальные сети, объединяясь, образуют новую трехканальную сеть, представленную в данной работе сферой в трехмерном евклидовом пространстве.
Категориальное пространство схематического изображения циферблата часов. Результаты анализа матрицы оценок различий по времени, показываемом на схематическом циферблате, приведены на рис 5-а и 5-6. На рис. 5-а приводятся проекции точек-стимулов на горизонтальную плоскость двух первых координат трехмерного пространства, а на рис. 5-6 - на вертикальную плоскость координат Х1ХЗ. Круговая траектория точек на рис. 5-а хорошо согласуется со временем, показанном на циферблате часов (рис. 1). В то же время расположение точек по вертикальной оси этого же пространства носит совершенно случайный характер (рис. 5-6). Это означает, что, в отличие от конфигурационного пространства, для категориальной оценки времени достаточно одной двухканальной сети, и третья координата данного пространства отражает только влияние шума в зрительной системе.
Рис. 5-а - двумерное категориальное пространство, основанное на оценках различий по времени, показанному на схематическом циферблате часов. Круговая траектория точек на плоскости в точности соответствует показаниям времени на циферблате часов-стимулов. Адекватность такой интерпретации показана на графике зависимости сферической координаты точки-стимула (ось ординат на рис. 5-6) от показания времени на схематическом циферблате часов (ось абсцисс). Характерная особенность этого пространства в том, что его декартовы оси никак не связаны с детекцией конфигурационных характеристик стимула, образующих конфигурационное пространство этих же стимулов. Для иллюстрации этого положения на рис. 5-6 приводится проекция точек-стимулов на плоскость Х1ХЗ, которая показывает, что не только первые две оси категори-
«О
о, и<
П-
\г
п
Щ
, ? »«Ч
? » О 5
а
Двумерное подпространство различения углов
х,= Хз
б
Рис. 4. Подпространство различения углов (а) и двумерное подпространство различения углов (б)
Пространство различения времени на схематическом циферблате часов.
1.2 п
0,4
гм х 0,0
-0,8 -1,2
4
21
гу 2 \
17/ „„ / • 20 23 19 ] •• 8 \ 6 Ч
1.81в22 • 7 1 • !5
\14 15 • \в 16 13 12 /9 11 у • / ^Хю
-1,2 -0,8
-0,4 0,0 Ось Х1
0,4 0,8 1,2
а
График зависимости сферической коорлинаты точек-стимулов от времени, покзываемого часам» 6
Время, часы
б
Рис. 5. Результаты анализа матрицы оценок различий по времени, показываемом на схематическом циферблате
ального пространства не имеют связи с конфигурационными характеристиками стимулов, но и третья ось, которая не связана с категориальной характеристикой стимулов, не связана также и с конфигурацией стимулов.
Выход двухканальной сети различения временных категорий приводится на рис. 6 в виде графика зависимости горизонтального угла точки-стимула на плоскости Х1Х2, измеренного в радианах (ось ординат), от времени на циферблате часов, представленном положением линий-стрелок (ось абсцисс). Линейная форма этой функции свидетельствует о том, что сферическая модель различения стимулов, приведенная на рис. 5-а, адекватно представляет зрительную систему человека в процессах восприятия циферблата, как целостного образа, и оперирования этим паттерном, как простой, одномерной категорией времени, несмотря на его сложную конфигурацию.
Проекция точек-стимулов на вертикальную плоскость Х1ХЗ
-0.4 0.0 Ось Х1
Рис. 6. Выход двухканальной сети различения временных категорий
Соотношение конфигурационной и категориальной моделей зрения.
Полученные данные позволяют говорить о наличии в зрительной системе двух разных нейронных сетей, осуществляющих кодирование конфигурационных и категориальных характеристик стимула. Примечательно, что анализ конфигурационных характеристик осуществляется более сложной (в формальном смысле) сетью, чем категориальный анализ. При этом в отличие от конфигурационного пространства различения углов разной ориентации, которое можно формально вывести из более простых операций - детекции ориентации и детекции угла, двумерное категориальное пространство различения стимулов не является подпространством трехмерного конфигурационного пространства. Это означает, что категория времени, хотя и представлена определенным зрительным пат-
терном, не выводится аналитически из конкретной конфигурации, т. е. информация о форме паттерна (ответ на вопрос - что это?) не содержится в конфигурационных характеристиках стимула.
Каким же образом устанавливается соотношение между конкретным паттерном и категорией? В случае циферблата часов генезис этого соотношения очевиден, поскольку циферблат - это искусственный паттерн, и именно его конструктор приписал временные категории различным конфигурационным вариациям этого паттерна. Такую же процедуру приписывания можно предположить и для других категорий, включая геометрические формы. Это означает, что мы видим треугольник, квадрат или круг не потому, что эти фигуры обладают специфическими пространственными соотношениями линий и углов, а потому, что зрительная система приписала образ данной фигуры (например, категорию треугольника) определенной комбинации базисных элементов, в число которых входят и ориентация линий, и величина углов, и ориентация углов. Но зрительная система приписывает образ треугольника не только комбинации этих элементов. Другой комбинации из других базисных элементов ((например, точек, или фигурных элементов, из которых образуются фигуры Канише [Коршунова, 1999] также может быть приписана аналогичная категория, и тогда мы увидим треугольник, хотя никаких геометрических оснований для этого нет.
Наиболее универсальным механизмом конструирования категорий из конфигураций является язык. Возможно, что восприятие формы в зрительной системе происходит по языковому принципу. В этом смысле, образы одной и той же геометрической формы, построенные на основе различных конфигурационных характеристик (линий, локальных углов, или только точек-вершин), есть просто зрительные синонимы.
Выводы
Различение конфигурационных и категориальных характеристик одного и того же стимула осуществляется в зрительной системе разными механизмами, которые представлены в данной работе различными геометрическими моделями. При этом модель категориального различения имеет более простую геометрическую структуру, чем модель различения конфигурации, которая представляет собой двухстадийную иерархическую сеть.
Конфигурационная и категориальная пространственные модели не имеют общих геометрических характеристик, что позволяет предположить независимость зрительных механизмов категориального и конфигурационного различения стимулов, т. е. отсутствие генетической связи между конфигурацией стимула и категорией.
ЛИТЕРАТУРА
1. БрунерДж.С. Психология познания. -М.: Прогресс, 1977.
2. Глезер В.Д. Зрение и мышление. - JL: Наука, 1985.
3. Грановская P.M., Березная И.Я. Запоминание и узнавание фигур. - JT.: Наука, 1974.
4. Иден М. Задачи распознавание образов и некоторые обобщения // Распознавание образов / Ред. А. Колере и М. Иден. - М.: Мир, 1970.
5. Измагшов Ч.А., Исайчев С.А., Шехтер Е.Д. Двухканальная модель различения сигна-лов в сенсорных системах // Вестн. МГУ Сер. 14. Психология. -1998. - Вып. 3, с. 29-40.
6. Измайлов, Ч.А., Ласточкина М.Н, Полянская Г.Н., Соколов Е.Н. Различение линий и углов зрительной системой // Вестник МГУ. Сер. 14. Психология. - 1988. - Вып. 1, с. 41-50.
7. Измагшов Ч.А., Коршунова С.Г., Соколов Е.Н. Связь зрительных вызванных потенциалов с субъективными различиями между эмоциональными выражениями схематического лица // Журн. высш. нерв. Деятельности. - 2000. - Т. 50. - Вып. 5, с. 805-818.
8. Коршунова С.Г. Зрительные вызванные потенциалы на иллюзорный контур (квадрат Канизса) // Журн. высш. нерв. Деятельности. - 1998. - Т.48. - Вып. 5, с. 807-815.
9. Линдсей П., Норман А. Переработка информации у человека. - М.: Мир, 1974.
10. Соколов Е.Н., Измайлов Ч.А. Трехстадийная модель цветового зрения // Сенсорные системы. - 1988. - Т. 2. - Вып. 4, с. 400-407,
И. Соколов Е. Н., Измайлов Ч.А., Завгородняя BJI. Многомерное шкалирование знаковых конфигураций // Вопросы психологии. - 1985. - Вып. 1, с. 131-140.
12. Терехина А.Ю. Анализ данных методом многомерного шкалирования. - М.: Наука, 1985.
13. Уинстон ПЛ. Компьютерное зрение // Психология машинного зрения / Под ред. ПЛ. Уинстона. -М.: Мир, 1978.
14. Фомин С.В., Соколов Е.Н., Вайткявичус Г.Г. Искусственные органы чувств. - JI.: Наука, 1979.
15. Шевелев И.А., Каменкович В.М., Шараев Г.А. Относительное значение линий и углов геометрических фигур для их опознания человеком // Журн. высш. нерв, деятельности. - 2000. - Т. 50. - Вып. 3, с. 403-409.
16. Guzman A. Decomposition of a visual scene into three-dimensional bodies // Automatic inteip retation and classification of images / Ed. A. Grasselli. - N.Y.: Acad. Press, 1969.
17. HubelD.N., Wiesel T.N. Receptive fields, binocular integration and functional architecture in the cat's visual cortex 11 J. Physiology. - 1962. - V.160, p. 106-154.
18. Izmailov, Ch.A., Sokolov E.N. Multidimensional scaling of lines and angles discrimination // Psychophysical Explorations of Mental Structures / Ed. H.G.Geissler. - Toronto-Bern-Stuttgart: Hogrefe and Huber Publishers, 1990, p. 181-189.
19. Izmailov Ch., Davydova K. Multidimensional Scaling of Configurations from Lines // Psychometric Methology / Eds. R. Steyer, K.F.Wender, F.Widaman. - Stuttgart and New York: Gustav Fischer Verlag, 1993, p. 579-584.
20. Shepard R.N. Attention and the metric structure of the stimulus space // Journal of Mathematical Psychology. - 1964. - V. 1, p. 54-87.
21. Shepard R.N. Towards a universal law of generalization for psychological space I I Science. - 1987. - V. 237, p. 1317-1323.
22. Shepard R. N., Carroll J.D. Parametric representation of nonlinear data structures // Multivariate analysis / Ed. P.R. Krishnaiah. - N. Y.: Acad. Press, 1966, p. 561-592.
23. Shevelev I.A., Lazareva N.A., Sharaev G.A. Interrelation of tuning characteristics to bar, cross and corner in striate neurons // Neuroscience. - 1999. - V. 88, p. 17-25.
THE CONFIGURATIONAL AND CATEGORIAL CHARACTERISTICS OF THE VISUAL PERCEPTION OF DIAGRAMMATIC FIGURES
Ch.A. IZMAILOV
The Chair of Psychophysiology Lomonosov Moscow State University 4, Bolshaya Nikitskaya, 103009 Moscow, Russia
J.A. CHUDINA
The Chair of Psychology and Pedagogics Russian Peoples' Friendship University 6, Miklukho-Maklaya St., 117198 Moscow, Russia
The article compares the 2 geometrical models using the method of the multidimentional scaling for 2 types of estimations of the perceived differences between the same stimuli - the schematic representation of the clock dial. During the first experimental series the stimuli were presented to the participants as the specific configurations compiled of the lines of different orientation. The participants estimated the configurational differences between the stimuli. During the second series the stimuli were presented as a clock dial showing different time of the day, and the participants estimated the differences according to the category «time of the day». The received geometrical spaces were analysed by means of the terms of Sokolov and Izmailov's two-channelled spherical model of differentiating stimuli.