КАТЕГОРИАЛЬНАЯ МОДЕЛЬ РАЗЛИЧЕНИЯ ЧЕТЫРЕХЛИНЕЙНЫХ ФИГУР*
Ю.А. Чудина, Н.А. Чудина
Кафедра социальной и дифференциальной психологии Российский университет дружбы народов ул. Миклухо-Маклая, 6, Москва, Россия, 117198
В работе была построена модель различения изображений, состоящих из четырех линий и характеризующихся разным соотношением элементов. Усредненные надпороговые оценки различий четырехлинейных конфигураций были обработаны методом многомерного шкалирования, построенное пространство интерпретировано в терминах сферической модели различения стимулов Соколова—Измайлова. Характеристики полученной модели отражают механизм различения изображений путем выделения зрительных категорий на основе категориальных признаков.
Ключевые слова: различение четырехлинейных фигур, многомерное шкалирование, субъективные оценки попарных различий, двухканальный модуль, сферическая модель различения стимулов, категориальные признаки стимула, зрительная категоризация.
Восприятие зрительных образов осуществляется сложной нейронной сетью, которая локализована преимущественно в затылочных и височных отделах коры. Эта сеть участвует как в распознавании графических или конфигуративных характеристик изображений, так и в различении их категориальных признаков [6; 16]. По-видимому, выбор способа анализа зависит от условий восприятия и от организации стимуляции [14]. Как было показано в предыдущих исследованиях [3; 5], восприятие одних и тех же стимулов осуществляется по-разному в зависимости от различаемых конфигуративных или категориальных особенностей стимулов, что существенно влияет на структуру психологического пространства и определяет выбор механизма различения формы. Таких механизмов выделяют два: конфигу-ративный и категориальный [3; 4; 5]. Согласно метафоре, предложенной Ч.А. Измайловым [4], конфигуративный механизм связан с распознаванием элементов «зрительного алфавита», а категориальный — с распознаванием «зрительных слов» или других смысловых единиц зрительного образа. Элементы «зрительного алфавита» используются для построения изображения любой сложности и для спецификации внутренней структуры изображения [3; 5; 11; 12]. «Зрительные слова» формируются, скорее всего, с учетом «зрительного алфавита» и предназначены для определения семантической структуры видимой сцены.
В данной работе экспериментально исследован категориальный механизм зрительного различения четырехлинейных фигур. Для этого методом многомерного шкалирования были обработаны субъективные оценки различий между стимулами, выбранными из предыдущих исследований [11; 12]. Полученная геометрическая модель была проанализирована в терминах сферической модели различения стимулов [1; 2; 10; 13; 15; 17].
* Работа поддержана грантами РГНФ № 10-06-00302а и РФФИ № 10-06-00438а.
Испытуемые. В эксперименте приняли участие пять здоровых испытуемых в возрасте 20—25 лет, среди которых было две женщины и трое мужчин.
Стимулы. В качестве стимулов использовали 30 четырехлинейных фигур (рис. 1), в состав которых включили три группы по 10 изображений, отличающиеся относительным расположением четырех линий. Первые 20 конфигураций характеризуются тем, что точка пересечения четырех линий совпадает с центром экрана, а у последних 10 конфигураций не совпадает. В первых 10 изображениях (с 1 по 10) четыре линии разделяют пространство на более или менее равные четыре части.
Рис. 1. Четырехлинейные фигуры, используемые в качестве стимулов (номера стимулов обозначены цифрами)
Во вторых 10 конфигурациях (с 11 по 20) две линии лежат на одной прямой и отделяют половину поля зрения (180°), а две другие расположены по-разному
относительно ее центра и делят вторую половину еще на три части, в этом случае зрительное поле разделяется на четыре неравные части. Третьи 10 конфигураций (с 21 по 30) отличаются от предыдущих тем, что все четыре линии группируются в пределах двух квадрантов видимого поля (не более 150°) и делят зрительное поле также на неравные четыре части, где одна часть занимает больше 180°.
Каждая описанная группа стимулов была составлена из изображений, являющихся элементами видимой сцены, которые рассматриваются как ключевые в теории машинного зрения [8. С. 9—29; 9. С. 30—93]. Авторы теории машинного зрения обрзначили эти стимулы следующим образом: первая группа — «звезда» или «Х», вторая группа — «К» и третья группа — «пик». Далее мы будем использовать эти названия для обозначения стимулов соответствующей группы.
Процедура предъявления стимулов
Четырехлинейные фигуры изображались на экране компьютера белыми линиями на темном фоне. Стимулы предъявлялись парами в квазислучайном порядке, и испытуемые оценивали различия между каждой парой изображений по 9-балльной шкале, где 1 (единице) соответствовало минимальное различие между стимулами, 9 — максимальное различие, а остальным значениям — промежуточные оценки, которые вводились в компьютер путем нажатия на соответствующую цифровую клавишу. Пара стимулов предъявлялась на экране в течение 0,5 с, затем, во время экспонирования темного фона (0,5 с) испытуемый давал числовой ответ. Каждому испытуемому предъявляли 870 пар стимулов из расчета п(п - 1), где п = 30, так как одинаковые стимулы в паре не предъявлялись.
В результате экспериментов для каждого испытуемого была получена четырехугольная матрица попарных субъективных различий между стимулами. Матрицы всех испытуемых проверяли на коррелированность, усредняли по испытуемым и по предъявлениям и получили треугольную матрицу усредненных попарных оценок различий между четырехлинейными фигурами (рис. 2). Полученная матрица была проанализирована неметрическим методом многомерного шкалирования по алгоритму Гутмана [7; 15].
Спецификация структуры полученного геометрического пространства осуществлялась путем определения его минимальной размерности или минимального количества координатных осей, при котором межточечные расстояния соответствуют исходным оценкам в матрице различий [15].
Для этого использовали следующие показатели: «стресс», который определяет отклонение данных, полученных в результате шкалирования, от исходных данных, и коэффициент корреляции — мера их близости. Минимальная размерность определяется для значений стресса и коэффициента корреляции, которые при увеличении количества осей существенно не изменяются. Из таблицы видно, что изменения значений этих показателей становятся несущественными при переходе от трех измерений к четырем и более. Следовательно, полученное пространство обладает оптимальной геометрической структурой при трехмерном решении.
№ 1 2 3 i 5 6 7 3 9 10 11 12 13 14 15 16 17 13 19 20 21 22 23 24 25 26 27 23 29 30
1 0 5 0 0 ■3 ■3 0 ■3 ■3 0 ■3 ■3 0 ■3 ■3 0 ■3 ■3 ■3 ■3 ■3 ■3 3 3 ■3 3 ■3 3 3 ■3
2 40 5 0 0 ■3 ■3 0 ■3 ■3 0 ■3 ■3 0 ■3 ■3 0 ■3 ■3 ■3 ■3 ■3 ■3 3 3 ■3 3 ■3 3 3 ■3
3 62 0 0 ■3 ■3 0 ■3 ■3 0 ■3 ■3 0 ■3 ■3 0 ■3 ■3 ■3 ■3 ■3 ■3 3 3 ■3 3 ■3 3 3 ■3
4 4,7 7.0 53 0 ■3 ■3 0 ■3 ■3 0 ■3 ■3 0 ■3 ■3 0 ■3 ■3 ■3 ■3 ■3 ■3 3 3 ■3 3 ■3 3 3 ■3
5 3,7 12 7.0 5,7 ■3 ■3 0 ■3 ■3 0 ■3 ■3 0 ■3 ■3 0 ■3 ■3 ■3 ■3 ■3 ■3 3 3 ■3 3 ■3 3 3 ■3
6 10 6.7 5;5 22 5;7 ■3 0 ■3 ■3 0 ■3 ■3 0 ■3 ■3 0 ■3 ■3 ■3 ■3 ■3 ■3 3 3 ■3 3 ■3 3 3 ■3
7 62 ^ -13 4,7 0 ■3 ■3 0 ■3 ■3 0 ■3 ■3 0 ■3 ■3 ■3 ■3 ■3 ■3 ■3 ■3 ■3 ■3 3 3 ■3 ■3
3 7.0 1.0 55 75 М 7.7 ■3 ■3 0 ■3 ■3 0 ■3 ■3 0 ■3 ■3 ■3 ■3 ■3 ■3 3 3 ■3 3 ■3 3 3 ■3
1 2.3 12 7 7 35 2." 5:е 6:3 ■3 0 ■3 ■3 0 ■3 ■3 0 ■3 ■3 ■3 ■3 ■3 ■3 3 3 ■3 3 ■3 3 3 ■3
10 1;В 6;0 3;~ 15 4,1 5:2 5;0 53 0 ■3 ■3 0 ■3 ■3 0 ■3 ■3 ■1 ■3 ■3 ■3 ■3 ■3 ■3 ■3 ■3 ■3 ■3 ■3
11 7.0 7" 1;0 5;0 ®5 4,2 7,0 3.3 5£ 3,7 ■3 ■3 0 ■3 ■3 0 ■3 ■3 ■3 ■3 ■3 ■3 3 3 ■3 3 ■3 3 3 ■3
и 72 72 7,8 62 72 5,7 7.7 ^2 5 3 5,5 ■3 0 ■3 ■3 0 ■3 ■3 ■3 ■3 ■3 ■3 3 3 ■3 3 ■3 3 3 ■3
13 63 6.2 5;0 53 52 7.0 7,0 5,8 6.7 ;5 0 ■3 ■3 0 ■3 ■3 ■3 ■3 ■3 ■3 3 3 ■3 3 ■3 3 3 ■3
и 65 5;0 5;3 •У 62 52 6,7 72 32 6.3 5,3 2,0 12 ■3 ■3 0 ■3 ■3 ■3 ■3 ■3 ■3 3 3 ■3 3 ■3 3 3 ■3
15 У 3,8 72 4;0 6,3 33 6,0 32 1,5 6? 3,7 6;0 ■3 0 ■3 ■3 ■3 ■3 ■3 ■3 3 3 ■3 3 ■3 3 3 ■3
16 6,7 5,7 б,а 53 62 5.3 65 7.0 5,7 6;5 5,3 32 5.5 63 0 ■3 ■3 ■3 ■3 ■3 ■3 3 3 ■3 3 ■3 3 3 ■3
17 63 4,7 з;о 4.3 52 43 72 7.7 62 72 6;0 6? 53 3. 4,7 6.2 ■3 ■3 ■3 ■3 ■3 ■3 3 3 ■3 3 ■3 3 3 ■3
18 6;0 7.0 У Ц 4,5 6,3 2,7 1:5 5:7 6.2 1,7 5.7 ■3 ■3 ■3 ■3 ■3 ■3 ■3 ■3 ■3 ■3 ■3 ■3 ■3
19 63 62 77 4.8 6;~ 6;0 6,0 60 5£ 12 «;5 1:7 4,7 4:~ 52 53 1.5 53 ■3 ■3 ■3 ■3 3 3 ■3 3 ■3 3 3 ■3
20 3.7 4.3 3.2 6,3 63 53 3.0 3.3 «5 4.3 4. В 30 6,3 63 2,2 55 ■3 ■3 ■3 3 3 ■3 3 ■3 3 3 ■3
21 6;0 5,7 7 7 3 Ч 7,8 65 53 «3 73 3.2 73 7^ 7.3 7,2 ¡У ■3 ■3 ■3 ■3 ■3 ■3 ■3 ■3 ■3 ■3
22 9;0 зз У 3;~ 3.5 3,5 35 3,0 3.0 3.5 3,0 3.5 3.7 3.2 7.7 ¡Г 35 53 5,3 ■3 3 3 ■3 3 ■3 3 3 ■3
23 85 б;з 8,7 У 33 3.5 7,5 3;~ 32 V 3.2 72 зз 3.7 7.0 зз 3,3 зз 53 3,3 22 3 3 ■3 3 ■3 3 3 ■3
21 6;7 72 6.2 6;3 55 72 4,3 7.7 73 6" 7.7 75 72 5.3 5,7 72 7.0 3,0 72 6;~ 2:5 5.3 3 ■3 3 ■3 3 3 ■3
25 75 77 77 6;3 7,! 3.0 65 7.3 ч 6" 3.2 75 73 7;3 6.7 7 7 7.7 6,7 зз 6.2 2,2 15 33 1.3 ■3 3 ■3 3 3 ■3
26 85 32 7,8 3;0 32 У 7.7 3;3 7,0 11 3.5 73 8.0 32 35 7 7 3;~ 7.7 3;0 8,7 3,5 3.0 13 12 2.3 3 ■3 3 3 ■3
27 63 77 32 7.0 7.5 6,7 3;0 75 11 зз 7,0 7,3 6;3 7.0 72 7.7 52 "■3 7.5 1,7 1:7 12 1,5 3,3 ■3 3 3 ■3
23 6;0 62 5;5 4,7 53 5.3 6,3 52 6,7 63 6,0 6.2 5.7 57 6.7 7.0 3,7 1:7 5.3 1,5 7.3 «з 5.0 "■3 7.7 5,3 3 3 ■3
29 7.0 б;з 3.2 75 73 У 32 6.2 12 72 6.2 7.3 72 6.7 7.5 6,3 60 2,2 6,0 1.3 1,3 55 3.2 ■3 ■3
30 6.3 7.5 72 6.1 5.3 ■15 7.7 6.7 5.3 3.0 "3 6.3 7.2 3.0 60 6.5 ".2 7.7 6.3 2.3 : 3 62 3.0 -1.2 7.7 3.2 3.3 2.3 ■3
Рис. 2. Матрица субъективных различий между четырехлинейными фигурами (Номера строк и столбцов соответствуют номерам стимулов на рис. 1)
Таблица
Показатели пространственной модели попарных различий между четырехлинейными фигурами
Показатель Размерность пространства
1 2 3 4 5 6
Стресс (в) 0,52 0,29 0,19 0,15 0,11 0,09
Коэффициент корреляции (г) 0,47 0,64 0,76 0,81 0,86 0,88
Средний радиус — 1,42 1,74 2,10 2,33 2,55
Стандартное отклонение — 0,23 0,25 0,17 0,17 0,16
Коэффициент вариации, % — 0,17 0,14 0,08 0,07 0,06
Необходимо оценить сферичность полученного пространства, что осуществляется на основе коэффициента вариации, который определяет степень отклонения экспериментальных данных от уравнения сферы. Динамика значений коэффициента вариации полученного пространства (см. табл.) такова, что при трехмерном решении он достигает допустимого значения. Следовательно, полученное пространство может быть представлено в виде трехмерной сферы.
Далее будет осуществлена содержательная интерпретация осей, которая является дополнительным критерием правильности выбора минимальной размерности [10; 15] и позволяет специфицировать полученную модель четырехлинейных фигур.
Сферическая модель различения конфигураций
Содержательная интерпретация осей полученного пространства требует сопоставления полученных данных со сферической моделью различения стимулов [1; 2; 17]. Согласно этой модели значимая характеристика стимулов в зрительной системе анализируется двухканальной нейронной сетью (модулем), каналы которой связаны реципрокными отношениями, и сумма квадратов числовых показателей их активности является константой. Математически двухканальный модуль зрительной системы представлен двумя декартовыми координатами двумерной евклидовой плоскости, а сферическая координата соответствует сенсорной характеристике стимулов [10; 13]. Различение стимулов с несколькими физическими характеристиками осуществляется набором двухканальных модулей [2], которые, взаимодействуя, образуют многоканальную сеть. Математически такая сеть представлена гиперсферой в евклидовом пространстве, размерность которого определяется числом сферических координат, связанных с субъективными характеристиками стимула [2; 10; 13].
Следовательно, для содержательной интерпретации полученного трехмерного пространства как модели различения четырехлинейных фигур необходимо проанализировать расположение точек, соответствующих стимулам, спроецировав их на двумерные плоскости.
На рис. 3 изображена проекция точек на плоскость двух первых координат — горизонтальная плоскость Х1Х2. Число около каждой точки соответствует номеру стимула на рис. 1. График показывает, что все точки разделились на три группы. Анализ особенностей стимулов показал, что группировка произошла на основе категориальных признаков, а не конфигурационных. Кроме того, субъективная группировка не совсем совпадает с объективным разделением стимулов на группы, описанные выше. В группу «пик» вошли стимулы, в которых все четыре линии выходят из одной вершины. В группу «К-фигура» вошли стимулы, которые похожи на букву «К», т.е. имеют две линии, лежащие на одной прямой, и две другие, расположенные с одной стороны от этой прямой. Группу «звезда» составили фигуры, представленные четырьмя линиями, выходящими из центра поля зрения и делящими его приблизительно на равные части. Интересно, что на горизонтальной плоскости проекция точки 28 расположена почти на равном расстоянии от групп «пик» и «К-фигура», так как по внешним признакам ее можно отнести к каждой из этих категорий.
На рис. 4 показана проекция точек, представляющих стимулы, на вертикальную плоскость пространства, образованную первой и третьей осями (Х1 и Х3). На этом графике видно, что все точки расположились группами, но образовали уже не три группы, а пять. При этом группа «пик» разделилась на две подгруппы, а элементы групп «К-фигура» и «звезда» образовали три подгруппы.
Категориальное пространство стимулов Проекция на горизонтальную плоскость
Ось XI
Рис. 3. Проекция точек-стимулов на горизонтальную плоскость трехмерного категориального пространства
Категориальное пространство стимулов Проекция на вертикальную плоскость
-1,2 -1,0 -0,8 -0,6 -0,4 -0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2
Ось XI
Рис. 4. Проекция точек-стимулов на вертикальную плоскость трехмерного категориального пространства
Получившиеся подгруппы мы обозначили в зависимости от вошедших в них элементов и согласно представлениям теории машинного зрения [8; 9]. В подгруппу «малый пик» вошли стимулы, которые представляют острый угол. В подгруппу «пик» вошли стимулы, две внешние линии которой образуют угол больше 90°. Подгруппа «звезда» содержит элементы, похожие на букву Х. Элементы подгрупп «К-фигура» и «стрелка» похожи на букву «К», однако элементы последней группы имеют небольшой угол между двумя внутренними линиями. Проекция точек на вертикальную плоскость, по-видимому, отражает окончательную категориальную структуру различения четырехлинейных фигур. Сферические координаты полученного пространства составляют сложный категориальный признак, так как они анализируют изображения в целом и выделяют пять категорий. При сравнении данного пространства с конфигурационными пространствами, полученными при анализе похожих фигур [11; 12], очевидно, что они отличаются не только размерностью, но и внутренней структурой. Полученные ранее пространства отражают анализ графических признаков изображения, а модель настоящего исследования — категориальных признаков.
Следовательно, различение четырехлинейных фигур разных типов осуществляется трехканальной нейронной сетью, которая анализирует особенности изображения путем категоризации — отнесения их к разным категориям на основе сложного видимого категориального признака, представленного двумя сферическими координатами пространства.
ЛИТЕРАТУРА
[1] Измайлов Ч.А. Сферическая модель цветоразличения. — М.: Изд-во МГУ, 1980.
[2] Измайлов Ч.А., Исайчев С.А., Шехтер Е.Д. Двухканальная модель различения сигналов в сенсорных системах // Вестник МГУ. Сер. 14, Психология. — 1998. — Вып. 3. — С. 29—40.
[3] Измайлов Ч.А., Соколов Е.Н., Едренкин И.В. Интегрирование простых признаков стимула в нейронных сетях зрительной системы // Нейрокомпьютеры: разработка, применение. — 2008. — № 5—6. — С. 34—46.
[4] Измайлов Ч.А., Черноризов А.М. Язык восприятия и мозг // Психология. Журнал Высшей школы экономики. — 2005. — Т. 2. — № 4. — С. 22—52.
[5] Измайлов Ч.А., Чудина Ю.А. Конфигурационные и категориальные характеристики зрительного восприятия схематических фигур // Вестник РУДН. Серия «Психология и педагогика». — 2004. — № 2. — С. 210—228.
[6] Николлс Дж. Г., Мартин А.Р., Валлас Б.Дж., Фукс П.А. От нейрона к мозгу. — М.: УРСС, 2003. — С. 414—482.
[7] Терехина А.Ю. Анализ данных методом многомерного шкалирования. — М.: Наука, 1985.
[8] Уинстон П.П. Компьютерное зрение // Психология машинного зрения / Под ред. П.П. Уин-стона. — М.: Мир, 1978.
[9] Уолд Д. Интерпретация контурных рисунков, изображающих сцены с тенями // Психология машинного зрения / Под ред. П.П. Уинстона. — М.: Мир, 1978.
[10] Фомин С.В., Соколов Е.Н., Вайткявичус Г.Г. Искусственные органы чувств. — Л. Наука, 1979.
[11] Чудина Ю.А., Измайлов Ч.А. Конфигурационный механизм различения крестообразных фигур // Вестник РУДН. Серия «Психология и педагогика». — 2011. — № 5. — С. 7—18.
[12] Чудина Ю.А. Конфигурационный механизм различения изображений // Вестник РУДН. — Серия «Психология и педагогика». — 2012. — № 1. — С. 85—93.
[13] Izmailov Ch. A., Sokolov E.N. Spherical model of color and brightness discrimination // Psychological Science. — 1991. — V. 2. — Р. 249—259.
[14] Maier A., Logothetis N.K., Leopold D.A. Context-dependent perceptual modulation of single neurons in primate visual cortex // PNAS March 27. — 2007. — Vol. 104. — N. 13. — P. 5620— 5625.
[15] Shepard R.N. Towards a universal law of generalization for psychological space // Science. — 1987. — V. 237. — P. 1317—1323.
[16] Sigala N, Logothetis N.K. Visual categorization shapes feature selectivity in the primate temporal cortex // Nature. — 2002 Jan 17. — 415(6869). — P. 318—20.
[17] Sokolov E.N. Model of cognitive processes // Advances in Psychological Science / Eds. M. Sagaurin, T. Craik. — V. 2. — Sussecs, UK: Psychol Press, 1998. — P. 355—378.
CATEGORIAL MODEL OF FOUR-LINE DIAGRAMMATIC REPRESENTATIONS RECOGNITION
Yu. A. Chudina, N.A. Chudina
Chair of Social and Differential Psychology Peoples' Friendship University of Russia Miklukho-Maklaya str., 6, Moscow, Russia, 117198
The geometrical model of recognizing four-line diagrammatic representations, characterized by different relations of elements, has been constructed in the article. The averaged superthreshold estimations of the perceptive differences between the four-line configurations have been processed by means of the multidimensional scaling technique. The constructed space has been interpreted in terms of Sokolov and Izmailov's spherical model of differentiating stimuli. The characteristics of the derived model reflect the representation recognition mechanism based on categorical attributes.
Key words: recognition of four-line diagrammatic representations, multidimensional scaling, subjective estimations of pared differences, two-channel module, spherical model of differentiating stimuli, categorical features of stimuli, visual categorization.