КАТЕГОРИАЛЬНАЯ МОДЕЛЬ РАЗЛИЧЕНИЯ ЛИНИЙ, УГЛОВ И КРЕСТООБРАЗНЫХ ФИГУР*
Ю.А. Чудина
Кафедра социальной и дифференциальной психологии Российский университет дружбы народов ул. Миклухо-Маклая, 6, Москва, Россия, 117198
В статье рассмотрена геометрическая модель различения стимулов, представляющих собой изображения из линий. С помощью многомерного шкалирования усредненных надпороговых оценок субъективных различий между линиями, углами и крестами было получено пространство, которое в рамках концепции Соколова—Измайлова является моделью различения этих стимулов. Особенностью полученной модели является различение изображений путем выявления зрительных категорий.
Ключевые слова: различение линий, углов и крестов, многомерное шкалирование, субъективные оценки попарных различий, двухканальный модуль, сферическая модель различения стимулов, зрительная категоризация.
Физиологической основой зрительного восприятия является сложная нейронная сеть, которая широко представлена в мозге и обеспечивает успешное отражение особенностей зрительного мира, необходимое для адекватного поведения. Согласно современным нейрофизиологическим исследованиям, эта нейронная сеть представлена двумя функциональными системами, которые имеют различную локализацию в мозге, отличаются скоростью обработки и передачи сигнала, выполняют разные задачи [7; 15; 17]. Активность более медленной вентральной системы или системы «Что это?» преимущественно связана с распознаванием и спецификацией внешних объектов. Дорзальная система или система «Где это?» считается более быстрой, определяет местоположение объекта в видимом поле, а также осуществляет зрительный контроль управления двигательным поведением [15; 17]. Локализационные и функциональные особенности этих двух систем согласуются с представлениями о наличии категориального и конфигуративного механизмов распознавания изображений [5; 6]. Мы склонны предполагать, что выявление конфигуративных характеристик связано с работой дорзальной системы, в то время как категоризация видимой сцены осуществляется вентральной системой. Обе системы используют одну и ту же входную информацию, которая специфически преобразуется каждой из них. Экспериментальным подтверждением этого является восприятие одних и тех же стимулов в качестве графических элементов изображения [3; 4; 6; 12; 13] или как объектов, относящихся к определенным зрительным категориям [6; 14].
В этой статье исследуется механизм одновременного распознавания линий, углов и крестообразных фигур, по отдельности исследованных в предыдущих работах [2; 4; 12; 13]. С одной стороны, согласно теории машинного зрения [9; 10], одиночные и пересекающиеся линии являются элементами любого изображения видимой сцены, с другой стороны, они могут быть представлены как самостоятельные объекты. Объединение разных типов стимулов в одном эксперименте
* Работа поддержана грантами РГНФ № 10-06-00302а и РФФИ № 10-06-00438а.
позволит понять, каким образом происходит зрительная категоризация изображений в реальных условиях распознавания и на основе каких зрительных характеристик.
Испытуемые. В эксперименте приняли участие 10 здоровых испытуемых женского и мужского пола в возрасте 25—30 лет.
Стимулы. В качестве стимулов использовали 30 изображений (рис. 1), в состав которых входили линии, углы и крестообразные фигуры. Линии были двух типов: линии-отрезки представляли собой линию, ограниченную с одной стороны центром экрана; линии-границы представляли линию, пересекающую центр экрана, которая в длину равнялась двум линиям-отрезкам.
10
X
х X
11
12
13
X
14
15
\
16
17
13
19
20
Г
V
21
22
23
24
25
Л-
>
_1
И
26
27
23
29
Рис.1. Линии, углы и кресты, используемые в качестве стимулов (номера стимулов обозначены цифрами)
Углы состояли из двух линий-отрезков, а крестообразные фигуры или кресты были образованы двумя пересекающимися линиями-границами. Следовательно, всего было использовано четыре типа изображений: линии-отрезки, линии-границы, углы и кресты.
Процедура предъявления стимулов
Стимулы изображались на экране компьютера белыми линиями на темном фоне и предъявлялись парами в квазислучайном порядке. Задачей испытуемых было оценить различия между каждой парой изображений, используя 9-балльную шкалу, согласно которой минимальному различию между стимулами соответствует 1, максимальному различию — 9, а остальные значения используются для промежуточных оценок. Оценки вводились в память компьютера путем нажатия на соответствующую цифровую клавишу. Длительность предъявления пары стимулов на экране соответствовала 500 мс. Затем через 500 мс экспонировался темный фон, после чего испытуемый давал числовой ответ. Одинаковые стимулы в паре не предъявлялись, поэтому каждый испытуемый сравнивал по 435 пар стимулов из расчета п(п - 1)/2, где п = 30. Следовательно, для каждого испытуемого была получена матрица попарных оценок субъективных различий. Эти матрицы после проверки на коррелированность (минимальный коэффициент корреляции составил 0,78), усредняли. В результате была получена треугольная матрица различий между линиями, углами и крестообразными фигурами (рис. 2). Элементом данной матрицы является усредненная по всем испытуемым субъективная оценка различий между определенными стимулами, номера которых соответствуют номерам на рис. 1. Итоговую усредненную матрицу анализировали неметрическим методом многомерного шкалирования по алгоритму Гутмана [8; 18]. В результате получили многомерное геометрическое пространство, являющееся моделью различения линий, углов и крестообразных фигур [1; 11; 16; 18; 19].
Выявление внутренней структуры полученного пространства связано с определением его минимальной размерности или минимального количества координатных осей, при котором межточечные расстояния соответствуют исходным оценкам в матрице различий [18], и с определением его сферичности. Для определения минимальной размерности использовали меру отклонения данных, полученных в результате шкалирования, от исходных данных («стресс») и меру их близости (коэффициент корреляции). Минимальная размерность пространства определяется по точке перегиба функций «стресса» и коэффициента корреляции, после которой существенных изменений этих показателей не наблюдается.
В табл. 1 представлены значения показателей «стресса» и коэффициента корреляции в зависимости от размерности пространства. Существенные изменения наблюдаются при переходе от двухмерного решения к трехмерному и почти отсутствуют при переходе от трех измерений к четырем и более. Следовательно, для полученного пространства оптимальной является трехмерная структура.
Оценка сферичности полученного трехмерного пространства осуществляется по коэффициенту вариации (табл. 1), который является показателем степени отклонения экспериментальных данных от уравнения сферы. При трехмерном решении коэффициент вариации не превышает допустимое значение (14%), что позволяет представить полученное пространство в виде трехмерной сферы.
Рис. 2. Матрица субъективных различий между линиями, углами и крестообразными фигурами
(Номера строк и столбцов соответствуют номерам стимулов на рис. 1)
Показатели пространственной модели различения линий, углов и крестообразных фигур
Таблица 1
Показатель Размерность пространства
1 2 3 4 5 6
Стресс, в 0,47 0,28 0,12 0,08 0,06 0,05
Коэффициент корреляции, г 0,54 0,83 0,94 0,97 0,98 0,98
Коэффициент вариации, % — 1,78 1,80 2,73 2,77 2,58
Дальнейшая содержательная интерпретация осей [16; 18] трехмерного сферического пространства различения линий, углов и крестов позволит выявить структуру полученной модели, ее особенности и характеристики.
Сферическая модель различения линий, углов и крестов
Согласно сферической модели различения стимулов Соколова—Измайлова [11; 16; 19], физическая характеристика изображения обрабатывается в зрительной системе двухканальной нейронной сетью или модулем [1], каналы которого связаны реципрокными отношениями, а сумма квадратов показателей их активности равна константе. Двухканальный модуль представлен декартовыми координатами двухмерного евклидова пространства, сферическая координата которого соответствует субъективной характеристике стимулов. Набор физических характеристик стимула обрабатывает многоканальная сеть, являющаяся результатом взаимодействия нескольких двухканальных модулей. В данном случае результатом такого объединения стала трехканальная нейронная сеть. Спроецируем стимуль-ные точки на двухмерные плоскости для содержательной интерпретации осей и выявления функций модулей.
На рис. 3 изображена проекция точек на горизонтальную плоскость Х1Х2, которая отражает активность одного двухканального модуля. На графике видно, что все точки разделились на три группы в зависимости от специфики стимулов, которые объединились на основе категориальных признаков. На это указывает кластерная структура расположения стимульных точек. В одну группу, обозначенную как «линии», вошли стрелки и границы, во вторую группу, которую мы назвали «кресты», вошли крестообразные фигуры и третью группу составили «углы».
Х1
Рис. 3. Проекция точек-стимулов на горизонтальную плоскость трехмерного категориального пространства
Вклад второго двухканального модуля в распознавание линий, углов и крестов отражается в проекции точек на вертикальную плоскость Х1Х3 (рис. 4). Проекция точек на рис. 3 имеет также кластерную структуру, в которой все стимуль-ные точки разделились на четыре группы: линии-отрезки, линии-границы, углы и кресты. Стимулы группы «линии» на плоскости Х1Х3 разделились на две подгруппы: «стрелки» и «границы».
Категориальное пространство
Х1
Рис. 4. Проекция точек-стимулов на вертикальную плоскость трехмерного категориального пространства
Следовательно, различение линий, углов и крестов осуществляется на основе категориальных признаков, где наиболее важной является информация не о конфигурации, а типе изображения [5; 6; 14]. В данном случае линия-граница или линия-отрезок не является элементом изображения, а рассматривается как самостоятельный объект.
Первичное разделение стимулов на три группы осуществляется двухканаль-ным модулем (Х1Х2), который определяет тип фигуры: «линия», «угол», «крест». Этот модуль не «видит» различий между линиями-отрезками и линиями-границами, такая категоризация является первичной. Более точная дифференциация «линий» требует участия дополнительного модуля, который встраивается в данную сеть и представлен в виде одного нейронного канала (ось Х3). Следовательно, выявление разных типов линий отражает процесс вторичной (более тонкой) категоризации изображений, первоначально отнесенных к одной группе. Этот процесс виден не только на примере разделения группы «линии» на отрезки и гра-
ницы, но также и на примере стимула № 9 (см. рис. 1), который может быть включен не только в группу «кресты», но и в группу «границы» на основании его сходства с единичной линией.
Структура полученного пространства указывает на категориальный характер анализа использованных стимулов. Процесс совместного различения разнотипных стимулов (линий, углов и крестов) осуществляется трехканальной нейронной сетью путем определения зрительных категорий. Первоначально выявляются группы стимулов, соответствующие основным типам фигур (первичная категоризация), затем внутри этих групп выделяются подгруппы (вторичная категоризация). Следовательно, зрительная категоризация изображений может носить сложный ступенчатый характер и иметь несколько, более одного основания для категоризации.
ЛИТЕРАТУРА
[1] Измайлов Ч.А., Исайчев С.А., Шехтер Е.Д. Двухканальная модель различения сигналов в сенсорных системах // Вестник МГУ. Сер. 14, Психология. — 1998. — Вып. 3. — С. 29—40.
[2] Измайлов Ч.А., Ласточкина М.Н., Полянская Г.Н., Соколов Е.Н. Различение линий и углов зрительной системой // Вестник МГУ. Сер. 14, Психология. — 1988. — Вып. 1. — С. 41—50.
[3] Измайлов Ч.А., Соколов Е.Н., Едренкин И.В. Интегрирование простых признаков стимула в нейронных сетях зрительной системы // Нейрокомпьютеры: разработка, применение. — 2008. — № 5—6. — С. 34—46.
[4] Измайлов Ч.А., Соколов Е.Н., Коршунова С.Г., Чудина Ю.А. Геометрическая модель различения ориентаций линии, основанная на субъективных оценках и зрительных вызванных потенциалах // Журнал ВНД. — 2004. — Т. 54. — № 2. — С. 267—279.
[5] Измайлов Ч.А., Черноризов А.М. Язык восприятия и мозг // Психология. Журнал Высшей школы экономики. — 2005. — Т. 2. — № 4. — С. 22—52.
[6] Измайлов Ч.А., Чудина Ю.А. Конфигурационные и категориальные характеристики зрительного восприятия схематических фигур // Вестник РУДН. Серия «Психология и педагогика». — 2004. — № 2. — С. 210—228.
[7] Николлс Дж.Г., Мартин А.Р., Валлас Б.Дж., Фукс П.А. От нейрона к мозгу. — М.: УРСС, 2003. — С. 414—482.
[8] Терехина А.Ю. Анализ данных методом многомерного шкалирования. — М.: Наука, 1985.
[9] Уинстон П.П. Компьютерное зрение // Психология машинного зрения / Под ред. П.П. Уинстона. — М.: Мир, 1978. — С. 9—29.
[10] Уолд Д. Интерпретация контурных рисунков, изображающих сцены с тенями // Психология машинного зрения / Под ред. П.П. Уинстона. — М.: Мир, 1978. — С.30—93
[11] Фомин С.В., Соколов Е.Н., Вайткявичус Г.Г. Искусственные органы чувств. — Л.: Наука, 1979..
[12] Чудина Ю.А., Измайлов Ч.А. Конфигурационный механизм различения крестообразных фигур // Вестник РУДН. Серия «Психология и педагогика». — 2011. — № 5. — С. 7—18.
[13] Чудина Ю.А. Геометрическая модель различения углов // Вестник РУДН. — Серия «Психология и педагогика». — 2012. — № 2. — С. 31—39.
[14] Чудина Ю.А., Чудина Н.А. Категориальная модель различения четырехлинейных фигур // Вестник РУДН. Серия «Психология и педагогика». — 2012. — № 3. — С. 35—42.
[15] Cardoso-Leite P., Gorea A. On the Perceptual/Motor dissociation: A Review of concept, theory, experimental paradigms and data interpretations // Seeing and Perceiving. — 2010. — № 23. — P. 89—151.
[16] Izmailov Ch.A., Sokolov E.N. Spherical model of color and brightness discrimination // Psychological Science. — 1991. — V. 2. — Р. 249—259.
[17] Norman J. Two visual systems and two theories of perception: An attempt to reconcile the con-structivist and ecological approaches // Behavioral and Brain Sciences. — 2002. — № 25. — P. 73—144.
[18] Shepard R.N. Towards a universal law of generalization for psychological space // Science. — 1987. — V. 237. — P. 1317—1323.
[19] Sokolov E.N. Model of cognitive processes // Advances in Psychological Science / Eds. M. Sagaurin, T. Craik. — V. 2. — Sussecs, UK: Psychol Press, 1998. — P. 355—378.
CATEGORIAL MODEL OF LINES, ANGLES AND CROSS-SHAPED IMAGES RECOGNITION
Yu.A. Chudina
Chair of Social and Differential Psychology Peoples' Friendship University of Russia Miklukho-Maklaya str., 6, Moscow, Russia, 117198
The geometrical model of recognizing stimuli represented by the images composed of lines has been considered in the article. We have constructed the three-dimensional space having made use of the multidimensional scaling technique for averaged superthreshold estimations of the subjective differences between lines, angles and cross-shaped images. By means of the terms of Sokolov and Izmailov's theory this space was the recognition model of differentiating our selected stimuli. The main specific feature of the model was the differentiation of these images by use of visual categorization.
Key words: recognition of lines, angles and cross-shaped images, multidimensional scaling, subjective estimations of pared differences, two-channel module, spherical model of differentiating stimuli, visual categorization.