МОДЕЛЬ РАЗЛИЧЕНИЯ ФИГУР ИЗ ЛИНИЙ С РАЗНЫМ КОЛИЧЕСТВОМ ЭЛЕМЕНТОВ
Ю.А. Чудина
Кафедра социальной и дифференциальной психологии Российский университет дружбы народов ул. Миклухо-Маклая, 6, Москва, Россия, 117198
Настоящая работа посвящена моделированию механизмов различения фигур, состоящих из разного количества линий. Экспериментальное исследование зрительного восприятия данных конфигураций осуществлялось в рамках векторного подхода, его результаты интерпретировались в терминах сферической модели различения стимулов Е.Н. Соколова и Ч.А. Измайлова. Различение фигур из линий с разным количеством элементов осуществляется интегральной трехканальной нейронной сетью, образованной в результате взаимодействия двухканальных модулей, детектирующих элементы изображения.
Ключевые слова: многомерное шкалирование, субъективные оценки попарных различий, фигуры из линий, двухканальный модуль, сферическая модель различения стимулов, интегральная нейронная сеть.
Проблемы интеграции признаков видимой сцены и формирования целостного зрительного образа являются ключевыми в концепции векторного кодирования. Решение этих проблем связано с разработкой сферической модели различения стимулов [1; 3—5; 7]. Эта модель, построенная на основе экспериментальных данных, описывает способы взаимодействия детекторных механизмов зрительной системы, осуществляющих восприятие видимой сцены. Моделью различения конфигураций является трехуровневая нейронная сеть [3; 4], каждый уровень которой имеет свои особенности. На первом уровне сети происходит сбор информации о «направлении протяженных перепадов яркости в форме границ, отделяющих одну часть зрительного поля от другой» [4]. Элементами первого уровня являются нейроны-детекторы с «простыми» рецептивными полями [8; 9], различающие ориентацию. Они являются входными элементами и выполняют функцию «квазирецепторов» при анализе формы [3; 4]. На втором уровне формируется набор «узловых элементов» («узлы» Гузмана) [4; 5; 8; 12], представляющих комбинации из линий с разной ориентацией, имеющих точки пересечения. Третий уровень интегрирует информацию предыдущих уровней и из «разных узлов-признаков, как из элементов алфавита, составляются конфигурации, определяющие контурную форму предметов в поле зрения, аналогично тому, как из букв составляются слова» [4; 5]. Второй и третий уровни нейронной сети представлены детекторами со сложными и сверхсложными рецептивными полями.
Составными частями сферической модели формирования предметного образа являются двухканальные модули, обрабатывающие одномерные признаки конфигураций [1; 3—5]. Каждый двухканальный модуль представляет двухканальную нейронную сеть, каналы которой находятся в реципрокных отношениях и графически могут быть представлены двумя осями декартовой системы координат. Стимулы-конфигурации представлены точками, составляющими окружность на евклидовой плоскости, образованной этими осями, а зрительная переменная — сферической координатой точки-стимула [1; 7].
Настоящая статья посвящена построению сферической модели различения «узловых» элементов изображения: «отрезков», «углов», «стрелок» и т.д. [8; 10; 12]. Выбор именно таких стимулов был связан с попыткой решения двух задач. Описание особенностей двухканальных модулей, образующих интегральную нейронную сеть различения «узловых» элементов изображения. Выявление влияния количества элементов на характеристики интегральной нейронной сети различения «узлов».
Испытуемые. В эксперименте приняли участие 12 здоровых испытуемых, по 6 женщин и мужчин, в возрасте 25—30 лет.
Стимулы. В качестве стимулов использовали фигуры, состоящие из разного количества линий, начинающихся в одной центральной точке (рис. 1). Всего использовали 30 стимулов, объединенных в 5 групп по количеству элементов. Представители каждой группы различались так же ориентацией в видимом поле и величиной внешнего угла, исключая экземпляры первой группы, представленные одной линией.
Рис. 1. Фигуры, составленные из разного количества линий (номера стимулов обозначены цифрами)
Процедура предъявления стимулов. Стимулы, изображенные белыми линиями на черном фоне, предъявлялись на экране компьютера парами. Каждая пара предъявлялась в течение 500 мс, далее в течение экспонирования черного маскирующего фона (500 мс) испытуемый давал числовую оценку различий между предъявленной парой стимулов, путем нажатия на соответствующую цифровую клавишу для записи результата в памяти компьютера.
Испытуемых просили оценить различия между парами по 9-балльной шкале: минимальному различию приписать 1, максимальному — 9, а остальные значения использовать для промежуточных оценок. Каждый испытуемый оценивал различия между 435 парами стимулов из расчета п(п - 1)/2, где п = 30, так что одинаковые стимулы испытуемый не сравнивал. Пары стимулов предъявлялись в квазислучайном порядке. Для каждого испытуемого была получена индивидуальная матрица попарных субъективных различий между стимулами. После проверки матриц всех испытуемых на коррелированность, их усреднили и получили треугольную матрицу групповых субъективных различий между фигурами из линий (рис. 2).
№ 1 2 3 4 5 6 7 3 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
1 0 0 0 0 0 0 00000000000000000 0 0 0 0 0 0 а
2 2 0 0 0 0 0 ооооооооооооооооо 0 0 0 0 0 0 0
3 1,9 1,4 0 0 0 0 00000000000000000 0 0 0 0 0 0 0
4 1 2,5 3,1 0 0 0 ооооооооооооооооо 0 0 0 0 0 0 0
5 2,8 1,6 2,4 1,8 0 0 ооооооооооооооооо 0 0 0 0 0 0 0
6 2,1 1,5 и 1,6 1,5 0 ооооооооооооооооо 0 0 0 0 0 0 0
7 5,7 5,7 5,2 5 5,7 5 ооооооооооооооооо 0 0 0 0 0 0 0
8 5,8 5,6 5,6 6 6,1 6,2 2ДОООООООООООООООО 0 0 0 0 0 0 0
9 5,5 5,1 6 6 5,9 5,7 4,1 4,7 000000000000000 0 0 0 0 0 0 а
10 5,5 5,6 5,6 6 5,7 5,9 3,4 3,2 2,5 00000000000000 0 0 0 0 0 0 0
11 5,7 6 5,5 6,2 5,9 5,8 3,8 2,7 2,3 2,2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
12 5,4 5,6 6 5,4 5,8 5,1 4,7 4,8 2,4 3,4 2,9 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
В 6,1 6,2 6,1 7,2 6,6 6,8 5,1 5ц4 5Д 5 5Д 5/1 0 0000000000 0 0 0 0 0 0 0
14 бд 5,7 6,4 6,4 6,8 7,5 6,2 5,8 4,5 5,9 5,3 5,1 4,5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 а
15 6,3 6,6 6,6 7 6,9 6,7 3,7 4,9 4,4 5,8 4,7 5,8 3,5 5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
16 6,2 6,9 6,4 7 6,4 6,4 5,6 6Д 4,1 4,8 5,9 3,8 5,4 2,9 4,4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
17 6,4 6,8 5,6 6,7 6,5 6,2 5,2 5,3 5,1 4 4,8 5,6 3,6 4,1 5,6 5 0 0 0 0 0 0 0 0 0 0 0 0 0 0
18 6,6 6,1 5,6 6,7 6,5 6,4 5,8 6,3 4,2 5,6 5,7 5,2 4,8 2,3 5,1 2 3,1 0 0 0 0 0 0 0 0 0 0 0 0 0
19 6,9 7,5 7,5 7,4 7,5 7,6 8 6,8 5,9 6,4 6,8 5 5,7 5,9 6,4 5,9 6,3 6,7 0 0 0 0 0 0 0 0 0 0 0 0
20 7,6 7,9 6,9 6,9 7,2 7,3 5,6 5^> 6^ 6,1 6 6,3 5,7 3,4 6,6 4 5,1 5,2 4 0 0 0 0 0 0 0 0 0 0 0
21 7,7 8,1 7,7 8,5 7,8 7,6 6,3 6,6 6.3 6,1 7,1 6,7 6,6 5Д 6,9 4,9 6.3 5,4 2,5 2,8 0 0 0 0 0 0 0 0 0 0
22 7,1 7,8 7,5 7,7 7,7 7,5 6 5,6 6,2 5,9 6,8 6,3 6 4,7 5,9 5,1 5,4 5,9 4,5 4,8 4,1 0 0 0 0 0 0 0 0 а
23 8,1 7,1 8 7,4 7 7,4 6,7 7 5,4 5,1 6,1 7,4 6 5,8 5,2 5,8 6,3 4,7 6 6 5,4 5,2 0 0 0 0 0 0 0 а
24 6,8 7,5 7,7 7,4 6,9 7,7 5,4 6,2 6,6 6,8 7,7 6,5 4,8 6,1 6,4 6,8 6Д 6,6 6 5,8 5,5 5.3 4,1 0 0 0 0 0 0 0
25 8,3 7,3 7,8 7,4 7,3 7,7 7 7,4 5,9 6,8 6,7 5,6 5,9 5,9 6,1 5Д 6,1 5,9 1,8 4,5 1,6 4.9 6,1 5,6 0 0 0 0 0 0
26 8,3 8 7,5 7,8 7,6 7,9 7,5 7,3 5,5 7Д 6,4 7,3 6,5 6 7,7 5Д 6Д 6,1 3,6 ЗД 2,4 4,8 6,3 5,7 1,5 0 0 0 0 0
27 7,7 7,2 7,8 8,1 8 7,4 6,1 м ад 7,3 7,4 6,9 5,8 5,3 6,8 6,4 6Д 5,6 5,6 5 4 4,7 3,3 5Д 5,1 4,3 0 0 0 а
28 7,7 7,3 7,6 7,6 8,1 8 6 6,9 7,7 6Д 6,5 -.3 6,1 5,8 6.3 5,8 5,5 5,8 5,4 5,5 4,8 4,4 3,4 5Д 4,8 4,6 2Д 0 0 0
29 8,8 8,1 8,6 8,4 8 7,9 6,7 5,9 6,8 6,9 7,3 7 6,5 5,8 7,3 5,7 7 5,7 4,8 5,7 4,1 4,3 3,7 5Д 5,5 5,7 4,1 2,7 0 0
30 7,6 7,5 7,8 8 8,4 8,1 6,1 7,4 6,6 7,6 7,5 6,3 6 6,5 5,9 6,5 6,1 6Д 5,8 5 4Д 4,4 2,7 5,4 6,3 5 4,1 3,1 3,1 0
Рис. 2. Матрица усредненных субъективных различий между фигурами из линий (номера строк и столбцов матрицы соответствуют номерам стимулов на рис. 1)
Обработка результатов. Полученную групповую матрицу обработали неметрическим методом многомерного шкалирования по алгоритму Краскела [6; 11].
В результате было построено геометрическое пространство фигур из линий. Полученное пространство специфицировали по сферичности и минимальной размерности. Для определения сферичности вычисляли коэффициент вариации, показывающий отклонения экспериментальных данных от уравнения сферы [11]. Для выявления минимальной размерности рассчитали показатели меры различия — «стресса» (5) и меры сходства — коэффициента корреляции (г) между экспериментальными и модельными данными.
С точки зрения формальных признаков полученное пространство имеет структуру трехмерной сферы (табл. 1).
Таблица 1
Показатели пространственной модели попарных различий между фигурами из линий
Показатель Размерность пространства
1 2 3 4 5 6
Стресс (в) 0,53 0,34 0,21 0,16 0,12 0,09
Коэффициент корреляции (г) 0,36 0,59 0,74 0,81 0,86 0,89
Коэффициент вариации, % — 5,78 4,63 5,04 4,93 4,71
Сферическая модель различения фигур из линий. Далее осуществляли содержательный анализ структуры полученного пространства, для чего ее интерпретировали в терминах сферической модели различения стимулов Е.Н. Соколова, Ч.А. Измайлова [1; 3; 4; 7]. Согласно этим представлениям, полученное пространство является многомерной моделью распознавания фигур из линий. Декартовые координаты (оси) в этой модели соответствуют нейронным каналам, детектирующим сенсорные характеристики стимулов, а сферические координаты отражают субъективные признаки распознавания изображений. Внешняя стимуляция осуществляет не только выбор определенных модулей, но так же их взаимодействие и объединение, результатом которого является интегральная многоканальная нейронная сеть. Предполагается, что при активации интегральной сети становится возможным зрительное восприятие предметного мира.
Полученная сферическая модель фигур из линий представлена сферой в трехмерном пространстве, три оси которого соответсвуют нейронным каналам, результатом объединения которых является двухканальные модули, представленные в виде двухмерных проекций точек-стимулов [1; 4; 7]. Проекции стимульных точек на двухмерные плоскости, образованные первой и второй координатами, и первой и третьей координатами пространства фигур из линий, представлены соответственно на рис. 3 и рис. 4.
На первой проекции (рис. 3) все стимулы расположились последовательно в зависимости от количества линий, составляющих фигуру. Это демонстрирует график зависимости первой сферической координаты пространства от количества элементов фигуры вне зависимости от ее ориентации в видимом поле (рис. 4). Следовательно, первый двухканальный модуль используется для распознавания типа «узлов», которое осуществляется на основе количества линий и их комбинаций с разной ориентацией. Активность нейронных каналов отражается в специфике расположения стимульных точек вдоль первой и второй осей полученного пространства и подтверждает нашу интерпретацию.
1,6 1,4 1,2
3 1'0
а
^
* 0,8
° 0,6
га х
0,4 0,2 0,0 -0,2
3 6*
4* •
нн 10 11 •
• *8
7
12
Х2
15
*17..
»1318
14 16
23 20*
22
24 19 2.528 -* 2У27
21 29
• 30
Х1
-1,2 -1,0 -0,8 -0,6 -0,4 -0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2 Количество элементов
Рис. 3. Проекция точек-стимулов на горизонтальную плоскость трехмерного пространства
т
га ^ «
^ ш
I й
1- I
У га
* £ ¥ "
И
° ^ ^
>Е £ 1 £ ь
^ я
.о о.
с; г*
{2 *
3 О
а. *
о
3,5 -г
3,0-
2,52,0
,5-
1,0 0,5-
0,0
Связь первой сферической координаты конфигуративного пространства с количеством
элементов
Количество элементов, шт
Рис. 4. График зависимости первой сферической координаты пространства от количества элементов
Канал, представленный первой осью, дифференцирует фигуры, которые отличаются количеством составных линейных элементов. При этом первая ось различает только количество линейных элементов, не обращая внимания на их ориентацию в видимом поле, но это относится в основном к элементам с вертикально-горизонтальной ориентацией [2; 3]. Наклонная ориентация детектируется второй осью. На рис. 3 видно, что стимулы образовали группы в зависимости от количества элементов, при этом четко выделились четыре группы: 1) фигуры, состоящие из одного элемента; 2) двух элементов; 3) трех элементов; 4) четырех и пяти элементов. Встает вопрос, почему четырех- и пятиэлементные фигуры вошли в одну группу? Возможно, различение количества элементов, превышающее три, становится несущественным при восприятии такого рода стимулов и фирмирует общую группу «больше трех элементов».
Вторая проекция, составленная первой и третьей осями (рис. 5), отражает активность ворого двухканального модуля, который анализирует величину внешнего угла. Это показано на графике зависимости второй сферической координаты точки-стимула от величины внешнего угла (рис. 6). Обращает на себя внимание расположение точек по третьей оси. Точки, представляющие фигуры из одной линии, имеют нулевое значение по этой координате, а точки, соответствующие остальным стимулам, имеют как отрицательные, так и положительные значения. Интересно, что стимулы, состоящие из линий, образующих внешний прямой угол, имеют, наряду с одноэлементными фигурами, нулевое значение по оси. Отрицательные значения имеют стимульные точки, элементы которых образуют острый внешний угол, а положительные значения — точки, имеющие тупой внешний угол. Следовательно, третий канал не просто детектирует величину угла, а определяет, является ли внешний угол прямым, меньше прямого или больше прямого [2; 5].
1,0
-1,2 -1,0 -0,8 -0,6 -0,4 -0,2 0,0 0,2 0,4 0,6 0,8 1,0 1,2 Количество элементов
Рис. 5. Проекция точек-стимулов на вертикальную плоскость трехмерного пространства
У
О
со X (Л
о о о
.0 I .0
о. <и со
2,6 2,4 2,2 2,0 1,8 1,6 1,4 1,2 1,0 0,8 0,6
Связь второй сферической координат конфигуративного пространства с величиной внешнего
угла
3,4 3,6 3,8 4,0 4,2 4,4 4,6 4,8 5,0 5,2 5,4 5,6 5,8 6,0 Величина внешнего угла, радианы
Рис. 6. График зависимости второй сферической координаты точки-стимула от величины внешнего угла
Полученная интегральная многоканальная сеть образовалась путем объединения модулей детектирования ориентации и величины угла [4; 5].
Это видно из анализа особенностей образующих ее нейронных каналов и их взаимодействия. Первый канал отражает механизм различения типов «узловых» элементов изображения по количеству элементов. Трудно сказать, являются ли эти элементы фигуры «простыми» или «сложными», но их равнозначность подтверждается единством детекторного механизма. По-видимому, в формировании первого двухканального модуля приняли участие детекторы ориентации, анализирующие горизонтальное, вертикальное и наклонное положение элементов фигуры [2; 3], которые объединились по количеству линий, составляющих зрительный «узел». Таким образом, первый двухканальный модуль является результатом объединения нескольких детекторов ориентации, выполняющих роль «квазирецепторов» при различении формы. Третий канал многоканальной сети связан с детектированием величины угла [2; 5]. В данном случае нейронная сеть детектирования углов представлена одним каналом, а не двумя. Возможно, это связано со специфическим взаимодействием третьего канала с первым. Канал детектирования прямых углов не является оппонентным [2; 5], что способствует его «поглащению» первым каналом, способным анализировать и вертикальную, и горизонтальную ориентацию.
Итак, в данном исследовании было показано, что интегральная нейронная сеть различения «узловых» конфигураций использует количество элементов для распознавания изображений, выделяя один, два, три и «больше трех» элементов.
Эта нейронная сеть представлена взаимодействием трех нейронных каналов, которые анализируют конфигурацию зрительных «узлов», на основе информации о количестве элементов определенной ориентации и величины угла между ними.
ЛИТЕРАТУРА
[1] Измайлов Ч.А., Исайчев С.А., Шехтер Е.Д. Двухканальная модель различения сигналов в сенсорных системах // Вестник МГУ. Сер. 14, Психология. — 1998. — Вып. 3. — С. 29—40. [Izmaylov Ch.A., Isaichev S.A., Shehter E.D. Dvuhkanalnaya model razlicheniya signalov v sensornih sistemah // Vestnik MGU. Ser. 14, Psykhologiya. — 1998. — Vyp. 3. — S. 29—40.]
[2] Измайлов Ч.А., Ласточкина М.Н., Полянская Г.Н., Соколов Е.Н. Различение линий и углов зрительной системой // Вестник МГУ. Сер. 14, Психология. — 1988. — Вып. 1. — С. 41—50. [Izmaylov Ch.A., Lastochkina M.N., Polyanskaya G.N., Sokolov E.N. Razlicheniye liniy i uglov zritelnoy sistemoy // Vestnik MGU. Ser. 14, Psykhologiya. — 1988. — Vyp. 1. — S. 41—50.]
[3] Измайлов Ч.А., Соколов Е.Н., Коршунова С.Г., Чудина Ю.А. Геометрическая модель различения ориентаций линии, основанная на субъективных оценках и зрительных вызванных потенциалах // Журнал ВНД. — 2004. — Т. 54. — № 2. — С. 267—279. [Izmailov Ch.A., Sokolov E.N., Korshunova S. G., Chudina Y.A. Geometricheskaya model razlicheniya orien-taciy liniy, osnovannaya na subektivnih ocenkah i zritelnih vizvannih potencialah // Journal VND. — 2004. — T. 54. — № 2. — S. 267—279.]
[4] Измайлов Ч.А., Соколов Е.Н., Едренкин И.В. Интегрирование простых признаков стимула в нейронных сетях зрительной системы // Нейрокомпьютеры: разработка, применение. — 2008. — № 5—6. — С. 34—46. [Izmailov Ch.A., Sokolov E.N., Edrenkin I.V. Inte-grirovanie prostih priznakov stimula v neyronnih setyah zritelnoy sistemi // Neurocomputery: razrabotka i primenenie. — 2008. — № 5—6. — S. 34—46.]
[5] Измайлов Ч.А., Черноризов А.М. Язык восприятия и мозг // Психология (Журнал Высшей школы экономики). — 2005. — Т. 2. — № 4. — С. 22—52. [Izmailov Ch.A., Chernorizov A.M. Yazik vospriyatiya i mozg // Psykhologiya (Journal Visshej shkoly ekonomiki). — 2005. — T. 2. — № 4. — S. 22—52.]
[6] Терехина А.Ю. Анализ данных методом многомерного шкалирования. — М., 1985. [Terehina A. Y. Analiz dannih metedom mnogomernogo shkalirovaniya. — M., 1985.]
[7] Фомин С.В., Соколов Е.Н., Вайткявичус Г.Г. Искусственные органы чувств. — Л., 1979. [Fomin S.V., Sokolov E.N., Vaytkyavichus G.G. Iskusstvennye organi chuvstv. — L., 1979.]
[8] Шевелев И.А., Каменкович В.М., Шараев Г.А. Относительное значение линий и углов геометрических фигур для их опознания человеком // Журн. высш. нерв. деятельности. — 2000. — Т. 50. — № 3. — С. 403—409. [Shevelev I.A., Kamtnkovich V.M., Sharayev G.A. Otnositelnoe znacheniye liniy i uglov geometricheskih figur dlya ih opoznaniya chelovekom // Journal vysshej nervnoj deyatelnosti. — 2000. — T. 50. — № 3. — S. 403—409.]
[9] Hubel D.N., Wiesel T.N. Receptive fields, binocular integration and functional architecture in the cat's visual cortex // J. Physiology. — 1962. — V. 160. — P. 106—154.
[10] Hubel D.N., Wiesel T.N. Receptive fields and functional architecture in two nonstriate visual areas (18 and 19) of the cat // J. Neurophysiology. — 1965. — V. 28. — P. 229—289.
[11] Shepard R.N. Towards a universal law of generalization for psychological space // Science. — 1987. — V. 237. — P. 1317—1323.
[12] Shevelev I.A., Lazareva N.A., Sharaev G.A. // Interrelation of tuning characteristics to bar, cross and corner in striate neurons // Neuroscience. — 1999. — V. 88. — P. 17—25.
DISCRIMINATING MODEL OF FIGURES WITH DIFFERENT NUMBER UNIFORM ELEMENTS
Y.A. Chudina
Chair of Social and Differential Psychology Peoples' Friendship University of Russia Miklukho-Maklaya str., 6, Moscow, Russia, 117198
The model of discriminating mechanisms of the figures with a different number of uniform elements has been described in the present article. The experimental investigation of the visual perception of these figures have been made within the scope of the vectorial approach and its results have been interpreted by means of the terms of Sokolov and Izmailov's spherical model of differentiating stimuli. The discrimination of the figures with a different number of uniform elements (lines) is realized with the integral three-channel neural network, made up as a result of the interaction of the two-channel modules, detecting pictorial elements.
Key words: multidimensional scaling, subjective estimations of pairwise differences, figures composed of uniform elements, two-channel module, spherical model of differentiating stimuli, integral neural network.