Психология. Журнал Высшей школы экономики. 2005. Т. 2. № 4. С. 22-52.
Теоретико-эмпирические исследования
ЯЗЫК ВОСПРИЯТИЯ И МОЗГ1
Ч.А. ИЗМАЙЛОВ, А.М. ЧЕРНОРИЗОВ
Измайлов Чингис Абильфазович — профессор кафедры психофизиологии МГУ им. М.В. Ломоносова, доктор психологических наук. Область научных интересов — восприятие цвета и формы, психофизиология эмоций, психологические измерения, математическая психология, моделирование нейронных сетей зрения. Является автором книг «Сферическая модель цветоразличения» (М.: Изд-во МГУ, 1980), «Психофизиология цветового зрения» (в соавторстве с Е.Н. Соколовым и А.М. Черноризовым, М.: Изд-во МГУ, 1989), «Психофизиологические основы эмоций» (в соавторстве с А.М. Черноризовым, М.: Изд-во МПСИ, 2004). Контакты: еЬ [email protected]
Черноризов Александр Михайлович — заведующий кафедрой психофизиологии факультета психологии МГУ им. М.В. Ломоносова, доктор психологических наук, профессор, член Нью-Йоркской академии наук, заслуженный работник высшего профессионального образования.
Основная область научных интересов — фундаментальные исследования в области сравнительной психофизиологии цветовосприя-тия человека и животных по методологической схеме «Человек — Нейрон — Модель». Исследования направлены на экспериментальную проверку основных положений «векторной психофизиологии», касающихся принципов переработки информации в нейронных сетях.
Контакты: [email protected]
1Работа поддержана грантами РГНФ (№ 04-06-00230) и РФФИ (№ 04-06-80245).
Резюме
Предлагается новый теоретико-экспериментальный подход к решению проблем мозговых механизмов речи и восприятия, основанный на гипотезе о том, что речь и восприятие являются частными формами существования единой и общей для них структуры — «структуры языка». При этом если речь представляет собой самую развитую и в нашем обыденном представлении самую «настоящую» форму языка, то связь восприятия с языком представляется весьма опосредованной. По этой причине в работе сделан акцент на анализе полученных нами и другими авторами экспериментальных и теоретических данных, позволяющих рассматривать восприятие как своеобразную форму языка — «зрительного языка» со своим «зрительным алфавитом» (буквами), «зрительной морфологией» (частями «зрительной речи» — «зрительными» слогами, словами и правилами их комбинации), а также «зрительным синтаксисом» (знаками препинания).
Постановка проблемы: речь, язык,восприятие
Одной из важнейших характеристик речи является ее направленность на обозначение предметов. Не менее важным можно считать и переход к обозначению отношений между предметами, иными словами, предметное олицетворение этих отношений, абстракций, которые нельзя выразить «указанием на» или подражанием. Для обозначения этой характеристики уместно использовать психологический термин «опредмечивание». Опредмечивая абстрактные понятия, речь создает искусственные предметы в виде слов для обогащения и развития общения индивидов (Лурия, 1974; Выготский, 1934). Это, в свою очередь, служит мощным стимулом для развития всего категориального аппарата психики и, в первую очередь, долговременной памяти, интеллекта и речи. Таким образом, формируется положительная обратная связь, которая приводит к интенсивному развитию всех когнитивных процессов.
Какова же природа этой речевой характеристики, какие мозговые механизмы обусловливают ее исполнение? Данная работа не претендует на исчерпывающие ответы на эти вопросы. Наша задача — предложить вниманию читателей новый подход к решению проблемы мозговых механизмов речи и восприятия, основанный на единой и общей для них структуре — структуре языка. В работе выдвигается гипотеза, что речь и восприятие являются частными формами существования этой общей «языковой структуры». Речь — это самая развитая и в нашем обыденном представлении самая близкая к языку структура, поскольку именно речь мы наиболее часто называем языком. Однако современное состояние лингвистики, в особенности семиотики и структурной лингвистики, показывает, что языковая структура представлена не только в речи (письменной или устной), но и в таких отдаленных от речи областях, как мифология, этнография, антропология. В психологии и психолингвистике
общепринято рассматривать как близкие (соседние в феноменологическом смысле) такие разделы, как «Память», «Мышление» и «Речь». На наш взгляд, эта традиция восходит к явно распознаваемому структурному сходству этих когнитивных процессов, которые, по существу, являются именно языковыми.
Основная идея данной работы состоит в том, чтобы показать, что не только речь, мышление и память имеют явную языковую структуру, но и зрительное восприятие — это тоже «язык», и не в переносном, а в прямом значении этого слова. Поэтому мозговые механизмы зрительного восприятия имеют непосредственное отношение к языковым механизмам. Более того, язык зрительного восприятия значительно проще речевого или интеллектуального языка, но в то же время обладает всеми языковыми атрибутами (алфавитом, грамматикой, синтаксисом) и в этом смысле представляет собой удобный материал для исследования нейрофизиологических механизмов собственно «речи» и «языка». Здесь мы видим прямую аналогию с широко известными своей эффективностью исследованиями нейронных механизмов памяти и научения в простых нейронных системах высших беспозвоночных (Кэндел, 1980).
Основная идея классических и современных теорий зрительного восприятия
Практически все теории зрительного восприятия (и классические, и современные) в явном или неявном виде строятся на одном и том же основании, на одном и том же посту-
лате — объектности физической среды, внешнего мира.
«Наша зрительная система приспособлена для восприятия объемных предметов реального мира, для восприятия различных объектов, выделяющихся на фоне друг друга и на общем для них фоне, а не для восприятия объектов и фона в виде двумерных, плоских поверхностей, какими они предстают на фотографиях или на чертежах. Восприятие трехмерных форм на основании фотографий или чертежей есть на самом деле иллюзия, в которой естественный механизм, приспособленный к восприятию реального мира, активируется под воздействием очевидных признаков глубины и удаленности, представленных на плоскости» (Шифман, 2003). Идея реальности трехмерного евклидова пространства как вместилища реально существующих физических объектов неизбежно приводила исследователей к пониманию зрительного восприятия как процесса обнаружения, отображения, распознавания, опознания в среде трехмерных объектов. Что значит видеть? Обычно, отвечая на такой вопрос, человек говорит, что видеть — значит «узнавать» при осмотре, определяя, что и где находится (так, в частности, считал Аристотель). Другими словами, зрение — это процесс определения по изображениям (паттернам), что именно присутстствует в окружающем мире и где находится. Таким образом, пер-цепт как феноменальный образ восприятия неизбежно рассматривается как результат процесса узнавания, который осуществляется зрительной системой путем детектирования базисных характеристик (сенсорных
качеств, признаков) этого объекта и последующего их синтеза (сборки) в целостный, константный, выделенный из фона предмет (визуальный образ, перцепт).
Но парадокс состоит в том, что основным камнем преткновения для таких теорий зрительного восприятия оказывается нейрофизиологическое устройство зрительной системы, которое в ряде своих звеньев никак не соответствует этой идее. Причем при первом приближении к тому, как устроена та или иная часть зрительной системы, кажется, что «детекторная концепция» подкрепляется принципом ее (зрительной системы) устройства, но последующее, более детальное исследование обнаруживает в ряде случаев кардинальное несоответствие. Например, оптический аппарат глаза позвоночных представляет собой биологический механизм, который на первый взгляд фактически идентичен оптической системе фотоаппарата, придуманного человеком для «правильного» отображения физических объектов. Это вроде бы прямо указывает на адекватность центральной идеи классических теорий восприятия — «идеи распознавания». Но когда выяснилась морфология сетчатки и положение в ней рецепторов (светочувствительных элементов) относительно оптической системы, то результаты привели исследователей в тупик. Дело не в том, что оптика глаза дает изображение, перевернутое «вверх ногами» относительно силы тяготения на земле, т. е. противоположное информации, получаемой от вестибулярной системы. В конце концов, перевернув фотоаппарат «вверх ногами», фотокадр легко перевернуть
вновь при проявлении или печатании снимка. И даже тот факт, что произвольное искажение хода лучей в оптике глаза с помощью дополнительных внешних устройств не меняет фатально процесс распознавания, можно (хотя и не очень эффектно для хорошей теории) принять и объяснить ^гайоп, 1897; Логвинен-ко, 1974). Главная проблема в том, что рецепторы сетчатки позвоночных расположены так, будто природа задалась целью максимально оградить ее главные светочувствительные элементы от оптически «правильного» получения светового изображения. Прежде чем попасть на рецепторы, свет должен пройти через несколько слоев тканей (сосудистой, нервной, глиальной), поглощающих и рассеивающих (искажающих) световой поток. Это все равно, как если бы в фотоаппарате между фотопленкой и окуляром поместить много слоев разноцветной бумаги. «Еще не нашел объяснения тот факт, что рецепторные элементы сетчатки позвоночных обращены в сторону, противоположную стимулу» (Сомьен, 1975).
Более того, непрерывные высокочастотные движения глаз и разнообразные движения головы и тела все время меняют направление и интенсивность света. Но устранить эти движения — значит прекратить зрение. Стабилизация изображения на сетчатке приводит к исчезновению воспринимаемых предметов, остается только восприятие простых перепадов света и темноты в полном соответствии с устройством оптической системы глаза (Riggs е! al., 1953; Ярбус, 1965). «Изображение на сетчатке — это сильно уменьшенный
искривленный двумерный вариант того, что мы считаем прямой трехмерной действительностью. Проекция на сетчатке обладает невысокими оптическими качествами и не может конкурировать по четкости деталей с изображениями, которые дают фотоаппараты. Каким образом из дрожащих смутных теней на дне каждого глаза мозг воссоздает единый видимый мир, поразительно богатый, надежно устойчивый, с манящей глубиной и перспективой,— это загадка, решение которой не дается самым талантливым физиологам, посвятившим себя изучению сенсорных систем» (Ярбус, 1965). Специалистам по технической оптике совершенно ясно, что при таком устройстве глаза ни о каком процессе приема и распознавания изображений (за исключением самых приблизительных разграничений света и темноты) не может быть и речи. Но при всем при этом острота зрения у многих высших позвоночных значительно превосходит физические возможности технического устройства с аналогичной оптикой.
Это можно продемонстрировать несложными расчетами. Плотность рецепторов (колбочек) в центральной ямке глаза человека (fovea) примерно 160 000 на один квадратный миллиметр (Линдсей, Норман, 1974). Диаметр fovea — 1.7-1.8 градуса. При фокусном расстоянии до сетчатки в 20 мм линейный размер радиуса fovea равен примерно 0.9 мм, т. е. для fovea линейный размер 1мм соответствует угловому размеру в 1 градус. Зная линейную плотность колбочек, можно вычислить площадь fovea, занятую одним рецептором: 1/У150000 = 1/390 мм, или в
угловых единицах — 9.2 секунды. Это не толщина рецептора, а характеристика «зернистости» фоторецеп-торного уровня. Соотнесем ее с остротой зрения человека, полученной в психофизических измерениях. Минимальная величина светового пятна, которая определяет порог обнаружения,— 1 угловая секунда. Верньерная острота зрения (различение сдвига одной линии относительно другой) — 2 угловые секунды. Порог распознавания буквы — 30 угловых секунд. Сравните эту величину с устройством входной матрицы светочувствительных элементов искусственных распознающих систем, в которых минимально приемлемая зернистость (с нулевой помехой) для различения букв — это 7X7 элементов.
Другой не менее интересный пример связан с различением наклона прямой линии. Открытие Д. Хьюбе-лом и Т. Визелем нейронов с простыми рецептивными полями — детекторов ориентации линии — в зрительной коре высших позвоночных было воспринято как открытие нейрофизиологического механизма восприятия линий. Однако дифференциальная характеристика этих нейронов варьирует от 5 до 10 угловых градусов (Hubel, Wiesel, 1974; Wiesel, Hub-el, 1974), тогда как дифференциальный порог различения наклона линии глазом человека на два порядка ниже. Этот факт также свидетельствует о несоответствии нейрофизиологических характеристик зрительной системы представлению о ней как механизме, «настроенном» природой на точное распознавание изображений.
Еще большие трудности возникают у классических теорий восприятия
при попытках сформулировать принципы функционирования механизмов синтеза отдельных характеристик в целостный образ. Здесь также открытие Д. Хьюбелом и Т. Визе-лем нейронов со «сложными» и «сверхсложными» рецептивными полями — детекторов комбинаций простых признаков — в зрительной коре высших позвоночных было воспринято как открытие нейрофизиологического механизма распознавания «сложных физических объектов». Механизм казался простым и очевидным. На первом этапе опознания зрительная система одновременным включением детекторов простых физических признаков выделяет из проксимального стимула первичные базисные характеристики изображения. На следующих уровнях анализа эти характеристики группируются во все более сложные комбинации признаков нейронами со все более сложными рецептивными полями. И, наконец, на завершающем этапе «детекторы сложных признаков» — «гностические нейроны» — опознают, идентифицируют паттерн как отдельный объект внешнего мира. Но такое решение встречается с целым рядом нейрофизиологических проблем, свидетельствующих о его несовместимости с реальным устройством зрительной системы. Дело вовсе не в том, что число нейронов зрительной коры, включая и ассоциативные области темен-но-затылочной и затылочно-височ-ной областей, несопоставимо с числом возможных визуальных форм. И даже не в том, что многочисленные исследования коры головного мозга выявляют поразительно небольшое число типов нейронов-де-
тектров сложных конфигураций (таких, как геометрические фигуры, лицо, живой объект, объекты неживой природы) по сравнению с числом нейронов-детекторов простейших признаков (таких, как ориентация линии, отрезок, угол или доминантность левой—правой половины поля зрения). Главная проблема заключается в том, что иерархическая теория восприятия неизбежно базируется на проксимальной стимуляции как источнике максимальной информации, которая в последующих звеньях только обобщается и редуцируется, поскольку имеет избыточный характер. Наиболее простые примеры обычно приводятся по расчетам ста с лишним миллионов рецепторов или миллиона с лишним ганглиозных клеток сетчатки как однобитовых информационных ячеек по и вычислению невообразимого количества информации, получаемой в этом случае зрительной системой при самых умеренных частотных характеристиках нервных клеток (Веккер, 1974; Циммерман, 1984; Кейдель, 1975). Однако эти расчеты никакого отношения к восприятию формы не имеют. Во-первых, экспериментальные данные показывают, что восприятие формы вовсе не обязательно базируется на физическом воздействии на рецепторы глаза. Здесь можно указать на эксперименты с восприятием формы по феноменальному контуру без ре-тинального изображения (Рок, 1980; Gregory, 1972) и с восприятием формы через узкую движущуюся щель (Rock, Sigman, 1973). Во-вторых, эксперименты с подавлением формирования детекторов определенного типа в онтогенезе показывают, что, хотя число нейронов-детекторов
определенной ориентации линий в зрительной коре существенно редуцируется, это незначительно влияет на последующее восприятие формы, для которой теоретически необходимы данные детекторы (Hirsch, Spi-nelly, 1972). Авторы гештальт-теории уже давно показали, что детекции отдельных элементов недостаточно для восприятия формы. Так, согласно сформулированному гештальтиста-ми закону транспозиции, главным фактором образования целостности является восприятие соотношений между элементами, а не просто самих элементов. (С нашей точки зрения, этот пункт является наиболее важным и решающим для понимания механизмов восприятия формы и восприятия вообще, поэтому далее мы на нем остановимся более детально.)
На самом деле среди исследователей зрительного восприятия достаточно много критически относящихся к представлению о перцепте как результате анализа сетчаточного изображения (проксимального стимула). Так, один из них, Дж. Гибсон, в результате такой критики пришел к следующему заключению: «Теперь я вижу единственный выход в том, чтобы отвергнуть догму о существовании сетчаточного стимула в форме картинки» (Гибсон, 1988). Но в то же время эти ученые не подвергают сомнению постулат существования реальности в виде трехмерного ортогонального мира, который восприятие должно как можно точнее отобразить. В связи с этим многие исследователи склоняются к позиции, что для понимания восприятия формы как процесса формирования правильного изображения реальных объектов необходимо привлечение
более сложных когнитивных процессов, таких, как научение, память, интеллект (Рок, 1980, Грегори, 1972). Предложение Дж. Гибсона перейти от физиологической оптики к оптике экологической (Гибсон, 1988) и рассматривать восприятие как систему «глаз — мозг — голова — тело — окружающая среда» тем не менее оставляет в основании идею реального существования «экологических» объектов именно такими, какими они представлены в восприятии. В теории Дж. Гибсона меняется описание физического мира (для которого он вводит специальный термин «окружающая среда»), но задача восприятия — «узнавать при осмотре, что и где находится»,— остается неизменной.
Совершенно не случайно, что все компьютерные системы распознавания образов включают процессы обучения, логические уравнения, систему принятия решений (Линдсей, Норман, 1974; Бонгард, 1967; Уин-стон, 1978). Таким образом, успешное решение задачи распознавания изображений требует не просто автоматического анализа сетчаточного изображения (проксимальной стимуляции), но и дополнительного привлечения процедур более высокого когнитивного уровня. Именно поэтому М. Бонгард (1967) пишет, что «проблема узнавания — это часть проблемы мышления».
Однако при анализе того, на чем основана эффективность алгоритмов распознавания образов (нейро-когнитрон) (Fucushima, Miyake, 1982; Van Ooyen, Nienhuis, 1993), мы сталкиваемся с той же проблемой несогласованности принципов построения искусственных алгоритмов распознавания образов с
нейрофизиологическими характеристиками зрительной системы. «Эффективность работы этих алгоритмов прямо зависит от вычислительных возможностей механизма (компьютера), что определяется двумя условиями: быстродействием процессора и объемом оперативной памяти. При современных вычислительных мощностях (миллиардах операций в секунду и доступу к миллиардам бит информации) на распознавание трехмерной фигуры (не сканирование, а классификацию) требуется время, измеряемое в секундах. Не будем акцентировать внимание на времени, так как это малосущественный показатель (хотя зрительная система человека делает то же самое за десятки миллисекунд), а обратимся к устройству нервной сети. Быстродействие электрических процессов в нервной сети, ограниченное «сверху» 1 кГц, определяется двумя факторами — рефрактерным периодом формирования потенциала действия и химическим устройством синапса. Так же «ничтожно» по сравнению с компьютерными системами «выглядит» и объем оперативной зрительной памяти человека — порядка 10 единиц. При таких характеристиках носителя никакой из имеющихся алгоритмов распознавания образов работать не будет.
Таким образом, мы приходим к выводу, что включение в процесс «восприятия формы» элементов памяти, научения и интеллекта сторонниками подхода, который мы называем «распознаванием образов», нисколько не приближает нас к пониманию именно зрительных механизмов восприятия формы. Напротив, такое включение демонстрирует «полную непригодность» мозга
как устройства для точного отображения объектов в зрительной модальности.
Возникает следующая дилемма. Либо мы (1) учитываем нейрофизиологию зрения и рассматриваем зрительное восприятие как специфический психический процесс, осуществляемый у высших позвоночных специально зрительной системой (а не всем организмом в целом), либо мы (2) рассматриваем зрительную систему как фотоэлектрическое устройство, которое воспроизводит внешний мир в виде распределения активированных и неактивированных элементов на плоскости (сетчатки или коры) и для которого главным и фактически единственно необходимым свойством является высокая разрешающая способность, обеспечивающая точное и полное отражение реальной среды.
В первом случае мы имеем целый ряд частных психофизиологических теорий, в которых достаточно точно измеренные характеристики человека (или животных) в области зрительного восприятия математически корректно связаны с нейрофизиологическими характеристиками зрительной системы. Например, известный феномен полос Маха, с одной стороны, и латеральное торможение нейронов в сетчатке и НКТ — с другой. Или восприятие интенсивности светового излучения, с одной стороны, и «рабочие характеристики» фоторецепторов — с другой. Кульминацией такого подхода являются современные теории цветового зрения (Wyszecki, Stiles, 1982; Измайлов, Соколов, Чер-норизов, 1989), в которых значительное количество цветовых функций, полученных в психофизических
экспериментах на человеке, с высокой степенью точности обосновывается функционированием специфических звеньев зрительной системы высших позвоночных (Zrenner, 1983; De Valois, 1973). Но эта точность касается только наиболее простых, так называемых сенсорных характеристик зрения, а как только зрительный стимул представляет собой пространственную или временную комбинацию нескольких зрительных переменных, то теория перестает работать. Например, высокоэффективные теории восприятия апертурных цветов ничего не дают для решения проблемы цветовой константности.
Во втором случае зрительный образ, перцепт — это результат функционирования не просто всего мозга, включающего как когнитивные, так и мотивационные механизмы, но некоторого сверхмощного по современным меркам нейронного вычислительного устройства. Здесь мы не имеем хоть сколько-нибудь развитых психологических (тем более психофизиологических) теорий восприятия. Зато имеем достаточно эффективные теории и алгоритмы распознавания образов, которые широко используются в современных управляющих и диагностических компьютерных системах, но которые так же далеки от нейронных механизмов зрительного восприятия и мозга человека в целом, как глаз от фотоаппарата.
Новый подход к зрительному восприятию как особой форме «языка»
Все изложенное выше должно, по замыслу авторов, подвести читателя
к тому, что идея рассматривать зрительное восприятие в виде процесса распознавания или отображения объектов реального мира во многом не согласуется и с нейрофизиологией зрительной системы, и с пониманием зрительного восприятия как самостоятельного психического процесса, требующего «обращения» ко всему мозгу и имеющего свои специфические механизмы функционирования. Именно эта идея является причиной кардинального водораздела между психологическими и нейрофизиологическими теориями восприятия, объяснительная сила которых ограничена пределами частных экспериментальных данных, на которых они построены, с одной стороны, и практическими разработками алгоритмов распознавания образов — с другой. «Системы распознавания» из огромного массива экспериментальных данных в области психофизики и нейрофизиологии зрения используют только самую примитивную модель зрительной системы как фотоаппарата, а всю эффективность своих результатов получают из «вычислительных» механизмов, описываемых в таких разделах психологии, как «Научение», «Принятие решений», «Логический интеллект».
Когда исследователь сталкивается с фатальным противоречием в выводах из теории, самое время пересмотреть ее основной тезис. И. Кант уже говорил об этом, причем именно в связи с анализом соотношений «субъективного» опыта и «объективной» реальности. «Когда оказалось, что очевидная гипотеза вращения всех небесных светил вокруг наблюдателя недостаточно хорошо объясняет небесные движения, он (Коперник)
попробовал, не удастся ли достигнуть лучших результатов, если предположить, что наблюдатель движется, а звезда находится в покое. И в метафизике можно сделать такое же предположение, что касается очевидных представлений» (Кант, 1915). И. Кант формулирует такое предположение относительно природы психических феноменов и, в частности, относительно их пространственно-временного представления, которое непосредственно относится к проблеме восприятия. «Пространство и время — это не объективные структуры, воспроизводимые в ощущении, а априорная форма, которая, будучи субъективной предпосылкой любого ощущения, изнутри упорядочивает лишенную объективной пространственной структурированности хаотическую материю внешнего опыта» (выделено нами. — Ч. И., А. Ч.).
Следуя идее И. Канта, можно попытаться объединить в одну теоретическую концепцию разнообразную феноменологию зрительного восприятия, устройство зрительной системы позвоночных и формальные алгоритмы распознавания образов, если отойти от идеи распознавания в проксимальной стимуляции уже существующих объектов среды и принять за основание идею языкового описания физико-химической среды в форме предметного зрительного трехмерного мира. Иначе говоря, рассматривать восприятие как языковую структуру, а нейрофизиологические механизмы зрения — как устройства, которые формируют элементы зрительного языка (зрительный алфавит) и собирают из них по языковым правилам («зрительная
грамматика») целостные категориальные единицы (перцепты), из которых далее также по языковым, но другим правилам («зрительный синтаксис») формируются предложения — «зрительные сцены».
«Зрительный язык» построен по общим принципам языковой архитектуры, но имеет свою специфику. Например, в отличие от одномерного устного языка и двумерного письменного зрительный язык трехмерен. Размерность языка здесь характеризует не процесс слушания, говорения, письма или чтения, которые одномерны, поскольку линейно разворачиваются во времени, а субъективную размерность элемента алфавита, необходимую для выделения его из фона и от других элементов алфавита. Именно трехмерность алфавита задает трехмерность зрительного восприятия. Это не имеет отношения к реальной среде, а в соответствии с идеей Канта представляет собой особую ментальную область (субъективное пространство), в которой размещаются категориальные единицы зрительного языка — пер-цепты. Не все живые организмы имеют трехмерный зрительный язык, но возможно, что размерность языка связана с устройством зрительной системы, с ее эффективностью. Мы видим, что животные с трехмерным зрением имеют более сложную нервную систему и более сложное поведение, чем животные с двумерным или одномерным зрением.
Гипотеза зрительного восприятия как своеобразной формы языка открывает возможности для более глубокого понимания роли восприятия в поведении человека и животных. Под влиянием когнитивного подхода
в современной психофизиологии восприятия ширится круг исследователей, рассматривающих понятие информации в качестве важнейшей основы когнитивных процессов (Веккер, 1974). С этих позиций восприятие — это источник информации о состоянии среды, включающей сам организм как физико-химический агрегат. Это утверждение не вызывает возражения, за исключением одного аспекта. Большинство сторонников такого информационного подхода рассматривают именно среду в качестве источника информации, а зрительную систему (наряду со слуховой, обонятельной и другими сенсорными системами) — как один из каналов переработки этой информации и передачи ее в центральный аппарат мозга (Веккер, 1974). Наша позиция состоит в том, что в среде не содержится никакой информации, поэтому организм не извлекает информацию из среды, а производит ее сам. Именно зрительная система продуцирует информацию, причем в таком виде, который наиболее адекватен центральным системам мозга, принимающим решения и ответственным за эффективность поведения, т. е. памяти и интеллекту. Поскольку память и интеллект — это языковые структуры, то информация, производимая восприятием, должна быть им понятна и содержательна как родная речь, а не как вычислительная процедура, требующая колоссального объема памяти и наносекундного быстродействия. Иначе говоря, мозг — это не вычислительная машина, а языковая система, и информация в мозге измеряется не в битах за секунду, а в «семантических единицах». Нужно от-
метить, что это не означает, что машина не является языковой системой. Современные компьютеры представляют собой уже развитые языковые системы, но они конструктивно реализованы не только как языковые, но, в первую очередь, как вычислительные устройства, использующие для хранения и обмена информацией (результатов вычислений) между блоками структуру в виде двоичного кода, требующего для своей обработки колоссальных ресурсов памяти.
Из «языковой гипотезы восприятия» следует, что предметные образы восприятия (зрительные перцепты) не имеют прямых («абсолютно точных», «тождественных») аналогов во внешнем мире. Так, перцептивные характеристики цвета или формы не имеют прямых физических коррелятов и конструируются из сенсорных образов зрения, но не буквально по образу и подобию реальных объектов, а по правилам и алгоритмам языка, реализованного нейронными механизмами перцепции в качестве носителя. Термин «конструирование» здесь используется в соответствии с концепцией радикального конструктивизма (Цоколов, 2000). Такое понимание восприятия переводит нас из области видеотехники и каналов преобразования видеоизображений в область языковых конструкций. В данном подходе выделяются три класса зрительных феноменов: сенсорные образы, алгоритмы конструирования перцептов и сами перцептивные образы. Каждый из этих классов реализуется специфическими нейронными механизмами в зрительной системе. Они соотносятся с тремя классами языковых феноменов:
буквы (слоги), грамматика, слова (морфемы). Продолжение этой аналогии состоит в формулировании (поиске) правил формирования трехмерной зрительной сцены из отдельных предметных образов по аналогии с тем, как в языке формируются предложения (словосочетания) из слов. Все вместе это будет составлять «язык зрительного восприятия».
Чтобы эта идея не оставалась просто метафорой, мы постараемся далее обосновать ее результатами экспериментальных исследований зрительного восприятия и электрофизиологических исследований зрительной системы.
Алфавит зрительного восприятия
Языковая концепция зрения приводит к совершенно другому пониманию роли рецепторов, подкорковых структур и нейронов-детекторов в формировании зрительных образов. Она подводит к изучению зрения как лингвистическому исследованию неизвестного языка. Одной из важнейших задач, которые встают перед исследователем, является определение критерия (интервала), отделяющего грамматические единицы (буквы и слоги) друг от друга и от семантических единиц (морфем, слов и словосочетаний). Для решения этой проблемы «зрительного языка» может быть использован метод, основанный на сферической модели различения зрительных стимулов. Рассмотрим более детально предлагаемый метод выделения языковых единиц зрительного восприятия.
В ходе проведенных нами экспериментальных исследований разли-
чения зрительных стимулов — изображений различной сложности (гомогенное поле разного спектрального состава и яркости, простые геометрические фигуры в виде линий или углов разной величины и ориентации, схематические и фотографические изображения лица, буквы русского и латинского алфавитов, случайные сочетания букв; слова, обозначающие цвета и эмоции) — нами было обнаружено, что результаты всех экспериментов можно разделить на два класса в соответствии со спецификой используемых стимулов (см.: Измайлов и др., 1989). Важно отметить, что все эти исследования проводились по единой методике, включающей «единые стандарты» процедур стимуляции, инструкции испытуемому, инструкции по статистической обработке данных и математическим методам представления данных. При этом все эти исследования отличались только типом используемых стимулов. На этом основании можно утверждать, что типология результатов определялась типологией стимулов. Кроме собственных данных, мы будем привлекать к обсуждению данные других авторов, которые получены в соответствии с отмеченными выше условиями эксперимента. Какова же полученная типология экспериментальных данных?
Сферическая модель различения
В результате опытов по зрительному различению стимулы одного типа могут быть представлены точками в евклидовом пространстве разной размерности так, что все межточечные расстояния прямо соотносятся с
субъективными оценками воспринимаемых различий между попарно предъявляемыми стимулами. Существенной особенностью такого представления данных является то, что точки-стимулы заполняют не все евклидово пространство, а только часть его, образуя гладкую поверхность п-мерной сферы. По терминологии Р. Шепарда, это соответствует фундаментальному свойству «циркулярности» внутренних репрезентаций (БЬерагё, 1987; 2001). Каждый зрительный стимул представлен в данной модели своим п-мерным вектором, и все векторы-стимулы имеют одинаковую длину. Отсюда следует, что информация о стимулах кодируется только соотношением компонентов вектора, которые взаимосвязаны следующими уравнениями:
Х21г+ Х22г... Х2т = Я2г (1)
п
¿2г]= ДХ^г -Хк)2 (2)
Первое уравнение фиксирует пространственные свойства модели, т. е. представление стимулов как точек сферы в т-мерном евклидовом пространстве (Фомин, Соколов, Вайткявичус, 1979; Вайткявичус, Соколов, 1989). Второе уравнение выражает метрику модели, согласно которой воспринимаемое различие между стимулами измеряется как евклидово расстояние между точками — концами векторов, представляющими эти стимулы на сфере (к-шаИоу, 8око1оу, 1990; 1992; Измайлов, Соколов, Коршунова, 2003).
Первая важная особенность такого представления субъективных раз-
личий состоит в том, что сферические (угловые) координаты точек-стимулов обнаруживают строгую связь с субъективными переменными, которые традиционно используются в литературе по зрительному восприятию для спецификации этих стимулов. Например, пространство цветоразли-чения представлено трехмерной сферой в четырехмерном евклидовом пространстве, в котором три сферические координаты цветовых точек, представляющих монохроматические стимулы, в точности соответствуют функциям, описывающим связь цветового тона, насыщенности и светлоты цвета с длиной волны и интенсивностью светового излучения (^шаПоу, 8око1оу, 1990). А пространство различения углов разной величины и ориентации представлено сферой, в которой две сферические координаты точек, представляющих такие стимулы в трехмерном евклидовом пространстве, в точности соответствуют психофизическим функциям, описывающим связь воспринимаемых угловых характеристик с физическими свойствами стимулов (Измайлов и др., 1988; кша1-1оу, 8око1оу, 1990; Измайлов и др., 2003а, б; Измайлов и др., 2005).
Вторая важная особенность сферической модели различения зрительных стимулов состоит в том, что система декартовых координат пространства, в котором размещаются точки-стимулы, рассматривается как набор нейрофизиологических каналов, из которых в зрительной системе формируется нейронная сеть кодирования стимулов. Функции, описывающие связь декартовых координат точек с физическими характеристиками стимулов, также
хорошо согласуются с электрической активностью отдельных звеньев зрительной системы (Sokolov, Izmailov, 1990; Измайлов, Соколов, Чернори-зов, 1989). Например, в том же пространстве цветоразличения четыре декартовы координаты цветовых точек, представляющих монохроматические стимулы, в точности соответствуют функциям, описывающим активность двух типов цветоопонент-ных клеток (так называемых г-g и b-y нейронов сетчатки и латерального коленчатого тела) и двух типов яркостных клеток (так называемых on- и off-нейронов сетчатки и латерального коленчатого тела, B-и D-нейронов коры), обнаруженных в зрительной системе высших позвоночных (De Valois, 1973; Yung, 1973; Супин, 1981; Черноризов, 1995; 1999; Измайлов, Соколов, Черноризов, 1989; Izmailov, Sokolov, 1990; 1992; Черноризов, Соколов, 2001). А в пространстве различения углов разной величины и ориентации три функции значений декартовых координат соответствуют характеристикам нейронов с простыми рецептивными полями, обнаруженных в зрительной коре высших позвоночных, так называемых детекторов ориентации линий и углов (Hubel, Wisel, 1974; Шевелев и др., 2000; Измайлов и др., 2004).
Таким образом, сферическая модель различения зрительных стимулов одновременно описывает как механизм нейрофизиологического кодирования стимулов в зрительной системе (который представлен системой декартовых координат), так и механизм декодирования нейрофизиологического кода в перцептивные характеристики зрительного образа
(который представлен системой сферических координат).
Категориальная модель различения
Результаты различения стимулов другого типа представляют собой неметрическое пространство двух или трех измерений в декартовой системе координат. Здесь стимулы группируются в кластеры, внутри которых положение каждого стимула достаточно случайно, а сами кластеры могут образовывать локально упорядоченные цепочки. Например, буквы русского (или латинского) алфавита образуют двумерное пространство, в котором выделяются три класса, которые можно охарактеризовать через категории округлости, остро-угольности и прямоугольности (Соколов и др., 1985; Терехина, 1986). Трехлинейные фигуры (три луча, выходящие из одной точки), варьируемые только по величине одного угла, дают аналогичное трехмерное пространство, в котором образуются три кластера — так называемые «стрелки», «вилки» и «Т-образные фигуры». Такие же результаты получаются при различении геометрических фигур — треугольника, трапеции и пятиугольника, искаженных различной степенью деформации контура вплоть до полной бесформенности. Для испытуемых с разным уровнем знаний в области геометрии получено двумерное пространство с распределением стимулов на четыре кластера, внутри которых локальная упорядоченность стимулов коррелировала с уровнем образования испытуемых (Шехтер, 2004).
Особенно интересные результаты получаются в экспериментах с
оценкой цветовых различий между словами — названиями цветов (Фрумкина и др., 1982; Измайлов и др., 1992; ^шаНоу, 8око1оу, 1992; 8Ье-раМ, 1992). Наиболее типичные результаты многомерного шкалирования данных различения цветовых названий приводятся в работах Фрумкиной с соавт. (1982) и Тере-хиной (1986), являющихся наиболее представительными в ряду исследований такого рода. В работе Фрум-киной с соавт. (1982) использованы 80 цветовых названий, используемых в русском языке, и обобщены данные, полученные на 63 испытуемых. Пространственное распределение названий, полученное этими авторами, имело форму конической поверхности с кластеризацией цветов на пять групп по четырем основным цветам спектра (синий, зеленый, желтый, красный) и ахроматическим цветам (белый, молочный, серый, пепельный, грифельный, черный). Между этими основными кластерами располагались группы промежуточных цветовых названий. Например, между группой синих (васильковый, голубой, синий, небесный) и группой зеленых (болотный, зеленый, салатный, бутылочный) располагались названия «бирюзовый», «морской волны», а «красные» вообще составили отдельное измерение, ортогональное этой поверхности. Такая неметрическая структура данных различения речевых категорий (не только цветовых названий) получается всегда при использовании самых разных методов анализа, но не это главное в нашем обсуждении.
Весьма показательны результаты экспериментов с искусственными названиями цветов. В работах Из-
майлова с соавт. (Измайлов и др., 1992; кшаНоу, 8око1оу, 1992) в качестве стимулов были взяты 20 бессмысленных слов (= псевдослов), составленных из трех букв русского алфавита (согласная — гласная — согласная) путем квазислучайных комбинаций. Вначале было показано, что эти «слова» исходно не содержат цветовой семантики. Испытуемые оценивали стимулы по цветовым различиям, и в результате анализа, как и ожидалось, получалось двумерное евклидово пространство, в котором стимулы располагались достаточно произвольно, с небольшой группировкой вокруг гласных букв. Эти результаты свидетельствовали о том, что искусственные стимулы в виде псевдослов содержат только ту семантическую характеристику, которая связана с алфавитом русского языка. Затем проводилась обучающая серия, в которой каждому псевдослову ставился в соответствие определенный цвет, создаваемый монохроматическим излучением в спектральном диапазоне 480-615 нм. Обучение считалось завершенным, если испытуемый безошибочно называл каждый из цветовых стимулов, предъявляемых в случайном порядке, своим (закрепленным при обучении) искусственным названием. После этого испытуемые оценивали цветовые различия между искусственными цветовыми названиями. По этим данным вновь строили пространственную модель различения, которую сравнивали с аналогичной моделью, полученной до обучения. Главным результатом этих экспериментов был монотонный, зависящий от степени обучения переход от двумерного неметрического пространства
речевых категорий в начале обучения к сферическому пространству цветоразличения на конечных стадиях обучения.
Авторами данных работ такой переход объяснялся изменением семантического содержания стимула-псевдослова в процессе обучения: от речевого (буквы русского алфавита, слоги русского языка) к зрительному, когда значение слова определяется только цветовым содержанием сенсорного образа. В свете языковой теории зрения этот вывод можно развить следующим образом. Световой паттерн, попадающий на сетчатку, зрительная система одновременно детектирует (обозначает) и как элемент алфавита, и как зрительную категорию. В первом случае результат детектирования выражается в виде сферической модели различения (поскольку так устроена нейронная сеть детектирования элементов зрительного алфавита), во втором случае в виде категориального семантического пространства. Пока псевдослова детектировались как принадлежащие речевому языку, в оценке различия между стимулами доминировал вклад категориальной системы зрения. Но затем в оценке различия стал доминировать вклад алфавитной системы зрения, так как вследствие обучения зрительная система стала детектировать стимулы не только как речевые, но и как принадлежащие цветовому зрению. В этом случае слова определялись главным образом по цветовому тону, т. е. их характеристика относилась к зрительному алфавиту. (Здесь нужно напомнить, что алфавит зрения не есть алфавит русского языка, это совершенно разные явления.)
В пользу такой интерпретации структуры субъективных различий между искусственными цветовыми названиями говорят данные различения слов, обозначающих основные цвета спектра в обыденной речи. Геометрическое представление оценок сходства или различия между такими словами всегда имеет форму цветового круга Ньютона аналогично пространству стимулов-излучений соответствующих цветовых тонов (Фрумкина, 1982; ЗЬерага, 1992). В таких словах, как «красный», «синий», «зеленый» и т. п., доминирует цветовая сенсорная характеристика, и эти слова, предъявленные как зрительные стимулы, вне речевого контекста, активируют в основном нейронные сети зрительного алфавита, что и находит соответствующее отражение в структуре оценок испытуемого. Эксперименты с регистрацией вызванных потенциалов различения (ВПР) у человека в ответ на мгновенную смену этих же слов — цветовых названий (Измайлов и др., 2003) — показывают, что в этом случае активируется именно зрительная сеть. При этом в левой затылочной области коры головного мозга (электрод О1 в системе 10/20) регистрируется компонент Р120-Ш80, амплитуда которого прямо связана с субъективной оценкой цветовых различий в словах—названиях цветов. Примечательно, что этот компонент ВПР не реагирует на цветовые различия между излучениями. В аналогичных экспериментах со стимулами-излучениями разного цвета на цветовые различия реагируют более ранние компоненты — N87 (Измайлов и др., 1998) и Ш7-Р120 (Измайлов и др., 2003; ^шаИоу, 8око1оу,
2004). Компонент ВПР Р120-Ш80 чувствителен не только к цветовым различиям между словами — базисными названиями цветов, но и к трансформациям элементов в сложном зрительном паттерне (например, к изменениям кривизны рта или наклона бровей на схематическом изображении лица; см.: кшаНоу, 8око1оу, 2004). Этот компонент «реагирует» также на число букв в слове независимо от того, что обозначают эти слова — цвета (Измайлов и др., 2003а) или эмоции (Измайлов и др., 2003б). Во всех этих случаях матрица меж-стимульных различий, полученная для амплитуд компонента Р120-Ш80 ВПР, позволяет построить метрическое пространство, соответствующее сферической модели различения зрительных стимулов.
Таким образом, разделение зрительных стимулов на два класса на основании метрических и пространственных характеристик соответствующей геометрической модели различения рассматривается как операциональный метод выявления двух основных языковых форм зрения: буквы (слоги) и морфемы (слова).
На первый взгляд эта классификация соответствует традиционному выделению в зрении сенсорных и перцептивных процессов. Но традиционные классификации базируются на априорно (или феноменологически) определяемых критериях для такого разделения. Однако все попытки такого рода не выдерживают экспериментальной проверки, поскольку не сопровождаются жестким методом верификации теоретических критериев. Внимательный анализ предлагаемого нами метода показывает, что ни о каком зрительном
стимуле априори нельзя сказать, к какому классу из базисных языковых составляющих зрения этот стимул принадлежит. Ответ на этот вопрос можно получить только после тщательного исследования данного стимула описанным в наших работах методом. То же самое относится и к следующему направлению анализа зрительного языка — выявлению правил, по которым буквы соединяются в слоги, морфемы и слова.
Прежде чем рассматривать грамматические основы зрительного языка, мы остановимся на определении нейрофизиологического механизма зрительного алфавита, на основе которого формируется нейронная сеть конкретной зрительной буквы.
Двухканальная нейронная сеть как
базисный механизм (модуль) зрительного языка
Представление в рамках одной и той же математической модели нейрофизиологического и перцептивного механизмов различения разнообразных зрительных стимулов позволило выделить базисный механизм (так называемый двухканальный модуль), с помощью которого в зрительной системе специфицируется единичная субективная переменная (Измайлов и др., 1998; Измайлов и др., 2004; 2005). Математическое выражение этого модуля представлено описанными выше уравнениями 1 и 2 для случая, когда п = 2. Графически эта модель представляет (а) стимулы как радиус-векторы, концы которых есть точки окружности на евклидовой плоскости (рис. 1а), (б) субъективную переменную — как угловую координату точки-стимула,
Рисунок 1а
Сферическая модель различения стимулов по интенсивности светового излучения
0.0 0.5 1.0
Активность канала Х1
Примечание. Два вектора представляют два стимула и Б]. Единичная окружность, проходящая через концы векторов, образуется множеством стимулов, воспринимаемых зрительной системой (уравнение 1). Угол между вектором и осью абсцисс есть сферическая координата вектора, которая представляет перцептивную характеристику стимула — светлоту. Хорда между концами векторов представляет воспринимаемое различие по светлоте между стимулами и Б2 (уравнение 2). Ось абсцисс на графике представляет активность одного канала нейронной сети различения зрительных стимулов Х1, а ось ординат — другого Х2. Каждая точка-стимул задана уравнением сферы в двумерной декартовой системе координат.
а (в) нейрофизиологическую сеть кодирования стимула — как два канала, взаимосвязанных реципрокным отношением так, что когда один канал в этой сети (ось Х1) увеличивает свою активацию при возрастании стимульной величины, то другой канал (ось Х2) пропорционально уменьшает свою активацию, и, наоборот, при убывании стимульной переменной первый канал уменьшает свою активность, а второй — увеличивает. При этом общая активность модуля,
представленная величиной радиуса окружности (уравнение 1), остается всегда постоянной. Это достигается за счет особого устройства входных синапсов каждого канала. Коэффициенты синаптического преобразования обоих каналов имеют синусно-косинусную характеристику, что и определяет сферическую форму выражения их взаимосвязи (Фомин, Соколов, Вайткявичус, 1979). Таким образом, определенное соотношение компонентов вектора, которое
однозначно задает его сферическую координату, представляет в модели взаимооднозначную связь между способами активации каналов нейронной сети, с одной стороны, и перцептивной (субъективной) переменной — с другой. Эта взаимооднозначность (изоморфизм) показана целым рядом разных методик, начиная от электрической стимуляции непосредственно проекционных зон коры головного мозга и кончая опытами по хирургическому переключению между собой волокон зрительного и слухового трактов.
А как же обстоит дело с однозначностью связи между перцептивной переменной (образом) и соответствующими состояниями среды? Весь наш обыденный зрительный опыт основывается именно на этой очевидной однозначности. Обычно приводятся следующие рассуждения. «Вот береза стоит возле дома. Сколько бы я раз ни проходил мимо нее, она та же самая, с раздвоенным стволом, зелеными листьями летом, с желтыми листьями осенью и без листьев зимой. Я могу до нее дотронуться, понюхать ее листочек. То же самое воспринимают и другие люди, а не только я. Что может быть реальнее?» Речь в данном случае идет не об образах памяти или представлениях, а именно об актуальных образах восприятия. Но все эти рассуждения касаются не столько взаимооднозначности связи между реальностью и ее отражением (перцептом), сколько взаимооднозначности связи между самими перцептами. Когда же мы в психофизическом эксперименте проверяем взаимоотношения между физическим воздействием и перцептом, меняя физические характеристики
излучения, падающего на сетчатку, то для изоморфизма не остается никаких оснований. Наиболее ярким примером такой неоднозначности является феномен цветового метаме-ризма, лежащий в основе одного из законов смешения цветов. Существует множество спектральных излучений, которые при одних и тех же условиях стимуляции и наблюдения дают один и тот же (субъективно неразличимый) цвет. Таким образом, зная абсолютно точно цветовые характеристики образа (цветовой тон, насыщенность и светлоту), ничего нельзя сказать о спектральном составе этих излучений (распределении энергии по длинам волн видимого спектра). Другой, не менее эффектный феномен демонстрируется с помощью так называемого «ящика Гельба». Внутрь черного ящика рядом с задней стенкой помещается небольшой картонный прямоугольник коричневого цвета, а в передней стенке делается два маленьких отверстия. Через одно из них освещается этот прямоугольник, а через другое — смотрит одним глазом (другой глаз закрыт) испытуемый и по просьбе экспериментатора называет цвет картонки. При указанных выше условиях испытуемый всегда видит не коричневый кусок картона, а ярко-желтый светящийся прямоугольник. Но стоит экспериментатору поместить между задней стенкой и картонкой кусок бумаги или серой ткани (большей по величине, чем картонка), не меняя при этом никаких других условий (то есть физических характеристик излучения, освещающего картонку и условий наблюдения для испытуемого), как ярко-желтое светящееся поле трансформируется в
восприятии наблюдателя в обычный кусок коричневого картона. Причем сколько раз вы проделываете эту операцию, столько раз меняется субъективный образ.
Исследователи зрения давно раскрыли природу этих и многих других аналогичных феноменов. Она заключается в том, что зрительная система реагирует не на само воздействие среды (энергию излучения), а на отношения возбуждений, вызванных этим воздействием в разных клетках сетчатки. В случае цветового метамериз-ма это отношение между реакциями на одно и то же воздействие трех типов рецепторов сетчатки. В случае одновременного контраста это отношение активностей пространственно разделенных рецепторов. Аналогичные эффекты можно получить с помощью временного разделения активности рецепторов или нейронов сетчатки.
Отсюда следует принципиально важный вывод. Фоторецепторы — это не просто входные элементы распознающей системы, как это обычно представляется в теориях зрительного восприятия и технических системах распознавания образов, а набор гетерогенных датчиков преобразования энергии среды в отношение реакций, т. е. в определенные соотношения числа импульсов, мембранных потенциалов и т. п., возникающих одновременно в разных рецепторах и (или) пострецепторных клетках (нейронах) сетчатки на одно и то же воздействие среды. Поэтому для формирования «зрительного кода» объекта главным является не столько зернистость сетчатки, определяемая плотностью распределения рецепторов, сколько типологическое
разнообразие рецепторов. Поскольку стимулом для зрительной системы является отношение величин, а не их абсолютные значения, то понятно, что никакой взаимооднозначности между физическими явлениями внешнего мира и активностью зрительной системы нет, а есть в лучшем случае гомоморфизм, т. е. множество состояний среды кодируется одним и тем же множеством состояний зрительной системы. Это означает, что взаимооднозначности не может быть и в отношениях между средой и пер-цептом.
Структура сферической модели отражает именно такие отношения между физическим воздействием среды, зрительной системой и субъективным образом. Каждый двухканальный модуль (рис. 1б) содержит на входе систему из двух или более рецепторов, имеющих гетерогенные (различные, но перекрывающиеся) характеристики чувствительности к диапазону физической энергии (Фомин, Соколов, Вайткявичус, 1979; Соколов, Вайткявичус, 1989). От рецептора каждого типа возбуждение передается сразу на входы обоих каналов. В каждом из каналов это возбуждение преобразуется умножением на коэффициент синаптиче-ской передачи, и это произведение выхода 1-го рецептора на вход ]]-го канала определяет итоговую величину активации канала, которая представлена компонентом вектора в уравнении 1.
Грамматика зрительного языка
Рассмотренная выше сферическая модель двухканальной нейронной сети различения зрительных
Рисунок 1б
Двухканальная нейронная сеть, представляющая векторную модель анализатора интенсивности сигнала (Измайлов и др., 2001)
Примечание. И — рецепторы, представляют первый уровень анализа, е — коэффициент синаптической связи, Х — величина активации канала в двухканальной нейронной сети, D — детекторы интенсивности. В, Y, И, G — синий, желтый, красный и зеленый каналы соответственно.
стимулов представляет базисный механизм формирования элементов зрительного алфавита. Зрительный алфавит содержит в себе столько элементов, сколько зрительных стимулов при их различении может быть представлено в виде сферической модели. Эти стимулы можно обозначить как «простые зрительные стимулы». В соответствии с излагаемым здесь языковым подходом к зрительному восприятию все остальные стимулы рассматриваются как «сложные», они составляются из элементов зрительного алфавита так же, как составляются комбинации букв из речевого алфавита. Из последующего изложения будет видно, что такое разделение на простые и сложные зрительные стимулы не связано пря-
мо ни с физическими характеристиками стимулов, ни с феноменальными, субъективными характеристиками зрительного образа. Точно так же разделение языковых форм в общем случае не определяется свойствами носителя языка, хотя в любом конкретном языке (например, в устной речи) этимологический анализ показывает, что свойства носителя учитываются как в формировании алфавита, так и при формировании семантических единиц.
Для построения более сложных форм зрительного языка, которые традиционно представлены сложными многомерными стимулами, зрительная система использует нейронную сеть, состоящую из комбинации базисных двухканальных модулей.
Структура сложной сети может быть самой разной в зависимости от того, как сгруппированы между собой двухканальные модули. Рассмотрим первый грамматический уровень зрительного языка, аналогичный составлению слогов и морфем из букв речевого языка. Например, нейронная сеть цветового кодирования у позвоночных с трихроматическим зрением состоит из двух двухканаль-ных модулей, один из которых анализирует спектральный состав светового излучения и преобразует его в цветовой тон (хроматическая система цветового зрения), а другой анализирует интенсивность светового излучения и преобразует его в светлоту (ахроматическая система цветового зрения). У человека эти два модуля объединены в общую четырех-канальную сеть, в которой сохраняется взаимосвязь между каналами, выраженная уравнением 1 при n = 4 (рис. 2). Декодирование излучения в четырехканальной сети приводит к появлению в восприятии еще одной, дополнительной переменной в виде цветовой насыщенности (Измайлов, Соколов, Черноризов, 1989; Izmailov, Sokolov, 1990; 1992). Вероятно, это справедливо и для других высших позвоночных с трихроматическим зрением. В частности, у приматов обнаруживается способность к различению стимулов не только по цветовому тону и светлоте, но и по насыщенности (De Valois, 1973). В то же время у таких низших позвоночных, как травяная лягушка, указанные выше два модуля работают по отдельности, поэтому при различении гомогенных световых полей разного спектрального состава зрительная система лягушки не выделяет насы-
щенности цвета, а различает стимулы только по цветовому тону и светлоте (Черноризов, Зимачев, 2001). Таким образом, при анализе спектрального состава и интенсивности светового излучения зрительная система человека формирует три элемента зрительного алфавита, а зрительная система лягушки только два. В логике этих рассуждений зрительная система животных и людей с ахроматическим зрением (монохрома-тов) формирует при анализе этого же светового излучения только один элемент зрительного алфавита — светлоту.
Объединение двухканальных модулей в единое сферическое пространство означает формирование зрительного слога. При анализе существующих в феноменологии зрительного восприятия человека различных сочетаний этих трех элементов зрительного алфавита мы видим, что возможны только две комбинации. Первая состоит только из одного элемента — светлоты, а вторая всегда состоит из трех элементов — светлоты, насыщенности и цветового тона. Остальные (теоретически возможные) комбинации этих элементов зрительного алфавита в восприятии человека обычно отсутствуют. Это не значит, что восприятие других видов позвоночных с трихрома-тическим зрением также ограничено этими двумя комбинациями (хотя, скорее всего, так оно и есть). Просто при анализе зрительного восприятия человека мы можем обратиться к своему субъективному опыту, в котором не существует цвета и светлоты без насыщенности, или цвета без насыщенности и светлоты, или сочетания насыщенности и светлоты без
Рисунок 2
Блок-схема трехстадийной нейронной сети цветового зрения человека
Примечание. На первой стадии три типа рецепторов L, М, и Б экстрагируют интенсивность данного светового излучения в длинно-, средне- и коротковолновом участках видимого спектра. На следующей стадии эта информация передается на два двухканальных модуля, аналогичных по своему строению модулю, представленному на рис. 1б. Верхний модуль состоит из двух типов так называемых цветооппонентных (г^ и Ь-у) клеток зрительной системы и представляет хроматический механизм цветового зрения. Здесь формируется информация о цветовом тоне данного излучения. Нижний модуль состоит из неоппонентных световых и темновых (Ь- и ^ти-пов) клеток и представляет ахроматический механизм цветового зрения, в котором формируется информация о светлоте данного излучения. На третьей, детекторной стадии информация от ахроматического и хроматического механизмов интегрируется в виде активности селективного нейрона-детектора. Главная особенность нейронов-детекторов состоит в том, что коэффициенты преобразования сигнала у синапсов, связывающих каждый нейрон-детектор с двухканальны-ми модулями, подчиняются уравнению сферы (уравнение 1). Это обеспечивает селективность нейрона-детектора по отношению к множеству разнообразных излучений. Дополнительным фактором такой интеграции является формирование субъективной трехмерности цвета в виде цветового тона (хроматический модуль), светлоты (ахроматический модуль) и насыщенности (см.: Измайлов, Соколов, Черноризов, 1989).
цветового тона. В то же время возможность существования комбинации цветового тона и светлоты без насыщенности, которую мы предполагаем в зрении лягушки, вполне реальна. В этом случае серия цветов,
получаемых, например, смешением монохроматического излучения длиной волны 620 нм (чистый красный цвет) с широкополосным излучением, соответствующим излучению черного тела с температурой 6500 граду-
сов (чистый белый цвет), будет представлена в восприятии лягушки в виде оттенков только двух цветов — красного и белого (так, как будто «розового цвета» не существует). Этот же ряд смешанных цветов «разбивается» в восприятии человека на семь разных цветов — чистый красный, красно-розовый, розово-красный, розовый, розово-белый, бело-розовый и чистый белый.
Еще два элемента зрительного алфавита можно выделить по результатам экспериментов, описанным в работах Измайлова с соавт. (Измайлов и др., 1988; 2004; ^шаНоу, Боко-1оу, 1990). Этими элементами являются ориентация линии и угол между двумя линиями во фронтальной плоскости зрения. Необходимо отметить, что ориентация линии рассматривается здесь как ориентация границы, разделяющей зрительное поле на две части, и в таком виде этот стимул отличается от стимула, представляющего собой собственно линию как отрезок прямой (Измайлов и др., 2004). В работах Измайлова с соавт. (2003а, б) было показано, что для обоих типов стимулов (линия, простирающаяся через все зрительное поле с центром вращения в середине, и линия-отрезок, занимающая часть зрительного поля с центром вращения на одном конце отрезка) можно построить сферическую модель различения стимулов, представляющую типичный двухка-нальный механизм зрительной системы. Но в случае стимулов-ориен-таций этот механизм в точности соответствовал двухканальному механизму ахроматического зрения (Измайлов и др., 2004), а в случае стимулов-отрезков — двухканально-
му механизму хроматического зрения (Измайлов и др., 2003а, б).
«Субъективные пространства», аналогичные сферической модели различения ахроматических излучений, были получены и для стимулов, представляющих вариацию величины угла между двумя линиями-отрезками независимо от ориентации самих линий (Измайлов и др., 1988; ^шаПоу, Боко1оу, 1990). В терминах зрительного языка ориентация линии-границы и угол между двумя границами являются равноправными элементами зрительного алфавита, каждый из которых представлен в зрительной системе своим двухка-нальным модулем в соответствии с уравнениями 1 и 2.
Различение стимулов при одновременном изменении ориентации и величины угла приводит к активации нового варианта комбинации двух двухканальных модулей в общую сеть, который отличается от варианта комбинации хроматического и ахроматического модулей (Измайлов и др., 2004). Графически объединение этих модулей можно представить как пересечение двух евклидовых плоскостей в трехмерном пространстве (рис. 3), в котором одна сферическая координата представляет ориентацию угла во фронтальном поле зрения, а другая сферическая координата представляет величину угла. Трехмерность полученного решения (уравнение 1 при п=3) явилась следствием такого процесса объединения двух двухканальных модулей в общую сеть, при котором модуль ориентации вошел в сеть обоими каналами, а модуль величины угла — только одним каналом (Измайлов и др., 2003а, б).
Рисунок 3а
Блок-схема двухканальной нейронной сети детектирования ориентации (вверху) и аналогичная блок-схема двухканальной нейронной сети детектирования величины угла (внизу)
Примечание. Блок В-Г представляет канал для кодирования ориентации по шкале «вертикаль — горизонталь», а блок Л-П — канал для детектирования ориентации по шкале «право—лево».
Примечание. Блок О-Т представляет оппонентный канал для кодирования величины угла по шкале «острый—тупой», а блок П — неоппонентный канал для детектирования прямых углов.
Рисунок 3б
Блок-схема нейронной сети различения углов
Л - П
В - Г
Величина угла по
шкале «острый — тупой»
Рецепторы
Оппонентные каналы
Детекторы ф) угла
Примечание. Блок-схема нейронной сети различения углов, которая состоит из двух двухка-нальных модулей (рис. 3а) — детекции ориентации и детекции величины угла. В данной сети эти два модуля соединяются таким образом, что образуется трехканальная сеть.
Заключение
Предлагаемый подход к анализу структуры зрительного восприятия по аналогии с анализом структуры языка опирается на обнаруженную нами дихотомию геометрических моделей, репрезентирующих субъективные пространства различения зрительных стимулов. Два класса таких моделей — сферические пространства с евклидовой метрикой и неметрические категориальные пространства различения — мы связываем с двумя «образующими» языка: алфавитом (включая слоги) и словами (включая морфемы).
Рассмотренные в работе элементы зрительного алфавита, конечно, не исчерпывают его в целом, но в первом приближении позволяют
указать на некоторые характерные свойства этих элементов. В частности, все выделенные нами зрительные буквы (цветовой тон, светлота, насыщенность, ориентация световой границы и величина угла между границами) совершенно адекватны для детектирования сетчаткой позвоночных в том виде, как она реально устроена. При этом можно предполагать, что в число элементов зрительного алфавита могут быть включены и другие формы пространственного и временного распределения энергии светового излучения в поле зрения, представленные в виде направления и скорости движения, градиента текстуры и др. Дополнительными аргументами в пользу такого обобщения могут служить результаты нейрофизиологических исследований
зрительной системы кошки (Вайткя-вичус и др., 2006).
«Снимая» с сетчатки задачу формирования высококачественного (с фототехнической точки зрения) изображения, мы не предполагаем, что эта задача просто «перекладывается» на нейроны латерального коленчатого тела или проекционной области зрительной коры. Реально здесь продолжается та же самая работа (начатая в сетчатке) по формированию первичных элементов зрительного языка — букв и слогов. Результаты этой работы представлены нейронами с простыми, сложными и сверхсложными рецептивными полями, специфицированными Д. Хьюбе-лом и Т. Визелем в зрительной коре высших позвоночных. Приведенные выше примеры организации зрительных слогов из букв зрительного алфавита в виде комбинации нескольких двухканальных модулей в более сложную нейронную сеть показывают, что с точки зрения эффективности (затраченного времени, числа последовательных операций) процессы формирования и букв, и слогов представляют собой процессы одного и того же порядка. Нейронные сети, формирующие букву зрительного алфавита (ориентация границы) или трехбуквенный слог (цвет, насыщенность, светлота), хотя и отличаются числом каналов, содержат три одинаковых звена, составляющих такую сеть и определяющих число моноси-наптических преобразований в сети: широкополосные рецепторы, оппо-нентные широкополосные нейроны и селективные нейроны-детекторы. Именно поэтому временные характеристики клеток с простыми, сложными и сверхсложными рецептивными
полями не различаются по своим временным характеристикам (Singer et al., 1975; Супин, 1981). Эти нейрофизиологические данные крайне затрудняют построение вычислительной теории иерархического типа, зато хорошо согласуются с языковой концепцией восприятия. В соответствии с последней сложность структурных единиц языка (букв, слогов, морфем или слов) никак не связана прямо с количеством элементов носителя (числом линий, из которых состоит буква или слог письменной речи, или числом звуков или фонем в устной речи). Точно так же сложность зрительной языковой единицы не связана с числом каналов или числом селективных детекторов, входящих в нейронную сеть, осуществляющую функцию носителя языковой единицы.
Еще один вопрос, который не получает ответа в традиционном понимании зрительной системы как механизма извлечения и передачи в центр информации, содержащейся в окружающем мире, состоит в том, как мы видим один и тот же предмет, одну и ту же фигуру, при радикально различающихся распределениях излучения на сетчатке. Речь идет не только о проблеме константности зрительного восприятия, но и о более общем случае, который в гештальт-теории формулировался как «закон перцептивной организации». На примере рассмотренных случаев образования сложной сети путем комбинации двухканальных модулей (Izmailov, So-kolov, 1990; 1992; 2004; Измайлов и др., 2003а, б) мы видим, что ни в строении самой нейронной сети, ни в информационных характеристиках объекта (светлота, ориентация, величина
угла) не содержится «указания» на какой-то общий принцип соединения отдельных модулей в более сложную многомерную сеть, как это предусматривается в иерархических теориях зрительного восприятия. Арнхейм так сформулировал понимание неэффективности простой иерархической модели восприятия: «По-видимому, рассматривать видение как переход от частного к общему сегодня уже невозможно. Напротив, становится все более очевидным, что первичными данными восприятия являются общие структурные особенности воспринимаемого объекта, поэтому обобщенное представление о треугольнике не есть последний результат интеллектуальной абстракции, а является непосредственным элементарным опытом, более простым, чем регистрация индивидуальных деталей» (Арн-хейм, 1974, с. 19).
Этот вопрос проясняется в языковой концепции восприятия. В речевом языке (письменной речи) невозможно объяснить, почему три линии, расположенные одним (именно таким, а не другим) образом на бумаге, представляют букву А, а другим — букву П или почему три буквы Л, М
и О в одной последовательности образуют слово МОЛ, в другой — слово ЛОМ, а в третьей — ЛМО — не образуют слова. Ответа на этот вопрос нет ни в свойствах носителя (графических изображений букв и слогов), ни в информационных свойствах букв и слогов как базисных единиц речи. Ответ находится в природе самого языка. Только зная язык, можно сказать, какие графические формы являются информационными единицами данного языка, а какие нет. Точно так же в зрительном восприятии проблематичным представляется поиск общих принципов организации нейронов в сложные сети, исходя только из электрических или химических характеристик «мозговых единиц», чтобы они собой ни представляли — нейронные ансамбли, отдельные нейроны, синапсы, белковые молекулы или гены.
Только расшифровав язык зрительного восприятия, мы сможем понять принципы организации мозговых элементов в информационные единицы, а информационных единиц — в зрительные категории, т. е. в предметные образы, формирование которых и составляет суть процессов зрительного восприятия.
Литература
Арнхейм Р. Искусство и визуальное восприятие. М.: Прогресс, 1974.
Бонгард М. Проблема узнавания. М.: Наука, 1967.
Вайткявичус Г. Г., Соколов Е.Н., Ша-тинскас Р. и др. Кодирование параметров движения стимулов в зрительной системе кошки // Журнал ВНД. 2006 (в печати).
Веккер Л.М. Психические процессы. Л.: Изд-во ЛГУ, 1974. Т. 1.
Выготский Л.С. Мышление и речь. М.: Соцекгиз, 1934.
Гибсон Дж. Экологический подход к зрительному восприятию. М.: Прогресс, 1988.
Глезер В.Д. Зрение и мышление. Л.: Наука, 1985.
Грегори Р. Разумный глаз. М.: Мир, 1972.
Измайлов Ч.А., Ласточкина М.Н, Полянская Г.Н., Соколов Е.Н. Различение линий и углов зрительной системой // Вестник МГУ. Сер. 14. Психология. 1988. № 1. С. 41-50.
Измайлов Ч.А., Соколов Е.Н., Черноризов А.М. Психофизиология цветового зрения. Изд-во МГУ, 1989.
Измайлов Ч.А., Соколов Е.Н., Сукрет-ная Л.М, Шехтер Л.М. Семантическое пространство искусственных цветовых названий // Вестник МГУ. Сер. 14. Психология. 1992. № 1. С. 3-14.
Измайлов Ч.А., Исайчев С.А., Коршунова С.Г., Соколов Е.Н. Цветовой и яр-костный компоненты зрительных вызванных потенциалов у человека // Журнал ВНД. 1998. Т. 48. № 5. С. 777-787.
Измайлов Ч.А., Соколов Е.Н., Коршунова С.Г. Цветовое пространство человека, основанное на данных корковых вызванных потенциалов // Сенсорные системы. 2003. Т. 17. № 1. С. 32-44.
Измайлов Ч.А., Соколов Е.Н., Коршунова С.Г., Кадик А.А. Семантический компонент вызванного потенциала различения // Психология. Современные направления междисциплинарных исследований / Под ред. А.Л. Журавлева и Н.В. Тарабриной. М.: Изд-во ИП РАН, 2003а. С. 295-308.
Измайлов Ч.А., Соколов Е.Н., Коршунова С.Г., Чудина Ю.А. Геометрическая модель различения ориентаций линии, основанная на субъективных оценках и зрительных вызванных потенциалах // Журнал ВНД. 20036. Т. 54. № 2. С.267-279.
Измайлов Ч.А., Чудина Ю.А. Конфигурационные и категориальные характеристики зрительного восприятия схематических фигур // Вестник РУДН. 2005. Т. 2. С. 27-41.
Кант И. Критика чистого разума. М.: Наука, 1999.
Кейдель В.Д. Физиология органов чувств. М.: Медицина, 1975.
Кэндел Э. Клеточные основы поведения. М.: Мир, 1980.
Линдсей П., Норман А. Переработка информации у человека. М.: Мир, 1974.
Логвиненко А.Д. Зрительный образ и инвертированное зрение // Вопросы психологии. 1974. № 5. С. 19-28.
Лурия А. Р. Язык и мозг // Вопросы психологии. 1974. № 1. С. 49-60.
Максимов В.В. Трансформация цвета при изменении освещения. М.: Наука, 1984.
Парамей Г.В., Измайлов Ч.А., Бабина В.С. Эмоционально-экспрессивные характеристики схематического лица на дисплее компьютера. // Вестник МГУ. Сер. 14. Психология. 1992. № 3. С. 30-38.
Рок И. Введение в зрительное восприятие. М.: Педагогика, 1980.
Сомьен Дж. Кодирование сенсорной информации. М.: Мир, 1975.
Соколов Е.Н., Вайткявичус Г.Г. Ней-роинтеллект. М.: Наука, 1989.
Соколов Е.Н., Измайлов Ч.А., Завго-родняя В.Л. Многомерное шкалирование знаковых конфигураций // Вопросы психологии. 1985. № 1. С. 131-140.
Супин А.Я. Нейрофизиология зрения млекопитающих. М.: Наука, 1981.
Терехина А.Ю. Анализ данных методом многомерного шкалирования. М.: Наука, 1986.
Уинстон П.П. Компьютерное зрение. Психология машинного зрения. М.: Мир, 1978.
Фомин С.В., Соколов Е.Н., Вайткявичус Г.Г. Искусственные органы чувств. М.: Наука, 1979.
Фрумкина Р.М., Михеев А.Б., Терехи-на А.Ю. Экспериментальное изучение семантических отношений в группе
слов-цветообозначений. М.: Изд-во ИРЯ АН СССР, 1982.
Циммерман М. Сенсорная система в свете теории информации // Шмидт Р. Основы сенсорной физиологии. М.: Мир, 1984. С. 78-91.
Цоколов С. Дискурс радикального конструктивизма. Мюнхен: PHREN, 2000.
Черноризов А.М. Цветовое зрение рыбы как модель цветового зрения человека. // Вестник МГУ. Сер. 14. Психология. 1995. № 4. С. 35-45.
Черноризов А.М. Нейронные механизмы цветового зрения: Автореф. дис. ... д-ра. психол. наук. М.: МГУ, 1999.
Черноризов А.М., Соколов Е.Н. Векторный принцип кодирования информации о цвете в слое биполярных клеток сетчатки карпа // Вестник МГУ. Сер. 14. Психология. 2001. № 1. С. 1-34.
Черноризов А.М., Зимачев М.М. Структура пространства цветоразличе-ния лягушки в разные периоды ее сезонной активности // Вестник МГУ. Сер. 14. Психология. 2001. № 2. С. 12-32.
Шевелев И.А., Каменкович В.М., Ша-раев Г.А. Относительное значение линий и углов геометрических фигур для их опознания человеком // Журнал ВНД. 2000. Т. 50. С. 403-409.
Шехтер Л.М. Зрительные механизмы формирования категориальных структур: Автореф. дис. ... канд. психол. наук. М.: МГУ, 2004.
Шифман Х. Ощущение и восприятие. СПб.: Питер, 2003.
Ярбус А.Л. Роль движений глаз в процессе зрения. М.: Наука, 1965.
Fucushima K, Miyake S. Neurocogni-tron: a new algorithm for pattern recognition tolerant of deformations and shifts in position // Pattern Recognition. 1982. Vol. 15. № 6. P. 455-469.
Gregory R.L. Cognitive contours. Nature. 1972. Vol. 238. P. 51-52.
Gouras P., Zrenner E. Color vision: A review from neurophysiological perspective // I. Autrum, D. Ottoson, E.R. Perl, R.F Schmidt. (eds.). Progress in sensory physiology. 1981. Vol. 1. P. 139-179.
Hirsch H.V.B., Spinelly D.N. Visual perception in cat after environmental surgery. // Exp. Brain Res. 1972. Vol. 15. P. 405-423.
Hubel D.N., Wiesel T.N. Sequence regularity and geometry of orientation columns in the monkey striate cortex // J. Comper. Neurol. 1974. Vol. 158. P. 267-294.
Izmailov Ch.A, Sokolov E.N. Multidimensional scaling of lines and angles discrimination // Psychophysical Explorations of Mental Structures / H.G. Geissler (ed.). Toronto-Bern-Stuttgart: Hogrefe and Huber Publishers, 1990. P. 181-189.
Izmailov Ch.A, Sokolov E. N. A semantic space of color names // Psychological Science. 1992. Vol. 3. № 2. P. 105-111.
Izmailov Ch. A., Sokolov E.N. Subjective and Objective Scaling of Large Color Differences // Psychophysics beyond sensation. Laws and Invariants of human Cognition. / C. Kaernbach, E. Schroger, H. Muller (eds.). Lawrence Erlbaum Associates: Mahwah, New Jarsy, London, 2004. P. 27-42.
Jung R. Visual perception and neurophysiology. // Handbook of Sensory Physiology / R.Jung (ed.). New York: Acad. Press, 1973. Vol. VII/3. P. 3-152.
Riggs L.A., Rutliff F, Cornsweet J.C., Cornsweet T.N. The disappearance of steadily-fixated objects // J. Opt. Soc. Am. 1953. Vol. 43. P. 495-501.
Roth G. Gehirn und Selbstorganisation // W. Krohn, G. Kuppers (eds.). Selbstorganisation. F. Vieweg und Sohn, 1992. P. 167-180.
Rock I., Halper F. Form perception without retinal image // J. of Psych. 1969. Vol. 82. P. 425-440.
Rock I., Sigman E. Intelligence factors in the perception of form through of moving split Perception. 1973. Vol. 2. P. 357-369.
Shepard R.N. Towards a universal law of generalization for psychological space // Science. 1987. Vol. 237. P. 1317-1323.
Shepard R.N. Perceptual-cognitive universals as reflections of the world // Behavioral and brain sciences. 2001. Vol. 24. P. 581-601.
Shevelev IA., Lazareva NA, Sharaev GA. Interrelation of tuning characteristics to bar, cross and corner in striate neurons // Neuroscience. 1999. Vol. 88. P. 17-25.
Singer W., Tretter F., Cynader M. Organisation of cat striate cortex. A correlation of receptive-field properties with afferent and efferent connections // J. of Neurophysiology. 1975. Vol. 38. P. 1080-1098.
Stratton G.M. Vision without inversion of the retinal image // Psychological Review. 1897. Vol. 4. P. 341-360.
Van Ooyen A., Nienhuis B. Pattern recognition in the Neurocognitron is impro-
ved by neuronal adaptation // Biological Cybernetics. 1993. Vol. 70. P. 47-53.
Valois de R. L. Central mechanisms of color vision // R.Jung (ed.). Handbook of sensory physiology. 1973. Vol. VII. Pt 3.
Valois de R.L., Valois de K.K. Neural coding of color // Handbook of Perception. Seeing. N.Y., 1975. Vol. 5. P. 117-166.
Wiesel T.N., Hubel D.N. Ordered arrangement of orientation columns in monkeys lacking visual experience //J. Comp. Neurol. 1974. Vol. 158. P. 307-318.
Wyszecki G., Stiles W.S. Color science: concepts and methods, quatitative data ad formulae. N.Y.: Wiley, 1982.
Zeki S. The representation of colours in the cerebral cortex // Nature. 1980. Vol. 284. P. 412-418.
Zrenner E. Neurophysiological Aspects of Colour Vision in Primates. Berlin: Springer Verlag, 1983.