Научная статья на тему 'Механизмы влияния категориальной информации на зрительный поиск'

Механизмы влияния категориальной информации на зрительный поиск Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
251
40
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЗРИТЕЛЬНЫЙ ПОИСК / КАТЕГОРИИ / ВНИМАНИЕ / ВОСХОДЯЩИЕ ПРОЦЕССЫ / НИСХОДЯЩИЕ ПРОЦЕССЫ / VISUAL SEARCH / CATEGORIES / ATTENTION / TOP-DOWN PROCESSES / BOTTOM-UP PROCESSES

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Морозов Максим Игоревич, Спиридонов Владимир Феликсович

В статье рассматривается вопрос о том, каким образом категориальная принадлежность объектов влияет на зрительный поиск. Для того чтобы сопоставить между собой механизмы влияния категориальной информации, описанные в существующих экспериментальных парадигмах, мы выделили два параметра: доступность категориальной информации и форму ее репрезентации. Параметр доступности описывает временной аспект: на каком этапе выполнения задачи поиска испытуемому доступна категориальная информация об объектах. Она может быть доступна либо в процессе поиска, либо на этапе предварительной демонстрации цели. Второй параметр это форма репрезентации категориальной информации в задаче поиска. Она может быть репрезентирована непосредственно в виде информации о категориальной принадлежности объекта или опосредованно через зрительные признаки объектов. Проведенный нами анализ литературы показывает следующие закономерности. Если категориальная информация доступна только на этапе демонстрации цели и репрезентирована опосредованно через зрительные признаки, ее влияние сводится к тому, что актуализируется прототип целевой категории и его зрительные признаки формируют образ цели. Если испытуемым доступна категориальная принадлежность не только цели, но и всей сцены, это помогает выделить релевантные зоны для поиска. А дополнительное знание категориальной принадлежности дистракторов при поиске в естественных сценах привлекает внимание испытуемых к объектам, категориально сходным с целью. И наконец, если информация о категориальной принадлежности объектов доступна испытуемым в процессе поиска и репрезентирована непосредственно, то она оказывает большее влияние на направление нашего внимания, чем зрительные признаки объектов. Таким образом, можно сделать вывод о том, что механизм влияния категориальной информации на зрительный поиск зависит от доступности категориальной информации и от формы ее репрезентации. И чем больше категориальной информации доступно испытуемым, тем большее влияние на процесс зрительного поиска она оказывает.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Морозов Максим Игоревич, Спиридонов Владимир Феликсович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The mechanisms of categorical influences on visual search

In this article, we consider the issue of categorical influences on visual search performance. In order to compare the mechanisms of such influences, described in modern paradigms, we use two parameters: the accessibility of categorical information and the form of its representation. The parameter of accessibility concerns the temporal aspect: on which stage of a search task the participants have access to the categorical information. This information could be available during a search task or before it during the target presentation stage. The second parameter is a form of representation of categorical information. It could be represented directly as categorical knowledge, or indirectly by an object’s visual features. Our analysis shows the following: If categorical information is available only at the target demonstration stage and represented indirectly by visual features, then it influences visual search by recalling a prototype of a target category, the visual features of which then form a search template. If a category of a scene is also available, then it helps to choose the most relevant zones in a scene for search. Additional information of distractors’ categories will draw participants’ attention to the objects which are categorically similar to a target. Finally, if categorical information is available directly during the search stage, it influences our attention more than visual features. Therefore, we conclude that the mechanism of categorical influences on visual search depends on the amount of categorical information available to a participant. The more categorical information of objects and a scene is available to participants, the more it influences visual search performance.

Текст научной работы на тему «Механизмы влияния категориальной информации на зрительный поиск»

УДК 159.952.13

Вестник СПбГУ Психология. 2019. Т. 9. Вып. 3

Механизмы влияния категориальной информации на зрительный поиск*

М. И. Морозов1,2, В. Ф. Спиридонов2

1 Московская высшая школа социальных и экономических наук (Шанинка), Российская Федерация, 119571, Москва, пр-т Вернадского, 82, корп. 2

2 Российская академия народного хозяйства и государственной службы при Президенте Российской Федерации,

Российская Федерация, 119571, Москва, пр-т Вернадского, 82, стр.1

Для цитирования: Морозов М. И., Спиридонов В. Ф. Механизмы влияния категориальной информации на зрительный поиск // Вестник Санкт-Петербургского университета. Психология.

2019. Т. 9. Вып. 3. С. 280-294. https://doi.org/10.21638/spbu16.2019.305

В статье рассматривается вопрос о том, каким образом категориальная принадлежность объектов влияет на зрительный поиск. Для того чтобы сопоставить между собой механизмы влияния категориальной информации, описанные в существующих экспериментальных парадигмах, мы выделили два параметра: доступность категориальной информации и форму ее репрезентации. Параметр доступности описывает временной аспект: на каком этапе выполнения задачи поиска испытуемому доступна категориальная информация об объектах. Она может быть доступна либо в процессе поиска, либо на этапе предварительной демонстрации цели. Второй параметр — это форма репрезентации категориальной информации в задаче поиска. Она может быть репрезентирована непосредственно в виде информации о категориальной принадлежности объекта или опосредованно через зрительные признаки объектов. Проведенный нами анализ литературы показывает следующие закономерности. Если категориальная информация доступна только на этапе демонстрации цели и репрезентирована опосредованно через зрительные признаки, ее влияние сводится к тому, что актуализируется прототип целевой категории и его зрительные признаки формируют образ цели. Если испытуемым доступна категориальная принадлежность не только цели, но и всей сцены, это помогает выделить релевантные зоны для поиска. А дополнительное знание категориальной принадлежности дистракторов при поиске в естественных сценах привлекает внимание испытуемых к объектам, категориально сходным с целью. И наконец, если информация о категориальной принадлежности объектов доступна испытуемым в процессе поиска и репрезентирована непосредственно, то она оказывает большее влияние на направление нашего внимания, чем зрительные признаки объектов. Таким образом, можно сделать вывод о том, что механизм влияния категориальной информации на зрительный поиск зависит от доступности категориальной информации и от формы ее репрезентации. И чем больше категориальной информации доступно испытуемым, тем большее влияние на процесс зрительного поиска она оказывает. Ключевые слова: зрительный поиск, категории, внимание, восходящие процессы, нисходящие процессы.

* Статья подготовлена в рамках исследовательского гранта ОАНО МВШСЭН (Шанинка). © Санкт-Петербургский государственный университет, 2019

Введение

Зрительный поиск изучается в когнитивной психологии почти с самого ее основания. Это модельная задача для изучения внимания: чтобы найти целевой объект, испытуемому необходимо выделить релевантную информацию среди нерелевантной. Также это экологически валидная задача — в обычной жизни люди очень часто занимаются зрительным поиском.

Результаты многочисленных экспериментов показали, что для того, чтобы найти цель, наше внимание использует зрительные признаки объектов (цвет, форму, угол наклона и т. п.) [1]. Однако когда исследователи попытались с помощью этого механизма объяснить, как выполняется зрительный поиск в реальной жизни, они столкнулись с большими трудностями. Зрительный поиск в повседневной жизни и в лаборатории устроены по-разному. В лаборатории поиск изучается на перцептивно простом стимульном материале: линиях, простых геометрических формах и т. п. Перед каждой пробой (в исследованиях последовательного поиска) испытуемым предъявляют целевой объект. Это делает его зрительные признаки доступными в процессе поиска. В отличие от лабораторных условий в реальной жизни объекты состоят из большого количества зрительных признаков. Более того, не все зрительные признаки доступны для восприятия, так как объекты могут перекрывать друг друга или быть расположены таким образом, что их отличительные зрительные признаки не будут видны. И наконец, когда мы ищем объект в реальной жизни, зачастую мы знаем только то, к какой категории он относится. Мы можем не знать, как именно выглядит искомый объект, так как представители целевой категории могут выглядеть по-разному [2]. Таким образом, когда мы ищем объект не в рамках лабораторного эксперимента, его зрительные признаки зачастую нам недоступны либо из-за внешних условий восприятия, либо потому, что мы их просто не знаем. Если описывать механизм поиска, постулируя, что внимание использует только зрительные признаки объектов (как было установлено в лабораторных экспериментах), возникает следующая проблема. В исследовании испытуемые знают, из каких зрительных признаков состоит цель поиска, и успешно ее находят. При зрительном поиске в экологически валидных условиях люди не знают, какие зрительные признаки присущи цели, но все равно успешно ее находят. Чтобы объяснить это противоречие, было выдвинуто предположение, что не только зрительные признаки, но и другая информация об объектах — семантическая, категориальная, фонетическая — может быть использована, чтобы найти целевой объект. Однако роль категориальной информации в управлении вниманием будет рассматриваться принципиально по-разному в зависимости от подхода, которого придерживаются исследователи.

На материале рассматриваемой нами проблемы продолжается давний спор о том, могут ли разные когнитивные процессы влиять на работу друг друга. Сторонники модульного подхода, который идет еще от работ Дж. Фодора (Fodor) [3], считают, что когнитивные процессы не могут вмешиваться в работу друг друга. Доступными могут быть только результаты того или иного процесса, но сам ход его работы не зависит от других когнитивных процессов. Согласно модульному подходу, высокоуровневая информация об объекте (например, его категория) не может влиять на его перцептивную заметность. Перцептивная заметность зависит

только от зрительных признаков объектов. И даже если категориальная информация будет доступна в процессе зрительного поиска, она не будет оказывать непосредственного влияния на его выполнение.

Сторонники идеи когнитивной проницаемости (cognitive penetrability) [4], наоборот, считают, что когнитивные процессы могут вмешиваться в работу друг друга. Они могут влиять на сам ход работы других когнитивных процессов, а не только пользоваться их результатами. Поэтому знание дополнительной высокоуровневой информации об объектах должно влиять на работу внимания в процессе зрительного поиска и даже на перцептивную заметность объектов.

Таким образом, сторонники идеи когнитивной проницаемости отводят высокоуровневой информации более самостоятельную роль в управлении вниманием при зрительном поиске, тогда как сторонники модульного подхода считают, что она не может оказывать непосредственного влияния на низкоуровневые процессы.

В данном обзоре мы подробно рассмотрим влияние категориальной информации об объектах на зрительный поиск. Под категориальной информацией мы будем понимать принадлежность объектов к определенному классу, а также репрезентацию этого класса в нашей когнитивной системе.

Изучение того, как категориальная информация влияет на зрительный поиск, сопряжено с двумя сложностями. Первая связана с доступом к категориальной информации в процессе поиска. Считается, что категориальная принадлежность объекта становится доступна испытуемым только на поздних этапах обработки информации — позже, чем его зрительные признаки. Также для ее обработки необходима фиксация объекта взором и его распознавание. Многие задачи поиска могут быть выполнены до того, как категориальная информация об объектах будет обработана. Чтобы оказывать влияние на зрительный поиск, категориальная информация должна быть доступна испытуемым в процессе выполнения задачи поиска.

Вторая сложность связана с формой репрезентации категориальной информации в процессе поиска. Если она репрезентирована как категориальная принадлежность объектов, то неясно, как она может оказывать влияние на зрительный поиск. В большинстве современных моделей зрительного поиска постулируется, что поиск цели осуществляется по ее зрительным признакам [5; 6]. Так, Г. Зелински (Ze-linsky) и коллеги [7] считают, что для того чтобы найти цель, зрительные признаки объектов сличаются с репрезентацией цели в рабочей памяти, которая содержит только ее зрительные признаки. А значит, чтобы выявить роль категориальной информации в зрительном поиске, необходимо установить, в какой форме эта информация репрезентирована в ходе решения задачи поиска. Может ли категориальная информация влиять на процесс поиска, если она репрезентирована непосредственно в виде категориальной принадлежности объектов, и как она взаимодействует с репрезентацией зрительных признаков объектов?

Наличие этих сложностей привело к тому, что сторонники влияния категориальной информации на зрительный поиск стремились доказать его существование: оно имеет место независимо от зрительных признаков объектов. Их критики, напротив, стремились показать, что полученные эффекты можно объяснить исключительным использованием зрительных признаков объектов, а обработка категориальной информации и ее влияние на направление внимания в процессе

поиска — это излишнее допущение. По этой причине в литературе нет общего понимания того, как категориальная информация влияет на выполнение зрительного поиска. Чтобы соотнести между собой механизмы такого влияния, описанные в разных парадигмах, мы выделили два параметра. Они заключают в себе все возможные варианты преодоления сложностей в описании влияния категориальной информации на зрительный поиск, которые мы рассматривали выше.

Первый параметр — то, в какой момент в задаче зрительного поиска становится доступной категориальная информация об объектах. Она может быть доступна либо в процессе поиска — обрабатываться и оказывать влияние на направление нашего внимания в режиме bottom-up, либо только на этапе предварительной демонстрации цели. В таком случае она будет влиять на направление нашего внимания в процессе поиска в режиме top-down.

Второй параметр — это форма репрезентации категориальной информации в задаче поиска. Она может быть репрезентирована непосредственно в виде информации о категориальной принадлежности объекта или опосредованно через зрительные признаки объектов.

Таким образом, можно выделить четыре возможных варианта соотношения выделенных параметров (табл. 1).

Таблица 1. Варианты формы репрезентации категориальной информации и степени ее доступности, реализованные в описываемых парадигмах

Доступ ность категориальной информации

— При демонстрации цели При поиске

Форма репрезентации категориальной информации Опосредованно Категориальный зрительный поиск Исследования зрительного поиска в естественных сценах (Хендерсон)

Непосредственно — Парадигма видимого мира, исследования зрительного поиска в естественных сценах (Помплун)

Первый вариант: категориальная информация доступна только на этапе демонстрации цели и репрезентирована опосредованно через зрительные признаки объектов. Такой вариант представлен в парадигме категориального зрительного поиска.

Второй вариант: категориальная информация доступна только на этапе демонстрации цели и репрезентирована непосредственно в виде категориальной принадлежности целевого объекта. Такой вариант не реализован ни в одной из известных нам экспериментальных парадигм. И мы считаем, что при таком варианте категориальная информация вряд ли может оказывать влияние на зрительный поиск. Испытуемые будут знать только категорию целевого объекта, но не будут знать категориальную принадлежность дистракторов, а также то, как должен выглядеть целевой объект.

Третий вариант: категориальная информация доступна при выполнении самой задачи поиска и репрезентирована опосредованно через зрительные признаки объектов. Такой вариант представлен в модели Хендерсона (Henderson) и коллег [8].

Четвертый вариант: категориальная информация доступна при выполнении самой задачи поиска и репрезентирована непосредственно в виде категориальной принадлежности объекта. Такой вариант представлен в парадигме видимого мира, а также в исследованиях зрительного поиска в естественных сценах М. Помплуна (Pomplun) и коллег [9]. Далее мы подробно рассмотрим каждую из названных парадигм и механизм влияния категориальной информации на зрительный поиск, который в них реализован, а также сопоставим их между собой. В этом заключается цель нашего обзора.

Парадигма категориального зрительного поиска

Эта парадигма создавалась для того, чтобы изучить, как происходит поиск объекта, когда мы знаем только его категорию. Стандартная схема исследования в этом случае выглядит следующим образом: испытуемого просят найти представителя целевой категории, например плюшевого мишку, среди других повседневных объектов. Все предметы предъявляются на экране компьютера. В рамках данной парадигмы Зелински и коллеги, одни из наиболее влиятельных исследователей в этой области, изучали, как устроена репрезентация цели в процессе категориального поиска, входит ли в нее информация о категориальной принадлежности цели. Результаты проведенных ими исследований свидетельствуют о том, что репрезентация цели в данной задаче состоит только из ее зрительных признаков и не включает категориальную информацию. Так, Зелински и коллеги показали, что поиск представителя базовой категории происходит успешнее, чем представителя суперординатной категории [10]. В их исследовании цель поиска задавалась либо абстрактным описанием (обувь), либо конкретным (берцы). И испытуемые находили берцы быстрее, чем обувь. Использованные в эксперименте два варианта категориального описания цели различались по количеству зрительных признаков объекта, но оба сообщали категориальную принадлежность объекта. Обнаруженные различия в успешности поиска авторы объясняют следующим образом: чем больше конкретных зрительных признаков объекта можно извлечь из описания цели, тем успешнее будет ее поиск, так как наше внимание для поиска объекта опирается именно на его зрительные признаки, а не на категориальную принадлежность как таковую.

В другом исследовании Зелински и коллеги [11] показали, что, если цель задается одной и той же категорией, но варьируется типичность целевых объектов, которые предъявлены на экране поиска, испытуемые находят высокотипичного представителя целевой категории быстрее, чем низкотипичного. Например, если испытуемых просят найти топор, поиск эффективнее всего в том случае, когда в качестве целевого объекта используется изображение топора для колки дров, а не секиры. И высокотипичные, и низкотипичные представители целевой категории относятся к категории «топоры», но различаются по количеству зрительных признаков, общих с прототипом данной категории. Здесь, так же как и в предыдущем исследовании, авторы считают, что именно на зрительные признаки объектов опи-

рается наше внимание в процессе поиска. Поэтому чем больше зрительных признаков делят между собой прототип целевой категории, актуализирующийся в долговременной памяти испытуемого при демонстрации цели, тем успешнее поиск. Также Зелински и коллеги [5] показали, что наличие дистракторов, перцептивно схожих с целью, мешает поиску, а наличие категориально сходных с целью дис-тракторов — нет.

Описанные выше эксперименты, по мнению Зелински и коллег, свидетельствуют о том, что роль категориальной информации в управлении вниманием в задачах на категориальный зрительный поиск минимальна. Результаты проведенных ими экспериментов демонстрируют, что именно зрительные признаки объектов, а не их категориальная принадлежность управляют вниманием испытуемых в процессе поиска. Эти зрительные признаки, по мнению авторов, извлекаются из долговременной памяти. На этапе демонстрации цели у испытуемых актуализируется прототип заданной категории. Зрительные признаки, извлеченные из данного прототипа, формируют репрезентацию цели в процессе поиска. А значит, чем больше предъявленный объект перцептивно сходен с прототипом категории и чем больше зрительных признаков можно извлечь из категориальной информации на этапе демонстрации цели, тем успешнее будет поиск. В этом и заключается механизм влияния категориальной информации. В этой задаче категориальная информация обрабатывается и влияет на поиск на этапе демонстрации цели, то есть еще до начала выполнения самой задачи поиска. И она репрезентирована не напрямую, а опосредованно через зрительные признаки целевого объекта. Мы можем зафиксировать влияние категориальной информации только в описанном виде, так как в этой парадигме объекты в каждой пробе никак не связаны между собой. Их категориальная принадлежность ничего нам не сообщает об их местоположении. Внимание направляют зрительные признаки целевого объекта. Их категориальная принадлежность обрабатывается только после фиксации взора непосредственно на объекте, а значит, ее обработка избыточна для нахождения цели.

Исследования зрительного поиска в естественных сценах

В естественных сценах объекты расположены не случайным образом. Они взаимосвязаны между собой, и наиболее вероятное положение конкретного объекта в сцене связано с его категориальной принадлежностью. Картины висят на стенах, а не на потолке или не лежат на полу. Посуда чаще всего стоит на кухне, а не на подоконнике и не в книжном шкафу. Благодаря доступности информации о взаимосвязи объектов в сцене, которая может быть извлечена из их категориальной принадлежности, влияние категориальной информации на зрительный поиск в естественных сценах будет иным, нежели в парадигме категориального зрительного поиска.

Для изучения зрительного поиска в естественных сценах могут использоваться изображения помещений (комнат, залов и т. п.) или же открытых пространств (улиц, пляжей и т. п.). Испытуемых просят найти определенный объект в предъявленной сцене. Цель поиска задается категориально. В качестве зависимых переменных используется время поиска и анализируются движения глаз испытуемых — строится «тепловая» карта.

Анализ движения глаз испытуемых при поиске представителя заданной категории в естественных сценах показывает, что испытуемые направляют свое внимание в ту область изображения, где наиболее вероятно встречаются представители заданной категории. Так, если необходимо найти картину в комнате, испытуемые будут обследовать среднюю часть изображения, где обычно расположены стены. Идентификация самого изображения комнаты происходит очень быстро, что было продемонстрировано во многих исследованиях в парадигме ИБУР (Парадигма для изучения временных аспектов внимания. Испытуемым необходимо найти цель среди последовательно быстро предъявляемых объектов) [12]. Однако большинство авторов считают, что опознание сцены происходит за счет обработки ее зрительных статистик, состоящих из элементарных зрительных признаков, например распределения вертикальных линий, составляющих предметы на изображении, наклоненные под определенным углом. Эти зрительные статистики сличаются с хранящимися в памяти паттернами статистик, характерными для определенной категории изображений, например для изображений улиц. Сопоставление паттерна статистик предъявленного изображения и паттернов, хранящихся в памяти, приводит к отнесению изображения к определенной категории. В то же время категориальная информация о цели поиска также актуализирует в нашей долговременной памяти паттерны зрительных статистик, среди которых данный объект встречается наиболее вероятно. В область изображения, содержащую схожий паттерн статистик, и будет направлено внимание испытуемых. Далее в рамках приоритетной области поиска испытуемый обследует объекты, опираясь на их перцептивную за-метность, то есть отличие их зрительных признаков от окружения. Таким образом, механизм обработки информации при поиске в естественных сценах, по мнению авторов, выглядит следующим образом. Анализ зрительных статистик изображения приводит к тому, что строится карта перцептивной заметности объектов относительно фона (заНепсу тар) [13]. Также анализ этих статистик и категориальной информации о цели приводит к построению карты, на которой выделена зона, где наиболее вероятно будет расположена цель. Результат совмещения двух этих карт называется картой приоритетов. Именно эта карта определяет, куда будет направлено внимание испытуемых в процессе поиска, — к наиболее перцептивно заметным объектам в области сцены, где вероятнее всего может находиться цель.

Категориальная информация о цели актуализирует в нашей долговременной памяти зрительные признаки наиболее вероятного окружения этой цели. А значит, влияние категориальной информации на поиск происходит еще до того, как предъявляется сцена, — на этапе демонстрации цели. Категориальная информация об объектах в сцене в процессе поиска недоступна испытуемым, так как в описанном механизме она избыточна: внимание направляется в соответствии с построенной картой приоритетов, которая включает в себя зрительные признаки объектов. Таким образом, в ходе решения данной задачи категориальная информация о цели также репрезентирована в виде зрительных признаков объектов, среди которых признаки представителей целевой категории встречаются наиболее часто.

В данном случае выделенный нами механизм влияния категориальной информации полностью совпадает с описанным для категориального зрительного поиска. Однако здесь за счет взаимосвязи объектов в рамках конкретной сцены когнитивная система использует эту информацию для управления вниманием. В отли-

чие от парадигмы категориального зрительного поиска, при поиске в естественных сценах на направление внимания влияют не только зрительные характеристики самой цели, но и зрительные признаки объектов, составляющих сцену. Объекты в ней расположены не случайным образом, а, как правило, организованы в группы, принадлежащие к сходным категориям (например, в ванной комнате расположены предметы гигиены). Благодаря этому категориальная принадлежность объектов может служить подсказкой об их возможном местоположении и выступать фактором управления вниманием. Объекты, принадлежащие к целевой или сходным категориям, будут привлекать внимание испытуемых.

Для того чтобы исследовать, как влияет категориальная принадлежность объектов на траекторию движения глаз в рамках определенной сцены, Помплун и коллеги использовали стимулы из базы данных labelme [14]. Эти стимулы представляют собой естественные сцены, на которых экспертами размечены все входящие в них объекты и определены их категории. Эта разметка не видна испытуемым. Она позволяет рассчитать, насколько каждый из входящих в сцену объектов категориально близок к целевому объекту. Помплун и коллеги использовали для этого метод latent semantic analysis, который представляет любые заданные значения (в данном случае категорий объектов в сцене) как векторы в многомерном пространстве и таким образом позволяет рассчитать близость значений заданных элементов через косинус угла между двумя выбранными векторами. На основании проведенных расчетов были построены карты категориальной схожести объектов отдельно для каждой сцены. Далее цитируемые авторы [11] предъявляли испытуемым сцены и просили найти на них представителя заданной категории. Анализировалась последовательность, в которой испытуемые просматривали объекты в сцене. Полученные данные показали, что как при выполнении задачи поиска, так и при рассматривании сцен испытуемые переводят взор на объект, категориально сходный с тем, на который в предыдущий момент времени они смотрели. Таким образом, Помплун и коллеги показали, что категориальная принадлежность фиксированного взором объекта влияет на то, на какой объект далее будет направлено внимание.

Вопрос о том, каким образом испытуемому доступна категориальная принадлежность объекта (фиксированного взором и следующего) непосредственно в процессе поиска, остается не до конца изученным. Помплун и коллеги [15] предлагают два возможных варианта ответа. Первый состоит в том, что обработка смысла сцены может происходить на ранних этапах обработки информации, что облегчит идентификацию объектов внутри сцены и тем самым ускорит обработку их категориальной принадлежности. Объекты, присутствующие в сцене, и их местоположение связаны с ее значением. Ориентировка в пространстве сцены может также происходить с помощью анализа распределения ее перцептивных характеристик. Второй возможный механизм заключается в том, что знание категории объекта, фиксированного взором в данный момент, содержит в себе информацию о том, объекты каких категорий обычно находятся рядом. Так, стул обычно находится рядом со столом, а тарелка — рядом со столовыми приборами. Идентификация одного из объектов из такой устойчивой группы позволяет нашей когнитивной системе предугадывать его возможное окружение и переводить туда взор, не прибегая к экстрафовеальной идентификации объекта и обработке его категориальной при-

надлежности. Таким образом, исследования, проведенные в данной парадигме, показывают, что при поиске объектов в естественных сценах испытуемым доступна их категориальная принадлежность, и эта информация определяет, на какие объекты будет переведен взор испытуемых в процессе поиска. При этом вопрос о том, каким образом репрезентирована категориальная информация об объектах в процессе поиска, остается не до конца изученным. Она может быть репрезентирована как непосредственно, так и опосредованно через зрительные признаки объектов, чаще всего окружающих фиксируемый взором объект. От предыдущей парадигмы цитированные исследования отличаются операционализацией категориальной информации. Помплун и коллеги проанализировали движения глаз испытуемых с учетом категориальной схожести фиксируемых объектов, тогда как Хендерсон и коллеги анализировали движения глаз с учетом заметности зрительных признаков объектов.

Парадигма видимого мира

Как уже отмечалось выше, процесс обработки информации о категориальной принадлежности объектов достаточно продолжительный. При выполнении задачи поиска в обычных условиях на обработку категориальной информации не хватает времени. Однако это не означает, что она не может влиять на зрительный поиск. Поэтому, чтобы изучить влияние категориальной информации, исследователи ищут особые условия, в которых категориальная информация об объектах могла бы быть обработана достаточно быстро и доступна в процессе самого поиска. Один из вариантов таких условий — это использование естественных сцен. В них благодаря знанию категориальной информации об объектах и самой сцене наша когнитивная система способна предсказывать вероятное местоположение целевого объекта. Этот подход был реализован в исследованиях Помплуна и коллег, которые мы рассмотрели выше. Другой вариант того, как сделать категориальную информацию доступной в процессе поиска, реализован в парадигме видимого мира (visual world paradigm). В ней доступность категориальной информации достигается за счет того, что испытуемым перед началом выполнения задания на поиск дают просмотреть в течение двух секунд все объекты, с которыми предстоит выполнять задание в данной пробе. Это не нарушает экологической валидности задачи поиска, так как в обычной жизни мы часто ищем что-нибудь среди знакомых объектов или в повторяющихся условиях. Полученные результаты демонстрируют, что при отсутствии на экране объекта, прямо упомянутого в предъявленном на слух предложении, испытуемые склонны переводить взор на изображение предмета, относящегося к той же категории. Так, слыша в предложении слова «пианино» и при отсутствии изображения пианино на экране, они были склонны переводить свой взор на изображение «трубы» (музыкального инструмента) [16]. Причем Мирман (Mirman) и коллеги [17] показали, что этот эффект связан именно с категориальной информацией. В своем эксперименте они варьировали степень категориальной близости произносимого слова и дистракторов. Например, для критического слова «автобус» в качестве категориально близкого дистрактора было использовано изображение фургона, а в качестве категориально далекого дистрактора — изображение велосипеда. Полученные результаты свидетельствуют о том, что вероятность

перевода взора на дистрактор, категориально связанный с критическим словом, зависит от степени их категориальной близости. Чем более дистрактор и критическое слово близки категориально, тем вероятнее испытуемые переведут на него взор при предъявлении этого критического слова.

В рамках парадигмы видимого мира было показано, что объекты, сходные с критическим словом не только категориально, но и перцептивно и фонетически, привлекают внимание испытуемых [18; 19]. Поэтому исследователей заинтересовал вопрос о том, какова динамика управления разными характеристиками объектов в процессе поиска, какая информация об объектах обрабатывается в первую очередь. Чтобы это установить, испытуемым на экране компьютера вместо одного конкурента и трех не связанных с целевым словом объектов предъявлялись три объекта, по-разному связанных с критическим словом (семантически, фонетически, перцептивно), и один не связанный с ним объект [20]. Удивительно, но перцептивные характеристики объектов влияли на направление внимание в этой задаче одними из последних, уступая по времени воздействия и семантическим, и фонетическим. Фонетическая же информация была первой, которая направляла внимание испытуемых.

Тот факт, что важнейшая роль в разнице результатов, полученных в парадигмах видимого мира и зрительного поиска, обусловлена доступностью категориальной информации, был проверен в специальном исследовании [21]. В нем на одном и том же материале первая группа испытуемых выполняла задачу зрительного поиска объекта (цель поиска задавалась до предъявления объектов), а вторая группа выполняла задачу, аналогичную парадигме видимого мира (объекты предъявлялись испытуемым за две секунды до того, как была задана цель поиска). В обеих группах цель задавалась категориально (на слух предъявлялось слово, например «банан»), а в качестве дистракторов использовались перцептивный конкурент (каноэ), семантический конкурент (обезьяна) и не связанный со словом объект. Авторы фиксировали движения глаз испытуемых. Полученные результаты свидетельствовали о том, что при отсутствии целевого объекта испытуемые чаще смотрят на семантически конкурирующее изображение, если они могли просмотреть изображения объектов до начала поиска, и на перцептивно конкурирующее изображение, если они увидели изображения объектов уже после задания цели. Эти данные подтверждают изначальное предположение авторов. Различия в процедурах проведения исследования в парадигме зрительного поиска и видимого мира влияют на то, какие процессы будут вовлечены в обработку информации. За счет этого наблюдаются различия в факторах, управляющих вниманием испытуемых в этих двух парадигмах.

В рассмотренном выше исследовании изучалась динамика влияния семантической, а не категориальной информации на зрительный поиск. Однако это исследование релевантно для нашего обзора, так как в парадигме видимого мира предполагается общий механизм влияния любой высокоуровневой информации на зрительный поиск, а значит, полученные закономерности актуальны не только для семантической, но и для категориальной информации об объектах.

Этот механизм, по мнению Хуттига (Ние1^) и коллег [22], устроен следующим образом. Воспринимаемые нами объекты загружаются в рабочую память, где начинается процесс их обработки. В рабочей памяти запоминается местоположение

объекта в пространстве, а также обрабатываются его первичные зрительные характеристики, формирующие зрительный образ. Наличие этого зрительного образа в рабочей памяти запускает процесс активации всех связанных с ним репрезентаций в долговременной памяти. Активируется значение этого объекта, его категориальная принадлежность, его название, а также и те объекты, которые схожи с ним по зрительным признакам. При этом предполагается, что репрезентации в долговременной памяти организованы по сетевому принципу. Также постулируется, что распространение активации происходит каскадно, то есть каждый следующий узел сети получает меньше активации, чем предыдущий. Описанным образом происходит обработка всех воспринятых объектов, в том числе и тех, которые предъявляются на слух. Однако необходимо отметить, что аудиально предъявленные объекты имеют специфику в обработке. Распространение активации в долговременной памяти, вызванное восприятием этих стимулов, начинается не с перцептивных репрезентаций (с того, как выглядит объект), а с вербальных (с характеристик его названия).

С одной стороны, активация в долговременной памяти всех связанных с объектом репрезентаций обеспечивает опознание этого объекта. С другой стороны, она является основой для столь гибкого управления вниманием, что демонстрируют проведенные экспериментальные исследования. Задача в парадигме видимого мира устроена таким образом, что один из предъявленных объектов связан с критическим словом. Причем эта связь может быть любой — семантической, перцептивной или даже фонетической. Характер связи между объектом в зрительном поле и критическим словом в данной модели неважен. Так как предполагается, что репрезентации информации об объектах хранятся в долговременной памяти в виде сети, распространяющаяся активация затрагивает все имеющиеся репрезентации объекта. И та репрезентация, которая является общей для критического слова и одного из объектов в поле зрения (например, они оба принадлежат к одной категории), получает двойную активацию, что сразу выделяет ее среди всех других. Повышение активации репрезентации одного из объектов является сигналом для нашей когнитивной системы о том, что цель найдена. Это вызывает перевод нашего взора на объект, который получил дополнительную активацию. Перевод взора не составляет проблем, так как в рабочей памяти хранится информация о местоположении объекта. Этим объясняются быстрота и легкость, с которыми люди обнаруживают объекты в парадигме видимого мира. Активация от воспринятых объектов распространяется по узлам сети, а хранение в рабочей памяти местоположения объекта обеспечивает быстрое переведение взора. В отличие от парадигмы зрительного поиска, где процесс решения такой сложной задачи описывается через последовательное обращение внимания на каждый объект, обработку его зрительных признаков и сличение с репрезентацией цели, хранящейся в рабочей памяти, в данном случае обработка информации в процессе поиска цели происходит практически параллельно путем распространения активации в долговременной памяти.

За счет того что у испытуемых было время, чтобы обработать предъявленные стимулы на уровне их категориальной принадлежности, эта информация стала доступна им в процессе выполнения задачи поиска. Причем она доступна не опосредованно через зрительные признаки примеров этих категорий, а непосредственно. Описываемый Хуттигом и коллегами механизм также предполагает, что категори-

альная информация об объектах активируется в долговременной памяти и там же происходит процесс распространения активации, вызванный предъявленными стимулами. В рассмотренных нами выше моделях предполагалось, что процесс поиска обеспечивается рабочей, а не долговременной памятью (сличением фиксируемых объектов с образом цели). Но у рабочей памяти нет ресурсов на обработку еще и категориальной информации, что затрудняет объяснение того, как она может обрабатываться и влиять на поиск. Модель Хуттига и коллег решает эту проблему за счет привлечения ресурсов долговременной памяти. Рабочая память в данной модели играет роль хранилища информации о местоположении тех объектов, которые явились источниками активации в долговременной памяти. Благодаря хранению информации о пространственном положении объектов испытуемые способны быстро перевести взгляд на объект, активация которого совпала с активацией, вызванной критическим словом.

Заключение

Во многих современных исследованиях зрительного поиска делается акцент на превалирующую роль зрительных признаков объектов в управлении вниманием в процессе поиска. Сторонники этого подхода стремятся переинтерпретировать имеющиеся данные о влиянии категориальной информации на зрительный поиск на «языке» все тех же зрительных признаков. Такая постановка проблемы приводит к тому, что противники влияния категориальной информации на зрительный поиск стремятся доказать, что внимание направляется лишь зрительными признаками объектов, а роль категориальной информации в этом процессе сведена к минимуму или вообще отсутствует.

Мы считаем, что такая интерпретация непродуктивна. Она не позволяет понять специфику влияния категориальной информации на зрительный поиск и условия, в которых это влияние возможно. Задачу этого обзора мы видели в сопоставлении механизмов влияния информации о категориальной принадлежности объектов в парадигмах, изучающих зрительный поиск в естественных условиях. В качестве ключевых факторов, определяющих механизм влияния категориальной информации, мы выделили доступность (на этапе демонстрации цели или в процессе самого поиска) и форму ее репрезентации (опосредованно через зрительные признаки объектов или непосредственно как категориальную принадлежность объектов). Сочетание этих факторов дает нам четыре варианта ситуаций, три из которых являются осмысленными и реализованы в существующих исследовательских парадигмах.

В том случае, когда категориальная информация доступна только на этапе демонстрации цели и репрезентирована опосредованно через зрительные признаки (парадигма категориального зрительного поиска), ее влияние на процесс поиска сводится к тому, что с помощью категориальной принадлежности цели из долговременной памяти извлекаются зрительные признаки прототипа целевой категории, которые и управляют вниманием непосредственно в процессе поиска.

Чем больше категориальной информации об объектах и сценах доступно испытуемым, тем большее влияние на процесс поиска оказывает эта информация. Исследования зрительного поиска в естественных сценах показывают, что, если ис-

пытуемым доступна не только категориальная принадлежность цели, но и сцены, в которых эту цель необходимо найти, это помогает выделить релевантные зоны для поиска. А дополнительное знание категориальной принадлежности дистрак-торов при поиске в естественных сценах влияет на траекторию движения наших глаз в процессе поиска. Внимание испытуемых привлекают объекты, категориально сходные с теми, на которые направлено внимание в данный момент. И наконец, если информация о категориальной принадлежности объектов доступна испытуемым непосредственно в процессе поиска и репрезентирована непосредственно, она оказывает большее влияние на направление нашего внимания, чем зрительные признаки объектов. Это показано в исследованиях, проведенных в парадигме видимого мира, где доступность категориальной информации достигается за счет предварительного знакомства с объектами, которые будут предъявлены в задаче поиска. Таким образом, можно сделать вывод о том, что механизм влияния категориальной информации на зрительный поиск зависит от ее доступности и от формы ее репрезентации. И чем больше категориальной информации доступно испытуемым, тем большее влияние на процесс зрительного поиска она оказывает.

Литература

1. Treisman A., Galade G. A feature-integration theory of attention // Cognitive psychology. 1980. Vol. 12. P. 97-136.

2. Bravo M., Farid H. The specificity of search template // Journal of vision. 2008. Vol. 9 (1). No. 34. P. 1-9.

3. Fodor J. The modularity of the mind. Cambridge: MIT Press, 1983. P. 200.

4. Lupyan G. Cognitive Penetrability of Perception in the Age of Prediction: Predictive Systems are Penetrable Systems // Review of philosophy and psychology. 2015. Vol. 6 (4). P. 547-569.

5. Duncan J., Humphreys G. W. Visual search and stimulus similarity // Psychological Review. 1989. Vol. 96. P. 433-458.

6. Wolfe J. M. Guided Search 4.0: Current Progress with a model of visual search // Integrated Models of Cognitive Systems / Ed. by W. Gray. New York; Oxford: Oxford University Press, 2007. P. 99-119.

7. Alexander R. G., Zelinsky G. J. Visual similarity effects in categorical search // Journal of Vision.

2011. Vol. 11 (8), no. 9. P. 1-15.

8. Torralba A., Oliva A., Castelhano M., Henderson J. Contextual Guidance of Eye Movements and Attention in Real-World Scenes: The Role of Global Features in Object Search // Psychological Review. 2006. Vol. 113, no. 4. P. 766-786.

9. Hwang A., Wang H., Pomplun M. Semantic guidance of eye movements in real-world scenes // Vision Research. 2011. Vol. 51. P. 1192-1205.

10. Schmidt J., Zelinsky G. Search guidance is proportional to the categorical specificity of a target cue // The Quarterly Journal of Experimental Psychology. 2009. Vol. 62 (10). P. 1904-1914.

11. Maxfield J., Stalder W., Zelinsky G. Effects of target typicality on categorical search // Journal of Vision. 2014. Vol. 14 (12), no. 1. P. 1-11.

12. Potter M. C. Conceptual short-term memory in perception and thought // Frontiers in Psychology.

2012. Vol. 3. P. 1-13.

13. Itti L., Koch C. Computational modelling of visual attention // Nature reviews neuroscience. 2001. Vol. 2 (3). P. 194-203.

14. Labelme Database. URL: http://labelme.csail.mit.edu (дата обращения: 03.12.2018).

15. Chia-Chien W., Farahnaz A. W., Pomplun M. Guidance ofvisual attention by semantic information in real-world scenes // Frontiers in psychology. 2004. Vol. 54. P. 1-13.

16. Huettig F., Altmann G. Word meaning and the control of eye fixation: Semantic competitor effects and the visual world paradigm // Cognition. 2005. Vol. 96 (1). P. 23-32.

17. Mirman D., Magnuson J. Dynamics of activation of semantically similar concepts during spoken word recognition // Memory and Cognition. 2009. Vol. 37. P. 1026-1039.

18. Allopenna P. D., Magnuson J. S., Tanenhaus M. K. Tracking the Time course of Spoken Word Recognition Using Eye Movements: Evidence for Continuous Mapping Models // Journal of Memory and Language. 1998. Vol. 38. P. 419-439.

19. Huettig F., Altmann G. Visual-shape Competition during Language Mediated Attention is Based on Lexical Input and not Modulated by Contextual Appropriateness // Visual Cognition. 2007. Vol. 15. P. 985-1018.

20. Huettig F., McQueen J. The tug of war between phonological, semantic and shape information in language-mediated visual search // Journal of Memory and Language. 2007. Vol. 57 (4). P. 460-482.

21. Groot F., Huettig F., Olivers C. When Meaning Matters: The Temporal Dynamics of Semantic Influences on Visual Attention // Journal of Experimental Psychology: Human Perception and Performance. 2016. Vol. 42 (2). P. 180-196.

22. Huettig F., Olivers C., Hartsuiker R. J. Looking, language, and memory: Bridging research from the visual world and visual search paradigms // Acta Psychologica. 2011. Vol. 137. P. 138-150.

Статья поступила в редакцию 21 марта 2019 г.; рекомендована в печать 17 июня 2019 г.

Контактная информация:

Морозов Максим Игоревич — науч. сотр.; magnus_ingvarsson_frost@mail.ru Спиридонов Владимир Феликсович — д-р психол. наук, проф.; vfspiridonov@yandex.ru

The mechanisms of categorical influences on visual search

M. I. Morozov1,2, V. F. Spiridonov2

1 The Moscow School of Social and Economic Sciences, 82/2, pr. Vernadskogo, Moscow, 119571, Russian Federation

2 Russian Presidential Academy of National Economy and Public Administration, 82/1, pr. Vernadskogo, Moscow, 119571, Russian Federation

For citation: Morozov M. I., Spiridonov V. F. The mechanisms of categorical influences on visual search. Vestnik of Saint Petersburg University. Psychology, 2019, vol. 9, issue 3, pp. 280-294. https://doi.org/10.21638/spbu16.2019.30 (In Russian)

In this article, we consider the issue of categorical influences on visual search performance. In order to compare the mechanisms of such influences, described in modern paradigms, we use two parameters: the accessibility of categorical information and the form of its representation. The parameter of accessibility concerns the temporal aspect: on which stage of a search task the participants have access to the categorical information. This information could be available during a search task or before it during the target presentation stage. The second parameter is a form of representation of categorical information. It could be represented directly as categorical knowledge, or indirectly by an object's visual features. Our analysis shows the following: If categorical information is available only at the target demonstration stage and represented indirectly by visual features, then it influences visual search by recalling a prototype of a target category, the visual features of which then form a search template. If a category of a scene is also available, then it helps to choose the most relevant zones in a scene for search. Additional information of distractors' categories will draw participants' attention to the objects which are categorically similar to a target. Finally, if categorical information is available directly during the search stage, it influences our attention more than visual features. Therefore, we conclude that the mechanism of categorical influences on visual search depends on the amount of categorical information available to a participant. The more categorical information of objects and a scene is available to participants, the more it influences visual search performance.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Keywords: Visual Search, Categories, Attention, Top-Down Processes, Bottom-Up Processes.

References

1. Treisman A., Galade G. A feature-integration theory of attention. Cognitive psychology, 1980, vol. 12, pp. 97-136.

2. Bravo M., Farid H. The specificity of search template. Journal of vision, 2008, vol. 9 (1), no. 34, pp. 1-9.

3. Fodor J. The modularity of the mind. Cambridge, MIT Press, 1983. 200 p.

4. Lupyan G. Cognitive Penetrability of Perception in the Age of Prediction: Predictive Systems are Penetrable Systems. Review of philosophy and psychology, 2015, vol. 6 (4), pp. 547-569.

5. Duncan J., Humphreys G. W. Visual search and stimulus similarity. Psychological Review, 1989, vol. 96, pp. 433-458.

6. Wolfe J. M. Guided Search 4.0: Current Progress with a model of visual search. Integrated Models of Cognitive Systems. Ed. by W. Gray. New York, Oxford, Oxford University Press, 2007, pp. 99-119.

7. Alexander R. G., Zelinsky G. J. Visual similarity effects in categorical search. Journal of Vision, 2011, vol. 11 (8), no. 9, pp. 1-15.

8. Torralba A., Oliva A., Castelhano M., Henderson J. Contextual Guidance of Eye Movements and Attention in Real-World Scenes: The Role of Global Features in Object Search. Psychological Review, 2006, vol. 113, no. 4, pp. 766-786.

9. Hwang A., Wang H., Pomplun M. Semantic guidance of eye movements in real-world scenes. Vision Research, 2011, vol. 51, pp. 1192-1205.

10. Schmidt J., Zelinsky G. Search guidance is proportional to the categorical specificity of a target cue. The Quarterly Journal of Experimental Psychology, 2009, vol. 62 (10), pp. 1904-1914.

11. Maxfield J., Stalder W., Zelinsky G. Effects of target typicality on categorical search. Journal of Vision, 2014, vol. 14 (12), no. 1, pp. 1-11.

12. Potter M. C. Conceptual short-term memory in perception and thought. Frontiers in Psychology, 2012, vol. 3, pp. 1-13.

13. Itti L., Koc C. Computational modelling of visual attention. Nature reviews neuroscience, 2001, vol. 2 (3), pp. 194-203.

14. Labelme Database. Available at: http://labelme.csail.mit.edu (accessed: 03.12.2018).

15. Chia-Chien W., Farahnaz A. W., Pomplun M. Guidance of visual attention by semantic information in real-world scenes. Frontiers in psychology, 2004, vol. 54, pp. 1-13.

16. Huettig F., Altmann G. Word meaning and the control of eye fixation: Semantic competitor effects and the visual world paradigm. Cognition, 2005, vol. 96 (1), pp. 23-32.

17. Mirman D., Magnuson J. Dynamics of activation of semantically similar concepts during spoken word recognition. Memory and Cognition, 2009, vol. 37, pp. 1026-1039.

18. Allopenna P. D., Magnuson J. S., Tanenhaus M. K. Tracking the Time course of Spoken Word Recognition Using Eye Movements: Evidence for Continuous Mapping Models. Journal of Memory and Language, 1998, vol. 38, pp. 419-439.

19. Huettig F., Altmann G. Visual-shape Competition During Language Mediated Attention is Based on Lexical Input and not Modulated by Contextual Appropriateness. Visual Cognition, 2007, vol. 15, pp. 985-1018.

20. Huettig F., McQueen J. The tug of war between phonological, semantic and shape information in language-mediated visual search. Journal of Memory and Language, 2007, vol. 57 (4), pp. 460-482.

21. Groot F., Huettig F., Olivers C. When Meaning Matters: The Temporal Dynamics of Semantic Influences on Visual Attention. Journal of Experimental Psychology: Human Perception and Performance, 2016, vol. 42 (2), pp. 180-196.

22. Huettig F., Olivers C., Hartsuiker R. J. Looking, language, and memory: Bridging research from the visual world and visual search paradigms. Acta Psychologica, 2011, vol. 137, pp. 138-150.

Received: March 21, 2019 Accepted: June 17, 2019

Author's information:

Maxim I. Morozov — researcher; magnus_ingvarsson_frost@mail.ru

Vladimir F. Spiridonov — Dr. Sci. in Psychology; vfspiridonov@yandex.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.