Научная статья на тему '2018. 01. 008. Ванруллен Р. Наука о восприятии в эпоху глубинных нейронных сетей. Vanrullen R. perception Science in the age of deep neural networks // Frontiers in Psychology. - 2017. - Vol. 8, article 142. - p. 1-6. - doi: 10. 3389/fpsyg. 2017. 00142'

2018. 01. 008. Ванруллен Р. Наука о восприятии в эпоху глубинных нейронных сетей. Vanrullen R. perception Science in the age of deep neural networks // Frontiers in Psychology. - 2017. - Vol. 8, article 142. - p. 1-6. - doi: 10. 3389/fpsyg. 2017. 00142 Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
83
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВОСПРИЯТИЕ / НЕЙРОНАУКА / ПСИХОЛОГИЯ / ГЛУБИННОЕ ОБУЧЕНИЕ / НЕЙРОННЫЕ СЕТИ / ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Сущин М.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «2018. 01. 008. Ванруллен Р. Наука о восприятии в эпоху глубинных нейронных сетей. Vanrullen R. perception Science in the age of deep neural networks // Frontiers in Psychology. - 2017. - Vol. 8, article 142. - p. 1-6. - doi: 10. 3389/fpsyg. 2017. 00142»

Резюмируя, авторы отмечают, что полученные ими результаты свидетельствуют о том, что для восприятия таких видов зрительных ансамблей, как разнообразие по цвету, размеру и средней величине, требуются ресурсы внимания (по крайней мере в его рассеянной, распределенной форме). Зафиксированные в более ранних исследованиях З. Бронфмана и др. и Э. Уорд и др. результаты можно интерпретировать таким образом, что субъекты в поставленных ими экспериментах все же уделяли определенное внимание ансамблевой статистике (цветовому разнообразию букв из невыделенных строк). Ансамблевые репрезентации могут эффективно кодироваться с привлечением весьма незначительных ресурсов внимания, поэтому их формирование в экспериментах не сказывалось на выполнении основной задачи отчета о буквах в выделенной строке.

Сторонники альтернативной точки зрения на природу перцептивного опыта могли бы заявить, что в ходе настоящих экспериментов испытуемые на самом деле воспринимали ансамблевую статистику, однако ввиду неустойчивости процессов памяти оказались не в состоянии отчитаться об этом во время тестов. И хотя утверждалось, что спор двух подходов (неспособности отчитаться ввиду неустойчивости памяти или отсутствия предшествующего восприятия как такового) едва ли поддается разрешению научными средствами1, в нескольких недавних исследованиях предпочтение отдавалось позиции отсутствия у субъектов в таких условиях перцептивного опыта, которую поддерживают и авторы статьи. Как они утверждают, «представляется, что внимание необходимо для ансамблевого восприятия, даже для базовых ансамблевых перцеп-тов, таких как цвет и размер» (с. 159).

М.А. Сущин

2018.01.008. ВАНРУЛЛЕН Р. НАУКА О ВОСПРИЯТИИ В ЭПОХУ ГЛУБИННЫХ НЕЙРОННЫХ СЕТЕЙ.

VANRULLEN R. Perception science in the age of deep neural networks // Frontiers in psychology. - 2017. - Vol. 8, article 142. - P. 1-6. -DOI: 10.3389/fpsyg. 2017.00142.

1 Cohen M.A., Dennett D.C. Consciousness cannot be separated from function // Trends in cognitive sciences. - 2011. - Vol. 15, N 8. - P. 358-364.

Ключевые слова: восприятие; нейронаука; психология; глубинное обучение; нейронные сети; искусственный интеллект.

Автор статьи - сотрудник Центра исследований мозга и познания при Национальном центре научных исследований и Университете Поля Сабатье (Тулуза III). В статье обсуждается текущее положение дел в области науки о восприятии на фоне недавнего чрезвычайно стремительного развития поля исследований машинного обучения. Речь идет о том, как проекты, подобные так называемой программе глубинного обучения, могут изменить традиционные исследования восприятия в психологии и нейронауке.

Так, автор отмечает, что на протяжении долгого периода времени восприятие рассматривалось как плохо понимаемая способность биологических систем, которая едва ли может быть воспроизведена в искусственных интеллектуальных устройствах. Однако в последние годы появление новых компьютерных моделей восприятия изменило эту ситуацию. Автор задается вопросами: что недавний впечатляющий прогресс в области искусственного интеллекта может дать для психологических и нейрофизиологических исследований восприятия; является ли он угрозой, возможностью или в некоторой степени и тем и другим?

Ранее ученые в области исследований восприятия использовали обстоятельство отсутствия сопоставимых по возможностям с человеческими искусственных воспринимающих систем как оправдание для выбора упрощенной методологической стратегии -так называемых «небольших шагов» (baby steps). Поскольку задача зрительного распознавания объектов представлялась чрезвычайно трудной, исследователи предпочитали фокусироваться на изучении обработки простых стимулов (фильтры Габора) или высокоспецифичных стадий процессов распознавания (таких как инвариантность симметрии). Теперь же, когда в немалой степени навеянные архитектурой зрительной системы приматов нейронные сети начинают превосходить человека в выполнении целого ряда задач, исследователи по-прежнему топчутся на месте в тщетных попытках раскрыть природу перцептивных процессов биологических систем.

За последние пять лет произошел значительный прогресс во многих областях изучения искусственного интеллекта и машинного обучения. Интеллектуальные персональные помощники вроде Siri, Contana, Google Assistant или Alexa стали частью повседнев-

ной жизни современного человека, значительно усовершенствовались системы машинного перевода, а натренированные при помощи техник глубинного обучения нейронные сети способны порождать новые тексты, синтезировать музыку и т.д.

Примечательны существенно возросшие способности непосредственно систем обработки изображений и машинного зрения. Вслед за появлением сетей, распознающих объекты на уровне человека, стало возможным анализировать сложные сцены, точно идентифицируя каждый объект, определяя его местоположение и отношение к другим объектам. Посредством процедуры, обратной анализу изображения (деконволюции), нейронные сети могут синтезировать новые изображения и выполнять множество полезных операций: весьма умело раскрашивать черно-белые изображения, создавать реалистичные фотографии на основе примитивных зарисовок, восстанавливать оригинальное разрешение изображений из изображений с низким разрешением, получать полностью новые изображения на основе текстовых описаний и т.д. «Тем временем, -пишет автор, - поле науки о восприятии все еще испытывает большие трудности при объяснении того, как сенсорная информация преобразуется мозгом человека (или животного) в значимые понятия, не говоря уже о понимании воображения или художественного творчества... Пока мы дискутировали о деталях, кто-то составил цельную картину» (с. 2).

Тем не менее, конечно, могут возникнуть определенные возражения против конвергенции науки о восприятии и современных подходов в области искусственного интеллекта и машинного зрения. Например, кто-либо мог бы заметить, что исследованиям машинного зрения еще предстоит проделать долгий путь и что получившие значительное распространение методы глубинного обучения еще не были адаптированы ко множеству областей науки о восприятии (обработке движения и глубины, цветопостоянству, законам гештальтпсихологии, вниманию, мультистабильному восприятию, мультисенсорной интеграции и т.д.). В ответ на это возражение, полагает автор, можно математически продемонстрировать, что если возможно решение по преобразованию сенсорных входов в выходы, то оно может быть реализовано при помощи техник глубинного обучения. К тому же очевидно, что «для любой проблемы науки о восприятии существует по крайней мере одно

разумное решение - то, которое воплощено в нашем мозге» (с. 2). Поэтому, считает он, можно ожидать, что эти проблемы будут решены по мере развития области машинного обучения.

Кроме того, возможны сомнения по поводу биологической правдоподобности глубоких нейронных сетей. Так, функционирование современных нейронных сетей в значительной степени основывается на методах контролируемого обучения с привлечением больших массивов маркированных изображений, тогда как перцептивное обучение человека не требует надзора и какого-либо маркирования воспринимаемых объектов и сцен. Отсутствует среди исследователей в настоящий момент и согласие относительно возможного эквивалента в деятельности мозга для алгоритма обратного распространения ошибки, являющегося краеугольным камнем для глубинного обучения. В дополнение можно отметить, что нейронные сети, в отличие от мозга, не располагают реальной темпоральной динамикой, а также по преимуществу основываются на прямой, восходящей архитектуре (в то время как для мозга неоценимой значимостью обладают множественные соединения обратной связи).

Автор не считает, что все эти замечания представляют серьезный вызов для отстаиваемой им точки зрения. Во-первых, не так давно были предложены неконтролируемые или частично контролируемые методы обучения нейронных сетей, либо не привлекавшие маркированные изображения, либо привлекавшие их в незначительном количестве. Во-вторых, использование аналогов потенциалов действия для нейронных сетей становится все более распространенным. Наконец, в последнее время исследователями стали разрабатываться глубокие сети с использованием дальних прямых и обратных соединений. Иное возражение заключается в том, что просто воспроизведение определенного поведения в искусственной системе необязательно предполагает понимание принципов его функционирования. В ответ на это автор замечает, что в настоящий момент для специалистов в области изучения восприятия открывается возможность анализировать работу искусственных воспринимающих систем - глубинные нейронные сети, систематическое изучение которых может быть намного проще.

В отличие от скептиков автор статьи полагает, что недавние успехи в области машинного обучения открывают множество воз-

можностей для исследований восприятия в рамках психологии и нейронауки. Так, синтезирующие способности глубоких сетей, утверждает он, могут служить для создания нового типа стимулов и инновационных экспериментальных процедур. Кроме того, техники глубинного обучения могут быть использованы для изобретения новых мощных инструментов анализа данных, а также выступать ориентиром для существующих и возникающих теорий функций мозга. Наконец, указанный прогресс, считает он, должен стать сигналом для специалистов в области науки о восприятии, для того чтобы отойти от упрощенной методологии и начать рассматривать более масштабные, панорамные вопросы.

В заключение автор на правах редактора журнала «Новые рубежи в психологии» выступает с призывом публиковать в издании любые оригинальные работы, выполненные в соответствии с требованиями научной строгости и основательности. И хотя он рассматривает появление на горизонте программы глубинного обучения как важнейший фактор, способствующий изменениям в исследованиях перцептивных процессов, ясно, что далеко не все работы в этой области должны иметь отношение к глубоким сетям и алгоритмам. Единственное его пожелание к авторам состоит в том, чтобы они не мотивировали свои работы представлениями о «невозможности машинного восприятия достигнуть уровня человеческих способностей»; это было бы недальновидно (с. 4).

М.А. Сущин

i Надоели баннеры? Вы всегда можете отключить рекламу.