Научная статья на тему 'Модель клеток зрительной коры, селективных к пространственно-периодическим структурам, на основе сети Хопфилда-Танка'

Модель клеток зрительной коры, селективных к пространственно-периодическим структурам, на основе сети Хопфилда-Танка Текст научной статьи по специальности «Математика»

CC BY
125
39
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Потапов Алексей Сергеевич, Аверкин Антон Нилович

Построена модель клеток зрительного тракта, селективных к пространственно-периодическим структурами и участвующих в текстурной сегментации изображений. Модель представляет собой искусственную нейронную сеть типа Хопфилда-Танка, в которой рецептивные поля нейронов заданы функциями Габора, а латеральные связи обеспечивают выделение групп нейронов, дающих отклики на одинаковые структуры

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Потапов Алексей Сергеевич, Аверкин Антон Нилович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Модель клеток зрительной коры, селективных к пространственно-периодическим структурам, на основе сети Хопфилда-Танка»

МОДЕЛЬ КЛЕТОК ЗРИТЕЛЬНОЙ КОРЫ, СЕЛЕКТИВНЫХ К ПРОСТРАНСТВЕННО-ПЕРИОДИЧЕСКИМ СТРУКТУРАМИ, НА ОСНОВЕ СЕТИ ХОПФИЛДА-ТАНКА А.С. Потапов, А.Н. Аверкин Научный руководитель - д.т.н., профессор И.П. Гуров

Построена модель клеток зрительного тракта, селективных к пространственно-периодическим структурами и участвующих в текстурной сегментации изображений. Модель представляет собой искусственную нейронную сеть типа Хопфилда-Танка, в которой рецептивные поля нейронов заданы функциями Габора, а латеральные связи обеспечивают выделение групп нейронов, дающих отклики на одинаковые структуры.

Введение

В настоящее время в области компьютерного зрения разработано большое количество методов, реализующих различные аспекты анализа изображений, однако до сих пор возможности систем компьютерного зрения далеки от возможностей соответствующих биологических систем. Таким образом, остается актуальной проблема повышения эффективности методов автоматического анализа изображений, и одним из перспективных направлений здесь является построение моделей биологических систем зрительного восприятия на основе нейрофизиологических данных [1].

Построение моделей клеток зрительного тракта позволяет как прояснить принципы функционирования биологических систем, так и использовать полученные сведенья при проектировании систем компьютерного зрения. Недавно открытыми являются несколько типов клеток зрительной коры, селективных к пространственно-периодическим структурам [2]. Эти клетки участвуют в текстурном анализе, относящимся также к фундаментальным и не вполне решенным проблемам компьютерного зрения.

Принято считать [3], что селективность к пространственно-периодическим структурам обеспечивается за счет того, что клетки обладают рецептивными полями, позволяющими им выполнять вейвлет-подобные преобразования. В частности, работа простых клеток зрительной коры хорошо моделируется с помощью функций Габора [4]. Однако подобные модели не описывают процесс сегментации изображений, для которого необходимо учитывать не только рецептивные поля отдельных клеток, но и систему связей между ними, которая бы обеспечивала совместную активацию групп клеток внутри однородных текстурных областей.

В работе производится построение и исследование модели клеток зрительной коры указанного типа. Модель представляет собой трехуровневую искусственную нейронную сеть (ИНС). Первый уровень ИНС имитирует работу простых клеток зрительной коры, рецептивные поля которых описываются функциями Габора. На втором уровне имитируются сложные клетки, отклики которых соответствуют габоровской энергии. Третий уровень представляет собой рекуррентную нейронную сеть Хопфилда-Танка (см., напр., [5]), выделяющую группы нейронов, дающие отклики на одинаковые структуры. На основе экспериментальных исследований показывается правдоподобность, но недостаточность модели для объяснения механизмов текстурного анализа.

Нейросетевая модель

Построенная нейросетевая модель клеток зрительной коры, участвующих в текстурном анализе изображений, имеет структуру, представленную на рис. 1.

Рис. 1. Общая структура искусственной нейронной сети для моделирования клеток, селективных к пространственно-периодическим структурам

Построенная ИНС состоит из трех уровней. На первом уровне моделируется работа простых клеток зрительной коры, рецептивные поля которых задаются в виде габо-ровских функций:

~2+У2у2

8 £,л,е,а, уд,ф(х У) = е

2ст 2

соб! 2п—+ ф

где у = (х -£)соб е- (у -п^п е и у = (х -£)бш е + (у -п)соб е - преобразованные координаты.

Параметры функций Габора имеют следующий смысл. Величины £ и п определяют координаты центра рецептивного поля клетки на изображении, е, а и у - угол ориентации, размер и вытянутость этого поля, а — и ф - длину волны и фазу периодической компоненты.

В построенной ИНС каждой точке на изображении соответствует большое число простых клеток с разными значениями параметров функций Габора. Все простые клетки разделены на слои; в каждом слое значения параметров постоянны, за исключением значений £ и п. Таким образом, в каждом слое нейроны селективны по отношению к одинаковым структурам, но помещенным в разные точки изображения. Количество слоев определялось как количество комбинаций допустимых значений различных параметров (всего использовалось порядка пятидесяти слоев). Варьировались параметры —, е и у. Значение параметра а определялось, исходя из следующего соотношения а/— = 0.56, принятого в моделях простых клеток [2]. Параметр ф принимал значения 0 и -я/ 2 и участвовал не в разделении простых клеток на слои, а в формировании отклика клеток следующего уровня. Этот отклик определялся по формуле

Е£

Xх У) = VГ1 п,е,а,у,—,ф=0 (XУ) + Г£Яе,а,у, —,ф=-п/2 (X У) ,

-'£, п,е,а, у,—\'£, П,е, а, у,А,ф=очл>^/ 1 '£,п, е, а, у, —,ф= где г - отклик простой клетки как свертка /£,л,е,а,у,—,ф (х,у) = (/ ® #£,л,е,а,у,—,ф)(х,у) рецептивного поля ^ и изображением /. Отклик сложной клетки Е представляет собой габоровскую энергию и не зависит от значения фазы ф. На рис. 2 представлено текстурированное изображение и примеры откликов сложных клеток в двух слоях (темным цветом обозначены более сильные отклики). Как видно из рисунка, характер откликов сильно отличается в разных областях изображения в зависимости от параметров рецептивных полей.

Рис. 2. Пример изображения и соответствующих откликов сложных клеток в двух слоях с приведенными рецептивными полями

Следующий уровень нейронной сети представлял собой рекуррентную нейронную сеть, топологически эквивалентную уровню сложных клеток, но включающую набор латеральных связей между нейронами. Пусть нейроны этого слоя пронумерованы от 1 до N. Обозначим через и/ (V) уровень возбуждения /-го нейрона в момент времени V.

Выход от /-го нейрона V/ (V) определяется его уровнем возбуждения и/ (V) и некоторой нелинейной передаточной функцией у, в качестве которой может быть взята линейная передаточная функция с насыщением

0, и (г) < о и/ (0, 0 < и/ (0 < 1.

1, и (V) > 1

Обозначим через Wi у вес связи, идущей от /-го нейрона ку'-му нейрону. Тогда изменение уровня возбуждения /-го нейрона в следующий такт времени задается следующей формулой:

N

и/ (V+1) = и/ (V) + ZWj,/Vj (V).

у=1

Исходно каждый нейрон данного уровня получал сигнал от соответствующего ему нейрона предыдущего уровня для установления начальных значений и/ (0) .

Веса связей W/ у должны быть организованы таким образом, чтобы в результате

релаксации сети в каждом слое оставались только нейроны, чьи характеристики рецеп-

V/ (V) = у(и/ (V )) =

тивных полей и координаты на изображении соответствуют областям однородной текстуры. Остальные нейроны при этом должны подавляться. Таким образом, близко расположенные (в системе координат изображения) нейроны одного слоя должны поддерживать друг друга, а разных слоев - подавлять. В результате для каждой точки на изображении останется активным нейрон только в одном слое, характеристики которого наиболее соответствуют характеристикам текстуры в данной точке.

Для реализации связей между нейронами с указанными свойствами веса были заданы на основе функции вида

нами с координатами (£1,гц) и (£2,П2), а а - параметр функции Габора, определяющий размер рецептивного поля. Эта функция, имеющая форму «мексиканской шляпы», выделяет вокруг нейрона две области (см. рис. 3) - круг и кольцо, в одном из которых влияние нейронов друг на друга положительное, а в другом - отрицательное. Знак влияния зависит от удаленности слоев (по прочим параметрам функций Габора), к которым относятся связанные нейроны.

Рис. 3. Смена подкрепления и торможения пары нейронов в зависимости от расстояния между ними и удаленности соответствующих слоев

В частности, подкрепление нейронов в одном слое осуществляется в кольце, в то время как для нейронов удаленных слоев в кольце осуществляется торможение. Степень близости двух слоев определяется в пространстве параметров (—, е, у), которые для каждого слоя имеют индивидуальные значения. Конкретные значения параметров латеральных связей и параметров релаксации ИНС были подобраны эмпирически, после чего было произведено экспериментальное изучение функционирования данной модели.

Было произведено экспериментальное исследование разработанной ИНС. Как показали эксперименты, слои, исходно содержащие малоактивные нейроны, после релаксации сети полностью подавлялись. При этом в других слоях рекуррентной сети происходило подавление лишь части нейронов, в то время как остававшиеся активные нейроны соответствовали определенным текстурным областям. На рис. 4 представлены типичные примеры слоев нейронной сети, в которых произошло выделение групп активных нейронов, соответствующих какой-либо области. После релаксации ИНС в слоях остаются активные группы нейронов, располагающихся в узлах текселов и находящихся на удалении, в среднем равном размеру рецептивного поля. Как видно из рис. 4, в слое остаются активными нейроны, соответствующие одной определенной текстуре.

Эксперименты показывают адекватность модели клеток и возможность использования данного подхода для решения задач текстурного анализа. Однако для автомати-

плоскости изображения между нейро-

Экспериментальное исследование модели

ческого решения прикладных задач на основе результатов работы построенной ИНС требуется их дополнительная обработка. Также на основе текущей модели невозможно количественно оценить эффективность выполняемой ею текстурной сегментации.

Рис. 4. Фрагмент исходного изображения и активность двух слоев нейронов

после релаксации ИНС

Заключение

Нами была разработана и протестирована нейросетевая модель клеток зрительной коры, селективных к пространственно-периодическим структурам. Данная модель представляет собой трехуровневую искусственную нейронную сеть, в которой рецептивные поля нейронов нижнего уровня описываются функциями Габора, выход нейронов второго уровня соответствует габоровской энергии, а третий уровень является рекуррентной нейронной сетью, латеральные связи в которой обеспечивают выделение групп клеток, отвечающих определенным текстурным областям.

Экспериментальная проверка показала, что с помощью данной ИНС в определенной степени возможно выделение областей с постоянной текстурой, т.е. модель в целом является адекватным описанием нейрофизиологических данных, которые могут быть перенесены в область компьютерного зрения. Однако результат работы данной модели не пригоден для автоматического использования без дополнительной обработки. Помимо этого, одним из существенных недостатков разработанной ИНС в плане практического использования является низкая скорость работы. Таким образом, обнаруженные принципы организации естественных нейронных сетей требуют либо аппаратной реализации, либо поиска такой программной реализации, которая бы воспроизводила основные идеи, но в адаптированной к возможностям последовательных цифровых машин форме, что и является предметом наших последующих исследований.

Литература

1. Kruizinga P., Petkov N. Nonlinear operator for oriented texture // IEEE Tran. on image processing. - 1999. - Vol. 8. - No. 10. - P. 1395-1407.

2. Grigorescu C., Petkov N., Westenberg M.A. Contour detection based on nonclassical receptive field inhibition // IEEE Trans. on image processing. - 2003. - Vol. 12. - No. 7. -P. 729-738.

3. Field D.J. Wavelets, vision and the statistics of natural scenes // Phil. Trans. R. Soc. Lond. A. - 1999. - Vol. 357. - P. 2527-2542.

4. Daugman J.G. Uncertainty relation for resolution in space, spatial frequency, and orientation optimized by two-dimensional visual cortical filters // J. Opt. Soc. Amer. A. - 1985. -Vol. 2. - No. 7. - P. 1160-1169.

5. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. - 2-е изд. - М.: Горячая линия-Телеком, 2002. - 382 c.

i Надоели баннеры? Вы всегда можете отключить рекламу.