Научная статья на тему 'Информационные модели организации сетчатки глазного яблока'

Информационные модели организации сетчатки глазного яблока Текст научной статьи по специальности «Математика»

CC BY
93
25
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЗРИТЕЛЬНОЕ ВОСПРИЯТИЕ / ИНФОРМАЦИОННАЯ МОДЕЛЬ СЕТЧАТКИ / ОРГАНИЗАЦИЯ СЕТЧАТКИ / VISUAL PERCEPTION / INFORMATION MODEL OF A RETINA / THE RETINA ORGANISATION

Аннотация научной статьи по математике, автор научной работы — Утробин В. А.

Рассматриваются архитектурные аспекты организации сетчатки глазного яблока с позиций теории активного восприятия. Исследуются свойства системы «сетчатка центр» в целом. Приводятся варианты структурной и функциональной организации сетчатки.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

INFORMATION MODELS OF THE EYEBALL RETINA ORGANISATION

Considered architectural aspects of the eyeball retina organization from positions of the theory of active perception. Investigated properties of system «the retina the center» as a whole. Variants of the structural and functional organisation of a retina are resulted.

Текст научной работы на тему «Информационные модели организации сетчатки глазного яблока»

УДК 519.7

В.А. Утробин

ИНФОРМАЦИОННЫЕ МОДЕЛИ ОРГАНИЗАЦИИ СЕТЧАТКИ

ГЛАЗНОГО ЯБЛОКА

Нижегородский государственный технический университет им. Р.Е. Алексеева

Рассматриваются архитектурные аспекты организации сетчатки глазного яблока с позиций теории активного восприятия. Исследуются свойства системы «сетчатка - центр» в целом. Приводятся варианты структурной и функциональной организации сетчатки.

Ключевые слова: зрительное восприятие, информационная модель сетчатки, организация сетчатки.

1. Общие положения

Все, что входит в состав живого организма, представлено мембранами как оболочками [1]. Поэтому сетчатка глаза - мембрана. Рассмотрим возможный вариант ее организации.

О составе сетчатки известно следующее (выделим только необходимые на момент изложения данные): а) рецепторы координатно упорядочены на сетчатке, так как мозг (нижнее коленчатое тело (НКТ) и зрительные отделы мозга) «точно знает» координаты всех рецепторов в области ясного видения (fovea) и групп рецепторов на периферии; б) сами рецепторы «разбросаны» по сетчатке с увеличивающимся шагом от точки 0 (центр сетчатки) fovea к периферии; в) над рецепторами сетчатки находится два слоя нейронов, последний из которых образован ганглиозными клетками.

Отметим, что изменение шага между рецепторами вряд ли случайно, так как в противном случае потребуются дополнительные затраты на вычисления, что не допустимо с позиции «выживания», требующей высоких скоростей реакции на внешние воздействия. Такое изменение шага более всего похоже на пространственную дискретизацию с переменным шагом, а поскольку эволюция живого за миллионы лет «породила оптимальную систему», то в такой системе на уровне врожденных механизмов нет ничего «случайного». Поэтому примем за исходные следующие положения:

• изменение шага от точки 0 к периферии растет квадратично: 1x1 в fovea; 2x2, 4x4,

16x16 и т.д.;

• «палочки» - это рецепторы вне fovea, а «колбочки» - рецепторы в fovea;

• если нервные клетки рецепторов - это первый нейронный слой, то второй слой нейронов

- нервные клетки, связанные с рецепторами и образующие рецепторные поля, которые

допускают свое определение на множество фильтров-покрытий^: i = 1, ..., 15}.

Третий слой нейронов - ганглиозные клетки, непосредственно связанные с центром,

образуют более сложные рецепторные поля над вторым слоем. Каково их функциональное назначение и какова конструкция таких полей - пока неизвестно. В пределах рассматриваемой работы примем следующую гипотезу: поскольку слой ганглиозных клеток покрывает (и поэтому «обобщает» получаемый сигнал) подмножество рецепторных полей ниже лежащего слоя, то допустимо использование того же множества {Fi}, но над большей областью определения. В результате «интеллектуально» выявляются новые связи, которые передаются в центр обработки, а если последний «запросит» по обратной связи уточнения, то передаче подлежат данные с нижележащих слоев.

2. Модель организации системы «сетчатка-центр»

В соответствии с принятыми условиями сетчатка «грубо» разбивается на зоны с переменным разрешением, а в координатном представлении имеем решетку с переменным

© Утробин В.А., 2010.

шагом. В пространстве система «сетчатка-центр» допускает следующую функциональную организацию (рис. 1):

• сетчатка со всеми ее слоями - это усеченная пирамида (6^-пирамида) или «интеллектуальная рупорная антенна»;

• зрительный нерв - волновод или система передачи данных, имеющая конечное число линий прямой и обратной связи;

• центр - мозг (это все, что вне сетчатки и относится к зрительной системе восприятия) - обратная усеченная пирамида (6^-пирамида) «развертывания» принятых данных.

Рис. 1. Функциональная организация системы «сетчатка-центр»:

1 - ^-пирамида; 2 - канал передачи данных (волновод); 3 - Цгпирамида

Если первая пирамида «сворачивает» (кодирует) данные с передачей их по оси г, то вторая «развертывает» (декодирует) в плоскости «экрана».

Определение 1. б^пирамида - система сжатия видеоданных; 6^-пирамида - система восстановления видеоданных, а ^-пирамида - система восстановления пространственной глубины. Если первые две упорядочены в Е2, то ^-пирамида определена над 6^-пирамидой в Е3.

Для цели анализа организации сетчатки в ее широком понимании как многослойной системы особый интерес представляет организация £/х-пирамиды. Отметим следующее:

1. Функциональное и структурное устройство 6^-пирамиды (а это ^-пирамида в составе пирамиды принятия решений) рассмотрено в работах [2 - 4].

2. Элементы устройства ^-пирамиды изложены в работе [5].

Рис. 2. Варианты реализации системы «сетчатка-центр»:

а - передача данных с управлением; б - самообучающаяся система (1 - ^-пирамида; 2 - канал передачи данных; 3 - Цгпирамида; 4 - слои {}; 5 - ^-пирамида; 6 - память)

Модельное представление по рис. 1 допускает две физические реализации:

1) «обычная» система передачи данных, решающая задачи сжатия, кодирования, собственно передачи данных и их восстановления (рис. 2, а);

2) самообучающаяся распознающая система как система анализа и принятия решения (рис. 2, б).

Относительно блока памяти отметим следующее. Во-первых, элементарным конструктивным элементом памяти является трехмерный триггер, элементарным модулем (для полных групп) является пятислойный «кристалл» полных групп, а в роли ячейки памяти выступает «кристалл» полных и замкнутых групп, который фактически является дешифратором этих групп (ДПЗ) с аналогом на ориентационные колонки в зрительной коре головного мозга [4 - 6].

Во-вторых, на множестве слоев {/} первый слой (0 по рис. 2, б) - это единственный слой, состоящий из одной ячейки ДПЗ; остальные - множество «стопок» ДПЗ на гладко склеенных планигонах.

Модельное представление по рис. 1 не случайно и определяется четырехмерными представлениями с моделью на гиперкуб в проекции на плоскость, а в трехмерном представлении по направлению глубины - это усеченная пирамида. При этом возможны два подхода в интерпретации модели по рис. 1 - формальный и субъективный.

Для первого варианта предполагаем, что существуют два наблюдателя, изолированные друг относительно друга. Если первый «живет» в четырехмерном пространстве E3 - t, то и второй «живет» в своем E - t (этим пространствам на модели по рис. 1 соответствуют свои усеченные пирамиды (1, 3)). Их изолирует третье трехмерное пространство, где нет времени (а это по рис. 1 - канал 2). Общее число измерений в таком «слоеном» пространстве равно 11, т.е. соответствует пространству E4

Для второго варианта предполагаем, что любому наблюдателю (как Я) соответствует три позиции в пространстве событий [4]: Я - сознательное (осознанное понимание себя); Я -подсознательное («внутренний голос»); Я - внешнее (наблюдение себя со стороны). Первая и третья позиции существуют в пространстве и времени, где время для первой позиции - внутреннее, а для третьей - внешнее. Для второй позиции понятие времени не нужно. Получаем опять 11 измерений 4-мерного пространства.

3. Пространственная ориентация слоя рецепторов

В общем случае система, организованная по рис. 1, с позиций информационных преобразований - это отношение типа «внешний мир/внутренний мир», где внешний мир - среда, погруженная в E3, а внутренний мир - среда наблюдателя. Такому представлению соответствуют две ^-пирамиды с их ^-преобразованиями - ^-пирамида над полем рецепторов и ^-пирамида над планигоном (отметим, что конус и пирамида - это топологически эквивалентные объекты). Между этими пирамидами существует поток данных (по зрительному нерву). Поскольку поток данных на пути передачи не претерпевает изменений, то канал «информационно пуст» и допускает свое исключение из информационной модели. Результатом имеем два модельных представления [4]:

• конус на паре 0-пирамид, где основание одной - «экран» (окно), отображающий внешний пусть плоский мир, а основание другой - «экран» (или окно), отображающий внутренний пусть плоский мир. Общая вершина - это то, что мы считаем «своим Я»;

• пара противоположно ориентированных и совмещенных в цилиндре 0-пирамид по типу организации ^/-ячейки куба полных групп.

Пусть рецепторы упорядочены на регулярной решетке. Выделим на множестве NxN рецепторов ячейку размером 4x4 рецептора, над которой построим пирамиду (рис. 3, а). Такая организация обеспечивает на одной операции, реализуемой фильтром F0, сжатие данных в 16 раз. Если считать, что зрительная система на уровне сетчатки и ее нейронов обеспечивает сжатие данных (вне fovea, где коэффициент преобразования данных равен 1:1) порядка

100, то необходима еще одна такая структура, для которой уровень 3 предыдущей пирамиды станет уровнем 1 следующей (рис. 3, б). Тогда общий коэффициент сжатия на одной операции равен 162, а на двух - 128 (одна реализуется F0 и еще одна на фильтре из [F\, F2, F3}). Если ввести еще одну операцию из оставшегося подмножества {F,}, то получим значение коэффициента, равное 64, что близко к 100, так как 100 - это достаточно грубая и усредненная оценка [7]: в fovea 1:1, далее порядка 1:100, на дальней периферии существенно более 1:100.

Таким образом, для передачи данных по результату действия фильтра F0 и одного из подмножества {F,: i Ф 0} необходимы две пирамидальные структуры, которым можно поставить в соответствие два слоя нейронов над рецепторами сетчатки (последние также следует рассматривать как нейроны). В результате имеем модель реальной сетчатки глаза, но построенной на регулярной решетке. Такая модель верна по направлению z, но не в плоскости x0y.

Рис. 3. Модельные пирамидальные представления:

а - «рецепторная» пирамида; б - пирамида ганглиозной клетки над «рецепторными» пирамидами

с общим полем рецепторов 64x64 (1 - решетка рецепторов; 2 - первый слой обработки; 3 - последний слой обработки)

1

Разработанное модельное представление позволяет утверждать, что каждый нейрон сетчатки реализует однотипные операции обработки на множестве { Fi}, а различие, по крайней мере, с позиции только обработки по схеме «снизу-вверх», заключается в размерах области определения (т.е. в размерах рецепторных полей).

Теперь рассмотрим вариант решетки с увеличивающимся к периферии пространственным шагом: 1x1, 2x2, 4x4 и т.д. Такую решетку можно построить на основе регулярной. Пусть все поле рецепторов определено на планигоне 4x4, т.е. каждый рецептор находится в центре клетки планигона (рис. 4). Если размер планигона равен четырем единицам длины по осям x, у, то самые удаленные от центра планигона рецепторы распределены с шагом в одну единицу длины по x, у, т.е. упорядочены на решетке 1x1. Следующий ряд периферических рецепторов будет упорядочен во внутреннем квадрате 2x2 планигона на решетке 1/2 x 1/2. Центр планигона и его e-окрестность размером 1x1 - область «неразличимости» на планигоне 4x4, так как разрешающая способность планигона -клетка 1x1. Такая окрестность - «большая» точка - fovea, требующая перехода на следующий уровень разрешения. Для реального глаза это означает передачу данных от каждого рецептора fovea.

Рис. 4. Поле рецепторов:

1 - внешняя периферия; 2 - внутренняя периферия; 3 - fovea

Итак, имеем два модельных представления организации сетчатки - регулярная структура по рис. 3 и «пространственно-распределенная» структура по рис. 4. Для последней необходимо выделение рецепторных полей нейронов с построением над ними пирамид обработки данных. Для этого надо ввести в поле рецепторов дополнительные рецепторы, помещая их в узлы клеток планигона: для планигона 4x4 дополнительные рецепторы попали на углы квадратного поля fovea (относительно внешних периферических рецепторов) и в поле fovea (относительно внутренних периферических рецепторов). Поскольку эти рецепторы «принадлежат» fovea, то они - «колбочки», из которых составлена область ясного видения.

Правило 1. Пусть поле рецепторов размером NxN - планигон 4x4, а рецепторы упорядочены на пространственно-распределенной системе по закону 2й, где n = 1, 2, ... Тогда дополнительные до четырех рецепторы - это колбочки, отличающиеся от периферийных трех рецепторов (палочек) каким-либо параметром, верным для рецепторов области ясного видения.

4. Структурная организация сетчатки

Исключение из рассмотрения канала передачи данных предполагает некоторый уровень пересечения упакованных друг в друга конусов (усеченных пирамид). Этот уровень, в силу модели по рис. 2, а, задает «сечение канала передачи данных», либо планигон над полем рецепторов. Размер такого сечения зависит от геометрии связанных конусов (или пирамид с квадратным основанием), т.е. от величины угла при вершине: если, например, этот угол равен 90о, то имеем (в дискретном представлении) К-пирамиду (координатную пирамиду [4]).

Анализ геометрии базовой ^-пирамиды над К = К4 К4 = К планигоном проведен в работе [4], где показано, что

такая пирамида, построенная над квадратом - половина октаэдра, ребра которого (с углом при вершине в 90о) задают систему координат (х1, х2, x3, x4), а уровни K1, K2, K4, рассматриваемые как превышение над местностью, находятся в отношении

К4/К2/К1 = 0/(1/3)/1. Поэтому упакованные ^-пирамиды образуют «слой» толщиной А = h /3 между уровнями К2 этих пирамид, где может находиться планигон (рис. 5).

Пусть планигон находится на высоте h относительно основания ^-пирамиды, имеет размеры hxh; тогда допустимо модельное представление по рис. 6. Если это представление считать базовым, то относительно структурной организации получаем:

1) три уровня обработки данных - периферийный (3), промежуточный и центральный (на рис. 6 - это К1, К2, К4, где К2 представлен уровнем 1, а К4 = A

- «большая» точка 2);

2) два слоя нейронов с одинаковой упорядоченностью рецепторов на четырех склеенных рецепторных полях в пределах своих уровней, на которых могут функционировать только четыре фильтра - F0, F1, F2, F3. Третий слой третьего уровня (fovea) представлен четырьмя рецепторами, на которых функционирует F0, отображающий слой в точку A;

3) отношение числа рецепторных полей по уровням имеет вид 4/4/1. Если считать, что K1 - уровень периферийных рецепторов, а K4 - центральных, то имеем для K1 четыре поля и четыре нейрона над полями; для K4 - пять полей (и нейронов), из которых четыре - «поля периферические и поля центральные» и одно «точно центральное».

Правило 2. Пусть рецепторным полям, упорядоченным по схеме 4/4/1, соответствуют три уровня обработки данных - уровень периферийного зрения, промежуточного и цен-

А = h/3

Рис. 5. Упаковка двух g-пирамид

(aa - размер планигона)

трального соответственно. Пусть каждому полю соответствует свой обрабатывающий нейрон. Тогда «волновод» между полем рецепторов и полем отображений (проекций) центра -«трубчатая слоевая» координатно упорядоченная система линий связи.

Именно таковым свойством, как известно, наделен зрительный нерв, длина которого не более 50 мм. На рис. 7 показана организация «волновода или кабеля» упаковки линий связи. Если данную модель применить к базовой ^-пирамиде по рис. 3, а, где число рецепторов, образующих поле, должно быть не четыре, а 16, то принцип упаковки линий связи сохраняется, но возрастает число линий. В результате будем иметь (рис. 8): 1) «центральную жилу» -fovea; 2) внутренний слой с «крестом» линий связи промежуточного слоя; 3) внешний слой с «крестом» линий связи периферийного слоя.

б) в) Рис. 6. Структурная организация g-пирамиды по слоям рецепторов (а) и ее вид по оси глубины z (б, в):

1 - планигон по линии аа рис. 5; 2 - fovea, отображенная с помощью ^-преобразования в точку A уровня K4 пирамиды; 3 - £/-грамма в поле рецепторов (стрелками показаны направления проектирования; пунктирной линией - уровень K2 и его проекция на уровень K1)

верх

лево

право

Такая упаковка становится полной, поскольку отражена в координатном пространстве Е2 своими «крестами», но она требует согласования двух модельных представлений по рис. 3, а, где поле рецепторов имеет размер 4x4, и рис. 6, а с размером поля 2x2. Поэтому в базовую пирамиду по рис. 3,а необходимо введение уровня К2, которого там нет (аналогично для рис. 3, б). Но в этом случае в два раза уменьшится коэффициент сжатия. Для его поддержания необходимо отказаться от условия, что нейроны рецепторных полей выполняют две функции, соответствующие фильтру и одному из {Рг}.

Результатом имеем два варианта функционирования пирамидальной модели сетчатки:

Алгоритм 1. Все нейроны всех уровней -«обычные» сумматоры (тонические нейроны), реализующие ^-преобразование и не более.

Алгоритм 2. Цикл зрительного восприятия, в первом приближении, разделен на два такта. В первом все нейроны реализуют ^-преобразование с синхронной передачей данных в центр. Во втором все нейроны (кроме области ясного видения) реализуют ^-преобразование с передачей результата разложения в центр (фазические нейроны).

Естественно, что возможны варианты: например, все периферические нейроны реализуют только ^-преобразование. Тогда для оценки общей освещенности при решении задачи идентификации фона (день/ночь) потребуются дополнительные нейроны типа горизонтальных клеток сетчатки глаза. В любом случае выбор того или иного конкретного варианта функционирования и состава нейронов зависит от прикладного назначения сетчатки и нами не рассматривается.

низ

Рис. 8. Упаковка линий связи для модели зрительного нерва

5. Функциональная организация сетчатки

Пусть слоям рецепторов и уровням ^-пирамиды по рис. 6, в соответствуют поля «интереса» (рис. 9, а):

1 - слой и уровень 1 относительно остальных - поле «дальнего обнаружения», а зона периферийных рецепторов, упорядоченных на проекции уровня K2 (рис. 6, а), - поле «малого интереса» и одновременно - поле «дальнего контроля»;

2 - слой и уровень 3, одновременно зона промежуточных рецепторов - поле «ближнего обнаружения» и поле «заинтересованности»;

3 - слой и уровень 2 - fovea - поле и зона максимального «интереса».

\____ \У____/

X4 V ж N *

3

/ 2

-[ 1

а)

k А Л А

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

б)

Рис. 9. Структурная организация сетчатки на матрице 16x16:

а - поля интересов (1, 2, 3); б - укладка рецепторных полей

2

X

X

В результате на матрице 8x8 имеем три зоны (рис. 9, а) - дальнюю, ближнюю, центральную, число рецепторных полей которых относится как 12/4/1. Такая структурная организация не отвечает изложенным требованиям, так как в ней появились «лишние» рецептор-ные поля - «ушки», отражающие геометрию квадрата, а не окружности (см. рис. 8), т.е. поя-

12 3 4

вились поля рецепторов, «контролирующие» диагональные направления - х , х , х , х .

Подобным образом функционально и структурно организованная сетчатка, позволяющая «контролировать» диагональные направления, является архитектурой системы «сетчатка». Поскольку в пространстве (речь идет не просто об укладке рецепторов на поверхности сетчатки, о чем пока говорится только в первом, очень грубом приближении, см. рис. 6, а, в) - это пирамида, то видимое на рис. 9, б диагональное рецепторное поле (по каждому направлению хг) предполагает существование невидимого (в проекции) диагонального поля. Это связывает два соседних уровня ^-пирамиды, например, уровни К1 и К2. В результате «процесс распространения интереса образует конус Маха». На четырех диагональных направлениях в четырех квадрантах сетчатки имеем четыре таких конуса (рис. 10). Таким образом организованная сетчатка позволяет объяснить существование двух «дефектов» зрения [8]: 1) астигматизм именно по направлениям 5 (см. рис. 10); 2) цилиндрическую дистор-сию по вертикали и горизонтали (см. рис. 8).

Утверждение 1. Диагональные направления планигона, на котором заданы направления верх/низ, лево/право, - градиентные направления интереса, а им обратные - направления внимания.

1, 2 - верх, низ; 3, 4 - лево, право; 5 - направления распространения «интереса»;

А, В, С - зоны интересов

Заключение

Построена модель организации сетчатки глазного яблока как системного целого в ее взаимодействии со зрительными отделами головного мозга (определение 1), позволяющая выделить следующие задачи управления по обратной связи для технических систем (часть задач рассмотрена в работах [4, 5]):

• управление процессом дополнительной передачи данных;

• управление процессами сжатия или расширения поля зрения на планигоне;

• управление видеоглазом по внешней обратной связи с учетом поступающих данных;

• управление «зрачком» видеоглаза (по внешней обратной связи);

• реализация механизма саккад, тремора и дрейфа (при необходимости);

• отключение видеоглаза с сохранением «картинки» в буферной оперативной памяти. Представлены модельные варианты пространственной ориентации слоя рецепторов

сетчатки, позволяющие реализовать процедуру сжатия данных для их передачи в центр обработки и упорядочить отношения между двумя классами рецепторов (правило 1).

Рассмотрены вопросы структурной и функциональной организации сетчатки, позволяющие:

• выделить периферийные и центральные поля сетчатки в их представлении на плани-гоне (правило 2);

• сформулировать алгоритмы функционирования пирамидальной модели сетчатки;

• отметить специфику диагональных направлений сетчатки, представленной на плани-гоне (утверждение 1).

Библиографический список

1. Рубин, А.Б. Биофизика: В 2-х т. Т. 1. Теоретическая биофизика / А.Б. Рубин. - М.: Книжный дом «Университет», 1999. - 448 с.

2. Утробин, В.А. Информационные модели системы зрительного восприятия для задач компьютерной обработки изображений / В.А. Утробин; НГТУ. - Н. Новгород, 2001. - 234 с.

3. Утробин, В.А. Компьютерная обработка изображений. Анализ и синтез / В.А. Утробин; НГТУ. - Н.Новгород, 2003. - 228 с.

4. Утробин, В.А. Компьютерная обработка изображений. Принятие решений в пространстве эталонов / В.А.Утробин; НГТУ. - Н. Новгород, 2004. - 221 с.

5. Утробин, В.А. Компьютерная обработка изображений: Информационные модели этапа понимания / В.А. Утробин; НГТУ. - Н.Новгород, 2006. - 247 с.

6. Утробин, В.А. Информационная модель многомерной ячейки памяти // Системы обработки информации и управления. Труды НТГУ. 2004. С. 21-31.

7. Джордж, Ф. Мозг как вычислительная машина / Ф. Джордж. - М.: Изд-во иностр. литр-ра, 1963. - 528 с.

8. Ивенс, Р.М. Введение в теорию цвета / Р.М. Ивенс. -М.: Мир, 1964. - 184 с.

Дата поступления в редакцию 06.07.2010

V.A. Utrobin

INFORMATION MODELS OF THE EYEBALL RETINA ORGANISATION

Considered architectural aspects of the eyeball retina organization from positions of the theory of active perception. Investigated properties of system «the retina - the center» as a whole. Variants of the structural and functional organisation of a retina are resulted.

Key words: visual perception, information model of a retina, the retina organisation.

i Надоели баннеры? Вы всегда можете отключить рекламу.