УДК 004.922: 681.7 А.М. Ковалев
КТИ НП СО РАН, Новосибирск О СТРУКТУРЕ ВИЗУАЛЬНОГО ПРОСТРАНСТВА
Известно, что изображение окружающей среды, получаемое от камеры, снабженной оптическим объективом, не соответствует естественному зрительному восприятию той же среды человеком. Показано, что искажения масштабов предметов и глубины пространства могут достигать сотни процентов, как на малых, так и на больших расстояниях [1]. Ошибки происходят из-за того, что объектив камеры строит двумерное (2М) изображение с фиксированным фокусным расстоянием, в то время как зрительная сенсорная система создает трехмерное (3М) изображение, работая с переменным фокусным расстоянием [2]. При этом в сознании человека формируется визуальное пространство, внутренняя геометрия которого является гиперболической геометрией Лобачевского [3].
Визуальное пространство (ВП) может быть представлено как конечный результат ряда процессов: физических, физиологических, психофизических и когнитивных [3]. Процесс видения можно условно разделить на три этапа:
1. Сбор информации сенсорной подсистемой зрения;
2. Построение сенсорной модели;
3. Формирование собственно ВП.
На первом этапе путем сканирования пространства предметов остронаправленным взглядом [2], во-первых, строится 2М сетчаточный образ пространства. Во-вторых, оцениваются расстояния до предметов по признакам глубины - прямым и косвенным. Прямые признаки глубины стимулируют аккомодацию глаз, их конвергенцию и стереоскопическую диспарантность. К косвенным признакам относят: окклюзии; уменьшение размеров и смещение к горизонту предметов при их удалении; уменьшение контраста и градиента текстуры при увеличении расстояния; двигательный параллакс. Практика показывает, что сенсорная подсистема дает верную информацию о расстояниях до предметов, причем с необходимой для зрительной системы точностью.
На втором этапе построения ВП сетчаточный образ согласно психофизическому закону Эммерта испытывает «растяжение» по размеру и глубине, пропорционально воспринимаемым расстояниям до предметов. Как показано в [2,3] эти расстояния определяются оптической силой редуцированного аккомодирующего глаза, представленного в виде тонкой линзы
1/f = 1/r +1/d, (1)
где f - фокусное расстояние; r - расстояние до предмета; d -гиперфокальное расстояние, или «начало» бесконечности. Величина d - это личностная константа наблюдателя, варьируемая в пределах от 3 до 6 м. Если учесть фиксацию предметов в разных точках пространства, заданного в
полярной системе г, в, ф с началом координат в центре проекции, то можно получить преобразование вида [3]
ГС
ц = ^ = 777, вц = в, фц = ф, (2)
где ц - воспринимаемое расстояние; т - масштабный коэффициент; с = dm; вц, фц - угловые координаты. Итак, на втором этапе при помощи (2) строится пространственный образ окружающей среды, или проективная сенсорная модель.
В [2, 3] обнаружено совпадение сенсорной модели с моделью пространства Лобачевского по Клейну в определении плоскости, прямой и движений [4]. Тождественность моделей дает основание считать, что ВП имеет неевклидову метрику. Через изображение на модели оба пространства - Евклида и Лобачевского - оказываются взаимно-однозначно связанными. Таким образом, преобразование (2) переводит евклидово пространство в пространство модели Клейна. При г^ж ц^с и поэтому пространство на модели Клейна занимает внутренность шара с радиусом с.
От модели Клейна легко перейти к модели Пуанкаре с помощью стереографической проекции [4]. При этом возникает конформное отображение вида 2д
р = і+1/Й^Т вр =в*
-ка-ы;е?’ р вв' фр ф (3)
При г^да, д^с р^2с и, таким образом, пространство на модели Пуанкаре занимает внутренность шара с радиусом 2с.
Наконец, от моделей Клейна и Пуанкаре можно перейти к гиперболическому пространству Лобачевского [3]
р = оЛтік (д/с) = 2сЛтік (р/2с) = — 1п
А тл
1 + 2 -
V ^ у
= ф. (4)
Таким образом, на третьем этапе процесса видения формируется визуальное пространство, внутренняя геометрия которого является неевклидовой. Полная гауссова кривизна ВП постоянна и равна К = 1/(/с) , где ¡с - мнимый радиус. ВП - метрическое пространство, которое локально евклидово. Несмотря на «мнимость» координатных поверхностей, расстояние между двумя точками вдоль прямой, или геодезической является действительной величиной. Формулы (2, 3, 4) определяют расстояние до точки вдоль радиального направления от начала координат - оптического центра глаза. Этого достаточно для построения и исследования пространственного образа трехмерной сцены.
Дальнейшее уточнение рассмотренных моделей связано с проблемой «иллюзии Луны». Эта проблема занимает умы ученых более 20 веков и остается нерешенной до настоящего времени. В структуре изотропного ВП «бесконечно» удаленные объекты такие, как звезды, солнце и луна, располагаются на поверхности, близкой к предельной сфере, орисфере, а
значит, по закону Эммерта имеют размеры, независимые от возвышения над горизонтом. Но на деле это не так. Всем известно, что на восходе или закате луна и солнце больше, чем в средней части неба или в зените. В [3] отмечено, что возникает анизотропия ВП по углу возвышения, или широте в, и это показано в экспериментах Кауфманов с искусственными лунами [5]. При в = 45° среднее расстояние до предельной поверхности равно d = 3.65 м, что в 1.5 раза меньше, чем при в = 1.5° ^ = 5.47 м). К сожалению, по двум точкам Кауфманов невозможно определить достоверный вид предельной поверхности. Однако можно предположить, что - это не сфера, а равномерно сжатая по вертикали сфера, или сфероид.
В [6] рассмотрена модель анизотропного визуального пространства, занимающая внутреннюю область сфероида. Пусть в прямоугольной декартовой системе координат XYZ задан сжатый эллипсоид вращения (сфероид) каноническим уравнением вида
где а - большая полуось; Ь - малая полуось. В полярной системе координат, начало которой совпадает с оптическим центром глаза, сфероид может быть задан гиперфокальным расстоянием dв, широтой в и долготой ф
Отображение евклидовой точки г,в,ф в область сфероида запишем в виде
где g - радиальное расстояние от наблюдателя до изображения точки. Очевидно, что расстояние g не может превысить гиперфокальное расстояние dв, поскольку при г^ ж g^ dв. Спроектируем все видимые точки евклидового пространства внутрь сфероида (6) и получим, с одной стороны, изображение окружающей среды, а, с другой - анизотропную модель ВП, совпадающую с моделью гильбертова гиперболического пространства. Во всех горизонтальных гиперплоскостях, параллельных плоскости визирования вё = в = 0, модель становится изотропной и совпадает с моделью Клейна для
плоскостей Лобачевского. При надлежащем выборе аффинных координат % =
2 2 2
х/а, и = у/Ь, £ = ^/а уравнение сфероида (5) можно записать в виде % + и + £ = 1. Тогда и в любом меридиональном сечении сфероида эллипс можно рассматривать как единичную окружность в евклидовой метрике. Итак, с точностью до аффинного преобразования гильбертово пространство совпадает с пространством Лобачевского. Это означает, что наряду с проективной моделью согласно (7) можно построить и конформное отображение Пуанкаре вида
(X + Х)/а1 + у2/Ь2 = 1,
(5)
£
, р = aтcіg —
(6)
(7)
где с>0 - радиус гауссовой кривизны, определенной выше.
На рис. показано проективное (а) и конформное (Ь) изображение глобальной структуры анизотропного пространства в меридиональном сечении. Начало координат ассоциируется с расположением внутреннего «Я» наблюдателя, главная зрительная ось совпадает с координатной осью Ъ.
Рис.1 Анизотропное ВП: а - проективная модель; Ь - конформная модель:
1 - земля; 2 - окружности; 3 - евклидова параллель оси Ъ; 4 - эквидистанта;
5 - геодезическая; 6 - небосвод; 7 - луна на закате; 8 - бисекция небосвода
Отличие визуального пространства в том, что в окрестности наблюдателя оно изоморфно и даже изометрично евклидовому пространству. Поэтому на малых расстояниях (до 2-4 м) предметы воспринимаются практически в натуральных размерах. На больших расстояниях (более 10 м) предметы в 2-4 раза больше «оптических». Если предметами являются луна или солнце, то их размер пропорционален гиперфокальному расстоянию dв. Из (6) относительное увеличение (по отношению к зениту) в сенсорной модели равно
^в 1 Ув= ~Т= I 2 2 , (9)
Ь л/1 -£ СОБ в
где £ = - эксцентриситет сфероида. При конформном
отображении возникает угловое увеличение, равное Vо [6]. Луна (солнце) на горизонте больше, чем в зените в 1.87-3.5 раза. В расчетах использовался сфероид с полуосями: а = 2.927 м и Ь = 5.475 м, которые получены по усредненным данным экспериментов Кауфманов [5].
N1
Дальнейшее уточнение рассмотренных моделей связано, во-первых, с экспериментальным определением формы предельной поверхности ВП, которая, в сущности, является личностной функцией наблюдателя. Во-вторых, требуется выявление особенностей бинокулярного зрения на расстояниях меньше 1 м, где проявляется эффект обратной перспективы.
В заключении необходимо отметить некоторые существенные, на наш взгляд, области приложения полученных знаний:
1. общая теория перспективы, как искусство изображения на плоскости трехмерного пространства, приближенного к естественному зрительному восприятию. Разработка групп линейных и нелинейных перспектив, в том числе для компьютерной графики и 3М дисплеев с ограниченной глубиной дисплейного пространства;
2. конвергенция технического и когнитивного зрения. Разработка систем когнитивного зрения в узком и широком смысле этого слова. Когнитивное зрение в узком смысле - это достоверное, естественное и комфортное зрительное восприятие для надежного распознавания визуальной обстановки человеком-оператором при решении задач визуального контроля и управления, в том числе дистанционного. Когнитивное зрение в широком смысле - это техническое зрительное восприятие и распознавание образов, обучение и встраивание в различные системы с искусственным интеллектом.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Ковалев А.М. Оценка искажений предметов при отображении перцептивного пространства на картинную плоскость / А.М. Ковалев // Автометрия. - 2004. - Т. 40. - № 6. - С. 87-100.
2. Ковалев А.М. О моделях визуального пространства / А.М. Ковалев // Оптика и спектроскопия. - 2006. - Т. 100. - № 1. - С. 134-141.
3. Ковалев А.М. Описание визуального пространства в моделях Клейна и
Пуанкаре/ А.М. Ковалев // Автометрия. - 2006. - Т. 42. - № 4. - С. 57-66.
4. Клейн Ф. Неевклидова геометрия / Ф. Клейн. - М.;Л.: ОНТИ, 1936.
5. Kaufman L., Kaufman J.H. Explanation the moon illusion // Proceedings of the
National academy of Sciences of the USA. 2000. 97, № 1. - С. 500-505.
6. Ковалев А.М. Об анизотропной модели визуального пространства/ А.М. Ковелев // Автометрия. - 2006. - Т. 42. - № 6. - С. 53-62.
© А.М. Ковалев, 2007