Научная статья на тему 'Механизмы и погрешности восприятия 3D-пространства зрительной системой'

Механизмы и погрешности восприятия 3D-пространства зрительной системой Текст научной статьи по специальности «Медицинские технологии»

CC BY
800
182
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
3D-ИЗОБРАЖЕНИЕ / СТЕРЕОСКОПИЧЕСКОЕ ИЗОБРАЖЕНИЕ / КОНВЕРТАЦИЯ / 2D-ИЗОБРАЖЕНИЕ / ВИДЕО / 3D-ФОРМАТ / 3D-IMAGE / STEREOSCOPIC IMAGE / CONVERSION / 2D FORMAT / VIDEO / 3D FORMAT

Аннотация научной статьи по медицинским технологиям, автор научной работы — Красильников Николай Николаевич

Постановка проблемы: отсутствие четких представлений о том, как формируется ощущение глубины пространства в зрительной системе человека, принуждает каждый раз опытным путем определять, возможно ли получить желаемый стереоскопический эффект при съемке данной сцены, и если да, то при каких параметрах. Цель статьи состоит в выявлении существенных для решения данной проблемы особенностей зрительного восприятия глубины 3D-пространства. Результаты: теоретические и экспериментальные исследования показали, что при небольших расстояниях наблюдения механизм зрения, основанный на стереоскопическом эффекте, позволяет оценивать расстояния до объектов с меньшей погрешностью, чем механизм зрения, основанный на перспективных преобразованиях. При больших расстояниях имеет место обратная ситуация. Предложена и экспериментально подтверждена гипотеза, которая объясняет возникновение ощущения глубины пространства при наблюдении реальных сцен и стереоскопических изображений «конвергенционно-дивергенционными» движениями глаз, что позволило разработать методику определения оптимальных условий стереоскопической съемки для достижения максимального стереоэффекта, а также методику выбора оптимальных параметров конвертации изображений и видео из 2D-формата в 3D-формат. Показано, что карта глубины стереоскопического изображения допускает весьма большие погрешности, не приводящие к заметным искажениям результирующего изображения. Практическая значимость: полученный результат делает возможным выполнение коррекции имеющихся стереоскопических изображений и фильмов. Знание факта, что карта глубины стереоскопического изображения допускает весьма большие погрешности, не приводящие к заметным искажениям результирующего изображения, позволяет существенно упростить процедуру конвертации 2D-изображения в 3D-изображение.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Mechanisms and Inaccuracies of 3D Spatial Perception by Visual System

Purpose: The lack of clear ideas about how the human visual system forms the sensation of spatial depth forces us to experimentally determine while shooting every scene whether it is possible to obtain the desired stereoscopic effect, and if so, under what parameters. The aim of this article is to identify the features of visual perception of 3D spatial depth essential to resolve this problem. Results: Theoretical and experimental studies have shown that at short observation distances the vision mechanism based on the stereoscopic effect allows us to estimate distances to objects with lesser errors than the vision mechanism based on perspective transformations. At long distances, the situation is reversed. An hypothesis was proposed and experimentally confirmed which explained how the sensation of spatial depth appears while watching real scenes and stereoscopic images by "converging-diverging" eye movements. This led to the development of a method determining the optimal conditions of stereoscopic shooting giving the best stereo effect, as well as the technique of choosing the optimal parameters of image/video conversion from 2D into 3D. It was shown that the depth map of a stereoscopic image tolerates significant inaccuracies which do not lead to any noticeable distortion of the resulting image. Practical relevance: The obtained result makes it possible to correct the existing stereoscopic images and movies. When we know that the depth map of a stereoscopic image tolerates inaccuracies without any noticeable distortion, we can considerable simplify the procedure of converting 2D images into 3D.

Текст научной работы на тему «Механизмы и погрешности восприятия 3D-пространства зрительной системой»

УДК 612.843,721

МЕХАНИЗМЫ И ПОГРЕШНОСТИ

ВОСПРИЯТИЯ ЭР-ПРОСТРАНСТВА ЗРИТЕЛЬНОЙ СИСТЕМОЙ

Н. Н. Красильникова, доктор техн. наук, профессор

аСанкт-Петербургский государственный университет аэрокосмического приборостроения, Санкт-Петербург, РФ

Постановка проблемы: отсутствие четких представлений о том, как формируется ощущение глубины пространства в зрительной системе человека, принуждает каждый раз опытным путем определять, возможно ли получить желаемый стереоскопический эффект при съемке данной сцены, и если да, то при каких параметрах. Цель статьи состоит в выявлении существенных для решения данной проблемы особенностей зрительного восприятия глубины 30-пространства. Результаты: теоретические и экспериментальные исследования показали, что при небольших расстояниях наблюдения механизм зрения, основанный на стереоскопическом эффекте, позволяет оценивать расстояния до объектов с меньшей погрешностью, чем механизм зрения, основанный на перспективных преобразованиях. При больших расстояниях имеет место обратная ситуация. Предложена и экспериментально подтверждена гипотеза, которая объясняет возникновение ощущения глубины пространства при наблюдении реальных сцен и стереоскопических изображений «конвергенционно-дивергенционными» движениями глаз, что позволило разработать методику определения оптимальных условий стереоскопической съемки для достижения максимального стереоэффекта, а также методику выбора оптимальных параметров конвертации изображений и видео из 2й-формата в Эй-формат. Показано, что карта глубины стереоскопического изображения допускает весьма большие погрешности, не приводящие к заметным искажениям результирующего изображения. Практическая значимость: полученный результат делает возможным выполнение коррекции имеющихся стереоскопических изображений и фильмов. Знание факта, что карта глубины стереоскопического изображения допускает весьма большие погрешности, не приводящие к заметным искажениям результирующего изображения, позволяет существенно упростить процедуру конвертации 2й-изображения в Эй-изображение.

Ключевые слова — Эй-изображение, стереоскопическое изображение, конвертация, 2й-изображение, видео, Эй-формат.

Введение

С середины первого десятилетия 21 века начинают интенсивно развиваться и внедряться в быт и промышленность ЭБ-технологии, в том числе технологии получения и демонстрации стереоскопических статичных изображений и видео. Сюда, в частности, относится открытие ЭБ-кинотеатров, появление в продаже доступных по цене ЭБ-телевизоров, ЭБ-фотокамер, приборов и приложений для конвертации 2Б-изображений и видео в ЭБ-формат, услуг по изготовлению в ЭБ-формате растровых фотографий, а также продажа расходных материалов и оборудования для их изготовления. Отметим, что, строго говоря, во всех перечисленных случаях речь идет о стереоскопических изображениях, а термин ЭБ используется, скорее, в рекламных целях. Одновременно в Интернете появилось множество публикаций на эту тему, в том числе и на профессиональном уровне. В этих публикациях рассматриваются технологические особенности получения стереоскопических фотографий, а также съемки и технологии монтажа ЭБ-фильмов. Особенное место занимают публикации, касающиеся конвертации фотографий и фильмов в ЭБ-формат [1-Э], а также многочисленные сайты, предлагающие скачать приложения для конвертации. В большинстве публикаций обычно приводятся лишь самые общие сведения об ис-

пользуемых методах [4, 5], что же касается предлагаемых приложений, то результаты их работы оставляют желать лучшего, в чем нетрудно убедиться путем их применения.

Касаясь ситуации в России в этой области, отметим, что, по оценке журнала «Деньги», в России рынок профессиональной ЭБ-визуализации по состоянию на 2010 г. отставал от мирового лет на 5-10, более поздних оценок найти не удалось [6]. В частности, в журнале говорится, что развитие ЭБ-технологий в России тормозит проблема дефицита на рынке ЭБ-специалистов и отсутствие узкоспециализированного образования в этой отрасли.

Характеризуя ситуацию, сложившуюся в этой области, следует отметить, что одной из причин, тормозящих развитие ЭБ-кинотеатров и ЭБ-телевидения, является недостаточное количество ЭБ-контента, которое, в свою очередь, обусловлено трудностями стереоскопической съемки. Отсутствие четких представлений о том, как формируется ощущение глубины пространства в зрительной системе человека, принуждает каждый раз опытным путем определять, возможно ли получить желаемый стереоскопический эффект при съемке данной сцены, а если да, то при каких параметрах. Эти же трудности возникают при конвертации 2Б-фильмов в ЭБ-формат с той разницей, что переснять плохо конвертирующиеся сцены уже невозможно. Сказанное

полностью относится и к получению 3Б (стерео) фотографий.

В случае наблюдения 3Б-изображений, в отличие от наблюдения 2Б-изображений, у зрителя в дополнение к оценке расстояния до каждого из изображенных объектов возникает еще ощущение глубины пространства благодаря бинокулярному зрению. Для прояснения ситуации рассмотрим проблему подробнее. Вначале рассмотрим работу механизмов, посредством которых в зрительной системе осуществляется оценка расстояния до каждого из объектов при наблюдении 3Б-сцены, а затем механизм, создающий ощущение глубины пространства.

Оценка расстояния до наблюдаемого объекта

Известно, что расстояние до наблюдаемого объекта зрительной системой человека оценивается рядом механизмов, погрешности которых сильно различаются между собой. Перечисляя кратко, отметим механизмы, основанные на:

— определении размера проекций наблюдаемого объекта на сетчатки глаз при условии, что истинный размер объекта априори известен;

— явлении стереоскопического эффекта, который обусловлен тем, что глаза зрителя разнесены по горизонтали на величину базы;

— использовании явления аккомодации глаз;

— использовании воздушной перспективы.

Для того чтобы судить о роли этих механизмов при оценке расстояния до наблюдаемого объекта зрителем, найдем погрешность определения расстояния каждым из этих механизмов.

При определении расстояния до объекта первым из перечисленных выше механизмов оценка погрешности обусловлена двумя статистически независимыми источниками.

Во-первых, зритель не способен хранить в зрительной памяти абсолютно точные размеры объекта, например его высоту И, а запоминает их с некоторой погрешностью ДИ. Это приводит к погрешности оценки расстояния до объекта ДЬИ

Во-вторых, вследствие дискретного строения сетчатки, которое ограничивает остроту зрения углом Рпор, зрительная система не может абсолютно точно оценить размеры проекции объекта на сетчатку, а выполняет это с некоторой погрешностью Д^пор.

Поскольку оба источника погрешности статистически независимы, результирующая погрешность находится путем суммирования их дисперсий с последующим извлечением квадратного корня:

ДЬлерсп =у!Д4ор + ДЬН ■

(1)

хп уп 2п

Центр зрачка

Передняя плоскость изображения

У о 2 о

Уо

I Ь

■ Рис. 1. Модель оптической части глаза в виде модели камеры с передней плоскостью изображения

Переходя к выводу формул для расчета компонента погрешности ДЬИ, представим оптическую часть глаза зрителя в виде модели камеры с передней плоскостью изображения (рис. 1). На этом рисунке жирными линиями показан объект А (вертикальная линия), координаты верхней точки которого хо, уо, 2о, и его проекция А', координаты верхней точки которой хп, уп, 2п. Кроме того, через Ь обозначено фокусное расстояние зрачка глаза. Введем еще ряд дополнительных обозначений: И — высота объекта: И = уо; Н — высота проекции объекта: Н = уп; Ь — расстояние от объекта до объектива камеры: Ь = 2 0 + Ь

Найдем вначале выражение для составляющей погрешности ДЬИ, для чего составим очевидную пропорцию

Н = Н + ДН Ь Ь + ДЬН '

решая которую относительно ДЬИ получим

ДН

ДЬН = Ь-

Н

(2)

Перейдем теперь к выводу формулы для расчета второго компонента погрешности оценки расстояния до наблюдаемого объекта ДЬпор рассматриваемым механизмом зрительной системы. Из подобия треугольников уо, 2о, I и уп, 2п, I следует, что

Уп = -УУ- ■ «о + У

Учитывая, что расстояние от объекта до зрачка, как было отмечено, Ь= 2о + Ь, запишем

(3)

Ь = щ/н.

Поскольку причиной погрешности оценки расстояния до объекта ДЬпор в рассматриваемом случае является погрешность определения размера его проекции на сетчатки глаз ДН, обусловленная их дискретной структурой, то, как нетрудно

У

хо = 0

0

2

о

х

видеть, ошибочное определение величины проекции к + Ак дает значение расстояния

Ь - А^ор = ^ ■ (4)

к + АН

Решая это уравнение относительно АЬпор, находим

к к + АН

что с учетом формулы (Э) после несложных преобразований дает

АЬпор = ЬАк/ (к + АН).

Разделим числитель и знаменатель этой формулы на f:

АкЫ

АЬп°р = Ь--.

кЫ + Ак//

Поскольку h/f = И/Ь, что следует из подобия треугольников, то, заменяя в формуле h/f на И/Ь, будем иметь

АкЫ

АЬп°р = Ь--.

Н/Ь + АкЧ

Величина Аh/f имеет смысл углового размера между двумя колбочками, спроецированными на плоскость, перпендикулярную оси наблюдения и совмещенную с объектом, т. е. угла, определяющего остроту зрения Рпор, который равен приблизительно одной минуте. С учетом этого запишем

АЬп°р = ЬРп°^ (Н/Ь + р:

^п°р

(5)

Результирующая погрешность оценки расстояния до наблюдаемого объекта рассматриваемым механизмом зрительной системы, АЬперсп, вычисляется по формуле (1).

Перейдем теперь к выводу формулы для оценки погрешности расстояния до наблюдаемого объекта посредством механизма бинокулярного зрения. В качестве наблюдаемого объекта возьмем точку N (рис. 2), удаленную от линии, соединяющей зрачки левого ЗЛ и правого ЗП глаз наблюдателя, на расстояние Ь. Вследствие того, что зрачки глаз смещены по горизонтали друг относительно друга на величину базиса Ь, равного примерно 65 мм, их проекции на сетчатках глаз п1 и п2 также оказываются смещенными. В рассматриваемом примере на сетчатке левого глаза СЛ проекция точки смещена влево от центра сетчатки на величину а1, а на сетчатке правого глаза СП смещена вправо на величину а2. Сумма этих смещений называется линейным параллаксом:

р = А-Ь = а1+а2.

(6)

N

* Ь \ Ь

ЗЛ ЗП

СЛ П1 / \ \П2 , СП

А

■ Рис. 2. Схема бинокулярного наблюдения

Из подобия треугольников n1Nn2 и ЗЛNЗП следует, что Ь/А = Ь/(Ь + следовательно:

Ь = Ы/(А - Ь).

Принимая во внимание равенство (6), получим окончательно

Ь = ЬЦр.

(7)

Обратим внимание на то, что формулы (Э) и (7) имеют идентичную структуру. Следствием этого является то, что и формула для оценки погрешности измерения расстояния до наблюдаемого объекта на основе механизма бинокулярного зрения будет иметь структуру, идентичную структуре формулы (5), в чем нетрудно убедиться:

АЬ,

'стерео

= ЬРп°р/ (Ь/Ь+р:

(8)

В обоих случаях формулы для определения погрешностей различаются первыми слагаемыми знаменателей: в одной Ь/Ь, в другой И/Ь.

График зависимости величин погрешностей от расстояния наблюдения для двух сравниваемых механизмов зрения приведен на рис. Э. Расчет произведен по формулам (1), (2), (5) и (8). При расчетах приняты следующие исходные данные: Рпор = 0,00029, Ь = 0,065 м, АН/И = 0,05. Кривые 1, 2, 3 построены для И = 1; 0,5 и 0,2 м соответственно. Из графика следует, что при расстояниях наблюдения примерно до 11 м механизм зрения, основанный на стереоскопическом эффекте, позволяет оценивать расстояния до объектов с меньшей погрешностью, чем механизм зрения, основанный на перспективных преобразованиях, в то время как при больших расстояниях имеет место обратная картина. Практика полностью это подтверждает.

Что касается оценки расстояния, обеспечиваемой другими перечисленными механизмами

ДЬ, м 1,00 0,75 0,50 0,25 0

0 5 10 15 20 Ь, м

■ Рис. 3. Зависимости погрешности оценки дальности до объекта от расстояния наблюдения для механизма, использующего явление перспективных преобразований (кривые 1, 2, 3), и для механизма, использующего явление параллакса(кривая 4)

зрения, то погрешности, с которыми они это делают, несопоставимо больше погрешностей рассмотренных механизмов зрения, и поэтому рассматривать их в данном контексте не имеет смысла.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Механизм формирования глубины пространства при наблюдении 3D-сцен и стереоскопических изображений

Из физиологии зрения известно, что при наблюдении сцены или изображения оптические оси глаз совершают содружественные саккадиче-ские движения с интервалом около 50-60 мс [7]. Эксперименты Ярбуса показали, что при этом оси зрения фиксируются на световых границах объектов наблюдаемой сцены. Изображения, приведенные на рис. 4, а, б, иллюстрируют это.

■ Рис. 4. Наблюдаемое изображение (а) и траектории и точки фиксации оптической оси глаза при наблюдении изображения (б)

Для объяснения механизма возникновения у зрителя ощущения глубины пространства при наблюдении 3Б-сцен и стереоскопических изображений нами была выдвинута следующая гипотеза.

При рассматривании стереоскопического изображения оптические оси левого и правого глаз зрителя постоянно и синхронно сканируют это изображение, оставаясь в плоскости, параллельной линии надбровья. В момент пересечения вертикальных, или содержащих вертикальную составляющую, световых границ, образуемых изображенными объектами, они одновременно фиксируются на них в одних и тех же точках. При фиксации в зрительную систему посылается сигнал об угле между оптическими осями глаз, получив который, зрительная система «вычисляет» дистанцию от зрителя до точки фиксации на изображенном объекте. Благодаря тому, что при наблюдении стереоскопического изображения глаза зрителя в процессе сканирования постоянно совершают «конвергенционно-дивергенцион-ные» движения, а зрительная система постоянно «вычисляет» дистанции от зрителя до точек фиксации на изображенных объектах, создается ощущение глубины пространства. При рассматривании плоской картины такого ощущения не возникает вследствие отсутствия «конвергенци-онно-дивергенционных» движений глаз при ее сканировании, хотя определение расстояния до изображенных объектов у зрителя затруднения не вызывает. Эти же процессы протекают в зрительной системе и при наблюдении 3Б-сцен.

Выдвинутая гипотеза подтверждается экспериментально. Знание этого механизма позволяет избегать неудачных композиций кадров при стереоскопической съемке фотографий и видео. Проиллюстрируем сказанное примерами.

1. Для возникновения у зрителя ощущения глубины пространства необходимо, чтобы в его поле зрения присутствовали резкие вертикальные световые границы рассматриваемых объектов или, по крайней мере, границы, включающие в себя «вертикальную составляющую», например, достаточно крутые наклонные границы. Пример 2Б-изображения такой сцены показан на рис. 5 [9], а ее 2Б цветное и стереоскопическое изображения в анаглифном формате приведены на рис. П1 и П2 приложения, размещенного на сайте [8]. Отметим, что размытие границ, например вследствие плохой фокусировки, сильно снижает стереоэффект.

2. Если в фотографируемой сцене отсутствуют объекты с вертикальными или содержащими вертикальную составляющую границами, то при стереоскопической съемке такой сцены левое и правое изображения стереопары не будут между собой различаться. Поэтому изображение, полу-

■ Рис. 5. Пример изображения сцены, содержащей резкие вертикальные световые границы и границы, включающие в себя «вертикальную составляющую», для которой может быть создано стереоскопическое изображение

■ Рис. 6. Пример изображения сцены, не содержащей вертикальных световых границ, для которой невозможно создать стереоскопическое изображение

чившееся в результате фотографирования, не будет вызывать ощущение глубины пространства (рис. 6) [10].

3. Рассмотрим теперь с позиций выдвинутой гипотезы так называемый «эффект отжатия рамкой», хорошо известный кинематографистам, снимающим стереофильмы. Этот эффект заключается в том, что если снимаемый объект выходит за вертикальные границы кадра, ощущение глубины пространства ослабляется, при этом ослабление тем сильнее, чем большая часть объекта оказывается за пределами кадра. На рис. П3а и П3б сайта [8] приведены два стереоскопических изображения в анаглифном представлении, демонстрирующие это явление. Для объяснения

■ Рис. 7. Рисунок, поясняющий возникновение «эффекта отжатия рамкой»

причины возникновения данного эффекта обратимся к рис. 7, где показаны наложенные друг на друга контуры, соответствующие световым границам левого и правого компонентов стереопары стереоскопического изображения (см. рис. П3а [8]).

Согласно предложенной нами гипотезе, при зрительном сканировании стереоскопического изображения оптические оси левого и правого глаз фиксируются на световых границах проекций объектов на сетчатки глаз, оставаясь в плоскости, параллельной линии надбровья. В данном примере это будет линия, параллельная горизонтальной границе изображения, показанного на рис. П3а [8]. При рассматривании верхней части рисунка зритель увидит изображенную на нем часть объекта на расстоянии, соответствующем параллаксу (расхождению контуров). При рассматривании же нижней части зритель увидит ее на том же расстоянии, что и рамка рисунка, потому что контуры, соответствующие световым границам изображенного объекта, сливаются с вертикальной границей изображения. Таким образом, при ограничении изображенного на рисунке объекта по бокам рамкой глубина рассматриваемой части объекта совпадает с глубиной рамки, отсюда и «эффект отжатия рамкой». Понимание механизма «эффекта отжатия рамкой» позволило нам предложить способ, как его избежать. Но это будет тема другой статьи.

Влияние погрешности воспроизведения карты глубины на восприятие глубины пространства

Как было показано, бинокулярное зрение при оценке расстояний до наблюдаемых объектов (координат глубины) обеспечивает сравнительно небольшую погрешность только на небольших расстояниях наблюдения, и, по-видимому, его основная роль заключается в создании ощущения глубины пространства благодаря «конвер-генционно-дивергенционным» движениям глаз при наблюдении сцены. В связи с этим возникает вопрос, насколько точно необходимо пред-

ставлять карту глубины, например, при конвертации 2Б-изображений в ЭБ-изображения или при представлении данных о стереоскопическом изображении в формате 2Б + Z, для того, чтобы зрителю при воспроизведении изображений погрешности представления глубины оставались бы незаметными.

Для ответа на этот вопрос нами был поставлен следующий эксперимент. Посредством программы 3Ds Max в ЭБ-среде было размещено ЭБ-изображение головы человека (виртуальный объект). Затем с помощью двух виртуальных камер, помещенных в эту среду, были получены два изображения, которые составили стереопару. Далее, по измеренным величинам параллаксов для каждого соответствующего пикселя этих изображений рассчитывалась карта глубины для ЭБ-изображения головы человека представляемой стереопары. На рис. П4а [8] приведено изображение головы человека (виртуального объекта), полученное путем фотографирования ЭБ-изображения спереди; на рис. П4б показано стереоскопическое изображение в анаглифном представлении, полученное путем фотографирования ЭБ-изображения двумя виртуальными камерами, а на рис. П4в показана карта глубины, рассчитанная указанным способом. Затем было сформировано анаглифное стереоскопическое изображение, при изготовлении которого была использована сильно упрощенная (примитивная) карта глубины (рис. П5а [8]; анаглифное стереоскопическое изображение, соответствующее этой карте глубины, приведено на рис. П5б [8]). Несмотря на то, что карты глубин, показанные на рис. П4в и П5а [8], даже не сопоставимы по своему виду, столь сильно они разнятся между собой, изображение на рис. П5б смотрится так же хорошо, как и изображение на рис. П4б. На рис. П5в [8] приведено анаглифное изображение, при изготовлении которого была использована упрощенная карта глубины в виде криволинейной поверхности. И в этом случае на изображении нет заметных зрителю искажений. Для сравнения на рис. П6 [8] показано так называемое псевдостереоскопическое изображение в анаглифном формате, которое отличается от стереоскопического тем, что для всех пикселей левого и правого изображений стереопары параллакс сделан одинаковым. В этом случае, как нетрудно видеть,

Литература

1. Красильников Н. Н. Метод формирования ЭБ-изоб-ражения сцены по одной фотографии // Информационно-управляющие системы. 201Э. № Э. С. 2-7.

2. Красильников Н. Н., Красильникова О. И. Метод конвертации 2Б-изображения в стереоскопическое

возникает эффект плоского изображения, смещенного по глубине относительно плоскости стереоскопического окна на некоторую постоянную величину, определяемую величиной параллакса.

Таким образом, эксперименты показали, что стереоскопическое изображение допускает большие искажения параллакса, следовательно, допустимы большие погрешности карты глубины без возникновения заметных зрителю искажений на стереоскопическом изображении. Эта особенность зрительной системы позволяет упростить процесс конвертации 2Б-изображений в ЭБ-изображения.

Заключение

В заключение отметим, что принципиальной особенностью наблюдения ЭБ-сцен и изображений, которая отличает их от наблюдения 2Б-изображений, является возникновение ощущения глубины за счет бинокулярного зрения. При этом важно четко представлять как роль отдельных зрительных механизмов в оценке расстояний до наблюдаемых объектов, так и механизм, посредством которого формируется ощущение глубины пространства. Отсутствие количественной теории, описывающей работу этих механизмов, приводило к необходимости опытным путем определять как условия съемки стереоскопических фотографий и видео (ЭБ-видео), так и алгоритмы конвертации изображений и видео из 2Б-формата в ЭБ-формат. В результате проведенных исследований нами была выдвинута и экспериментально подтверждена гипотеза «конвер-генционно-дивергенционных» движений глаз. Эта гипотеза не только объясняет, каким образом формируется ощущение глубины пространства, но и указывает, как правильно построить кадр для того, чтобы максимально обеспечить стереоэффект, объясняет роль вертикальных и горизонтальных границ, роль фокусировки, что и почему приводит к возникновению «эффекта отжатия рамкой» и т. д.

Кроме того, в результате исследований было показано, что карта глубины стереоскопического изображения допускает весьма большие погрешности в процессе ее формирования, не приводящие к заметным искажениям результирующего изображения.

ЭБ-изображение // Оптический журнал. 2014. Т. 82. № 2. С. 1-9. Э. Krasil'nikov N. N., Krasil'nikova O. I. Method of Converting a 2D Image into a Stereoscopic 3D Image // Journal of Optical Technology. 2014. Vol. 81. Iss. 2. P. 68-74.

4. Конвертация 2d в 3d. Что такое псевдостерео? http://www.televizor-3d.ru/konvertaciya-2-d-v-3d. html (дата обращения: 10.10.2014).

5. Почему «Титаник» стоит смотреть в стерео 3D. http://total3d.ru/diy/92707/ (дата обращения: 10.10.2014).

6. Город в 3D.ru. http://gorodv3d.ru/3d-tours-technology-success-story.html (дата обращения: 04.10.2014).

7. Физиология сенсорных систем. Ч. 1: Физиология зрения / под ред. Г. В. Гершуни. — Л.: Наука, 1971. — 416 с.

8. Приложение к статье «Восприятие ЭБ-пространства зрительной системой и роль бинокулярного зрения» http://cv.guap.ru/krasilnikov_nn/files/pril002 (дата обращения: 10.08.2014).

9. Изображение рельсов. http://img-2007-07. photosight.ru/20/2205746.jpg (дата обращения: 09.10.2014).

10. Изображение штиля на море. http://alex-petsch. ucoz.ru/_ph/3/609301960.jpg (дата обращения: 09.10.2014).

UDC 612.843,721

Mechanisms and Inaccuracies of 3D Spatial Perception by Visual System

Krasilnikov N. N.a, Dr. Sc., Tech., Professor, [email protected]

aSaint-Petersburg State University of Aerospace Instrumentation, 67, B. Morskaia St., 190000, Saint-Petersburg, Russian Federation

Purpose: The lack of clear ideas about how the human visual system forms the sensation of spatial depth forces us to experimentally determine while shooting every scene whether it is possible to obtain the desired stereoscopic effect, and if so, under what parameters. The aim of this article is to identify the features of visual perception of 3D spatial depth essential to resolve this problem. Results: Theoretical and experimental studies have shown that at short observation distances the vision mechanism based on the stereoscopic effect allows us to estimate distances to objects with lesser errors than the vision mechanism based on perspective transformations. At long distances, the situation is reversed. An hypothesis was proposed and experimentally confirmed which explained how the sensation of spatial depth appears while watching real scenes and stereoscopic images by "converging-diverging" eye movements. This led to the development of a method determining the optimal conditions of stereoscopic shooting giving the best stereo effect, as well as the technique of choosing the optimal parameters of image/video conversion from 2D into 3D. It was shown that the depth map of a stereoscopic image tolerates significant inaccuracies which do not lead to any noticeable distortion of the resulting image. Practical relevance: The obtained result makes it possible to correct the existing stereoscopic images and movies. When we know that the depth map of a stereoscopic image tolerates inaccuracies without any noticeable distortion, we can considerable simplify the procedure of converting 2D images into 3D.

Keywords — 3D-Image, Stereoscopic Image, Conversion, 2D Format, Video, 3D Format.

References

1. Krasilnikov N. N. The Method of Generating a 3D-Image Scene Based on a Single Photograph. Informatsionno-upravliaiushchie sistemy, 2013, no. 3(64), pp. 2-7 (In Russian).

2. Krasilnikov N. N., Krasilnikova O. I. The Method of Converting 2D-Images in Stereoscopic 3D-Image. Opticheskii zhurnal, 2014, vol. 82, no. 2, pp. 1-9 (In Russian).

3. Krasil'nikov N. N., Krasil'nikova O. I. Method of Converting a 2D Image into a Stereoscopic 3D Image. Journal of Optical Technology, 2014, vol. 81, iss. 2, pp. 68-74.

4. Konvertaciia 2d v 3d. Chto takoe psevdostereo? [Converting 2D to 3D. What is Pseudostereo?]. Available at: http://www. televizor-3d.ru/konvertaciya-2-d-v-3d.html (accessed 10 October 2014).

5. Pochemu "Titanik" stoit smotret' v stereo 3D [Why "Titanic" is Worth Watching in Stereo 3D]. Available at: http:// total3d.ru/diy/92707/ (accessed 10 October 2014).

6. Gorod v 3D.ru [The City in 3D.ru]. Available at: http:// gorodv3d.ru/3d-tours-technology-success-story.html (accessed 4 October 2014).

7. Fiziologiia sensornyh sistem. Chast Pervaia. Fiziologiia zreniia [Physiology of Sensory Systems. Part One. Vision Physiology]. Ed. by G. B. Gershuni. Leningrad, Nauka Publ., 1971. 416 p. (In Russian).

8. Prilozhenie k stat'e "Vospriiatie 3D-prostranstva zritel'noi sistemoi i rol' binokuliarnogo zreniia" [The appendix to the article "Perception of the 3D Space by the Visual System and the Role of Binocular Vision"]. Available at: http://cv.guap.ru/krasilnikov_nn/files/pril002 (accessed 10 August 2014).

9. Izobrazhenie rel'sov [Picture Rails]. Available at: http:// img-2007-07.photosight.ru/20/2205746.jpg (accessed 9 October 2014).

10. Izobrazhenie shtilia na more [The Picture of Calm on the Sea]. Available at: http://alex-petsch.ucoz.ru/_ph/3/ 609301960.jpg (accessed 9 October 2014).

i Надоели баннеры? Вы всегда можете отключить рекламу.