Научная статья на тему 'ТЕОРЕМЫ ЕДИНСТВЕННОСТИ ВОССТАНОВЛЕНИЯ ПРООБРАЗА ПРИ ВЫРОЖДЕННЫХ ПРЕОБРАЗОВАНИЯХ'

ТЕОРЕМЫ ЕДИНСТВЕННОСТИ ВОССТАНОВЛЕНИЯ ПРООБРАЗА ПРИ ВЫРОЖДЕННЫХ ПРЕОБРАЗОВАНИЯХ Текст научной статьи по специальности «Математика»

CC BY
20
4
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОЕКЦИЯ МНОЖЕСТВА / ПРЕОБРАЗОВАНИЕ ВРАЩЕНИЯ / ПРОСТРАНСТВЕННАЯ РЕКОНСТРУКЦИЯ / ПРОСТРАНСТВЕННАЯ ОРИЕНТАЦИЯ

Аннотация научной статьи по математике, автор научной работы — Клячин Алексей Александрович, Клячин Владимир Александрович

При решении задач трехмерной реконструкции объектов по изображениям актуальной является задача определения условий, при которых такая реконструкция будет иметь ту или иную степень единственности. Именно такие условия позволяют применить, в частности, методы глубокого машинного обучения с использованием сверточных нейронных сетей для определения пространственной ориентации объектов или их составных частей. С математической точки зрения задача сводится к определению условий восстановления прообраза для преобразования проекции. В настоящей статье доказан ряд теорем единственности такого рода восстановления. В частности, доказано, что параметры преобразования вращения, близкого к тождественному, однозначно могут быть определены по проекции результата такого вращения объекта, заданной структуры. Кроме этого, в статье найдены условия, при которых пространственная ориентация объекта может быть вычислена по его проекции.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

UNIQUENESS THEOREMS FOR RECOVERING THE INVERSE IMAGE UNDER DEGENERATE TRANSFORMATIONS

When solving problems of three-dimensional reconstruction of objects from images, the problem of determining the conditions under which such a reconstruction will have one or another degree of uniqueness is relevant. It is these conditions that make it possible to apply, in particular, deep machine learning methods using convolutional neural networks to determine the spatial orientation of objects or their constituent parts. From a mathematical point of view, the problem is reduced to determining the conditions for restoring the preimage for transforming the projection. In this article, we prove a number of uniqueness theorems for this kind of restoration. In particular, it has been proved that the parameters of a rotation transformation close to identical can be uniquely determined from the projection of the result of such rotation of an object with a given structure. In addition, the article found the conditions under which the spatial orientation of an object can be calculated from its projection.

Текст научной работы на тему «ТЕОРЕМЫ ЕДИНСТВЕННОСТИ ВОССТАНОВЛЕНИЯ ПРООБРАЗА ПРИ ВЫРОЖДЕННЫХ ПРЕОБРАЗОВАНИЯХ»

Известия Саратовского университета. Новая серия. Серия: Математика. Механика. Информатика. 2022. Т. 22, вып. 1. С. 15-27

Izvestiya of Saratov University. Mathematics. Mechanics. Informatics, 2022, vol. 22, iss. 1,

pp. 15-27 https://mmi.sgu.ru

https://doi.org/10.18500/1816-9791-2022-22-1-15-27

Научная статья УДК 514.17

Теоремы единственности восстановления прообраза при вырожденных преобразованиях

А. А. Клячин, В. А. Клячин

Волгоградский государственный университет (ВолГУ), Россия, 400062, г. Волгоград, Университетский пр-т, д. 100

Клячин Алексей Александрович, кандидат физико-математических наук, заведующий кафедрой математического анализа и теории функций, klyachin-aa@yandex.ru, klyachin.aa@volsu.ru, М1р8: //orcid.org/0000-0003-3293-9066, АийогГО: 9530

Клячин Владимир Александрович, кандидат физико-математических наук, заведующий кафедрой компьютерных наук и экспериментальной математики, klchnv@mail.ru, klyachin.va@volsu.ru, https://orcid.org/0000-0003-1922-7849, AuthorID: 616063

Аннотация. При решении задач трехмерной реконструкции объектов по изображениям актуальной является задача определения условий, при которых такая реконструкция будет иметь ту или иную степень единственности. Именно такие условия позволяют применить, в частности, методы глубокого машинного обучения с использованием сверточных нейронных сетей для определения пространственной ориентации объектов или их составных частей. С математической точки зрения задача сводится к определению условий восстановления прообраза для преобразования проекции. В настоящей статье доказан ряд теорем единственности такого рода восстановления. В частности, доказано, что параметры преобразования вращения, близкого к тождественному, однозначно могут быть определены по проекции результата такого вращения объекта, заданной структуры. Кроме этого, в статье найдены условия, при которых пространственная ориентация объекта может быть вычислена по его проекции.

Ключевые слова: проекция множества, преобразование вращения, пространственная реконструкция, пространственная ориентация

Благодарности: Работа выполнена при поддержке Минобрануки России (проект «Развитие методики виртуальной 3D реконструкции исторических объектов», шифр научной темы 2019-0920, номер проекта в системе управления НИР Е2Ш-0633-2020-0004).

Для цитирования: Клячин А. А., Клячин В. А. Теоремы единственности восстановления прообраза при вырожденных преобразованиях // Известия Саратовского университета. Новая серия. Серия: Математика. Механика. Информатика. 2022. Т. 22, вып. 1. С. 15-27. https://doi.org/10.18500/1816-9791-2022-22-1-15-27

Статья опубликована на условиях лицензии Creative Commons Attribution 4.0 International (CC-BY 4.0)

Article

Uniqueness theorems for recovering the inverse image under degenerate transformations

A. A. Klyachin, V. A. Klyachin1

s

Volgograd State University, 100 Prosp. Universitetsky, Volgograd 400062, Russia

Alexey A. Klyachin, klyachin-aa@yandex.ru, klyachin.aa@volsu.ru, https://orcid.org/0000-0003-3293-9066, AuthorID: 9530

Vladimir A. Klyachin, klchnv@mail.ru, klyachin.va@volsu.ru, https://orcid.org/0000-0003-1922-7849, AuthorID: 616063

Abstract. When solving problems of three-dimensional reconstruction of objects from images, the problem of determining the conditions under which such a reconstruction will have one or another degree of uniqueness is relevant. It is these conditions that make it possible to apply, in particular, deep machine learning methods using convolutional neural networks to determine the spatial orientation of objects or their constituent parts. From a mathematical point of view, the problem is reduced to determining the conditions for restoring the preimage for transforming the projection. In this article, we prove a number of uniqueness theorems for this kind of restoration. In particular, it has been proved that the parameters of a rotation transformation close to identical can be uniquely determined from the projection of the result of such rotation of an object with a given structure. In addition, the article found the conditions under which the spatial orientation of an object can be calculated from its projection.

Keywords: set projection, rotation transform, spatial reconstruction, spatial orientation

Acknowledgements: This work was supported by the Ministry of Education and Science of Russia (project "Development of Virtual 3D Reconstruction of Historical Objects Technique", scientific theme code 2019-0920, project number in the research management system FZUU-0633-2020-0004).

For citation: Klyachin A. A., Klyachin V. A. Uniqueness theorems for recovering the inverse image under degenerate transformations. Izvestiya of Saratov University. Mathematics. Mechanics. Informatics, 2022, vol. 22, iss. 1, pp. 15-27 (in Russian). https://doi.org/10.18500/1816-9791-2022-22-1-15-27

This is an open access article distributed under the terms of Creative Commons Attribution 4.0 International License (CC-BY 4.0)

Введение

Одной из актуальных проблем при построении систем компьютерного зрения является задача определения пространственной ориентации и пространственного положения объекта по фотоснимку. Например, подобная задача особенно важна для систем автономного вождения, в которых определение положения ближайших автомобилей является ключевым вопросом для автономных транспортных средств в городской среде. В связи с этим, например, в 2019 г. Лаборатория робототехники и автономного вождения Baidu совместно с Пекинским университетом поставили соответствующую задачу содружеству Kaggle (https://www.kaggle.com/c/pku-autonomous-driving) и предоставили более 60 000 экземпляров трехмерных автомобилей с маркировкой из 5277 реальных изображений. Нужно отметить, что попытки

решения подобных задач и не только для автомобилей в качестве объектов предпринимались и ранее. Так, следует отметить работу [1], в которой представлен один из методов оценки положений и размеров параллелепипедов (30 боксов), охватывающих автомобиль в пространстве по его изображению на фотоснимке. В указанной работе производится оценка местоположения автомобиля по углу рыскания (углу поворота вокруг вертикальной оси), поскольку предполагается, что камера наблюдателя выровнена относительно дорожного полотна и угол между плоскостью камеры и плоскостью дороги не изменен и составляет значение ^/2. Данное допущение является вполне состоятельным, поскольку для большинства задач автономного вождения, распознавания объектов городского трафика и т.п. значение крена и тангажа для автомобилей на дороге не является существенным, если, конечно, речь не идет о положении автотранспорта на специальных конструкциях вроде въездов/съездов с мостов, пандусов, развязок и т.д. (хотя вопрос с детектированием пространственного расположения автомобилей в местах выездов и заездов на развязки становится все более актуальным). Эти же приемы были использованы в работах [2,3]. Аналогичная задача об определении 30 положения объектов решалась в работе [4], в которой использовались модифицированные сверточные нейронные сети и специально подготовленные маски объектов с пониженной дискретизацией. В работе [5] использовался метод, основанный на покадровом слежении за объектом, а обучающая модель строилась на основании рекуррентных ЬБТМ нейронных сетей. Отметим также работу [6], в которой для целостной реконструкции трехмерной сцены предлагается ее описание в виде грамматики, а результат реконструкции авторы строят в виде специального графа. Надо отметить, что подобные задачи реконструкции возникают, например, и при восстановлении трехмерной модели лица и позы человека по фотографии (см., например, [7,8]).

Анализ указанных работ и работ, процитированных в них, показывает, что наиболее часто для решения задач пространственного анализа изображений применяются нейронные сети. Это понятно — сверточные нейронные сети могут автоматически выявлять признаки на изображениях и определять их значимость на основе датасета, используемого в обучении. Безусловно, подход, основанный на использовании нейронных сетей, заслуживает внимания, но он требует очень большого набора данных для обучения. Поэтому, как нам кажется, полезным было бы уметь проводить прямые вычисления пространственных данных, основываясь исключительно на характерных особенностях изображений самих объектов. Так, например, в работе [9] было показано, что ориентация плоскости круга в пространстве может быть получена по характеристикам эллиптической области, являющейся проекцией круга. В работе [10] был получен и описан алгоритм восстановления профиля видимой части поверхности вращения по ее проекции. В подобных задачах важную роль играют теоремы единственности: с какой степенью однозначности может быть восстановлен объект по своей проекции? В настоящей работе мы формулируем ряд утверждений общего характера, а также даем полное решение задачи определения пространственной ориентации объекта по его проекции в некоторых частных случаях. Математической моделью объектов мы выбрали конечные подмножества евклидова пространства Р С Ега, п ^ 3. Следует указать работы [11,12], в которых предложены методы решения задач, подобных нашей, с использованием методов машинного обучения, а также [13], в которой обратные задачи для преобразования проекции рассматривались в рамках исследований компьютерной томографии биологических объектов.

1. Однозначное определение множества по его проекции

Пусть Р с Rra, n > 1, Р = {pi,...,Pn> 0} — конечное множество евклидова пространства Rra. Будем рассматривать два вида вырожденных отображений. Во-первых, отображения ортогональной проекции ж : R м Rk с Rra, 0 < k < п, во-вторых, отображение центральной проекции nc : R+ = {х е R : хп > 0} м П = = {х е R : хп = 1}, заданное формулой х м х/хп. Мы ставим задачу определения множества Р по его проекции п(Р) или пс(Р). Конечно, в общем случае такая задача не имеет единственного решения. Но если, например, известна некоторая структура множества Р, то можно надеяться на то, что множество Р возможно будет восстановить по своей проекции. В настоящей статье мы будем рассматривать структуру множества Р, заданную в виде системы соотношений для длин d = {dij : dij = \pi - pj |} и углов a = {aijk : aijk = Z'PiPjpk, i = j,i = j,j = к} в виде уравнения

F (d,a) = 0. (1)

Например, если взять N = n + 1, то система соотношений

dij = dki, г = j, к = I,

задает структуру правильного симплекса в Rra. Прежде чем переходить к некоторым полным решениям задач восстановления, сформулируем ряд общих утверждений, лежащих в основе обоснования возможности однозначного определения прообраза проекции. Рассмотрим сначала случай ортогональной проекции к. Введем следующее обозначение:

8 = КЫ - K(Pj^

Лемма 1. Пусть f\ : Rra м Rra, г = 1,2 такие преобразования, что для всякого х е Р с R выполнено

\fi(x) - х\ <5/33, г =1, 2.

Тогда справедливо одно из следующих утверждений:

• или имеют место равенства

АЬ(Рг))= Af2(Рг)), Уг = 1, ..., N,

• или выполнено

<h(P )) = <h(P)).

Доказательство. Рассмотрим произвольные i = j,i,j = 1,...,N. Имеем

6 ^ \п(рг) - п(р3)\ = \п(рг) - п(Ш)) + п(Ш)) - n(f2(p,)) + n(f2(p,)) - п(р3)\ ^

^ \Рг - МРг)\ + Шг(Рг)) - АЬ(Р3 ))\ + \Р3 - Ь(Р3 )\ < ^ + ШМ)) - АЬ(Р3 ))\.

^ Ш) - <!M))\ + WM)) - ))\ + W2(p3)) - ф3)\ ^

26 ~3

Откуда следует неравенство

г

Шг(Рг)) - Af2(p3))\ > 3. (2)

Предположим теперь, что не выполнена вторая альтернатива в утверждении леммы, т. е. имеет место равенство

*(МР )) = АМР)).

Тогда для всякого г = 1, 2,..., N найдется номер ] = 1, 2,..., N, такой, что ^(¡\{рг)) = = ))• Данные равенства не могут выполняться для 1 = ] в силу неравенства (2).

Поэтому выполнена первая альтернатива. Теперь предположим, что не выполнена первая альтернатива, т.е. при некотором г = 1,2,...,Ы имеет место неравенство Рг)) = ^(12(Рг)). Тогда возможны два варианта. В первом варианте — точка 'к(/1(Рг)) Е ^(¡2(Р)). Это влечет выполнение второй альтернативы. Во втором варианте возможно равенство ^(^(рг)) = 2(р^)) при некотором ] = г. Но это невозможно в силу неравенства (2). Теперь лемма доказана полностью. □

Для случая центральной проекции доказательство аналогичного утверждения несколько усложняется, поскольку центральная проекция не является линейным отображением. Более того, не ограничивая общности, мы будем предполагать, что множество Р лежит в П+ = {х = (х\,...,хп) € Ега : хп ^ 1}. Докажем следующее неравенство для всякой пары точек х,у € П+:

- жс(у)1 ^ |ж - уМ. Введем обозначения ж' = (хх, ...,хп-х), у1 = (ух, ...,уп-х). Тогда

(3)

\кс(х) - пс(у)1 =

— - У-

Уп

— _ У- + У- - У-

/V» /V» /V» Г> I

•^п п ^п Уп

<

+ 1_ _ у' = № - у1

Уп \ХП |

+

ьп Уп |

\Хг1

^ (|Ж' - у' |2 + |Жга - уга|2) 2 (у2п + У |2)

^ 1 Л, ,2 I и/|2Л 1 _1

ыы

Тем самым неравенство (3) доказано. Положим

М = тах \рА,

РгеР1

к - УМ

ЫЫ

< 1х -

6С = тт 1пс(рг) - пс(рз)| > 0.

г=3

(4)

Имеет место

Лемма 2. Пусть ^ : Ега ^ Ега, г = 1,2 такие преобразования, что для всякого х € Р С Ега выполнено

г

Цг(х) - ж| <, г = 1, 2. ип ) |

Тогда справедливо одно из следующих утверждений: • или имеют место равенства

*ШРг )) = *ШРг)), V =1,...,М,

1

• или выполнено

к (Н(Р )) = )).

Изв. Сарат. ун-та. Нов. сер. Сер.: Математика. Механика. Информатика. 2022. Т. 22, вып. 1 Доказательство. Рассмотрим произвольные г = ], г,] = 1,...,Ы. Имеем

8С ^ \^с(Рг) - )! = ^М) - Пс{/1(Рг))+ Пс{/1(Рг)) - Кси2{Р] ))+ Кси2{Р] )) - ^с(Р] )| ^

^ КсЫ - ^с(1\(Рг))\ + ^сАЬЫ)) - Кс^Рз))| + КШРз)) - Кс(Рз ^ Применяя неравенство (3), получаем

$с < \Рг - ¡1(Рг)\\Рг\ + МЛ (Рг)) - ^с(1'2(Рз))| + \Р] - ¡2(Рз)\\Рз 1 <

¿с

< 2М^ + \пс(Ш)) - ))\.

Откуда следует неравенство

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3

M/ife)) - ъШРэ))\ > ^. (5)

Далее доказательство ничем не отличается от заключительной части доказательства леммы 1. □

Лемма 3. Пусть R : R3 м R3 — преобразование, представляющее собой композицию поворота вокруг оси L, проходящей через начало координат и смещения вдоль вектора, ортогонального L. Обозначим через А матрицу этого вращения, а через Т — вектор смещения, так, что имеет место равенство Я(х) = Ах + Т Ух е R3. Предположим, что выполнено неравенство

г

\и -1\\- М + \т\ < ^, (6)

где 5С, М определены формулами (4). Тогда, если множество Р не является плоским, то жс(Я(Р)) = пс(Р)

Доказательство. Для х е Р имеем

6.

\R(x) - х\ = \А(х) - (х)+ Т\ ^ \\А - I\\ ■ \ж\ + \Т\ ^

с

Отсюда следует, что выполнены условия леммы 2 при ¡1(х) = Я(х), /2(х) = х. Покажем, что при выполнении первой альтернативы множество Р лежит в плоскости, ортогонально прямой Ь и проходящей через центр проекции. Действительно, пусть г = Обозначим через Пг, П плоскости, ортогональные оси вращения Ь и проходящие через точки грг,Рз соответственно. Из выполнения первой альтернативы леммы 2 следует, что пс(рг) = пс(Я(рг)), пс(рз) = пс(Я(рз)). Вектор смещения ортогонален прямой Ь, так что Я(рг) € Пг, ) е П. С другой стороны, прямые, содержащие точки рг,Я(рг) и рз), проходят через центр проекции. Из этого следует, что плоскости Пг, П совпадают как параллельные плоскости, содержащие центр проекции. Таким образом, мы получаем, что все точки множества Р лежат в одной плоскости, ортогональной оси вращения. Лемма доказана. □

Пусть Яг : R3 ^ R3, г = 1, 2 — два преобразования вида композиции вращения и параллельного переноса такие, что Яг(х) = Агх + Тг, где Аг — матрица вращения в стандартном базисе. Пусть Е — собственный вектор матрицы А2А-1 — вектор, задающий ось вращения для композиции вращений А-1 и А2. При этом считаем, что

вектор Т2 — А2А~-1(Т1) ортогонален вектору Е. Будем предполагать выполненными следующие условия:

\\А — I\\М + \tí\ ^ miní^^,м}. (7)

Из доказанных вспомогательных утверждений следует

Теорема 1. Пусть Р с R3 П П+ — конечное множество, не лежащее в одной плоскости и такое, что

Sc = min \nc(pí) — nc(pj)\ > 0.

Тогда для двух преобразований Rí : R3 ^ R3 указанного выше вида, удовлетворяющих условию (7), выполнено

■Kc(Rl (Р)) = ЪсШР)).

Доказательство. Рассмотрим множество Р0 = R\ (Р). Построим отображение R : R3 ^ R3 как композицию исходных отображений R = R2 о

Л-1. Ясно, что

R(Po) = R2(P). Поэтому нам достаточно показать, что жс(Р0) = nc(R(P0)). Мы это сделаем, показав, что для множества Р0 и отображения R выполнены условия леммы 3. С этой целью заметим, что

R2 о R-1(x) = А2А-1х + Т2 — ЛА-^).

То есть R есть композиция вращения и параллельного переноса. Причем вектор смещения Т2 — А2А--1(Т1) ортогонален оси вращения для преобразования поворота А2А-1. Далее имеем

\A2A-1(z) — Z\ = \^2A-1(z) — A-1(Z) + A-1(Z) — Z\ ^ ^ \A2A-\z) — A-\Z)\ + \A-\z) — Z\ ^ ^ \\A — i\\ ■ \a^1(z)\ + \a^1(z)\ ■ \\i — AH ^ (\\A — I\\ + \\A — IHM

Здесь мы воспользовались тем фактом, что для вращений \А(z) \ = \A~1(z) \ = \z\. Следовательно, из предыдущих выкладок получаем неравенство \\А2А-1 — I\\ ^ \\А1 — I\\ + + \\А2 — I\\. Далее, для точек qí е Р0 применяя неравенство (3), имеем

— Kc(qj)\ = \^c(qí) — kC(pÍ) + kC(pÍ) — Kc(pj) + Kc(Pj) — Kc(qj)\ ^

^ \kC(pÍ) — -кc(Pj)\ — — pÍ\\pÍ\ — \qj — Pj\\Pj\ ^ ^ \kc(pÍ) — *c(Pj)\ — 2M(\\A1 — I\\M + \T1\). Поэтому из условия (7) получаем

Щ,

So = min \\^c(qí) — Kc(qj)\ ^ . (8)

Далее оценим величины, стоящие в знаменателе неравенства (6). Пусть М0 тахдер0 |д|. Имеем

Ы = №Ы| = И1(Рг)+ Тх\ ^ М + |7\|.

Изв. Сарат. ун-та. Нов. сер. Сер.: Математика. Механика. Информатика. 2022. Т. 22, вып. 1 И поскольку из условия (7) следует, что |Ti| ^ М, будем иметь

ы ^ 2М, дг е Ро.

Поэтому М0 ^ 2М. Обозначим через Т вектор Т = Т2 — A2A~-1(Ti), а через А матрицу A2A-i. Тогда для левой части неравенства (6) в случае множества Р0 будем иметь

р — IЦМо + IT| ^ (||Л — 11| + ||А2 — IЦ)(М + IT,|) + |Т|.

Заметим, что

IT I < IT! I + IT2I,

и поскольку из неравенства (7) следует, что

I ^ 30М'

получаем неравенство \Т\ ^ 5С/(15М). Применяя еще раз неравенство (7), получаем

р — m + + JL + А,«^ + *

15М 450М3 15М 15 М 450М3' Правая часть неравенства (6) может быть оценена, используя (8)

¿о > 145с > 75с

3М0 3 ■ 15М0 45М Остается проверить неравенство

25с 5\ 75с

С +--^ С

15М 450М3 45М' которое после преобразований будет эквивалентно неравенству

8С ^ 10М2.

Это неравенство очевидно выполнено, поскольку

5с < | Пс(Рг) - ПС{Р]) | ^ | Рг - Р3 |1 Р3 | ^ 2М2 < 10М2.

Таким образом выполнены все условия леммы 3, и это завершает доказательство теоремы. □

Замечание 1. Из доказанной теоремы следует такой факт. Если множество Р с К3 не является плоским, то найдется не более одного вращения К, близкого к тождественному преобразованию, переводящего множество Р в множество, имеющее заданную центральную проекцию. То, что глобально теорема не может быть справедливой, очевидно. Достаточно привести примеры множеств Р, имеющих нетривиальную группу симметрий.

2. Условия локальной однозначности

Дадим иной подход к решению поставленной задачи, который в какой-то степени будет рассматриваться в более общей ситуации. Сформулируем искомые условия для произвольного семейства преобразований.

Пусть в пространстве Е3 имеется набор точек Р = {рг}М= 1 и задано семейство преобразований В1 : Е3 ^ Е3, зависящих от набора параметров £ = (11,...,1т) и таких, что при £ = (0,..., 0) преобразование В° является тождественным. Через Р1 будем обозначать образ набора точек Р при отображении В1, т.е. Рг = {Я*(рг)}11. Мы исследуем следующую задачу: при каких условиях на расположение точек рг по набору точек Ср = {п(Я*(рг))}1= 1 или Ср = {^с(Рк(рг))}11= 1 можно однозначно восстановить набор точек Р1 при малых значениях всех параметров Ь1,...,Ьт.

Рассмотрим сначала случай ортогональной проекции к на плоскость г = 0. Пусть отображение Кь = (К1(х, у, г, Ь1, ...,Ьт), К2(х, у, г, Ь1, ...,Ьт), К3(х, у, г, Ь1, ...,Ьт)). Естественно предположить, что т = 2Ы. Введем следующие обозначения. Пусть Рг = (хг,уг,гг), = (и\,у\, 0), г = 1,...,М. Тогда мы можем записать систему уравнений

П1(х1,у1,г1,г1,...,г2м) Р2(х1,у1,г1,г1, ...,г2М)

Я1(хм,

щ

V1

им <.

(9)

Если из этой системы уравнений можно однозначно выразить набор параметров Ь1,...,Ь21, то по ним мы сможем вычислить положения точек = В1(рг). По теореме об обратном отображении условием локальной разрешимости системы уравнений (9) в окрестности точки £ = 0 является ненулевой якобиан. Поэтому получаем условие

( ■Щ- (Х1,у1,ги 0)

■Щ (Х1,У1^1,0)

■Щ(хм,ум, 0)

V 'Ш(хм,Ум,гм, 0)

■Щ (хъУъгъ 0) Ш (ъм^ъ 0)

\

(хм,Ум, 0) (%м,Ум, 0) у

= 0.

(10)

Аналогично можно поступить, если осуществляется центральная проекция на плоскость г = 1 с центром в начале координат. В этом случае приходим к системе уравнений

К1(Х1,У1,Х1,11,...,12М) К2(х1,у1,г1,и, ...,Ь2м)

= и\П3(х1,У1,г1,11,...,12М) = у\П3(х1,у1,г1,г1,...,г2м)

В,1(хк ,Ук к ,11,...^2м) = и% В,3 (хм ,ум ,гм ,г1,...,г2м) , Я2(%м ,Ум ^1,...^2М ) = Ум Я3(Хм ,Ум ^1,...^2М )

Учитывая, что центральные проекции начального набора точек Р имеют координаты (хг/хг,уг/гг, 1), и выписывая определитель, приходим к условию

( z, ff (ръ 0) - ff (ръ 0) ж (Р1,0) - У1Щ3 (Р1,0)

det

(PN, 0) - (pN, 0)

V (PN, 0) - (PN, 0)

* H (p^0) - S3 ^0) \

*1 Ш ^0) - У1 ё (^0)

(PN, 0) - (PN, 0)

(PN, 0) - yN§^ (PN, 0) У

p2N

= 0. (11)

Рассмотрим отображение F : R ^ R, которое для любого t G R ставит в

соответствие точку

(u\,v\ ,...,ulN ,v%)

Тогда, если выполняется одно из условий (10) или (11), отображение F взаимно однозначно в окрестности точки t = 0.

Используя данный подход, выпишем условия для системы поворотов относительно некоторой точки (x0,y0,z0). Так как поворот точки задается двумя углами (t\ = y,t2 = ф), мы рассмотрим семейство поворотов:

R\ (х, у, z, р, ф) = хо + (х — хо) cos ф — (z — zo) sin ф, R2(x, у, Z, ф, ф) = у0 — (х — х0) sin р sin ф + (у — у0) cos р — (z — z0) sin p cos ф, (12) R3(x, у, Z, ф, ф) = z0 + (х — х0) cos ф sin ф + (у — у0) sin ф + (z — z0) cos cos ф,

где <р,ф G R.

Если центр поворота фиксирован, то нам достаточно выписать условие для одной точки, например р\. Вычислим определитель (10), считая, что t\ = y,t2 = ф:

det

(

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0

-¿1 + Zq

-Z1 + Zq 0

)

= -(Z1 - Zq)2

Поэтому в данном простом случае отображение F(<р,ф) будет взаимно однозначным при малых углах поворота у и ф, если хотя бы одна точка из набора [pí}i¡=1 не лежит на плоскости z = zq.

Рассмотрим теперь семейство поворотов вокруг произвольной точки и горизонтальных сдвигов. В этом случае добавляются еще два параметра, и преобразование будет иметь вид

R1(x, у, z, а, Ъ,<р,ф) = а + (x-xq) cos ф - (z-zq) sinф, R2(x, у, z, а, Ъ,<р,ф) = b - (x-xq) sin p sinф + (y-y0) cos p - (z-zq) sin p cos ф, (13) R3(x, y, z, a, b, p, ф) = zq + (x-xq) cos p sin ф + (y-y0) sin p + (z-zq) cos p cos ф.

Следовательно, нам нужна будет еще одна точка (t1 = a,t2 = b,t3 = p,t4 = ф). Тогда, вычисляя определитель (10), получаем

det

/10 0 Z1 + zq\

0 1 —z1 + zq 0

10 0 -Z2 + zq

V 0 1 Z2 + zq 0 )

-(^1 - Z2)2

Отображение F(а,Ь,р,ф) будет взаимно однозначным при малых сдвигах а,Ь и малых углах поворота р, ф, если найдутся две точки из набора {Pi}!=i, которые не лежат в одной плоскости z = const.

Перейдем к случаю центральной проекции пс. Рассмотрим сначала семейство преобразований (12). Для него условие (11) легко вычисляется и имеет вид

det( Xl(Vl - У°) Zl(Zl - Z°)+Xl(Xl

у zi(zi - z0) + yi(yi - yo) yi(xi -x0) J

(Zi - Zo) (Xi(xi - Xo) + yi(yi - yo) + Zi(Zi - Zo)) (*i - zo)( (xi - f)2 + (yi - f)2 + (zi - f)2 - 4 X + У2 + ^ = 0.

Это условие означает, что хотя бы одна точка из набора {рг}11=1 не лежит ни в плоскости г = г0, ни на сфере радиуса 1/2 + у1 + с центром в точке

(х0/2, Уо/2, хо/2).

Рассмотрим теперь повороты со сдвигами (13). Условие (11) будет таким:

det

( Zi 0 Xi(yi - yo) Zi(Zi - Zo) + Xi(Xi - Xo) \

0 zi zi(zi - zo) + yi(yi - yo) У i(Xi - Xo)

Z2 0 X2(У2 - yo) Z2(Z2 - Zo) + X2(X2 - Xo)

У 0 Z2 Zi( Zi - Zo) + У2 (У2 - yo) У 2 (x2 - Xo)

= -Z^z:^(Zi - Z2)2 + ZiZ2(Xiy2 - X2Vi)((Xi - Xo)(y2 - yo) - (X2 - Xo)(yi - Vo)) +

+ZiZ2(zx - z2)(zi(x2(x2 - Xo) + y2(У2 - yo)) - z2(yi(yi - Vo) + X(xi - Xo))) = 0. (14)

Суммируя все полученные результаты, приходим к следующим утверждениям.

Теорема 2. 1) Отображение F(р,ф), соответствующее семейству поворотов (12) и ортогональной проекции, взаимно однозначно при малых углах поворота р и ф, если в наборе точек {pi}f=i найдется хотя бы одна точка, не лежащая в плоскости z = zo.

2) Отображение F(а,Ь,р,ф), соответствующее семейству преобразований (13) и ортогональной проекции, взаимно однозначно при малых сдвигах а,Ь и малых углах поворота р, ф, если в наборе точек {pi}f=i найдутся хотя бы две точки, не лежащие в одной плоскости z = const.

Теорема 3. 1) Отображение F(р,ф), соответствующее семейству поворотов (12) и центральной проекции, взаимно однозначно при малых углах поворота р и ф, если хотя бы одна точка из набора {pi}f=i не лежит в плоскости z = zo и одновременно не лежит на сфере радиуса \/2\Jx\ + у2 + Zq с центром в точке

(xo/2, yo/2, zo/2).

2) Отображение F(а,Ь,р,ф), соответствующее семейству преобразований (13) и центральной проекции, взаимно однозначно при малых сдвигах а,Ь и при малых углах поворота р, ф, если в наборе точек {pi}f=i найдутся хотя бы две точки, например рi = (x\,y\,zi) и р2 = (x2, у2, z2), для которых выполняется неравенство (14).

Заключение

В статье рассмотрена задача об однозначном определении пространственных точек по их ортогональной и центральной проекциям при условии, что данный набор точек есть образ некоторого начального набора точек параметрического семейства преобразований. Получены условия на начальное расположение точек, гарантирующие такое однозначное восстановление для семейства малых поворотов и малых сдвигов (теорема 2 и теорема 3).

Список литературы

1. Mousavian A., Anguelov D., Flynn J., Kosecka J. 3D Bounding Box Estimation Using Deep Learning and Geometry // 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2017. P. 5632-5640. https://doi.org/10.1109/cvpr.2017.597

2. Gordeev A. Y., Klyachin V. A. Determination of the Spatial Position of Cars on the Road Using Data from a Camera or DVR // «Smart Technologies» for Society, State and Economy / eds.: E. G. Popkova, B. S. Sergi. ISC 2020. Lecture Notes in Networks and Systems. Vol. 155. Cham : Springer, 2021. P. 172-180. https://doi.org/10.1007/978-3-030-59126-7_20

3. Gordeev A. Y, Klyachin V. A., Kurbanov E. R, Driaba A. Y. Autonomous Mobile Robot with AI Based on Jetson Nano // Proceedings of the Future Technologies Conference (FTC), 2020. Vol. 1 / eds.: K. Arai, S. Kapoor, R. Bhatia. FTC 2020. Advances in Intelligent Systems and Computing. Vol. 1288. Cham : Springer, 2021. P. 190-204. https://doi.org/10. 1007/978-3-030-63128-4_15

4. Ren M., Pokrovsky A., Yang B., Urtasun R. SBNet: Sparse Blocks Network for Fast Inference // 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2018. P. 8711-8720. https://doi.org/10.1109/CVPR.2018.00908

5. Hu H., Cai Q., Wang D., Lin J., Sun M., Krhenbhl P., Darrell T., Yu F. Joint Monocular 3D Vehicle Detection and Tracking // Proceedings of the IEEE/CVF International Conference on Computer Vision. Seoul, Korea, 27 October-2 November 2019. P. 5390-5399.

6. Huang S., Qi S., Zhu Y., Xiao Y., Xu Y., Zhu S. C. Holistic 3d scene parsing and reconstruction from a single rgb image // Proceedings of the European Conference on Computer Vision (ECCV), 2018. P. 187-203.

7. Jackson A. S., Bulat A., Argyriou V., Tzimiropoulos G. Large pose 3D face reconstruction from a single image via direct volumetric CNN regression // 2017 IEEE International Conference on Computer Vision (ICCV). IEEE. 2017. P. 1031-1039.

8. Ferkova Z., Urbanova P., Cerny D., Zuzi M., Matula P. Age and gender-based human face reconstruction from single frontal image // Multimedia Tools and Applications. 2020. Vol. 79. P. 3217-3242. https://doi.org/10.1007/s11042-018-6869-5

9. Клячин В. А., Григорьева Е. Г. Алгоритм автоматического определения параметров ориентации камеры в пространстве на основе характерных элементов фотоснимка // Тенденции развития науки и образования. 2018. № 45, ч. 6. С. 10-20. https://doi.org/10. 18411/lj-12-2018-125

10. Клячин В. А., Григорьева Е. Г. Алгоритм 3D реконструкции поверхности вращения по её проекции // Сибирский журнал индустриальной математики. 2020. Т. 23, № 1. С. 84-92. https://doi.org/10.33048/SIBJIM.2020.23.108

11. Kamyab S., Ghodsi A., Zohreh Azimifar S. Deep structure for end-to-end inverse rendering. 2017 // ArXiv, abs/1708.08998.

12. Kamyab S., Zohreh Azimifar S. End-to-end 3D shape inverse rendering of different classes of objects from a single input image. 2017 // ArXiv, abs/1711.05858.

13. Penczek P. A. Fundamentals of three-dimensional reconstruction from projections // Methods in Enzymology. 2010. № 482. P. 1-33. https://doi.org/10.1016/S0076-6879(10)82001-4

References

1. Mousavian A., Anguelov D., Flynn J., & Kosecka J. 3D Bounding Box Estimation Using Deep Learning and Geometry. 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2017, pp. 5632-5640. https://doi.org/10.1109/cvpr.2017.597

2. Gordeev A. Y., Klyachin V. A. Determination of the Spatial Position of Cars on the Road Using Data from a Camera or DVR. In: E. G. Popkova, B. S. Sergi, eds. "Smart Technologies" for Society, State and Economy. ISC 2020. Lecture Notes in Networks and Systems, vol. 155. Cham, Springer, 2021, pp. 172-180. https://doi.org/10.1007/978-3-030-59126-7_20

3. Gordeev A. Y., Klyachin V. A., Kurbanov E. R., Driaba A. Y. Autonomous Mobile Robot with AI Based on Jetson Nano. In: K. Arai, S. Kapoor, R. Bhatia, eds. Proceedings of the Future Technologies Conference (FTC), 2020, vol. 1. FTC 2020. Advances in Intelligent Systems and Computing. Vol. 1288. Cham, Springer, 2021, pp. 190-204. https: //doi.org/10.1007/978-3-030-63128-4_15

4. Ren M., Pokrovsky A., Yang B., Urtasun R. SBNet: Sparse Blocks Network for Fast Inference. 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2018, pp. 8711-8720. https://doi.org/10.1109/CVPR.2018.00908

5. Hu H., Cai Q., Wang D., Lin J., Sun M., Krhenbhl P., Darrell T., Yu F. Joint Monocular 3D Vehicle Detection and Tracking. In: Proceedings of the IEEE/CVF International Conference on Computer Vision. Seoul, Korea, 27 October-2 November 2019, pp. 5390-5399.

6. Huang S., Qi S., Zhu Y., Xiao Y., Xu Y., & Zhu S. C. Holistic 3d scene parsing and reconstruction from a single rgb image. In: Proceedings of the European Conference on Computer Vision (ECCV), 2018, pp. 187-203.

7. Jackson A. S., Bulat A., Argyriou V., Tzimiropoulos G. Large pose 3D face reconstruction from a single image via direct volumetric CNN regression. 2017 IEEE International Conference on Computer Vision (ICCV). IEEE, 2017, pp. 1031-1039.

8. Ferkova Z., Urbanova P., Cerny D., Zuzi M., Matula P. Age and gender-based human face reconstruction from single frontal image. Multimedia Tools and Applications, 2020, vol. 79, pp. 3217-3242. https://doi.org/10.1007/s11042-018-6869-5

9. Klyachin V. A., Grigorieva E. G. Algorithm for automatic determination of camera orientation parameters in space based on the characteristic elements of the photograph. Tendencii razvitiya nauki i obrazovaniya, 2018, no. 45, pt. 6, pp. 10-20 (in Russian). https://doi. org/10.18411/lj-12-2018-125

10. Klyachin V. A., Grigorieva E. G. A 3D reconstruction algorithm of a surface of revolution from its projection. Journal of Applied and Industrial Mathematics, 2020, vol. 14, pp. 85-91. https://doi.org/10.1134/S1990478920010093

11. Kamyab S., Ghodsi A., Zohreh Azimifar S. Deep structure for end-to-end inverse rendering. 2017. ArXiv, abs/1708.08998.

12. Kamyab S., Zohreh Azimifar S. End-to-end 3D shape inverse rendering of different classes of objects from a single input image. 2017. ArXiv, abs/1711.05858.

13. Penczek P. A. Fundamentals of three-dimensional reconstruction from projections. Methods in Enzymology, 2010, no. 482, pp. 1-33. https://doi.org/10.1016/S0076-6879(10)82001-4

Поступила в редакцию / Received 26.12.2020 Принята к публикации / Accepted 07.10.2021 Опубликована / Published 31.03.2022

i Надоели баннеры? Вы всегда можете отключить рекламу.