Научная статья на тему 'Анализ условий, влияющих на свойства конструируемых признаков 3D-изображений'

Анализ условий, влияющих на свойства конструируемых признаков 3D-изображений Текст научной статьи по специальности «Математика»

CC BY
192
23
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Компьютерная оптика
Scopus
ВАК
RSCI
ESCI
Область наук
Ключевые слова
3D-изображение / гипертрейс-преобразование / гипертрейс-матрица / гипертриплетный признак / опорная сетка на сфере / аналитическая структура признаков / image / hypertrace transform / hypertrace matrix / hypertriplet feature / support grid on the sphere / features analytical structure

Аннотация научной статьи по математике, автор научной работы — Федотов Николай Гаврилович, Сёмов Алексей Александрович, Моисеев Александр Владимирович

В данной статье показаны теоретические результаты, полученные с помощью нового геометрического метода анализа и распознавания 3D-изображенийгипертрейс-преобразования. Кратко описывается математическая модель предлагаемого метода. Происходит дальнейшее развитие теории гипертриплетных признаков 3D-изображения, имеющих аналитическую структуру. Свойства признаков изучаются на этапе их формирования при помощи нового разработанного математического инструмента – гипертрейс-матрицы. Свойства признаков зависят от особенностей формирования и результатов обработки гипертрейс-матрицы.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Федотов Николай Гаврилович, Сёмов Алексей Александрович, Моисеев Александр Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Analysis of conditions that influence the properties of the constructed 3D-image features

In this article, we discuss theoretical results obtained using a new geometric method for 3D image analysis and recognition (a hypertrace transform). A mathematical model of the proposed method is briefly described. The theory of 3D image hypertriplet features with analytical structure is further developed. The feature properties are studied while they are being formed using a newly developed mathematical tool – a hypertrace matrix. The feature properties depend on a specific formation process and processing results of the hypertrace matrix.

Текст научной работы на тему «Анализ условий, влияющих на свойства конструируемых признаков 3D-изображений»

АНАЛИЗ УСЛОВИЙ, ВЛИЯЮЩИХ НА СВОЙСТВА КОНСТРУИРУЕМЫХ ПРИЗНАКОВ ЭБ-ИЗОБРАЖЕНИЙ

Н.Г. Федотов 1, А.А. Сёмов 2, А.В. Моисеев 3 1 Пензенский государственный университет, Пенза, Россия, 2 ООО «КомХэлф», Пенза, Россия, 3 Пензенский государственный технологический университет, Пенза, Россия

Аннотация

В данной статье показаны теоретические результаты, полученные с помощью нового геометрического метода анализа и распознавания 3Б-изображений - гипертрейс-преобразования. Кратко описывается математическая модель предлагаемого метода. Происходит дальнейшее развитие теории гипертриплетных признаков 3Б-изображения, имеющих аналитическую структуру. Свойства признаков изучаются на этапе их формирования при помощи нового разработанного математического инструмента - гипертрейс-матрицы. Свойства признаков зависят от особенностей формирования и результатов обработки гипертрейс-матрицы.

Ключевые слова: 3Б-изображение, гипертрейс-преобразование, гипертрейс-матрица, ги-пертриплетный признак, опорная сетка на сфере, аналитическая структура признаков.

Цитирование: Федотов, Н.Г. Анализ условий, влияющих на свойства конструируемых признаков 3Б-изображений / Н.Г. Федотов, А.А. Сёмов, А.В. Моисеев // Компьютерная оптика. - 2016. - Т. 40, № 6. - С. 887-894. - DOI: 10.18287/2412-6179-2016-40-6-887-894.

Введение

В современных условиях во многих областях науки, техники и промышленности возникла большая потребность в системах распознавания реальных трехмерных (далее 3Б) объектов. Сюда можно отнести робототехнику, результаты которой широко используются, например, в военном деле, в промышленности, в космонавтике и т.д. [1 - 3].

В индустриально развитых странах ведутся интенсивные исследования по решению проблем распознавания пространственных объектов на основе их изображений. Однако в этой области возникают большие сложности и нерешенные задачи, связанные:

• с созданием математических методов описания изображений реальных объектов;

• разработкой алгоритмов формирования инвариантных к пространственному положению и масштабу объекта наборы признаков, использование которых обеспечивает высокую надежность распознавания данных реальных 3Б-объектов;

• другими задачами теоретического и прикладного характера.

Несмотря на возрастающую потребность в развитии методов машинного зрения, их эффективность при распознавании 3Б-изображений значительно уступает возможностям человека. Например, в работе [4] рассматривается необходимость формирования моделей с обзором 360°, что человеку не требуется. В работах [5, 6] рассматриваются новые подходы к анализу формы, чтобы приблизить машинное понимание объекта к человеческому. Поэтому разработка нового метода анализа и распознавания 3Б-изображений является актуальной и перспективной задачей.

В статье рассматривается новый подход к анализу и распознаванию 3Б-изображений, основанный на методах и положениях стохастической геометрии и представляющий собой развитие идей из [1]. В работе [14] представлены практические эксперименты по примене-

нию разрабатываемого метода. Целью данной статьи является дальнейшее развитие нового метода распознавания 3Б-объекгов, направленное на анализ условий, формирующих свойства признаков. Теоретические исследования в данном направлении будут способствовать повышению качества конструируемых распознающих систем за счет сознательного выбора процедур, позволяющих извлекать признаки с заданными свойствами. Ниже кратко представлена математическая модель предлагаемого метода - гипертрейс-преобразование [7].

1. Математическая модель гипертрейс-преобразования

Обозначим через B(h, r) плоскость на расстоянии r от начала координат и вектором нормали h = [sin ф-cos ю, sin ф-sin ю, cos ф], где ю - угол между осью 0х и проекцией вектора п на плоскость 0xy, ф -угол между вектором п и осью 0z.

Исходная 3Б-модель изображения F сканируется сеткой параллельных плоскостей B(h(w, ф), r) под различными углами обзора ю и ф согласно узлам опорной сетки на сфере [7]. Идея построения опорной сетки заключается в следующем. Каждой сканирующей сетке параллельных плоскостей с парой углов (ю, ф) на единичной сфере сопоставим точку, которая будет являться точкой касания со сферой плоскости, параллельной плоскостям данной сетки. Множество точек на сфере образует сетку, которая называется опорной (рис. 1). Чтобы конструируемые признаки обладали свойством инвариантности к пространственному повороту 3D-изображения, опорная сетка должна иметь равномерное распределение точек на сфере.

Результат пересечения каждой сканирующей плоскости B(h(w, ф), r) с трёхмерной моделью F характеризуется числом, получаемым с помощью функционала Hyper T: G = Hyper T (F П B(h(w, ф), r)).

Результаты сканирования удобно занести в гипер-трейс-матрицу (будем называть её гипертрейс матри-

ца 3ТМ), у которой ось 0ш направлена горизонтально, ось 0ф - вертикально, ось 0г - вглубь [8].

1

О

0,5/

а)

0,2 \ /,

Рис. 1. Построение опорной сетки на сфере (а); процесс

сканирования 3D-изображения сеткой параллельных плоскостей (б)

Далее обрабатываются столбцы и строки сформированной матрицы с помощью функционалов Hyper 0, Hyper Q и Hyper P. В результате вычислений получается значение признака Res (F) исходной 3D-модели изображения в виде композиции четырех функционалов [8, 9]: Res (F) = HyperQ о HyperW ° HyperP о HyperT(Feect ).

Приставка Hyper для обозначения функционалов используется авторами для подчеркивания, что речь идет об обработке 3Б-объекта.

Изображение фигуры сечения FSect сканируется решеткой параллельных прямых l (р, 9) с дискретным шагом Ар между линиями под различными углами 9 до завершения полного обхода в 2п радиан. Результаты сканирования аналогичным образом формируются в двумерную трейс-матрицу, у которой ось 0р направлена вертикально, а ось 09 - горизонтально [10].

Признак 2Б-изображения получается сворачиванием строк и столбцов трейс-матрицы и имеет структуру в виде композиции трех функционалов [1, 10]:

П (Fect, ) = HyperT(FseCt ) = 0 о Р о T(Fsect n l (e, p)).

Объединяя полученные формулы, окончательно получаем следующую аналитическую структуру ги-пертриплетного признака 3Б-изображения:

Res (F) = HyperQ о HyperW о HyperP о

oHyperT(0оPоt(Feect Пl(e,p))).

2. Особенности формирования гипертрейс-матрицы

Если результаты сканирования 3Б-изображения (признаки сечений) заносить в матрицу от точки (0, 0,1) оси 0z в направлении по часовой стрелке от

оси 0х, то при формировании гипертрейс-матрицы 3ТМ [7, 9] возникают определенные трудности сохранения целостности ее структуры - нарушается порядок следования строк и столбцов друг за другом в матрице. Это вызвано тем, что равномерная сетка на сфере неизоморфна равномерной сетке на плоскости.

При повороте 3Б-изображения глубинные строки сохраняют порядок следования элементов, так как при повороте не изменяется порядок следования сечений (дискретная форма пространственного объекта). Однако при повороте 3Б-изображения порядок следования элементов в горизонтальных строках (ось 0ю) и вертикальных столбцах (ось 0ф) матрицы 3ТМ в общем случае без наложения дополнительных условий не сохраняется из-за произвольной пространственной ориентации 3Б-изображения.

Так, при обработке функционалами трехмерная матрица сворачивается в число в строго заданных направлениях (сначала глубинные, далее вертикальные, а затем горизонтальные строки). Поэтому из-за произвольной ориентации тела в пространстве возможен случайный поворот матрицы относительно оси 0г в пространстве 0шфг. Произвольное нарушение порядка следования строк матрицы друг за другом в данных фиксированных направлениях приведёт к изменению значения вычисляемого признака и, как следствие, инвариантность распознавания 3Б-изображения будет нарушена.

В связи с этим правила нумерации узлов опорной сетки, по которым формируется трехмерная гипер-трейс-матрица и определяется порядок следования ее элементов, должны определятся не относительно координатных осей, а относительно произвольно ориентированного пространственного объекта.

Для определения направления нумерации узлов опорной сетки достаточно идентифицировать некоторые опорные ключевые точки - узлы опорной сетки, которые однозначно определяются вне зависимости от пространственной ориентации 3Б-объекта. Данные опорные точки определяют начало отсчёта (первую глубинную строку), от которого начинает заполняться гипертрейс-матрица. Например, построение гипер-трейс-матрицы при нумерации узлов опорной сетки от первой ключевой точки по часовой стрелке в направлении второй ключевой точки для заполнения элементов матрицы.

Ключевые точки характеризуют уникальные свойства пространственного объекта, на основании которых могут быть построены гипертриплетные признаки, инвариантные к повороту 3Б-изображения. Так, в качестве ключевой точки можно взять узел на опорной сетке, который соответствует сетке секущих плоскостей, содержащей максимальное по площади сечение исходного пространственного объекта.

Стоит отметить, что при повороте объекта секущие плоскости (например, сечения, перпендикулярные главной оси объекта) будут соответствовать другим точкам опорной сетки по сравнению с точками сетки до его поворота. Поэтому необходимо задавать правило инвари-

антной нумерации узлов опорной сетки, которое позволяет получать однородную структуру матрицы, при обработке функционалами строк и столбов которой получаются одинаковые значения признака вне зависимости от пространственной ориентации 3Б-объекта.

Порядок следования горизонтальных строк (ось 0ю) и вертикальных столбцов (ось 0ф) при произвольной пространственной ориентации трехмерного тела имеет некоторые особенности в зависимости от метода построения гипертрейс-матрицы 3ТМ. Приведем один из примеров нумерации узлов опорной сетки (методов построения гипертрейс-матрицы).

Из всего множества возможных узлов опорной сетки выбирается ключевая точка, имеющая отличительное значение по какому-либо признаку. Данная ключевая точка считается за северный полюс, от которого по сфере начинают строиться меридианы. Данные меридианы разбивают сферу на двуугольники с вершинами в северном и диаметрально противоположном ему относительно центра сферы южном полюсе. Нулевым меридианом будет считаться тот, который проходит через точку с координатами (1; 0; 0). В случае совпадения указанной точки 5 с одним из полюсов сферы - через точку (0; 1; 0).

Нумерация в каждом двуугольнике идет от северного полюса к южному по часовой стрелке. Обход всех двуугольников совершается по часовой стрелке (если смотреть на северный полюс сверху), начиная и заканчивая двуугольниками, чьи стороны содержат нулевой меридиан.

В этом случае смысл строк и столбцов гипер-трейс-матрицы 3ТМ останется тем же с той лишь разницей, что тройке (ю;, фj, тк) соответствует элемент матрицы со значением Щ^^) и номером (5^ у*, т), соответствующая точка которого лежит в пределах от долготы 5( до 5г+^, в полосе широт от у* до у*+1. Соответственно, все точки, принадлежащие одному двуугольнику, соответствуют всем значениям одного вертикального столбца матрицы 3ТМ.

Горизонтальные строки определяют порядок считывания граней выпуклого многогранника (в частности, икосаэдра). Так как нулевой меридиан определяется на основе глобальной системы координат, от которой зависит ориентация 3Б-объекта, то вертикальные столбцы (ось 05) представляют собой дискретный аналог периодической кривой.

3. Анализ свойств гипертрейс-матриц для построения инвариантного класса признаков ЗБ-изображений

Трейс-матрицы 3ТМ и ТМ являются удобным инструментом для анализа движения распознаваемых объектов и их масштабных изменений [1, 10]. Гипер-трейс-матрица 3ТМ - 3Б-трейс-образ исходного пространственного изображения, который содержит информацию о первоначальном объекте. Аналогично, трейс-матрица ТМ - 2Б-трейс-образ плоского изображения 2Б-фигуры сечения, полученного при пересечении плоскости ф), т) исходного 3Б-объекта

В зависимости от вида преобразования, применяемого к 3D- и 2Б-изображению, свойства гипертрейс-и трейс-матриц будут различными. Поэтому целесообразно рассмотреть данные матрицы отдельно.

Свойства трейс-матриц в зависимости от операций, применяемых к 2Б-изображению сечения [1, 10]:

1) Поворот 2Б-изображения в плоскости сечения.

В локальных осях плоскости сечения каждая сканирующая прямая l будет характеризоваться расстоянием р от локального начала координат до нее и углом 9 ее направляющего вектора и локальной оси абсцисс (0 < 9 < 2p):

l (9, р) = {(х, y): хcos 9 + y sin 9 = p] .

Если прямую в плоскости сечения повернуть на угол п радиан, то она будет параллельна сама себе, при этом ее направляющий вектор и вектор нормали, лежащие в плоскости сечения, будут направлены в прямо противоположную сторону: l(9, р) = l(9+p, р) для любого значения угла 9. Так как вектор нормали прямой в плоскости сечения определяет направление порядка следования пересечений 2Б-изображения сеткой сканирующих прямых (элементы матрицы ТМ по вертикальной оси 0р), то через каждый интервал длины п по оси 09 переворачиваются столбцы трейс-матрицы (ось 0р).

Если прямую в плоскости сечения повернуть на угол 2п радиан, то она совпадёт сама с собой, в том числе ее направляющий вектор и вектор нормали: l(9, р) = l(9+2p, р). Поэтому матрица ТМ будет 2п-периодична в направлении горизонтальной оси 09.

В связи с этим, если первоначальное 2Б-изобра-жение поворачивается на угол в, то происходит сдвиг столбцов трейс-матрицы ТМ в горизонтальном направлении на в единиц, так как сканирующей прямой l(9, р) исходного изображения FSect будет соответствовать сканирующая прямая Г (9+b, р) повернутого изображения F'Sect: l(9, р) = l' (9+b, р). Поэтому 2D-трейс-образ изображения будет сдвигаться вперёд или назад на |в| единиц по горизонтальной оси 09 в зависимости от знака угла в. При этом порядок следования столбцов друг за другом не изменится, так как порядок сканирований сетками прямых формируется последовательно друг за другом (по возрастанию значений угла 9 от 0 до 2п радиан).

2) Перенос 2Б-изображения в плоскости сечения.

Если происходит сдвиг исходного 2D-

изображения на некоторый вектор {a-cos b; a-sin b} длины a под углом в к локальной оси абсцисс, то точка (х ', y') сдвинутого изображения F' будет соответствовать точке (х, y) исходного изображения F следующим образом: х ' = a-cos b, y ' = a-sin b.

Поэтому сканирующей прямой l (9, р) исходного изображения Fsect будет соответствовать сканирующая прямая l' (9' , р') сдвинутого изображения F set

х cos 9 + y sin 9 = р ,

(х + a cos b) cos 9' + (y + a sinb) sin 9 ' = р',

х cos 9' + y sin 9' + (a cos b cos 9' + a sin b sin 9') = р',

х cos 9' + y sin 9' = р - a cos (9 ' -b).

Так как сканирующей прямой l (9, р) исходного изображения Fsect соответствует сканирующая прямая l (9, р - a-cos (9 - b)) сдвинутого изображения F'sect, то при переносе исходного 2Б-изображения на некоторый вектор {a-cos b; a-sin b} произойдет сдвиг строк трейс-матрицы ТМ в вертикальном направлении на a-cos (9 - b) единиц вверх или вниз в зависимости от знака выражения. При этом вертикальные столбцы матрицы ТМ остаются на своём месте и не сдвигаются вдоль оси 09, так как при сдвиге 2Б-изображения угол сканирующей прямой Г(9', р'), соответствующий сканирующей прямой l (9, р) исходного изображения, не изменяется: 9' = 9.

Таким образом, при сдвиге 2Б-изображения в плоскости сечения в трейс-матрице ТМ увеличивается или уменьшается количество нулевых элементов в вертикальных столбцах (ось 0р) в зависимости от его приближения или удаления от локального начала координат. Поэтому 2Б-трейс-образ изображения будет растягиваться вдоль оси 0р на соответствующее число, определяемое вектором переноса.

3) Масштабирование 2Б-изображения в плоскости сечения.

Если происходит масштабирование исходного 2D-изображения в ц раз, то точка (x', y' ) масштабированного изображения F'sect будет соответствовать точке (x,y) исходного изображения Fsect следующим образом: x' = m-x, y ' = m-y.

Поэтому сканирующей прямой l (9, р) исходного изображения Fsect будет соответствовать сканирующая прямая l' (9' , р' ) масштабированного изображения F'sect:

Г /л/ f • í\f '

x cos 9 + y sin 9 = р ,

x cos 9' + y sin 9' = (р'/m), 0.

Таким образом, при р ' = |-р и 9'= 9 сканирующая прямая l (9 , р ) совпадет с прямой l (9, р). При масштабировании в ц раз 2Б-изображение сечения будет пересекать больше (при m > 1) или меньше (при m < 1) сканирующих прямых, так как изменяются размеры 2Б-изображения при сохранении значения шага сканирования. В связи с этим, в вертикальных строках столбцах трейс-матрицы ТМ соответственно изменится количество ненулевых элементов, которые обозначают свойства пересечений плоского изображения сеткой прямых. Следовательно, 2Б-трейс-образ изображения будет расширяться или сужаться в ц раз вдоль оси 0р.

Стоит отметить, что при масштабировании изображения будут изменяться еще и значения элементов трейс-матрицы ТМ. Так, если в качестве функционала Т взять длину отрезка пересечения сканирующей прямой 2Б-изображения сечения Fsect, то значения элементов трейс-матрицы для сканирующих прямых l (9, р) и l (9 , р ) будут равны соответственно:

i Fsect П l (9, р))=7( x2 - x )2 +( y 2 - yi )2 = l0,

T(

T(Fsect П l'(9', р')) = ^(x2 - x')2 +(y2 - y')2

= V(m-x2-m- xi )2+(m-y2-m-yi )2 = m-10.

Следовательно, значение элементов трейс-матрицы ТМ при m > 1 увеличатся в ц раз, а при m < 1 -уменьшатся в ц раз, если в качестве значения трейс-функционала была взята длина высекаемого отрезка. В зависимости от вида функционала Т значения элементов матрицы могут изменяться по-разному.

Свойства гипертрейс-матриц в зависимости от операций, применяемых к 3Б-изображению:

1) Поворот 3Б-изображения в пространстве.

В глобальных осях 3Б-объекта каждая сканирующая плоскость B будет характеризоваться расстоянием r от начала координат до нее и углами ю и ф (0 < ю < 2я,0 < f < я), где h = [cos ю-sin f, sin ю-sin f, cos f] - единичный вектор в R3, ю - угол между осью 0x и проекцией на плоскость 0xy прямой b с B, ф - угол между осью 0z и прямой b:

B(h(w,f),r) = {(x,y,z): x - cos ю-sinf + +y - sin ю-sin f + z - cos f = r}.

Как уже было сказано выше, для учета произвольной неизвестной пространственной ориентации объекта необходимо определить ключевые точки, которые однозначно идентифицируются для исходного F и повернутого F' изображений еще до занесения результатов сканирования в гипертрейс-матрицу, так как данные точки характеризуют уникальные свойства 3Б-объекта, не зависящие от его вращения в пространстве. Ключевым точкам будут соответствовать плоскости B(h(5, g), r) и B'(h(5', g), r), для которых B(h(5, g), r) = B'(h(5', g), r).

Если сканирующую плоскость B в пространстве повернуть относительно прямой d, проходящей через фиксированный северный полюс сферы (первая ключевая точка), на угол п радиан, то она будет параллельна сама себе и ее вектор нормали h будет направлен в прямо противоположную сторону, так как для любого значения угла 5 имеются равенства

B(h(5, g), r)=B'(h(5+p, я-g), r) и h = -h': h(5+p, я-g) = [cos (5 + я)-sin (я-g), sin (5+я)- sin (я-g) ,cos (я-g)] = = [- cos 5- sin g, - sin 5- sin g, - cos g] = -h(5, g).

Другими словами, плоскостям B(h(5, g), r) и B'(h(5+p я-g), r) будут соответствовать диаметрально противоположные точки опорной сетки на сфере. Так как вектор нормали плоскости определяет направление порядка следования сечений 3Б-объекта сеткой сканирующих плоскостей (элементы матрицы 3ТМ по глубинной оси 0r), то через каждый интервал длины п по оси 05 переворачиваются вертикальные столбцы (ось 0у) и глубинные строки (ось 0r) гипертрейс-матрицы 3ТМ.

Если плоскость B повернуть в пространстве относительно прямой d на угол 2п радиан, то она совпадёт

сама с собой, в том числе и ее вектор нормали h :

B(h(5, g), r) = B'(h(5+2n; g), r) и h = -h ' для любого значения угла 5. Поэтому матрица 3ТМ будет 2п-периодична в направлении горизонтальной оси 05.

2) Перенос 3Б-изображения в пространстве. Если происходит сдвиг исходного 3D-

изображения на некоторый вектор {a - cos 1 - sinb; a - sin 1 - sinb; a - cos b]

длины a, то точка (х', y', z ') сдвинутого изображения F будет соответствовать точке (х, y, z) исходного изображения F следующим образом: х' = х + a - cos 1-sin b, y' = y + a - sin1-sinb, z' = z + a - cos b.

Поэтому сканирующей плоскости B(h(5, g), r) исходного изображения F будет соответствовать сканирующая плоскость B'(h(5', g), r') сдвинутого изображения F:

х - cos 5'-sing+y' - sin5'-sing+z - cosg = r , (х + a - cos 1 - sin b)- cos 5' - sin g' +

+ (y + a - sin 1-sin b)-sin 5'-sin g +

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+ (z + a - cos b)- cos g' = r', х - cos 5'-sin g+y - sin 5'-sin g+z - cos g = = r' - a - (cos 1 - sin b- cos 5' - sin g' +

+ sin 1 - sin b - sin 5' - sin g+cos b- cos g'),

5/ • / Q / • / /

- sin g + y - sin 5 - sin g + z - cos g =

= r ' - a -(sin b- sin g'- cos (5 '-1) + cos b- cos g').

Так как сканирующей плоскости B(h(5, g), r) исходного изображения F соответствует плоскость

B ' (h(5, g), / -

-a -(sin b- sin g - cos (5 -1) + cos b- cos g))

сдвинутого изображения F, то при переносе исходного трехмерного изображения на некоторый вектор {a-cos 1-sin b; a-sin 1-sin b; a-cos b} произойдет сдвиг строк гипертрейс-матрицы 3ТМ в глубинном направлении на a-sin b-sin g-cos (5 - 1)+cos b-cos g) единиц вверх или вниз в зависимости от знака выражения. При этом вертикальные столбцы и горизонтальные строки матрицы 3ТМ остаются на своём месте и не сдвигаются вдоль осей 0ш и 0ф, так как при сдвиге 3Б-изображения угол сканирующей плоскости B'(h(5 ' , g), r) соответствующей сканирующей плоскости B(h(5, g), r) исходного изображения, не изменяется: 5 = 5, g = g.

Таким образом, при сдвиге 3Б-изображения в ги-пертрейс-матрице 3ТМ увеличивается или уменьшается количество нулевых элементов в глубинных строках (ось 0r) в зависимости от его приближения или удаления от глобального начала координат. Поэтому 3Б-трейс-образ изображения будет растягиваться вдоль оси 0r на соответствующее число, определяемое вектором переноса.

3) Операция масштабирования 3Б-изображения в пространстве.

Если происходит масштабирование исходного 3D-изображения в ^ раз, то точка (х ', y' , z ' ) масштабированного изображения F будет соответствовать точке (х, y, z) исходного изображения F следующим образом: х ' = m-х, y ' = m-y, z ' = m-z.

Поэтому сканирующей плоскости B(h(5, g), r) исходного изображения F будет соответствовать следующая сканирующая плоскость B'(h(5 ' , g ), r') масштабированного изображения F:

х - cos 5'-sing+y - sin5'-sing+z - cosg = r',

5/ • / Q/ • /

- sing +m-y - sin5 - sing +

+ m- z - cos g = r',

5/ • / Q/ • / / //

- sin g + y - sin 5 - sin g + z - cos g = r /m,

m* 0.

Таким образом, при r' = m-r и 5 ' = 5, g = g сканирующая плоскость B'(h(5, g), r') совпадет с плоскостью B(h(5, g), r). При масштабировании в ^ раз 3D-изображение будет пересекать больше (при m > 1) или меньше (при m < 1) сканирующих плоскостей, так как изменяются размеры 3D-изображения при сохранении значения шага сканирования. В связи с этим в глубинных строках гипертрейс-матрицы 3ТМ соответственно изменится количество ненулевых элементов, которые обозначают свойства сечений пространственного изображения сеткой плоскостей. Поэтому 3D-трейс-образ изображения будет расширяться или сужаться в ^ раз вдоль оси 0r.

Стоит отметить, что при масштабировании изображения будут изменяться значения элементов гипер-трейс-матрицы 3ТМ. Рассмотрим, как изменятся значения элементов гипертрейс-матрицы, если в качестве функционала HyperY взять вычисление площади сечения.

Так как изначально задан полигональный 3D-объект, то любое из его сечений плоскостью можно представить совокупностью многоугольников произвольной формы. Так как любой многоугольник можно разбить на множество треугольников, то площадь сечения FSect исходного изображения F будет равна:

П( FSeC, ) = X Sa .

Площадь сечения FSect масштабированного изображения F будет равна:

п( F'sect ) = X SA = m2 - X SA =m2 -n (FSeCt).

Таким образом значения элементов гипертрейс-матрицы 3ТМ при m> 1 увеличатся в m2 раз, а при m < 1 - уменьшатся в m2 раз, если в качестве признака сечения была взята площадь. В зависимости от вида трейс функционала HyperJ значения элементов матрицы могут изменяться по-разному.

Таким образом, зная заранее, как реагирует 3D-трейс-образ исходного пространственного объекта на то или иное его движение и масштабирование, можно изначально конструировать признаки с заранее заданными свойствами. В частности, возможно построение классов признаков, сенситивных и/или инвариантных к тем или иным преобразованиям 3D-изображения.

Заключение

Актуальность создания нового метода анализа и распознавания 3Б-объектов связана с разработкой такого метода сканирования, который обладал бы одновременно и универсальностью, и быстродействием. Заметим, что разрабатываемый метод является развитием подходов, используемых для анализа 2D-изображений [1]. Возможности повышения быстродействия разрабатываемого метода при сканировании 3Б-объектов рассмотрено в [11].

Гипертрейс-преобразование позволяет создавать инвариантное описание пространственного объекта вне зависимости от его пространственной ориентации, положения и масштаба.

Трейс-матрицы 3ТМ и ТМ являются удобным инструментом для анализа движения распознаваемых объектов и их масштабных изменений. Гипертрейс-матрица - 3Б-трейс-модель исходного пространственного изображения, которая содержит всю информацию о первоначальном объекте. Возможности извлечения различных свойств 3Б-объекта описаны в [12, 13].

Применяя при обработке матрицы соответствующие функционалы, которые инвариантны к приведенным выше преобразованиям изображения и изменениям строк гипертрейс- и трейс-матриц, мы будем конструировать признаки, инвариантные к группе движений и масштабированию 3Б-изображения. Строгое математическое описание данных свойств (изменений матрицы в результате движения 3D-изображения) содержится выше в данной статье.

Благодарности

Работа выполнена при поддержке гранта РФФИ (проект №15-07-04484).

Литература

1. Федотов, Н.Г. Теория признаков распознавания образов на основе стохастической геометрии и функционального анализа / Н.Г. Федотов. - М.: Физматлит, 2010. - 304 с. - ISBN: 978-5-9221-0996-3.

2. Kiy, K.I. Segmentation and detection of contrast objects and their application in robot navigation / K.I. Kiy // Pattern Recognition and Image Analysis. - 2015. - Vol. 25, Issue 2. - P. 338-346. - DOI: 10.1134/S1054661815020145.

3. Wang, C. VFM: visual feedback model for robust object recognition / C. Wang, K.-Q. Huang // Journal of Computer Science and Technology. - 2015. - Vol. 30, Issue 2. -P. 325-339. - DOI: 10.1007/s11390-015-1526-1.

4. Zhang, Y. PanoContext: A whole-room 3D context model for panoramic scene understanding / Y. Zhang, S. Song,

P. Tan, J. Xiao / Proceedings of the 13th European Conference on Computer Vision (ECCV 2014). - Zurich, Switzerland: Springer, 2014. - Part VI, Vol. 8694. - P. 668-686. -DOI: 10.1007/978-3-319-10599-4_43.

5. Andreux, M. Anisotropic Laplace-Beltrami operator for shape analysis / M. Andreux, E. Rodola, M. Aubry, D. Cremers / Proceedings of the 13th European Conference on Computer Vision (ECCV 2014). - Zurich, Switzerland: Springer, 2014. - Part VI, Vol. 8928. - P. 299-312. - DOI: 10.1007/978-3-319-16220-1_21.

6. Elhachloufi, M. Affine invariant descriptors of 3D object using multiple regression model / M. Elhachloufi, A.El Oirrak, D. Aboutajdine, M.N. Kaddioui // International Journal of Computer Science & Information Technology. -2011. - Vol. 3, Issue 1. - P. 1-10. - DOI: 10.5121/ijcsit.2011.3101.

7. Fedotov, N.G. Trace transform of spatial images / N.G. Fedotov, S.V. Ryndina, А.А. Syemov / 11th International conference on Pattern Recognition and Image Ana-lasis: New Information technologies (PRIA-11-2013). Conference Proceedings (V. I-II). - Samara: IPSI RAS, 2013. -V. 1. - P. 186-189.

8. Fedotov, N.G. Trace transform of three-dimensional objects: recognition, analysis and database search / N.G. Fedotov, S.V. Ryndina, А.А. Semov // Pattern Recognition and Image Analysis. Advances in Mathematical Theory and Applications. - 2014. - Vol. 24, Issue 4. - P. 566-574. - DOI: 10.1134/S105466181404004X.

9. Сёмов, А.А. Основные методы построения гипертрейс-матриц / А.А. Сёмов // XXI век: итоги прошлого и проблемы настоящего плюс. Серия: технические науки. Информационные технологии. - 2015. - № 03(25) -С. 69-76.

10. Fedotov, N.G. The theory of image-recognition features based on stochastic geometry / N.G. Fedotov // Pattern Recognition and Image Analysis. Advances in Mathematical Theory and Applications. - 1998. - Vol. 8, Issue 2. -P. 264-266.

11. Федотов, Н.Г. Минимизация признакового пространства распознавания 3D изображения на основе стохастической геометрии и функционального анализа / Н.Г. Федотов, А.А. Семов, А.В. Моисеев // Машинное обучение и анализ данных. - 2015. - T. 1, № 13. -C. 1796-1814. - DOI: 10.21469/22233792.1.13.03.

12. Федотов, Н.Г. Интеллектуальные возможности гипер-трейс-преобразования: конструирование признаков с заданными свойствами / Н.Г. Федотов, А.А. Семов, А.В. Моисеев // Машинное обучение и анализ данных. -2014. - T. 1, № 9. - C. 1200-1214.

13. Федотов, Н.Г. Гипертрейс-матрица как основной инструмент анализа 3D объектов / Н.Г. Федотов, А.А. Сёмов // XXI век: итоги прошлого и проблемы настоящего плюс. Серия: технические науки. Информационные технологии. - 2015. - № 03(25). - С. 63-69.

Сведения об авторах

Федотов Николай Гаврилович, 1945 года рождения. В 1967 году окончил с отличием Пензенский политехнический институт (ныне Пензенский государственный университет) по специальности «Вычислительная техника». По окончании аспирантуры при том же институте в 1973 году в ученом совете Рязанского радиотехнического института защитил диссертацию на соискание ученой степени кандидата технических наук. В 1990 году в Московском институте электроники и математики (МИЭМ) защитил диссертацию на соискание ученой степени доктора технических наук. Имеет ученые звания доцента (1977) и профессора (1992). В Пензенском государственном университете работает с 1971 года. С 1996 года заведует кафедрой экономической кибернетики. Область научных

интересов: распознавание образов, стохастическая геометрия, признаки распознавания, анализ изображений, функциональный анализ, искусственный интеллект, экономическая кибернетика. E-mail: _ [email protected] .

Сёмов Алексей Александрович, 1990 года рождения, в 2012 году окончил Пензенский государственный университет по специальности 080116 «Математические методы в экономике». В 2015 году защитил диссертацию на соискание ученой степени кандидата технических наук. Работает аналитиком в ООО «КомХэлф». Область научных интересов: математическое моделирование, математическая статистика, теория вероятностей, обработка изображений, распознавание образов. E-mail: [email protected] .

Моисеев Александр Владимирович, 1972 года рождения, в 1994 году окончил Пензенский государственный педагогический университет им. В.Г. Белинского по специальности «Математика». В 1997 году защитил диссертацию на соискание ученой степени кандидата физико-математических наук. Имеет ученое звание доцент (2001). Работает доцентом кафедры математики Пензенского государственного технологического университета. Область научных интересов: математический анализ, краевые задачи, теория вероятностей, математическая статистика, математическое моделирование экономических процессов, распознавание образов. E-mail: [email protected] .

ГРНТИ: 28.23.15

Поступила в редакцию 14 июня 2016 г. Окончательный вариант - 24 октября 2016 г.

ANALYSIS OF CONDITIONS THAT INFLUENCE THE PROPERTIES OF THE CONSRUCTED 3D-IMAGE FEATURES

N.G. Fedotov 1, A.A. Syemov 2, A. V. Moiseev 3

1 Penza State University, Penza, Russia,

2 LLC «KomHelf», Penza, Russia,

3 Penza State Technological University, Penza, Russia

Abstract

In this article, we discuss theoretical results obtained using a new geometric method for 3D image analysis and recognition (a hypertrace transform). A mathematical model of the proposed method is briefly described. The theory of 3D image hypertriplet features with analytical structure is further developed. The feature properties are studied while they are being formed using a newly developed mathematical tool - a hypertrace matrix. The feature properties depend on a specific formation process and processing results of the hypertrace matrix.

Keywords: image, hypertrace transform, hypertrace matrix, hypertriplet feature, support grid on the sphere, features analytical structure.

Citation: Fedotov NG, Syemov AA, Moiseev AV. Analysis of conditions that influence the properties of the constructed 3D-image features. Computer Optics 2016; 40(6): 887-894. DOI: 10.18287/2412-6179-2016-40-6-887-894.

Acknowledgements: The work was partially funded by the Russian Foundation of Basic Research, grant No. 15-07-04484.

References

[1] Fedotov NG. The theory of pattern recognition features based on stochastic geometry and functional analysis [In Russian]. Moscow: "Fizmatlit" Publisher; 2010. ISBN: 978-5-9221-0996-3.

[2] Kiy KI. Segmentation and detection of contrast objects and their application in robot navigation. Pattern Recognition and Image Analysis 2015; 25(2): 338-346. DOI: 10.1134/S1054661815020145.

[3] Wang C, Huang K-Q. VFM: visual feedback model for robust object recognition. Journal of Computer Science and Technology 2015; 30(2): 325-339. DOI: 10.1007/s11390-015-1526-1.

[4] Zhang Y, Song S, Tan P, Xiao J. PanoContext: A whole-room 3D context model for panoramic scene understanding. ECCV 2014; VI(8694): 668-686. DOI: 10.1007/978-3-319-10599-4_43.

[5] Andreux M, Rodola E, Aubry M, Cremers D. Anisotropic Laplace-Beltrami operator for shape analysis. ECCV 2014; VI(8928): 299-312. DOI: 10.1007/978-3-319-16220-1_21.

[6] Elhachloufi M, El Oirrak A, Aboutajdine D, Kaddioui MN. Affine invariant descriptors of 3D object using multiple regression model. International Journal of Computer Science & Information Technology 2011; 3(1): 1-10. DOI: 10.5121/ijcsit.2011.3101.

[7] Fedotov NG, Ryndina SV, Syemov AA. Trace transform of spatial images. 11th International conference on Pattern Recognition and Image Analysis: New Information technologies (PRIA-11-2013). Conference Proceedings. Samara, Russia: IPSI RAS; 2013; 1: 186-189.

[8] Fedotov NG, Ryndina SV, Syemov AA. Trace transform of three-dimensional objects: recognition, analysis and database search. Pattern Recognition and Image Analysis. Advances in Mathematical Theory and Applications 2014; 24(4): 566-574. DOI: 10.1134/S105466181404004X.

[9] Semov AA. The basic methods of hypertrace-matrix formation [In Russian] // 21st century: Results of the Past and Problem of the Present plus. Scientific and methodical magazine. Series: Engineering science. Information technologies 2015; 03(25): 69-76.

[10] Fedotov NG. The Theory of Image-Recognition Features Based on Stochastic Geometry. Pattern Recognition and Image Analysis. Advances in Mathematical Theory and Applications 1998; 8(2): 264-266.

[11] Fedotov NG, Semov AA, Moiseev AV. Feature space minimization of three-dimensional image recognition based on stochastic geometry and functional analysis [In Russian]. Machine Learning and Data Analysis 2015; 1(13): 17961814. DOI: 10.21469/22233792.1.13.03.

[12] Fedotov NG, Syemov AA, Moiseev AV. Intelligent capabilities hypertrace transform: Constructing features with predetermined properties [In Russian]. Machine Learning and Data Analysis 2014; 1(9): 1200-1214.

[13] Fedotov NG, Syemov AA. Hypertrace-matrix as main tool for 3D objects analysis [In Russian]. 21st century: Results of the Past and Problem of the Present plus. Scientific and methodical magazine. Series: Engineering science. Information technologies 2015; 03(25): 63-69.

Authors' information

Nikolay Gavrilovich Fedotov (b. 1945) graduated with honors from Penza Polytechnic Institute (now the Penza State University) in 1967 on a specialty "Computer Science". After graduate school at the same institute in 1973, the Scientific Council of the Ryazan Radio Engineering Institute defended his thesis for the degree of Candidate of Technical Sciences. In 1990, at the Moscow Institute of Electronics and Mathematics (MIEM) defended his thesis for the degree of Doctor of Technical Sciences. He has the rank of assistant professor (1977) and professor (1992). Since 1996, Head of Economic Cybernetics department. His research interests include pattern recognition, stochastic geometry, signs of recognition, image analysis, functional analysis, artificial intelligence, economic cybernetics. E-mail: fedotov@pnzgu. ru .

Aleksey Alexandrovich Syemov (b. 1990) graduated from Penza State University in 2012, majoring 080116 "Mathematical Methods in Economics". In 2015, he defended his thesis for the degree of Candidate of Technical Sciences. He worked as an analyst in the company "KomHelf". Research interests: mathematical modeling, mathematical statistics, probability theory, image processing, pattern recognition. E-mail: [email protected] .

Alexander Vladimirovich Moiseev (b. 1972) graduated from Penza State Pedagogical Institute in 1994, specialty "Mathematics". In 1997, he defended his thesis for the degree of Candidate of Physical and Mathematical Sciences. He holds the title of Associate Professor (2001). It works assistant professor of "Mathematics" Penza State Technological University. His research interests include mathematical analysis, boundary value problems, probability theory, mathematical statistics, mathematical modeling of economic processes, pattern recognition. E-mail: [email protected] .

Received June 14, 2016. The final version - October 24, 2016.

i Надоели баннеры? Вы всегда можете отключить рекламу.