Научная статья на тему 'Теоретические основы гипертрейс-преобразования: техника сканирования, математический аппарат и экспериментальная проверка'

Теоретические основы гипертрейс-преобразования: техника сканирования, математический аппарат и экспериментальная проверка Текст научной статьи по специальности «Математика»

CC BY
170
21
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Компьютерная оптика
Scopus
ВАК
RSCI
ESCI
Область наук
Ключевые слова
распознавание 3D-изображений / геометрическое гипертрейс-преобразование / сетка параллельных плоскостей / стохастическое сканирование / аналитическая структура признака / гипертрейс-матрица / инвариантность распознавания. / recognition of 3D images / geometric hypertrace-transform / grid of parallel planes / stochastic scanning / analytical structure of the feature / hypertrace matrix / and invariant recognition.

Аннотация научной статьи по математике, автор научной работы — Федотов Николай Гаврилович, Сёмов Алексей Александрович, Моисеев Александр Владимирович

В статье последовательно описывается теоретическая основа нового геометрического метода анализа и распознавания трехмерных (3D) изображений. Дается описание техники сканирования для формирования гипертрейс-преобразования и его математическая модель. Данный метод в отличие от существующих позволяет анализировать 3D-изображения без предварительного их упрощения или построения проекций на плоскости, анализируя непосредственно их трехмерную форму. Обоснован выбор сканирующего инструмента и построение опорной сетки на сфере, необходимой для решения проблемы инвариантности распознавания 3D-изображения к повороту. Разработан математический аппарат стохастической реализации техники сканирования на основе стохастической геометрии и функционального анализа. Введен новый математический инструмент для анализа 3D-изображений – гипертрейс-матрица, позволяющий распознавать пространственные объекты сложной формы и структуры благодаря построению единой математической модели 3D-изображения. Представлено описание нового типа признаков 3D-изображений, имеющих аналитическую структуру, – гипертриплетные признаки, благодаря аналитической структуре которых возможна автоматическая генерация большого количества признаков с заранее заданными свойствами. Рассматриваются результаты экспериментальной проверки, демонстрирующие точность вычисления признаков для распознавания 3D-изображения и доказывающие адекватность разработанного математического аппарата.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Федотов Николай Гаврилович, Сёмов Алексей Александрович, Моисеев Александр Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Theoretical foundations of hypertracetransform: scanning techniques, mathematical apparatus and experimental verification

We consistently describe the theoretical basis of a new geometric method of analysis and recognition of three-dimensional (3D) images. The description of a scanning technique for forming a hypertrace transform and its mathematical model are given. This method, unlike the existing ones, enables 3D images to be analyzed directly from their 3D shape, without first simplifying them or constructing plane projections. We substantiate the selection of a particular scanning tool and the need to construct a reference spherical grid to address the problem of the rotational invariance of the 3D image recognition. A mathematical apparatus of the stochastic realization of the scanning technique based on stochastic geometry and functional analysis is developed. We introduce a new mathematical tool for 3D image analysis – a hypertrex matrix that allows spatial objects of complex shape and structure to be recognized by constructing a single mathematical model of the 3D image. We describe a new type of 3D image features that have an analytic structure hypertryplet features, whose analytical structure makes possible an automatic generation of a large number of features with predetermined properties. Results of the experimental verification are presented, demonstrating the accurate calculation of features for 3D image recognition and proving the adequacy of the developed mathematical apparatus.

Текст научной работы на тему «Теоретические основы гипертрейс-преобразования: техника сканирования, математический аппарат и экспериментальная проверка»

ОБРАБОТКА ИЗОБРАЖЕНИЙ, РАСПОЗНАВАНИЕ ОБРАЗОВ

ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ГИПЕРТРЕЙС-ПРЕОБРАЗОВАНИЯ: ТЕХНИКА СКАНИРОВАНИЯ, МАТЕМАТИЧЕСКИЙ АППАРАТ И ЭКСПЕРИМЕНТАЛЬНАЯ ПРОВЕРКА

Н.Г. Федотов 1, А.А. Сёмов 2, А.В. Моисеев•1 1 ФГБОУ ВО «Пензенский государственный университет», Пенза, Россия, 2 ООО «КОМХЭЛФ», Пенза, Россия

Аннотация

В статье последовательно описывается теоретическая основа нового геометрического метода анализа и распознавания трехмерных (3D) изображений. Дается описание техники сканирования для формирования гипертрейс-преобразования и его математическая модель. Данный метод в отличие от существующих позволяет анализировать 3D-изображения без предварительного их упрощения или построения проекций на плоскости, анализируя непосредственно их трехмерную форму. Обоснован выбор сканирующего инструмента и построение опорной сетки на сфере, необходимой для решения проблемы инвариантности распознавания 3D-изображения к повороту. Разработан математический аппарат стохастической реализации техники сканирования на основе стохастической геометрии и функционального анализа. Введен новый математический инструмент для анализа 3D-изображений - гипертрейс-матрица, позволяющий распознавать пространственные объекты сложной формы и структуры благодаря построению единой математической модели 3D-изображения. Представлено описание нового типа признаков 3D-изображений, имеющих аналитическую структуру, - гипертриплет-ные признаки, благодаря аналитической структуре которых возможна автоматическая генерация большого количества признаков с заранее заданными свойствами. Рассматриваются результаты экспериментальной проверки, демонстрирующие точность вычисления признаков для распознавания 3D-изображения и доказывающие адекватность разработанного математического аппарата.

Ключевые слова: распознавание 3D-изображений, геометрическое гипертрейс-преобразование, сетка параллельных плоскостей, стохастическое сканирование, аналитическая структура признака, гипертрейс-матрица, инвариантность распознавания.

Цитирование: Федотов, Н.Г. Теоретические основы гипертрейс-преобразования: техника сканирования, математический аппарат и экспериментальная проверка / Н.Г. Федотов, А.А. Сёмов, А.В. Моисеев // Компьютерная оптика. - 2018. - Т. 42, № 2. - С. 273-282. -DOI: 10.18287/2412-6179-2018-42-2-273-282.

Введение

В настоящее время в условиях интенсивного развития компьютерных технологий возрастает роль методов обработки данных, представленных в виде изображений. В качестве примера можно привести такие области, как аэрокосмические исследования, машинное зрение, трехмерная компьютерная томография, исследования Земли из космоса, автоматизация процесса компьютерного распознавания в дефектоскопии, дактилоскопии и тому подобные [1 - 4].

Для современного этапа развития теории распознавания образов актуально расширение круга рассматриваемых задач распознавания на трехмерные (далее 3Б) изображения, в то время как ранее внимание исследователей было сосредоточено на решении задач анализа и распознавания двумерных (далее 2Б) изображений. Эффективность машинного зрения при распознавании пространственных изображений значительно уступает возможностям человека, что объясняется не слабой мощностью вычислительных средств, а недостаточно развитыми теоретическими методами и подходами.

В данной статье предлагается подход на основе стохастической геометрии и функционального анализа, который благодаря построению признаков, инва-

риантных к группе движений и масштабированию, позволяет повысить надежность и универсальность распознавания. Сканирование со случайными параметрами улучшает соотношение «надежность - быстродействие» распознавания ЭБ-изображений по сравнению с детерминированным сканированием.

1. Инструмент сканирования

Пусть F - исходная трехмерная модель. Авторы рассматривали полигональные модели, однако метод применим и к другим видам моделей. Определим плоскость В(П, r) = {x I xT- n = r} как касательную к сфере с центром в начале координат и радиусом r, проходящую через заданную точку X на расстоянии r от начала координат с заданными углами ш и ф (рис. 1), где П = [cos ш-sin ш, cos ф] - единичный вектор в R3, ш - угол между осью 0x и проекцией отрезка OX на плоскость 0xy, ф - угол между осью 0z и отрезком OX.

Сканирование ЭБ-изображения будет осуществляться плоскостями. Данный выбор оправдан тем, что пересечение плоскости с любым другим пространственным геометрическим примитивом хорошо известно в высшей математике и имеет строгое аналитическое представление, которое нам пригодится при разработке аналитической структуры признака.

Наличие сетки параллельных плоскостей помогает решить проблему инвариантного описания объекта (дает необходимое условие для конструирования признаков, инвариантных к переносу ЗБ-изображения). Если пространственный объект сканируется сеткой параллельных плоскостей, то перемещение исходного ЗБ-изображения не изменяет форму получаемых сканирующими плоскостями сечений (дискретный шаг сканирования игнорируется). Поэтому получаемые сечения и извлекаемые на их основе признаки не изменят своего значения при переносе ЗБ-изображения на любой вектор в пространстве. Другими словами, вычисляемые признаки не будут зависеть от пространственного положения объекта.

2. Проблема инвариантности распознавания ЗВ-изображения при его произвольной ориентации в пространстве

Для трехмерного случая наличие произвольной пространственной ориентации ЗБ-изображения сильно осложняет создание его инвариантного описания. В отличие от двумерного случая, проблема поворота ЗБ-изображения в трехмерном пространстве связана с невозможностью его поворота вокруг одной оси, независимо от совершённого вращения по другим осям.

Чтобы схема сканирования ЗБ-изображения не была привязана к пространственной ориентации объекта, необходимо и достаточно, чтобы сканирующие элементы, если все их одновременно зафиксировать в пространстве, давали одинаковые сечения трехмерного объекта при любом его угле вращения. Другими словами, необходимо добиться, чтобы все сканирующие сетки параллельных плоскостей под разными углами ю и ф обзора распознаваемого ЗБ-изображения совпадали бы друг с другом при любом его пространственном повороте (дискретный шаг игнорируется).

Стандартный перебор всех углов ю и ф, которыми идентифицируется каждая сканирующая сетка параллельных плоскостей, в топологическом смысле для непрерывного случая дает модель концентрических сфер с центром в начале координат. Каждой сканирующей сетке параллельных плоскостей на единичной сфере сопоставим точку, которая будет являться точкой касания со сферой плоскости, параллельной плоскостям данной сетки (отдельно для каждой пары (ю, ф) углов обзора). Множество точек на сфере образуют сетку, которую будем называть опорной (рис. 2).

Стоит отметить, что пара углов (ю, ф) однозначно определяет узел опорной сетки, соответствующий единственной касательной плоскости к сфере в этой точке, а значит, и единственной сетке сканирующих параллельных плоскостей, что подробно рассмотрено в [5].

Для дискретного случая на обычной карте глобуса вблизи полюса наблюдается более плотное скопление точек, чем у экватора. Поэтому если при повороте полюс совместить с точкой на экваторе, то будут заметны отклонения точек исходной и повернутой сеток. Так как каждая точка опорной сетки на сфере однозначно определяет угол наклона сетки параллельных плоскостей, то изменение угла наклона сетки плоскостей повлияет на форму получаемых сечений. Вследствие этого увеличится ошибка расчёта признака и снизится точность распознавания ЗБ-объекта.

сетки сканирующих параллельных плоскостей

С другой стороны, если при повороте сферы вокруг своего центра опорная сетка перейдет сама в себя, то соответствующие сетки секущих параллельных плоскостей полностью совпадут друг с другом и получаемые сечения будут одинаковыми (не изменят своей формы). Поэтому вычисляемое значение признака не изменится.

Таким образом, необходимо построить опорную сетку, обладающую равномерным распределением точек на сфере для достижения меньшей ошибки при совмещении узлов опорной сетки при ее повороте из-за дискретного шага сканирования. Равномерное распределение точек опорной сетки на сфере обеспечит отсутствие более плотных скоплений узлов опорной сетки на поверхности сферы, определяющих преимущественно сечения под теми или иными углами обзора объекта. В связи с этим все результаты сканирования будут принимать равноправное участие при вычислении значения признака ЗБ-изображения без повышения влияния каких-либо определенных значений сечений, так как частота появления любого среза сечений будет приблизительно одинакова (равномерный обзор трехмерного тела со всех сторон). Другими словами, значение вычисляемого признака не будет зависеть от ориентации ЗБ-изображения в пространстве.

3. Равномерная опорная сетка на сфере

Указанное свойство равномерного распределения точек опорной сетки на сфере является необходимым

условием инвариантности конструируемых признаков к повороту. Математическая формулировка данной проблемы имеет следующий вид.

Рассмотрим сферу, заданную параметрически: х(ш, ф)=,К-сс« ш^ш ф, ф)=.К-8ш ш^т ф, 2(ш, ф)=^С08 ф. Необходимо определить аналитически функцию /(ш, ф) плотности совместного распределения параметров ш и ф, соответствующую равномерному распределению точек на поверхности сферы.

Рассмотрим небольшой участок поверхности сферы, ограниченный приращениями ёф и ёш (рис. 3).

Rsinafá(ü

Рис. 3. Участок на поверхности сферы и значение его сторон

В случае, когда точки имеют равномерное распределение на поверхности сферы, вероятность попадания произвольной точки А на элемент поверхности dS с одной стороны равна: P(Ae dS) = dS / S.

При постоянном значении ф изменение угла doi описывает дугу R-sin ф-dffl. Поэтому площадь малого элемента поверхности сферы равна dS=R2-sin ф^ш^ф. Таким образом, вероятность попадания произвольной точки А на элемент поверхности dS будет равна:

P(A е dS) - ^ - sin Ф- dffl-dф _ R - sin ф- dra-dф _

IX r2 - dffl-dф 4-n-r

_ sinф-dffl-dф 4n .

С другой стороны, вероятность попадания точки А на данный элемент поверхности равна: P(A с dS) = f (ш, ф)-dffl-dф. Следовательно, совместная плотность распределения вероятности ш и ф равна:

sinф-dffl-d^ ^^ ^^ ^ ,, _, sinф

—ь--ь = f (ш,ф)-dffl -dф ^ f (ш,ф) = —-.

4п 4п

Генерируя значения параметров ш и ф с использованием функции плотности распределения f (ш, ф), получаем равномерное распределение точек на поверхности сферы. Различные алгоритмы построения равномерного распределения конечного числа точек рассмотрены в [6, 7].

Данное условие является необходимым условием инвариантности конструируемых признаков к повороту 2Б-изображения в плоскости сечения и 3D-изображения в целом.

4. Описание техники сканирования

Сканирование 3D-изображения производится сеткой параллельных плоскостей с расстоянием Аг между плоскостями и заданными углами ш и ф. Взаимное положение 3D-изображения F и каждой сканирующей плоскости _В(п(ш, ф), г) характеризуется числом G, которое определяется по некоторому правилу

ИурегТ: G = ИирегТ(¥ПВ(п(ш, ф), г)). В качестве указанного правила можно использовать вычисление площади сечения, количество пересечений плоскости с исходным объектом, свойства окрестности полученного сечения и тому подобное. Другими словами, функционал ИурегТ характеризует свойство признака сечения.

Затем сканирование производится сеткой параллельных плоскостей для нового значения угла ш+Дш и ф+Дф , получившего дискретные приращения Дш и Дф соответственно, с тем же шагом Дг между сканирующими плоскостями. К сечениям новой сетки из плоскостей В (п(ш+Лш, ф+Лф), г) применяется такое же ранее выбранное правило ИурегТ.

Сканирование повторяется для каждого нового угла ш+Дш и ф+Дф до завершения оборота в 2п и п радиан соответственно. Важно отметить, что углы изменяются не произвольным образом, а согласно построению опорной сетки на сфере, обеспечивающей равномерную плотность плоскостей в пространстве (для выполнения необходимого условия инвариантности конструируемых признаков к повороту).

Результат вычислений функционала ИурегТ зависит от трех параметров плоскости (г,ш,ф). Поэтому, если каждому 2Б-изображению, полученному при сечении исходной трёхмерной модели сканирующей плоскостью, сопоставить некоторый информативный признак П(¥5ес() по правилу ИурегТ, то при численном анализе результат гипертрейс-преобразования удобно представить в виде трехмерной гипертрейс-матрицы 3ТМ, у которой ось 0ф направлена вертикально, ось 0ш - горизонтально, ось 0г - вглубь.

Каждое 2Б-изображение, получившееся в сечении исходной 3Б-модели сеткой параллельных плоскостей под разными углами обзора, сканируется, чтобы извлечь какие-нибудь значимые признаки (например, периметр контура фигуры сечения). Для нахождения признака двумерного изображения сечения используется трейс-преобразование, которое будет описано ниже.

Сканирование получаемых в сечении изображений ¥цесг осуществляется решеткой параллельных прямых /(0, р) с расстоянием Др между линиями, где р, 9 - полярные координаты прямой в плоскости сечения. Взаимное положение 2Б-изображения ¥хеа и каждой сканирующей линии /(0, р) характеризуется числом g, вычисляемым по некоторому правилу Т: g = Т(¥жс( П /(0, р)). В качестве указанного правила можно использовать вычисление длины части прямой, лежащей внутри изображения, свойства окрестности точки пересечения прямой с изображением и тому подобное.

Затем сканирование производится для нового значения угла 9+Д9, получившего дискретное приращение Д9, сеткой параллельных прямых в той же плоскости сечения ¥хесг и с тем же шагом Др. К пересечению новой прямой /(9+Д9,р) и сечения ¥хесг применяется такое же ранее выбранное правило Т. Сканирование повторяется для каждого нового угла 9+Д9 до завершения оборота в 2п радиан.

Результат вычислений функционала Т зависит от двух параметров прямой 9 и р. При численном анализе результат трейс-преобразования удобно представить в виде двумерной трейс-матрицы ТМ, у которой ось 09 направлена горизонтально, а ось 0р - вертикально. Подробное описание свойств трейс-преобразования можно найти в [8].

5. Режимы сканирования и стохастическая реализация

Данный метод поддерживает несколько различных режимов сканирования ЗБ-изображений, которые имеют свои преимущества и недостатки в различных практических ситуациях:

1) Детерминированный режим сканирования.

В этом случае опорная сетка на сфере имеет детерминированную структуру, и расстояние между сканирующими плоскостями одинаково для любой пары (ю, ф) углов обзора. Аналогичное свойство наблюдается в плоскости сечения для опорной сетки на окружности и для расстояния между сканирующими прямыми.

2) Стохастический режим сканирования.

В данном случае опорная сетка на сфере имеет стохастическую структуру, и расстояние между сканирующими плоскостями случайно, но обладает равномерной плотностью в пространстве в пределах размеров ЗБ-объекта отдельно для каждой пары (ю, ф) углов обзора. Аналогичное свойство наблюдается в плоскости сечения для опорной сетки на окружности и для расстояния между сканирующими прямыми.

Кроме того, заранее предопределённый алгоритм построения равномерной сетки на сфере по скорости выполнения будет заметно уступать генерации случайной сетки с равномерным распределением точек на ее поверхности.

Стоит отметить, что стохастическое сканирование со случайными параметрами улучшает соотношение «надежность - быстродействие» распознавания 2Б-изображений по сравнению с детерминированным сканированием с фиксированными параметрами, что показано в [9]. Аналогичное свойство справедливо также и при анализе и распознавании ЗБ-изображений.

При стохастическом сканировании строки и столбцы гипертрейс-матрицы будут обозначать не номер, а диапазон варьирования каждой из переменных ю, ф и г. Поэтому перед формированием гипер-трейс-матрицы строится трехмерное вероятностное распределение переменных, аналогично стандартным методам стохастической геометрии.

Так, при проектировании распознающих систем используются дискретные представления переменных ю, ф и г. Соответственно, параметры сканирующих плоскостей образуют три множества:

М1 = {ш^ ш^ шш} , М2 = {ф^ ф^ .„, ф„},

Мз ={ гl, ^ г1} .

Детерминированное сканирование позволяет однозначно определить каждый элемент матриц 3ТМ. Так, тройке (ю,-, ф/, Гк) соответствует элемент матрицы с номе-

ром (г,/, к) и значением ИирегТ(^ПВ(п(ш, ф), г)). При применении случайного сканирования на множествах М1, М2, МЗ задаются вероятностные распределения:

М1 ={ Р (ш1), Р (ш 2 ),Р (ш „)},

М 2 ={ 9 (ф1 ), 9 (ф 2 ), 9 (фп)},

М3 ={ 5(Г1 ),5(Г2), 5(Г1 )} ,

X Р (ш, )= 1, 19 (Ф / )= 1, X 5 (Гк ) = 1.

г / к

При стохастическом способе генерирования равномерного распределения точек на сфере используются генераторы псевдослучайных чисел, которые позволяют равномерные сетки на сфере для любого количества точек. Авторы решили модифицировать алгоритм 8аГГ [6] для построения детерминированной спирали. Каждая точка данной спирали получила случайный равномерный прирост по каждой координате на величину не более 1 . После чего расстояние от точки до начала координат приводится к единичному масштабу.

Выбирая параметры сканирования случайным образом на основе заданных распределений, получаем трехмерное распределение случайных величин в виде матрицы 3ТМ, где О/ = ИирегТ(^ПВ(п(ш,', Ф/), Гк)) с вероятностью р(ад-)-9(ф/)-5(гк) и Оцк = 0 с вероятностью 1-р(шг)-9(ф/)-5(гк). Аналогичное свойство имеет место и для трейс-матриц в плоскости сечения, которые являются двумерным распределением случайных величин 9 и р.

Стохастическое сканирование ЗБ-изображений можно реализовать в следующем виде: случайная величина г имеет непрерывное равномерное распределение на отрезке [а, Ь] с функцией плотности

1 г е [а,Ь]

/ (г ) =

Ь - а

0, г £ [а, Ь]

случайные величины ю, ф имеют совместное равномерное распределение на поверхности сферы с функцией плотности

! (ш, ф) =

зт ф 4п .

6. Математический инструмент для анализа ЗВ-изображения

Трехмерная гипертрейс-матрица 3ТМ - математический инструмент для анализа ЗБ-изображения. Гипертрейс-матрица ЗТМ - ЗБ-трейс-образ исходного пространственного изображения, который содержит информацию о первоначальном объекте.

Каждая глубинная строка матрицы содержит элементы-признаки, которые вычисляются по 2Б-изображениям, полученным в результате сечений исходного ЗБ-объекта сканирующими плоскостями при обходе всех значений переменной расстояния г

с фиксированными значениями углов ю и ф. Соответственно, каждый вертикальный столбец матрицы содержит элементы-признаки, которые вычисляются по 2Б-изображениям, полученным в результате сечений исходного ЗБ-объекта сканирующими плоскостями при обходе всех углов ф (от 0 до п радиан) при одинаковых значениях угла ю и расстояния г. И, наконец, каждая глубинная строка матрицы содержит элементы-признаки, которые вычисляются по 2Б-изображениям, полученным в результате сечений исходного ЗБ-объекта сканирующими плоскостями для всех значений расстояний г при фиксированных значениях углов ю и ф.

Если плоскость В не пересекает ЗБ-изображение, то есть ^ П В(п(ш, ф), г) = ф, то значение гипертрейс-функционала полагают равным нулю:

ИирегТ(^ П В(п(ш, ф), г)) = 0.

Графическое представление гипертрейс-матрицы 3ТМ называется гипертрейс-трансформантой, где полученное в результате сканирования множество чисел О образует точки (юг, ф/, гк) в системе координат с осями 0ю, 0ф и 0г. Так как результат вычислений функционала ИирегТ(^ПВ(п(ш/, ф,), гк)) зависит от трёх параметров сканирующей плоскости г, ю и ф, имеющих дискретный шаг сканирования, то реальная гипер-трейс-трансформанта имеет дискретную структуру.

Двумерная трейс-матрица ТМ - математический инструмент для анализа 2Б-изображения. Трейс-матрица ТМ - 2Б-трейс-образ плоского изображения 2Б-фигуры сечения, полученного при пересечении плоскости В(п(ш, ф), г) исходного ЗБ-объекта

Каждый вертикальный столбец матрицы ТМ содержит значения, вычисляемые по всем прямым сканирующей сетки при одинаковом значении угла 9 и различными значениями р внутри конкретного 2Б-изображения сечения. Соответственно, каждая горизонтальная строка матрицы ТМ содержит значения, вычисляемые для всех прямых I, имеющих одинаковое расстояние р до начала координат и различных значениях угла 9 внутри конкретного 2Б-изображения сечения.

Если прямая I не пересекает изображение: FSec/Пl(Q, р) = ф, то значение трейс-функционала полагают равным нулю Т(^5ес(П1(0, р)) = 0.

Графическое представление трейс-матрицы ТМ называется трейс-трансформантой, где полученное в результате сканирования множество чисел g образуют точки (9;,р/) в системе координат с осями 09 и 0р.

Таким образом, паре (9г,р/) соответствует элемент матрицы ТМ с номером (г/) и значением Т(^сЩег, р/)).

Данный математический инструмент будет особо полезным в области медицинской томографии при анализе и извлечении метрических характеристик пространственных объектов (внутреннего органа человека). С помощью гипертрейс-матрицы возможен не только анализ движущихся ЗБ-объектов, но и извлечение параметров этих движений. Подробнее об этом можно найти в [5].

7. Особенности формирования и построения гипертрейс-матриц

Если результаты сканирования ЗБ-изображения (признаки сечений) заносить в элементы матрицы от точки (0, 0, 1) оси 0г в направлении по часовой стрелки от оси 0х, то при формировании гипертрейс-матрицы 3ТМ возникают определенные трудности сохранения целостности ее структуры - нарушается порядок следования строк и столбцов друг за другом в матрице, так как равномерная сетка на сфере неизоморфна равномерной сетке на плоскости.

При повороте ЗБ-изображения глубинные строки сохраняют порядок следования элементов, так как при повороте не изменяется порядок следования сечений (дискретная форма пространственного объекта). Однако при повороте ЗБ-изображения порядок следования элементов в горизонтальных строках (ось 0ю) и вертикальных столбцах (ось 0ф) матрицы 3ТМ в общем случае без наложения дополнительных условий не сохраняется из-за произвольной пространственной ориентации ЗБ-изображения.

Так, при обработке функционалами трехмерная матрица сворачивается в число в строго заданных направлениях (сначала глубинные, далее вертикальные, а затем горизонтальные строки). Поэтому из-за произвольной неизвестной ориентации тела в пространстве возможен случайный поворот матрицы относительно оси 0г в пространстве 0юфг. Произвольное нарушение порядка следования строк матрицы друг за другом в данных фиксированных направлениям приведёт к изменению значения вычисляемого признака, и, как следствие, инвариантность распознавания ЗБ-изображения будет нарушена.

В связи с этим правила нумерации узлов опорной сетки, по которым формируется трехмерная гипер-трейс-матрица и определяется порядок следования ее элементов, должны определятся не относительно координатных осей, а относительно произвольно ориентированного пространственного объекта.

Для определения направления нумерации узлов опорной сетки достаточно идентифицировать некоторые опорные ключевые точки - узлы опорной сетки, которые однозначно определяются вне зависимости от пространственной ориентации ЗБ-объекта. Данные опорные точки определяют начало отсчёта (первую глубинную строку), от которого начинается заполняться гипертрейс-матрица. Например, построение гипертрейс-матрицы при нумерации узлов опорной сетки от первой ключевой точки по часовой стрелке в направлении второй ключевой точки для заполнения элементов матрицы.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Ключевые точки характеризуют уникальные свойства пространственного объекта, на основании которых могут быть построены гипертриплетные признаки, инвариантные к повороту ЗБ-изображения. Так, в качестве ключевой точки, например, можно взять узел на опорной сетке, который соответствует сетке секущих плоскостей, содержащей максимальное по площади сечение исходного ЗБ-объекта.

Стоит отметить, что при повороте объекта секущие плоскости (например, сечения, перпендикулярные главной оси объекта) будут соответствовать другим точкам опорной сетки, чем точкам сетки до его поворота. Поэтому необходимо задать правило, определяющее соотношение каждой точки опорной сетки смещенного объекта с соответствующей точкой опорной сетки исходного объекта. Другими словами, необходимо создать правило инвариантной нумерации узлов опорной сетки, которое позволяет получать однородную структуру матрицы, при обработке функционалами строк и столбов которой получаются одинаковые значения признака вне зависимости от пространственной ориентации 3Б-объекта (из-за дискретного шага сканирования будет присутствовать ограниченный сверху уровень колебания в значениях вычисляемого признака).

Порядок следования горизонтальных строк (ось 0ш) и вертикальных столбцов (ось 0ф) при произвольной пространственной ориентации трехмерного тела имеет некоторые особенности в зависимости от метода построения гипертрейс-матрицы 3ТМ. Особенности формирования данных матриц и их разновидностей можно найти в [5].

8. Конструирование признаков ЗВ-изображения

После заполнения трёхмерной гипертрейс-матрицы обрабатываются ее глубинные строки с помощью функционала Hyper P, который можно задать, например, как Huper P = ÎG(œ, ф, r)dr. В результате исходная трёхмерная гипертрейс-матрица 3ТМ становится двумерной матрицей 2ТМ. Далее применяется постолбцовая обработка матрицы 2TM посредством функционала Hyper Q, который можно задать, например, как

HyperQ = maxG(о>,ф).

ф

В результате получается горизонтальная строка 1TM - вектор значений, непрерывным аналогом которого в общем случае является 2п-периодическая кривая. К полученному набору чисел применяют функционал Hyper 0, что приводит к появлению некоторого числа - признака изображения Res(F). Этот функционал можно задать, например, амплитудой второй гармоники при разложении вектора в ряд Фурье.

Таким образом, гипертриплетный признак 3D-изображения F обладает структурой в виде композиции четырёх функционалов, каждый из которых, кроме функционала Hyper T, при последовательном применении сокращает размерность матрицы 3TM на единицу:

Res ( F ) = Hyper 0 о Hyper Q о

о Hyper P о Hyper T( F^ г ).

После заполнения двумерной трейс-матрицы c помощью диаметрального функционала T обрабатываются столбцы матрицы TM. Его можно задать, например, как

Jg(9, P)dp

T = -

maxg(9, p)

В результате исходная двумерная матрица TM становится одномерной матрицей - вектором чисел, непрерывным аналогом которого будет 2п-периодическая кривая. Затем к полученному набору чисел применяют функционал 0, который можно задать как

0 = min g (0).

В результате получается число n(Fseci) - признак 2Б-изображения сечения Fsect.

Таким образом, триплетный признак 2D-изображения FSect обладает структурой в виде композиции трех функционалов, каждый из которых, кроме функционала T, при последовательном применении сокращает размерность матрицы TM на единицу [7]:

П( Fsea ) = Hyper Т( Fsea ) = 0 о P о т( Fsea П l (0, p)).

Объединяя полученные формулы для Res(F) и n(FSect), окончательно получаем следующую аналитическую структуру признака 3Б-изображения в виде композиции множества функционалов:

Res ( F ) = Hyper 0 о Hyper Q о Hyper P о

Hyper T(0 о P о t( Fsect П l (0, p))).

Благодаря композиционной структуре функционалов, входящих в структуру и возможно получение огромного числа признаков. Причем возможно конструирование признаков, описывающих те или иные геометрические характеристики ЭБ-объекта, что облегчает задачу анализа свойств ЭБ-изображений и построения информативных признаков [5].

Стоит отметить, что расположение системы координат в плоскости сечения и ее ориентация относительно фигуры сечения совершенно несущественны, так как трейс-преобразование полностью инвариантно к группе движений и масштабированию 2Б-изображения [6].

9. Планирование эксперимента

В отличие от большинства известных методов, рассмотренных ранее в работе, предлагаемый метод позволяет в режиме автоматической генерации формировать большое число признаков, которые будут являться как инвариантными, так и сенситивными к группе движений и масштабированию 3Б-изображений [5]. Данные гипертриплетные признаки имеют аналитическую структуру, которая позволяет строить признаки с заданными свойствами, описывающие те или иные метрические характеристики пространственного объекта. В силу того, что реальное сканирование происходит с дискретным шагом, то возникает определённая погрешность вычисления данных признаков. Поэтому целесообразной становится задача оценки погрешности вычисления признаков при различных параметрах движения и масштабирования ЭБ-изображений.

Так как функционалы, входящие в состав признака, имеют композиционную структуру, то по мере

уменьшения шага число сканирований 3Б-изобра-жения растёт комбинаторно, и время вычисления признака заметно возрастает. Поэтому целесообразно исследовать сканирование 3Б-изображения на оптимальность соотношения «надежность - быстродействие» распознающей системы при использовании различных параметров сканирования (количество узлов опорной сетки на сфере, количество узлов опорной сетки на окружности и другие).

Все рассматриваемые в данной статье ЗБ-изображения были взяты из известной базы данных принстонского университета The Princeton Shape Benchmark [10]. Каждый пространственный объект данной базы имеет полигональную структуру поверхности. Данная база включает наборы ЗБ-моделей различных классов: от предметов неживой природы (двери, машины, самолёты и другие) до объектов живой природы (муравьи, кошки, люди, птицы и другие). Количество полигонов в моделях объектов варьируется в диапазоне от 1000 до 300 000 штук.

Реализация и экспериментальная проверка предложенного метода ЗБ-трейс-преобразования производилась с использованием инженерного пакета MathCAD 15 M030. Визуализация трехмерных объектов осуществлялась с помощью средств пакета MeshLab 1.3.

Прежде, чем приступить к анализу параметров стохастического сканирования и определения их оптимальной структуры, необходимо сделать несколько замечаний.

Во-первых, более общим параметром, влияющим на точность вычисления признака, является параметр Nq - количество узлов опорной сетки на сфере.

Во-вторых, для детерминированного сканирования используется 4 параметра; A3 - расстояние между параллельными плоскостями, N9 - количество различных углов сканирования плоскостями 3Б-изображения (количество узлов равномерной опорной сетки на сфере), A2 - расстояние между параллельными прямыми в плоскости сечения, N9 - количество различных углов сканирования прямыми 2Б-изображения сечения (количество узлов равномерной опорной сетки на окружности).

Для стохастического сканирования показатель A3 показывает усреднённое расстояние между параллельными плоскостями: A3 = dist/cross, где dist -расстояние между двумя граничными касательными плоскостями в сетке плоскостей под данным углом обзора, cross - количество пересечений пространственного объекта сканирующей плоскостью. Аналогичное замечание будет и для показателя A2. Параметры N9 и N9 для стохастического сканирования характеризуют равномерное случайное распределение точек опорной сетки на сфере и окружности соответственно.

В-третьих, полноценный анализ всех параметров сканирования затруднён, так как точность вычисления признака меняется при совместном изменении параметров сканирования, причём как в прямом, так

и обратном направлениях прироста значений данных параметров.

Чтобы при анализе конкретной переменной (например, Ar) нивелировать эффект влияния других параметров сканирования изображения, все остальные параметры сканирования (Иф, Ар, N9) должны иметь значения, при которых точность вычисления признака является максимально высокой. Тем самым, точность сканирования 3Б-изображения будет являться чувствительной к изменению только одного параметра (Ar) и не зависеть от уровня значений других параметров.

В связи с этим анализ времени вычисления признака не даст информативной картины, так как вычисление признака будет осуществляться достаточно долго. В этом случае необходимо руководствоваться общим принципом при отборе требуемого уровня точности вычисления признака: чем крупнее шаг сканирований и меньше число узлов на сетке, тем меньше времени требуется на его вычисление.

В-четвертых, для стохастического сканирования эксперимент повторялся сто раз, а затем вычислялись усреднённые характеристики применяемых параметров.

10. Экспериментальная часть: определение оптимальных параметров сканирования

В качестве анализируемого пространственного объекта была взята ЗБ-модель храмового комплекса с кодовым номером m405 в указанной выше базе данных [10]. Вычисляемый признак Res данного объекта имеет следующую структуру:

Res = Hyper 0 о Hyper Q о Hyper Р о о Hyper Т(0 о Р о т),

где

т = Xf(0,Р,t), р =

max

р

A g (0, Р)

Др

0 = ming(0), HyperТ = П(Fsect) = G(ф,г),

Hyper Р =

Row3D +1 - 2 • Arg max (G (œ, ф, г))

Hyper Q = max G (œ, ф), Hyper 0 = max G (œ),

ф œ

где Row3D - количество ненулевых элементов в глубинных строках гипертрейс-матрицы 3TM.

Для оценки уровня колебания значений вычисляемого признака использовался коэффициент колебания его средней относительной погрешности, который рассчитывается по формуле:

£ =

X

j=1

Res j - X |ReS;|

XI Res, I

где Res,- - значение признака в г-м эксперименте, n -количество экспериментов.

Зависимость погрешности вычислений признака Res от параметра Ar демонстрирует рис. 4.

=1

•^•оооооооооооооооо (=>с>о<г><г><ъос>осьсъ-ч-чСч1Сч1сг1гг1 о" о" о" о" о" о" о" о" о" о" о" о" о" о" о" о" о" Рис. 4. Зависимость погрешности вычисления признака от параметра Аг

Из графика 6 видно, что при Аг < 0,06 точность вычисления признака стабильна. Так как шаг Аг и время работы распознающего алгоритма обратно пропорциональны, то оптимальное значение Аг = 0,06, что составляет менее 10 % от параметров размера исходного ЭБ-изображения.

Зависимость погрешности вычислений признака от параметра сканирования ^ф показана на рис. 5.

10 12 16 20 24 28 32 40 45 50 65 70 75 80 85 92

Рис. 5. Зависимость погрешности вычисления признака от параметра Nty

Как видно из представленного выше графика, достаточно уже 64 узла на опорной сетке на сфере, чтобы погрешность вычисления признака s была низкой (менее 1 %).

Зависимость погрешности вычислений признака Res от параметра сканирования Ар демонстрирует рис. 6. е,%

35 30 25 20 15 10 5 О

~.х->00000000000000

ООООООООООО-ч-чГ^г^гт)

о" о" о" о" о" о" о" о" о" о" о" о" о" о" о" о"

Рис. 6. Зависимость погрешности вычисления признака от параметра Ар

Согласно графику 6, приемлемым значением с точки зрения соотношения качества инвариантности признака и времени работы алгоритма является значение Ар = 0,06 (согласно аналогичным рассуждениям, приведённым для Аг).

Зависимость погрешности вычислений признака Res от параметра сканирования N9 демонстрирует рис. 7.

4 6 8 10 11 13 15 18 21 24 28 32 36

Рис. 7. Зависимость погрешности вычисления признака от параметра N9

Так как шаг N9 и время работы распознающего алгоритма прямо пропорциональны, то согласно представленному выше графику оптимальное значение N9 достигается при значении 18, то есть N9 = 18.

Стоит отметить, что для разных видов признаков данные графики будут отличаться друг от друга, но основные направления роста погрешности вычисления признаков сохранятся. Цель данного эксперимента состояла в наглядной демонстрации основных свойств зависимости погрешности вычисления признака от различных параметров сканирования и проверке адекватности разработанного математического аппарата.

Благодарности

Работа выполнена при поддержке гранта РФФИ (проект №15-07-04484).

Литература

1. Kiy, K.I. Segmentation and detection of contrast objects and their application in robot navigation / K.I. Kiy // Pattern Recognition and Image Analysis. - 2015. - Vol. 25, Issue 2. - P. 338-346. - DOI: 10.1134/S1054661815020145.

2. Wang, C. VFM: visual feedback model for robust object recognition / C. Wang, K.-Q. Huang // Journal of Computer Science and Technology. - 2015. - Vol. 30, Issue 2. -P. 325-339. - DOI: 10.1007/s11390-015-1526-1.

3. Гайдель А.В. Исследование текстурных признаков для диагностики заболеваний костной ткани по рентгеновским изображениям / А.В. Гайдель, С.С. Первушкин // Компьютерная оптика. - 2013. - Т. 37, № 1. - С. 113-119.

4. Гайдель, А.В. Возможности текстурного анализа компьютерных томограмм в диагностике хронической об-структивной болезни / А.В. Гайдель, П.М. Зельтер, А.В. Капишников, А.Г. Храмов // Компьютерная оптика. - 2014. - Т. 38, № 4. - С. 843-850.

5. Федотов, Н.Г. 3D-трейс-преобразование: режимы сканирования, особенности стохастической реализации, способы ускорения вычислений / Н.Г. Федотов, А.А. Сёмов, А.В. Моисеев // Известия высших учебных заведений. Поволжский регион. Технические науки. -2014. - № 3. - С. 41-53.

6. Rakhmanov, E.A. Minimal discrete energy on the sphere / E.A. Rakhmanov, E.B. Saff, Y.M. Zhou // Mathematical Research Letters. - 1994. - Vol. 1. - No 6. - P. 647-662. -DOI: 10.4310/MRL.1994.v1.n6.a3.

7. Lovisolo, L. Uniform distribution of points on a hyper-sphere with applications to vector bit-plane encoding / L. Lovisolo, L.E.A.B. da Silva // IEE Proceedings - Vision, Image and Signal Processing. - 2001. - Vol. 148, Issue 3. -P. 187-193 - DOI: 10.1049/ip-vis:20010361.

8. Федотов, Н.Г. Теория признаков распознавания образов на основе стохастической геометрии и функционального анализа / Н.Г. Федотов. - М.: Физматлит, 2010. - 304 с. - ISBN: 978-5-9221-0996-3.

9. Fedotov, N.G. Random scanning for speedier systems of pattern recognition based on stochastic geometry methods /

N.G. Fedotov, L.A. Shul'ga, A.V. Moiseev // Pattern Recognition and Image Analysis. - 2005. - Vol. 15, Issue 2. - P. 387-388.

10. Princeton Shape Benchmark [Electronical Resource]. -URL: http://shape.cs.princeton.edu/benchmark/ (date request 10.10.2017).

Сведения об авторах

Федотов Николай Гаврилович, 1945 года рождения. В 1967 году окончил с отличием Пензенский политехнический институт (ныне Пензенский государственный университет) по специальности «Вычислительная техника». По окончании аспирантуры при том же институте в 1973 году в ученом совете Рязанского радиотехнического института защитил диссертацию на соискание ученой степени кандидата технических наук. В 1990 году в Московском институте электроники и математики (МИЭМ) защитил диссертацию на соискание ученой степени доктора технических наук. Имеет ученые звания доцента (1977) и профессора (1992). В Пензенском государственном университете работает с 1971 года. С 1996 года заведует кафедрой экономической кибернетики. Область научных интересов: распознавание образов, стохастическая геометрия, признаки распознавания, анализ изображений, функциональный анализ, искусственный интеллект, экономическая кибернетика. E-mail: fedotov @pnzgu. ru .

Сёмов Алексей Александрович, 1990 года рождения, в 2012 году окончил Пензенский государственный университет по специальности 080116 «Математические методы в экономике». В 2015 году защитил диссертацию на соискание ученой степени кандидата технических наук. Работает аналитиком в ООО «КомХэлф». Область научных интересов: математическое моделирование, математическая статистика, теория вероятностей, обработка изображений, распознавание образов. E-mail: mathematik [email protected] .

Моисеев Александр Владимирович, 1972 года рождения, в 1994 году окончил Пензенский государственный педагогический университет им. В.Г. Белинского по специальности «Математика». В 1997 году защитил диссертацию на соискание ученой степени кандидата физико-математических наук. Имеет ученое звание доцент (2001). Работает доцентом кафедры экономической кибернетики Пензенского государственного университета. Область научных интересов: математический анализ, краевые задачи, теория вероятностей, математическая статистика, математическое моделирование экономических процессов, распознавание образов. E-mail: [email protected] .

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ГРНТИ: 28.23.15

Поступила в редакцию 9 августа 2017 г. Окончательный вариант - 16 октября 2017 г.

THEORETICAL FOUNDATIONS OF HYPERTRACE-TRANSFORM: SCANNING TECHNIQUES, MATHEMATICAL APPARATUS AND EXPERIMENTAL VERIFICATION

N.G. Fedotov1, A.A. Syemov2, A.V. Moiseev1

1 Penza State University, Penza, Russia,

2 LLC «KomHelf», Penza, Russia

Abstract

We consistently describe the theoretical basis of a new geometric method of analysis and recognition of three-dimensional (3D) images. The description of a scanning technique for forming a hypertrace transform and its mathematical model are given. This method, unlike the existing ones, enables 3D images to be analyzed directly from their 3D shape, without first simplifying them or constructing plane projections. We substantiate the selection of a particular scanning tool and the need to construct a reference spherical grid to address the problem of the rotational invariance of the 3D image recognition. A mathematical apparatus of the stochastic realization of the scanning technique based on stochastic geometry and functional analysis is developed. We introduce a new mathematical tool for 3D image analysis - a hypertrex matrix that allows spatial objects of complex shape and structure to be recognized by constructing a single mathematical model of the 3D image. We describe a new type of 3D image features that have an analytic structure --hypertryplet features, whose analytical structure makes possible an automatic generation of a large number of features with predetermined properties. Results of the experimental verification are presented, demonstrating the accurate calculation of features for 3D image recognition and proving the adequacy of the developed mathematical apparatus.

Keywords: recognition of 3D images, geometric hypertrace-transform, grid of parallel planes, stochastic scanning, analytical structure of the feature, hypertrace matrix, and invariant recognition.

Citation: Fedotov NG, Syemov AA, Moiseev AV. Theoretical foundations of hypertrace-transform: scanning techniques, mathematical apparatus and experimental verification. Computer Optics 2018; 42(2): 273-282. DOI: 10.18287/2412-6179-2018-42-2-273-282.

Acknowledgements: The work was partially funded by the Russian Foundation for Basic Research under grant No. 15-07-04484.

References

[1] Kiy KI. Segmentation and detection of contrast objects and their application in robot navigation. Pattern Recognition and Image Analysis 2015; 25(2): 338-346. DOI: 10.1134/S1054661815020145.

[2] Wang C, Huang K-Q. VFM: visual feedback model for robust object recognition. Journal of Computer Science and Technology 2015; 30(2): 325-339. DOI: 10.1007/s11390-015-1526-1.

[3] Gaidel AV, Pervushkin SS. Research of the textural features for the bony tissue diseases diagnostics using the roentgenograms [In Russian]. Computer Optics 2013; 37(1): 113-119.

[4] Gaidel AV, Zelter PM, Kapishnikov AV, Khramov AG. Computed tomography texture analysis capabilities in diagnosing a chronic obstructive pulmonary disease [In Russian]. Computer Optics 2014; 38(4): 843-850.

[5] Fedotov NG, Semov AA, Moiseev AV. 3D-trace-conversion: scanning modes, stochastic implementation features, methods

of computational speedup [In Russian]. University proceedings. Volga region. Technical sciences 2014; 3: 41-53.

[6] Rakhmanov EA, Saff EB, Zhou YM. Minimal discrete energy on the sphere. Math Res Lett 1994; 1(6): 647-662. DOI: 10.4310/MRL.1994.v1.n6.a3.

[7] Lovisolo L, da Silva LEAB. Uniform distribution of points on a hyper-sphere with applications to vector bit-plane encoding. IEE Proc - Vis Image Signal Process 2001; 148(3): 187-193. DOI: 10.1049/ip-vis:20010361.

[8] Fedotov NG. The theory of pattern recognition features based on stochastic geometry and functional analysis [In Russian]. Moscow: "Fizmatlit" Publisher; 2010. ISBN: 978-5-9221-0996-3.

[9] Fedotov NG, Shul'ga LA, Moiseev AV. Random scanning for speedier systems of pattern recognition based on stochastic geometry methods. Pattern Recognition and Image Analysis 2005; 15(2): 387-388.

[10] Princeton Shape Benchmark. Source: (http://shape.cs.princeton.edu/benchmark/).

Author's information

Nikolay Gavrilovich Fedotov (b. 1945) graduated with honors from Penza Polytechnic Institute (now the Penza State University) in 1967 on a specialty "Computer Science". After graduate school at the same institute in 1973, the Scientific Council of the Ryazan Radio Engineering Institute defended his thesis for the degree of candidate of technical sciences. In 1990, at the Moscow Institute of Electronics and Mathematics (MIEM) defended his thesis for the degree of Doctor of Technical Sciences. He has the rank of assistant professor (1977) and professor (1992). Since 1996, Head of Economic Cybernetics department. His research interests include pattern recognition, stochastic geometry, signs of recognition, image analysis, functional analysis, artificial intelligence, economic cybernetics. E-mail: [email protected] .

Aleksey Alexandrovich Syemov (b. 1990) graduated from the Penza State University in 2012, majoring in 080116 "Mathematical Methods in Economics". In 2015 he defended his thesis for the degree of candidate of technical sciences. He worked as an analyst in the company "KomHelf". Research interests: mathematical modeling, mathematical statistics, probability theory, image processing, pattern recognition. E-mail: mathematik [email protected] .

Alexander Vladimirovich Moiseev (b. 1972) graduated from Penza State Pedagogical Institute in 1994, specialty "Mathematics". In 1997 he defended his thesis for the degree of candidate of physical and mathematical sciences. He holds the title of Associate Professor (2001). It works assistant professor of "Economic Cybernetics" Penza State University. His research interests include mathematical analysis, boundary value problems, probability theory, mathematical statistics, mathematical modeling of economic processes, pattern recognition. E-mail: [email protected] .

Received August 9, 2017. The final version - October 16, 2017.

i Надоели баннеры? Вы всегда можете отключить рекламу.