Повышение надежности распознавания 3D-объектов на основе методов стохастической геометрии

Сёмов А.А.

УДК 004.93 Сёмов А.А.

ФГБОУ ВПО «Пензенский Государственный Университет», Пенза, Россия

ПОВЫШЕНИЕ НАДЕЖНОСТИ РАСПОЗНАВАНИЯ 3D ОБЪЕКТОВ НА ОСНОВЕ МЕТОДОВ СТОХАСТИЧЕСКОЙ ГЕОМЕТРИИ

Введение

Успехи в области вычислительной техники и компьютерных технологий за последние десятилетия обширны и удивительны. Особенно это касается достижений в области роста быстродействия компьютеров, сетевых технологий, мультимедиа, увеличение возможностей программного и аппаратного обеспечения машины. Так, по разрешающей способности цифровые фото- и видеокамеры, сканеры вполне приближаются к зрению человека и животных.

Однако, достижения в области компьютерного зрения и слуха являются намного менее скромными [1]. Возможности интеллектуального анализа изображений с помощью компьютеров пока находятся на не высоком уровне, несмотря на возрастающую потребность в данных методах. Самостоятельное принятие решение и искусственный интеллект роботов будет невозможен или крайне неэффективен при слабом уровне машинного зрения [2] . Так, транспортные роботы при плохом качестве машинного зрения не смогут обеспечить надежную ориентацию и движение в пространстве.

Одной из главных задач развития машинного зрения является не только производство высокоточного оборудования, но и более качественные методы обработки информации, получаемой в виде изображения, которые даже в условиях шума и искажений способны давать верное решение [3].

Таким образом, актуальность разработки нового подхода для анализа и распознавания 3D изображений связана, прежде всего, с необходимостью разработки метода, который позволял бы конструировать признаки объектов устойчивые к линейным искажениям и координатному шуму.

Настоящая статья построена следующим образом. Кратко рассматривается математическая модель ги-пертрейс преобразования для анализа и распознавания пространственных изображений. Далее описываются свойства и функции гиперфункционалов, входящих в структуру получаемого гипертриплетного признака 3D объекта. Указывает роль данных функционалов в гипертрейс преобразование. В контексте рассматриваемой темы рассматривается вопрос повышения надежности распознавания 3D объектов. Затем приводятся конкретные примеры гиперфункционалов и конструируется конкретный гипертриплетный признак на их основе. В заключении формируются выводы по работе, указываются дальнейшие пути развития и применения данного метода.

Гипертрейс преобразование и его описание

Обозначим через В(п, г) плоскость на расстоянии r от начала координат и вектором нормалью h = [cosf ■ sinw,sinf ■ sinw,cosw] , где о - угол между В(п, г) и 0xy, ф - угол между В(п, г) и 0xz.

Исходный 3D объект F сканируется сеткой параллельных плоскостей. Результат пересечения каждой сканирующей плоскости В(ц(о,ф),г) с трёхмерной моделью F характеризуется числом: G = HyperT(F1B(h(w,f),r)) . Объект сканируется под различными углами о и ф с шагом До и Дф до завершения оборота обхода объекта F в 2п радиан по каждому углу с дискретным шагом Д между сканирующими плоскостями. В результате вычислений формируется гипертрейс матрица 3TM, у которой ось 0о направлена горизонтально, ось 0ф - вертикально, ось Or - вглубь.

Далее, вычисляется признак Res(F) исходной модели при помощи гиперфункционалов Hyper©, HyperQ и HyperP обработок строк и столбцов матрицы 3TM [4]:

Res (F) = HyperQ о HyperQ. о HyperP о HyperT (Fsect)

Признаки получившихся в сечении фигур извлекаются при помощи 2D трейс преобразования, введённого Н.Г. Федотовым [5] . Так, изображение фигуры сечения Fsect сканируется решеткой параллельных прямых l(p,0) с дискретным шагом Др между линиями под различными углами 0 до завершения полного оборота обхода в 2п радиан.

Признак 2D изображения имеет структуру в виде композиции трех функционалов [6]:

П(Fsect ) = HyperT (FSect ) = Q о P о T (Fsec, n l(e,p)) .

В топологическом смысле перебор всех углов о и ф даёт модель концентрических сфер с центром в начале координат. Сканирующие плоскости из совокупности сеток параллельных прямых, касающиеся единичной сферы в одной точке, назовём опорными (см. рис. 1) .

а) б)

Рисунок 1 Сканирование плоскостями: а) построение опорных плоскостей на основе равномерной

сетки на сфере; б) процесс сканирования сеткой параллельных плоскостей.

Свойства гиперфункционалов, входящих в структуру гипертриплетного признака

Гиперфункционал HyperT является основным гиперфункционалом, входящим в композиционную структуру определяемого гипертриплетного признака. На него приходится основная вычислительная сложность, занимая до 90% всего объёма операций. Аналогичная ситуация имеет место и для 2D трейс преобразования, являющимся предком и основой данного гипертрейс преобразования [7].

Функционалы типа HyperT определяют различные виды данного преобразования и оказывают влияние на выполнение свойства инвариантности к переносу.

Так, например, взяв в качестве HyperT расстояния по прямым до опорной плоскости, можно получать не сечения, а проекции исходной 3D модели F на опорные плоскости под разными углами, причем это достигается в той же технике сканирования.

Т.к. перемещение 2D фигуры в плоскости не изменяет её форму, то ввиду того, что дана сетка параллельных, получаемые сечения 3D объектов будут одинаковы вне зависимости от удаленности объекта от начала координат. Выбирая различные виды трейс- и гипертрейс функционалов, отражающие признаки фигур в сечении (длины высекаемого отрезка прямой, периметра или площади фигуры, получаемого в сечении и т.п.), достигается выполнение инвариантность к переносу. Здесь и далее погрешность дискретного шага будет игнорироваться.

Функционал HyperP оказывают влияние на выполнение свойства инвариантности к переносу. Данное свойство выполняется за счёт учёта всего среза сечений 3D объектов и осуществляется путём обрабатывания глубинной строки гипертрейс матрицы 3TM. Кроме того, подбирая определённые виды гиперфункционала, можно добиться, наоборот, сенситивности к переносу и получения признаков, инвариантных к аффинным преобразованиям. Некоторые типы функционала HyperP обладают высокой устойчивостью к линейным искажениям и координатному шуму.

Функционалы Hyper& и HyperQ оказывают влияние на выполнение свойства инвариантность к повороту и на сенситивность к масштабированию. Инвариантность к повороту достигается за счёт обзора 3D объекта со всех сторон и осуществляется путём обработки вертикальных и горизонтальных строки ги-пертрейс матрицы 3TM соответственно. Сенситивность к масштабированию может быть достигнута путём сведения всех признаков сечений к единичному масштабу.

Гиперфункционалы, входящие в состав гипертриплетного признаков, могут быть различными. Использование того или иного типа функционала отражает ту специфику и особенность, которую мы хотим извлечь из анализа объекта.

Основная роль гиперфункционалов состоит в нахождении какого-либо признака или особенностей исходного трехмерного объекта. В математическом смысле это означает поиск соответствующего элемента матрицы, содержащего величину максимального периметра среза, среза 3D объекта с определённым номером и т. п.

Также гиперфункционалы способны формировать новые признаки как комбинации признаков, полученных при сканировании и обработки 2D сечений. Например, площадь поверхности 3D объекта, максимальная из усреднённых площадей по каждой совокупности среза или усреднённая из максимальных площадей по каждой совокупности среза.

Повышение надежности распознавания 3D объектов

Определения точного позиционирования 3D моделей и последующая нормализация его положения во многих случаях не является устойчивой за счет неправильной нормализации по повороту. Объясняется это тем, что определение пространственной ориентации выполняется путем вычисления собственных значений ковариационной матрицы, и предполагается, что ориентация высокочастотной информации в значительной степени коррелирует с ориентацией компонент второго порядка. Если собственные значения матрицы равны, невозможно получить однозначно определяемое множество главных осей. Кроме того, наличие искажений и координатных шумов может привести к неправильному совмещению рассматриваемого объекта с эталоном из-за неправильного определения центра масс объекта и, как следствие, вектора переноса, коэффициента масштабирования.

Использование признаков, инвариантных к группе движений, позволяет получать более информативные и устойчивые признаки, чем при способе нормализации положения объектов. Гипертриплетные признаки являются устойчивыми к линейным искажениям и координатному шуму не только из-за свойства инвариантности, отсутствия предварительной обработки изображения и большого выбора гиперфункционалов, обладающих различными свойствами, но и из-за применяемой техники сканирования. Так, искажения 3D модели по-разному выглядят с разных углов обзора, в связи с чем в гипертрейс матрице глубинные строки будут иметь разный уровень колебания численных значений признака среза сечений. Следовательно, подбирая разные виды гиперфункционалов для выделения разных глубинных строк матрицы 3ТМ, возможно получить гипертриплетные признаки 3D изображения, менее подверженные линейным искажениям и координатному шуму. Данное обстоятельство повышает надежность распознавания 3D объектов .

Благодаря композиционной структуре гиперфункционалов, входящих в состав признака, возможно получение большого количества гипертриплетных признаков в режиме автоматической компьютерной генерации. Увеличение количества признаков позволяется заметно повысить надежность распознавания трехмерных изображений. Функционалы выбираются из различных областей математики: теории вероятно -стей и статистики, фрактальной геометрии, стохастической геометрии и т. п., благодаря чему гипертриплетные признаки, построенные на их основе, несут следы генезиса соответствующих областей математики и придают гибкость и универсальность алгоритмам распознавания.

Отметим, что гипертрейс функционалы помимо нахождения признаков 3D объекта можно использовать для сопоставления признаков совокупности целого среза сечений. Так, гиперфункционал находит, например, номер столбца с максимально возможным элементом (признаком сечения), а затем сравнивает полученный вектор c аналогично найденным вектором признаков или каждой строкой матрицы 3TM другого объекта. Такой способ использования гипертрейс функционалов позволяет значительно повысить эффективность 3D трейс преобразования, т.к. сравниваются не только признаки сечений, но и порядок их следования в срезе. Вероятность совпадения одной совокупности среза сечений для различных 3D объектов мала, в то время как вероятность совпадения нескольких совокупностей срезов под разными углами для одинаковых 3D объектов даже в условиях искажений и шума заметно повышается.

В этом случае признак Res(F) будет представлять собой не число, а вектор - признак среза сечений. Кроме того, размерность гипертриплетного признака можно увеличить. Вычисляя для большей надежности несколько признаков сечения 3D объекта, гипертриплетный признак Res(F) будет представлять собой уже матрицу - набор признаков среза сечений. Если аналогичное свойство распространить и на двумерный признак n(Fsect) для сравнения распределения среза прямых в сечении объекта, то признак Res(F) будет представлять собой уже трёхмерную матрицу. Однако стоит помнить, что по мере увеличения размерности признака происходит увеличение не только информативности и различающей силы признака, но и его вычислительной сложности и времени обработки.

Теоретические примеры гиперфункционалов и гипертриплетного признака.

Варьируя свойства каждого из указанных выше гиперфункционалов, можно получать большое количество признаков с заданными свойствами по исходной трёхмерной модели. Выбор конкретного типа функционалов исходит из особенностей анализируемого объекта и преследуемой цели.

Ниже кратко приведены теоретические примеры построения некоторых видов функционалов:

Т1: подсчёт числа пересечений 2D фигуры со сканирующей прямой.

Т4: (сумма длин отрезков, высекаемых сканирующей прямой на 2D изображении):

T(F nl)= J f (в,р, t)dt .

F nl *0

Т17 : T(F ПІ) =

P14

max (f(0,p t))+ min (f(0,p t))

t,Fnl*0 t,Fnl* 0

/2 .

многоугольника,

(периметр

Row2D-1

P(q) = (Row2D+і)-др+ Z |f(q,p,+1)-f(q,p), где дР

описанного около 2D сечения):

расстояние между параллельными прямыми, Row2D -

число строк двумерной трейс матрицы ТМ.

i=i

IRow2D Ґ Row2D Л Row2D

р27: p(q)=J z [w-pj)- z f(q,p)/»J/ z f(q,p).

Col 2D

07: 0 = П f(qV Col 2D if f(q) * о, где Col2D - число столбцов двумерной трейс матрицы ТМ.

і

021: вторая гармоника разложения функции в ряд Фурье.

HyperTl (полный тип функционала): полностью реализуются гипертриплетные и триплетные признаки при сечении плоскостями. Используется для анализа геометрических особенностей исходной трёхмерного объекта, поиску по 3D моделям, сегментации объектов в 3D сцене и т.п.

HyperT4 (сокращённый тип функционала): полностью реализуются только гипертриплетные признаки

3D при проекции на опорные плоскости, а триплетные признаки 2D только частично. Обладают значительно меньшими вычислительными затратами по сравнению с HyperT1.

HyperP13 (объём 3D объекта) : HyperP(w,f) = Zn(a,f,r) Dh , где Ah - расстояние между параллельными

г

плоскостями.

HyperP7 : медиана распределения среза сечений 3D объекта под одним углом. HyperQ3 : HyperW(f) = mean(HyperW(a,f)) .

HyperQ9: HyperW(f) = Arg (max (HyperW(a,f )))^ Arg (min (HyperW(a,f))) .

Hyper06 (коэффициент асимметрии): Hyper0 = m(f)/s3 (f) , где m (f) = m^X -m( X ))3 J - третий центральный

момент, а s(f) - среднеквадратическое отклонение вектора Х.

Hyper021: первая гармоника разложения функции в ряд Фурье.

Приведем теоретический пример построения гипертриплетного признака, характеризующего площадь поверхности объекта:

S(FSeCt) = Res (F) = HyperQ о HyperW о HyperP о HyperT (0 о P о T) ,

где T(Fsect nl(q,p)) = Zf(q,p,t)■ Dt , P(g(0,p)) = (Row2D + 1)-Dt + Zf(qp+1)-f(q,p) , 0(g(q)) = maxf(q) ,

t p q

HyperT(Fn B(h(a,f),г)) = П(Fsect) = П(a,f,r) , HyperP(n(a,f)) = Zn(a,f,r)■Dh , HyperW(P(f)) = maxn(a,f) ,

r W

HyperQ = maxn(f) , At - расстояние между параллельными прямыми в плоскости сечения, f(q, p,k) - длина

k-го отрезка, высекаемого р^-ой прямой под 01-ым углом в плоскости сечения Fsect , Row2D - количество ненулевых элементов в столбце трейс матрицы TM в плоскости сечения, П(Fsect) = n(afr) - признак

сечения (площадь), получаемого rh-ой плоскости под (xt, <ps)-ым углом, Ah - расстояние между параллельными плоскостями.

Заключение

Распознавание и обработка изображений является одной из центральных и практически важных задач при создании систем искусственного интеллекта, которая требует дальнейшего развития.

Создаваемое новое геометрическое гипертрейс преобразование является источником нового класса конструктивных признаков - гипертриплетных признаков. Композиционная структура гиперфункционалов, входящих в состав признака Res(F) 3D объекта, позволяет выполняется сканирование и обработку объекта в одной технике. В связи с этим, уже на этапе сканирования можно формировать гипертриплетные признаки 3D модели, что позволяет ускорить выполнение работы всей распознающей системы.

Опора на большое количество признаков позволяет заметно повысить надежность распознавания. В частности, варьирую свойства функционалов можно получить признаки инвариантные к группе движений и сенситивные к масштабированию, а также признаки, отражающие метрические характеристики 3D объектов. Определённый подбор типов гиперфункционалов способен построить признаки более устойчивые к линейным искажениям и координатному шуму.

Автор планирует развить и более подробно описать применение гипертрейс преобразование для анализа выпуклых и невыпуклых объектов. Планируется расширить данный метод для анализа особенностей 3D моделей и их метрических характеристик, для сегментации и нелинейной обработки 3D изображений, аналогично уже разработанной теории для 2D изображений [8-10] . Гипертрейс преобразование способно распознавать не только контурные, но текстурные и цветные 3D изображений, аналогично свойствам 2D трейс преобразования [11-14]. Сканирование в гипертрейс преобразование возможно также по сложным траекториям, как это было описано для 2D трейс преобразования в [15].

Автор планирует провести апробацию гипертрейс метода на различных базах данных (в частности в задачах распознавания 3D изображений лиц).

Всё вышеперечисленное обосновывает актуальность разработки гипертрейс преобразования и высокую надежность распознавания 3D объектов.

ЛИТЕРАТУРА

1. Юрков Н.К. Концепция синтеза сложных наукоемких изделий / Надежность и качество: труды Международного симпозиума, под ред. Н.К. Юркова. - Пенза, Изд-во ПГУ. - 2012. - Т. 1. - С. 3-5.

2. Сазонов В.В., Щербаков М.А. Качественное увеличение деталей изображения / Надежность и качество: труды Международного симпозиума. - Пенза, Изд-во ПГУ. - 2013. - Т. 1. - С. 347-349.

3. Ергалиев Д.С., Тулегулов А.Д., Мусагулова Ж.С., Нысанбаева А.Б. Геометрические искажения и геометрическая коррекция спутниковых снимков / Надежность и качество: труды Международного симпозиума, под ред. Н.К. Юркова. - Пенза, Изд-во ПГУ. - 2013. - Т. 1. - С. 359-361.

4. Семов А.А. Об одном подходе к распознаванию SD-изображений / Надежность и качество: труды Международного симпозиума, под ред. Н.К. Юркова. - Пенза, Изд-во ПГУ. - 2013. - Т. 1. - С. 350351.

5. Fedotov N.G. The Theory of Image-Recognition Features Based on Stochastic Geometry // Pattern Recognition and Image Analysis. Advances in Mathematical Theory and Applications. - 1998.

- V. 8, № 2. - P. 264-266 .

6. Fedotov N.G., Shulga L.A. New Ways to Form Features for Pattern Recognition on the Basis of Stochastic Geometry // 12th Scandinavian Conf. on Image Analysis. - Vol. I-II. - Bergen (Norway).

- 2001. - Р. 373-380.

7. Федотов Н.Г. Теория признаков распознавания образов на основе стохастической геометрии и функционального анализа. - М.: ФИЗМАТЛИТ, 2009. - 304 с.

8. Федотов Н.Г., Крючкова Е.А., Моисеев А.В., Семов А.А. предварительная обработка изображений на основе трейс-преобразований / Надежность и качество: труды Международного симпозиума, под ред. Н.К. Юркова. - Пенза, Изд-во ПГУ. - 2011. - Т. 2. - С. 315-316.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

9. Федотов Н.Г., Крючкова Е.А., Моисеев А.В., Шабакаев А.И. Новое геометрическое двойственное трейс-преобразование для нелинейной фильтрации изображений / Надежность и качество: труды Международного симпозиума, под ред. Н.К. Юркова. - Пенза, Изд-во ПГУ. - 2011. - Т. 2. - С. 317-318.

10. Федотов Н.Г., Фионов Н.С., Романенко Ю.А., Баннов В.Я. Развитие принципов интеллектуально -го поиска биометрических изображений на основе стохастической геометрии и функционального анализа / Надежность и качество: труды Международного симпозиума, под ред. н.к. Юркова. - Пенза, Изд-во ПГУ. - 2012. - т. 2. - с. 394.

11. Fedotov N.G., Mokshanina D.A. Recognition of halftone textures from the standpoint of stochastic geometry and functional analysis // Pattern Recognition and Image Analysis, Advances in Mathematical Theory and Applications. - 2010. - Vol. 20. - № 4. - P. 551-556.

12. Fedotov N.G., Mokshanina D.A. Recognition of images with complex half-tone texture // Measurement Techniques. - 2011. - Vol. 53. - № 11. - P. 1226-1232.

13. Федотов Н.Г., Шабакаев А.И., Крючкова Е.А. Применение трейс-преобразования полутоновых изображений для оптического контроля производства микропровода / Надежность и качество: труды Международного симпозиума, под ред. Н.К. Юркова. - Пенза, Изд-во ПГУ. - 2012. - Т. 2. - С. 392393 .

14. Nikolay Fedotov, Sergey Romanov, Daria Goldueva Application of triple features theory to the analysis of half-tone images and colored textures. Feature construction along stochastic geometry and functional analysis. Computer and Information Science // Canadian Center of Science and Education Canada. - 2013. - Vol. 6. - № 4. - P. 17-24.

15. Федотов Н.Г. Анализ свойств триплетных признаков распознавания при различных вариантах сканирования изображений / Надежность и качество: труды Международного симпозиума, под ред. Н. К. Юркова. - Пенза, Изд-во ПГУ. - 2013. - Т. 1. - С. 80-82.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Сёмов А. А.

Текст научной работы на тему «Повышение надежности распознавания 3D-объектов на основе методов стохастической геометрии»