УДК 004.93
АКТУАЛЬНОСТЬ РАЗРАБОТКИ НОВОГО МЕТОДА АНАЛИЗА И РАСПОЗНАВАНИЯ 3D-ОБЪЕКТОВ
А. А. Семов, М. А. Семов
ACTUALITY OF DEVELOPING A NEW METHOD FOR 3D-OBJECTS ANALYSIS AND RECOGNITION
А. А. Syemov, M. А. Syemov
Аннотация. Предлагается новая методика анализа и распознавания 3Б-изоб-ражений, основанная на представлении объекта в виде трехмерной модели. Обосновываются актуальность рассматриваемой темы и необходимость разработки нового метода для анализа и распознавания 3Б-объектов. Приводится обзор основных подходов к анализу и распознаванию 3Б-объектов с указанием их особенности и основных недостатков. Кратко описывается математическая модель данного преобразования. Указываются основные свойства гипертрейс-метода.
Ключевые слова: 3Б-моделирование, анализ и распознавание 3Б-объектов, ги-пертрейс-преобразование, гипертриплетный признак, композиционная структура функционалов признака, многофункциональные свойства метода.
Abstract. A new method for 3D-images analysis and recognition based on the object representation as a three-dimensional model is suggested. The topic actuality and the importance to develop a new method for the 3D-objects analysis and recognition is substantiated. Overview of the main approaches to the analysis and recognition of 3D-objects indicating their main peculiarities and disadvantages is provided. The mathematical model of this transform is briefly described. Basic hypertrace method properties are indicated.
Key words: 3D-modeling, 3D-objects analysis and recognition, hypertrace transform, hypertriplet feature, compositional structure functionals of feature, multifunctional method properties.
Проблема распознавания образов является одной из центральных в теоретической информатике и кибернетике. Помимо общетеоретического значения, элемент распознавания образов присутствует в любом непримитивном поведении автоматов - для многих областей знания разработка методов распознавания образов и анализа изображений является самоцелью. Речь идет о таких областях, как искусственный интеллект, зрение роботов, аэрокосмические исследования, радиолокация. От решения этих задач зависит прогресс информатики в важной области - обработке информации, представленной в виде изображений.
Для современного этапа развития теории распознавания образов актуально расширение круга рассматриваемых задач распознавания на пространственные изображения, в то время как ранее внимание исследователей было сосредоточено на решении задач анализа и распознавания 2D-изображений. Эффективность машинного зрения при распознавании 3D-изображения значительно уступает возможностям человека, что объясняется не слабой мощностью вычислительных средств, а недостаточно развитыми теоретическими методами и подходами.
С увеличением количества ЗБ-моделей в хранимых базах данных насущной проблемой становится их поиск в этих базах, обучение компьютерной системы способности различать и классифицировать объекты. Так, ЗБ-визуализация товара помогает быстрее продвигать продукцию на рынке, когда покупателю в опПпе-режиме система предоставляет возможность быстро подобрать различные виды товара и рассмотреть его со всех сторон.
С развитием и усложнением технических устройств актуальной становится также задача вычисления различных метрических свойств объектов. Так, в медицинской диагностике сердечно-сосудистых заболеваний большое значение имеет задача визуального наблюдения структуры живого сердца [1]. Точное определение размеров, формы и других параметров отделов сердца играет важную роль, так как помогает врачу оценить степень влияния патологии на структуру и работу сердца. Получить четкое представление о форме внутреннего и внешнего контура желудочков и поставить правильный диагноз крайне сложно без использования средств ЗБ-моделирования и распознавания.
Обзор основных методов анализа и распознавания ЗБ-объектов
В большинстве публикаций по теме распознавания и обработки ЗБ-изображения либо рассматриваются эвристические подходы, которые характерны для узкого класса изображений, либо описываются теоретические подходы, обладающие теми или иными ограничениями.
Так, в [2] предлагается подход, определяющий похожесть ЗБ-объектов на основе визуального подобия. Предполагается, что если ЗБ-модели подобны, то со всех углов зрения они должны выглядеть одинаково. Таким образом, 100 проекций объекта кодируются с помощью моментов 2егшке и дескрипторов Фурье, которые используются для извлечения в качестве характерных признаков.
В [З] представлен подход быстрого запроса ЗБ-модели. Дескрипторы, которые извлекаются из входной модели, представляют собой геометрические характеристики ЗБ-объектов и выбираются аналогично базовым критериям, которыми пользуется аналитик (например углы и грани модели и т.п.).
В [4] используются гистограммы формы, которые дискретно параметризуются по главным осям инерции модели. Гистограммы формы имеют три типа: момент инерции по оси, среднее расстояние от поверхности до оси и дисперсия расстояния от поверхности до оси.
Для рассмотренных и других аналогичных методов этого класса необходимы определение точного позиционирования ЗБ-моделей и последующая нормализация его положения. Однако нормализация по повороту за счет пространственной ориентации во многих случаях не является устойчивой из-за невозможности однозначного определения множества главных осей. Наличие искажений может сильно повлиять даже на определение точного коэффициента масштаба и вектора переноса, в результате чего эффективность распознавания может быть значительно снижена.
К настоящему времени известно лишь небольшое число подходов к извлечению ЗБ-моделей, где оценка положения не является необходимой. Так, в [5] показан дескриптор объемной формы, инвариантный к поворотам на 90° вокруг оси координат. Эта ограниченная инвариантность к поворотам получается за счет достаточно грубого отображения формы, вычисленного с помощью облака кластерных точек. Поскольку этап нормализации опущен,
при повороте объекта вокруг оси на любой другой угол (например 45°), вектор признаков претерпевает значительные изменения, и эффективность распознавания падает.
В [6] дана сложная методика, представляющая 3Б-объект в виде графов. Из-за громоздкости и большого объема вычислений данный способ пригоден только для определенного типа моделей и имеет узкую область применения.
В [7] предложен эффективный метод 3Б-поиска и извлечения. Дан новый подход, инвариантный к поворотам дескрипторов, не требующих нормализации по повороту. Однако в этой работе присутствует нормализация по переносу и масштабированию.
В настоящей статье предлагается новый универсальный подход к распознаванию 3Б-изображений, основанный на аппарате стохастической геометрии и функционального анализа. Данный метод основан на анализе объекта как трехмерной модели, а не его проекций. Использование в анализе данных формы объекта заметно повышает информативность извлекаемых признаков и, как следствие, улучшает эффективность распознавания.
Математическая модель ЗБ-трейс-преобразования
Обозначим через B(n, r) плоскость на расстоянии r от начала координат и вектором нормалью ^ = [cos ф • sin ю, sin ф • sin ю, cos ю], где ю - угол между
B(n, r) и Oxy, ф - угол между B(n, r) и Oxz.
Исходный 3Б-объект F сканируется сеткой параллельных плоскостей (рис. 1). Результат пересечения каждой сканирующей плоскости 5(п(ю, ф), r) с трехмерной моделью F характеризуется числом G = HyperT (F П B (^(ю, ф), r)).
Объект сканируется под различными углами ю и ф с шагом Дю и Дф до завершения оборота обхода объекта F в 2п радиан по каждому углу с дискретным шагом Д между сканирующими плоскостями. В результате вычислений формируется гипертрейс - матрица 3TM, у которой ось 0ю направлена горизонтально, ось 0ф - вертикально, ось Or - вглубь.
Рис. 1. Сканирование объекта сеткой плоскостей 201
Далее, используя построковые и постолбцовые обработки матрицы 3TM с помощью гиперфункционалов HyperP, HyperQ и Hyper®, вычисляется признак Res(F) исходной модели [8] :
Res (F) = HyperQ • HyperQ, • HyperF • HyperT (Fsect ).
Признаки получившихся в сечении фигур извлекаются с помощью 2D трейс-преобразования, введенного Н. Г. Федотовым [9]. Так, изображение фигуры сечения Fsect сканируется решеткой параллельных прямых 1(р, 0) с дискретным шагом Ар между линиями под различными углами 0 до завершения полного оборота обхода в 2п радиан. Признак 2D-изображения имеет структуру в виде композиции трех функционалов:
П (Fsect ) = HyperT (Fsect ) = Q F • T(Fsect П l(6, P)) .
Благодаря композиционной структуре функционалов, входящих в признак, возможно получение большого количества гипертриплетных признаков в режиме автоматической компьютерной генерации. Опора на большое количество признаков позволяет повысить надежность распознавания. Функционалы выбираются из различных областей математики: теории вероятностей и статистики, фрактальной геометрии, стохастической геометрии и т.п., благодаря чему гипертриплетные признаки, построенные на их основе, несут следы генезиса соответствующих областей математики и придают гибкость и универсальность алгоритмам распознавания. В частности, варьируя свойства функционалов, можно получить признаки, инвариантные к группе движений и сенситивные к масштабированию, а также признаки, отражающие метрические характеристики 3D-объектов.
Свойства гипертрейс-метода
Новый рассматриваемый метод базируется на ранее не применявшемся в области анализа и распознавания 3D-изображений математическом аппарате стохастической геометрии и функционального анализа. Новое геометрическое гипертрейс-преобразование является удобным инструментом для изучения движущихся объектов.
Предлагаемое в данной статье гипертрейс-преобразование позволяет конструировать признаки, полностью инвариантные к группе движений 3D-объектов и сенситивные (в части случаев даже инвариантные) к масштабированию [10]. Кроме того, данный метод способен извлекать метрические свойства объекта, анализировать его особенности (глубина кратера на поверхности объекта), определять масштаб модели, количество ее составных частей и т.д., а также эффективно распознавать 3D-объекты, подверженные линейным деформациям.
Гипертриплетные признаки пригодны для распознавания цветных, контурных и текстурных изображений как 3D-, так и 2D-изображений [11]. Кроме того, они обладают устойчивостью к координатному шуму.
Стоит отметить, что обработка, сканирование и анализ изображения осуществляются по одинаковой процедуре благодаря специфичной структуре
формируемых признаков, что позволяет ускорить время работы распознающей системы.
Данный метод обладает определенной универсальностью, так как схема сканирования не привязана к геометрическим особенностям исходной модели, а благодаря большому числу используемых видов функционалов и их композиционной структуре можно подбирать и конструировать различные признаки, которые будут наиболее эффективны при распознавании заданной базы объектов.
Всей совокупностью перечисленных свойств не обладает ни один из известных мировых методов [12].
Список литературы
1. Алпатов, А. В. Способ количественной визуализации формы правого желудочка сердца человека в целях эхокардиографических исследований / А. В. Алпатов, Р. Е. Калинин // Актуальные вопросы клинической морфологии : сб. науч. тр. -Рязань, 2000. - С. 80-84.
2. On visual similarity based 3D model retrieval / D.-Y. Chen, X.-P. Tian, Y.-T. Shen, M. Ouhyoung // Computer Graphics Forum. - 2003. - V. 22, № 3. - Р. 223-232.
3. Fast content-based search of VRML models based on shape descriptors / I. Kolonias, D. Tzovaras, S. Malassiotis, M. G. Strintzis // IEEE Transactions on Multimedia. -2005. - V. 7, № 1. - Р. 114-126.
4. Shape-similarity search of three-dimensional models using parameterized statistics / R. Ohbuchi, T. Otagiri, M. Ibato, T. Takei // Proceedings of the 10th Pacific Conference on Computer Graphics and Applications. - Beijng, China, 2002. - Р. 265-274.
5. Suzuki, M. T. A web-based retrieval system for 3D polygonal models / M. T. Suzuki // Proceedings of the Joint 9th IFSA World Congress and 20th NAFIPS International Conference. - Vancouver, Canada, July 2001. - V. 4. - Р. 2271-2276.
6. Topology matching for fully automatic similarity estimation of 3D shapes / M. Hilaga, Y. Shinagawa, T. Kohmura, T. L. Kunii // Proceedings of the 28th Annual Conference on Computer Graphics and Interactive Techniques (SIGGRAPH '01). - Los Angeles, Calif, USA, August, 2001. - Р. 203-212.
7. 3D Model Search and Retrieval Using the Spherical Trace Transform / Dimitrios Zarpalas, Petros Daras et al. // EURASIP Journal on Applied Signal Processing. - New York, NY, USA, October, 2006. - V. 1. - Р. 207-221.
8. Федотов, Н. Г. 3d трейс-преобразование и его свойства / Н. Г. Федотов, А. А. Се-мов // XXI век: итоги прошлого и проблемы настоящего - плюс. Серия «Технические науки. Информационные технологии». - 2013. - Вып. 10 (14). - С. 68-74.
9. Fedotov, N. G. The Theory of Image-Recognition Features Based on Stochastic Geometry / N. G. Fedotov // Pattern Recognition and Image Analysis. Advances in Mathematical Theory and Applications. - 1998. - V. 8, № 2. - P. 264-266.
10. Fedotov, N. G. Trace transform of spatial images / N. G. Fedotov, S. V. Ryndina, А. А. Syemov // 11th International conference on Pattern Recognition and Image Ana-lasis: New Information technologies (PRIA-11-2013). Conference Proceedings (V. I-II). - Samara : IPSI RAS, 2013. - V. 1. - P. 186-189.
11. Семов, А. А. Об одном подходе к распознаванию 3D-изображений / А. А. Семов // Надежность и качество : тр. Междунар. симп. : в 2 т. / под ред. Н. К. Юркова. -Пенза : Изд-во ПГУ, 2013. - Т. 1. - С. 350-351.
12. Федотов, Н. Г. Краткий обзор основных подходов к анализу 3D-моделей и разработка 3D трейс-преобразования / Н. Г. Федотов, А. А. Семов // Новые информационные технологии и системы» (НИТИС-2012) : сб. тр. X Междунар. науч.-техн. конф. - Пенза : Изд-во ПГУ, 2012. - С. 222-225.
Семов Алексей Александрович аспирант, программист, кафедра экономической кибернетики, Пензенский государственный университет E-mail: [email protected]
Семов Михаил Александрович аспирант,
кафедра высшей и прикладной математики, Пензенский государственный университет E-mail: [email protected]
Syemov Aleksey Aleksandrovich postgraduate student, programmer, sub-department of economic cybernetics, Penza State University
Syemov Mihail Aleksandrovich postgraduate student, sub-department of higher and applied mathematics, Penza State University
УДК 004.9З Семов, А. А.
Актуальность разработки нового метода анализа и распознавания ЭБ-объек-
тов / А. А. Семов, М. А. Семов // Модели, системы, сети в экономике, технике, природе и обществе. - 2014. - № 2 (10). - С. 199-204.