Научная статья на тему 'Интеллектуальная обработка 3D изображений: преобразование, сегментация и нелинейная фильтрация пространственных объектов'

Интеллектуальная обработка 3D изображений: преобразование, сегментация и нелинейная фильтрация пространственных объектов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
351
35
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
3D ИЗОБРАЖЕНИЕ / ГИПЕРТРЕЙС-ПРЕОБРАЗОВАНИЕ / ГИПЕРТРИПЛЕТНЫЙ ПРИЗНАК / ИНВАРИАНТНОЕ РАСПОЗНАВАНИЕ / ИНТЕЛЛЕКТУАЛЬНАЯ ОБРАБОТКА / СЕГМЕНТАЦИЯ ИЗОБРАЖЕНИЯ / ПРЕОБРАЗОВАНИЕ ИЗОБРАЖЕНИЙ / НЕЛИНЕЙНАЯ ФИЛЬТРАЦИЯ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Сёмов А. А.

В статье описаны основы интеллектуальной обработки 3D изображений на основе гипертрейс-преобразования. Рассматриваемый в настоящей работе метод сканирования трехмерных изображений основан на аппарате стохастической геометрии и функционального анализа. Описана математическая модель и техника сканирования гипертрейс-преобразования. Предложено дальнейшее развитие теории гипертриплетных признаков. Благодаря их аналитической структуре возможна автоматическая генерация большого количества признаков с заранее заданными свойствами, в частности, инвариантности и сенситивности по отношению к группе движений и масштабным преобразованиям. Проанализированы основные элементы интеллектуальной обработки 3D изображений: преобразование, сегментация и нелинейная фильтрация. Приведены конкретные примеры

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Интеллектуальная обработка 3D изображений: преобразование, сегментация и нелинейная фильтрация пространственных объектов»

и ремонтов - устанавливается срочность ремонта, его продолжительность, трудозатраты, требования в запасных частях и материалах, ответственные. Составляются соответствующие данной процедуре документы в электронном виде - ведомости, заявки, сметы, графики, акты, отчеты. После описания алгоритмов системы оценки состояния оборудования на следующем этапе возможна проведение экспериментальная проверка данных методов и алгоритмов, а также реализация данных схем с помощью автоматизированного комплекса принятия решений по техническому состоянию оборудования.

Заключение

Полученные алгоритмы могут быть программно и аппаратно реализованы в автоматизированных системах управления и контроля процесса технического обслуживания и ремонта, тем самым позволяя в реальном режиме времени оценивать техническое состояние машиностроительного оборудования, а также реализовать стратегию оптимизации ремонтных работ по техническому состоянию оборудования, его износу.

ЛИТЕРАТУРА

1. Полетаев, В.П. Автоматизированная система оптимизации периодичности профилактики проявления отказов / В.П. Полетаев, Д.А. Богданов // Труды международной конференции «Системы проектирования, технологической подготовки производства и управления этапами жизненного цикла промышленного продукта». - Москва: ИПУ РАН, 2015. - C. 224-226.

2. Полетаев, В.П. Применение автоматизированного комплекса для оценки состояния сложных технических систем со скрытыми отказами / В.П. Полетаев, Д.А. Богданов // Надежность и качество сложных систем. - Пенза: ФГБОУ ВО ПГУ. - № 3(15) - 2016. - С. 80-84.

3. Полетаев, В.П. Автоматизированная система реализации модели оценки технического состояния оборудования на основе линейной аппроксимации / В.П. Полетаев, Д.А. Богданов // Труды международной конференции «Системы проектирования, технологической подготовки производства и управления этапами жизненного цикла промышленного продукта». - Москва: ИПУ РАН, 2016. - C. 364-366.

4. Полетаев, В.П. Моделирование и расчёт периодичности профилактического обслуживания технических систем по эмпирической функции надёжности / В.П. Полетаев, Д.А. Богданов // Конструкции из композиционных материалов. - 2007. -№ 4. -С. 58-64

5. Полетаев, В.П. Управление периодичностью обслуживания технических систем при оптимизации коэффициента технического использования / В. П. Полетаев, Д. А. Богданов // Надежность и качество: труды Международного симпозиума: в 2-х т. / Пенза: Информационно-издательский центр ПГУ, 2007. -С. 237-239.

6. Полетаев, В. П. Оптимизация периодичности профилактики отказов / В. П. Полетаев, Д. А. Богданов // Труды международного симпозиума Надежность и качество. -2015. -Т. 1. -С. 35-37.

7. Полетаев, В. П. Управление профилактическим обслуживанием при различном проявлении отказов технических систем / В. П. Полетаев, О. И. Микрюкова, Д. А. Богданов // Труды международной конференции «Системы проектирования, технологической подготовки производства и управления этапами жизненного цикла промышленного продукта». - Москва: ИПУ РАН, 2011. -С. 249-250.

УДК 004.89:004.93 Сёмов А.А.

ООО «Комхэлф», Пенза, Россия

ИНТЕЛЛЕКТУАЛЬНАЯ ОБРАБОТКА 3D ИЗОБРАЖЕНИЙ: ПРЕОБРАЗОВАНИЕ, СЕГМЕНТАЦИЯ И НЕЛИНЕЙНАЯ ФИЛЬТРАЦИЯ ПРОСТРАНСТВЕННЫХ ОБЪЕКТОВ

В статье описаны основы интеллектуальной обработки 3D изображений на основе гипертрейс-преобразования. Рассматриваемый в настоящей работе метод сканирования трехмерных изображений основан на аппарате стохастической геометрии и функционального анализа. Описана математическая модель и техника сканирования гипертрейс-преобразования. Предложено дальнейшее развитие теории гипертриплетных признаков. Благодаря их аналитической структуре возможна автоматическая генерация большого количества признаков с заранее заданными свойствами, в частности, инвариантности и сенситивности по отношению к группе движений и масштабным преобразованиям. Проанализированы основные элементы интеллектуальной обработки 3D изображений: преобразование, сегментация и нелинейная фильтрация. Приведены конкретные примеры.

Ключевые слова:

3D изображение, гипертрейс-преобразование, гипертриплетный признак, инвариантное распознавание, интеллектуальная обработка, сегментация изображения, преобразование изображений, нелинейная фильтрация

Введение

Устойчивой тенденцией научно-технического прогресса является увеличение числа людей, занятых обработкой информации, которое становится всё больше и больше с каждым годом. Одной из важнейших задач, возникающих при создании информационных систем, является автоматизация процесса распознавания образов. Для её решения ведутся широкие исследования, которые призваны помочь познать одно из основных свойств человеческого мозга - способность распознавать [1-3]. Для этого разрабатываются и создаются решающие предпосылки для построения интеллектуальных систем.

Проблема анализа и распознавание трехмерных изображений имеет огромное общетехническое и прикладное значение. Во многих отраслях знаний существенная часть информации заключается в изображениях, без анализа которых невозможно осуществлять дальнейшую деятельность. Например, к их числу можно отнести изображения, получаемые с помощью магнитно-резонансной томографии. В большинстве практических задач необходимо исследовать свойства и метрические характеристики исходных пространственных объектов [4-5]. В связи

с этим анализ и распознавание трехмерных изображений является актуальной задачей.

Возможности интеллектуального анализа изображений с помощью компьютеров пока находятся на не высоком уровне, несмотря на возрастающую потребность в данных методах. Самостоятельное принятие решение и искусственный интеллект роботов будет невозможен или крайне неэффективен при слабом уровне машинного зрения [6]. Так, транспортные роботы при плохом качестве машинного зрения не смогут обеспечить надежную ориентацию и движение в пространстве.

Интеллектуальная обработка 3D изображений: гипертрейс-преобразование

Обозначим через В(^,г) = |х | х = г| как касательную к сфере центром в начале координат, проходящую через заданную точку X и на расстоянии г от начала координат и вектором нормалью

Т] = \сс$,т- $,тф, СС8ф] , где а - угол между

осью 0х и проекцией отрезка ОХ на плоскость 0ху, Ф - угол между осью 0 2 и отрезком ОХ.

Сканирование исходного объекта осуществляется сеткой параллельных плоскостей с разных углов

обзора (рис. 1, слева) [7]. Результат пересечения каждой сканирующей плоскости В г) с трёхмерной моделью ¥ характеризуется числом:

где г, а, ф - сферические координаты. В результате множество чисел О (какой-либо признак сечения) формирует ги-пертрейс-матрицу ЭТИ, у которой ось 0а направлена горизонтально, ось 0ф - вертикально, ось 0г - вглубь [8].

Важно отметить, что изменять углы важно не произвольным образом, а согласно построению опорной сетки, чтобы плотность плоскостей в пространстве была равномерной (рис. 1, справа). Опорная сетка, обладающая равномерным распределением точек на сфере, обеспечит достижение меныпей ошибки совмещении узлов опорной сетки

при ее повороте из-за дискретного шага сканирования. Равномерное распределение точек опорной сетки на сфере обеспечит отсутствие более плотных скоплений узлов опорной сетки на поверхности сферы, определяющих преимущественно сечения под теми или иными углами обзора объекта. В связи с этим, все результаты сканирования будут принимать равноправное участие при вычислении значения признака 3D изображения без повышения влияния каких-либо определенных значений сечений, так как частота появления любого среза сечений будет приблизительно одинакова (равномерный обзор трехмерного тела со всех сторон). Другими словами, значение вычисляемого признака не будет зависеть от ориентации 3D изображения в пространстве.

Рисунок 1 - Сканирование 3D объекта (ракушки) сеткой параллельных плоскостей

Признак 3D изображения получается после обработки строк и столбцов матрицы 3TM функционалами HyperQ, HyperQ и HyperP. Таким образом, признак 3D изображения имеет композиционную структуру [9]:

Res(F) = Hyper® о HyperQ = Hyper? ° Hyper\(F {\В{г!(а,ф),г^

Сканирование получаемых в сечение фигур Fsect

осуществляется сеткой параллельных прямых l(в,р)

с расстоянием Др между линиями под всеми углами наклона прямых 8 в плоскости сечения [10], где р, 8 - полярные координаты прямой в плоскости сечения. Взаимное положение изображения Fsect и

каждой сканирующей линии l (в,р) характеризуется

числом, вычисляемым по правилу Т:

Res(F) = Hyper® ^ HyperQ »HyperP з//т,ре?'Т(©с Р оТ) , где Т=Хmp,t) , P = Zë(M ,

© = max g (в) - min g (в),

в в '

HyperP = max I rowgrad G (ю,ф, r) ,

HyperT = 0(ю,ф, r) ,

max G(ф)

HyperQ. = max G (®,ф) , Hyper© = —ф-

min

ф

G(Ф) '

функция

g(M = T(FBCtn/(M) •

После перебора различных углов 8 формируется трейс-матрица ТМ, у которой ось 0р направлена горизонтально, ось 08 - вертикально [11]. Три-плетный признак сечения получается после обработки строк и столбцов матрицы ТИ функционалами 0 и Р, каждый из которых последовательно сокращает размерность матрицы на единицу (аналогично признаку 3D изображения).

Таким образом, признак 2D сечения имеет следующую структуру [12]:

П(^ес,) = ^е;Т(Р5ес() = ©оРоТ(Р5ес( ГММ) ■

Благодаря композиционной структуре функционалов, входящих в структуру П(^ес и Яев(¥) ,

возможно получение огромного числа признаков. Причем возможно конструирование признаков, описывающих те или иные геометрические характеристики 3D объекта, что облегчает задачу анализа свойств 3D изображений и построения информативных признаков [13].

Ниже приведён пример признака, который полностью инвариантный к группе движения и масштабированию 3D изображения:

гспу^рас](у(.¥],...,хи)) находит градиент строки (вы-ч

числяет абсолютные значения приростов между соседними значениями по переменной Х^ ).

Возможность регулировать свойства конструируемых признаков повышает интеллектуализацию анализа и обработки 3D изображений, так как не только расширяет количество полезных признаков, эффективных для того или иного класса пространственных объектов, но и позволяет извлекать дополнительную информацию об объекте, не проводя при этом дополнительных сканирований.

Интеллектуальная обработка 3D изображений: преобразование

Специфичная структура гипертриплетных признаков Res(F) позволяет строить признаки как сенситивные, так и инвариантные к группе движений и масштабированию, что повышает интеллектуальность и гибкость гипертрейс-метода при распознавании объектов.

Опишем, как можно осуществлять преобразование изображений на основе построение признаков сенситивных к группе движений 3D изображений и анализе их свойств. Вычисляя два сенситивных к переносу признака 3D объекта, можно получить в одной технике признак Кев(Е), инвариантный к группе движений изображения, а также уравнения

p

граней выпуклого многогранника, содержащего внутри себя исходный объект.

Свойство сенситивности к переносу для любого функционала £ будет иметь вид:

общем

сех допустимых

© =

C( f ( x + b)) = C( f ( x ))-b

C(f (x+b)) = C(f (x))+b , ил C(f (x + b)) = C(f (x)) + b ■ k дл f ( x ) и Vb , Vk .

Свойство сенситивности к масштабированию для любого функционала Z будет иметь вид:

C( f (a ■ x))= -JC{ f ( x)) или C(f(a ■ x)) = a C(f(x))

для всех допустимых f (x) и Va Ф 0 .

Ниже приведен пример признака, инвариантного к повороту и сенситивного к переносу и масштабированию 3D изображения:

SenA (F)= Hyper& ° HyperO ° HyperP ° HyperT (© ° Р ° Т) , где T = (maxf (в,р,t)+ minf (в,р,t))j2 ,

P = ming (в,р,. yXg (в, p ) ,

^ П1 f в )| if \f в )| * 0.0001 , HyperT = G (®,ф,г) ,

HyperP = arg last G (а,ф,r) , HyperO = max G (а,ф) ,

r ф

Hyper® = max G (a) , arg last- функционал, вычис-

а

ляющий номер последнего ненулевого элемента горизонтальной строки.

В качестве второго сенситивного признака SenB(F) возьмём признак, имеющий ту же аналитическую структуру, за исключение одного функционала HyperP:

HyperP = arg first G (аа,ф, r ) .

r

где arg first - функционал, вычисляющий номер первого ненулевого элемента горизонтальной строки.

При этом заметим, что дополнительно производить сканирование для второго сенситивного признака не нужно: оба признака извлекаются из одних и тех же 3ТМ и ТМ матриц.

По двум указанным сенситивным признакам SenA(F) и SenB(F) возможно определить множество различных признаков, дающих инвариантное описание различных свойств 3D изображения. В частности, ниже показан пример признак, который будет инвариантным к группе движений и сенситивным к масштабированию 3D изображения:

Res ( F ) = ( SenA( F )- SenB ( F ))■ A r .

Построенный признак характеризует наибольшую ширину 3D объекта (его диаметр). Другими словами, находится минимальный размер произвольно ориентированного в пространстве куба, который полностью содержит исходный 3D объект внутри себя.

Промежуточным продуктом вычислений данного признака является тройка (ai, ф^ rk), которая соответствует элементу матрицы с номером (i, j,

k) и значением n(Fœ() , характеризующим информативный признак 2D фигуры, полученной в сечении объекта F плоскостью B(¡(®,ф),rk) . Поэтому по

результатам сканирования можно определить уравнения граничных плоскостей, касающихся исходного пространственного объекта в некоторой точке:

cos^. ■ sin а ■ x + cos^. ■ cosa ■ y + sin^. ■ Z = r •

Таким образом, определив параметрическое множество коэффициентов нормалей плоскостей, можно построить ограниченный данными плоскостями выпуклый многогранник, содержащий внутри себя исходный 3D объект. Чем больше признаков такого класса вычисляется и чем больше узлов опорной

сетки на сфере используется, тем более полигональным и сглаженным становится данный многогранник, вплоть до точной копии оболочки самого объекта.

Аналогично можно построить выпуклый многогранник, полностью содержащийся в исходной 3D модели.

Интеллектуальная обработка 3D изображений: сегментация

Гипертрейс-преобразование является эффективным методом сегментации объектов на 3D изображении и определения числа объектов. Обычно решение задач сегментации и нахождения числа объектов требует привлечения структурных методов распознавания. Автор успешно применил интегральный метод гипертриплетных признаков и гипер-трейс-преобразование для решения подобных задач при создании системы автоматического распознавания 3D изображения [14].

Итак, количество пространственных объектов на 3D изображении:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Col {F)= Hyper& ° HyperO. ° HyperP ° HyperT (© ° P ° T) , где Т = minf(e,p, t), Р = rows g (в, p) , © = rows g (в) ,

HyperT = G(а,ф, r) ,

HyperP = 1 + rows

r

HyperO. = max G (а,ф) ,

SegmentZero G(а,ф,r)

r ,G(m4,r )=0

Hyper® = max G (

ф

где

rows (f (X)) - количество элементов вектора f (X)

, функция SegmentZero разделяет каждую глубинную строку гипертрейс-матрицы на множество отрезков, каждый из которых содержит только подряд идущие друг за другом нулевые элементы.

Немного изменив структуру данного гипертри-плетного признака можно определить номер (i, j, k) элемента гипертрейс-матрицы и по нему сферические координаты плоскости, которая проходит между пространственными объектами и разделяет одно тело от другого. Так, это можно сделать при помощи функционала

HyperP = arg half I SegmentZero G (<,ф, r) ,

r ^ r,G(^,r )=0 J

где arg half f (x) находит аргумент средней точки

r

отрезка в векторе f (x) , которая благодаря функции SegmentZero G(<,ф,r) содержит только отрезки

подряд идущих нулевых элементов, находящихся между ненулевыми элементами в глубинных строках матрицы 3ТМ. Левая граница такого отрезка определяется как G (ш,ф, rk 0 Л G(ш,ф, ^+i) = 0 для Vrk

, а правая - как G (<Я,ф, \ ) = 0 Л G (<ф, ^k+l)^ 0 для

Vrk • Проходя последовательно все данные отрезки,

можно осуществить сегментацию пространственных объектов в 3D сцене.

Таким образом, количество пространственных объектов на 3D изображении можно определить как максимальное число среди всех пар углов обзора трёхмерной сцены для множества увеличенных на единицу чисел, определяющих минимальное количество параллельных плоскостей, которых достаточно для размещения между пространственными телами под конкретным углом обзора, чтобы разделить их друг от друга.

Интеллектуальная обработка 3D изображений: нелинейная фильтрация

Применяя определённые виды функционалов для обработки строк и столбцов трехмерной гипер-трейс-матрицы, можно осуществлять сглаживание, устранять помехи и шумы, внесенные регистрирующим устройством, а также осуществлять нелинейное сглаживание углов изображения, ставя определённый порог на отсечение крайних значений.

Пример нелинейной фильтрации изображен на рисунке 2.

Рисунок 2 - Исходный (слева) и сглаженный (справа) 3D изображение насекомого

Заключение

Автор планируют развить данный метод для анализа не только бинарных и монохромных 3D изображений, но и цветных и текстурных 3D изображений. Аналогичные результаты уже были получены при анализе цветных и текстурных 2D изображений в [15] . Интеллектуальные уровень гипертрейс-пре-образования может быть повышен благодаря развитию теории трейс-преобразования для интеллектуального анализа и распознавания деформированных

и повреждённых 3D объектов, а также для распознавания двигающих изображений, когда одна часть изображения изменяет своё положение по отношению к другой части. Последнюю задачу не способен решить ни один из известных на сегодняшний момент методов.

Работа выполнена при поддержке гранта РФФИ (проект №15-07-04484).

ЛИТЕРАТУРА

1. Marchanta, A.P. Ensemble representations: Effects of set size and item heterogeneity on average size perception / A.P. Marchanta, D.J. Simonsb, J.W. de Fockert // Acta Psychologica. -2013. - V. 142, № 2. - P. 245-250.

2. Szeliski, R. Computer vision: algorithms and applications (texts in computer science) [Text] / R. Szeliski. - second edition. - London : Springer, 2011. - 832 P.

3. Полтавский, А.В. Основы распознавания образов в текстовой информации / А.В. Полтавский, Е.Ю. Русяева, А.А. Бурба // Надежность и качество сложных систем. - 2016 - №3 (15). - С. 24-38.

4. Садыков, С.С. Распознавание отдельных тестовых и реальных плоских объектов на основе безразмерных признаков выпуклых оболочек их бинарных изображений методом дискриминантного анализа Фишера / С.С. Садыков, Я.Ю. Кульков // Надежность и качество: труды Международного симпозиума, под ред. Н.К. Юркова. - Пенза, Изд-во ПГУ. - 2016. - Т. 1. - С. 137-140.

5. Wang, C. VFM: visual feedback model for robust object recognition / C. Wang, K.-Q. Huang // Journal of Computer Science and Technology. - 2015. - Vol. 30, Issue 2. - P. 325-339. - DOI: 10.1007/s11390-015-1526-1.

6. Fedotov, N.G. New Methods of Three-Dimensional Images Recognition Based on Stochastic Geometry and Functional Analysis / N.G. Fedotov, A.V. Moiseev, A.A. Syemov, V.G. Lizunkov, A.Y. Kindaev // IOP Conference Series: Materials Science and Engineering. - Bristol, 2017. - Vol. 177 : Mechanical Engineering, Automation and Control Systems (MEACS 2016) : International Conference, October 2729, 2016, Tomsk, Russia : [proceedings]. - [012047, 5 p.]. - DOI: 10.1088/1757-899X/177/1/012047.

7. Сёмов, А.А. Различные виды пространственного сканирования 3D изображений [Текст] / А.А. Сёмов // Надежность и качество: труды Международного симпозиума. - 2015. - Т. 2. - Пенза: ПГУ. - С. 150153.

8. Федотов, Н.Г. Анализ условий, влияющих на свойства конструируемых признаков 3D-изображений / Н.Г. Федотов, А.А. Сёмов, А.В. Моисеев // Компьютерная оптика. - 2016. - Т. 40, № 6. - С. 887-894. - DOI: 10.18287/2412-6179-2016-40-6-887-894

9. Fedotov, N.G. Trace transform of three-dimensional objects: recognition, analysis and database search [Text] / N.G. Fedotov, S.V. Ryndina, А.А. Semov // Pattern Recognition and Image Analysis. Advances in Mathematical Theory and Applications. - 2014. - Vol. 24. - No. 4. - Moscow: Pleiades Publishing, Ltd. - P. 566-574.

10. Fedotov, N.G. The Theory of Image-Recognition Features Based on Stochastic Geometry [Text] / N.G. Fedotov // Pattern Recognition and Image Analysis. Advances in Mathematical Theory and Applications. - 1998. - V. 8. - № 2. - Moscow: Pleiades Publishing, Ltd. - P. 264-266.

11. Федотов, Н.Г. Вопросы построения алгоритмов сокращения признакового пространства на основе селекции информативных признаков / Н.Г. Федотов, А.А. Сёмов, А.В. Моисеев // Надежность и качество: труды Международного симпозиума, под ред. Н.К. Юркова. - Пенза, Изд-во ПГУ. - 2016. - Т. 1. - С. 299-301.

12. Федотов, Н.Г. Теория признаков распознавания обра-зов на основе стохастической геометрии и функцио-нального анализа / Н.Г. Федотов. - М.: Физматлит, 2010. - 304 С. - ISBN: 97 8-5-9221-0 9 9 63

13. Федотов, Н.Г. Интеллектуальные возможности гипертрейс-преобразования: конструирование признаков с заданными свойствами [Текст] / Н.Г. Федотов, А.А. Семов, А.В. Моисеев // Машинное обучение и анализ данных. - 2014. - T. 1. - №9. - Электронный журнал. - Издательство: Вычислительный центр им. А.А. Дородницына РАН (Москва). - C. 1200 - 1214.

14. Свидетельство об официальной регистрации программ для ЭВМ № 2015612257 Роспатента от 16.02.15. Программный комплекс анализа и распознавания 3D изображений на основе пространственного трейс-преобразования со случайными параметрами сканирования / Н. Г. Федотов, А. А. Сёмов.

15. Fedotov, N.G. Recognition of images with complex half-tone texture / N.G. Fedotov, D.A. Mokshanina [Text] // Measurement Techniques. - 2011. - Vol. 53. - № 11. - P. 1226-1232

УДК 004.89: 004.93

Федотов1 Н.Г., Сёмов2 А.А., Моисеев3 А.В.

гФГБОУ ВО «Пензенский государственный университет», Пенза, Россия 2ООО «Комхэлф», Пенза, Россия

3ФГБОУ ВО «Пензенский государственный технологический университет», Пенза, Россия

ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ 3D ИЗОБРАЖЕНИЙ: ПОСТАНОВКА ПРОБЛЕМЫ, ОПИСАНИЕ ПОДХОДА И НОВЫЕ ИДЕИ

В статье представлен общий обзор проблемы распознавания изображений. Рассматриваются практические задачи, для решения которых необходимо применение методов интеллектуального анализа и распознавания 3D образов. Представлено краткое описание гипертрейс-преобразования, описана его математическая модель. Впервые для анализа и распознавания 3D изображений предложен подход на основе стохастической геометрии и функционального анализа. Благодаря построению признаков, инвариантных к группе движений и масштабированию разработанный на его основе метод позволяет повысить надежность и универсальность распознавания. Проанализированы интеллектуальные возможности гипертрейс-преобразования. Предложен новый подход для развития идей интеллектуального анализа 3D изображения. Приведены конкретные примеры Ключевые слова:

3D изображение, гипертрейс-преобразование, инвариантное распознавание, интеллектуальный анализ, стохастическая геометрия

Введение

Важную часть в области искусственного интеллекта занимает автоматическое планирование или принятие решений в системах, которые могут выполнять механические действия, такие как перемещение робота через некоторую среду. Этот тип обработки обычно нуждается во входных данных, предоставляемых системами компьютерного зрения, действующими как видеосенсор и предоставляющими высокоуровневую информацию о среде и роботе. Другие области, которые иногда описываются как принадлежащие к искусственному интеллекту и которые используются относительно компьютерного зрения, - это распознавание образов и обучающие методы. В результате, компьютерное зрение иногда рассматривается как часть области искусственного интеллекта или области компьютерных наук вообще [1, 2].

Одной из важных проблем распознавания образов является разработка универсального метода, который позволял бы машинной системе за время, сравнимое со временем решения аналогичной задачи человеком, проанализировать, распознать и сделать интерпретацию изображений с различными характеристиками (освещение, цвет, текстура, контур и тому подобное) [3, 4].

Следует заметить, что существует много научных школ, работающих над решением проблем распознавания образов. Однако единого подхода к оценке качества распознавания до сих пор нет [5]. Таким образом, на сегодняшний момент нет единого универсального подхода к распознаванию образов для 2D изображений, не говоря уже о 3D изображениях.

Неправильное распознавание и понимание машиной изображения в основном возникает из-за относительно низкого интеллектуального уровня машинного зрения. Интеллектуальные возможности машины отличаются от человеческих способностей тем, что машина неспособна мыслить «свободно» и отойти от заложенного алгоритма [6]. Значение проблем распознавания образов тесно связано с более фундаментальными вопросами развития идей кибернетики: «Что принципиально может и не может делать машина? В какой степени способности машины могут быть приближены к возможностям человеческого мозга?».

В связи с этим возникает вопрос: «Может ли машина развить в себе способность производить действия в зависимости от ситуаций, понимая контекст решаемой задачи, аналогично возможностям человека?». Если компьютерные модели будут пытаться имитировать процесс обработки мозгом визуальной информации, то будут ли искусственные имитаторы мозга обмануты зрительной иллюзией, которой может быть обманут человек? Решение данной проблемы невозможно без развития методов интеллектуального и когнитивного анализа данных машиной [7].

Анализ и распознавание 3D изображений: общий обзор

Распознавание образов - это процесс отнесения конкретного объекта, представленного значениями его свойств (признаков), к одной из фиксированного перечня категорий (классов) по определённому решающему правилу в соответствии с поставленной целью. Другими словами, суть задачи распознавания состоит в том, чтобы установить, обладают ли изучаемые объекты фиксированным конечным набором признаков, позволяющим отнести их к определенному классу.

С математической точки зрения постановка задачи распознавания заключается в следующем. Пусть имеется множество Х объектов x, относительно которых нужно произвести классификацию. Объекты задаются значениями некоторых признаков fir i = 1, ..., n, наборы которых одинаковы для всех объектов. Таким образом, описание Info каждого объекта будет иметь вид Info(x) = (f1(x), f2(x), ..., fn (x)).

Множество Х допускает разбиение на подмноже-

т

ства Ki, ..., Кп, называемые классами: Х= U К..

7=1

Данное разбиение осуществляется на основе некоторой априорной информации. По какому-либо алгоритму формируется описание классов Info(Kj), j = 1, ., m, например, как усреднённая характеристика признаков объектов внутри соответствующего класса.

Задача распознавания состоит в том, чтобы для каждого объекта x, о котором неизвестно к какому из классов Ki, ..., Kn он принадлежит, по известной информации Info(K) и Info(X) установить значение

предиката P = ^X е Kj^ .

Ниже перечислены основные типовые задачи распознавания образов:

Задача идентификации.

Заключается в том, чтобы выделить конкретный объект среди ему подобных (например, узнать среди других лиц определённое лицо). Два объекта, отличающиеся друг от друга только масштабом, могут считаться как одинаковыми, так и разными, в зависимости от поставленной задачи.

Возникает, например, в поисковых системах, когда по запросу пользователя нужно найти то или иное изображение.

Задача отнесения объекта к тому или иному классу (классификация с учителем).

Заключается в том, чтобы классифицировать объекты по классам, при этом однородные и похожие объекты должны быть отнесены к одной и той же категории. Применяется тогда, когда имеется достаточно много данных для классификации изображений (обучающая выборка), например, собранных на основе опыта прошлых лет. Процедура обучения состоит в многократном предъявлении машинной системе различных объектов с указанием их классов на основе заданной меры сходства между ними. Качество обучения определяется путем тестирования

i Надоели баннеры? Вы всегда можете отключить рекламу.