Научная статья на тему 'Методы и алгоритмы контурного анализа для задач классификации сложноструктурируемых изображений'

Методы и алгоритмы контурного анализа для задач классификации сложноструктурируемых изображений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1008
245
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЕГМЕНТ ИЗОБРАЖЕНИЯ / КОНТУР / ДЕСКРИПТОРЫ ФУРЬЕ / МОРФОЛОГИЧЕСКИЕ ОПЕРАТОРЫ / ИНФОРМАТИВНЫЕ ПРИЗНАКИ / SEGMENT OF THE SCENE / SIDEBAR / DESCRIPTORS FURIE / MORPHOLOGICAL OPERATORS / INFORMANION SIGNS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Дюдин М.В., Поваляев А.Д., Подвальный Е.С., Томакова Р.А.

В работе предлагаются методы и алгоритмы формирования пространства информативных признаков, предназначенного для формального описания геометрических свойств границы сегмента сложно структурируемого изображения. В качестве математического аппарата для построения модели границы сегмента используется Фурье - анализ. Для препарирования данных, характеризующих границу сегмента, используется теория морфологического анализа. Формируемое пространство информативных признаков предназначено для нейросетевых классификаторов сложно структурируемых изображений и их сегментов. Алгоритмы контурного анализа реализованы в среде MATLAB 7.10

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Дюдин М.В., Поваляев А.Д., Подвальный Е.С., Томакова Р.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHODS And ALGORITHMS of the CONTOUR ANALYSIS FOR PROBLEMS of the CATEGORIZATIONS COMPLEX - STRUcTURED IMAGES

In work are offered methods and algorithms of the shaping space information sign, intended for formal description geometric characteristic borders of the segment complex structured images. As mathematical device for building of the models of the border of the segment is used Furie an analysis. For transformation data, characterizing border of the segment, is used theory of the morphological analysis. The Formed space information sign is intended for neuron nets qualifier complex structured images and their segment. The Algorithms of the contour analysis marketed in ambience MATLAB 7.10

Текст научной работы на тему «Методы и алгоритмы контурного анализа для задач классификации сложноструктурируемых изображений»

УДК 681.5.01

МЕТОДЫ И АЛГОРИТМЫ КОНТУРНОГО АНАЛИЗА ДЛЯ ЗАДАЧ КЛАССИФИКАЦИИ СЛОЖНОСТРУКТУРИРУЕМЫХ ИЗОБРАЖЕНИЙ

М.В. Дюдин, А.Д. Поваляев, Е.С. Подвальный, Р.А. Томакова

В работе предлагаются методы и алгоритмы формирования пространства информативных признаков, предназначенного для формального описания геометрических свойств границы сегмента сложно структурируемого изображения. В качестве математического аппарата для построения модели границы сегмента используется Фурье - анализ. Для препарирования данных, характеризующих границу сегмента, используется теория морфологического анализа. Формируемое пространство информативных признаков предназначено для нейросетевых классификаторов сложно структурируемых изображений и их сегментов. Алгоритмы контурного анализа реализованы в среде МАТЬАБ 7.10

Ключевые слова: сегмент изображения, контур,

ные признаки

Введение

Информация о множестве процессах и явлениях в науке и технике представляется в виде изображений. В виде изображений могут быть представлены как «сырые» данные, так и данные, прошедшие полную или предварительную обработку. После представления данных в виде изображения встает вопрос об идентификации или классификации полученного образа. При этом возникает ряд сложных научных, технических и технологических проблем .

Для успешной классификации изображений необходима априорная информация о его структуре или сегментах. Наиболее полную информацию об этом несут «контуры» или «края» изображения, соответствующие пикселям изображения, в которых наблюдается скачкообразное изменение их атрибутов. Однако многие факторы, влияющие на процесс формирования изображения (угол наблюдения, освещенность, переход от 3Б-сцен к 2Б-изображениям и т.п.), снижают ценность априорной информации. Это приводит к неоднозначности процедуры сегментации. В итоге изображения имеют альтернативные структуры, решение по выбору одной из которых не может быть принято однозначно. Определим этот класс изображений как сложноструктури-руемые. Следовательно, если изображение является сложноструктурируемым, то это ведет к значительному снижению качества его класси-

Дюдин Михаил Валерьевич - ЮЗГУ, аспирант, e-mail: dudin@ramec.ru

Поваляев Анатолий Дмитриевич - ВГТУ, канд. техн. наук, профессор, тел. (473) 246-12-07

Подвальный Евгений Семенович - ВГТУ, д-р техн. наук, профессор, тел. (473) 243-77-18

Томакова Римма Александровна - ЮЗГУ, д-р техн. наук, профессор, тел. 8 9202673933

шпторы Фурье, морфологические операторы, информатив-

фикации или классификации его сегментов посредством обучаемых классификаторов.

В настоящее время для классификации успешно применяются алгоритмы, такие как Bagging и Boosting, основанные на использовании коллективов базовых классификаторов с последующим использованием метаклассифи-каторов, осуществляющих интеграцию (объединение) решений, принятых на нижнем иерархическом уровне. Использование этих алгоритмов предполагает наличие больших объемов выборок, позволяющих осуществить настройку множества классификаторов. Однако существует достаточно большой класс сложно-структурируемых изображений, для которых обеспечить необходимый объем обучающей выборки принципиально невозможно. Это, в частности, относится к медицинским изображениям, примером одного из которых является флюорограмма грудной клетки. В этом случае на нижнем иерархическом уровне целесообразно использовать базовые классификаторы, реализующие методы и алгоритмы, основанные на различных парадигмах, а в качестве метаклас-сификатора использовать гибридные модели классификации, которые применяют как методы обучаемых классифицирующих систем, так и методы экспертного оценивания. Метаклас-сификатор, выполненный в виде гибридной модели, позволяет учитывать различные характеристики изображения: цвето-яркостные характеристики сегмента, геометрические характеристики его границ, масштаб и текстуру.

Для учета в классифицирующей модели геометрических характеристик границы сегмента используется теория контурного анализа [1]. Для принятия решений на основе контурного анализа наиболее часто используются дескрипторы, определяемые посредством вычисления автокорреляционной или взаимокорреляционной функций контура. По результатам

корреляционного анализа вычисляется мера близости текущего контура до эталонного контура. При анализе сложноструктурируемых изображений получение эталонного сегмента не представляется возможным. Кроме того, использование корреляционного анализа предполагает равенство отсчетов в сравниваемых контурах, что также невыполнимо при анализе сложноструктурируемых изображений. Поэтому развитие теории контурного анализа для интеллектуальных систем классификации сегментов сложноструктурируемого изображения является актуальной задачей.

1. Метод морфологической обработки бинарных изображений

В результате сегментации сложнострукту-рируемые изображения представляются в виде граничных кривых, которые имеют разнообразные формы. Граничные кривые рассматриваются как растровые бинарные или полутоновые изображения. Для описания формы этих кривых использован математический аппарат, посредством которого кривая любого типа преобразуется к формализованному виду, позволяющему представить ее множеством коэффициентов Фурье.

С этой целью разработан метод морфологического описания граничной кривой, основанный на теоретико-множественном подходе и отличающийся тем, что множество точек, описывающих границу сегмента, представляется в виде двух непересекающихся подмножеств. Границы этих двух подмножеств определяются границами исходного множества декартовых координат граничной кривой. Метод позволяет представить произвольную кривую, в том числе и незамкнутую, в виде двумерной числовой последовательности, описывающей координаты замкнутой кривой.

Пусть дискретная функция F(x,y) представлена в памяти компьютера в виде последовательности пар чисел, соответствующих координатам пикселей границы сегмента

(xk,yk ), к е к,. (1)

Полагаем, что множество {(xk,yk)} этих пар является объединением двух непересекающихся подмножеств Pi и Q,, таких, что

{(Хк,Ук)}i = P U Qi, (2)

где множество

Pi = {(xg,yg)}„ "g е G,

[G е К,, inf (g) = arg x (g) = 1, sup(g) = arg xN(g) = N],

(3)

в котором пары чисел упорядочены по возрастанию xg , а множество

Qr = {(x„y, )}i, "L е L, (4)

[L е К,, inf (L) = argxN(L) = N, sup(L) = argx^L) = 2N - 2] , в котором пары чисел упорядочены по убыванию xl , при этом в паре

{(xg,yg)}, е P и {( xN+(N -g ) ,yN+(N -g ) )}, е Qi

yN+(N-g) - yg , (5)

а в паре

{((xLy )}i е Pi и {(xN+(N-L) ,yN+( N -L) )}, е Qi

xi - xN+(N-L) . (6)

Граничные кривые не являются замкнутыми для всех возможных топологий сегментов, поэтому не удовлетворяют условиям (6) и (7). Замкнутую граничную кривую будем называть контуром. Для замыкания граничных кривых разработан метод, основанный на морфологической обработке бинарных изображений, позволяющий описать граничную кривую, в том числе и принадлежащую к классам самопересекающихся и древовидных (рис.1,а), контуром формализованной структуры, описываемой

множествами Pi и Qi, удовлетворяющими

условиям (2-6), который назовем «контуром минимальной толщины» (рис. 1,6).

а) б)

Рис. 1. Преобразование древовидной граничной кривой в «контур минимальной толщины»: а - исходная кривая (I - ветвление); б -«контур минимальной толщины», соответствующий кривой а

Метод позволяет трансформировать исходную границу сегмента в «контур минимальной толщины», используя пять последовательно выполняемых морфологических операций [2] над растровым изображением границы сегмента (сегментом): imfill (заполнение отверстий на исходном бинарном изображении); skel (строит остов изображения); dilate (совершает дилатацию с использованием структурообразующего элемента 3х3); bwperim (выделяет границы бинарных объектов); shrink (сжимает объекты без внутренних дыр в точки, а с дырами - в кольца).

Первый и последний операторы применяются для устранения артефактов, связанных с наличием изолированных пикселей на границе контура и возможностью неоднозначного обхода контура. Назначение остальных морфологических операторов иллюстрирует рис. 2.

Рис. 2. Трансформация тестового изображения граничной кривой в процессе осуществления цепочки морфологических преобразований: а -исходная граничная кривая; б - исходная граничная кривая осуществления морфологических операций imfill — skel; в - исходная граничная кривая после осуществления морфологических операций imfill — skel— dilate; г - исходная граничная кривая после осуществления морфологических операций imfill — skel— dilate—> bwperim

Таким образом, метод морфологической обработки кривой сложной формы, позволяет получить из кривой, описывающей границу сегмента изображения, замкнутую кривую контур, обладающую свойством «контура минимальной толщины». Это свойство описывается двумя следующими уравнениями

|x(y(L + N)) - x(y(L - N))| < 2. (7)

|y(x(L + N)) - y(x(L - N))| < 2. (8) Так как кривая, описываемая множествами Pi и Qi, замкнутая, следовательно, она является периодической, и для ее описания в пространстве информативных признаков может

быть использовано дискретное преобразование Фурье.

2. Методы спектрального контурного анализа

В качестве отсчетов используем отсчеты, полученные на дискретной сетке с равномерным шагом по оси абсцисс, вычисленным как Д = (х„ -х,)/N, (9)

где (2№2) - число отсчетов, описываемых границы контура, причем для растрового изображения число элементов в множествах Р1 и

одинаково (равно К) и их индексация соответствует условию

Хк = XN+(N - к), "(х,, у,) 6 р, _

"(XN+(N-к), УN+(N-к) ) 6 й

Объединение множеств р и й рассматриваем как массив упорядоченных комплексных чисел

{ &{ = х( + ]у(\ £ = 1,2,...,2 N - 2; (11)

для анализа, которого применяем спектральное преобразование Фурье.

После представления границы «контура минимальной толщины» множеством (10), получаем дискретное преобразование Фурье конечной последовательности z(к) :

—21с-3 те-]2Шк/(2 N-2) (12)

¿1 (и) = -

^ -2 к=0

для и = 0,1,2,...,2 N - 3.

При использовании только М первых пар коэффициентов Фурье результатом восстановления является следующее приближение

¿(к ):

¿(к) = М^а(и /(2 ^2) (13)

и=0

для к = 0,1,2,. ..,2N - 3.

Несмотря на то, что при вычислении каждой спектральной составляющей (13) используется только М отсчетов, параметр к в (13) по-прежнему лежит в диапазоне от 0 до 2К-3. Следовательно, в восстановленной границе число пикселей не изменится, но для восстановления их координат используется меньшее число отсчетов.

Таким образом, описание границ сегментов посредством дескрипторов Фурье позволяет сократить размерность пространства информативных признаков, при этом процесс восстановления границы должен гарантировать инвариантность относительно сдвига и поворота. Инвариантность дескрипторов Фурье относительно масштаба не предусматривается, так как при решении задач

классификации в медицинских приложениях масштаб контура являться информативным источником.

3. Оптимальный выбор дескрипторов Фурье при анализе границ сегментов слож-ноструктурируемых изображений

Для адекватной работы классификатора необходимо, чтобы диапазон пространственных частот, соответствующий дескриптору Фурье с определенным номером, не зависел от числа отсчетов в контуре, спектр которого вычисляется. Для обеспечения этого требования был разработан метод формирования пространства информативных признаков, позволяющий получить адекватную классификационную модель, независимо от числа отсчетов в анализируемых контурах, заключающийся в дополнении числа спектральных отсчетов до максимального в выборке путем добавления нулевых отсчетов слева и справа от граничных частот и увеличении амплитуды спектральных составляющих на величину, прямо пропорциональную величине расширения спектра, с последующим отсечением дескрипторов Фурье до числа, оптимальное значение которого определяется путем минимизации ошибки, вычисляемой как разность между площадью восстановленного контура и площадью исходного контура минимальной толщины.

На первом этапе реализации метода задаем общее число отсчетов в контурах, которое должно быть одинаковым для всех контуров контрольных и обучающих выборок. Это число определяется по результатам статистических исследований изображений исследуемых классов. Для сравнения дискретных отсчетов частот, соответствующих разным объектам на изображении, необходимо, чтобы объекты имели в граничных кривых одинаковое количество отсчетов (априорно полагается, что частота дискретизации кривых равна одному пикселю). Следовательно, любая выборка анализируемых контуров должна содержать контуры с одинаковым числом отсчетов, то есть с одинаковым числом пикселей. Для выравнивания числа пикселей в выборке выбираем способ, заключающийся в том, что для каждого контура в выборке доводим число пикселей до числа пикселей в контуре максимальной длины.

Способ реализуем в пространстве частот. С этой целью дополняем высокочастотную часть спектральной полосы каждой границы сегмента (контура) нулями таким образом, чтобы число отсчетов в спектре каждого контура (границы сегмента) было равно максимальной по выборке. В этом случае в пространстве сиг-

налов появятся виртуальные отсчеты между реальными отсчетами. Таким образом, первый этап реализует следующую цепочку преобразо-

ваний: Кт

>спектр контура^дополнение ну-

лями спектральных отсчетов до Ктах.

В результате выполнения первого этапа в исходном пространстве появятся дополнительные (ненулевые) отсчеты. Поэтому на втором этапе необходимо все спектральные составляющие в спектре 1-го контура умножить на величину Ктах/К , что позволит привести модифицированное изображение и его спектральный образ в соответствие равенству Парсеваля.

Третий этап - сокращения числа дескрипторов до оптимального. Оптимизируем число дескрипторов путем сравнения результатов обратного преобразования Фурье с исходным контуром.

Для вычисления границ сегмента по его дескрипторам используем уравнение (13). На рис.3 представлен пример такого восстановления. На рис.3, а показан исходный контур. На рис.3, б показан контур, восстановленный по пяти дескрипторам, а на рис.3, в - по 99 дескрипторам. Восстановленные контуры на последних двух рисунках прочерчены более толстыми линиями, чем исходный контур. Это объясняются тем, что в виду дополнения нулями и доведения числа отсчетов в контуре до максимального в выборке каждой точке контура на рис. 3, а соответствует множество точек, расположенных на рис. 3,б и в.

Рис. 3. Третий этап: сравнение исходного контура с контуром, полученным после обратного преобразования Фурье модифицированного спектра контура

в)

Продолжение рис. 3.

На рис. 4 показан интерфейс программного обеспечения, позволяющего получить дескрипторы Фурье произвольного контура, в том числе и контура минимальной толщины. Спектр Фурье контура представлен в виде графика, изображенного в нижней части интерфейсного окна. В верхнем левом углу интерфейсного окна представлено изображение контура, дескрипторы которого представлены в окне. Программный модуль Фурье-анализа контуров разработана в среде МЛТЬЛВ 7.10.

Рис.4. Интерфейсное окно программного обеспечения для получения дескрипторов Фурье границ сегментов

Чтобы оценить информационные потери при приравнивании к нулю части дескрипторов, предложен критерий восстановления контура, основанный на определении площади Б:

1 К-1

Я = 1 и У (к (£0) - У(к * (X* ,Г)) ® тт ,(14)

К к=0

где К - число отсчетов в контурах выборки, £ и - координаты параметра к* (восстановленного контура), находящегося на минимальном расстоянии от к (исходного контура), причем для растровых изображений к= к*.

Для «контура минимальной толщины»

к* =1ш(К/2)+к (15)

и при отсутствии ошибки площадь Б ~ 1. Если уравнение (14) применить к исходному контуру, то близость его правой части к единице станет условием того, что контур является «контуром минимальной толщины».

Для определения левой части (14) использовались известные приемы, например, критерий информационной осыпи Кэттеля.

Используя разработанные методы и алгоритмы спектрального анализа граничных кривых, получаем адекватное описание кривой произвольного типа конечной, априорно определенной длины последовательностью дескрипторов Фурье.

Заключение

В результате проведенных исследований введено понятие «контур минимальной толщины», позволяющее построить математический аппарат и алгоритмы для преобразования сложной незамкнутой кривой в эквивалентную, замкнутую.

Разработан метод математического описания «контуров минимальной толщины», основанный на Фурье-анализе периодических кривых. Предварительно, для получения периодической кривой, множество пикселей границы сегмента дополняется до двух непересекающихся подмножеств, границы которых устанавливаются по нижней и верхней границам исходного множества (исходной кривой). Отличительная особенность метода заключается в последовательной реализации четырех морфологических операторов, которые в совокупности позволяют получить «контур минимальной толщины», являющийся периодической кривой. Метод позволяет представить любую кривую, в том числе и незамкнутую, в виде «контура минимальной толщины».

Предложена модель представления контура в виде двумерной числовой последовательности дескрипторов Фурье, вычисленных в декартовой системе координат, отличающаяся оптимизацией верхней и нижней границ числа дескрипторов Фурье, включаемых в представление.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Исследовано влияние формы и ориентации фигур на параметры дескрипторов Фурье в моделях контуров границ сегментов плохостукту-риремых изображений. Рассмотрен способ графического представления дескрипторов Фурье средствами компьютерной графики. Способ позволяет реализовать интерактивный режим оптимизации пространства информативных признаков для описания контуров сегментов плохоструктурируемых изображений для ин-

теллектуальных систем классификации изображений [3,4,5].

В типовых медицинских изображениях предложенная модель «контура минимальной толщины» содержит от 500 до 3000 пикселей, что является избыточным при использовании нейросетевых классификаторов. Поэтому для нейронных сетей предложен метод формирования пространства информативных признаков. Метод позволяет получить адекватную модель классификатора независимо от числа отсчетов в анализируемых контурах и независимо от того, описывается ли граница контура периодической кривой или древовидной кривой. Сущность метода состоит в том, что дескрипторы Фурье контура, соответствующие отрицательным и

положительным частотам, дополняются до наперед заданного максимального количества путем добавлением нулевых отсчетов. Для того, чтобы исключить амплитудные искажения, связанные с изменением количества частот в спектре, амплитуды спектральных составляющих увеличивается на величину, прямо пропорциональную величине

расширения спектра. На втором этапе реализации этого метода число дескрипторов Фурье снижается до оптимального путем минимизации ошибки, определяемой как разность между площадью восстановленного контура и исходного контура или «контура минимальной толщины», если

классифицируется непериодическая кривая.

Литература

1. Введение в контурный анализ; приложения к обработке изображений и сигналов/ Я.А.Фурман и др. — М.: ФИЗМАТЛИТ, 2003. — 592 с.

2. Гонсалес Р, Вудс Р, Эддинс С. Цифровая обработка изображений в среде МаЙаЬ. —М.: Техносфера, 2006. -616 с.

3. Подвальный Е.С. Модели индивидуального прогнозирования и классификации состояний в системах компьютерного мониторинга. - Воронеж: изд. ВПИ, 1998,-127с.

4. Подвальный, С.Л. Интеллектуальные системы моделирования: принципы разработки [Текст] / С.Л. Подвальный, Т.М. Леденева //Системы управления и информационные технологии. - 2013. - №1(51). - С.4-10.

5. Методы многомерной классификации в задачах медицинской диагностики / Подвальный С.Л., Матасов А.С., Бырко И.А.// Машиностроитель.- 2002. - №8. - С.59.

Воронежский государственный технический университет Юго-Западный государственный университет (г. Курск)

METHODS AND ALGORITHMS OF THE CONTOUR ANALYSIS FOR PROBLEMS OF THE CATEGORIZATIONS COMPLEX - STRUCTURED IMAGES

M.V. Dudin, A.D. Povalyaev, E.S. Podvalny, R.A.Tomakova

In work are offered methods and algorithms of the shaping space information sign, intended for formal description geometric characteristic borders of the segment complex - structured images. As mathematical device for building of the models of the border of the segment is used Furie - an analysis. For transformation data, characterizing border of the segment, is used theory of the morphological analysis. The Formed space information sign is intended for neuron nets qualifier complex - structured images and their segment. The Algorithms of the contour analysis marketed in ambience MATLAB 7.10

Key words: segment of the scene, sidebar, descriptors Furie, morphological operators, informanion signs

i Надоели баннеры? Вы всегда можете отключить рекламу.