Научная статья на тему 'Анализ пригодности методов сегментации для локализации объектов на основе цветовых и структурных признаков'

Анализ пригодности методов сегментации для локализации объектов на основе цветовых и структурных признаков Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
559
134
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АНАЛИЗ ИЗОБРАЖЕНИЙ / СЕГМЕНТАЦИЯ / ПОРОГОВАЯ ОБРАБОТКА / АЛГОРИТМ КРАСКАЛА / КАСКАДЫ ХААРА / THE KRUSKAL''S ALGORITHM / HAAR''S CASCADES / IMAGE ANALYSIS / SEGMENTATION / THRESHOLD PROCESSING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Зотин Александр Геннадьевич, Носов Александр Владимирович, Бузаев Дмитрий Васильевич

Рассмотрены существующие методы сегментации по цветовым и структурным признакам. Приведено описание алгоритмов функционирования наиболее широко известных методов сегментации на основе пороговой обработки, графов и каскадов. Представлены результаты анализа пригодности методов сегментации для локализации объектов на примере растений, лиц и кистей рук людей.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Зотин Александр Геннадьевич, Носов Александр Владимирович, Бузаев Дмитрий Васильевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ANALYSIS OF SUITABILITY OF SEGMENTATION METHODS BASED ON COLOR AND STRUCTURAL FEATURES FOR LOCALIZATION OF OBJECTS

The existing methods of segmentation, according to color and structural features, are considered. The algorithms of the most widely known methods of segmentation based on thresholding, graphs, and cascades are described. Results of the analysis of segmentation methods suitability for objects localization are shown for the cases of plants, people's faces and areas of the hands.

Текст научной работы на тему «Анализ пригодности методов сегментации для локализации объектов на основе цветовых и структурных признаков»

V. G. Zhukov, M. N. Zhukova, N. A. Koromyslov

APPLICATION OF FUZZY ARTIFICIAL IMMUNE SYSTEMS IN THE TASK OF CONSTRUCTION OF ADAPTIVE SELF-LEARNING INFORMATION SECURITY SYSTEM

We consider the application of principles of immune system functioning in the task of construction of adaptive self-organizing security tools and application of fuzzy logic for its improvement.

Keywords: artificial immune systems, fuzzy logic, information security.

© Жуков В. Г., Жукова М. Н., Коромыслов Н. А., 2012

УДК 004.932

А. Г. Зотин, А. В. Носов, Д. В. Бузаев

АНАЛИЗ ПРИГОДНОСТИ МЕТОДОВ СЕГМЕНТАЦИИ ДЛЯ ЛОКАЛИЗАЦИИ ОБЪЕКТОВ НА ОСНОВЕ ЦВЕТОВЫХ И СТРУКТУРНЫХ ПРИЗНАКОВ

Рассмотрены существующие методы сегментации по цветовым и структурным признакам. Приведено описание алгоритмов функционирования наиболее широко известных методов сегментации на основе пороговой обработки, графов и каскадов. Представлены результаты анализа пригодности методов сегментации для локализации объектов на примере растений, лиц и кистей рук людей.

Ключевые слова: анализ изображений, сегментация, пороговая обработка, алгоритм Краскала, каскады Хаара.

Развитие компьютерной техники делает возможной сложную обработку видеоданных, приближенную к реальному времени. В обработке изображений при распознавании образов одной из самых важных задач является задача обнаружения и локализации объектов интереса, возникающих в таких сферах, как мониторинг, охрана, управление и т. д. Среди наиболее активно развивающихся направлений можно выделить распознавание лиц людей и их жестов, применяемое в сфере охраны и управления, мониторинг растений и природных ресурсов в сельском хозяйстве.

Существует множество методов сегментации [1]. К наиболее распространенным методам относятся модификации методов пороговой обработки, сегментация на основе теории графов и на основе классификаторов (каскадов). Рассмотрим их более подробно.

В большинстве случаев, когда объекты интереса имеют определенный цвет, для их локализации используется цветовая сегментация, суть которой заключается в выделении областей, имеющих цвет объекта интереса. Наиболее широко известны и легко реализуемы методы, основанные на пороговой обработке, результатом которых является матрица, размеры которой совпадают с размерами изображения [2].

Сегментацию по порогу можно проводить разными способами. Самым простым является сравнение каждого пикселя с некоторым значением (порогом):

, ч Г1, если I (x, y) > Threshold,

M (x,y I = <

[0, если I (x, y) < Threshold,

где I(x, y) - яркость изображения в точке (x, y); M -результирующая маска; Threshold - значение порога.

Другой способ заключается в поиске близких по цвету пикселей с эталонным значением. Для этого каждый пиксель изображения рассматривается в выбранных цветовых пространствах, после чего вычисляется расстояние между ним и эталоном и принимается решение о принадлежности пикселя объекту. Однако следует обратить внимание на то, что в зависимости от цветовой модели цвет объекта может иметь различные представления в различных цветовых пространствах. Качество сегментации зависит от того, в какой модели будет проводиться обработка изображений:

, ч Г1,если d(M(x,y),Etalon) > Threshold,

M (x, y I = <

[0, если d(M(x, y),Etalon) < Threshold,

где I(x, y) - значение изображения выбранного цветового пространства в точке (x, y); M - результирующая маска; d(X, Y) - функция, вычисляющая расстояние между векторами X и Y; Etalon - значение координат эталонного цвета в рассматриваемом цветовом пространстве; Threshold - значение порога.

Для оценки расстояния между эталонным и проверяемым цветом используют метрики. Метрика - это функция, определяющая расстояния в метрическом пространстве, т. е. во множестве, в котором определено расстояние между любой парой элементов. Наиболее популярными метриками являются:

- евклидова метрика - обычное расстояние между двумя точками:

d (X, Y ) = ^(X - Y| .(X - Y), где X и Y - сравниваемые векторы;

- метрика Махаланобиса:

d(X, Y) = yj(X - Y) • C--(X - Y),

где С - ковариационная матрица; X и Y - сравниваемые векторы;

- среднеквадратичная ошибка MSE (Mean Square Error):

d(X, Y) = N(X - Y)-(X -Y),

где N - число элементов массива; X и Y - сравниваемые векторы.

Анализ данных о работе пороговой сегментации растений и кожи людей в моделях HSV и RGB показал, что значения каналов V, R, G и B лежат практически во всем диапазоне. Поэтому для более качественной сегментации по цветовым признакам используется модификация пороговой сегментации - многокомпонентная сегментация, которая заключается в назначении приоритета на составляющие выбранных цветовых моделей. К примеру, если сегментация зеленых растений проводится в моделях RGB и HSV, то эффективные результаты будет давать сегментация в каналах H, S и G, поэтому им следует задавать более высокие приоритеты, а каналам V, R и B - более низкие. Назначать приоритеты можно по формуле

д £((■ • Mi)

Sk- *

где Л - результирующая маска; к - приоритет i-го канала; M, - маска, полученная в результате сегментации изображения в i-м канале.

В тех случаях когда цвет объекта интереса может быть произвольным, применяется сегментация на основе теории графов, основная идея которой заключается в поиске и маркировке однородных по цвету участков [3].

Одним из алгоритмов такой сегментации является алгоритм Краскала, основанный на построении минимального остовного дерева взвешенного связного неориентированного графа. В текущей постановке задачи вершины графа (v,) представляют собой пиксели, а ребра e(v, vj) - расстояние между ними. Нам известны расстояния между парами пикселей (v,, vj) - это вес ребер w(e(vi, vj)). Для реализации алгоритма Крас-кала необходимо выполнить следующие шаги.

Шаг 1. Выполняем сортировку имеющихся в графе ребер в порядке возрастания длины.

Шаг 2. Анализируем ребра в порядке возрастания длины и смотрим на концы e = (a, b).

2.1. Если вершины a и b принадлежат одному множеству (внутри их подграфа сумма ребер уже минимальна), то такое ребро пропускается, так как оно образует цикл в дереве.

2.2. Если вершины a и b принадлежат разным подмножествам, то их нужно объединять, так как мы нашли ребро минимальной длины, объединяющее оба подмножества в одно.

2.3. Продолжаем цикл объединения до получения одного единственного множества, равного искомому, в котором будут присутствовать все вершины графа.

Шаг 3. Получаем одно единственное множество вершин и список ребер, использованных для его объединения. Данное множество представляет собой дерево с минимальной суммарной длиной, которое объединяет все вершины.

Для реализации понятия «множество» в алгоритме Краскала используется структура данных, ориентированная на хранение компонент связности в графах, -Disjoint-Set Data Structure, которая поддерживает выполнение следующих операций:

- выяснение, к какому множеству в текущий момент принадлежит рассматриваемая вершина;

- объединение заданных множеств в одно.

Алгоритм Краскала не работает с изображением

напрямую, поэтому возникает необходимость в создании графа. Существуют два подхода для построения графа по изображению: с использованием 4-и 8-пиксельных связей (рис. 1). В первом случае каждый пиксель соединяется с соседними пикселями сверху, снизу, слева и справа. Такое построение хорошо тем, что количество ребер в графе минимально. Во втором случае в дополнение к предыдущему подходу каждый пиксель соединяется с пикселями, расположенными на диагонали. При такой реализации количество ребер в графе увеличится, в связи с чем алгоритм будет выполняться медленнее, но получаемый результат сегментации будет более качественным, так как в нем учитывается больше связей между пикселями.

а б

Рис. 1. Виды связей: а - 4-пиксельная; б - 8-пиксельная

В начале выполнения алгоритма Краскала каждый пиксель, представляющий собой вершину графа, будет находиться в собственном сегменте, но в дальнейшем пиксели, обладающие схожим цветом, т. е. пикселем одного объекта, постепенно будут объединяться в один сегмент. Например, если на каком-то шаге алгоритма попалось ребро, соединяющее два соседних пикселя, в котором на одном конце ребра пиксель оранжевый, а на другом - красный, то длину ребра в таком случае можно определить как разницу цвета между пикселями.

Далее необходимо выяснить, в одном ли сегменте лежат анализируемые пиксели. Если они находятся в разных сегментах, то выполняется проверка. В случае прохождения проверки пиксели объединяются в один сегмент и построение графа продолжается.

Выделение объекта происходит с помощью следующих действий:

- поиск сегмента некоторого пикселя х по предкам до самого верха. Самый верхний пиксель - это корень дерева, представитель данного сегмента на текущий момент;

- объединение сегментов. Если у пикселей разные представители, значит они принадлежат различным сегментам, иначе корень был бы один. Для объединения пикселей представитель сегмента меньшей высоты отсылается на более длинного представителя, чтобы не увеличивать высоту дерева. В результате будет получен объединенный сегмент с общим представителем;

- для того чтобы в следующий раз не удаляться далеко от пикселя к корню, после того как представитель будет успешно обнаружен, на него устанавливается прямая ссылка из пикселя. Это сокращает путь последующих поисков. Для этого в качестве длины ребра выбирается евклидово расстояние, зависящее как от положения пикселей (х, у), так и от их цвета (г, g, Ь). Теперь пиксели будут считаться соседями, если они расположены рядом либо имеют схожий оттенок, хотя физически могут находиться на некотором удалении.

Сегментация на основе классификаторов (каскадов) лежит в основе алгоритма Виолы-Джонса, который заключается в том, чтобы при прохождении каскада весь кадр обрабатывать целиком, в результате чего можно определить области, в которых существует вероятность обнаружения объекта, и усилить простые классификаторы (рис. 2) [4].

h( x, f, p, Є) =

і, если pf (x) < pe,

0, если иначе,

где / - признак; р - полярность, показывающая направление неравенства; 0 - пороговое значение.

Для формирования сильного классификатора как взвешенной комбинации слабых классификаторов применяется процедура AdaBoost. Пусть даны примеры изображений (х1, у1), ..., (хи, уи), где у = [0, 1] для отрицательных и положительных примеров соответственно. Следует определить значение веса ^1„- = И2ш, 1/2/ для у, = [0, 1] соответственно, где т используется для отрицательных примеров; / - для положительных.

Нормализация происходит при условии, что существует конечное число слабых классификаторов:

ж,-

S'

j=і

t, j

Из всех слабых классификаторов выбирается самый сильный - с минимальной ошибкой:

в( = тт7,р,0 £ в( | Кх,, Х, р(, 0) - у, |.

Затем определяется слабый классификатор, переменные которого минимизируют £г:

^(х) = Кх,, ^, р(, 0х где £ - признак; р( - полярность; 0( - пороговое значение.

После того как один слабый классификатор найден, продолжается поиск других и обновляются веса:

vt+і,і

= wt,і -Рі

где є, = 0, если пример Хі классифицирован правильно, и Єі = 1, если иначе;

Pt =

і -є,

Значение сильного классификатора, состоящего из слабых, находится по следующей формуле:

Т 1 Т

1, если

2 <

C (x) =

і

Рис. 2. Схема работы алгоритма Виолы- Джонса

Классификатор - это набор признаков. Однако не все признаки могут точно описывать объект, вследствие чего необходимо обучение и усиление слабых признаков. Усиление простых классификаторов -подход к решению задачи классификации (распознавания) путем комбинирования примитивных слабых классификаторов в один сильный (под силой классификатора подразумевается эффективность решения задачи классификации). Слабый классификатор имеет вид

at, = l°g—,

t=1 21=1 Pt

0, если иначе.

Обучающий алгоритм для создания сильного классификатора позволяет вводить максимально и минимально допустимый уровень срабатываний. Для существующего набора отрицательных и положительных примеров задается общий уровень ложных срабатываний, для чего используется процедура усиления классификаторов AdaBoost. Полученный каскад необходимо оценить на тестовом наборе.

Признак, используемый для анализа изображения, можно представить кортежем

Feature (особенность) = {T, O, S},

где Т - тип признака; О - координата левого верхнего угла признака; S - размер признака по горизонтали и вертикали в пикселях.

wt л =

є

Значение признака рассчитывается по формуле

= к№ £Г№ + кь £ Гь,

где XV™, - суммы интенсивностей всех пиксе-

лей изображения в белых и черных областях признака; к„ и кь- коэффициенты их нормирования по площади.

Для быстрого вычисления признаков используется интегральное изображение (рис. 3). Оно представляет собой матрицу, размерность которой совпадает с раз-

мерностью исходного изображения. Элементы матрицы определяются по следующей формуле:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8АТ( х, у) = £ I (х', у'),

х'< х, у'< у

где 8АТ(х, у) - значение элемента интегрального изображения с координатами х, у; 1(х', уг) - яркость пикселя исходного изображения.

При проведении экспериментов было использовано более 100 изображений кистей рук, растений и лиц людей размером от 640x480 до 1 б00*1 200 (рис. 4).

б

Рис. 3. Виды признаков для обученного каскада Хаара: а - граничные; б - линейные; в - центральные; г - диагональные

*

Рис. 4. Примеры сегментации изображений: а - оригинальные изображения; б - изображения, полученные с помощью алгоритма Виолы-Джонса; в - алгоритма Краскала; г - пороговой сегментации

а

в

г

а

б

в

г

В алгоритме Краскала при определении расстояния между пикселями в таком аспекте, как перепад интенсивностей, пиксели пестрого, пусть даже единого объекта, будут реагировать на объединение в один объект. Во избежание этого предлагается использовать фильтр Гаусса, который позволяет убрать шум и размыть изображение. Это вызывает взаимопроникновение цветовых пикселей, и они более охотно идут на контакт.

Зависимость времени работы алгоритма от размеров изображения можно увидеть на рис. 5. Наибольшее быстродействие достигается при использовании модели УСгСЪ.

При оценке точности локализации были сформированы три набора экспериментальных данных по каждой категории:

- категория 1 - фон содержит минимальное количество объектов, затрудняющих локализацию, и имеет относительно простую структуру;

- категория 2 - фон содержит некоторое количество объектов и характеризуется умеренной неоднородностью;

- категория 3 - фон содержит некоторое количество объектов и обладает сложной структурой.

При рассмотрении результатов сегментации точность обнаружения объекта в значительной степени зависит от внешней среды и установленных параметров работы алгоритма (см. таблицу).

В ходе исследования было выяснено, что для локализации лиц людей наилучшим образом подходит сегментация с использованием цветовых моделей УСгСЪ, ИЬ8 и их комбинации. Алгоритм Виолы-Джонса достаточно устойчив к поворотам изображения до 15о. При локализации лиц в таких условиях алгоритм обладает крайне низкой вероятностью ложного обнаружения лица и является одним из лучших по показателю точности локализации лица, которая составляет 98,62 %. Алгоритм Виолы-Джонса обеспечивает хорошие результаты при поворотах изображения относительно камеры.

—■—Уіоіа^опез

ч. а > У 1

У

5

а а. Ю Порог Б

ос 2 ф

ей

0 0 5 Раз 1 мер изобр 5 >ажения (л 2 іегапиксе 5 пи) 3

Рис. 5. Зависимость времени работы алгоритмов от размера изображения

Оценка точности сегментации

Категория Пороговая сегментация Алгоритм Краскала Алгоритм Виолы-Джонса

Среднее Процент Среднее Процент Среднее Процент

количество покрытия количество покрытия количество покрытия

сегментов сегментов сегментов

Изображения растений

Категория 1 15 ,4 СЛ 00 7, 00 10 95,2.100,0 9 ,4 4, 4 0, 3

Категория 2 21 ,2 7, ,3 3, 00 19 ,9 6, 9 ,0 7, 8 10 ,8 9, 4 ,3 6, 3

Категория 3 24 ,5 6, ,4 00 31 5, 9 ,3 3, 7 7 ,8 8, 3 ,5 21

Изображения лиц людей

Категория 1 1 95,1... 100,0 1 97,2.100,0 1 97,9.100,0

Категория 2 3 93,3... 100,0 4 ,5 7, 9 ,5 9, 8 1 97,1.100,0

Категория 3 4 00, 6, 9 ,2 9, 00 7 ,3 91 3, 8 2 96,7.100,0

Изображения кистей рук людей

Категория 1 2 ,7 9, 9 5, 9 3 ,8 9, 9 ,7 4, 9 1 50,0..64,4

Категория 2 4 ,4 00* 9 ,3 3, 9 5 ,7 7, 9 ,4 6, 8 1 ,6 51 ,5 8, 3

Категория 3 6 7, 9 ,7 00 00 8 3, 9 ,8 8, 7 1 21,9.41,7

Примечание. При формировании табличных значений в ходе оценки экспериментальных данных не учитывалось покрытие сегментами областей, которые не относятся к объекту интереса.

При локализации кистей рук людей наилучшие результаты показали методы пороговой сегментации и алгоритм Краскала: 91,75 и 95,38 % соответственно.

Средняя точность при локализации растений пороговой сегментацией составляет 90,9 %, алгоритмом Краскала - 91,2 %.

В ходе экспериментов было выяснено, что алгоритм Виолы-Джонса не подходит для сегментации растений, поскольку в процессе развития они неоднократно меняют свою геометрию, что затрудняет обучение каскадов Хаара. При этом точность локализации не превышает 37 %.

Все вычисления производились на компьютере Intel Core 2 Duo P8400 2,2 MHz, с 4 Гбайтами оперативной памяти. Следует отметить что реализации алгоритмов Виолы-Джонса и Краскала очень требовательны к ресурсам компьютера. Время работы алгоритма Виолы-Джонса превышает порог в 1 с при об-

работке небольших изображений, например при обработке изображения с размером 1 024*768 - более 3 с, при этом алгоритм Краскала выполняется за 0,4 с.

Библиографические ссылки

1. Бузаев Д. В., Зотин А. Г., Носов А. В. Сравнение методов для системы локализации и обнаружения лиц // Молодежь Сибири - науке России : материалы на-уч.-практ. конф. Красноярск, 2011.

2. Гонсалес Р., Вудс Р. Цифровая обработка изображений : пер. с англ. М. : Техносфера, 2006.

3. Felzenszwalb P. F., Huttenlocher D. P. Efficient Graph-Based Image Segmentation // Huttenlocher Intern. J. of Computer Vision. 2004. Vol. 59, № 2. Р. 37-44.

4. Viola P., Jones M. Robust Real-Time Object Detection // Intern. J. of Computer Vision. Kluwer Academic Publishers, 2004. Р. 137-154.

A. G. Zotin, A. V. Nosov, D. V. Buzaev

ANALYSIS OF SUITABILITY OF SEGMENTATION METHODS BASED ON COLOR AND STRUCTURAL FEATURES FOR LOCALIZATION OF OBJECTS

The existing methods of segmentation, according to color and structural features, are considered. The algorithms of the most widely known methods of segmentation based on thresholding, graphs, and cascades are described. Results of the analysis of segmentation methods suitability for objects localization are shown for the cases ofplants, people's faces and areas of the hands.

Keywords: image analysis, segmentation, threshold processing, the Kruskal's algorithm, Haar's cascades.

© Зотин А. Г., Носов А. В., Бузаев Д. В., 2012

УДК 517.972.5

И. А. Лопатин

РЕШЕНИЕ ВАРИАЦИОННОЙ ЗАДАЧИ ПО ВЫБОРУ ОПТИМАЛЬНОЙ ФОРМЫ СЖАТОГО СТЕРЖНЯ

Представлено решение задачи о выборе закона изменения поперечного сечения стержня, обеспечивающего восприятие максимальной сжимающей силы при заданном объеме материала.

Ключевые слова: стержень, устойчивость, оптимизация.

Осесимметричные пространственные фермы, составленные из прямолинейных стержней, нашли широкое применение в качестве адаптеров полезной нагрузки. Расчет таких конструкций проводится в предположении, что стержни фермы соединены шарнирно, а основным видом разрушения стержня является потеря устойчивости при действии на него сжимающей силы.

Стержни фермы в большинстве конструкций имеют постоянное по длине поперечное сечение. Однако использование в ферме стержней с переменным поперечным сечением позволяет создавать более эффективные конструкции [1; 2].

Рассмотрим шарнирно опертый стержень длиной I, нагруженный сжимающей силой P. Пусть стержень имеет круглое поперечное сечение, радиус которого г

зависит от продольной координаты х. Длина стержня і и его объем У0 являются заданными величинами. Необходимо подобрать закон изменения радиуса поперечного сечения, который обеспечивает максимум критической силы Р при известном объеме стержня У0.

Сформулируем условие этой задачи как задачи вариационного исчисления. Объем стержня У0 определяется функционалом

V 0 - J n[r (x)] 2dx,

(1)

где г(х) - зависимость радиуса стержня от продольной координаты.

Уравнение устойчивости стержня имеет вид

Рм>

- 0,

(2)

i Надоели баннеры? Вы всегда можете отключить рекламу.