Научная статья на тему 'Параметризация цветового представления изображения пламени с использованием одноклассового классификатора'

Параметризация цветового представления изображения пламени с использованием одноклассового классификатора Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
120
29
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОДНОКЛАССОВАЯ КЛАССИФИКАЦИЯ / ПИКСЕЛЬНЫЕ КЛАССИФИКАТОРЫ / ДЕТЕКТИРОВАНИЕ ОГНЯ / ПОИСК ПЛАМЕНИ / SUPPORT VECTOR DATA DESCRIPTION / FIRE DETECTION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ларин А. О., Середин О. С.

Работа посвящена задаче поиска пламени на изображениях. Основная идея работы заключается в применении одноклассового классификатора Д. Тэкса для параметризации цветового представления изображения пламени. Эффективность выбранного подхода подтверждается экспериментальными исследованиями, в ходе которых было изучено влияние настраиваемого параметра классификатора на результаты параметризации. Также в данной работе рассмотрен подход к оптимизации решающего правила классификатора, позволяющий существенно увеличить скорость распознавания.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ларин А. О., Середин О. С.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PARAMETIZATION OF FLAME IMAGE COLOR DATA MODEL USING THE ONE - CLASS CLASSIFIER

The aim of the research is to detect the flame in images. The main concept is to applied. Tax's one class specific classifier for parameterization of color data modeling of flame. The efficiency of chosen approach is confirmed by experiments, which allow examine the effect of classifier's adjustable parameter on the results of parameterization. The approach to optimization of classifier's decision procedure, which helps to increase significantly the recognition speed is considered further in this work.

Текст научной работы на тему «Параметризация цветового представления изображения пламени с использованием одноклассового классификатора»

УДК 004.93

А.О. Ларин, магистрант, ekzebox@gmail. com (Россия, Тула, ТулГУ),

О.С. Середин, канд.ф.-м. наук, доц., oseredin@yandex. ru (Россия, Тула, ТулГУ)

ПАРАМЕТРИЗАЦИЯ ЦВЕТОВОГО ПРЕДСТАВЛЕНИЯ ИЗОБРАЖЕНИЯ ПЛАМЕНИ С ИСПОЛЬЗОВАНИЕМ ОДНОКЛАССОВОГО КЛАССИФИКАТОРА

Исследуется задача поиска пламени на изображениях. Основная идея работы заключается в применении одноклассового классификатора Д. Тэкса для параметризации цветового представления изображения пламени. Эффективность выбранного подхода подтверждается экспериментальными исследованиями, в ходе которых было изучено влияние настраиваемого параметра классификатора на результаты параметризации. Также в данной работе рассмотрен подход к оптимизации решающего правила классификатора, позволяющий существенно увеличить скорость распознавания.

Ключевые слова: одноклассовая классификация, пиксельные классификаторы, детектирование огня, поиск пламени, Support Vector Data Description, Fire Detection.

В системах компьютерного зрения, решающих задачу детектирования огня, одним из этапов работы является описание набора точек, представляющих объекты интереса на изображении, в параметрической форме. При цветовом анализе изображений любой пиксель можно представить в виде трехмерного вектора, каждая координата которого совпадает со значением соответствующей компоненты RGB этого пикселя. Задачей параметризации или Color data modeling [1] принято называть построение на основе выделенного экспертом набора точек в цветовом пространстве такого математического правила (модели), которое позволяет с заданной точностью параметрически описывать области интереса в пространстве признаков. Примером подобной задачи является параметризация пикселей огня, решение которой и будет рассмотрена в этой работе.

Основная гипотеза поиска пикселей, принадлежащих пламени, заключается в экспертном указании на изображении фрагментов (прямоугольников, полигонов, явного перечисления пикселей), описывающих пламя. Используя только эту информацию и принцип обучения по прецедентам, необходимо построить математическое описание правила, относящего пиксели к одному из двух классов: пламя — не пламя. На рис. 1 представлен пример вполне произвольного указания множества пикселей, составляющих обучающую совокупность. Область обучающей совокупности, отмеченная на рис. 1, образует множество трехкомпонентных векторов, которое можно представить в пространстве RGB, как показано на рис. 2.

Рис. 1. Кадр, содержащий изображение огня. Прямоугольником выделена область для обучения

G R

Рис. 2. Множество пикселей, представляющих изображение пламени,

в пространстве RGB

Широко используемым подходом к решению задачи параметризации является метод аппроксимации исходных данных смесью нормальных распределений [2]. Для поиска огня на изображения часто применяются модификации этого метода. Например, подробно рассмотренный в [5] метод аппроксимации экспериментальных данных сферами. Сферы строятся на основе подобранной смеси нормальных распределений таким образом, что центром каждой аппроксимирующей сферы является точка, представленная математическим ожиданием соответствующего распределения, а радиусом — удвоенное среднее квадратичное отклонение того же распре-

деления (см. рис. 3). Пиксель, классифицируемый на основе этой модели параметризации, считается принадлежащим изображению огня в случае, если попадает хотя бы в одну из аппроксимирующих сфер.

G

Рис. 3. Аппроксимация сферами исходного набора данных (центр сферы — среднее значение распределения, радиус — два СКО)

Важно отметить, что количество сфер должно быть подобрано изначально. В самой работе сделано предположение о том, что достаточного качества параметризации пикселей пламени можно добиться, используя десять аппроксимирующих сфер.

Если обратить внимание на вид исходного набора данных в пространстве RGB и постановку задачи, то можно предположить, что задачу параметризации можно решить, пользуясь методом одноклассовой классификации. Один из таких методов мы исследовали ранее, используя его в задаче идентификации личности по фотопортрету, где он показал неплохие результаты распознавания, поэтому возникла идея попытаться использовать одноклассовую классификацию для решения задачи параметризации пикселей пламени.

Метод описания данных опорными векторами

Метод одноклассовой классификации, который будет использован для решения поставленной задачи, впервые был предложен Д. Тэксом в [4] и получил название — Support Vector Data Description (метод описания данных опорными векторами). Особенность этого метода заключается в сильной аналогии с методом опорных векторов В.Н. Вапника. Модель

описания набора данных для обучения Xj е Rп, i = 1,..., N (п — размер-

ность признакового пространства, N — количество объектов в обучающей выборке) в методе — гиперсфера, представляющая ближайшую внешнюю границу вокруг данных. Ограничивающая гиперсфера однозначно определяется своими центром а е Rп и радиусом R е R, которые подбираются таким образом, чтобы радиус был минимален, но при этом большая часть объектов обучающей совокупности не выходила за ее пределы (см. рис. 4). При этом объекты, попадающие за пределы гиперсферы, должны быть оштрафованы, и сумма штрафов для таких объектов также должна быть минимальной.

Рис. 4. Сферическая модель описания данных

Таким образом, необходимо минимизировать структурную ошибку

модели:

,2

N

Д2 + C X $ ^ шт , 1=1 Д,а,5

22

хг- - а 2 < Д2 +$, $ > 0,I = 1,...,N.

(1)

Поставленная задача является задачей квадратичного программирования, которая решается с помощью метода множителей Лагранжа. Двойственная по отношению к (1) задача имеет вид:

N

N N

X ¿I (х х I) - X X ¿I ¿у (х Iх j) ^

I=1 I=1 у =1 Ь

N

ХЛ = 1,0 <Л < с,

I=1

(2)

I = 1,., N,

где Ь — множители Лагранжа. Д. Тэкс предлагает использовать для описания всей обучающей совокупности в решающем правиле только опорные объекты х£, Л£ е(0, С), лежащие на границе гиперсферы.

Новый объект считается принадлежащим классу интереса, когда расстояние от него до центра гиперсферы меньше ее радиуса. Из этого следует, что функция одноклассового решающего правила распознавания для объекта z будет иметь вид индикаторной функции:

d(г;I,R) = I(||г — а||2 < R2)

(3)

где

г - а

NSV NSV NSV , V

(г-г)- 2 X Л ()+ £ £ (х- ~х] )

i=1 3 =1

i=1

2 \ ^ , NSV ^ , V

R = К'х£)-2 £ Л(х£-х)+ £ £ ^(х-х])

i=1 3 =1

(4)

(5)

- =1

Nsv — количество опорных объектов, а х ^ — любой опорный объект.

Для возможности описания данных более «гибкой формой», нежели сфера, Д. Тэкс использовал идею метода потенциальных функций [6,7] для перехода в спрямляющее пространство признаков большей размерности. Наиболее часто для этого используются полиномиальная потенциальная функция

к(х- >х3 ) = (1 + х- х3 )Р и радиальная базисная функция Гаусса

к (х-,х 3) = ехР

2

— х- — хз

2

(6)

Таким образом, чтобы получить улучшенную модель описания данных по методу Д. Тэкса, необходимо заменить в (2), (4) и (5) операцию вычисления скалярного произведения двух векторов вычислением значения потенциальной функции двух аргументов.

Очевидно, что для решения задачи параметризации цветового представления пикселей пламени предпочтительной является потенциальная функция Гаусса, поэтому далее будем использовать именно ее.

Результаты экспериментов

На рис. 1 отмечена прямоугольная область, из которой был получен набор пикселей для обучения классификатора Д. Тэкса. Результаты построения разделяющей границы вокруг данных на основании обученного классификатора представлены на рис. 5. На рис. 6 проиллюстрировано применение классификатора для поиска пламени на изображении.

2

а б в

Рис. 5. Результаты построения разделяющей границы с использованием классификатора Тэкса для различных параметров потенциальной функции Гаусса s: а) - 10, б) - 50, в) - 100

Рис. 6. Кадр, на котором посредством классификатора Тэкса, обученного по фрагменту, представленному на рис. 1, черным цветом были отмечены пиксели, принадлежащие пламени

Следует отметить, что при уменьшении параметра потенциальной функции Гаусса s область становится более «плотной» и ограничивает в пространстве RGB меньшее количество пикселей вокруг обучающего множества. Таким образом, возникает необходимость в процедуре поиска оптимального параметра потенциальной функции.

Подбор оптимального для потенциальной функции Гаусса

В своей работе Д. Тэкс также предложил алгоритм, позволяющий подбирать оптимальное значение параметра s функции Гаусса. Суть алгоритма заключается в поиске параметра s, соответствующего заданной ошибке распознавания, в пределах от минимального значения параметра до максимального. Эти значения могут быть определены по следующим формулам:

smin = Ш1П/, ]

X -

, I * ],

smax = maxi, ]

Xi -

Поиск параметра должен осуществляться по итерационной схеме с заданным шагом до тех пор, пока ошибка распознавания не будет соответствовать желаемой. Оценку ошибки распознавания было предложено делать, используя процедуру скользящего контроля. На рис. 7 показана зависимость между ошибкой классификации и параметром потенциальной функции Гаусса.

Рис. 7. Зависимость между параметром потенциальной функции и ошибкой классификации на скользящем контроле

Если обратить внимание на график зависимости между параметром потенциальной функции Гаусса и количеством опорных объектов, участвующих в решающем правиле распознавания (см. рис. 8), то можно заметить, что количество опорных объектов уменьшается с увеличением параметра потенциальной функции. Таким образом, количество опорных объектов в решающем правиле является косвенным признаком, по которому можно грубо оценивать будущую ошибку классификации.

Использование реализованного программно классификатора в системе анализа видеопотока, работающей в реальном времени, показало необходимость ускорения его работы на этапе распознавания. Это обусловлено тем, что процедуру распознавания необходимо запускать для каждого пикселя обрабатываемого изображения несколько раз в секунду.

Если обратить внимание на вид потенциальной функции Гаусса (6) то можно заметить, что она обладает двумя свойствами, следующими из свойств экспоненты: принимает только положительные значения на всей своей области определения; в случае равенства аргументов принимает значение, равное единице.

б - параметр функции Гаусса

Рис. 8. Зависимость между параметром потенциальной функции и количеством опорных объектов в решающем правиле классификатора

Оптимизация скорости работы классификатора

Воспользовавшись этими утверждениями, можно преобразовать выражение решающего правила (3), получив его упрощенный вид

( N

N.

(7)

d(ж) = I I Л1К(ж,х)- I Л1К,х)>0 V 1=1 1=

где хк — любой опорный вектор. Ввиду положительности гауссовской

потенциальной функции достаточно частичного вычисления первой суммы в выражении (7), а вторая сумма может быть посчитана заранее, перед процедурой классификации.

Ясно, что для вычисления данного выражения, в сравнении с первоначальным, требуется меньшее число операций. Следовательно, временные затраты на процедуру классификации снизятся.

Хорошо известно, что операция вычисления экспоненты обладает большой вычислительной сложностью, поэтому мы предположили, что уменьшение вызовов этой функции во время выполнения может существенно снизить временные затраты на распознавание пикселей. В нашем случае вектор признаков представлен следующим образом:

X =( Г1,81, Ь). (8)

Подставляя (8) в исходное выражение потенциальной функции Гаусса (6) и, используя одно из свойств функции экспоненты, мы можем записать выражение для гауссовской потенциальной функции следующим образом:

к (х1, х j) = ехР

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1Г1 - ^ Г

ехр

1 81 - gj Г

ехр

1Ь - ъj\

/ (у) = ехр

' 2 ^ V

. (9)

(10)

2

2

2

5

и, выполняя замену в выражении (9), получим

K(xi,x j) = f (| r - rj |) f (| gi - gj |)f (| bi - bj |).

Обратим внимание на то, что значение каждой цветовой компоненты RGB ограничено множеством (0,1,...,255), поэтому модуль разности двух любых цветовых компонент также будет принадлежать этому множеству, значит, область определения функции (10) будет дискретна и ограничена множеством (0,1,., 255). Поэтому все значения этой функции могут

быть вычислены еще до начала основной процедуры классификации, что позволяет нам полностью отказаться от вычисления функции экспоненты, занимающего большую часть времени во время выполнения.

Таким образом, было существенно снижено число операций, необходимых для классификации, а также полностью исключено вычисление экспоненты во время выполнения. Сравнительные результаты можно увидеть на рис. 9.

Эксперимент по измерению времени параметризации пикселей проводился следующим образом. Было выбрано 50 тыс. «своих» пикселей (принадлежащих изображению пламени), и 500 тыс. «чужих» (не принадлежащих изображению пламени). Для каждого объекта из выборки процедура распознавания запускалась 200 раз, чтобы снизить ошибку измерения времени.

и s

X J га ас х

-е-

х

и

0 га

DC

1 и о. m

s - параметр функции Гаусса Рис. 9. Результаты оптимизации решающего правила Выводы

Метод описания данных опорными векторами (Support Vector Data Description) представляет собой довольно простую математическую модель, позволяющую решать задачу одноклассового распознавания образов. Нами было показано, что такая модель может быть применена к задаче параметризации пикселей пламени на изображении (см. рис. 6).

Для параметров модели Тэкса существуют эвристические алгоритмы определения их оптимальных значений, что дает возможность строить

Дооптимизации После оптимизации

модель описания данных без дополнительных вмешательств в процесс обучения: визуализации данных полученной модели и ее дополнительного анализа.

Помимо этого, использование данного метода с объектами, представленными в пространстве RGB, позволяет выполнить оптимизации, существенно ускоряющие выполнение классификации, что позволяет применять данный подход в системах, где важным критериями являются производительность и скорость работы, например, в системах видеонаблюдения.

Список литературы

1. Rother C., Kolmogorov V., Blake A. GrabCut - Interactive foreground extraction using iterated graph cuts // ACM Transactions on Graphics (TOG). ACM, 2004. Vol. 23, No. 3. P. 309-314.

2. Ruzon M., Tomasi C. Alpha estimation in natural images // Proceedings IEEE Conference on Computer Vision and Pattern Recognition. CVPR 2000 (Cat. No.PR00662). IEEE Comput. Soc, 2000. Vol. 1. No. June. P. 18-25.

3. Stauffer C., Grimson W. Adaptive background mixture models for real-time tracking // Proceedings 1999 IEEE Computer Society Conference on Computer Vision and Pattern Recognition Cat No PR00149, 1999. Vol. 2, Issue c, Publisher: IEEE Comput. Soc. P. 246-252

4. Tax D. One-class classification; Concept-learning in the absence of counterexamples // Ph.D thesis. Delft University of Technology, ASCI Dissertation Series. 2001. 146 p.

5. Toreyin B. Fire detection algorithms using multimodal signal and image analysis // Ph.D thesis. 2009. 138 p.

6. Vapnik V. Statistical Learning Theory. NY.: J. Wiley, 1998. 768 p.

7. Айзерман М., Браверман Э., Розоноэр Л. Метод потенциальных функций в теории обучения машин. М.: Наука, 1970. 386с.

A.O. Larin, O.S. Seredin

PARAMETIZATION OF FLAME IMAGE COLOR DATA MODEL USING THE ONE-CLASS CLASSIFIER

The aim of the research is to detect the flame in images. The main concept is to apply D. Tax's one-class specific classifier for parameterization of color data modeling of flame. The efficiency of chosen approach is confirmed by experiments, which allow examine the effect of classifier's adjustable parameter on the results of parameterization. The approach to optimization of classifier's decision procedure, which helps to increase significantly the recognition speed is considered further in this work.

Key words: one-class classification, pixel classifiers, fire detection, flame detection, Support Vector Data Description.

Получено 07.03.12

УДК 681.7

A.A. Аршакян, канд. техн. наук, (487-2)-35-02-19. elarkin@mail.ru (Россия. Тула. ТулГУ),

Е.В. Ларкин, д-р техн. наук, проф., (487-2)-35-02-19, elarkin@mail.ru (Россия. Тула. ТулГУ)

ЧАСТОТНЫЕ ХАРАКТЕРИСТИКИ ФИЛЬТРОВ, ВЫДЕЛЯЮЩИХ ГАРМОНИЧЕСКИЕ СОСТАВЛЯЮЩИЕ

Исследуется процесс обработки сигналов с высоким уровнем помехи в системах наблюдения. Показано, что обнаружение гармонического сигнала с заданной частотой возможно с использованием фильтров на основании вейвлетов. Для ряда фильтров указанного класса получены передаточные функции и уравнения для определения граничных частот полосы пропускания. Даны рекомендации по выбору типа фильтра при решении задачи выделения гармонических составляющих сигналов.

Ключевые слова: гармонический сигнал, согласованный фильтр, функция Гаусса, wave-вейвлет, rnhat-вейвлет, вейвлет Морле. гармонический всплеск импульсный отклик, передаточная функция, полоса пропускания.

Выделение гармоник с заданными частотами из сигналов является одним из ключевых моментов функционирования целого ряда информационно-измерительных систем, в частности, пеленгационных, радиолокационных, радиоприемной аппаратуры и других [1, 2]. Как правило, в реальных условиях наблюдения искомая синусно-косинусная составляющая сопровождается шумом и искусственно создаваемыми помехами, что делает актуальной задачу выделения заданной гармоники из наблюдаемого сигнала и измерения ее параметров.

Для достижения поставленной цели может быть применен принцип оптимальной фильтрации [3], согласно которому в импульсном отклике фильтра должна присутствовать в том или ином виде выделяемая гармоника, которая может быть представлена в комплексной форме:

Фильтры, сформированные из вейвлетов, в настоящее время широко применяются для обработки сигналов с высоким уровнем шума [4, 5]. Из существующих вейвлетов наиболее эффективными для частотного анализа сигналов являются фильтры, построенные на основании производных от гауссиана, гармонический всплеск и вейвлет Морле [5].

Производные от гауссиана, нормированного по площади, имеют

вид:

собственно гауссиан -

u(t) = exp iClut, - оо < t < оо, где С1и - частота выделяемой гармоники; t - время; i = yf—1.

(1)

i Надоели баннеры? Вы всегда можете отключить рекламу.