Синтез и анализ алгоритмов автоматической классификации цветных изображений
Ковригин А.В., Хлопов А.Н. (alexhl@list.ru) Красноярский Государственный Технический Университет
На основе теории распознавания образов синтезирован и исследован алгоритм автоматической классификации цветных изображений, независимый от помех типа «освещенность». Приводятся вычислительные эксперименты и анализируются применение полученных результатов в задаче построения машинного зрения.
1. Введение
Актуальной задачей в области искусственного интеллекта является реализация машинного зрения. Комплексное решение данной задачи затруднено, в связи ограниченности вычислительных ресурсов и отсутствия единой теоретической базы. Предпринимались попытки решить задачу на конкретном классе объектов, накладывая на входную информацию дополнительные ограничения. Так некоторые системы идентификации личности основывались на заранее известном положении лица человека на изображении, что значительно сужало область их применения. Требовались значительные ресурсы на синтез и реализацию методов идентификации объектов для разных прикладных задач, из-за невозможности применения ранее внедренных методов распознавания.
Задача состоит в создании алгоритмов анализа изображений способных локализовать и распознавать любые объекты без дополнительной перенастройки или обучения. В данной статье предлагается метод автоматического обнаружения объектов независимо от их размера и расположения на изображении, что является первым этапом при синтезе алгоритмов машинного зрения.
2. Постановка задачи исследования
Пусть задана исходная выборка V = (х', 1 = 1, п) , представляющая собой цветное изображение, где х1 - многомерная случайная величина. Каждая компонента вектора х' = (х1, х2, х3) характеризует яркость красного, зеленого, синего цветов соответственно.
Требуется выделить классы на цветном изображении, при заранее не известном их количестве. Под классом подразумеваются фрагмент изображения, пиксели которого близки по цвету.
3. Синтез алгоритма автоматической классификации цветных изображений
Идея предлагаемого похода основывается на построении окрестности Я вокруг выбранного класса О и проверки гипотезы (1) о принадлежности точек из окрестности Я классу О . Задача классификации решается с помощью проверки близости цветовых характеристик х' = (х[, х2, х3) класса О с точками х1 = (х/, х2, х3;) Я окрестности (2) и дополнительных знаний об объектах на изображении (3). Окрестность Я определяется как набор х1 точек, граничащих с классом О .
Предлагаемая методика:
1. Выбрать г -ую точку из выборки V и отнести её к классу От ( включить точку х' в
выборку Vm т -го класса, с последующим её удалением из V ).
2. Определить Я окрестность класса От .
3. Проверить все точки х1 из Я окрестности на принадлежность их классу О т, путем применения решающего правила (1)
т( х) =
х - хи
<С е а <
л' л1
и х1х
< а2 е а1 <
л' л1
и х^
<а2, х1 еОт
(1)
ега^а, х1 £ О
5 ^ т
где х' - точка, принадлежащая классу От,
1 - точка, принадлежащая Я окрестности, Мера близости между точками х' и х1 определена как
х' - х1
V
2 (х; - хк])
(2)
к=1
л' 1 2 , л' 1 3 - разностные характеристики, постоянные для отдельных классов на изображении и малозависимые от помех типа «освещенность».
Б1
х 1 - х 2
Б
Х1Х-3
х 1 - х 3
(3)
£ - коэффициент размытости изображения,
а1 « 0.8, а2 « 1.2 - заранее выбранные пороговые значения.
При условии принадлежности точки х1 из Я окрестности классу О т включить х1 в выборку V" т -го класса, с последующим удалением х1 из V ).
4. При отсутствии точек из Я окрестности, которые можно отнести к классу От , следует увеличить счетчик классов на единицу т = т +1
5. При отсутствии точек из выборки V, которые можно отнести к классу О т при заданном коэффициент размытости изображении £ , следует прекратить выполнение алгоритма, в противном же случае перейти к этапу 1.
Эмпирически установлено, эффективность алгоритма автоматической классификации зависит от выбора коэффициента размытости изображения £ . Положение усугубляется отсутствием возможности выбора фиксированного значения £ , минимизирующего ошибку, по причине большого варьирования оптимального £ для разных исходных выборок.
4. Итерационный метод настройки четкости изображения в алгоритме автоматической классификации цветных изображений
Большие значения коэффициента размытости изображения £ делают алгоритм автоматической классификации цветных изображений не чувствительным к цвету точек выборки V. Результатом применения метода с таким значением £ станет существования одного класса, включающего в себя все точки.
Для минимизации ошибок, на первом этапе целесообразно значение параметра £ выбирать достаточно малым £ е [5,8], с целью поставить в соответствие одному
объекту на изображении хотя бы один класс. Для правильного распознавания оставшихся
х, х
12
точек, следует поэтапно увеличивать значение £ на малую величину с целью их равномерного распределения между выделенными классами. Предлагаемая методика:
1. Задать значение £ и применить алгоритм автоматической классификации цветных изображений.
2. Выбрать От класс, построить Я окрестность и проверить гипотезу о
принадлежности каждой точки х1 из этой окрестности классу О т , путем
применения решающего правила (1)
3. При отсутствии точек из Я окрестности, которые могут принадлежать указанному классу, выбрать следующий класс и перейти к этапу 2.
4. При отсутствии точек из выборки V, которые могут быть распределены между указанными классами при заданном уровне £ , увеличить коэффициент размытости изображения £ на величину и перейти к шагу 2.
5. Если значение £ достаточно велико ( [30,35] ) и все точки выборки V распределены между классами, следует закончить классификацию.
Достижение более точной классификации, осуществляется с помощью перераспределения граничных точек между смежными классами. Каждая граничная точка будет принадлежать тому классу, среднее значение которого МО (х) ближе к
усредненному параметру
— 1 3 1 3
хг =1Е х), мо,(х) = -т-^ЕЕх)
3 1=1 3' Р1а о 1=1
m ( х) = <
Х! - MQ (х) < х' - MQ2( X) , x' g Q1
X7 - M Q (х) > x7 - M Q2( x) , x' g Q2
(4)
При условии перехода точки из одного класса в другой по правилу (4), необходимо пересчитать средние показатели этих классов. Для этого следует применять рекуррентные формулы.
n - 1 "-1 1 1 MQi = —— 2 хг + -х" = Мц + -х" , ' n (n -1) г=1 n n
" - 1 "-1 1 1 Mj = —— 2хг --Xn = M --x" , 1 n (n -1) i=1 n 1 n
где Q7 - класс к которому перешла точка x" , Qj - класс который покинула точка x" .
Результатом применения модифицированного алгоритма автоматической классификации цветного изображения служит набор выборок V1, 1 = 1, m , характеризующих отдельные объекты на изображении.
5. Исследование показателя эффективности алгоритма автоматической классификации цветных изображений
Для исследования эффективности предложенного метода автоматической классификации цветных изображений, алгоритм был протестирован на наборе данных, состоящем из 20 изображений одинакового размера (500х300), полученных при разных условиях освещенности окружающей среды.
Каждое изображение первоначально подвергалось обработке с помощью эксперта, с целью получения указаний учителя (выполнялось выявления объектов и уточнения их размеров).
Далее изображение поступало на вход алгоритма при разных уровнях е [1,3,5]. Первоначальное значение коэффициента размытости изображения £ было зафиксировано на уровне 5, а максимальное £ взято равным 40.
Далее результаты, полученные с помощью эксперта & и алгоритма а , сравнивались.
Показатель эффективности определялся как оценка вероятности ошибки автоматической классификации объектов на цветном изображении (5).
_ 1 П _.
р = -21(а\аг), (5)
П '=1
. —I 1, а Ф а ,
1(& &) = Г
—>
0, а = а ,
где & - указания учителя, а - результаты, полученные с помощью работы алгоритма.
Полученные показатели эффективности алгоритма автоматической классификации цветных изображений pi , усреднялись в пределах одного коэффициента размытости изображения £ и заданного шага (6).
Р1 = N2 р1, ^ = 20, 1 =13 (6)
Результаты исследования показателя эффективности алгоритма автоматической классификации цветных изображений приведены на рисунке 1.
Рис. 1. Зависимость показателя эффективности алгоритма Ру, у = 1,3 от значения коэффициента размытости изображения ^ • График №1 показан для значения шага = 1,
второй для = 2 и третий график для = 5 Предлагаемый метод автоматической классификации цветных изображений исследовался на скорость обработки поступающего набора данных. Оценка показателя скорости алгоритма определялась как время, затрачиваемое ЭВМ на проведение автоматической классификации цветного изображения. Оценка скорости алгоритма проводилась для каждого изображения и заданного шага , а полученные значения усреднялись. Результаты исследования показателя скорости алгоритма автоматической классификации цветных изображений приведены на рисунке 2. Тестирование проводилось на ЭВМ с тактовой частотой процессора 2СИг. н 1.е •
1.4 '
1.2 • 1 . 0.8 .
0,? '
014 ■
3,2 .
0 .
Рис. 2. Зависимость времени выполнения алгоритма автоматической классификации цветных изображений от шага . Столбец № 1 получен для значения шага = 1, столбец №2 для = 2 и столбец №3 для = 5
Исследование алгоритма автоматической классификации цветных изображений показало:
1. Наилучшие результаты, в смысле минимума ошибки классификации, получаются для = 1 . Но скорость алгоритма автоматической классификации при таком шаге достаточно мала.
2. Для достижения приемлемого качества и скорости алгоритма следует комбинировать шаг . Эффективно выбирать значение равное 3, пока коэффициент размытости изображения £ не достигнет уровня 20, т.к. расхождения показателей эффективности алгоритма в интервале £ е [5, 20] несущественны для = 1 и = 3 . Далее предпочтительно выбирать
3
2
1
ЙЕ=1 ¿¿=3 1®=5
равным 1, с целью достижения максимального качества автоматической классификации цветных изображений.
Результаты работы алгоритма автоматической классификации цветных изображений представлены на рисунки 3.
▲
Рис. 3. Результаты применения алгоритма. На картинке (а) показано исходное изображение, на (б) - изображение после применения алгоритма. Локализованные объекты определены как фрагменты изображения, имеющие одинаковый цвет.
6. Заключение
Алгоритм автоматической классификации цветных изображений решает одну из основных задач машинного зрения, выделение объектов из всего многообразия информации, представленной на изображении. Алгоритм не зависит от помех типа «освещенность», а также размеров и расположения локализуемых объектов.
Для наиболее быстрой и эффективной работы метода, выявлены рекомендуемые параметры описанного алгоритма. Следует устанавливать первоначальное значение размытости изображения £ равным 5, а шаг выбирать = 3, пока £ не достигнет 20, далее рекомендуется выбирать равным 1 для минимизации ошибки автоматической классификации.
Результаты, полученные с помощью алгоритма автоматической классификации цветных изображений, являются важным этапом в создании таких интеллектуальных систем как: идентификация личности, автоматизации служб безопасности и распознавания рукописного текста.
Литература
1. Лапко А.В., Непараметрические методы классификации и их применение.- Новосибирск: Наука, 1993, 152 с.
2. Sung, K. andPoggio, T. "Example-based learning for view based human face detection." In Proceedings from Image Understanding Workshop, Monterey, CA, 1994
3. Rowley, H., Baluja, S. andKanade, T. "Neural Network Based Face Detection." Computer Vision and Pattern Recognition. 1996
4. Kanade, T. "Picture processing by computer complex and recognition of human faces." Technical report, Kyoto University, Dept. of Information Science. 1973
5. Lucchese L. and Mitra S.K., «Unsupervised Segmentation of Color Images Based on k-Means Clustering in the Chromaticity Plane» to appear in Proc. of IEEE Workshop on Content-Based Access of Images and Video Libraries (CBAIVL'99), Fort Collins, CO, 22 June 1999.
6. Ziliani F. and Jensen B., «Unsupervised Image Segmentation Using the Modified Pyramidal Linking Approach»» Proc. of 1998 Int'l Conf. on Image Processing (ICIP'98), Chicago, IL, 4-7 Oct. 1998, Vol. III, pp. 303-307.