МЕТОДЫ ЦИФРОВОЙ ОБРАБОТКИ ИЗОБРАЖЕНИЙ
УДК 681.327.12
С. В. Дегтярев, А. В. Медведев, С. Ю. Мирошниченко
Курский государственный технический университет
МЕТОД АВТОМАТИЧЕСКОГО КАДРИРОВАНИЯ ЦИФРОВЫХ ПОРТРЕТНЫХ ИЗОБРАЖЕНИЙ ДЛЯ ЦИФРОВЫХ ФОТОАППАРАТОВ
Шссмотрен метод автоматического кадрирования цифровых портретных изображений с центрированием лица в плоскости кадра, предназначенный для встраивания в цифровые фотоаппараты. Метод основан на распознавании глаз и последующей оценке положения лица по их координатам.
На настоящем этапе развития фототехники наибольшей популярностью пользуются цифровые фотоаппараты. Данный факт обусловлен бурным развитием технологий ПЗС-фотоприемных матриц, специализированных процессоров и устройств, обеспечивающих обработку получаемых изображений непосредственно в фотоаппарате. На рынке представлено множество моделей недорогих цифровых фотоаппаратов ведущих мировых фирм-производителей: Sony, Kodak, Olympus, Nikon, Samsung и др. Качество оптики, разрешение и физические размеры ПЗС матриц, стоимость фотоаппаратов различных фирм примерно одинаковы, поэтому при выборе конкретной модели внимание акцентируется на функциональных возможностях, и в том числе на возможностях обработки получаемых изображений.
Одной из наиболее востребованных функций, встраиваемых в цифровые фотоаппараты, является автоматическое кадрирование портретных изображений с центрированием лица человека в плоскости кадра. Существующие методы выделения лица можно разделить на две основные группы: методы сегментации изображения в различных цветовых пространствах [1] и методы оценки положения лица, основанные на распознавании глаз как наиболее информативной его части. Методы первой группы обладают невысокой точностью при съемке в условиях сложного фона, тогда как методы второй группы имеют высокую сложность за счет рекурсивной организации вычислений.
Разработан метод для автоматического кадрирования цифрового портретного изображения на основании распознавания контуров глаз. Контурное описание изображения строится с помощью метода Канни [2], который предполагает свертку исходного изображения f (x,y), x = 1,M, y = 1,N с масками КИХ-фильтров, представляющих дискретные аппроксимации частных производных фильтра Гаусса:
G (x, y, с) = ( g (x, y, с), v (x, y, a)) = (|Vf (x, y, c)|,arg (Vf (x, y, a)),
(1)
• f (x, y )
(2)
>(x, y, с) = arctg
(3)
x2 + y2
(4)
где Gn (x, y, c) = —e 2с2 — функция отклика фильтра Гаусса, с — полуширина функции 2пс 2
отклика Gn (x, y, с).
Способ расчета маски КИХ-фильтра на основании функции отклика приведен в [3]. Полученное с использованием формул (1)—(3) градиентное изображение G (x, y, с) подвергается скелетизации для приведения контурных линий объектов к односвязному виду [4]. Скелетное градиентное изображение gs (x,y,с) формируется следующим образом:
gs (x,У,с) =
= íg (x,y, с), если [g (x,y,c)> g (x + ¡1,y + J\,с)]л[g (x,y,c) > g (x + ¡2, y + J2,с)] [ü, в противном случае где приращения координат ji),(¡2, J2) определяются как:
¡1 = [sin[v(x,y,с)]], ¡2 = -¡1, Jl = [cos[v(x,y,с)]], J2 = -Ji.
Скелетное градиентное изображение gs (x,y,с) преобразуется в двуградационное изображение b (x, y, с) с помощью порогового оператора с гистерезисом [2], основанного на использовании двух пороговых значений
[1, если gs (x,y,с)> t (Ti,T2); [0, в противном случае,
где T1,T2 — автоматически выбираемые пороговые значения (T2 > T1), t(1,T2)— функция выбора одного из значений в зависимости от присутствия в восьмисвязной окрестности текущей точки x, y контурных точек
b (x, y, с) = -
(5)
t(T T ) = JT1, если 3BJ : b (x + ¡,y + j,с) = 1, ¡, j = -1,1;
[T2, в противном случае.
(6)
Пороговое значение Т1 вычисляется с помощью сигма-метода [5] при с = 1,5; значение Т2 — с использованием метода Отсу [6].
Результат выделения контуров на портретном изображении (рис. 1) представлен на рис. 2.
Рис. 1
Рис. 2
Метод автоматического кадрирования цифровых портретнъх изображений для цифровых фотоаппаратов 7
На основании бинарного контурного изображения Ь (х, у, с) строится векторное описание С = {с)}. , каждый элемент С) которого представляет контур объекта
с, =
(а,, а,),( -, ,( Дсг]) =_
- =1, N
/ (а) (а) где а, =( х} >, у) >
- / (а) (а)
координата начала контура; а, = ( х) ', у) '
(7)
координата конца конту-
/ (-) Н\ — / (-) Ы\ „ „ „ „
ра; = ( х) у) '), = < х} ', у) ' > — координаты верхней левой и нижней правой вершин
описанного прямоугольника; Дс- — элементарный вектор контурной линии, описываемый приращением координат относительно предыдущей точки Дс- = ^Д),Ду^ .
Метод построения векторного контурного представления объектов описан в [7].
Сформированное контурное описание подвергается предварительной классификации для снижения трудоемкости процесса распознавания за счет исключения из рассмотрения заведомо неинформативных контуров.
Для предварительной классификации используются следующие признаки:
1. Отношение сторон 5— описанного вокруг контура прямоугольника
И
, если
Дх^Ду^
5-) = ■
д)
Дх(-) :
где Дх)™\ Ду(-) — ширина и высота описанного прямоугольника
Дх
Ду)
Н
если
Дх|-) <Ду(-)
(8)
Дх^ = х)"> - , ДуГ = уГ -уГ .
2. Относительные линейные размеры 55) контура
:(дх« Ду(-))
max
55) =-
max
(М, N )
(9)
3. Относительное расстояние 5т) центра масс контура т) от центра описанного прямо-
угольника —
(с)
5т) = ■
(с)
(-<с,р
хт - х
у? - Л
max (Дх
м
.Ду!-1)
max
(Дх(-), Ду(-))
(10)
т = ( х(т), у(т)) = ^
N - /К, - К, -
ЕЕДСк /ХХ^к ХХДу*
-=1 к=1 -=1 к=1
N.
N
(( > =
х()) у() У^)- У(
' * ' 2 \ 2 ' 2
Те контуры, значение хотя бы одного из параметров (8)—(10) которых превышают априорно установленные пределы, исключаются из контурного описания С.
По окончании предварительной классификации выполняется распознавание, целью которого является поиск контуров, соответствующих открытым глазам человека. При распознавании применяются следующие признаки [8]:
1. Среднее относительное расстояние 5т(- от центра масс т1 контура с( до каждой его
точки
5т( =
N
I
]=1
ЕАс,
Л
( ]
* Л
(к
V к=1
- т,
N • тах(ах((), Ау(()) '
(11)
2. Относительный смещенный момент инерции 5ц
(хУ)
5ц(ху) =
(^))2
(х) (у) Ц( 'Ц(
(12)
.(хУ)
(х) (у)
смещенный момент инерции; ц( ц( '
где ц
ты инерции соответственно:
N
|(хУ) = I
N2 ]=1
(( ] 1Ах/к VV к=1 J
- Ах(т)
— горизонтальный и вертикальный момен-
^ (( ]
Л
1АУ,к
- Ау(т)
V
1 N
ц(х )= 11
((] 1Ах(к
VV к=1 J
- Ах(т)
1 N
, н!у '=1I
VV к=1 J
((] ^ >
N
]=1
1АУ,к
VV
к=1
- Ау(т)
Ах(т) = х(т) - Ау/т) = у(т) - у/().
3. Сумма частот р(( е) верхней части гистограммы р бражения /(х, у), ограниченного прямоугольником (м>1,
/ (, ()
/т
Р,(е)=1 Р (]),
] =Те
участка исходного изо-
(13)
где Те — нижняя граница исследуемой области гистограммы р / (((, (() , выбираемая эмпирически; /тах — максимальное значение яркости изображения / (х, у).
Признаки (11) — (13) не чувствительны к повороту и масштабированию распознаваемого объекта (однако линейные размеры глаза должны составлять не менее 40 точек для достижения точности распознавания не менее 95%), что обеспечивает распознавание лица при любом его положении в плоскости изображения.
В результате распознавания в контурном описании сохраняются только контуры, соответствующие открытым глазам.
Метод автоматического кадрирования цифровъгх портретным: изображений для цифровъгх фотоаппаратов 9
В том случае, если исходное изображение содержит лицо одного человека, кадрирование выполняется следующим образом:
— определяются центры масс контуров, описывающих глаза;
— между центрами масс проводится отрезок, середина которого лежит на оси симметрии лица;
— вычисляется расстояние ёОЕ от глаза до оси симметрии (рис. 3);
— с помощью ёОЕ рассчитываются размеры кадрированного изображения ёК1, ёК2, (рис. 3) на основании априорно определенных зависимостей.
Полученное кадрированное изображение масштабируется до размеров исходного с помощью метода бикубической интерполяции.
Разработанный метод позволяет автоматически кадрировать цифровое портретное изображение вне зависимости от положения лица человека и обладает низкой вычислительной сложностью, что позволяет встраивать его в цифровые фотоаппараты.
список литературы
Рис. 3
1. Kukharev G., Nowosielski A. Fast and Efficient Algorithm for Face Detection in Color Images // Machine Graphics and Vision. 2004.Vol. 13. N. 4. Р. 377—397.
2. J.F.Canny. A Computational AProach to Edge Detection // IEEE Trans. Pattern Recognition and Machine Intelligence. 1986.Vol. 8. № 6. Р. 679—698.
3. Дегтярев С.В., Мирошниченко С.Ю., Стеценко Ю.П. Расчет дискретных аппроксимаций низкочастотного фильтра Тихонова для обработки изображений/ // Известия ТулГТУ. Серия. Вычислительная техника. Информационные технологии. Системы управления. Вып. 1. Вычислительная техника. Тула: Изд-во ТулГТУ, 2006. С. 58—63.
4. Методы цифровой обработки изображений / С.В. Дегтярев, С.С. Садыков, С.С. Тевс, Т.А. Ширабакина. Курск: КурскГТУ, 2001. 167 с.
5. Miroshnichenko S.Yu., Degtyarev S.V., Rukavitsin Yu.A. Adaptive Choice of Global Threshold for Binarization of Gradient Images // Pattern Recognition and Image Analysis. 2005.Vol. 15. №1. Р. 249-251.
6. N.Otsu. A Threshold Selection Method from Gray-Level Histograms // IEEE Trans. Syst . Man Cybern. 1979.Vol. 9, N 1. Р. 62—66.
7. Мирошниченко С.Ю., Мишустин В.Н., Дегтярев С.В. Распознающий аппаратно-программный диагностирующий комплекс // Изв. вузов. Приборостроение. 2005. Т. 48, №2. С. 22—27.
8. Стулов Н.Н. Способ формирования признаков объектов в СТЗ инвариантных к повороту, переносу и изменению масштаба // Системы и методы обработки и анализа информации. М.: Горячая линия — Телеком, 2005. С. 18—24.
Рекомендована кафедрой Поступила в редакцию
вычислительной техники 20.08.07