УДК 004.93
Н.А. Дегтярёв, асп., (4872)35-36-37, [email protected] (Россия, Тула, ТулГУ),
О.А. Кушнир, ассист., (4872)35-36-37, [email protected] (Россия, Тула, ТулГУ),
О.С. Середин, канд.физ.-мат. наук, доц., (4872)35-36-37, [email protected] (Россия, Тула, ТулГУ)
ВЛИЯНИЕ МЕТОДОВ ОЦЕНИВАНИЯ И ПОИСКА ПОЛОЖЕНИЯ ГЛАЗ НА РЕЗУЛЬТАТЫ СРАВНИТЕЛЬНОГО ТЕСТИРОВАНИЯ АЛГОРИТМОВ ПОИСКА ЛИЦ НА ИЗОБРАЖЕНИЯХ
Исследуется влияние методов оценивания и поиска положения глаз на точность сравнительного тестирования алгоритмов поиска лиц на изображениях. В экспериментальном исследовании использовались два алгоритма поиска лиц на изображениях; результаты анализа экспериментов приводятся в виде ROC-кривых и диаграмм точности локализации лиц на изображениях.
Ключевые слова: модели оценивания положения глаз, поиск лиц на изображениях, определение положения глаз внутри прямоугольного фрагмента изображения.
В настоящее время всё большую актуальность приобретают задачи связанные с поиском лиц на изображениях, например, сортировка фотографий в социальных сетях, видеонаблюдение за охраняемыми объектами, интерактивные пользовательские интерфейсы, интерактивные рекламные щиты и т. д. На рынке представлено большое количество программных средств, решающих задачу поиска лиц на изображениях, но каждое из них, как правило, приспособлено под определенную задачу. Следовательно, пользователи алгоритмов поиска лиц на изображениях должны сознательно подходить к выбору соответствующих программных реализаций. Исследования сравнительных тестирований алгоритмов поиска лиц на изображениях обычно содержат лишь обобщение ранее опубликованных результатов или результаты, полученные для конкретного алгоритма. Также осложняет возможность корректного сравнения различных методов поиска лиц на изображениях отсутствие единой тестовой базы. Наиболее полные и объективные исследования приведены в работах [1,3,5,7,9]. Проблема построения единой методики тестирования обусловлена тем, что программные реализации алгоритмов поиска лиц на изображениях по-разному представляют результаты детектирования, например, центром и радиусом окружности, описывающей лицо, центром и размером объемлющего его квадрата, координатами центров глаз, опорными точками контура лица и т.д. В работе [3] предложено унифицировать описание резуль-
татов поиска, а именно представлять найденное лицо координатами центров глаз. Для такой модели описания лица, во-первых, представляется более удобным определение различия двух результатов поиска; во-вторых, алгоритмы распознавания лиц по фотопортрету обычно требуют предварительного совмещения центров глаз обучающей выборки; в-третьих, эксперты быстрее и точнее размечают центры глаз, чем прямоугольные или овальные области. Если лицо описывалось не координатами центров глаз, а прямоугольной областью, то для унификации результатов работы алгоритмов использовался предложенный авторами метод оценивания положения глаз по прямоугольной области [3]. Простота этой методики вызвала ряд критических замечаний при обсуждениях на семинарах и конференциях. В этой статье мы хотим показать, что, несмотря на свою простоту, предложенный нами статистический метод оценивания положения глаз внутри прямоугольного фрагмента не привносит существенных ошибок в сравнительное тестирование алгоритмов поиска лиц на изображениях.
Для экспериментального исследования отобрали два алгоритма поиска лиц на изображениях - FaceSDK версии 2.0 (FSDK) и VeriLook версии 4.0 (VL), разработанных Luxand Inc. и Neurotechnology UAB, соответственно. Реализации именно этих алгоритмов выдают в качестве результата поиска, не только прямоугольный фрагмент, но и предполагаемые координаты глаз. Таким образом, можно сравнить координаты, которые предлагает наш метод оценивания, с теми, которые выдает непосредственно алгоритм, нашедший прямоугольный фрагмент. Более того, в этом же фрагменте будем определять положение глаз с использованием непосредственного поиска. В качестве такой процедуры выбрали хорошо зарекомендовавший себя [8] алгоритм поиска глаз на изображениях, опирающийся на метод Average of Synthetic Exact Filters (ASE фильтр), предложенный Д. Болме в работе [2]. В качестве результатов сравнительного анализа влияния методов оценивания и поиска положения глаз будут приведены ROC-кривые и диаграммы точности локализации глаз на изображениях на базе существенного размера. Также исследуем зависимость параметров настройки предложенного метода оценивания положения координат глаз от размеров лиц, найденных на изображениях.
Модель точности локализации лиц
Сравнительное тестирование алгоритмов поиска лиц на изображениях начинается с определения оператором действительного положения координат глаз на представленном изображении. Затем на данном изображении происходит поиск лица одним из алгоритмов детектирования. В случае, когда алгоритм представляет результаты поиска лиц в виде координат центров глаз, будем считать, что лицо найдено правильно, если экс-
периментальное положение глаз попадает в области диаметром DEyes вокруг действительного положения глаз (рис. 1, а).
Рис. 1. EyeLeft и EyeRight - найденные координаты центров зрачков левого и правого глаза соответственно; lEyes - межглазное расстояние;
^HEyes, lREyes > lHEyes - расстояние между верхней границей найденного
квадратного фрагмента лица и центром левого или правого глаза;
Sizenead - размер стороны квадрата, описывающего найденное лицо;
DEyes - диаметр области допустимых отклонений найденных глаз
от их истинного положения; Centernead - координаты центра найденного прямоугольного фрагмента
Эти области рассчитываются как DEyes = 2а х lEyes, а = const, где
параметр а е [0,2;0,25] выбирается исходя из экспериментальных данных и имеет смысл максимального допустимого отклонения найденных глаз от их истинного положения в долях межглазного расстояния. В экспериментах, проводимых в рамках данной работы, параметр был зафиксирован и равнялся 0,25. Заметим, что впервые такая модель точности локализации была предложена О. Джесорски [5]. Очевидно, что если результат поиска лиц представлен прямоугольной областью, то модель точности локализации требует «приведения» такого результата к представлению в виде координат центров глаз при помощи методов оценивания или поиска положения глаз. Оценивание положения глаз отличается от поиска тем, что в первом случае опираемся только на статистическую информацию о положении глаз в зависимости от размера найденного фрагмента. В случае поиска анализируем содержание фрагмента изображения соответствующим
алгоритмом детектирования глаз, тем самым используя дополнительную информацию.
Метод оценивания положения глаз по прямоугольному фрагменту
Пусть имеется изображение лица в анфас, без наклона головы (рис. 1, б), и алгоритм поиска определил его центр и размер (СеШег^^ и
Sizehead соответственно). Очевидно, что глаза на таком изображении располагаются симметрично относительно вертикальной оси, находясь от неё на половине расстояния между ними 1£уе$ /2, и на одинаковом расстоянии
1нЕуе8 от верхней границы области найденного лица. Таким образом, абсолютные координаты глаз можно найти, используя соотношения:
ЕУеЩШ = ЕУеЬе/г = СеШеГ_Иеай + lHEyes - SizeHeаd / 2 ,
= Сепе^ - lEyes / 2, ЕУе1е/1 = CenterHead + lEyes / 2 . Будем оценивать параметры конкретного алгоритма поиска лиц на изображениях, как среднестатистическое для большого числа изображений, на которых экспертом были указаны координаты центров глаз. Специфика работы конкретного алгоритма определяется двумя критериями, а именно коэффициентом А - среднее значение пропорции расстояния от верхней границы до центра глаз lнEyes к вертикальному размеру возвращаемой области лица; и коэффициентом В - среднее значение пропорции расстояния между глазами lEyes к горизонтальному размеру возвращаемой
области лица. Они вычисляются, используя информацию об истинном положении глаз на изображении как
А
г N . \ ( N
г
\ г=1
X lHEyes / Sгzehead / N, В = X lEyes / Sгzehead
\ г=1
/ N,
где lEyes,Sгzehlead и lн[Eyes - соответствующие метрики, измеренные для г -
го изображения в тестовой базе, N - число объектов, используемых для вычисления этих коэффициентов.
Тогда координаты глаз для лица заданного размера, найденного конкретным алгоритмом, определяются как:
^ЩШ = ^Ье/г = CenterHead + SгzeHead(A - °.5),
= Сепгег^ - SгzeHead(B / 2),
^Ье/г = Сепгег^ + SгzeHead (В / 2) ■ В случае, если на изображении представлено лицо в анфас с наклоном головы, будем определять lнEyes как среднее арифметическое рас-
204
стояний пары глаз от верхней границы области найденного лица, т.е.
Метод поиска положения глаз в прямоугольном фрагменте
В качестве процедуры поиска координат глаз мы выбрали хорошо зарекомендовавший себя [8] алгоритм поиска глаз на изображениях, опирающийся на метод Average of Synthetic Exact Filters (ASE фильтр), предложенный Д. Болме в работе [2].
Для ASE фильтра, все параметры модели полностью определяются для каждого изображения в обучающей выборке, что резко контрастирует с такими разработанными методами, как, например, Synthetic Discriminant Functions (SDFs), которые определяют только один параметр модели на каждом из изображений. К преимуществам ASE фильтра относится устойчивость к переобучению (так как итоговый фильтр является усреднением точных фильтров (exact filters), полученных для всей обучающей выборки), большая гибкость и стабильность результатов независимо от сложности фона изображения.
Экспериментальное тестирование методов оценивания и поиска положения глаз на изображениях
Для проверки гипотезы о том, что предложенная модель оценивания положения глаз применима в задачах сравнительного тестирования алгоритмов поиска лиц на изображениях, был проведён ряд экспериментов. Протестированы алгоритмы, одновременно описывающие найденные лица как координатами центров глаз, так и прямоугольными областями - FSDK и VL. База изображений была идентична, использованной в работе [3] и состояла из 59888 изображений; из них 11677 изображений содержали лица, а 48211 не содержали лиц. Для нахождения коэффициентов модели оценивания положения глаз использовалась база изображений Georgian Tech Face Database [4].
Коэффициенты модели оценивания положения глаз на изображениях по прямоугольному фрагменту для алгоритмов с различными параметрами настройки представлены в табл. 1,2. Видно, что средние значения коэффициентов модели для различных алгоритмов при разных настройках существенно различаются. Это означает, что разные алгоритмы на одном и том же изображении выделят различающиеся прямоугольные области. Среднее квадратичное отклонение (СКО) для каждого из исследуемых коэффициентов меньше 0.001, из чего можно сделать вывод, что размер прямоугольной области практически не зависит от уровня «строгости» алгоритма поиска лиц на изображениях.
Согласно используемой модели точности локализации, качество поиска лиц на изображениях для конкретного алгоритма, может быть охарактеризовано относительным числом правильно найденных лиц при заданном допустимом отклонении положения найденных глаз от их истинного
положения в долях межглазного расстояния а. Относительное число правильно найденных лиц при фиксированном уровне доли межглазного расстояния для предложенного метода оценивания положения глаз по прямоугольному фрагменту и двух методов поиска глаз представлено на рис. 2. Видно, что при значении параметра а = 0.25, использованного в работе [3], различия в процентах правильно найденных лиц при непосредственном поиске глаз и при оценивании их положения с помощью предложенной модели являются несущественными. Отметим, что ASE фильтр имеет наибольшую долю правильно найденных лиц при а < 0.1, но показывает заметно более худшие результаты, чем предложенная модель при а> 0.15, для алгоритма FSDK.
Таблица 1
Коэффициенты модели оценивания положения глаз на изображениях по прямоугольному фрагменту для алгоритма VL
Значение параметра настройки алгоритма Коэф. A Коэф. B
01 0,2509 0,4951
02 0,2509 0,4951
03 0,2509 0,4951
05 0,2509 0,4952
10 0,2507 0,4952
20 0,2506 0,4952
25 0,2507 0,4951
30 0,2506 0,4953
40 0,2504 0,4954
50 0,2504 0,4954
55 0,2506 0,4958
60 0,2503 0,4963
70 0,2499 0,4967
Среднее 0.2506 0.4955
СКО 0.00027 0.00051
В следующем эксперименте проведено сравнение ROC-кривых, полученных для обоих тестируемых алгоритмов, как при непосредственном, так и с использованием ASE фильтра, поиске глаз на изображениях, а так-
же при оценивании положения глаз с помощью предложенной модели (рис. 3). Можно видеть, что различия ROC-кривых являются незначительными и могут быть проигнорированы для задач сравнительного тестирования алгоритмов поиска лиц на изображениях. Более того, предложенная в работе модель оценивания положения глаз по прямоугольному фрагменту уменьшила ошибку первого рода ^КЯ) для алгоритма FSDK, по сравнению с непосредственным поиском глаз исходным алгоритмом.
Таблица 2
Коэффициенты модели оценивания положения глаз на изображениях по прямоугольному фрагменту для алгоритма FSDK
Значение параметра настройки Коэф. A Коэф. B
алгоритма
1 0.4279 0.3649
2 0.4282 0.3649
3 0.4283 0.365
5 0.4289 0,3651
7 0,4287 0,3650
9 0,4287 0,3652
Среднее 0.4285 0.3650
СКО 0.00035 0.00011
Недостатком исследования [3] можно считать то обстоятельство, что вычисление коэффициентов модели оценивания положения глаз внутри прямоугольного фрагмента производилось по изображениям одной базы - Georgian Tech Face Database [4], содержащей изображения лиц, близких по размеру. Более разумной методикой, на наш взгляд, является учет размера найденного фрагмента при подборе коэффициентов A и B. Тогда коэффициенты данной модели будут рассчитываться для заданной группы размеров k как
A
к
X lHEyes / Sizehead
V SizeHead = к
/ N
к
B
к
X
i:
V SizeHead = к
1Eyes / Sizehead
/N
к.
Рис. 2. Относительное число правильно найденных лиц при фиксированном уровне доли межглазного расстояния для предложенного метода оценивания положения глаз по прямоугольному фрагменту и двух методов поиска глаз. Прямоугольные фрагменты найдены алгоритмами VL (а) и FSDK (б)
Рис. 3. ROC-кривые для различных методов оценивания и поиска глаз на изображениях. Зависимость FRR от FAR (в логарифмическом масштабе) для алгоритмов VL (а) и FSDK (б)
На рис. 4 представлены графики значений параметров Ak и B^ в
зависимости от размера фрагмента, содержащего лицо, найденного алгоритмами VL и FSDK соответственно на всей тестовой базе лиц (более 11 тысяч изображений). Видим, что оценка параметров, полученная по Georgian Tech Face Database [4] (750 изображений) безо всякого учета раз-
а б
Рис. 4. Зависимость параметров модели A и B от размеров квадратных фрагментов, найденных алгоритмом VL (а) и FSDK(6). Жирной линией показано значение соответствующего параметра, полученного при его оценке только по базе Georgian Tech Face Database без учет а размеров найденных фрагмент ов
Заключение
Основной проблемой объективного сравнительного тестирования
алгоритмов поиска лиц на изображениях является существование большого числа различных способов представления найденных лиц. Одним из подходов к решению этой проблемы является унификация представления лиц на изображениях посредством их некоторого «преобразования». Очевидно, любое преобразование представления лиц привносит ошибку в результаты сравнительного тестирования алгоритмов поиска лиц на изображениях. В данной работе было исследовано влияние методов оценивания и поиска положения глаз на точность сравнительного тестирования алгоритмов детектирования лиц. Показано, что предложенный в работе [3] метод статистического оценивания положения глаз по прямоугольному фрагменту является легко реализуемым и достаточно точным для целей сравнительного тестирования алгоритмов поиска лиц на изображениях. При максимальном допустимом отклонении найденных глаз от истинного положения в долях межглазного расстояния, равном 0.25, различия в процентах правильно найденных лиц, а также в ROC-кривых при непосредственном поиске глаз и оценивании их положения несущественны (рис. 2,3) и могут быть проигнорированы.
Список литературы
1. J.R. Beveridge [et al.]. Face Detection Algorithm and Feature Performance on FRGC 2.0 Imagery. // First IEEE International Conference on Biometrics: Theory, Applications and Systems. - 2007.
2. Bolme D.S., Draper B.A., Beveridge J.R. / Average of Synthetic Exact Filters // IEEE CVPR 2009. 2009. P. 2105-2112.
3. Degtyarev N., Seredin O. Comparative Testing of Face Detection Algorithms // ICISP 2010, LNCS 6134, Springer, Heidelberg. 2010. P. 200-209.
4. Georgia Tech Face Database. - URL: http://www.anefian.com/ research/face reco.htm .
5. Hjelmas E., Low B.K. Face Detection: A Survey. // Computer Vision and Image Understanding, Vol. 83, Issue 3. 2001. P. 236-274.
6. Jesorsky O., Kirchberg K.J., Frischholz R.W.: Robust face detection using the hausdorff distance // LNCS, June, 2001 P. 90-95.
7. Mohamed, N.M., Mahdi, H. A simple evaluation of face detection algorithms using unpublished static images// 10th International Conference on Intelligent Systems Design and Applications (ISDA 2010), IEEE. 2010. P.1-5.
8. Difficult detection: A comparison of two different approaches to eye detection for unconstrained environments / W.J. Scheirer [et al.] // Proceedings of the 3rd IEEE international conference on Biometrics: Theory, applications and systems. 2009. P. 176-183.
9. Yang M.H., Kriegman D.J., Ahuja N. Detecting faces in images:
A survey. // IEEE Transactions on Pattern analysis and Machine intel. Vol. 24. Issue 1. 2002. P. 34-58.
N.A. Degtyarev, O.A. Kushnir, O.S. Seredin
EFFECT OF EYES DETECTION AND POSITION ESTIMATION METHODS ON THE RESULTS OF COMPARATIVE TESTING OF FACE DETECTION ALGORITHMS
This paper examines the effects of two different face representation conversion techniques: eyes estimation model and eyes detection method - on the results of comparative testing of face detection algorithms. The experiments consist of routine face detections in the variety of images. The analysis of experimental results is given in form of ROC-curves and localization accuracy charts.
Key words: model of eyes position estimation, face detection, eyes detection inside a given rectangular image region.
Получено 07.03.12
УДК 621.833
В.В. Кулешов, канд. техн. наук., доц., (4872) 35-05-52, parents @tula. net (Россия, Тула, ТулГУ)
РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ В МЕХАТРОННЫХ СИСТЕМАХ КОМПЕНСАЦИОННОГО ТИПА
Рассматриваются вопросы построения широкополосной мехатронной системы охваченной обратными связями разных знаков. Предложена методика определения параметров мехатронной системы. Полученные зависимости могут быть использованы при разработке высокоточных систем стабилизации и навигации.
Ключевые слова: мехатронная система, обратные связи, топологический синтез, полоса пропускания, частота среза.
Недостатком существующих мехатронных систем с жесткой отрицательной обратной связью, предназначенных для измерения механических величин (ускорений, давления, угловых скоростей), является низкая точность измерения, так как выбор коэффициента усиления по разомкнутому контуру ограничен условием устойчивости системы и полосой пропускания [1]. Расширение полосы пропускания мехатронной системы можно обеспечить путем введения в систему корректирующих звеньев, что в конечном итоге приводит к незначительному изменению полосы пропускания [2].
Целью данной работы является расширение полосы пропускания в