Научная статья на тему 'Метод обнаружения лиц на изображениях с низким разрешением'

Метод обнаружения лиц на изображениях с низким разрешением Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
103
23
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДЕТЕКТИРОВАНИЕ ЛИЦА / FACE DETECTION / РАСПОЗНАВАНИЕ ЛИЦА / FACE RECOGNITION / МАТРИЦА ЯРКОСТИ / BRIGHTNESS MATRIX

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Рыбак Я.В.

Приведены результаты исследования метода детектирования и распознавания лиц на изображениях с низким разрешением, передаваемых по узкополосным каналам связи в системах видеонаблюдения. Показана устойчивость метода к изменениям яркостной составляющей изображения. Приведены результаты тестирования предложенных алгоритмов детектирования и распознавания лиц на распространенных базах изображений лиц, позволяющие сделать вывод о перспективности предложенных методов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Рыбак Я.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Method of persons detection on images with the low permission

Results of research of a method of face detecting and identification on images with the low resolution, transferred via narrow-band communication channels in video observation systems are resulted. Method's ability to withstand changes of brightness image component is shown. Results of examines of the offered algorithms of face detecting and recognition on widespread persons images bases are shown, which allows the drawing of conclusions regarding the potential performance capability of the offered method.

Текст научной работы на тему «Метод обнаружения лиц на изображениях с низким разрешением»

УДК 621.387

Я. В. Рыбак

Санкт-Петербургский государственный университет телекоммуникаций

им. проф. М. А. Бонч-Бруевича

| Метод обнаружения лиц на изображениях с низким разрешением

Приведены результаты исследования метода детектирования и распознавания лиц на изображениях с низким разрешением, передаваемых по узкополосным каналам связи в системах видеонаблюдения. Показана устойчивость метода к изменениям яркостной составляющей изображения. Приведены результаты тестирования предложенных алгоритмов детектирования и распознавания лиц на распространенных базах изображений лиц, позволяющие сделать вывод о перспективности предложенных методов.

Детектирование лица, распознавание лица, матрица яркости

Проблема идентификации человека по изображению лица привлекает внимание большого количества исследовательских групп в области обработки изображений и распознавания образов [1]. Биометрическая идентификация человека по изображению лица состоит из двух основных задач: задачи обнаружения лица на изображении и задачи распознавания лица, т. е. вычисления меры близости между изображениями различных лиц, находящимися в базе данных. При решении этих задач возникают ошибки двоякого характера. Ошибка первого рода состоит в том, что алгоритм распознавания ошибочно отнесет неизвестное лицо к одному из известных лиц. Эта ошибка характеризуется вероятностью ошибочного принятия решения (False accepting rate - FAR). В результате ошибки второго рода алгоритм распознавания ошибочно относит известное лицо к неизвестным. Вероятность такой ошибки есть вероятность пропуска (False rejecting rate - FRR).

Согласно известным результатам [1] современные системы распознавания лиц способны их идентифицировать с высокой надежностью, которая, однако, существенно зависит от размеров лица, его расположения и условий освещенности1. Так, при работе лучших алгоритмов в условиях контролируемой освещенности для изображений со сверхвысоким разрешением (размер лица 400 пикселей и более) при ошибке первого рода 0.1% ошибка второго рода составляет всего 1%. В условиях неконтролируемой освещенности на изображениях сверхвысокого разрешения при ошибке первого рода 0.1% ошибка второго рода достигает 10... 15% [1]. Приведенные результаты достигнуты лучшими на настоящий момент алгоритмами распознавания на изображениях лиц строго анфас, взятыми из нормализованных баз изображений.

В настоящее время для решения задачи распознавания лиц применяются алгоритмы, основанные на статистическом анализе изображений, цепях Маркова, эластичных графах, вейвлет-анализе, анализе характерных точек, и алгоритмы, основанные на нейронных сетях. Дадим краткую характеристику наиболее популярным методам.

Метод главных компонент [2] является статистическим методом и применяется для сжатия информации без существенных потерь. Каждое изображение базы данных рассматривается как вектор отсчетов (пикселей), из которых формируется матрица базы дан-

1 Под размером лица понимается количество пикселей между центрами зрачков. © Рыбак Я. В., 2008

Известия вузов России. Радиоэлектроника. 2008. Вып. 6======================================

ных. В результате ортогонализации для этой матрицы определяются матрицы собственных чисел и взаимно некоррелированных собственных векторов. В процедуре распознавания участвуют только собственные векторы, соответствующие наибольшим собственным числам, количество которых определяется заранее. За счет ортогонализации объем учитываемых данных сокращается в наибольшей степени при заданных вероятностях ошибок. Основной недостаток этого метода заключается в высоких требованиях к условиям съемки и в необходимости качественной предварительной обработки изображения.

Линейный дискриминантный анализ [3] заключается в выборе проекции пространства изображений на пространство признаков, минимизирующей внутриклассовое и максимизирующей межклассовое расстояния в пространстве признаков. Для данного метода свойственна высокая точность распознавания.

Методы на основе скрытых марковских моделей [4] являются одним из наиболее мощных инструментов для решения задачи распознавания лиц. Впервые идея применения скрытой одномерной марковской модели была предложена Samaria [5]. В наиболее распространенных марковских моделях первого порядка полагается, что каждое последующее состояние зависит только от текущего состояния. В распознавании образов скрытые марковские модели применяются следующим образом. Каждому классу изображений ставится в соответствие своя модель. Распознаваемый образ представляется в виде последовательности наблюдений, и для каждой модели вычисляется вероятность того, что эта последовательность могла быть сгенерирована именно этой моделью. Недостатком такого подхода является то, что скрытые марковские модели обладают плохой различающей способностью, т. е. алгоритм обучения максимизирует отклик на свои классы, но не минимизирует отклик на другие классы.

Наряду с описанными методами существует большое число других оригинальных подходов и методов, заслуживающих отдельного внимания. Подробные обзоры современных методов можно найти в работах [2]-[4].

Большинство работ по распознаванию лиц направлено на решение задач биометрической идентификации человека в охранных системах и системах ограничения доступа. Специфика этих задач заключается в том, что алгоритму распознавания предъявляется изображение, полученное при определенных и заранее известных условиях съемки, поскольку не составляет труда оборудовать контрольно-пропускной пункт необходимым количеством источников освещения и видеокамер, обеспечивающих требуемое качество изображения. Однако в ряде случаев возникает задача передачи изображений по узкополосным каналам связи, в частности через сети мобильных операторов связи. В таком случае возможно либо уменьшить разрешение изображения с сохранением его качества, либо оставить изображение в высоком разрешении, но с повышением коэффициента компрессии. Последний вариант неприемлем, так как при повышении коэффициента компрессии в большинстве случаев теряются мелкие детали на изображениях, что делает невозможным детектирование лица человека и последующего его распознавания.

Рассмотрим задачу распознавания лиц как поиск лиц на изображениях низкого разрешения. Под портретным изображением будем понимать изображение лица анфас, не скрытого за посторонними предметами и содержащего основные лицевые признаки, такие, 22

как брови, глаза, нос и рот. Размеры лица на изображениях низкого разрешения составляли 75...110 пикселей, а на изображениях сверхнизкого разрешения - менее 75 пикселей. Изображения получены при неконтролируемых условиях освещения. Наличие эмоций и отклонение от вида анфас существенно усложняют задачу распознавания лица, поэтому от алгоритмов распознавания лиц не приходится ожидать столь высокой надежности, как при нормализованных условиях. В данной постановке задачи целесообразно говорить о поиске нескольких лиц, наиболее похожих на лицо-запрос.

Основная проблема при работе с изображениями низкого и сверхнизкого разрешений связана с невозможностью точной локализации основных лицевых признаков (глаз, бровей, носа и рта) из-за погрешностей дискретизации растрового изображения, наличия бликов, теней или помех, что, в свою очередь, не позволяет применять достаточно точные алгоритмы, оперирующие с этими признаками. В данном случае наиболее распространенной и робастной техникой является переход от исходного изображения к его специальному представлению. Примерами такого перехода могут служить применение преобразования Фурье или вейвлет-преобразования [4].

В настоящей статье рассмотрен новый подход, предполагающий переход от исходного изображения к так называемой матрице изменения яркостей. Указанный подход обеспечивает устойчивость алгоритмов детектирования и идентификации лиц к вариации условий освещенности и не требует предварительной обработки изображения - выравнивания гистограммы и нормализации яркости.

Мера близости на изображениях. В задачах детектирования и распознавания лиц ключевым моментом является введение меры близости на изображениях. Мера близости должна удовлетворять аксиомам метрики и кроме того учитывать особенности восприятия изображений зрительной системой человека: малую чувствительность к искажениям яркости на изображениях, к наличию теней и бликов.

Зрительная система человека обладает не только возможностью анализа изменений яркости, но и семантическими возможностями структурирования (выделения на изображении целостных сравнительно простых структур), узнавания (отнесения воспринимаемого изображения к категории уже известных), целостности (мыслительной достройкой совокупности воспринимаемых элементарных объектов изображения до его целого образа). Она придает большее значение качественным, а не количественным различиям. Ввиду этого процедура сравнения изображений лиц плохо описывается в рамках классических метрик даже в том случае, когда осуществлен переход от исходного изображения к какому-либо его специальному представлению.

Примером подходящей меры близости для сравнения изображений лиц может служить семейство псевдометрик, определяемых выражением

п т 2

рш (1, -1) = Е Е х2 П0 ^ Х1 =1 х2 =1 ' =1

где I = I (Х1, Х2), J = J (Х1, Х2 ) - монохромные изображения с размерами п х т; юх х > 0 - весовые коэффициенты; 9 - функция Хэвисайда; (•) - знаковая функция.

di

sgn

дх,) la*,-

dJ

(1)

Можно показать, что введенная мера близости удовлетворяет набору аксиом:

1. рш (I,у) * о.

2. I = У (I, У) = 0.

3. рт (I,У) = рт (У,I).

Меру близости, удовлетворяющую указанному набору аксиом, в классической литературе [6] принято называть псевдометрикой в силу того, что вторая аксиома выполняется только в одну сторону, т. е. из равенства меры близости нулю, вообще говоря, не следует равенства изображений. В то же время, в некоторых современных работах [7] меры близости, удовлетворяющие аксиомам 1-3, называют метрикой. В рамках настоящей статьи будем придерживаться классической трактовки понятия метрики и в дальнейшем называть меру близости (1) псевдометрикой.

Как следует из выражения (1), введенная псевдометрика оперирует со знаками частных производных, что придает мере близости устойчивость относительно вариации яркости изображения.

Рассмотрим важное свойство введенной псевдометрики. Поскольку I и У - монохромные изображения с размерами п х т, то I, У е Vn,m , где V- пространство изображений.

Введем отношение эквивалентности а между изображениями. Будем говорить, что изображение I эквивалентно У, если ри (I,У) = 0 . Определим множество О}, состоящее из

всех эквивалентных I изображений: а! = {У| У ~ I, У е Vn,m} . Множество о будем называть классом эквивалентности по отношению к а. Тогда имеет место следующее утверждение.

Утверждение. Изображение У е 01 тогда и только тогда, когда У (Х2) =

= / [I (Х1, Х2 )] , где / [•] - строго монотонно возрастающая функция на V, т. е. для любых

а, Ь е Ы, а < Ь выполняется неравенство / (а) < / (Ь) .

Рассмотрим некоторые примеры использования данного свойства. Если у исходного изображения изменить яркость и/или контрастность, то с точки зрения введенной псевдометрики исходное и искаженное изображения будут неразличимыми. Кроме того, ограничениям, накладываемым на функцию /, удовлетворяют монотонные искажения яркостной характеристики изображения, которые возникают при формировании растровых изображений цифровыми фотосенсорами и соответствуют особенностям восприятия изображений зрительной системой человека. В большинстве случаев эти искажения носят логарифмический характер.

Представление изображения в виде матрицы изменения яркостей. Для решения задач детектирования и идентификации лиц с помощью псевдометрики (1) осуществлен переход от исходного изображения к матрице изменения яркостей, элементами которой являются пары чисел, соответствующие знакам частных производных от яркости исходного изображения в каждой точке:

MlJ =

sgn (д1/ дх1 )| (x, x), sgn (дЦ дХ2 )| (x, ^)

где 5.//ЗХх ^ = I (х1+1, х^ I (х1, х^ \ ; \ - шаг расположения пикселей.

На рис. 1 изображены шаблон лица и соответствующая ему матрица изменения яркостей. Построение этой матрицы сводится к выполнению простейшей операции поэлементного сравнения двух массивов, а вычисление псевдометрики (1) соответствует вычислению метрики Хэмминга для матриц изменения яркостей, т. е. подсчету количества совпадающих элементов.

Детектирование лиц на изображениях. Прежде чем решать задачу распознавания лиц, необходимо детектировать лицо на изображении, т. е. найти область изображения, содержащую основные лицевые признаки (такие, как глаза, брови, рот и нос) и не содержащую элементов фона. Процедура детектирования лиц реализована сравнением участков входного изображения с шаблоном лица на основе введенной псевдометрики (1). В качестве шаблона лица выступает "усредненное" лицо (рис. 1, а), построенное по обучающей

1 N

выборке по алгоритму, описываемому выражением Т = — ^ , где N - количество

N

k=1

изображений лиц в обучающей выборке; ^^ - изображения лиц.

Поскольку на изображениях могут находиться лица разного размера, то для детектирования необходимо просмотреть входное изображение на нескольких масштабах.

Как и в задаче распознавания лиц, в задаче детектирования тоже встречаются ошибки двоякого характера. Ошибка первого рода - в необнаружении известного лица, а ошибка второго рода - в ошибочной классификации изображения как изображения известного лица.

Как следует из выражения (1), одним из параметров при вычислении меры близости является размер сравниваемых изображений. Очевидно, что при изменении масштаба изображения результат сравнения будет изменяться. Кроме того, от размера сравниваемых изображений зависит и объем вычислительных затрат, необходимых для вычисления псевдометрики (1). Таким образом, возникает задача выбора оптимального размера шаблона лица с точки зрения вычислительных затрат при ограничении на ошибки детектирования первого и второго родов.

т

L

3

■■■DHi

Рис. 1

а

Для оценки зависимости ошибок FRR и FAR от размера выборки изображений рассмотрим две выборки: первую, составленную из изображений лиц , и вторую - из изображений, не являющихся лицами QH . Ввиду того, что элементы выборок случайны, значения меры близости между шаблоном лица T и изображениями из выборок можно считать случайными величинами: ^ = ри (T,I), I ; П = Ри (T,I), I е .

Поскольку на изображения влияют множество независимых случайных факторов, а мера близости вычисляется как сумма случайных событий, случайные величины и п можно считать распределенными по нормальному закону:

/л (X ) = Т2

1

exp

Tía r

( X - тл )2

2стЛ

2

1

rexp

71(7.

( X - тн ) 2ct2

где в качестве параметров распределения используются статистические оценки:

1 N 1 N 2 1 N 1 N 2

1E ; =NTT1E (^ - m) ; m=- E n; =— E (n - m) •

N

N

N

mл = — л N

i=1

i-1

i=1

i-1

В качестве оценок для ошибок детектирования первого и второго родов примем следующие величины:

1 T^

FAR = J /л ( x) dx, FRR = J fH ( x) dx,

где 0 < Тл < 1 - пороговая величина принятия решения, выбираемая из условия равенства

ошибки первого рода заданной величине.

На рис. 2 представлены зависимость ошибки первого рода от размера классификатора п при заданном уровне ошибки второго рода (кривая 1) и аппроксимация экспериментальных данных экспоненциальной функцией (кривая 2). Оценка зависимости ошибок детектирования лиц от размера классификатора (кривая 1) получена на изображениях базы ВюГО [1]. Как видно из рис. 2, с увеличением размера классификатора ошибка детектирования снижается.

Немонотонное поведение графика ошибки объясняется влиянием существенной неопределенности входных данных, например случайным характером дискретизации, обусловленным положением лица относительно растровой сетки при масштабировании изображений. Количество арифметических операций, требуемых для вычисления меры близости между участком изображения и шаблоном лица с размерами

п х п , пропорционально п2, при этом для поиска лица на изображении с размерами Рис. 2 h х w потребуется количество операций,

FAR

0.75

FRR = 0.05

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0.5 -

0.25

0

В соответствии с установившейся в теории распознавания терминологией далее выборка изображений называется классификатором [8]. 26

0

л

2

пропорциональное n hw. Считая размер изображения постоянным и выражая его через размер шаблона, получим, что вычислительная сложность алгоритма детектирования про-4

порциональна n .

Одним из способов сокращения вычислительных затрат является каскадная классификация [8]. Ее суть заключается в последовательном применении классификаторов к изображению. Первый классификатор отсеивает большое количество участков изображения, не являющихся лицами. Последующие классификаторы осуществляют более тонкую проверку для оставшихся участков изображения, при этом каждый последующий классификатор вычисляется только для той области изображения, в которой отклик предыдущего классификатора превосходит заданное пороговое значение. Участки изображения, преодолевшие все стадии классификации, считаются лицами.

Задача распознавания образов может быть описана как в терминах мер близости, так и в терминах фильтров и классификаторов. В первом случае близким образам соответствует малое значение меры близости, в то время как в терминологии классификаторов искомому образу соответствует высокое значение отклика классификатора. Каскадная классификация описана в терминологии классификаторов. После нормировки псевдометрики (1) выбором весовых коэффициентов соответствующий ей классификатор можно записать как H (I) = 1 - ри (I, T).

На основе полученной зависимости ошибок детектирования от размера классификатора рассмотрим задачу минимизации вычислительных затрат при ограничениях на ошибку второго рода и фиксированной ошибке первого рода. Можно показать, что количество арифметических операций, необходимых для каскадного детектирования, выражается следующим образом:

Q(s) = с ts4 ÜFRR (sk),

j=1 k=i

где s = (si, S2, ••■, sp) - вектор размеров классификаторов (Sj > 2); с = const; FRR (s) -

зависимость ошибки второго рода от размера классификатора при фиксированной ошибке первого рода.

Поскольку при каскадном детектировании лиц каждый последующий классификатор применяется лишь к той области, для которой отклик предыдущего классификатора превосходит заданное пороговое значение, ограничение на ошибку детектирования накладывается только на последний классификатор в каскаде: FRR (Sp) < ßo.

Таким образом, необходимо решить следующую оптимизационную задачу:

¿s4 fiFRR (sk ) ^ min, FRR (Sp) <ßo, Sj e N, Sj < 2. (2)

j=1 k=1

Как следует из (2), целевая функция нелинейна, поэтому ограничение на дискретность решения существенным образом усложняет задачу.

Найдем непрерывное решение поставленной задачи и в окрестности точки минимума выберем такое дискретное решение, которому соответствует минимальное значение целевой функции. Кроме того, экспериментально показано, что ошибка второго рода FRR

27

экспоненциально убывает с ростом размера классификатора поэтому для решения задачи (2) аппроксимируем экспериментальную зависимость (см. рис. 2, кривая 1) методом

наименьших квадратов функцией f (n) = a^e онная задача примет вид

(см. рис. 2, кривая 2). Тогда оптимизаци-

j-1

al Z sk

к=1

_as

min , a0e 1 p < ß0, s < 2 .

(3)

p с -I ^

V1 4

SjaQ exp

j=1

Решение непрерывной задачи (3) получено с помощью пакета Optimization toolbox системы MATLAB.

На рис. 3 представлены графики зависимости ускорения вычислений r (увеличения относительного количества процедур сравнения, выполняемых в единицу времени) детектирования лиц от числа классификаторов в каскаде p .

Результаты тестирования алгоритма детектирования лиц. Предложенный алгоритм детектирования лиц на основе псевдометрики был протестирован на базах изображений лиц ORL3 [9], BioID4,Yale, Yale B5, Libor Spacek6.

В настоящее время общепринятая методика оценки ошибок детектирования лиц отсутствует. В некоторых работах для определения ошибки второго рода количество неправильно классифицированных изображений делится на количество изображений в базе. В других работах при расчете того же показателя в знаменателе используют количество сравнений шаблона лица с участками анализируемого изображения. Например при анализе изображения с размерами 640*480 пикселей с применением шаблона с размерами 20*20 пикселей, для поиска лиц произвольного размера необходимо проанализировать 12.. .15 масштабов, что в итоге сводится примерно к 100 000 сравнений шаблона лица с участками изображения.

В табл. 1 представлены результаты тестирования алгоритма детектирования лиц в виде абсолютных значений ошибок, т. е. количества L участков изображений, ошибочно принятых за лица для ошибки второго рода, и количества H не найденных лиц для ошибки первого рода. В таблице используются следующие обозначения: - количество изображений в базе;

Ыл - количество лиц на изображениях; FCp

- средний размер лица (количество пикселей между центрами зрачков).

Как следует из результатов проведенных исследований, предложенный метод детектирования лиц продемонстрировал вполне приемлемое качество работы на 6 9 p изображениях сверхнизкого разрешения

Рис. 3

2.4

1.7 -

http://www.cam-orl.co.uk/facedatabase.html

4 http://www.bioid.com/downloads/facedb

5 http://www.bioid.com/downloads/facedb

6 Spacek L. База изображений лиц // URL: http://cswww.essex.ac.uk/mv/allfaces/index.html 28

an

l

======================================Известия вузов России. Радиоэлектроника. 2008. Вып. 6

(размер лица меньше 75 пикселей). При этом на изображениях из баз Ли-бора Спасека и ORL получены достаточно хорошие оценки надежности с учетом специфики этих изображений.

Задача распознавания лиц заключалась в вычислении меры близости между лицом-запросом и всеми лицами из базы изображений и поиске наиболее близких лиц либо таких лиц, для которых мера близости не превышала заданного порогового значения. В качестве меры близости, как и при решении задачи детектирования, использовалась введенная псевдометрика (1). Основные отличия в применении псевдометрики в задачах детектирования и распознавания лиц связаны с изменением размеров сравниваемых образов и используемых весовых коэффициентов. Для процедуры детектирования лиц достаточно изображений меньших размеров (размер лица 20-30 пикселей), поскольку требуется уловить только основные особенности лица. В процедуре распознавания лиц необходимо отличать одно лицо от другого, следовательно, требуется более подробное изображение (размер лица более 30 пикселей).

В настоящей статье задача распознавания лиц трактовалась как задача поиска в базе изображений лиц, наиболее похожих на лицо-запрос. При таком подходе алгоритм поиска портретных изображений состоял из следующих этапов:

• детектирования лиц-запросов на изображении;

• вычисления матрицы изменения яркостей;

• подбора размеров для всех найденных лиц;

• сравнения матриц изменения яркостей лиц-запросов со всеми матрицами изменения яркостей из базы изображений лиц;

• предоставления пользователю набора первых наиболее релевантных изображений для каждого найденного лица на изображении.

Одним из недостатков методов распознавания на основе низкоуровневых признаков (в рассмотренном случае - на основе сочетания знаков частных производных яркости изображения) является отсутствие аффинной инвариантности, поскольку сдвиг одного изображения относительно другого приводит к существенному искажению результата сравнения. Такое смещение изображений главным образом связано со случайным характером дискретизации, обусловленным расположением лица относительно растровой сетки при масштабировании изображения. Кроме того, изменение ракурса съемки и наклон головы также вносят свой вклад в неточность положения лица внутри детектируемой области.

Наличие неточностей положения лица на изображении приводит к тому, что алгоритм сравнения изображений реагирует не столько на их различие, сколько на положение лица в кадре, что является дополнительным источником ошибок распознавания. Для устранения этого негативного фактора можно предложить два подхода. Первый заключается в дополнительной локализации лица в кадре, например посредством поиска координат центров зрачков, и последующей корректировки изображения. Второй способ состоит в сравнении двух изображений для различных относительных смещений и углов наклона и выборе минималь-

Таблица 1

База Параметры изображений N* F 1 ср H L

ORL 92x112, 8 Gray 400 32 3 3

BioID 384x286, 8 Gray 1521 55 168 78

Yale B 640x480, 8 Gray 650 92 151 138

Libor Spacek 200x200, 24 RGB 7900 38 27 45

Известия вузов России. Радиоэлектроника. 2008. Вып. 6======================================

ного расстояния (наилучшего совпадения) между сравниваемыми образами. Очевидным недостатком первого подхода является невозможность точного определения координат центров зрачков на изображениях низкого разрешения. Второй подход влечет за собой дополнительную вычислительную нагрузку. Так, для сравнения лиц при трех различных углах наклона и при относительных смещениях в 3 пикселя по каждой координате потребуется осуществить примерно пятьсот сравнений, а если добавить еще и некоторые изменения масштаба, то количество сравнений может возрасти до нескольких тысяч. Естественным шагом в данном случае является переход от полного перебора к методам направленного поиска. Идея метода направленного поиска глобального минимума заключается в вычислении меры близости для смещений в окрестности нулевого отклонения и в дальнейшем движении в направлении максимального убывания меры близости (в соответствии с методом наискорейшего спуска). Однако этот подход чреват некоторым снижением надежности распознавания, поскольку градиентные методы не всегда сходятся к глобальному экстремуму.

Результаты вычислительных экспериментов [8], проведенных на изображениях из базы ORL, свидетельствуют о 150-кратном ускорении алгоритма распознавания лиц с применением метода наискорейшего спуска для поиска оптимального совпадения сравниваемых лиц. При этом сохранялись удовлетворительные показатели надежности.

Результаты тестирования алгоритма распознавания лиц. Предложенные алгоритмы распознавания лиц были протестированы на базе изображений ORL и на трех выборках из базы Либора Спасека. Для оценки надежности алгоритма распознавания лиц изображения из тестовых баз были распределены по классам, состоящим из изображений лиц одного человека. Затем для всей базы вычислялась матрица близости, которая строилась следующим образом: Djj = р (F, Fj), где Fi, Fj - изображения лиц. Таким образом, каждая i-я строка матрицы

близости содержала расстояния от лица Fi до элементов базы Fj, j = 1, 2, ..., Z, где Z - количество элементов в тестовой выборке. По матрице близости для каждого лица Fi находился

ближайший элемент Fk, такой, что D^ = min Dj. Если изображения лиц F и Fk принадлежу' &

жали одному классу, то считалось, что алгоритм распознавания лиц отработал успешно.

Рассчитанная описанным образом ошибка распознавания лиц называется равной нормой ошибки (Equal error rate - ERR) и соответствует ситуации, когда вероятность ошибки первого рода равна вероятности ошибки второго рода. В табл. 2 приведены результаты тестирования алгоритма распознавания лиц на основе псевдометрики (1) на изображениях из базы ORL и базы Либора Спасека (Nn - количество персон (классов изображений лиц); NH3 - количество изображений для каждой персоны).

Сравнение достигнутой предложенным методом надежности распознавания с известными результатами на базе изображений ORL [9] представлено в табл. 3. Как следует из нее, предложенный алгоритм распознавания лиц, основанный на переходе от исходного изображения к матрице изменения яркостей (последняя строка в табл. 3) с мерой близости (1), продемонстрировал надежность распознавания, не уступающую другим известным алгоритмам. Основным отличием предложенного метода является то, что он не требует 30

Таблица 2

База Nimg NP F 1 ср ERR, %

ORL 400 40 10 32 5.5

Yale B 165 15 11 48 4.0

Libor Spacek 1000 200 5 38 5.0

Libor Spacek 1125 375 3 38 5.3

Libor Spacek 7190 375 20 38 4.0

Таблица 3

Алгоритм (1 - ERR ), %

Метод главных компонент 80

Линейный дискриминант Фишера 91

Одномерная марковская модель 84

Двумерная марковская модель 99.5

Вейвлеты Габора 95.5

Матрица изменения яркостей 94.5

нормализации базы лиц и предварительной обработки изображения, по вычислительным затратам сравнимой с самой процедурой распознавания.

Как следует из результатов проведенных исследований, предложенные алгоритмы детектирования и идентификации лиц продемонстрировали вполне приемлемое качество работы на изображениях сверхнизкого разрешения (когда размер лица на изображении составлял меньше 75 пикселей). При этом на изображениях из баз Либора Спасека и ORL получены достаточно хорошие оценки надежности с учетом специфики этих изображений.

Библиографический список

1. FRVT 2006 and ICE 2006 Large-Scale Results / P. J. Phillips, W. T. Scruggs, A. J. O'Toole et al. // National institute of standards and technology, Gaithersburg, 2007. P 521-530.

2. Pentland A., Moghaddam B., Starner T. View-based and modular eigenspaces for face recognition // Proc. of the IEEE Conf. on comp. vision and pattern recogn., 21-23 June 1994, Seattle, Washington, USA. Washington, IEEE, 1994. P. 84-91.

3. Etemad K., Chellappa R. Discriminant analysis for recognition of human face images // Journ. of the opt. soc. of America A. 1997. Vol. 14, № 8. P. 1724-1733.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. Martinez A. M., Kak A. C. PCA versus LDA // IEEE Trans. on pat. Anal. and mach. intel. 2001. Vol. PAMI-23, № 2. P. 228-233.

5. Samaria F., Young S. HMM-based architecture for face identification // Image and vision computing. 1994. Vol. 12, № 8. P. 537-543.

6. Математическая энциклопедия. Т. 3. М.: Сов. энцикл. 1982. 1183 с.

7. Рыжов А. П. Элементы теории нечетких множеств и измерения нечеткости М.: Диалог-МГУ, 1998. 116 с.

8. Froba B., Kulbeck C. Real-time face detection using edge-orientation matching // Proc. AVBPA 2001. P. 78-83.

9. Интернет-математика 2007: Сб. тр. Екатеринбург: Изд-во Уральского ун-та, 2007. 224 с.

Y. V. Rybak

Saint-Petersburg state university of telecommunication named on prof. M. A. Bonch-Bruevich

Method of persons detection on images with the low permission

Results of research of a method of face detecting and identification on images with the low resolution, transferred via narrow-band communication channels in video observation systems are resulted. Method's ability to withstand changes of brightness image component is shown. Results of examines of the offered algorithms of face detecting and recognition on widespread persons images bases are shown, which allows the drawing of conclusions regarding the potential performance capability of the offered method.

Face detection, face recognition, brightness matrix

Статья поступила в редакцию 1 декабря 2008 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.