© Мищенкова Е.С., 2013
®
УДК 004.021 ББК 32
СРАВНИТЕЛЬНЫЙ АНАЛИЗ АЛГОРИТМОВ РАСПОЗНАВАНИЯ ЛИЦ
Мищенкова Екатерина Сергеевна
Магистрант кафедры информационных систем и компьютерного моделирования
Волгоградского государственного университета
Проспект Университетский, 100, 400062 г. Волгоград, Российская Федерация
Аннотация. Описываются и анализируются современные методы распознавания лиц. На основе анализа методов, представляется, что перспективным может являться создание гибридных методов.
Ключевые слова: распознавание лиц, метод Виолы-Джонса, метод главных компонентов, нейронная сеть Хопфилда.
Одним из практических применений теории распознавания образов является распознавание лиц, в задачу которого входит автоматическая локализация лица на изображении и, при необходимости, идентификация человека по лицу. Интерес к процедурам, лежащим в основе процесса локализации и распознавания лиц, довольно значителен в связи с разнообразием их практического применения в таких областях, как охранные системы, верификация, криминалистическая экспертиза, телеконференции, компьютерные игры и т. д.
Технология идентификации личности на основе изображения лица, в отличие от использования других биометрических показателей, не требует физического контакта с устройством и с учетом стремительного развития
цифровой техники является наиболее приемлемой для массового применения. Основной трудностью данной технологии является зависимость качества результата распознавания человека по изображению лица от ракурса, положения, условий освещенности и т. д.
Далее в работе описываются и анализируются современные методы распознавания лиц.
Метод главных компонентов (Principal Component Analysis, PCA). Идея метода состоит в представлении изображений лиц в виде набора (вектора) главных компонентов изображений, называемых «собственные лица» (Eigenfaces). Они, лица, имеют полезное свойство: что изображение, соответствующее каждому такому вектору имеет лицеподобную форму.
Рис. 1. Пример изображений собственных векторов (собственные лица)
Вычисление главных компонентов сводится к вычислению собственных векторов и собственных значений ковариационной матрицы, которая рассчитывается из изображения. Сумма главных компонент, умноженных на соответствующие собственные вектора, является реконструкцией изображения.
Для каждого изображения лица вычисляются его главные компоненты. Обычно берется от 5 до 200 главных компонентов. Процесс распознавания заключается в сравнении главных компонент неизвестного изображения с компонентами всех известных изображений.
При этом предполагается, что изображения лиц, соответствующих одному человеку, сгруппированы в кластеры в собственном пространстве. Из базы данных выбираются изображения-кандидаты, имеющие наименьшее расстояние от входного (неизвестного) изображения [1].
Метод собственных лиц требует для своего применения идеализированных условий таких, как единые параметры освещенности, нейтральное выражение лица, отсутствие помех вроде очков и бород. При несоблюдении этих условий главные компоненты не будут отражать межклассовые вариации. Например, при различных условиях освещенности метод собственных лиц практически неприменим, поскольку первые главные компоненты преимущественно отражают изменения освещения, и сравнение выдает изображения, имеющие похожий уровень освещенности. При соблюдении идеализированных условий точность распознавания с использованием данного метода может достигать значения свыше 90 %, что является очень хорошим результатом.
Вычисление набора собственных векторов отличается высокой трудоемкостью. Один из способов - это свертка изображений по строкам и столбцам; в такой форме представление изображения имеет на порядок меньший размер, вычисления и распознавание происходит быстрее, но восстановить исходное изображение уже невозможно.
Метод Виолы-Джонса. Данный метод является высокоэффективным для поиска объектов на изображениях и видеопоследовательностях в режиме реального времени [2; 3]. Этот детектор обладает крайне низкой вероятностью ложного обнаружения лица.
Метод хорошо работает и обнаруживает черты лица даже при наблюдении объекта под небольшим углом, примерно до 30°. Точность распознавания с использованием данного метода может достигать значения свыше 90 %, что является очень хорошим результатом. При угле наклона больше 30° вероятность обнаружения лица резко падает. Указанная особенность метода не позволяет в стандартной реализации детектировать лицо человека, повернутое под произвольным углом, что в значительной мере затрудняет или делает невозможным использование алгоритма в современных производственных системах с учетом их растущих потребностей.
Сравнение шаблонов (Template Matching). Основа этого метода заключается в выделении областей лица на изображении, и последующем сравнении этих областей для двух различных изображений. Каждая совпавшая область увеличивает меру сходства изображений. Для сравнения областей используются простейшие алгоритмы вроде попиксельного сравнения.
Недостаток этого метода заключается в том, что он требует много ресурсов как для хранения участков, так и для их сравнения. Ввиду того, что используется простейший алгоритм сравнения, изображения должны быть сняты в строго установленных условиях: не допускается заметных изменений ракурса, освещения, эмоционального выражения и пр.
Точность распознавания с использованием данного метода составляет около 80 %, что является хорошим результатом.
Нейронная сеть Хопфилда. Алгоритм обучения сети Хопфилда существенно отличается от классических алгоритмов обучения персептронов тем, что вместо последовательного приближения к нужному состоянию с вычислением ошибок, все коэффициенты весовой матрицы рассчитываются по одной формуле, за один цикл, после чего сеть сразу готова к работе.
Ограничения метода:
- запоминаемые образы не должны быть сильно похожи;
- изображение не должно быть смещено или повернуто относительно его исходного состояния.
Для устранения этих недостатков рассматриваются различные модификации классической нейронной сети Хопфилда. Сеть Хоп-филда с ортогональным преобразованием позволяет восстанавливать сильно скоррелированные образы за счет преобразования их исходного множества к дуальному множеству векторов. Таким образом, получается нейронная сеть, которая может запоминать некоторое количество векторов, и при подаче на вход любого вектора, может определить, на какой из запомненных он более всего похож.
Точность распознавания с использованием данного метода составляет свыше 90 %, а в ряде случаев - даже приближается к 100%, что является почти отличным результатом.
Для большинства современных систем автоматического распознавания лиц основной задачей является задача сравнения заданного изображения лица с набором изображений лиц из базы данных. Характеристики систем автоматического распознавания лиц в этом случае оцениваются путем определения вероятностей ошибочного отказа в распознавании (ошибки первого рода) и ошибочного распознавания (ошибки второго рода). В допол-
нение к вероятностям ошибок для оценки системы автоматического распознавания лиц часто используется оценка устойчивости к возмущению изображений, вызываемая комбинацией со сложными фонами, изменчивостью освещения, изменению прически, и т. д.
Учитывая вышеизложенное, представляется, что перспективным может являться создание гибридных методов, использующих преимущества и нивелирующих недостатки рассмотренных выше различных частных подходов.
СПИСОК ЛИТЕРАТУРЫ
1. Брилюк, Д. Распознавание человека по изображению лица и нейросетевые методы / Д. Брилюк, В. Старовойтов. - Минск : Институт Технической Кибернетики Национальной Академии Наук Беларуси, 2001.
2. Viola, P. Rapid object detection using a boosted cascade of simple features / Р. Viola // IEEE Conf. on Computer Vision and Pattern Recognition. -Kauai, Hawaii, USA, 2001. - V 1. - P 511-518.
3. Viola, P. Robust realtime face detection / P. Viola // International Journal of Computer Vision. - 2004. -V 57. - №> 2. - P. 137-154.
COMPARATIVE ANALYSIS OF ALGORITHMS FOR FACES RECOGNITION
Mishchenkova Ekaterina Sergeevna
Master Student, Information Systems and Computer Simulation Department,
Volgograd State University [email protected]
Prospect Universitetsky, 100, 400062 Volgograd, Russian Federation
Abstract. The modern methods of faces recognition are described and analyzed. The creation of hybrid methods is seen to be prosperous according to the methods analysis.
Key words: face recognition, method Viola-Jones, principal component analysis, Hopfield neural network.
76
Е. С. Мищенкова. Сравнительный анализ алгоритмов распознания лиц