Научная статья на тему 'Идентификация лица человека методом опорной гиперплоскости*'

Идентификация лица человека методом опорной гиперплоскости* Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
93
24
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Калайда В. Т., Губанов Н. Ю.

In this paper a new method of human face identification and its program realization are introduced. The method is based on calculation of closeness measure between the hypersurface describing master classes and the given image. Due to the increase of the identification accuracy, the parameters of hypersurface are obtained by minimization of the master class images deviations. An experimental analysis of given face recognition and identification method was performed.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Идентификация лица человека методом опорной гиперплоскости*»

Вычислительные технологии Том 12, Специальный выпуск 1, 2007

ИДЕНТИФИКАЦИЯ ЛИЦА ЧЕЛОВЕКА МЕТОДОМ ОПОРНОЙ ГИПЕРПЛОСКОСТИ5

В. Т. Калайда Томский государственный университет систем управления и радиоэлектроники, Россия e-mail: [email protected]

Н. Ю. Губанов Отдел проблем информатизации ТНЦ СО РАН, Томск, Россия

e-mail: [email protected]

In this paper a new method of human face identification and its program realization are introduced. The method is based on calculation of closeness measure between the hypersurface describing master classes and the given image. Due to the increase of the identification accuracy, the parameters of hypersurface are obtained by minimization of the master class images deviations. An experimental analysis of given face recognition and identification method was performed.

Введение

Идентификация личности человека является одной из наиболее актуальных задач в системах распознавания, известных как "Биометрические системы безопасности". Интерес к таким системам вызван бурным развитием информационных технологий, которые находят все большее применение в различных сферах человеческой деятельности: банковская, шоу-бизнес, обеспечение доступа к системам вооружения и документации и др. Большую значимость такие системы приобретают в связи с нарастающей глобальной угрозой терроризма.

В настоящее время существует большое количество методов решения данной задачи [1-5], однако всем им присущ общий недостаток — существенная зависимость точности распознавания от условий получения изображения (угол наблюдения, уровень освещенности и т.п.).

1. Метод опорной гиперплоскости

Эффективной системой формализованного описания изображений по их геометрическим характеристикам служат моменты тар или центральные моменты ¡лав различных

* Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (грант № 06-08-00751).

© Институт вычислительных технологий Сибирского отделения Российской академии наук, 2007.

порядков:

maß = J J f (x, y)xaye dxdy, а, в = 0,1,... ,

те

ßaß = J J f (x, y) (x - xc)a (y - yc)e dxdy, а, в = 0,1,...

те

Здесь xc, yc — координаты центра масс, определяемые выражениями

Xc = mio/moo, yc = moi /moo.

Это утверждение базируется на следующей теореме [6].

Теорема. Бесконечная последовательность моментов изображения {ßaß} а, в = 0,1, 2,... ; однозначно определяется, функцией яркости f (x,y) м, наоборот, функция f (x, y) однозначно определяется, последовательностью {ßaß}.

Таким образом, если ограничить бесконечную последовательность моментов изображения конечным набором длиной n, то можно аппроксимировать изображения с выбранной точностью. Обозначим через х = (x1, x2,..., xn) вектор выбранных моментных характеристик, где x» — моментные характеристики maß.

Введем понятие класса изображений лица. Под классом изображений будем понимать множество одномасштабных изображений лица одного и того же человека, полученных в различных условиях съемки. Опорной гиперплоскостью будем называть гиперплоскость, наименее отклоняющуюся от множества векторов, описывающих изображения данного класса, В этом случае задача поиска параметров опорной гиперплоскости сводится к задаче

m / n

£ (ao, ai,..., ßn) = ^^ I akxk +

j=i V k=i

1 ao I ^ min,

где акхк + а0 = 0 — уравнение гиперплоскости; а — коэффициенты опорной галерка

плоскости; X = (хЦ, х2,..., хП) — реализация вектора параметра для ^'-го изображения класса; М — количество изображений в классе.

Оценки параметров опорной гиперплоскости а являются решением нормальной однородной системы системы линейных уравнений дТ, (ао, а\,..., ап)/даг = 0, г = 1, п:

м м м м

а^ х1 х1 + а2х2х1 + ... + а„^ х^х^ + ао^ х1 =0, ¿=1 ■?'=! ¿=1 ■?'=! м м м м

а^ х1 х2 + а2 Е х2х2 + ... + а„ ^ хПх2 + а^ х2 = 0, ¿=1 ¿=1 ¿=1 ¿=1

м м м

а^ х1 + а^ х2 + ... + а„^ хП + аоМ = 0. =1 =1 =1

Для оценки принадлежности анализируемого изображения к классу используется величина

/ п

^2 акхк + а0 к=1

Е ak

k=i

n

— отклонение от гиперплоскости, где хк — моментные характеристики анализируемого изображения.

На практике класс изображений формируется из небольшого числа (порядка пяти-десяти) изображений, В связи с этим оценка параметров гиперплоскости не обладает необходимой статистической достоверностью. Для достоверной идентификации лица человека необходимо использовать методы, позволяющие повысить точность оценки, Этого можно достигнуть путем размножения измерений на основе непараметрической оценки функции плотности распределения моментных характеристик класса изображений и генерации дополнительных характеристик по оцененному распределению [7]:

Здесь р(х) — совместная функция плотности вероятности; Ф(х) — ядерная функция (весовая функция, характеризующая меру близости хг по отношению к х); q — коэффициент размытости ядерной функции, характеризующий область ее определения.

Оценив функцию плотности распределения для выбранных значений q, можно произвести размножение моментных характеристик, используя метод bootstrap [8]. Основная идея данного метода состоит в том, что строится необходимое число "похожих" выборок, т, е, происходит "размножение" выборки. Затем рассчитывается статистика по каждой из "похожих" выборок и анализируется полученное при этом распределение.

Уточнение совместной функции плотности распределения проводится путем вычисления значений параметра размытости q в функции плотности распределения, обеспечивающего минимальную внутриклассовую дисперсию. Эта процедура сводится к решению оптимизационной задачи:

где с = (с1, с2,..., сп) — вектор коэффициентов размытости ядер ной функции; а = (а0 ,а1,... ,ап) — вектор коэффициентов опорной гип ерплоскости; (а, с) — отклонение от ]-то изображения класса до опорной гиперплоскости, для текущего значения с и коэффициентов опорной гиперплоскости а; 5 (а, с) — среднее арифметическое значение отклонений всех изображений класса до опорной гиперплоскости для текущего

а а

нормальной однородной системы (1) по "размноженной" с использованием полученной уточненной фунции плотности распределения (2) выборки моментных характеристик. Результатом решения задачи (3) является вектор коэффициентов аорЛ опорной гиперплоскости, наименее отклоняющийся от всех изображений класса,

2. Экспериментальная проверка метода

Экспериментальная проверка предложенного метода проводилась на 243 изображениях лица человека из 44 различных классов. Примеры анализируемых изображений приведены на рис, 1,

(3)

Рис. 1. Примеры лицевых изображений

При анализе метода для формализованного описания изображения лица человека использовалось девять моментных характеристик. Такой набор параметров достаточно полно описывает особенности изображения лица [9|,

При решении нормальной однородной системы использовался алгоритм, основанный на методе разложения матрицы в виде a = USVT (сингулярное разложение), обладающей высокой точностью и устойчивостью вычислительного процесса [10|. Здесь матрица U сформирован а из n ортонормированных собственных векторов, соответствующих n наибольшим собственным значениям матрицы aaT; матрица V сформирована из ортонормированных собственных векторов матрицы aTa; S — неотрицательные значения квадратных корней из собственных значений матрицы aTa.

Размножение моментных характеристик производилось путем решения задачи:

х = arg (arc p(x) = p),

где p — вектор случайных чисел, равномерно распределенных в интервале [0,1] длиной m = 500; X — вектор размноженных моментных характеристик.

Сродное арифметическое значение расстояния и сродное квадратичное отклонение от изображения j-го класса до опорной гиперплоскости класса 1

Класс 1 2 3 4 5 6 7 8

S (aopt) -1.4-10"5 0.01605 -0.0052 0.01644 0.01089 0.00538 -0.00212 -0.00909

о (aopt) 9.3 • Ю-5 0.0049 0.0016 0.00505 0.00336 0.00164 7.5-10"4 0.00279

Класс 9 10 11 12 13 14 15 16

S (aopt) 0.00351 -0.00294 0.00971 -0.00264 0.00711 0.01344 0.02572 0.0233

о (aopt) 0.00114 0.00103 0.00303 8.4-10"4 0.00218 0.00409 0.00784 0.00711

Класс 17 18 19 20 21 22 23 24

S (aopt) 0.0257 0.0016 0.01582 0.02682 0.02514 0.0064 0.00764 7.4-10"5

о (aopt) 0.00783 4.82-10"4 0.00484 0.00819 0.00768 0.00195 0.00237 0.00179

Класс 25 26 27 28 29 30 31 32

S (aopt) 0.00534 0.00568 0.01672 -0.01144 0.00826 -0.01619 0.00703 0.01023

о (aopt) 0.00165 0.00175 0.0051 0.00357 0.00253 0.00496 0.00215 0.00313

Класс 33 24 35 36 37 38 39 40

S (aopt) 0.00885 -0.00143 0.00144 0.01308 0.00999 0.00303 0.00591 0.00957

(У (aopt) 0.00273 4.3 • 10"4 4.4-10"4 0.00399 0.00305 9.3-10"4 0.00227 0.00301

Рис. 2. Сродное арифметическое значение расстояния и доверительные интервалы отклонения от изображения j-го класса до опорной гиперплоскости класса 1

Задача нелинейного программирования (3) решалась методом "скользящего допуска" [11|, Результаты расчетов приведены в таблице и на рис. 2.

Заключение

Экспериментальные исследования предложенного метода на различных классах изображений лица человека показали, что он обеспечивает достоверную, пригодную для практического использования идентификацию (вероятность распознавания) на уровне 0.9. Тем не менее для отдельных классов изображений (например, 1 и 24) возможно возникновение ошибок идентификации. Очевидно, что существенное повышение точности идентификации можно ожидать при описании класса изображений опорной гиперповерхностью.

Авторы выражают глубокую благодарность сотруднику ИВМ СО РАН A.B. Лапко за плодотворные советы по теме исследований.

Список литературы

[1] Кухарев Г.А. Биометрические системы: Методы и средства идентификации личности человека. СПб.: Политехника, 2001. 240 с.

[2] Saco Н., WiiiTEiiousE М., Smith A., Sutherland A. Real-time facial feature tracking-based on matching techniques and its application j j Proc. of IAPR. 1994. Vol. 2. P. 320 324.

[3] LeCun Y., Bengio Y. Convolutional networks for images, speech, and timeseries // The Handbook of Brain Theory and Neural Networks. 1995. P. 255-258.

[4] Kruizinga P., Petkov N. Optical flow applied to person identification // Proc. of Conf. on Massively Parallel Processing Applications and Development. Netherlands, 1994. P. 871-878.

[51 Васильев В.И. Распознающие системы: Справочник. Киев: Наук, думка, 1983. 287 с.

[6] Ни М.К. Recogniton on moment invariants // IRE Trans, on Information Theory. 1962. N 2.

[7] Непараметрические системы классификации / А.В. Лапко, В.А. Лапко, M.II. Соколов, С.В. Чепцов. Новосибирск: Наука, 2000. 240 с.

[8] Good P. Permutation, Parametric, and Bootstrap Tests of Hypotheses. N.Y.: Springer, 2005. XVI. 376 p.

[9] Кал айда В. Т. Применение методов морфологического анализа для задач идентификации полутоновых изображений // Оптика атмосферы и океана. 2003. Т. 16, № 9. С. 862-865.

[10] Уилкинсон Дж., Райнш К. Справочник алгоритмов на языке АЛГОЛ. Линейная алгебра. М.: Машиностроение, 1976. 389 с.

[11] Химмельвлау Д. Прикладное нелинейное программирование. М.: Мир, 1975. 534 с.

Поступила в редакцию 30 август,а 2007 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.