Алгоритмы двумерного анализа главных компонент для задач распознавания изображений лиц

Кухарев Георгий Александрович; Щеголева Надежда Львовна

ОБРАБОТКА ИЗОБРАЖЕНИЙ, РАСПОЗНАВАНИЕ ОБРАЗОВ

АЛГОРИТМЫ ДВУМЕРНОГО АНАЛИЗА ГЛАВНЫХ КОМПОНЕНТ ДЛЯ ЗАДАЧ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ ЛИЦ

Кухарев Г.А., Щеголева Н.Л.

Санкт-Петербургский государственный электротехнический университет

Аннотация

Представлены алгоритмы двумерного анализа главных компонент (Two-dimensional Principal Component Analysis - 2D PCA), ориентированные на обработку цифровых изображений больших размеров в условиях малой выборки. Алгоритмы основаны на прямом вычислении двух матриц ковариации по всем исходным изображениям без их преобразования в векторы. Результат анализа - нахождение главных компонент для строк и столбцов исходных изображений и построение соответствующих им матриц двумерной проекции.

Обсуждаются два способа выполнения 2D PCA, соответствующие параллельной и каскадной формам его реализации. Оценены характеристики представленных алгоритмов.

Ключевые слова: анализ главных компонент, распознавание изображений лиц.

Введение

В задачах обработки изображений методами РСА исходными являются три базовых параметра: {M, N, K}, где M и N - число строк и столбцов исходных изображений, а K - количество изображений [1-4]. Первые два параметра определяют размерность DIM исходного пространства признаков DIM=MN. При этом обработке изображений лиц методами РСА сопутствует проблема малой выборки (Small Sample Size - SSS [1-3]), когда DIM >> K.

Размерность исходного пространства признаков DIM определяет вычислительную сложность реализуемых алгоритмов. Анализ главных компонент (РСА [1-5]) является одним из методов, на котором основаны процедуры редукции размерности исходного пространства признаков, и при этом достигается условие:

DIMnew << DIM, (1)

где DIMnew - размерность нового пространства признаков.

Результат редукции используется в задачах компактного представления изображений (их компрессии), выявлении их существенных характеристик и/или в распознавании изображений в новом пространстве признаков. Однако эффективное применение PCA в этих задачах возможно только в случае выполнения условия:

DIMnew << K. (2)

Методология использования PCA в приложении к обработке изображений связана, с одной стороны, с необходимостью использования базового метода PCA [1, 2], изначально ориентированного на обработку векторных данных, а с другой стороны, с учётом условия (2).

Первый подход («Eigenfaces» [2]) основан на уменьшении каждого исходного изображения до размера m < M и n < N, конкатенации его столбцов в общий вектор и вычислении матрицы ковариации (порядка mn < K) по всем полученным векторным

данным. Матрица проекции в новое пространство признаков определяется далее на основе решения задачи на собственные значения для этой матрицы ковариации. Строки матрицы проекции являются собственными векторами матрицы ковариации, а обратное формирование их в двумерную матрицу размера т х п образует соответствующие им матрицы, называемые «Eigenfaces». При этом проекция в новое пространство признаков реализуется как одномерное преобразование Карунена-Лоэва (Ш КЬТ) векторизованных исходных данных.

Во втором подходе [3] вычисляются две матрицы ковариации, которые определяются отдельно по столбцам и строкам исходных изображений без их конкатенации в общий вектор. Далее вычисляются две матрицы проекции, определяемые собственными векторами этих матриц ковариации. Проекция исходных изображений в новое пространство признаков реализуется как двумерное (по строкам и столбцам) преобразование Карунена-Лоэва (2Б КЬТ), что и отличает подход [3] от [1-2]. В [3] было показано, что в приложении к задачам распознавания изображений лиц такой подход является более робастным по отношению к качеству исходных изображений, в том числе их искусственному «зашумлению» и циклическому сдвигу.

В работе [4] двумерный анализ главных компонент (2Б РСА) был исследован в приложении к распознаванию изображений лиц в условиях малой выборки. Здесь же впервые были представлены вектор-но-матричные процедуры, позволяющие непосредственно реализовать 2Б РСА в алгоритмических языках, поддерживающих матричные операции. Дальнейшее развитие подхода [3] было представлено в работах [5, 6] как 2Б РСА/2Б КЬТ.

При этом следует отметить, что некоторые аналогичные идеи по реализации 2Б РСА рассматривались в работе [7], вышедшей в свет после работ [4, 6]. Однако допущенные в [7] упрощения и ошибки в представлении базовой процедуры 2Б РСА и

отсутствие её точного описания не позволяют выделить характеристики этого метода, а неполное описание выполненных экспериментов не позволяет использовать результаты этой работы в рамках ме-таанализа. Следует также отметить, что авторы работы [7], представляя свой подход, отсылают к своей же работе [10] 2004 года как первоисточнику, «представляющему реализацию 2Б РСА». Однако в работе [10] представлен подход, реализующий РСА только по одному направлению, а именно: по столбцам исходных изображений (!). Естественно, что и КЬТ здесь реализуется также только по одному направлению.

Целью настоящей статьи является представление новых алгоритмов 2Б РСА/2Б КЬТ и соответствующих им вычислительных структур. Алгоритмы предназначены для обработки изображений больших размеров в условиях малой выборки, а структуры определяют базовые принципы реализации этих алгоритмов.

1. Идея и реализация 2Б РСЛ/2Б КЬТ

Пусть нам задан набор X, состоящий из K центрированных и нормированных к «1» изображений X(k) (для k = 1, 2, ..., К) размером М* N каждое и

МЫ > > К:

X = [X(1) X(2)... X(К)] (3)

Целью 2Б РСА является определение двух матриц проекции, трансформирующих исходные данные в новое пространство признаков так, чтобы выполнялось условие минимума расстояния:

(4)

сИзШпсе (X(к) - X(к;Г2) ® ш1п.

ТУ(к )Г/

' к = 1, 2,

, К,

где Щ - ортогональные матрицы порядковМи N соответственно.

Параллельный алгоритм. Здесь двумерный анализ главных компонент выполняется независимо по строкам и столбцам исходных данных, и при этом определяются два независимых собственных базиса.

Модель вычислений в 2Б РСА/2Б КЬТ можно представить следующим образом:

1.0. X —X,;

1.1. X РСАг Щ

1.2. X —

(5)

2. У(к) = W1TX(k)W2, "к = 1, 2,..., К.

На этапе 1.0 выполняется реорганизация структуры исходных данных (3). Это реализуется как транспонирование всех матриц размером М * N в наборе X и составление нового набора данных X]. На этапе 1.1 выполняется базовая процедура РСА относительно строк исходных данных (РСАг). На этапе 1.2 выполняется РСА относительно строк (РСАг) данных, входящих в набор X], или, что то же самое, относитель-

но столбцов исходных данных. Результат этапов 1.1 и 1.2 - вычисление двух матриц проекции Щ и Щ2. Этапы 1.1 и 1.2 могут быть выполнены параллельно, поскольку процедура РСАг применяется для независимых наборов данных X и X].

Наконец, этап 2 - это трансформация всех исходных изображений из набора X в новое пространство признаков У. С учётом этого на рис. 1 представлена схема параллельного способа (5) реализации 2Б РСА. Блок "Я" реализует транспонирование всех матриц размером М * N в наборе X. Блоки, обозначенные как реализуют процедуру проекции исходных данных. Пунктиром выделен блок, определяющий двумерное преобразование Карунена-Лоэва (2Б КЬТ).

Рис. 1. Структура параллельного алгоритма 2Б РСА

Заметим, что в представленном методе двумерное 2Б КЬТ реализуется по каскадной схеме: сначала исходное изображение обрабатывается по строкам, а затем полученный результат обрабатывается по столбцам (или наоборот). Это аналогично тому, как могут выполняться многие двумерные дискретные ортогональные преобразования изображений [1, 4], что, однако, противоречит способу получения собственных базисов в (5).

Каскадный алгоритм. Здесь в первом каскаде выполняется анализ главных компонент по строкам исходных изображений, а во втором - по столбцам результата первого каскада (или наоборот - сначала по столбцам, а потом по строкам результата). При этом определяются два взаимосвязанных собственных базиса, и 2Б КЬТ реализуется также по каскадной схеме во взаимосвязанных базисах. Модель каскадного алгоритма запишем следующим образом:

X ——Щ X.) ——® X ——СА—®

®{Г2;Г} ——® У.

(6)

Здесь Х1 - данные X1 после их реорганизации блоком "Я"; выражения в фигурных скобках представляют результаты РСА/КЬТ по строкам и столб -цам исходных изображений.

Схема вычислений, соответствующая модели (6), представлена на рис. 2. Здесь в явной форме отражён каскадный способ реализации 2Б РСА/2Б КЬТ.

R РСАг

W,

R

Рис. 2. Структура каскадного алгоритма 2D PCA

2. Формальное описание алгоритмов

Версия параллельного алгоритма Вычислим две матрицы ковариации, определив их относительно строк («г» - row) и столбцов («с» -column) для исходных изображений (3):

C(г> = £ X(k Ч X(k У; k =1

K

C(с) = £ (X(k })TX(k>,

(7)

k=1

Чг )„ г (с)

где C и C - матрицы порядков M и N соответственно.

С учётом (7) определим собственные значения и соответствующие им собственные векторы, решив следующие две задачи на собственные значения:

wjtc(r w = Aj; wtc (c)w2 = Л2.

(8)

При этом W1TW1 = I1 и W2TW2 = I2, а I1 и I2 -единичные матрицы порядков M и N соответственно; Л1 и Л2 - диагональные матрицы порядков M и N соответственно.

Трансформация исходных данных в новое пространство признаков реализуется как двумерное преобразование Карунена-Лоэва на основе собственных базисов, определяемых по (8) в следующей форме: Y(k) = (W1TX(k))W2, " k = 1,2, ..., K, (9)

где Y(k) - матрицы размера M x N, представляющие исходные изображения в новом пространстве признаков.

Версия каскадного алгоритма Выполним проекцию исходных данных так, что: X(k) = W?X(k)," k = 1,2,., K, (10)

где X1(k) - матрицы размера M x N, представляющие исходные изображения (3) в новом (промежуточном) пространстве признаков; матрица W1 была определена в (8).

Далее вычислим матрицу ковариации, определив её относительно столбцов («с» - column) результата (10):

c (c) = £ (X1(k))TX1(

(k)

(11)

где матрица C(с) имеет порядок, равный N.

Вычислим для (11) собственные значения и соответствующие им собственные векторы, решив следующую задачу на собственные значения:

W2TC(c W2 = A 2,

(12)

где W2 и Л2 - матрицы порядка N.

Трансформация исходных данных (3) в новое пространство признаков реализуется теперь как двумерное преобразование Карунена-Лоэва (9) на основе собственных базисов, определяемых ортогональными матрицами проекции (8) и (12).

Редукция размерности пространства признаков

Изменим (9) так, чтобы в дальнейших преобразованиях участвовали только те собственные векторы, которые соответствуют главным компонентам ^ < шт{М, Щ). Для этого из выбранных собственных векторов формируются две прямоугольные матрицы: из матрицы W1T выбираем <^» строк, а из матриц W2 выбираем <^» столбцов, соответствующих <^» наибольшим собственным числам, и на их основе формируются две матрицы редукции F1 и F2. Верхние границы параметра <^» выбираются исходя из критерия энергетической значимости собственных значений [1-6]. Нижние границы параметра <^» выбираются экспериментально с учётом критерия (4). При этом d < шт{М, N1 или d1 <М; d2 < N если d1 Ф d2.

Теперь выполним << усечённое» двумерное преобразование Карунена-Лоэва:

Yk) = F1X(k) F2

v(k)

где Y =

'y (1,1)... y (d ,1) y (2,1)... y (d ,2)

_y (d ,1)... y (d, d )

(k)

(13)

Матрицы F1 и F2 имеют размеры d хМи Nx dсоответственно (или d1х Ми N х d2 в общем случае); знак <<л» определяет отличие результата (13) от (9).

Результирующие матрицы в (13) имеют в общем случае размеры d1 х d2 и представляют исходные изображения в новом пространстве признаков.

3. Характеристики разработанных алгоритмов

3.1. На реализацию полного 2Б КЬТ (9) потребуется (NM1+MN1) операций, а на реализацию <<усечённого» 2Б КЬТ по схеме (13) потребуется (Md 2 + MNd) операций. При этом сокращение вычислений на этапе редукции размерности пространства признаков (РПП) можно приблизительно оценить как величину (М+А) / d, поскольку:

K

k =1

NM2 + MN2 _ MN (M + N) » M + N

Md2 + MNd ~ M(d + N)d ~ d (14)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

для d << N.

Например, для M = 112 и N = 92 (база лиц ORL [7]) и d = 10 сокращение вычислений составит примерно 20 раз(!) на каждое изображение. С учётом параметра «К» - числа изображений, ускорение вычислений составит величину, равную примерно К (M+N) / d на все исходные данные.

3.2. Результат в (13) содержит d2 (или dj х d2) элементов, поэтому степень редукции РПП определяется соотношением MN / d 2 или MN / (dj d2), если dj Ф d2.

Например, для M = 112, N = 92 и d = 10 редукция размерности пространства признаков составит более чем 100 раз(!) на каждое изображение.

3.3. Наибольший порядок матриц ковариации в (7), (12) составляет величину DIM = max{M, N}. Это предопределяет практическую возможность решения задачи на собственные значения и стабильность этого решения даже для изображений больших размеров.

3.4. При представлении исходных изображений как совокупности строк и столбцов общее число получаемых векторов составляет величину К (M+N), а размерность исходного пространства признаков определяется как DIM = max{M, N}. Поэтому при любых значениях M и N соотношение «размерность/число векторов» всегда будет отвечать условию max{M, N} << К (M+N), «обходя» таким образом проблему SSS.

Совокупность представленных выше характеристик не была представлена в работах [4-6] в столь полном объёме.

4. Распознавание изображений лиц

Цель первого эксперимента - сравнение представленных алгоритмов реализации 2D PCA при решении задачи поиска изображений лиц по заданному тестовому образу.

Эксперименты выполнены на базе ORL [9], некоторые изображения которой показаны на рис. 3.

Рис.3. Примеры исходных данных

База ORL охватывает 40 различных классов образов (изображений лиц людей различных наций) по 10 образов в каждом классе. Все изображения базы ORL относятся к типу „indoor", имеют размер 112 на 92 пикселя и представлены в шкале „GRAY" (256 уровней яркости).

Для лиц базы ORL характерно изменение контраста изображений и яркости фона вокруг области лица; размера лиц, в том числе непропорционально по осям X и Y; поворота головы в пространстве 3D в пределах не менее ±20о по оси X, ±30о по оси Y и не менее ±10о по оси Z; мимики, прорисовки деталей лиц (их сглаживание).

Эксперимент был выполнен для всех 40 классов с выбором только одного образа из каждого класса для эталона и девяти других образов в каждом классе для теста. Таким образом, в формулировке задачи поиска, база системы поиска содержала 40 образов-эталонов (по одному на класс), а в качестве тестовых были использованы 360 образов (по девять образов на каждый из 40 классов). В эксперименте дважды использована процедура кросс-валидации: в каждом эксперименте изменялся номер выбранного образа-эталона, а внутри каждого эксперимента изменялся параметр редукции «d» (d = 3, 4, ..., 10). Всего, таким образом, выполнено 10 х 8 = 80 экспериментов. Модель выполненного эксперимента имеет следующий вид [8]:

0RL(40/1/9/CV){2DPCA:112x92®

dxd/КМР/L1/rank=1}, где определены:

0RL(40/1/9/CV) - база лиц, структура данных и процедура кросс-валидации (CV);

2DPCA:112x92®dxd - использованный метод и размеры данных до и после редукции размерности пространства признаков;

КМР^1/гапк=1 - тип классификатора, метрика и ранг результата.

Текущие результаты в каждом эксперименте оценивались как отношение количества правильно классифицированных тестовых образов к общему их числу 360. Общее число тестовых образов составило 3600 для каждого значения параметра «d». Результат считался правильным, если на первом месте (rank = 1) в группе результатов находился образ из того же класса, что и тестовый образ.

В эксперименте использован классификатор по минимуму расстояния (КМР) в метрике L1.

На рис. 4 показаны 20 наибольших собственных значений (собственные значения, вычисленные по строкам для обоих способов, одинаковы по определению). При этом главные компоненты ограничены величиной d » 6, поскольку далее собственные значения практически равны «0».

На рис. 5 представлена динамика распознавания тестовых образов в эксперименте № 9 для всех 360-ти тестовых образов при значении d = 6.

На рис. 6 показаны результаты решения поставленной задачи поиска для различных значений параметра редукции «d». Как видно, наилучший результат поиска получен при значении d = 6. Степень редукции размерности пространства признаков составила при этом значение, равное 286 (поскольку 112 х 92 / 36 = 286).

Í

30 20

10

- Параллельный -

40

30

20

10

ТТТттп * .

ТТттгч-н

Г 40

30 20 10

Каскадный-

Ттггтн

0 10 20 0 10 20 0 10 20 по строкам по столбцам по столбцам

%

80 60 40

Рис. 4. Собственные значения для метода 2Б РСА Результат распознавания

! Для каскадного Í/--Í--Í--

Для параллельного

0 50 100 150 200 250 300 350 Число тестовых образов

Рис. 5. Динамика распознавания тестовых образов

Результат распознавания для кросс-валидации

%

70 65 60 55 50

1 1 —¡-*s 1 л \Í . 1Для 'каскадного^ -VT h -i -r r r -iiii ^ i'* i i i ! ! ! !

Jt\ iiii ^ i i l / Г1 ^

i i ti ! J L . Для параллельного' ¡ l"*^».

Г ! i i i i IIIIII IIIIII IIIIII

4 6 8 10 12 14 16 18 20 Параметр редукции "d"

Рис. 6. К выбору параметра редукции «d»

Подводя итог эксперимента, отметим следующее:

• при выполнении поставленного эксперимента дважды решалась задача на собственные значения. Порядки матриц ковариации составили соответственно 112 и 92. Общее число «изображений» составило 40^(112+92), поэтому матрицы ковариации были хорошо обусловлены и не потребовалось никаких процедур их регуляризации;

• ярко выраженное наличие «главных компонент» в составе собственных значений гарантирует репрезентативное представление исходных данных в новом пространстве признаков при малом значении параметра «d»;

• решение поставленной задачи поиска выполнено успешно, особенно если учитывать специфику исходных данных - изображений лиц базы ORL, и малое число образов-эталонов в системе поиска: по одному на каждый класс. Результаты, представленные в ходе экспериментов, выше результатов, показанных в [4, 5], при решении аналогичной задачи.

Цель второго эксперимента - решение задачи распознавания изображений лиц при различном числе эталонов в базе системы распознавания (Face

Recognition System - FaReS [6]). Модель выполненного эксперимента имеет следующий вид: ORL(40/Z/10-Z/R+CV){2DPCA:12x92®8x8} [КМР/L1 /rank= 1 ].

Здесь в базу FaReS выбирается L тренировочных изображений в каждом из 40 классов; выбор организован случайным образом (random - R) и использована процедура кросс-валидации (R+CV). Число тестовых образов составляет 10 - L для L = 1, 2, 3, 4, 5. Результаты выполненных экспериментов представлены в табл. 1.

Таблица 1. Результаты экспериментов

Э 1/40/360 2/80/320 3/120/280 4/160/240 5/200/200

П К П К П К П К П К

1 68 68 78 79 93 93 94 94 97 97

2 68 68 78 78 88 89 90 90 95 96

3 70 70 82 82 90 90 94 94 95 94

4 66 68 83 84 91 90 93 93 95 93

5 71 71 83 83 90 90 91 90 92 91

6 71 71 83 83 90 90 91 92 95 95

7 70 70 87 87 91 92 93 93 96 97

8 64 64 90 90 91 91 94 95 95 95

9 67 67 82 81 89 88 90 89 94 95

10 66 68 82 82 89 89 92 92 96 96

ср 68 69 83 83 90 90 92 92 95 95

Здесь: «Э» - номер эксперимента; 1/40/360... 5/200/200 - значение Ь и общее число изображений-эталонов и тестовых изображений в каждом эксперименте; П и К - способы: параллельный и каскадный.

Из представленных результатов видно, что существенный скачок результативности распознавания возникает уже при Ь = 2, а при значении Ь = 5 результат распознавания составляет (при округлении до наименьшего целого) в среднем 95% и в максимуме 97%. При этом результативность для двух алгоритмов реализации 2Б РСЛ/2Б КЬТ практически одинакова.

Заключение В статье представлены новые алгоритмы реализации 2БРСЛ/2Б КЬТ, ориентированные на обработку изображений. Представлены схемы вычислений, соответствующие этим алгоритмам, а также эксперименты при решении задач поиска и распознавания изображений лиц. Для выполненных экспериментов представлены соответствующие модели.

Идею алгоритмов 2Б РСЛ/2Б КЬТ можно представить в компактной форме:

2Б РСЛ/2Б КЬТ „

(15)

Y,

что можно интерпретировать как преобразование набора исходных изображений X в пространство переменных У. При этом выполняется этап 2Б РСЛ с определением 2-х матриц проекции

и отдельный этап 2D KLT с матрицами проекции

F F2}.

Сравнения с решениями [7] не проводилось, поскольку в [7] отсутствуют необходимые модели и, как следствие этого, данные о деталях выполненных экспериментов. А в таких условиях сравнение будет необъективным или бессмысленным.

Литература

1. Прэтт, У. Цифровая обработка изображений / У. Прэтт - М.: Мир, 1982. - 312 с.

2. Turk, М. Eigenfaces for Face Detection/Recognition / М. Turk, A. Pentland // Journal of Cognitive Neuroscience.

- 1991. - Vol. 3, No. 1. - P. 71-86. - ISSN 0898-929X.

3. Tsapatsoulis, N. Vector Based Approximation of KLT and Its Application to Face Recognition / N. Tsapatsoulis, V. Alexopoulos, S.A. Kollias // Proceedings of the IX European Signal Processing Conference EUSIPCO-98, September 8-11. Rodos Palace, Island of Rhodes, Greece,

- 1998. - Vol. III. - P. 1581-1584.

4. Кухарев, Г.А. Биометрические системы: методы и средства идентификации личности человека / Г.А. Кухарев - СПб.: Политехника, 2001. - 240 с.

5. Kukharev, G. Data Dimensionality Reduction for Face Recognition / G. Kukharev, P. Forczmanski //Journal machine graphics & vision. - 2004. - Vol. 13, No. 1/2. -P. 99-121. - ISSN 1230-0535.

6. Кухарев, Г.А. Системы распознавания человека по изображению лица / Г.А. Кухарев, Н.Л. Щеголева -СПб.: Изд-во СПбГЭТУ «ЛЭТИ», 2006. - 176 с.

7. Zuo, W. Subspace Methods for Face Recognition: Singularity, Regularization, and Robustness / W. Zuo, K. Wang, H. Zhang // State of the Art in Face Recognition, edited by: Dr. Mario I. Chacon M., January 2009, I-Tech, Vienna, Austria. - 250 p. - ISBN -3-902613-42-4.

8. Кухарев, Г.А. Поиск изображений лиц в больших базах данных / Г. А. Кухарев // Мир измерений. - 2009.

- № 4(98). - С. 22-30.

9. The ORL database -www.uk.research.att.com/pub/data/att_faces.zip.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10. Yang, J. Two-dimensional PCA: a new approach to appearance-based face representation and recognition / J. Yang [et al.] // IEEE Trans. on PAMI. - 2004. - No. 26.

- P. 131-137.

References

1. Pratt, W. Digital image processing / W. Pratt, - Moscow: "Mir" Publisher, 1982. - 312 p. - (in Russian).

2. Turk, М. Eigenfaces for Face Detection/Recognition / M. Turk, A. Pentland // Journal of Cognitive Neuroscience.

- 1991. - Vol. 3, No. 1. - P. 71-86. - ISSN 0898-929X.

3. Tsapatsoulis, N. Vector Based Approximation of KLT and Its Application to Face Recognition/ N. Tsapatsoulis, V. Alexopoulos, S.A. Kollias // Proceedings of the IX European Signal Processing Conference EUSIPCO-98, September 8-11. Rodos Palace, Island of Rhodes, Greece,

- 1998. - Vol. III. - P. 1581-1584.

4. Kukharev, G.A. Biometric Systems: Methods and means of identification of a person's identity / G.A. Kukharev -Saint-Petersburg: "Polytechnics" Publisher, 2001. - 240 p.

- (in Russian).

5. Kukharev, G. Data Dimensionality Reduction for Face Recognition / G. Kukharev, P. Forczmanski //Journal machine graphics & vision. - 2004. - Vol. 13, No. 1/2. -P. 99-121. - ISSN 1230-0535.

6. Kukharev, G.A. Systems of recognition of human facial image / G.A. Kukharev , N.L. Schegoleva - Saint-Petersburg, Acad ETU "LETI" Publisher, 2006. - 176 p. - (in Russian).

7. Zuo, W. Subspace Methods for Face Recognition: Singularity, Regularization, and Robustness / W. Zuo, K. Wang, H. Zhang // State of the Art in Face Recognition, edited by: Dr. Mario I. Chacon M., January 2009, I-Tech, Vienna, Austria. - 250 p. - ISBN -3-902613-42-4.

8. Kukharev, G.A. Find pictures of persons in large databases / G.A. Kukharev // World measurement. - 2009. -Vol. 4(98). - P. 22-30. - (in Russian).

9. The ORL database -www.uk.research.att.com/pub/data/att_faces.zip.

10. Yang, J. Two-dimensional PCA: a new approach to appearance-based face representation and recognition/ J. Yang [et al.] // IEEE Trans. on PAMI. - 2004. - Vol. 26.

- P. 131-137.

ALGORITHMS OF TWO-DIMENSIONAL PRINCIPAL COMPONENT ANALYSIS

FOR FACE RECOGNITION

G.A. Kukharev, N.L. Shchegoleva St. Petersburg State Electrotechnical University

Abstract

In article presents algorithms for two-dimensional principal component analysis (Two-dimensional Principal Component Analysis - 2D PCA)-oriented processing of digital images of large sizes in a small sample. Algorithms based on direct calculation of two covariance matrices for all source images without converting them into vectors. Result analysis - finding the principal components for the rows and columns of the source images and the construction of the corresponding matrices of two-dimensional projection. We discuss two ways to do 2D PCA, corresponding to parallel and cascade forms of its realization. Evaluated the presented algorithms.

Key words: principal component analysis, image recognition.

Сведения об авторах

Кухарев Георгий Александрович родился в 1941 году в Ленинграде. Кандидатскую диссертацию защитил в 1979 году в Ленинградском институте точной механики и оптики (ЛИТМО), докторскую - в 1986 году в институте автоматики и вычислительной техники (Рига, Латвия).

В настоящее время профессор кафедры математического обеспечения ЭВМ СПбГЭТУ (ЛЭТИ) и профессор на факультете информатики Щецинского технологического университета в Польше (Szczecin, West Pomeranian University of Technology, Poland). В 20012003 годах был визитинг-профессор на кафедре информатики и математики в Ecole Centrale de Lyon во Франции. В 2005-2006 годах был визитинг-профессор в Ханойском университете (Вьетнам).

Является автором и соавтором боле 100 научных работ, в том числе 40 авторских свидетельств на изобретения и 10 монографий, посвящённых методам и техническим средствам цифровой обработки сигналов и изображений.

Последние исследования связаны с биометрией - областью знаний, представляющей методы измерения физических характеристик (или персональных поведенческих черт) человека и методы их сравнения с аналогичными характеристиками в базе данных для целей идентификации или аутентификации человека.

E-mail: [email protected]

Georgy Alexsandrovich Kukharev Born in 1941 in Leningrad. PhD thesis defended in 1979 at the Leningrad Institute of Precision Mechanics and Optics (LITMO), PhD - in 1986 at the Institute of Automation and Computer Engineering (Riga, Latvia).

At present Professor of Computer Software ETU (LETI), and Professor of Computer Science Faculty at the Szczecin University of Technology in Poland (Szczecin, West Pomeranian University of Technology, Poland). In 2001-2003, a Visiting Professor at the Department of Informatics and Mathematics at the Ecole Centrale de Lyon in France. In 20052006. a Visiting Professor at the Hanoi University Scoma (Vietnam).

He is an author and co-authored more than 100 scientific papers, including 40 inventor's certificates and 10 monographs on methods and technical means of digital signal processing and image. Recent research related to biometrics - the area of knowledge, representing the methods of measuring physical characteristics (or personal behavioral traits) of a person and how they compare with similar characteristics in the database for the purpose of identification or authentication rights.

Щеголева Надежда Львовна, 1973 года рождения. В 2000 году в Санкт-Петербург -ском государственном электротехническом университете (ЛЭТИ) защитила диссертацию на соискание ученой степени кандидата технических наук. В 2001-2006 работала старшим научный сотрудником ОАО «Концерн «Океанприбор». В настоящее время работает доцентом кафедры МО ЭВМ СПБГЭТУ и старшим научным сотрудником ОАО «НИЦ СПб ЭТУ».

В настоящее время её интересы лежат в области биометрии, в том числе: обнаружение и распознавание лиц в больших базах данных, идентификация и контроль доступа, поиск лиц, построение систем распознавания лиц. Является автором 20 научных работ, соавтором монографии и двух учебных пособий.

E-mail: [email protected].

Nadegda Lvovna Schegoleva Born in 1973. He received his Ph.D. degree (2000) in Saint Petersburg Electrotech-nical University (LETI). From 2001-2006 she is Senior Researcher in JSC "Concern" OKEANPRIBOR ". From 2007 she is a docent in the Department of Computer Software Environment (Saint Petersburg Electrotechnical University LETI, St.-Petersburg, Russia) and Senior Researcher in Scientific-Engineering Center of Saint-Petersburg Electrotechni-cal University ( JSC "SIC St. EGS").

Her current interests are in the areas of biometrics, including: face detection and face recognition, "Visitor Identification" and "Access Control" Systems, task "Name-It" and face retrieval, system of face recognition. She is the author of one monograph, 20 scientific papers.

Поступила в редакцию 10.08.2010 г.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кухарев Георгий Александрович, Щеголева Надежда Львовна

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Кухарев Георгий Александрович, Щеголева Надежда Львовна

ALGORITHMS OF TWO-DIMENSIONAL PRINCIPAL COMPONENT ANALYSIS FOR FACE RECOGNITION

Текст научной работы на тему «Алгоритмы двумерного анализа главных компонент для задач распознавания изображений лиц»