Научная статья на тему 'Применение алгоритмов двумерного анализа главных компонент для задач распознавания изображений лиц'

Применение алгоритмов двумерного анализа главных компонент для задач распознавания изображений лиц Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY-NC-ND
738
102
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДВУМЕРНЫЙ АНАЛИЗ ГЛАВНЫХ КОМПОНЕНТ / ДВУМЕРНОЕ ПРЕОБРАЗОВАНИЕ КАРУНЕНА-ЛОЭВА / РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ ЛИЦ / ПРИМЕНЕНИЕ В БИЗНЕС-ПРИЛОЖЕНИЯХ / TWO-DIMENSIONAL PRINCIPAL COMPONENT ANALYSIS / A TWO-DIMENSIONAL KARHUNEN-LOEVE TRANSFORMATION / THE FACE RECOGNITION / THE USE IN THE BUSINESS APPLICATIONS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Щеголева Н. Л., Кухарев Г. А.

Представлены алгоритмы двумерного анализа главных компонент (Two-dimensional Principal Component Analysis 2D PCA), ориентированные на обработку цифровых изображений больших размеров в условиях малой выборки. Рассматриваются два способа выполнения 2D PCA, соответствующие параллельной и каскадной формам его реализации. Оценены характеристики представленных алгоритмов. Обсуждаются возможности использования представленных алгоритмов в других областях.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Щеголева Н. Л., Кухарев Г. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ALGORITHMS 2DPCA FOR FACE RECOGNITION

In article presents algorithms for two-dimensional principal component analysis (Two-dimensional Principal Component Analysis 2D PCA)-oriented processing of digital images of large sizes in a small sample. Algorithms based on direct calculation of two covariance matrices for all source images without converting them into vectors. Evaluated characteristics of the presented algorithms. We discuss possibilities presented by the use of algorithms in other areas.

Текст научной работы на тему «Применение алгоритмов двумерного анализа главных компонент для задач распознавания изображений лиц»

ПРИМЕНЕНИЕ АЛГОРИТМОВ ДВУМЕРНОГО АНАЛИЗА ГЛАВНЫХ КОМПОНЕНТ ДЛЯ ЗАДАЧ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ ЛИЦ

Н.Л. Щеголева,

кандидат технических наук, доцент кафедры математического обеспечения и применения ЭВМ Санкт-Петербургского государственного электротехнического университета (ЛЭТИ)

Г.А. Кухарев,

доктор технических наук, профессор кафедры математического обеспечения и применения ЭВМ Санкт-Петербургского государственного электротехнического университета (ЛЭТИ), профессор факультета информатики Западно-поморского технологического университета, Щецин, Польша (West Pomeranian University of Technology, Szczecin, Poland)

Адрес: г. Санкт-Петербург, ул. Профессора Попова, д. 5 E-mail:stil_hope@mail.ru, gkukharev@wi.zut.edu.pl

Представлены алгоритмы двумерного анализа главных компонент (Two-dimensionalPrincipal Component Analysis — 2D PCA), ориентированные на обработку цифровых изображений больших размеров в условиях малой выборки. Рассматриваются два способа выполнения 2D PCA, соответствующие параллельной и каскадной формам его реализации. Оценены характеристики представленных алгоритмов. Обсуждаются возможности использования представленных ^алгоритмов в других областях. ^

Ключевые слова: двумерный анализ главных компонент, двумерное преобразование Карунена-Лоэва, распознавание изображений лиц, применение в бизнес-приложениях.

Введение

XXI век ознаменовался переходом от простых информационных систем к использованию интеллектуальных сред — современного поколения вычислительных и информационных технологий. Примерами интеллектуальных сред являются:

♦ интернет, через который реализуются общение людей бизнес-сообщества (видеоконференции, консультации , почта), поиск информации и доступ к ней, интернет-маркетинг и интернет-магазины и т.д.;

♦ виртуальные предприятия, реализующие проекты по типу «start up», сообщества и ассоциации, реализующие обмен информацией, технологиями,

другими информационными и вычислительными ресурсами;

♦ высокоорганизованные интерфейсы систем «клиент — банк»;

♦ системы класса «Visitor Identification», реализующие распознавание или аутентификацию, например, постоянного покупателя магазина, гостя (посетителя) частного дома или офиса, пассажира международного транспорта и т.д;

♦ системы контроля доступа к информации (базам данных, корпоративным сетям), к средствам (техническим, финансовым), к помещениям, к ресурсам (например, вычислительным).

Перечисленные примеры имеют одну очень важную общую характеристику: здесь все задачи решаются в процессе непосредственного общения человека со средой (в режиме «on-line») и, что самое важное, — этим человеком может быть только зарегистрированный пользователь, подлинность личности которого проверяется на входе в интеллектуальную среду.

Сегодня, например, сложно представить себе успешного бизнесмена без ноутбука, планшетного компьютера, смартфона или коммуникатора. Более того, в ходе круглого стола «Электронный парламент: вопросы правового обеспечения», который прошел 14 апреля 2011 г. было принято решение об обеспечении всех депутатов Госдумы шестого созыва, которые будут избраны в декабре 2011 г., личными интернет-планшетами iPad. Вскоре подобная перспектива ждет и каждое региональное правительство. Все эти мобильные устройства хранят личную и деловую информацию, сведения, содержащие коммерческую тайну, а устройства депутатов Госдумы — сведения, представляющие государственную тайну. Очевидно, что доступ постороннего человека к этой информации может стать причиной материальных потерь и/или нанести ущерб безопасности государства. И здесь одной из наиболее актуальных проблем является проблема идентификации (аутентификации) конечного пользователя подобных устройств.

Задачи идентификации (аутентификации) пользователя успешно решаются в рамках биометрических технологий. Эти идеи отражает статья [1], в которой показано использование методов анализа главных компонент (Principal Component Analysis

— PCA) в задачах распознавания изображений лиц.

Однако в современных условиях развития информационных технологий и инженерии программного

обеспечения можно предложить более рациональные алгоритмы для этого метода, позволяющие более детально анализировать многомерные данные, какими являются изображения. Именно эти рациональные алгоритмы и предлагаются в настоящей статье, что отличает ее от работы [1].

Проблемы, связанные с обработкой изображений методами PCA

В задачах обработки изображений методами РСА исходными являются три базовых параметра: {M, N, K}, где Ми N — число строк и столбцов исходных изображений, а K — количество изображений [2 — 4]. Первые два параметра определяют размерность DIM исходного пространства признаков DIM = MN. При этом обработке изображений лиц методами РСА сопутствует проблема малой выборки (Small Sample Size — SSS), когда DIM >> K. Размерность исходного пространства признаков DIM определяет вычислительную сложность реализуемых алгоритмов.

Классический метод PCA [2] включает два этапа.

Первый из них — анализ главных компонент, в рамках которого по всем исходным данным определяется матрица ковариации и для нее определяются наибольшие собственные значения (главные компоненты) и матрица собственных векторов (матрица проекции). Второй этап включает одномерное преобразование в собственном базисе (или преобразование Карунена-Лоэва/Karhunena-Loeva Transform/KLT), которое использует найденную матрицу проекции.

Результат KLT представляет исходные данные как их спектр в собственном базисе, поэтому для сохранения основной информации об исходных данных достаточно использовать только несколько главных спектральных компонент [2]. При этом достигается условие:

DIM «DIM, (1)

new

где DIMnew — размерность нового пространства признаков.

Однако статистически устойчивое решение задачи PCA/KLT в приложении к обработке изображений возможно только в случае отсутствия проблемы SSS и/или выполнения условия:

DIM = MN << K. (2)

Варианты реализации РСА/КЕГ в условиях проблемы БББ показаны в работах [1, 3]. Они сводятся к предобработке исходных данных с целью уменьшения их размерности до достижения условия (2). Так в [3] решение основано на перемасштабиро-вании каждого исходного изображения до размеров т < М и п < N, при которых Б1М = тп << К и последующего прямого применения РСА/КЕГ В

[1] решение основано на декомпозиции всего набора исходных данных (общим размером MN х К ) в виде нескольких подматриц меньшего размера, для которых выполняется условие (2), нахождении частных решений РСА/КЕГ для этих подматриц и сведении частных решений к полному решению.

В настоящей статье представлены алгоритмы двумерного анализа главных компонент (2БРСА) и двумерного преобразования Карунена-Лоэва (2БКЕГ), специально предназначенные для обработки изображений больших размеров в условиях БББ и не требующие предобработки исходных данных с целью достижения условия (2) [4 — 6].

1. Идея и реализация 2D PCA\2D KLT

Пусть нам задан набор X, состоящий из X центрированных и нормированных к «1» изображений X(к) к = 1, 2,К (для к = 1, 2,К) размером М х N каждое, и MN >> К:

(K)!

(З)

Целью 2D PCA является определение двух матриц проекции, трансформирующих исходные данные в новое пространство признаков так, чтобы выполнялось условие минимума расстояния:

disance((k) - W1TX(k)Wmin, \jk = 1,2,..., K , (4)

где W1, W2 — ортогональные матрицы порядков M и N соответственно.

Параллельный алгоритм. Здесь двумерный анализ главных компонент выполняется независимо по строкам и столбцам исходных данных, и при этом определяются два независимых собственных базиса.

Модель вычислений в 2D PCA\2D KLT можно представить следующим образом:

1.0. X-

Xі;

(5)

1.1. X PCAr >W1;

1.2. X РСАг >Ж2;

2. У(к) = ЩТХ(к^2,Ук=1, 2,...,К .

На этапе 1.0 выполняется реорганизация структуры исходных данных (3). Это реализуется как транспонирование всех матриц размером М х N в наборе X и составление нового набора данных Х1. На этапе 1.1 выполняется базовая процедура РСА относительно строк исходных данных (РСАг). На этапе 1.2 выполняется РСА относительно строк (РСАг) данных, входящих в набор Х1, или, что тоже самое, — относительно столбцов исходных данных. Результат этапов 1.1 и 1.2 — вычисление двух матриц проекции W1 и Wr Этапы 1.1 и 1.2 могут быть выполнены параллельно, поскольку процедура РСАг применяется для независимых наборов данных X и Х1.

Наконец, этап 2 — это трансформация всех исходных изображений из набора X в новое пространство признаков К С учетом этого, на рис. 1 представлена схема параллельного способа (5) реализации 2Б РСА. Блок <^» реализует транспонирование всех матриц размером М х N в наборе X. Блоки, обозначенные как «®», реализуют процедуру проекции исходных данных. Пунктиром выделен блок, определяющий двумерное преобразование Карунена-Лоэва (2Б КЕГ).

Рис. 1. Параллельный способ реализации 2D РСА.

Заметим, что в представленном методе двумерное 2Б КЕГ реализуется по каскадной схеме: сначала исходное изображение обрабатывается по строкам, а затем полученный результат обрабатывается по столбцам (или наоборот). Это аналогично тому, как могут выполняться многие двумерные дискретные ортогональные преобразования изображений

[2], что, однако, противоречит способу получения собственных базисов в (5).

Каскадный алгоритм. Здесь в первом каскаде выполняется анализ главных компонент по строкам исходных изображений, а во втором — по столбцам результата первого каскада (или наоборот — сначала по столбцам, а потом по строкам результата). При этом определяются два взаимосвязанных собственных базиса, и 2Б КЕГ реализуется также по каскадной схеме во взаимосвязанных базисах. Модель каскадного алгоритма запишем следующим образом:

X РСА >щ.хі}—>X РСАг >{Ж2;У} —>У. (6)

Здесь: Х1 — данные Х1 после их реорганизации блоком «К»; выражения в фигурных скобках представляют результаты РСА\КЕГ по строкам и столбцам исходных изображений.

Схема вычислений, соответствующая модели (6), представлена на рис. 2. Здесь в явной форме отражен каскадный способ реализации 2Б РСА\2Б КЕГ.

РСАг

R

РСАг

Ж

R

Рис. 2. Структура каскадного алгоритма 2D PCA.

2. Формальное описание алгоритмов

Версия параллельного алгоритма. Вычислим две матрицы ковариации, определив их относительно строк («r» — row) и столбцов («с» — column) для исходных изображений (3):

K K

C(r) = ХX(k)CX(k))T и C(c) =Х(X(k))TX(k), v keK, (7)

где C(r) и C(c) — матрицы порядков M и N соответственно.

С учетом (7) определим собственные значения и соответствующие им собственные векторы, решив следующие две задачи на собственные значения:

W1TC(r )W1 = Л1; W2TC (c)W2 = Л (8)

При этом W1TW1 = I1 и W2TW2 = I2, а I1 и I2 — единичные матрицы порядков M и N соответственно; Л1 и Л 2 — диагональные матрицы порядков M и N соответственно.

Трансформация исходных данных в новое пространство признаков реализуется как двумерное преобразование Карунена-Лоэва на основе собственных базисов, определяемых по (8) в следующей форме:

Y<k) = (WTX(k))W2, V k = 1,2,..., K , (9)

где Y(k) — матрицы размера M x N , представляющие исходные изображения в новом пространстве признаков.

Версия каскадного алгоритма.

Выполним проекцию исходных данных так, что:

X(k) = WTX(k), v k = 1,2,..., K , (10)

где X1(k) — матрицы размера M x N, представляющие исходные изображения (3) в новом (промежуточном) пространстве признаков; матрица W1 была определена в (8).

Далее вычислим матрицу ковариации, определив ее относительно столбцов («с» — column) результата (10):

C(c) =£ (Xi(k))TXi(k) , (11)

k=1

где матрица C<с> имеет порядок, равный N.

Вычислим для (11) собственные значения и соответствующие им собственные векторы, решив следующую задачу на собственные значения:

WTC (c)W2 = Л 2,: (12)

где W2 и Л2 — матрицы порядка N.

Трансформация исходных данных (3) в новое пространство признаков реализуется теперь как двумерное преобразование Карунена-Лоэва (9) на основе собственных базисов, определяемых ортогональными матрицами проекции (8) и (12).

Редукция размерности пространства признаков

Изменим (9) так, чтобы в дальнейших преобразованиях участвовали только те собственные векторы, которые соответствуют «й» главным компонентам (d < шт{M, N}). Для этого, из выбранных собственных векторов формируются две прямоугольные матрицы: из матрицы W1T выбираем «й» строк, а из матриц Ж, выбираем «й» столбцов, соответствующих «й» наибольшим собственным числам, и на их основе формируются две матрицы редукции F1 и F2. Верхние границы параметра «й» выбираются исходя из критерия энергетической значимости собственных значений [5, 6]. Нижние границы параметра «й» выбираются экспериментально с учетом критерия (4). При этом d < шт{M, N} или d1 < M ; d2 < N , если d1 Ф d2.

Теперь выполним «усеченное» двумерное преобразование Карунена-Лоэва:

#)

У(1,1 ... y(d ,1)

Y^) = f,x (k) f2 , где ^) =

y(1,1)... y(d,1) y(2,1)... y(d ,2)

y(d ,1)... y(d, d)

(13)

Матрицы F1 и F2 имеют размеры d х M и N х d соответственно (или d1 х M и N х d2 в общем случае); знак «А» — определяет отличие результата (13) от (9).

Результирующие матрицы в (13) имеют в общем случае размеры d1 х d2 и представляют исходные изображения в новом пространстве признаков.

3. Характеристики разработанных алгоритмов и их отличия от известных

3.1. На реализацию полного 2Б КЕГ (9) потребуется (NM2 + MN2) операций, а на реализацию «усеченного» 2Б КЕГ по схеме (13) потребуется (Md2 + MNd) операций. При этом сокращение вычислений на этапе редукции размерности пространства признаков (РПП) можно приблизительно оценить как величину (Ы + N) / d , поскольку:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Ш2 +MN2 MN(M + Ю M + N

----1------=------------ =------, для d << N. (14)

Md2 + MNd M (а + d

Например, для М=112 и N=92 (база лиц ORЕ [9])

и d=10 сокращение вычислений составит примерно 20 раз(!) на каждое изображение. С учетом параметра « K » — числа изображений, ускорение вычислений составит величину, равную примерно K (M + N)/ d на все исходные данные.

3.2. Результат в (13) содержит d2 (или dt x d2) элементов, поэтому степень редукции РПП определяется соотношением MN / d2 или MN / (ld2), если dj Ф d2.

Например, для M=112, N=92 и d= 10 редукция размерности пространства признаков составит более чем 100 раз(!) на каждое изображение. Таким образом, использование предложенных в статье алгоритмов ориентировано на сокращение ресурсных затрат в практических приложениях.

3.3. Наибольший порядок матриц ковариации в (7), (12) составляет величину DIM = max{M,N}. Это предопределяет практическую возможность решения задачи на собственные значения и стабильность этого решения даже для изображений больших размеров.

3.4. При представлении исходных изображений как совокупности строк и столбцов общее число получаемых векторов составляет величину K (M + N), а размерность исходного пространства признаков определяется как DIM = max {M, N}. Поэтому при любых значениях M и N соотношение «размерность/число векторов» всегда будет отвечать условию max { M, N} << K (M + N), «обходя» таким образом, проблему SSS.

4. Распознавание изображений лиц

Эксперименты выполнены на базе ORL [9], некоторые изображения которой показаны на рис. 3. База ORL охватывает 40 различных классов образов (изображений лиц людей различных наций), по 10 образов в каждом классе. Все изображения базы ORL относятся к типу «indoor», имеют размер 112 на 92 пикселя и представлены в шкале «GRAY» (256 уровней яркости).

Для лиц базы ORL характерно изменение: контраста изображений и яркости фона вокруг области лица; размера лиц, в том числе не пропорционально по осям X и Y; поворота головы в пространстве 3D в пределах не менее ±20о по оси X, ±30о по оси Y и не менее ±10о по оси Z; мимики лиц, прорисовки деталей лиц (их сглаживание).

Рис. 3. Примеры исходных данных.

В первом эксперименте решалась задача поиска изображений лиц по заданному тестовому образу с помощью представленного в данной статье алгоритма 2D PCA. Эксперимент был выполнен для всех 40 классов с выбором только одного образа из каждого класса для эталона и девяти других образов в каждом классе для теста. Таким образом, в формулировке задачи поиска база системы поиска содержала 40 образов-эталонов (по одному на класс), а в качестве тестовых были использованы 360 образов (по девять образов на каждый из 40 классов). В эксперименте дважды использована процедура кросс-валидации: в каждом эксперименте изменялся номер выбранного образа-эталона, а внутри каждого эксперимента изменялся параметр редукции «d» (d = 3, 4,...,10). Всего, таким образом, выполнено 10 х 8 = 80 экспериментов. Модель выполненного эксперимента имеет следующий вид [6]:

ORL(40/1/9/CV){2DPCA: 112П92—»dffl/KMP/L1/rank = 1},

где определены:

0RL(40/1/9/CV) — база лиц, структура данных и процедура кросс-валидации (CV);

2DPCA:112—>92 d x d — использованный метод и размеры данных до и после редукции размерности пространства признаков;

KMP/L1/rank = 1 — тип классификатора, метрика и ранг результата.

Текущие результаты в каждом эксперименте оценивались как отношение количества правильно классифицированных тестовых образов к общему их числу 360. Общее число тестовых образов составило 3600 для каждого значения параметра «d». Результат считался правильным, если на первом месте (rank = 1) в группе результатов находился образ из того же класса, что и тестовый образ.

В эксперименте использован классификатор по минимуму расстояния (КМР) в метрике L1.

30

20

10

ТТТттг tfflifai

ПАРАЛЛЕЛЬНЫЙ 40

10

ЇТтГгт*

20 0

10

по столбцам

0

20 0

КАСКАДНЫЙ

tfwd......«««і

по строкам

Рис. 4. Собственные значения для метода 2D PCA.

10 20 по столбцам

% Результат распознавания для кросс-валидации

Рис. 5. К выбору параметра редукции «d».

На рис. 4 показаны 20 наибольших собственных значений (собственные значения, вычисленные по строкам для обоих способов, — одинаковы по определению). При этом главные компоненты ограничены величиной ё и 6, поскольку далее собственные значения практически равны «0».

На рис. 5 показаны результаты решения поставленной задачи поиска для различных значений параметра редукции «й». Как видно, наилучший результат поиска получен при значении й = 6. Степень редукции размерности пространства признаков составила при этом значение, равное 286 (поскольку 112 □92 / 36 = 286).

Подводя итоги эксперимента, необходимо отметить следующее:

♦ При выполнении поставленного эксперимента дважды решалась задача на собственные значения. Порядки матриц ковариации составили соответственно 112 и 92. Общее число «изображений» составило 40 □ (112 + 92), поэтому матрицы ковариации были хорошо обусловлены и не потребовалось никаких процедур их регуляризации (в подходе

0

0

«Eigenfaces» [1] порядок матрицы ковариации составил бы величину 112 □92 = 10304, что сразу же определило бы невозможность ее дальнейшего использования);

♦ Ярко выраженное наличие «главных компонент» в составе собственных значений гарантирует репрезентативное представление исходных данных в новом пространстве признаков при малом значении параметра «d»;

♦ Решение поставленной задачи поиска выполнено успешно, особенно если учитывать специфику исходных данных — изображений лиц базы ORL и малое число образов-эталонов в системе поиска: по одному на каждый класс. Результаты, представленные в ходе экспериментов, выше результатов, показанных в [5], при решении аналогичной задачи.

Во втором эксперименте решалась задача распознавания изображений лиц при различном числе эталонов в базе системы распознавания (Face Recognition System — FaReS [6]). Модель выполненного эксперимента имеет следующий вид:

ORL(40/Z/10-Z/R+CV){2DPCA:12x92-»8x8}

[КМР/Ll/rank = 1].

В базу FaReS выбирается L тренировочных изображений в каждом из 40 классов; выбор организован случайным образом (random — R) и использована процедура кросс-валидации (R+CV). Число тестовых образов составляет 10 — L для L = 1, 2, 3, 4, 5. Результаты выполненных экспериментов представлены в таблице 1.

Таблица 1.

Результаты экспериментов

Э i/40/380 2/В0/320 3/120/2В0 4/1б0/240 5/200/200

П К П К П К П К П К

i бВ бВ /В /д 93 93 д4 д4 97 97

2 бВ бВ /В /В ВВ Вд до до д5 дб

3 /0 /0 В2 В2 до до д4 д4 д5 д4

4 бб бВ ВЗ В4 gi до дЗ дЗ д5 дЗ

5 71 71 ВЗ ВЗ до до gi до д2 gi

б 71 71 ВЗ ВЗ до до gi д2 д5 д5

/ /0 /0 В/ В/ gi д2 дЗ дЗ дб д/

В б4 б4 90 90 gi gi 94 95 д5 д5

д б/ б/ В2 81 Вд ВВ до Вд д4 д5

io бб бВ В2 В2 Вд Вд д2 д2 дб дб

ер 68 69 83 83 90 90 92 92 95 95

Здесь: «Э» — номер эксперимента;

1/40/360...5/200/200 — значение L и общее число изображений-эталонов и тестовых изображений в каждом эксперименте; П и К — способы: параллельный и каскадный.

Из представленных результатов видно, что существенный скачок результативности распознавания возникает уже при L = 2, а при значении L = 5 результат распознавания составляет (при округлении до наименьшего целого) в среднем 95% и в максимуме 97%. При этом результативность для двух алгоритмов реализации 2D PCA\2D KLT практически одинакова.

Эффективность применения 2D PCA\2D KLT для изображений тестовой базы FERET была показана нами в [10].

Заключение

Укажем наиболее значимые области, в которых применение алгоритмов 2D PCA/2D KLT может дать наиболее значимый эффект.

1. В [11] обосновывается необходимость применения свёртки наименьшего размера, позволяющей достигнуть наибольшей точности и производительности в процессе идентификации. Особенно актуально это для больших баз данных, хранящих информацию о биометрических характеристиках человека. Применение представленных в настоящей статье алгоритмов 2DPCA\2DKLT позволит создавать эффективные биометрические системы, обеспечивающие низкий уровень ошибок.

2. Алгоритмы 2D PCA можно использовать также для анализа и поиска закономерностей в экономических и финансовых данных, представленных многомерной структурой данных — многомерными наблюдениями. Одним из хорошо зарекомендовавших себя методов анализа и прогнозирования финансового рынка является метод «Гусеница» [12]. Метод независимо разрабатывался в России, Великобритании и США (там его аналог получил название SSA — Singular Spectrum Analysis). Суть метода заключается в формировании матриц наблюдений из множества временных рядов и выполнении PCA в приложении к этим матрицам. Применение 2D PCA\2DKLT позволит в этом случае выявить закономерности в исходных данных (тренды и их периоды, сезонные и другие периодические составляющие, взаимосвязь отдельных рядов наблюдений между собой и определить их модели), а также позволит сократить объем вычислений и объем

информации, представив исходные данные в более компактном виде.

3. Развитие методов записи и хранения данных привело к бурному росту объемов собираемой и анализируемой информации. Объемы данных настолько внушительны, что человеку просто не по силам проанализировать их самостоятельно, хотя необходимость проведения такого анализа вполне очевидна, ведь в этих «сырых» данных заключены знания, которые могут быть использованы при

принятии решений. Для того чтобы провести автоматический анализ данных, используется метод «Data Mining». Это процесс обнаружения в «сырых» данных ранее неизвестных нетривиальных практически полезных и доступных интерпретации знаний, поиска закономерностей и представление данных в виде удобном для анализа, делающее возможным построение моделей прогнозирования. Одним из методов, широко используемых в «Data Mining», является РСА. Очевидно, что алгоритмы 2D PCA будут здесь также кстати! ■

Литература

1. Мокеев А.В. О точности и быстродействии метода синтеза главных компонент // Бизнес-информатика, 2010, № 3(13). - С. 65-68.

2. Прэтт У. Цифровая обработка изображений. — М.: Мир, 1982. — 312 с.

3. Turk М., Pentland A. Eigenfaces for Face Detection // Journal of Cognitive Neuroscience, 1991, Vol. 3, №1.

— Р. 71-86.

4. Tsapatsoulis N., Alexopoulos V., Kollias S.A. Vector Based Approximation of KLT and Its Application to Face Recognition // Proceedings of the IX European Signal Processing Conference EUSIPCO-98, Vol. 3. — P. 15811584.

5. Кухарев Г.А. Биометрические системы: Методы и средства идентификации личности человека. — СПб.: Политехника, 2001. — 240 с.

6. Kukharev G., Forczmanski P. Data Dimensionality Reduction for Face Recognition // Journal MACHINE GRAPHICS & VISION, 2004, Vol. 13, № 1/2. — P. 99-121.

7. Кухарев Г.А., Щеголева Н.Л. Алгоритмы двумерного анализа главных компонент для задач распознавания изображений лиц // Компьютерная оптика, 2010, т.34, № 4. — С. 545-551.

8. Кухарев Г.А. Щеголева Н.Л. Системы распознавания человека по изображению лица. — СПб.: Изд-во СПбГЭТУ «ЛЭТИ», 2006. — 176с.

9. Zuo W., Wang K., Zhang H. Subspace Methods for Face Recognition: Singularity, Regularization, and Robustness // State of the Art in Face Recognition. I-Tech, Vienna, Austria, — 2004. — 250 p.

10.Кухарев Г.А. Поиск изображений лиц в больших базах данных // Мир измерений, 2009, № 4(98). — С. 22-30.

11.The ORL database - www.uk.research.att.com/pub/data/att_faces.zip.

12. Shchegoleva N.L., Kukharev G.A. Application of Two-Dimensional Principal Component Analysis for Recognition of Face Images // Pattern Recognition and Image Analysis, 2010, Vol. 20, №4. — Р. 513-527. http://www.maik.ru/contents/ patrec/patrec4_10v20cont.htm

П^илантьев Д.А. Оценка необходимого размера свертки биометрического образца для обеспечения заданных параметров надежности биометрической системы идентификации // Бизнес-информатика, 2009, № 3(09). — С. 21-23.

i Надоели баннеры? Вы всегда можете отключить рекламу.