Научная статья на тему 'Некоторые аспекты построения системы биометрического поиска, базирующейся на стохастической геометрии'

Некоторые аспекты построения системы биометрического поиска, базирующейся на стохастической геометрии Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
126
62
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
Распознавание лиц / база данных изображений / трейс-преобразование / стохастическая геометрия / Face recognition / image database / trace transform / stochastic geometry

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Фионов Никита Сергеевич

Предложен подход к решению задачи поиска человеческих лиц в базе данных на основе стохастической геометрии и функционального анализа. Ключевым элементом этого подхода является новое геометрическое трейс-преобразование изображений, связанное со сканированием изображений по сложным траекториям. Описан модифицированный метод, используемый на этапе обучения.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Фионов Никита Сергеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Некоторые аспекты построения системы биометрического поиска, базирующейся на стохастической геометрии»

УДК 004.931:004.932

НЕКОТОРЫЕ АСПЕКТЫ ПОСТРОЕНИЯ СИСТЕМЫ

БИОМЕТРИЧЕСКОГО ПОИСКА, БАЗИРУЮЩЕЙСЯ НА СТОХАСТИЧЕСКОЙ ГЕОМЕТРИИ

Никита Сергеевич Фионов

Пензенский государственный университет, г. Пенза

Распознавание лиц; база данных изображений; трейс-преобразование;

стохастическая геометрия.

Face recognition; image database; trace transform; stochastic geometry. Аннотация

Предложен подход к решению задачи поиска человеческих лиц в базе данных на основе стохастической геометрии и функционального анализа. Ключевым элементом этого подхода является новое геометрическое трейс-преобразование изображений, связанное со сканированием изображений по сложным траекториям. Описан модифицированный метод, используемый на этапе обучения.

Abstract

In this paper, we present a new approach based on stochastic geometry and functional analysis to solve the problems in face image database retrieval. A key element of this approach is the use of a new geometric trace transform of image based on image scanning. The modification of the method used at the training stage is described.

Статья посвящена поиску изображений человеческих лиц в базе данных. В данной работе предлагается подход к решению задачи поиска человеческих лиц на основе стохастической геометрии и функционального анализа. Ключевым элементом этого подхода является новое геометрическое трейс-преобразование изображений, связанное со сканированием изображений по сложным траекториям [1].

Пусть F(х,у) — функция изображения на плоскости (х,у). Определим на плоскости сканирующую прямую l(j, р, t), которая задается нормальными координатами j и r:

х • cos j + у • sin j = р,

параметр t задает точку на прямой. Определим функцию двух аргументов g (j,p) = T( F n l (j,p, t)) как результат действия функционала T при

фиксированных значениях переменных j и r.

В результате действия функционала T по всему множеству сканирующих линий получаем матрицу, элементами которой являются значения tj = T( F n l (jj, p, t)). Детерминированное сканирование позволяет

однозначно определить каждый элемент матрицы. Данная матрица называется трейс-матрицей. Она является результатом трейс-преобразования, или трейс-трансформантой [1].

В дискретном варианте вычислений трейс-трансформанта представляет собой матрицу, элементами которой tj являются, например, значения

яркости изображения F при пересечении со сканирующей линией l(j, p). Параметры сканирующей линии jj, p определяют позицию этого элемента в матрице [1].

Примерами используемых функционалов являются: T1 = [ f (t)dt -

l nF

суммарная длина всех отрезков, высекаемых изображением на сканирующей

ГГ 1

линии; T2 =-------среднее гармоническое длин всех отрезков, высекаемых

С dt

l nF

f (t)

изображением на сканирующей линии; Тз = rip,в)

- число сегментов,

получаемых при пересечении прямой и образа.

Итак, каждой точке трейс-трансформанты соответствует сканирующая линия. Важным этапом работы системы биометрического поиска является этап обучения, на котором происходит отбор этих линий.

Опишем метод назначения весов каждой сканирующей линии согласно той роли, которую она играет в распознавании. Если функционалы принимают одинаковые значения для различных изображений лица одного человека, то соответствующие сканирующие линии наиболее важны для идентификации. Данный метод можно назвать взвешенным трейс-преобразованием [2].

Пусть F j - это j-ое изображение обучающей совокупности для і-го

человека. gk - соответствующее трейс-преобразование при использовании функционала k.

В нашем случае рассмотрено по 3 изображения для каждого человека (с разными выражениями лица).

Опишем поэтапно взвешенное трейс-преобразование.

На первом этапе вычисляется трейс-преобразование gk (f, p) = Тк (Fj (f, p, t)) ,

где Tk - это k-ый Т-функционал.

Затем вычисляются разницы между трейс-трансформантами:

Df

Df

D3k

gii - g

k i 2

kk gi1 — g i3

gki2 - gk3

Далее вычисляется матрица весов модифицированного трейс-преобразования:

Wlk (f, р) =

1 йШ '^Lmy(D'km (j Г)) = 0

0 eia^a.

где

f 0, anee x <t,

¥(X) = і о

[1, eia^a.

и t это некоторый порог.

Таким образом, матрица весов отмечает только те сканирующие линии, по которым на всех трех изображениях значения функционалов отличаются друг от друга лишь на определенное пороговое значение.

Пусть Gr и Gt - трейс-трансформанты эталонного и тестового изображений. Вычислим расстояние между ними по формуле

Dist = max({D(Gr, Gt)}

i

где

D(Gr, Gt) = -

exp

— W (j, P) ■ min j\glr (j P) - gt (jt, P)

П1,

1

где nk - общее число отмеченных линий во взвешенном трейс-преобразовании. D(G'r, Gt) возвращает максимальное значение, равное 1, в том случае, когда G’r иGt в точности равны.

Для задачи поиска изображений человеческих лиц в базе данных целесообразно сначала производить сегментацию портретного изображения с учетом физиологии человеческого лица. Дело в том, что детальная обработка наиболее информативных областей (области глаз, носа, рта, контура лица) может значительно снизить вычислительные затраты, а удачное признаковое описание таких областей увеличит эффективность поиска и идентификации

[3].

В середине XX века экспериментальные исследования А.Л. Ярбуса по изучению механизмов выбора точек фиксации взгляда показали, что человек

в процессе осмотра изображений фиксирует взгляд, главным образом, на его смысловых центрах, называемых наиболее информативными областями.

Выбор таких областей изображений для фиксации взгляда и детального анализа с помощью механизмов фовеального зрения зависит от множества факторов, взаимодействующих между собой.

Комплексный подход к изучению механизмов осмотра изображений, основанный на взаимодействии психофизического эксперимента и математического моделирования, описан в работе [4] научной школы НИИ нейрокибернетики им. А.Б. Когана Южного федерального университета. Наиболее информативные области, выделенные по результатам экспериментов с использованием современной системы регистрации и анализа движений глаз, оказались во многом сходны с результатами А.Л. Ярбуса.

Использование описанного модифицированного варианта трейс-преобразования позволяет повысить надежность поиска в базе данных, так как система идентификации должна устойчиво функционировать в условиях линейных преобразований изображения и ограниченных ракурсных трансформаций объекта идентификации.

Работа выполнена при поддержке Минобрнауки, АВЦП «Разработка теории анализа и распознавания изображений на основе стохастической геометрии и функционального анализа».

Литература

1. Федотов Н.Г. Теория признаков распознавания образов на основе стохастической геометрии и функционального анализа. - М.: ФИЗМАТЛИТ, 2009.

2. Sanun Srisuk, Kongnat Ratanarangsank, Werasak Kurutach and Sahatsawat Waraklang. Face Recognition using a New Texture Representation of Face Images. http://www.face-rec.org

3. Шапошников Д.Г., Головань А.В., Гизатдинова Ю.Ф., Литовченко Е.В., Гусакова В.И. Оценка параметров информативных областей изображений лиц//В мат. Юбилейной межд. конф. по нейрокибернетике, Ростов-на-Дону, 2002, 163-166.

4. Л.Н. Подладчикова, Д.Г. Шапошников, А.В. Тикиджи-Хамбурьян, Т.И. Колтунова, Г.Г. Бондарь, В.И. Гусакова, А.В. Головань. Комплексный подход к исследованию механизмов осмотра изображений// Сб. науч. тр. 11-ой Всерос. н.-т. конф.

«Нейроинформатика 2009». - 2009

i Надоели баннеры? Вы всегда можете отключить рекламу.