Научная статья на тему 'Развитие принципов интеллектуального поиска биометрических изображений на основе стохастической геометрии и функционального анализа'

Развитие принципов интеллектуального поиска биометрических изображений на основе стохастической геометрии и функционального анализа Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
81
42
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Федотов Н. Г., Фионов Н. С., Романенко Ю. А., Баннов В. Я.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Развитие принципов интеллектуального поиска биометрических изображений на основе стохастической геометрии и функционального анализа»

Федотов Н.Г., Фионов Н. С.,Романенко Ю.А.

Пензенский государственный университет, г. Пенза Протвино

РАЗВИТИЕ ПРИНЦИПОВ ИНТЕЛЛЕКТУАЛЬНОГО ПОИСКА БИОМЕТРИЧЕСКИХ ИЗОБРАЖЕНИИ НА ОСНОВЕ СТОХАСТИЧЕСКОЙ геометрии и функционального анализа

Данная работа посвящена развитию подхода к решению задачи поиска изображений человеческих лиц в базе данных на основе стохастической геометрии и функционального анализа. Ключевым элементом этого подхода является новое геометрическое трейс-преобразование изображений, связанное со сканированием изображений по сложным траекториям [1].

Пусть F (х, у) — функция изображения на плоскости (X, у) . Определим на плоскости сканирующую прямую /(j,p,t) , которая задается нормальными координатами j и р , а параметр t задает точку на прямой. Определим функцию двух аргументов g(jp) = T(F n / (jp t)) как результат действия функционала T при фиксированных значениях переменных j и р .

В результате действия функционала T получаем матрицу, элементами которой являются значения tj = T(F n /(fj, pj, t)) . Данная матрица, названная трейс-матрицей, является результатом трейс-преобразования, или трейс-трансформантой.

Трейс-матрица 2п-периодична в направлении горизонтальной оси Oj, причем через каждый интервал длины п столбцы её переворачиваются. Этообъясняется тем, что множество сканирующих прямых составляют неориентированные прямые, т.е. прямые с координатами (j, р) и ( j+п, - р) на плоскости изображения задают одну и ту же прямую.

Трейс-преобразование является эффективным инструментом при изучении движений распознаваемых объектов и их масштабных изменений. Это объясняется тем, что трейс-трансформанта сохраняет информацию о первоначальном объекте, т.е. тип трейс-матрицы не изменяется под действием группы движений (поворота, переноса) и гомотетии, но каждое из этих преобразований вносит свою характерную компоненту при формировании трейс-трансформанты.

В [1] описано построение системы поиска бинарных изображений человеческих лиц в базе данных по фотороботу. Данный подход заключается в выделении наиболее информативных областей с последующим их трейс-преобразованием.В качестве областей наибольшей информативности выступают анатомические особенности лица.

По трейс-матрицам автоматически формируются признаки в виде композиции трех функционалов, названные триплетными, которые не имеют содержательную геометрическую интерпретацию, но обладают большой различающей способностью. Подобная структура позволяет получить большое количество признаков распознавания в режиме автоматической компьютерной генерации. Варьируя свойства функционалов, входящих в триплетный признак, можно добиться инвариантности поисковых признаков по отношению к группе движений и линейным искажениям изображений, что повышает надежность поиска фотоизображений.

Примерами используемых функционалов являются: суммарная длина всех отрезков, высекаемых изображением на сканирующей линии; среднее гармоническое длин всех отрезков, высекаемых изображением на сканирующей линии; число сегментов, получаемых при пересечении прямой и образа.

В подходе, рассмотренном в [1], важную роль играет предварительная обработка изображений. Во-первых, приведение их к бинарному виду, поскольку черно-белое изображение фоторобота сравнивается с цветным изображением лиц из базы данных. Исходные цветные фотографические портреты приводятся специальной процедурой к полутоновым изображениям. Затем полутоновое изображение преобразуется в монохроматическое путем нелинейной пороговой фильтрации.

Вторым этапом является сегментация, на котором происходит выделение (разбиение изображения) наиболее информативных областей: глаза, нос, рот, овал лица и др. При сегментации портретного изображения с учетом физиологии человеческого лица происходит анализ окрестности заданных координат. Если пиксель в окрестности не является фоном, то координаты стартовой точки меняются и процедура вызывает себя с новыми измененными координатами. Это будет происходит до тех пор, пока не будет зафиксирована вся замкнутая область.

В настоящее время разработаны алгоритмы распознавания полутоновых изображений с позиций стохастической геометрии и функционального анализа [2].

Полутоновые изображения, в отличие от бинарных, имеют две группы значимых характеристик: геометрическую и яркостную. Поэтому, при распознавании полутоновых изображений, выделяются две группы триплетных признаков: признаки, характеризующие геометрические особенности изображения, и признаки, характеризующие яркостные особенности изображения.

Признаки первой и второй группы имеют одинаковую трехфункциональную структуру. Отличие между ними заключается лишь в подходе к заданию характеристик однородных по яркости отрезков сканирующих прямых. Для построения признаков, характеризующих геометрические особенности изображения, однородным по яркости отрезкам сканирующих прямых ставится в соответствие геометрическая величина - длина отрезка. Для построения признаков, характеризующих яркостные особенности изображения, однородным по яркости отрезкам сканирующих прямых ставится в соответствие средняя яркость отрезка .

Таким образом, для формирования признаков, характеризующих геометрические особенности изображения, функция g(j, р, t) принимается равной:

g( j , р, t)

1; t е F n /, 0; t <t F n /.

Для формирования же признаков , р, t) имеет следующий вид:

g( j , р, t)

i; t е F n /, 0; t <t F n /,

характеризующих яркостные особенности изображения

функция g( j

где i - значение яркости в точке t.

При распознавании человеческих лиц применение полутоновых изображений вместо бинарных позволяет значительно повысить эффективность распознавания.

1

При этом целесообразно применить подход, основанный не на выделении наиболее информативных областей, а на целостном восприятии зрительного образа, т.е. на принципах гештальтпсихологии. Для распознавания образа в процессе поиска применяется трейс-преобразование и последующая обработка результата с помощью статистических методов. В этом случае альтернативой сегментации наиболее информативных областей является применение метода, являющегося модификацией трейс-

преобразования.В данном случае производится ранжирование сканирующих линий согласно той роли, которые они играют в распознавании. Так, если функционалы принимают одинаковые значения для различных изображений лица одного человека, то соответствующие сканирующие линии наиболее важны для идентификации. После вычисления трейс-преобразования вычисляются разницы между трейс-

трансформантами. Например, для 3 различных изображений лица i-го человека и k-го функционала:

D\k = g - gk2\

Dk=g - gks|

Dk = \gk2 - gk3\

Далее вычисляется ранг каждой сканирующей линии, который полагается равным 0 или 1 в зависимости от установленного порога.

Таким образом, отмечаются только те сканирующие линии, по которым на всех трех изображениях значения функционалов отличаются друг от друга лишь на определенное пороговое значение.

ЛИТЕРАТУРА

1. Федотов Н.Г. Теория признаков распознавания образов на основе стохастической геометрии и

функционального анализа. - М.: ФИЗМАТЛИТ, 2009.

2. Fedotov N. G., Mokshanina D. A. Gray-scale texture recognition using stochastic geometry and functional analysis // Pattern Recognition and Image Analysis. №4, 2010, pp 382 - 383

2

i Надоели баннеры? Вы всегда можете отключить рекламу.