Научная статья на тему 'Вопросы повышения качества системы биометрического поиска, базирующейся на стохастической геометрии'

Вопросы повышения качества системы биометрического поиска, базирующейся на стохастической геометрии Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
58
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Федотов Н. Г., Рой А. В., Фионов Н. С., Старостин В. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Вопросы повышения качества системы биометрического поиска, базирующейся на стохастической геометрии»

Федотов Н.Г., Рой А.В., Фионов Н.С. , Старостин В.В. ВОПРОСЫ ПОВЫШЕНИЯ КАЧЕСТВА СИСТЕМЫ БИОМЕТРИЧЕСКОГО ПОИСКА, БАЗИРУЮЩЕЙСЯ НА СТОХАСТИЧЕСКОЙ ГЕОМЕТРИИ

В статье рассматриваются два типа систем биометрического поиска с различной архитектурой. Показано, как применение нового подхода, основанного на автоматической компьютерной генерации признаков, может повысить качество проектируемых систем.

Распознавание человеческих лиц является одним из самых эффективных методов биометрического поиска. В последнее время растет актуальность данного направления исследований.

Согласно психофизической теории восприятия и распознавания при восприятии изображения человеческого лица перемещение глаза носит стохастический характер с фиксацией на областях наибольшей информативности, в качестве которых выступают анатомические особенности лица.

Исходя из этого, для поиска изображений человеческих лиц по фотороботу предлагается использовать метод стохастической геометрии и функционального анализа. Данный метод базируется на новом геометрическом трейс-преобразовании изображений, связанном со сканированием изображений по сложным траекториям. На основе трейс-преобразования формируются триплетные признаки, характерной особенностью которых является их структура в виде композиции трех функционалов.

Детальная обработка не всего изображения, а преимущественно наиболее информативных областей, существенно увеличивает надежность биометрического поиска, поскольку при этом реализуется принцип постепенного исключения избыточности.

В середине ХХ века А.Л. Ярбус провел опыты, давшие начало большой серии различных исследований, в том числе исследований по компьютерному распознаванию человеческих лиц.

На глазу испытуемого он укрепил маленькое зеркальце, и световой зайчик писал на фотобумаге след движения глаз, когда человек рассматривал картину. Узор свидетельствовал, что зрение заключается вовсе не в том, что зрачки обводят контуры предметов, а в том, что максимумы внимания приходятся на смысловые центры изображения. Таким образом, движения глаз отражают работу мысли, мозг в процессе узнавания выступает как активная распознающая система [1].

Анализ физиологических принципов восприятия и распознавания приводит к идее построения системы биометрического поиска по типу системы «обучение с учителем» [2]. В данном случае на первом этапе (в режиме обучения) путем генерации триплетных признаков каждого портретного изображения, хранящегося в базе данных, строится набор поисковых триплетных признаков. Вычисления осуществляются по всем областям наибольшей информативности.

Признаки, значения которых попадают в непересекающиеся или частично пересекающиеся интервалы, следует использовать при построении решающей функции. Остальные, малоинформативные признаки исключаются из рассмотрения, их влияние при принятии решения в системе невелико.

Затем происходит этап поиска изображения лица по эскизу или фотороботу. Он базируется на том, чтобы предложить в первую очередь те портретные изображения, которые имеют наименьшее расстояние между двумя наборами поисковых признаков для определения степени близости того или иного изображения к задаваемому субъективному портрету. Таким образом, происходит упорядочение всех изображений по выбранному критерию близости к объекту поиска - наименьшему расстоянию между сравниваемыми наборами поисковых признаков.

Для описания каждого портретного изображения строится известный набор переменных - множество триплетных признаков [2]. Структура триплетного признака представляет собой композицию трех функционалов П = ®оР оТ{Р гл£(р,&У) .

Множество возможных значений всех переменных является множеством непрерывных или дискретных числовых значений.

Результат вычислений Т функционала есть некоторое трейс-преобразование изображения, которое при численном анализе принято представлять в виде матрицы.

Примерами функционалов, использовавшихся при построении системы, являются: Т = | / () ( -

суммарная длина всех _ _ _ на _й .............................. Т^ -

I п ¥? (г)

среднее гармоническое длин всех отрезков, высекаемых изображением на сканирующей линии; Т = п(р,6) - число сегментов, получаемых при пересечении прямой и образа; Т^ = тах | /(/)( - максимальная из

* А

длин отрезков, высекаемых бинарным изображением на сканирующей линии.

Экспериментальные результаты показывают, что описанная обучающая система обладает большой точностью идентификации. Однако ее существенным недостатком являются большие временные затраты на построение системы, связанные с реализацией режима «обучение».

Более перспективной является система, не включающая «обучение», а основанная на автоматической компьютерной генерации триплетных признаков с последующей их селекцией на основе математических процедур.

В данном случае по трейс-матрицам областей изображений с наибольшей информативностью автоматически формируются триплетные признаки, не имеющие содержательную геометрическую интерпретацию, но обладающие большой различающей способностью. Варьируя свойства функционалов, входящих в триплет-ный признак, можно добиться инвариантности поисковых признаков по отношению к группе движений и линейным искажениям изображений, что повышает надежность поиска фотоизображений.

Структура триплетных признаков в виде композиции трех функционалов позволяет получить в режиме автоматической компьютерной генерации большое количество признаков распознавания.

Генерация производится на основе имеющейся библиотеки функционалов. Затем осуществляется отбор, согласно некоторому критерию, как можно меньшего числа наиболее информативных некоррелированных признаков. Отбор признаков называют процессом минимизации размерности признакового пространства.

Для исключения избыточных признаков, или сокращения размерности признакового пространства, применяется метод селекции, основанный на разложении Карунена-Лоэва. Это разложение преобразует вектор признаков в новый вектор, определяющий наиболее важные переменные. Такими переменными являются те, которые имеют наибольшую вариацию среди разных объектов. Переменная же, принимающая одно и то же значение для всех объектов, очевидно, является неинформативной и может быть исключе-

на из набора переменных. Разложение Карунена-Лоэва обладает ценными свойствами, которые позволяют служить полезным инструментом при выборе признаков и повысить быстродействие распознавания [3]:

Оно минимизирует среднеквадратическую ошибку при использовании конечного числа базисных функций в разложении;

Оно минимизирует функцию энтропии, выраженную через дисперсии коэффициентов разложения.

Основным преимуществом данного подхода по сравнению с экстракцией с помощью обучения является возможность существенно сократить время проектирования систем биометрического поиска.

ЛИТЕРАТУРА

1. Глазунов А. Компьютерное распознавание человеческих лиц// Открытые системы. - 2000. - №3.

2. Федотов Н.Г. Теория признаков распознавания образов на основе стохастической геометрии и функционального анализа. - М.: ФИЗМАТЛИТ, 2009.

3. Федотов Н.Г., Фионов Н.С., Курынов Д.А., Старостин В.В., Петренко А.Г. Методы минимизации размерности признакового пространства в системах с автоматической компьютерной генерацией признаков// Надежность и качество: Труды международного симпозиума. Под ред. Н.К. Юркова - Пенза: Инф. Изд-во ПГУ, 2009.

i Надоели баннеры? Вы всегда можете отключить рекламу.