Научная статья на тему 'Распознавание дактилоскопических изображений'

Распознавание дактилоскопических изображений Текст научной статьи по специальности «Математика»

CC BY
673
139
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БИОМЕТРИЯ / ОТПЕЧАТОК ПАЛЬЦА / ЧАСТНЫЕ ПРИЗНАКИ / ТОПОЛОГИЧЕСКИЕ ВЕКТОРЫ / ДИПОЛЬ / СРАВНЕНИЕ ТОПОЛОГИИ / BIOMETRICS / FINGERPRINT / MINUTIAE CONSTELLATION / TOPOLOGICAL VECTORS / DIPOLE / TOPOLOGICAL MATCHING

Аннотация научной статьи по математике, автор научной работы — Гудков В. Ю., Гордеева Д. Н.

Предложен метод распознавания изображений отпечатков пальцев на основе частных признаков и топологических векторов. Топологические векторы обеспечивают компактное представление частных признаков в виде графа, улучшающего распознавание и ускоряющего обучение алгоритма.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Identification of Fingerprint Images

A method is proposed for fingerprint identification based on minutiae constellation and topological vectors matching. Topological vectors provide the compact representation of minutiae constellation in the form of a graph, which improves the identification and accelerates teaching of the algorithm. Refs. 10. Figs. 9. Tabs. 1.

Текст научной работы на тему «Распознавание дактилоскопических изображений»

УДК 004.93'1

В. Ю. Гудков, Д. Н. Гордеева

РАСПОЗНАВАНИЕ ДАКТИЛОСКОПИЧЕСКИХ ИЗОБРАЖЕНИЙ

Предложен метод распознавания изображений отпечатков пальцев на основе частных признаков и топологических векторов. Топологические векторы обеспечивают компактное представление частных признаков в виде графа, улучшающего распознавание и ускоряющего обучение алгоритма.

E-mail: diana@sonda.ru

Ключевые слова: биометрия, отпечаток пальца, частные признаки, топологические векторы, диполь, сравнение топологии.

Изображения отпечатков пальцев в электронно-цифровом виде формируются в памяти компьютера в результате сканирования полицейских дактилокарт с помощью планшетного сканера [1], ввода пальцев с живого сканера [2], фотографирования цифровым фотоаппаратом следов пальцев с фотопленки или другого твердого носителя [3]. Такие дактилоскопические изображения (ДИ) обычно состоят из линий темного цвета, являющихся отображением папиллярных линий. На рис. 1 линии ДИ контрастно отделены друг от друга просветами. Почти параллельные между собой, они образуют узоры (рис. 2) — общие признаки: — рисунки в виде петель, дельт и завитков [4].

Линии заканчиваются или начинаются, соединяются или расщепляются, образуя частные признаки: окончания и начала, соединения и разветвления линий. Такое деление признаков условно. Например, можно указать окончание и разветвление, фрагмент, островок, точку, примыкание, мостик, крючок, дельту, пересечение, утроение, прерывание линии и другое [5]. Фактически это составные признаки, которые могут быть образованы комбинацией окончаний и разветвлений. Чтобы уменьшить ошибки распознавания, изображение предварительно

Рис. 1. Исходное изображение Рис. 2. Петля и дельта изображе-

ния

Рис. 3. Скелет изображения Рис. 4. Окончания и разветвления

обрабатывают и получают его стилизованное представление — скелет (рис. 3), а по скелету детектируют два типа частных признаков: окончания и разветвления (рис. 4) [2, 6, 7]. Обработка помогает восстановить изображение, освободив его от помех [1, 8].

Известно важное свойство отпечатков пальцев. Они обладают постоянством и индивидуальностью, а кожа восстанавливается после незначительных травм и ожогов [2-4]. В настоящее время разработано множество математических моделей для доказательства индивидуальности узоров [6, 7, 9]. Большинство из них устанавливают уникальность отдельного узора, а каждая из таких моделей нацелена на уменьшение ошибок распознавания. Однако неизвестно ни одной свободной от недостатков модели [2, 3].

Распознавание. Оценка тождества двух ДИ — сложная задача [4], главным образом, из-за бесчисленного множества вариаций отпечатков одного и того же пальца, что обусловливает проблему внутриклассовых различий [10]. Это — положение и ориентация пальца на чувствительной поверхности сенсора, сухость или влажность кожи, эластичные деформации кожи и жировые следы, загрязнение и шелушение кожи. Вместе с тем тождество двух ДИ может быть доказано высокой степенью их сходства, а это уже проблема межклассовых различий [2]. Поэтому решение о степени сходства двух ДИ А1 и А2 или их шаблонов Т1 = / (А!) и Т2 = /(А2), где / — функция вычисления шаблона, неочевидно. Под шаблоном понимают математическую модель биометрического образца. Большинство алгоритмов распознавания оперирует с шаблонами, и только некоторые из них — непосредственно с изображениями. Блок, который вычисляет степень сходства различных ДИ или их шаблонов, называют мэтчером.

В целом методы распознавания ДИ можно разбить на четыре большие группы [1, 2], использующие: корреляцию многомерных сигналов; геометрические характеристики частных признаков; гребневый

счет между частными признаками; топологические векторы. В настоящей работе приведен метод распознавания ДИ на основе шаблонов, содержащих геометрические характеристики частных признаков и топологические векторы [1].

Частные признаки и модель диполя. Пусть каждому ДИ А1 и А2 функцией / поставлены в соответствие шаблоны Т1 = / (А1) и Т2 = /(А2) в виде

Т1 = [тг], шг = {хг,уг,9г,и}, г Е I = 1,...,п1; (1)

Т2 = {шз}, шз = {хз , Уз ,9з ,£3 } 3 Е 3 =1,...,П2, (2) где п1 и п2 — число частных признаков шг и шз на А1 и А2; (х, у), 9 и £ — координаты, вектор направления как угол и тип частного признака, £ € {0,1} (окончание и разветвление). Модель (1) и (2) — это способ классического представления ДИ [2, 5, 8].

Рассмотрим два диполя: (шг,шк) и (шз,шд) (рис.5), каждый из которых состоит из двух частных признаков шг,шк Е Т1, г = к, и шз,шд Е Т2, 3 = д. Оценим параметры диполей:

ш(шг,шк) = {<к,вк,вгк}, г,к Е I; (3)

ш(шз ,шд) = {д,.Пд,вд ,вд ,взg}, 3 д Е J, (4)

где ш(шр,шд) — набор параметров диполя с частными признаками шр и шд при р, д Е I либо р, д Е 3; <рд — длина диполя как расстояние между шр и шд в пространстве Е2; вр = wize (9р,ард) — вектор как угол поворота против хода часовой стрелки луча из шр в направлении шд с углом ард = arctg ((уд — ур)/(хд — хр)) до вектора 9р; вт = 1игп(9р,9д) — вектор как наименьший угол поворота вектора 9д до вектора 9р. Функция вычисления угла поворота против хода часовой стрелки записывается в виде

!а — в, если а — в > 0;

(5)

2п + а — в, если а — в < 0, а функция расчета наименьшего угла поворота — как

!а — в, если |а — в|< п;

(6)

2п • sign(в — а) + а — в, если |а — в| > п;

sign(.) — функция знака [5]. Диполи и их параметры для двух частных признаков показаны на рис. 5.

Опираясь на модель диполей (3) и (4), сравним каждый диполь из шаблона Т1 с каждым диполем из шаблона Т2. Вычислим степень подобия ф для сравниваемых диполей:

ф(ш(шг,шк),ш(ш,,шд)) = /(Д<, Ав1, Ав2, Два), (7)

Рис. 5. Основные параметры двух диполей частных признаков различных ДИ

где Д^ = — д\ \ — норма разности длин диполей; =

= \\1игп(во:, вдд)\\ — норма минимального угла поворота вектора вдд до вектора вгк; Др2 = ||1игп(вк, вд)|| - норма минимального угла поворота вектора вд до вектора вгк; Двз = ||1игп(вк, вд^)|| — норма наименьшего угла поворота вектора вд до вектора вк; / — функция оценки (обычно полином не выше второй степени). Норму можно вычислить в пространстве Таким образом, на основе четырех геометрических характеристик для двух диполей: (ш„тк) и (тд, тд), как тождественных, так и различных, можно вычислить геометрическую степень их подобия по соотношению (7). Не нарушая общности, можно считать, что 0 < ф < 1, причем для тождественных диполей степень подобия близка к единице, а для различных — к нулю.

Поскольку формулу (7) применяют для разностей координат и углов, результаты вычислений по этой формуле устойчивы к аффинным преобразованиям ДИ [2]. Однако геометрические характеристики частных признаков, организованные в форме связанного графа, не обеспечивают желаемых ошибок распознавания 1-го и 2-го рода. Поэтому применение моделей (1) и (2) ограничено [7, 9].

Топологические векторы. По сравнению с гребневым счетом топологические векторы являются развитием математической модели ДИ [9], обеспечивающим повышение качества и скорости распознавания ДИ [7]. В информативной области изображения вычисляют скелет (см. рис. 3) и детектируют частные признаки — окончания и разветвления (см. рис. 4). Частные признаки нумеруют и определяют их координаты, векторы направления и типы. Вектор направления частного признака указывает на область увеличения числа линий и параллелен касательной к скелету. В результате каждому ДИ А1 и А2 функцией /

вычисления шаблона ставятся в соответствие шаблоны Т1 = /(А1) и Т2 = /(А2) в виде (1) и (2).

Модель топологических векторов частных признаков Ь1 находится на основе множества Т1 по формуле (1) в виде

= {V = {(в1,и1)}\г е I, I е 1 ...ыг} , (8)

где V — топологический вектор для частного признака тг; I — множество индексов из (1) и г — его элемент; I — номер связи; е; — событие, сформированное на связи частным признаком с номером и;; — число связей при глубине сечения, равной и линиям. Число связей в векторе V для частного признака тг типа и рассчитывают по формуле ыг = 4и + 2 + (—1)^.

Опишем способ построения топологических векторов, изложенный в работе [7].

Сначала от каждого детектированного частного признака перпендикулярно его вектору направления фиксируют две проекции — вправо и влево — на смежные скелетные линии.

Выберем вершину р скелета, соответствующую частному признаку тг. Проведем через ее координаты (хг,уг) вправо и влево сечение на глубину и линий перпендикулярно касательным к пересекаемым линиям. Пронумеруем по спирали, разворачивающейся по ходу часовой стрелки, рассеченные линии, которые назовем связями. Сечение проходит, изгибаясь вдоль направления кривизны линий. Число линий 1 < и < 8. Линия в сечении образует две связи; их общее число равно

(см. (8)). Топологический вектор V определяют по сечению, прослеживая ход каждой связи от сечения до встречи с другим частным признаком или с проекцией от него. На связях детектируют события, показанные на рис. 6 и обозначенные числом в двоичном коде.

С событием как числом, детектированным на связи, ассоциируют номер частного признака, инициирующего это событие. Событие привязано к номеру связи. Для событий 0000 и 1100 номера частных признаков отсутствуют: линия либо обрывается в неинформативной области, либо замыкается — на ней нет других событий. Событие и номер частного признака образуют упорядоченную пару (е; ,и;), соответствующую 1-й связи.

Определение 1. Топологическим вектором V называют нумерованный набор связей с упорядоченными парами (е;,и;).

Рис. 6. События

9 ¡10

20

21

5 ! б

f

Ü2

23

22

19

8 J 7

24

25

12 ; 11

26

16 J15 — T

27

Рис. 7. Сечение для окончания

Местоположение бита в событии определяет тип частного признака, его направление, местоположение по отношению к связи и др. (см. рис. 6). Топологический вектор строят для каждого частного признака. На этом построение топологических векторов завершается.

Подобную модель топологических векторов L2 строят для T2 по формуле (2).

На рис. 7 в сечении для окончания 19 при n = 4 пронумерованы связи 0-16. Соответствующий топологический вектор представлен в таблице. Подобный вектор можно построить и для разветвления. Сечение штриховой прямой разрезает линии на связи, пронумерованные по спирали по ходу часовой стрелки.

Таким образом, шаблоны T1 по (1) и T2 по (2) дополняются топологическими векторами по формулам

Ti = {(m^Vi)} , m = {xcl,yl,ei,tl}, V = {(ebn)}, l, i E I; (9)

T2 = {(mj)} , mj = ,УзjЛ}, Vj = {(ei,n)}, l,j E J;

(10)

здесь ml и mj — частные признаки из шаблонов T1 и T2, а el и nl — событие и номер частного признака.

Преимущества такого способа построения топологических векторов по сравнению с гребневым счетом [6] и патентом Sparrow [9] изложены в [7].

Сравнение топологических векторов. Пусть типы частных признаков ml и mj совпадают. Построим для них топологические векторы Vl по (9) и V по (10) с числом связей, равным w. Очевидно, что векторы можно сравнить и по топологии, и по геометрии.

Таблица

Топологический вектор окончания

Номер связи Событие Индекс

0 1110 22

1 0001 21

2 1110 23

3 1001 24

4 1111 22

5 0011 21

6 1111 23

7 1010 24

8 0010 25

9 0010 21

10 1010 20

11 1010 26

12 0011 25

13 - -

14 1001 20

15 1111 27

16 0001 25

Степень подобия по топологии одноименных связей оценивают

функцией A(e£,ej), где ei £

Vi и ej

£ Vj — сравниваемые события,

I — номер связи. Не нарушая общности, полагают, что 0 < Л < 1. Значения, возвращаемые функцией, зависят от значений аргументов, а саму функцию в виде двумерной таблицы обучают. Например, значения ячеек таблицы для одинаковых событий равны единице, а для событий с различной ориентацией вектора направления — нулю (обычно это сравнение третьего бита справа в событиях: Л(0011, 0111) = 0). Другие ячейки таблицы содержат дробные значения. Например, при замыкании окончания влево (в разветвление) на связи наблюдают переход события 1101 ^ 1011 (см. рис.6), а при разрыве разветвления влево (в окончание) — переход 0101 ^ 1101. Точность обучения функции Л сильно влияет на ошибки идентификации. Тогда оценку степени подобия по топологии векторов V е Т1 по (9) и У^ е Т2 по (10) вычисляют в виде

¿A(eW)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

A(V,Vj ) =

1=0

w

(11)

где ы — число связей. Очевидно, что 0 < Л < 1.

Для оценки степени подобия по геометрии одноименных связей применяют формулу (7). Тогда оценку степени подобия по геометрии

векторов У Е Т1 по (9) и У) Е Т2 по (10) вычисляют в виде

ад

Е

Ф(У,У ) = Ь»-, (12)

w

где w — число связей; тк и тд — частные признаки, задаваемые их номерами к = иг1 Е У по (9) и д = п\ Е У3 по (10) на одноименных связях. Фактически накапливают оценки сравнения диполей, число которых равно числу связей, а диполи как лучи сходятся в тг Е Т1 или тз Е Т2. Очевидно, что 0 < Ф < 1.

Степень подобия топологических векторов в комплексе оценивают на основе (11) и (12) частичным степенным рядом вида

п

Б (У,У) = 5] {ак Лк (У,У) + Ьк Фк (У,У) + Ск Лк (У,У )Фк(У,У)),

к= 1

(13)

где ак, Ьк, ск — коэффициенты ряда; п — длина ряда. Видно, что в простейшем случае оценка аналогична вероятности произведения или суммы событий.

К сожалению, в таком виде оценка (13) из-за мутаций различного характера не работает [1]. Рассмотрим наиболее часто встречаемую мутацию.

Определение 2. Мутацией называют изменение типа частного признака.

При мутации изменяется нумерация связей топологического вектора. Введем функцию ^ восстановления номеров связей, сохраняющую пары (е[,П[), но задающую новое значение номера I связи. Такая функция существует [1]. Вычислим новый топологический вектор Уг = ^ (У) слева или УЗ = (у) справа, если типы частных признаков тг и тз по (9) и (10) различны. Номера одноименных связей пары (У',У) (или пары (У,у')) совпадают, так как применение функции ^ выравнивает типы частных признаков. Если при восстановлении одноименная связь не находится, то такую связь маскируют (например, крайние в сечении связи, поскольку число связей в топологическом векторе для окончания и разветвления различное), а при сравнении замаскированную связь не учитывают или штрафуют. Итак, восстановление номеров связей пары топологических векторов (У ,У) может быть выполнено как справа, так и слева. Тогда степень подобия этой пары оцениваем на основе (13)

£ (У ,У) = шах (Б (У,У ),£(У,У')) . (14)

Таким образом, независимо от типа частных признаков получено сравнение топологических векторов как по топологии (11), так и по

геометрии (12), а ядро оценки составляет ряд (13). Коэффициенты ряда подбирают так, чтобы 0 < S(V,Vj) < 1.

Сравнение шаблонов. Сравним все топологические векторы из различных шаблонов друг с другом и выберем лучшую пару векторов. Пусть это будут V е ^ и V е Х2.

Зададим стеки ST1 = ^^) и ST2 = (^.;). Построим рекурсию.

Выберем лучшую пару ^^) е ST1 по степени подобия S^^) по (13) или (14), если (^ _;) е ST2, и очистим стек ST2 = ST2\(i, j). Определим два множества смежности Г+^) = {^К е L1 Л a е I} из ^ и Г+(^) = |И!Н е L2 Л Ь е J} из T2, используя номера п частных признаков, находящихся на связях, где L определяется по (8). На основе этих множеств смежности составим пары топологических векторов (^И), заданных номерами a и Ь частных признаков, располагающихся на одноименных связях с учетом мутаций, которые поместим в стек, если (К^И) е ST1 и (a, Ь) е ST2. Отметим, что полный перебор исключается. Если ST2 = {0}, повторим рекурсию, иначе конец.

В итоге получаем упорядоченный набор результатов сравнений топологических векторов в виде

где к — номер элемента ряда и меньшим номерам соответствуют лучшие оценки. Тогда сходство шаблонов

к

где К < Ш1п(п1,п2) — длина ряда; п1 и п2 — число частных признаков по (1) и (2).

Обучение. При распознавании используют алгоритмы, в состав которых входят комбинации различных классификаторов. Целью такого комбинирования является уменьшение ошибок распознавания ДИ за счет компенсации недостатков отдельных классификаторов или построение шкалы качество-скорость. Одним из классификаторов, обеспечивающих такую настройку характеристик, является распознающее дерево. Несмотря на очевидные достоинства деревьев — на простоту и производительность распознавания — их не применяют в качестве самостоятельных распознавателей, так как хорошего распознавания они не обеспечивают, но включают в комбинации с другими классификаторами.

Распознающее дерево реализуют как двоичное дерево вложенных операторов вида жД^ ^ ^, завершающихся листьями. Его моделируют выбором значений коэффициентов а^, Ь^, с^ ряда по (13). В качестве

S = {Sk(V,Vj)|(V,Vj) £ STi} ,

(15)

S (Ti,T2)

k=1

(16)

min(n1,n2)'

Скорость

Рис. 8. Режимы идентификации

исходных данных рассмотрим ЯОС-кривую алгоритма распознавания [3, 10]. Для каждого возможного разбиения пространства признаков на полупространства, такого, что в каждом полупространстве имеются векторы из обучающего набора, обучим распознающее дерево с одним ветвлением и двумя листьями, которое называют пнем. Каждое из пороговых значений листа ищется настройкой коэффициентов ак, Ьк, ск. Из получившихся пней выбирают тот, у которого ошибка распознавания минимальна. Для простоты изложения можно считать, что множества значений каждого признака упорядочены, а сравнения выполняются на строгое неравенство Л.

Производительность алгоритма распознавания увеличивают, комбинируя классификаторы, показанные на рис. 8, с деревом распознавания. Для него в пространстве признаков выделяют следующие основные элементы:

— топологические классификаторы, выполняющие отбор признаков в топологическом пространстве;

— геометрические классификаторы, выполняющие отбор признаков в евклидовом пространстве (например, с учетом заданных допусков).

Концептуально дерево распознавания опирается на два типа классификаторов — топологические и геометрические, комбинируя которые можно получить различные режимы работы алгоритма. Ясно, что для каждого режима число обучаемых пней, как правило, больше одного.

На рис. 9 показаны ЯОС-кривые, полученные на тестовой базе изображений после обучения дерева распознавания. Им соответствуют четыре режима распознавания: 1 — качественный режим (медленный

п

0,01 од 1

Рис. 9. ROC-кривые для различных режимов распознавания

поиск), 2 — с грубыми допусками по топологии, 3 — с грубыми допусками по геометрии, 4 — с грубыми допусками по топологии и геометрии (самый быстрый поиск).

Графики показывают, что распознающие деревья, скомбинированные с указанными классификаторами, обеспечивает лучшую ЯОС-кривую (кривая 1, см. рис.9). При агрессивном отборе признаков по топологии или геометрии происходит разбалансировка распознающего дерева: с ростом производительности алгоритма ЯОС-кривые смещаются вправо и выше, а вероятности ошибок первого рода (Рг) и второго рода (Ра) увеличиваются. Кривая 4 (см. рис. 9) демонстрирует высокую производительность алгоритма в ущерб качеству распознавания. Гладкость кривых получена методом малого возмущения пороговых значений пней.

Заключение. Коротко рассмотрена математическая модель и метод распознавания ДИ на основе топологических векторов. Отмечены достоинства и недостатки модели и метода. Важной особенностью предложенной модели является возможность исключения полного перебора сравниваемых признаков. Метод позволяет выполнить декомпозицию задачи распознавания на два блока в виде двух классификаторов и комбинировать их на распознающих деревьях. Это позволяет построить эффективные методы обучения алгоритма распознавания. Математическая модель опирается на патентные материалы.

В будущих исследованиях ожидается применение топологических векторов для линий, которые не подвержены мутациям частных признаков.

СПИСОК ЛИТЕРАТУРЫ

1. Гудков В. Ю. Методы первой и второй обработки дактилоскопических изображений: Монография. - Миасс: Изд-во "Геотур", 2009. -237 с.

2. Handbook of fingerprint recognition / D. Maltoni, D. Maio, A.K. Jain, S. Prabhakar. - London: Springer-Verlag, 2009. - 496 p.

3. Bolle R. M. Guide to biometrics. - New York: Springer-Verlag, 2004. - 368 p.

4. The science of fingerprint: classification and uses. - Washington: U.S. Government Printing Office, 1984. - 211 p.

5. Банк данных детального описания папиллярных узоров / Л.Г. Эджубов, Е.С. Карпухина, В.Н. Мяснянкина и др.; Под ред. Л.Г. Эджубова // Сб. науч. статей. - М.: ИЦ МВД РФ, 2002. - С. 304-311.

6. Пат. 2054197 РФ, МПК G 06 K 9/46. Способ кодирования отпечатка папиллярного узора.

7. Пат. 2185660 РФ, МПК G 06 K 9/52. Способ кодирования отпечатка папиллярного узора.

8. Обработка и анализ изображений в задачах машинного зрения / Ю.В. Ви-зильтер, С.Ю.Желтов, А.В.Бондаренко и др. - М.: Физматкнига, 2010. - 672 с.

9. Pat. 5631971 USA, Int.Cl. G 06 K 9/00. Vector based topological fingerprint matching / Malcolm K. Sparrow (Winchester).

10. Ушмаев О. С. Методы мультибиометрической идентификации: Монография. - М.: ИПИ РАН, 2009. - 113 с.

Статья поступила в редакцию 9.08.2011

i Надоели баннеры? Вы всегда можете отключить рекламу.