УДК 004.93'1
В. Ю. Гудков, Д. Н. Гордеева
РАСПОЗНАВАНИЕ ДАКТИЛОСКОПИЧЕСКИХ ИЗОБРАЖЕНИЙ
Предложен метод распознавания изображений отпечатков пальцев на основе частных признаков и топологических векторов. Топологические векторы обеспечивают компактное представление частных признаков в виде графа, улучшающего распознавание и ускоряющего обучение алгоритма.
E-mail: [email protected]
Ключевые слова: биометрия, отпечаток пальца, частные признаки, топологические векторы, диполь, сравнение топологии.
Изображения отпечатков пальцев в электронно-цифровом виде формируются в памяти компьютера в результате сканирования полицейских дактилокарт с помощью планшетного сканера [1], ввода пальцев с живого сканера [2], фотографирования цифровым фотоаппаратом следов пальцев с фотопленки или другого твердого носителя [3]. Такие дактилоскопические изображения (ДИ) обычно состоят из линий темного цвета, являющихся отображением папиллярных линий. На рис. 1 линии ДИ контрастно отделены друг от друга просветами. Почти параллельные между собой, они образуют узоры (рис. 2) — общие признаки: — рисунки в виде петель, дельт и завитков [4].
Линии заканчиваются или начинаются, соединяются или расщепляются, образуя частные признаки: окончания и начала, соединения и разветвления линий. Такое деление признаков условно. Например, можно указать окончание и разветвление, фрагмент, островок, точку, примыкание, мостик, крючок, дельту, пересечение, утроение, прерывание линии и другое [5]. Фактически это составные признаки, которые могут быть образованы комбинацией окончаний и разветвлений. Чтобы уменьшить ошибки распознавания, изображение предварительно
Рис. 1. Исходное изображение Рис. 2. Петля и дельта изображе-
ния
Рис. 3. Скелет изображения Рис. 4. Окончания и разветвления
обрабатывают и получают его стилизованное представление — скелет (рис. 3), а по скелету детектируют два типа частных признаков: окончания и разветвления (рис. 4) [2, 6, 7]. Обработка помогает восстановить изображение, освободив его от помех [1, 8].
Известно важное свойство отпечатков пальцев. Они обладают постоянством и индивидуальностью, а кожа восстанавливается после незначительных травм и ожогов [2-4]. В настоящее время разработано множество математических моделей для доказательства индивидуальности узоров [6, 7, 9]. Большинство из них устанавливают уникальность отдельного узора, а каждая из таких моделей нацелена на уменьшение ошибок распознавания. Однако неизвестно ни одной свободной от недостатков модели [2, 3].
Распознавание. Оценка тождества двух ДИ — сложная задача [4], главным образом, из-за бесчисленного множества вариаций отпечатков одного и того же пальца, что обусловливает проблему внутриклассовых различий [10]. Это — положение и ориентация пальца на чувствительной поверхности сенсора, сухость или влажность кожи, эластичные деформации кожи и жировые следы, загрязнение и шелушение кожи. Вместе с тем тождество двух ДИ может быть доказано высокой степенью их сходства, а это уже проблема межклассовых различий [2]. Поэтому решение о степени сходства двух ДИ А1 и А2 или их шаблонов Т1 = / (А!) и Т2 = /(А2), где / — функция вычисления шаблона, неочевидно. Под шаблоном понимают математическую модель биометрического образца. Большинство алгоритмов распознавания оперирует с шаблонами, и только некоторые из них — непосредственно с изображениями. Блок, который вычисляет степень сходства различных ДИ или их шаблонов, называют мэтчером.
В целом методы распознавания ДИ можно разбить на четыре большие группы [1, 2], использующие: корреляцию многомерных сигналов; геометрические характеристики частных признаков; гребневый
счет между частными признаками; топологические векторы. В настоящей работе приведен метод распознавания ДИ на основе шаблонов, содержащих геометрические характеристики частных признаков и топологические векторы [1].
Частные признаки и модель диполя. Пусть каждому ДИ А1 и А2 функцией / поставлены в соответствие шаблоны Т1 = / (А1) и Т2 = /(А2) в виде
Т1 = [тг], шг = {хг,уг,9г,и}, г Е I = 1,...,п1; (1)
Т2 = {шз}, шз = {хз , Уз ,9з ,£3 } 3 Е 3 =1,...,П2, (2) где п1 и п2 — число частных признаков шг и шз на А1 и А2; (х, у), 9 и £ — координаты, вектор направления как угол и тип частного признака, £ € {0,1} (окончание и разветвление). Модель (1) и (2) — это способ классического представления ДИ [2, 5, 8].
Рассмотрим два диполя: (шг,шк) и (шз,шд) (рис.5), каждый из которых состоит из двух частных признаков шг,шк Е Т1, г = к, и шз,шд Е Т2, 3 = д. Оценим параметры диполей:
ш(шг,шк) = {<к,вк,вгк}, г,к Е I; (3)
ш(шз ,шд) = {д,.Пд,вд ,вд ,взg}, 3 д Е J, (4)
где ш(шр,шд) — набор параметров диполя с частными признаками шр и шд при р, д Е I либо р, д Е 3; <рд — длина диполя как расстояние между шр и шд в пространстве Е2; вр = wize (9р,ард) — вектор как угол поворота против хода часовой стрелки луча из шр в направлении шд с углом ард = arctg ((уд — ур)/(хд — хр)) до вектора 9р; вт = 1игп(9р,9д) — вектор как наименьший угол поворота вектора 9д до вектора 9р. Функция вычисления угла поворота против хода часовой стрелки записывается в виде
!а — в, если а — в > 0;
(5)
2п + а — в, если а — в < 0, а функция расчета наименьшего угла поворота — как
!а — в, если |а — в|< п;
(6)
2п • sign(в — а) + а — в, если |а — в| > п;
sign(.) — функция знака [5]. Диполи и их параметры для двух частных признаков показаны на рис. 5.
Опираясь на модель диполей (3) и (4), сравним каждый диполь из шаблона Т1 с каждым диполем из шаблона Т2. Вычислим степень подобия ф для сравниваемых диполей:
ф(ш(шг,шк),ш(ш,,шд)) = /(Д<, Ав1, Ав2, Два), (7)
Рис. 5. Основные параметры двух диполей частных признаков различных ДИ
где Д^ = — д\ \ — норма разности длин диполей; =
= \\1игп(во:, вдд)\\ — норма минимального угла поворота вектора вдд до вектора вгк; Др2 = ||1игп(вк, вд)|| - норма минимального угла поворота вектора вд до вектора вгк; Двз = ||1игп(вк, вд^)|| — норма наименьшего угла поворота вектора вд до вектора вк; / — функция оценки (обычно полином не выше второй степени). Норму можно вычислить в пространстве Таким образом, на основе четырех геометрических характеристик для двух диполей: (ш„тк) и (тд, тд), как тождественных, так и различных, можно вычислить геометрическую степень их подобия по соотношению (7). Не нарушая общности, можно считать, что 0 < ф < 1, причем для тождественных диполей степень подобия близка к единице, а для различных — к нулю.
Поскольку формулу (7) применяют для разностей координат и углов, результаты вычислений по этой формуле устойчивы к аффинным преобразованиям ДИ [2]. Однако геометрические характеристики частных признаков, организованные в форме связанного графа, не обеспечивают желаемых ошибок распознавания 1-го и 2-го рода. Поэтому применение моделей (1) и (2) ограничено [7, 9].
Топологические векторы. По сравнению с гребневым счетом топологические векторы являются развитием математической модели ДИ [9], обеспечивающим повышение качества и скорости распознавания ДИ [7]. В информативной области изображения вычисляют скелет (см. рис. 3) и детектируют частные признаки — окончания и разветвления (см. рис. 4). Частные признаки нумеруют и определяют их координаты, векторы направления и типы. Вектор направления частного признака указывает на область увеличения числа линий и параллелен касательной к скелету. В результате каждому ДИ А1 и А2 функцией /
вычисления шаблона ставятся в соответствие шаблоны Т1 = /(А1) и Т2 = /(А2) в виде (1) и (2).
Модель топологических векторов частных признаков Ь1 находится на основе множества Т1 по формуле (1) в виде
= {V = {(в1,и1)}\г е I, I е 1 ...ыг} , (8)
где V — топологический вектор для частного признака тг; I — множество индексов из (1) и г — его элемент; I — номер связи; е; — событие, сформированное на связи частным признаком с номером и;; — число связей при глубине сечения, равной и линиям. Число связей в векторе V для частного признака тг типа и рассчитывают по формуле ыг = 4и + 2 + (—1)^.
Опишем способ построения топологических векторов, изложенный в работе [7].
Сначала от каждого детектированного частного признака перпендикулярно его вектору направления фиксируют две проекции — вправо и влево — на смежные скелетные линии.
Выберем вершину р скелета, соответствующую частному признаку тг. Проведем через ее координаты (хг,уг) вправо и влево сечение на глубину и линий перпендикулярно касательным к пересекаемым линиям. Пронумеруем по спирали, разворачивающейся по ходу часовой стрелки, рассеченные линии, которые назовем связями. Сечение проходит, изгибаясь вдоль направления кривизны линий. Число линий 1 < и < 8. Линия в сечении образует две связи; их общее число равно
(см. (8)). Топологический вектор V определяют по сечению, прослеживая ход каждой связи от сечения до встречи с другим частным признаком или с проекцией от него. На связях детектируют события, показанные на рис. 6 и обозначенные числом в двоичном коде.
С событием как числом, детектированным на связи, ассоциируют номер частного признака, инициирующего это событие. Событие привязано к номеру связи. Для событий 0000 и 1100 номера частных признаков отсутствуют: линия либо обрывается в неинформативной области, либо замыкается — на ней нет других событий. Событие и номер частного признака образуют упорядоченную пару (е; ,и;), соответствующую 1-й связи.
Определение 1. Топологическим вектором V называют нумерованный набор связей с упорядоченными парами (е;,и;).
Рис. 6. События
9 ¡10
20
21
5 ! б
f
Ü2
23
22
19
8 J 7
24
25
12 ; 11
26
16 J15 — T
27
Рис. 7. Сечение для окончания
Местоположение бита в событии определяет тип частного признака, его направление, местоположение по отношению к связи и др. (см. рис. 6). Топологический вектор строят для каждого частного признака. На этом построение топологических векторов завершается.
Подобную модель топологических векторов L2 строят для T2 по формуле (2).
На рис. 7 в сечении для окончания 19 при n = 4 пронумерованы связи 0-16. Соответствующий топологический вектор представлен в таблице. Подобный вектор можно построить и для разветвления. Сечение штриховой прямой разрезает линии на связи, пронумерованные по спирали по ходу часовой стрелки.
Таким образом, шаблоны T1 по (1) и T2 по (2) дополняются топологическими векторами по формулам
Ti = {(m^Vi)} , m = {xcl,yl,ei,tl}, V = {(ebn)}, l, i E I; (9)
T2 = {(mj)} , mj = ,УзjЛ}, Vj = {(ei,n)}, l,j E J;
(10)
здесь ml и mj — частные признаки из шаблонов T1 и T2, а el и nl — событие и номер частного признака.
Преимущества такого способа построения топологических векторов по сравнению с гребневым счетом [6] и патентом Sparrow [9] изложены в [7].
Сравнение топологических векторов. Пусть типы частных признаков ml и mj совпадают. Построим для них топологические векторы Vl по (9) и V по (10) с числом связей, равным w. Очевидно, что векторы можно сравнить и по топологии, и по геометрии.
Таблица
Топологический вектор окончания
Номер связи Событие Индекс
0 1110 22
1 0001 21
2 1110 23
3 1001 24
4 1111 22
5 0011 21
6 1111 23
7 1010 24
8 0010 25
9 0010 21
10 1010 20
11 1010 26
12 0011 25
13 - -
14 1001 20
15 1111 27
16 0001 25
Степень подобия по топологии одноименных связей оценивают
функцией A(e£,ej), где ei £
Vi и ej
£ Vj — сравниваемые события,
I — номер связи. Не нарушая общности, полагают, что 0 < Л < 1. Значения, возвращаемые функцией, зависят от значений аргументов, а саму функцию в виде двумерной таблицы обучают. Например, значения ячеек таблицы для одинаковых событий равны единице, а для событий с различной ориентацией вектора направления — нулю (обычно это сравнение третьего бита справа в событиях: Л(0011, 0111) = 0). Другие ячейки таблицы содержат дробные значения. Например, при замыкании окончания влево (в разветвление) на связи наблюдают переход события 1101 ^ 1011 (см. рис.6), а при разрыве разветвления влево (в окончание) — переход 0101 ^ 1101. Точность обучения функции Л сильно влияет на ошибки идентификации. Тогда оценку степени подобия по топологии векторов V е Т1 по (9) и У^ е Т2 по (10) вычисляют в виде
¿A(eW)
A(V,Vj ) =
1=0
w
(11)
где ы — число связей. Очевидно, что 0 < Л < 1.
Для оценки степени подобия по геометрии одноименных связей применяют формулу (7). Тогда оценку степени подобия по геометрии
векторов У Е Т1 по (9) и У) Е Т2 по (10) вычисляют в виде
ад
Е
Ф(У,У ) = Ь»-, (12)
w
где w — число связей; тк и тд — частные признаки, задаваемые их номерами к = иг1 Е У по (9) и д = п\ Е У3 по (10) на одноименных связях. Фактически накапливают оценки сравнения диполей, число которых равно числу связей, а диполи как лучи сходятся в тг Е Т1 или тз Е Т2. Очевидно, что 0 < Ф < 1.
Степень подобия топологических векторов в комплексе оценивают на основе (11) и (12) частичным степенным рядом вида
п
Б (У,У) = 5] {ак Лк (У,У) + Ьк Фк (У,У) + Ск Лк (У,У )Фк(У,У)),
к= 1
(13)
где ак, Ьк, ск — коэффициенты ряда; п — длина ряда. Видно, что в простейшем случае оценка аналогична вероятности произведения или суммы событий.
К сожалению, в таком виде оценка (13) из-за мутаций различного характера не работает [1]. Рассмотрим наиболее часто встречаемую мутацию.
Определение 2. Мутацией называют изменение типа частного признака.
При мутации изменяется нумерация связей топологического вектора. Введем функцию ^ восстановления номеров связей, сохраняющую пары (е[,П[), но задающую новое значение номера I связи. Такая функция существует [1]. Вычислим новый топологический вектор Уг = ^ (У) слева или УЗ = (у) справа, если типы частных признаков тг и тз по (9) и (10) различны. Номера одноименных связей пары (У',У) (или пары (У,у')) совпадают, так как применение функции ^ выравнивает типы частных признаков. Если при восстановлении одноименная связь не находится, то такую связь маскируют (например, крайние в сечении связи, поскольку число связей в топологическом векторе для окончания и разветвления различное), а при сравнении замаскированную связь не учитывают или штрафуют. Итак, восстановление номеров связей пары топологических векторов (У ,У) может быть выполнено как справа, так и слева. Тогда степень подобия этой пары оцениваем на основе (13)
£ (У ,У) = шах (Б (У,У ),£(У,У')) . (14)
Таким образом, независимо от типа частных признаков получено сравнение топологических векторов как по топологии (11), так и по
геометрии (12), а ядро оценки составляет ряд (13). Коэффициенты ряда подбирают так, чтобы 0 < S(V,Vj) < 1.
Сравнение шаблонов. Сравним все топологические векторы из различных шаблонов друг с другом и выберем лучшую пару векторов. Пусть это будут V е ^ и V е Х2.
Зададим стеки ST1 = ^^) и ST2 = (^.;). Построим рекурсию.
Выберем лучшую пару ^^) е ST1 по степени подобия S^^) по (13) или (14), если (^ _;) е ST2, и очистим стек ST2 = ST2\(i, j). Определим два множества смежности Г+^) = {^К е L1 Л a е I} из ^ и Г+(^) = |И!Н е L2 Л Ь е J} из T2, используя номера п частных признаков, находящихся на связях, где L определяется по (8). На основе этих множеств смежности составим пары топологических векторов (^И), заданных номерами a и Ь частных признаков, располагающихся на одноименных связях с учетом мутаций, которые поместим в стек, если (К^И) е ST1 и (a, Ь) е ST2. Отметим, что полный перебор исключается. Если ST2 = {0}, повторим рекурсию, иначе конец.
В итоге получаем упорядоченный набор результатов сравнений топологических векторов в виде
где к — номер элемента ряда и меньшим номерам соответствуют лучшие оценки. Тогда сходство шаблонов
к
где К < Ш1п(п1,п2) — длина ряда; п1 и п2 — число частных признаков по (1) и (2).
Обучение. При распознавании используют алгоритмы, в состав которых входят комбинации различных классификаторов. Целью такого комбинирования является уменьшение ошибок распознавания ДИ за счет компенсации недостатков отдельных классификаторов или построение шкалы качество-скорость. Одним из классификаторов, обеспечивающих такую настройку характеристик, является распознающее дерево. Несмотря на очевидные достоинства деревьев — на простоту и производительность распознавания — их не применяют в качестве самостоятельных распознавателей, так как хорошего распознавания они не обеспечивают, но включают в комбинации с другими классификаторами.
Распознающее дерево реализуют как двоичное дерево вложенных операторов вида жД^ ^ ^, завершающихся листьями. Его моделируют выбором значений коэффициентов а^, Ь^, с^ ряда по (13). В качестве
S = {Sk(V,Vj)|(V,Vj) £ STi} ,
(15)
S (Ti,T2)
k=1
(16)
min(n1,n2)'
Скорость
Рис. 8. Режимы идентификации
исходных данных рассмотрим ЯОС-кривую алгоритма распознавания [3, 10]. Для каждого возможного разбиения пространства признаков на полупространства, такого, что в каждом полупространстве имеются векторы из обучающего набора, обучим распознающее дерево с одним ветвлением и двумя листьями, которое называют пнем. Каждое из пороговых значений листа ищется настройкой коэффициентов ак, Ьк, ск. Из получившихся пней выбирают тот, у которого ошибка распознавания минимальна. Для простоты изложения можно считать, что множества значений каждого признака упорядочены, а сравнения выполняются на строгое неравенство Л.
Производительность алгоритма распознавания увеличивают, комбинируя классификаторы, показанные на рис. 8, с деревом распознавания. Для него в пространстве признаков выделяют следующие основные элементы:
— топологические классификаторы, выполняющие отбор признаков в топологическом пространстве;
— геометрические классификаторы, выполняющие отбор признаков в евклидовом пространстве (например, с учетом заданных допусков).
Концептуально дерево распознавания опирается на два типа классификаторов — топологические и геометрические, комбинируя которые можно получить различные режимы работы алгоритма. Ясно, что для каждого режима число обучаемых пней, как правило, больше одного.
На рис. 9 показаны ЯОС-кривые, полученные на тестовой базе изображений после обучения дерева распознавания. Им соответствуют четыре режима распознавания: 1 — качественный режим (медленный
п
0,01 од 1
Рис. 9. ROC-кривые для различных режимов распознавания
поиск), 2 — с грубыми допусками по топологии, 3 — с грубыми допусками по геометрии, 4 — с грубыми допусками по топологии и геометрии (самый быстрый поиск).
Графики показывают, что распознающие деревья, скомбинированные с указанными классификаторами, обеспечивает лучшую ЯОС-кривую (кривая 1, см. рис.9). При агрессивном отборе признаков по топологии или геометрии происходит разбалансировка распознающего дерева: с ростом производительности алгоритма ЯОС-кривые смещаются вправо и выше, а вероятности ошибок первого рода (Рг) и второго рода (Ра) увеличиваются. Кривая 4 (см. рис. 9) демонстрирует высокую производительность алгоритма в ущерб качеству распознавания. Гладкость кривых получена методом малого возмущения пороговых значений пней.
Заключение. Коротко рассмотрена математическая модель и метод распознавания ДИ на основе топологических векторов. Отмечены достоинства и недостатки модели и метода. Важной особенностью предложенной модели является возможность исключения полного перебора сравниваемых признаков. Метод позволяет выполнить декомпозицию задачи распознавания на два блока в виде двух классификаторов и комбинировать их на распознающих деревьях. Это позволяет построить эффективные методы обучения алгоритма распознавания. Математическая модель опирается на патентные материалы.
В будущих исследованиях ожидается применение топологических векторов для линий, которые не подвержены мутациям частных признаков.
СПИСОК ЛИТЕРАТУРЫ
1. Гудков В. Ю. Методы первой и второй обработки дактилоскопических изображений: Монография. - Миасс: Изд-во "Геотур", 2009. -237 с.
2. Handbook of fingerprint recognition / D. Maltoni, D. Maio, A.K. Jain, S. Prabhakar. - London: Springer-Verlag, 2009. - 496 p.
3. Bolle R. M. Guide to biometrics. - New York: Springer-Verlag, 2004. - 368 p.
4. The science of fingerprint: classification and uses. - Washington: U.S. Government Printing Office, 1984. - 211 p.
5. Банк данных детального описания папиллярных узоров / Л.Г. Эджубов, Е.С. Карпухина, В.Н. Мяснянкина и др.; Под ред. Л.Г. Эджубова // Сб. науч. статей. - М.: ИЦ МВД РФ, 2002. - С. 304-311.
6. Пат. 2054197 РФ, МПК G 06 K 9/46. Способ кодирования отпечатка папиллярного узора.
7. Пат. 2185660 РФ, МПК G 06 K 9/52. Способ кодирования отпечатка папиллярного узора.
8. Обработка и анализ изображений в задачах машинного зрения / Ю.В. Ви-зильтер, С.Ю.Желтов, А.В.Бондаренко и др. - М.: Физматкнига, 2010. - 672 с.
9. Pat. 5631971 USA, Int.Cl. G 06 K 9/00. Vector based topological fingerprint matching / Malcolm K. Sparrow (Winchester).
10. Ушмаев О. С. Методы мультибиометрической идентификации: Монография. - М.: ИПИ РАН, 2009. - 113 с.
Статья поступила в редакцию 9.08.2011