Научная статья на тему 'Оценка точности автоматического кодирования частных признаков изображений отпечатков пальцев'

Оценка точности автоматического кодирования частных признаков изображений отпечатков пальцев Текст научной статьи по специальности «Математика»

CC BY
190
41
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОТПЕЧАТОК ПАЛЬЦА / ТОЧНОСТЬ / РЕЙТИНГ / НЕРАВНОМЕРНОЕ / РАСПРЕДЕЛЕНИЕ / ЧАСТНЫЕ ПРИЗНАКИ / РАСПОЗНАВАНИЕ / FINGERPRINT / ACCURACY / RATING / NO UNIFORM / DISTRIBUTION / MINUTIAE / RECOGNITION

Аннотация научной статьи по математике, автор научной работы — Гудков Владимир Юльевич

В статье рассматривается оценка точности автоматического распознавания частных признаков изображений отпечатков пальцев. Предлагается способ, учитывающий неравномерное распределение ошибок автоматического распознавания частных признаков по изображению. Данная оценка служит критерием для обучения алгоритмов классификационного анализа дактилоскопических изображений и выбора их функционального наполнения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Accuracy rating of automatic minutiae recognition of fingerprints

This paper presents a method of accuracy rating of automatic minutiae recognition. The method takes into account no uniform distribution of minutiae extraction errors. This accuracy rating serves as criterion to train the classification algorithms and to select their functionality.

Текст научной работы на тему «Оценка точности автоматического кодирования частных признаков изображений отпечатков пальцев»

УДК 681.3.01+681.3.05+681.3.069

ОЦЕНКА ТОЧНОСТИ АВТОМАТИЧЕСКОГО КОДИРОВАНИЯ ЧАСТНЫХ ПРИЗНАКОВ ИЗОБРАЖЕНИЙ ОТПЕЧАТКОВ ПАЛЬЦЕВ

В.Ю. Гудков

ACCURACY RATING OF AUTOMATIC MINUTIAE RECOGNITION OF FINGERPRINTS

V.U. Gudkov

В статье рассматривается оценка точности автоматического распознавания частных признаков изображений отпечатков пальцев. Предлагается способ, учитывающий неравномерное распределение ошибок автоматического распознавания частных признаков по изображению. Данная оценка служит критерием для обучения алгоритмов классификационного анализа дактилоскопических изображений и выбора их функционального наполнения.

Ключевые слова: отпечаток пальца, точность, рейтинг, неравномерное, распределение, частные признаки, распознавание.

This paper presents a method of accuracy rating of automatic minutiae recognition. The method takes into account no uniform distribution of minutiae extraction errors. This accuracy rating serves as criterion to train the classification algorithms and to select their functionality.

Keywords: fingerprint, accuracy, rating, no uniform, distribution, minutiae, recognition.

Введение

В постановке большинства задач распознавания результаты распознавания должны быть отнесены к определенным классам объектов [1, 3]. Формально это отношение задается пятеркой

где О - множество образцов; С = {ск,с } - множество классов, причем с - дополнение до {ск} и обозначает неизвестный класс; = {сок \ щеО.} -обучающая выборка образцов; = {а>к \ак & О) -тестовая выборка образцов; /с - экспертный классификатор. Требуется найти функцию классификации /: О -> , которая наилучшим образом

приближает fc на тестовой выборке , где вероятность

П

Рп = {Р е Я” IР = (Ри-,Р„), Рк е ^рк = 1}.

к=1

Оценить степень приближения можно при помощи функции ошибки, например, числа ошибочных классификаций на тестовой выборке [5, 10]. Оптимальным классификатором является тот, у которого функция ошибки минимальна [1, 8, 10]. Для стабилизации решений образцы, которые экспертно не классифицируются однозначно, удаляются из О .

В задачах классификации опираются на понятие признака образца [3-5]. В дактилоскопии образцом является физический объект, например палец. Но компьютерные технологии имеют дело не с пальцами, а с их изображениями, которые получают с устройств ввода [6, 10-12]. На таких дактилоскопических изображениях (ДИ) гребни кожи обычно отображаются темными линиями с контрастно выделяющимися просветами между ними. Линии могут начинаться или оканчиваться, соединяться или расщепляться, образуя частные признаки ДИ. В компьютерных технологиях частные признаки приравниваются к признакам образца [4, 9-12].

Понятие частного признака хорошо проработано и при ручном кодировании оператор просто указывает его местоположение и ориентацию [6, 11]. Это классический случай однозначной классификации и именно так формируются выборки и XV,. Небольшое смещение частного признака от его истинного местоположения (до одной линии) не считается за грубую ошибку, поскольку не оказывает существенного влияния на результаты идентификации [4, 12]. Однако влияние человеческого фактора при ручном кодировании частных признаков затрудняет оценку точности их автоматического распознавания. В работе [4] эта проблема частично решена. Но метод, предложенный в [4], не позволя-

Гудков Владимир Юльевич - доцент Челябинского Gudkov Vladimir Uylievich - associate professor of

государственного университета; diana@sonda.ru Chelyabinsk state university; diana@sonda.ru

ет акцентировать внимание на компактно расположенных ложных частных признаках. Именно они значительно ухудшают результаты идентификации. Действительно, след «родного» отпечатка пальца, приходящийся на фрагмент ДИ с этими ложными частными признаками, не идентифицируется [5, 6]. Поэтому необходимо обеспечить чувствительность метода оценки точности автоматического распознавания частных признаков к компактности расположения ложных частных признаков.

1. Метрика для сопоставления частных признаков

В суде при доказательстве идентичности двух отпечатков пальцев частные признаки являются основными признаками образца. Пусть одному и тому же образцу со функциями поставлены в соответствие шаблоны 7] = /{со) и Т2 = /2(со) в виде Тх ={т, |/е7 = 1..«1}, от, ={*„>>„ 6>;}, (1)

T2={mJ\jвJ = \..n2}, т]={хру],в]), (2)

где щ - количество частных признаков на со при ручной кодировке ДИ функцией /х; п2 - количество частных признаков на со при автоматической кодировке ДИ функцией /2 ; (х,у) - координаты; в - направление как угол; I - множество индексов, причем для любого / е / элемент от, известен; J - множество индексов, причем для любого jeJ элемент т3 известен. Шаблоны (1) и (2)

есть способ простого описания ДИ [4, 10,12]. Введем функцию метрики /*(г,а,от,,оту) е {0,1}, (3)

где г - радиус как допуск на величину отклонения координат от, и оту ; а - угол как допуск на величину отклонения углов направлений от, и т}; т1 - частный признак, закодированный вручную, от, е Тх; т] - частный признак, закодированный автоматом, оту е Г2 .

Функция метрики /л определяет сопоставимость двух частных признаков, полученных разным образом, по формуле ц(г,а,т1,т^ =

1,если ^(х, -х])2 +(у, -у^2 <гА\шп{в1,в1)<а,

0, иначе,

где функция наименьшего угла поворота Ьхт{а,Р) =

Г а-/?, если\а~р\< 180,

\Ъваъ1^{р~а) + а-р, если\а-р\ > 180 и знаковая функция

Г-н 1, если а > 0,

= <

I -1, если а < 0.

Если от, сопоставляется с mJ , то отклонение координат от, и т/ в допуске г и отклонение направлений от, и т) в допуске а и у. = 1, иначе ц = 0.

Задавая г = 0, требуем, чтобы частные признаки ручной и автоматической кодировки располагались точка в точке. Это идеальный случай, недостижимый в действительности. Частные признаки не только смещаются, но появляются ложные и исчезают истинные [4, 6, 12]. Вопрос оценки качества признакового пространства объекта вообще актуален [2, 10], а в криминалистике в особенности из-за сильно загрязненных изображений следов отпечатков пальцев с мест преступлений. Если материал, на котором оставлен след, тексту-рирован, количество ложных частных признаков может возрастать и группироваться. Функция метрики // это не учитывает. Она выносит булево решение о сопоставимости только двух частных признаков, выбранных из шаблонов Г] и Т2, на основе указанных допусков, причем шаблон Тх считается эталонным. Однако это позволяет построить оценку, учитывающую как точность распознавания частных признаков [4], так и компактность расположения ложных частных признаков.

2. Оценка точности

Оценка точности автоматического распознавания частных признаков основана на функции массовой ранговой вероятности. Зададим допуск а константой и ранжируем по допуску г сопоставляемые по (3) частные признаки (т,, от^) , которые назовем парой. Для допуска г количество сопоставляемых пар (от/5от7) находится как

п(г,а)= ^//(г,а,от;,от7), (4)

т,

т^2

где Г] и Т2 - шаблоны по (1) и (2).

Определение 1. Рангом пары г(от, ,оту) называется минимальная величина допуска г е 1..гтах , при которой эта пара сопоставляется.

Количество пар ранга г(т1,т]) находится в

виде 6(г) = п(г, а) - п(г -1, а) .

Определение 2. Функцией массовой ранговой вероятности Р(г) (МРВ) называется вероятность того, что ранг пары r(mj,mJ).

Шаблоны Тх и Т2 могут образовать не более шт(и,, «2) сопоставляемых пар. С позиций шаблона Т,, /' е {1,2}, функция МРВ находится в виде

ад=—• (5)

Щ

Обычно в шаблонах пхФп2. Тогда первичный классификатор на основе функции МРВ (5) строится в виде

Оценка точности автоматического кодирования частных признаков изображений отпечатков пальцев

/С(Г) = Р[(Г)Р2(Г):

(6)

где произведение в знаменателе (6) максимизирует /с(г) при пх=п2. Фактически величина /с(г) уменьшается при неравенстве количества частных признаков в шаблонах.

Оценку точности автоматического распознавания частных признаков как алгоритмический метод [7] построим следующим образом.

Зададим допуск г = 1. Рассчитаем (6), а сопоставляемые по (3) частные признаки {тит])

удалим из шаблонов: 7] = 7] \ {т( | г е 7} и

Т2=Т2\ {т} | 7 е 7} . Выберем частные признаки из шаблона Т2 в качестве вершин полного графа , количество вершин которого р{Ог)=\Т2\. В графе все вершины связаны. Рассчитаем сумму длин ребер в графе Сг от частного признака т, еТ2\я е J в виде

£,(*) = 2%’ (7)

где _____________________

1.у = +(у*- у У •

Для исходного графа |Г2| = п2 я Ьг (5) = Х0(.у) .

Инкрементируем допуск г и рассчитаем }с(г) по (6), удаляя сопоставляемые частные признаки из шаблонов Тх и Т2. Выберем частные признаки из шаблона Т2 в качестве вершин полного графа вг и рассчитаем Ьг (.?) по (7). Последовательно применяя инкрементацию допуска г, оценим точность автоматического распознавания частных признаков на образце щ, являющимся к -м по счету в тестовой выборке Wl, при помощи ошибки вероятностной массы по формуле

'шах

ек = шах ^ ехр

* Г=1

ад

ад.

ш-

(8)

где /-тах - максимальный допуск на величину отклонения координат (до 15). В ошибке вероятностной массы ек допуск а задан константой, а величина ошибки отражает взвешенную вероятность несовпадения шаблонов Тх и Т2 для образца еок. Метрика /л по (3) устанавливает критерий, по которому частные признаки от, и т] определяются сопоставляемыми. Чем ближе они располагаются, тем меньше величина ек, так как уменьшается

величина /с (г). Заметим, что (6) не зависит от того, какое множество 7] или Т2 является действительно полученным автоматом. Множитель ''/'тах в формуле (8) дополнительно увеличивает

чувствительность ек к удаленным друг от друга частным признакам из Тх и Т2, а отношение сумм длин ребер по (7) обеспечивает чувствительность к компактному расположению ложных частных признаков. Действительно, для малых допусков г выполняется 1Г (я) » 10 (.у), а с увеличением г сумма длин ребер Ьг{$) снижается. Однако компактно расположенные ложные частные признаки не сопоставляются и можно найти такой частный признак тх, который минимизирует (как

центр тяжести). Это позволяет выбором наиболее «неудобного» частного признака тх | я е .7 максимизировать ошибку вероятностной массы ек .

Точность автоматического распознавания частных признаков на тестовой выборке образцов Щ = {Щ IЩ 6 > ранжированной по величине

ошибки вероятностной массы ек, можно оценить при помощи суммарной ошибки 1

(9)

где |\У(| - мощность тестовой выборки образцов. Величина допуска а фиксирована (30-45). На рис. 1 показана кривая ошибки вероятностной массы (8). Образцы сок ранжированы по величине ек. Старшим индексам к соответствуют ДИ с успешно распознанными частными признаками. При удалении хороших изображений выделяется множество «плохих лидеров». Ограничивая тестовую выборку образцов \¥( множеством «плохих

лидеров», можно определить индекс к', начиная с которого оценка (9) наиболее критична, а изображения представляют наибольший интерес для развития методов классификационного анализа.

Рис. 1. Кривая ошибки вероятностной массы Выводы

Оценка точности автоматического распознавания частных признаков ДИ на основе МРВ (5) и суммарной ошибки (9) реализована в рамках автоматизированной дактилоскопической информационной системы СОНДА и использована для подготовки к тестам, проводимым независимыми международными организациями. Обучающая и тесто-

вая выборки образцов сформированы вручную на основе изображений, полученных от этих организаций в качестве образцов для пробных предварительных тестов.

Оценки (8) и (9) показали высокую эффективность при подготовке к международным тестам. Они служат удобным средством для предварительного обучения алгоритмов распознавания частных признаков, по которым выполняется идентификация изображений отпечатков пальцев. Выявлена зависимость качества обучения алгоритмов и выбора их функционального наполнения от мощности обучающей выборки образцов.

Литература

1. Аркадьев, А.Г. Обучение машины классификации объектов /А.Г. Аркадьев, Э.М. Браверман. -М. : Наука, 1971. —192 с.

2. А.с. 1652984 СССР, МКИ G 06 К 9/00. Способ формирования признаков при распознавании изображений объектов / Г.Е. Баскин, В.И. Горди-енко, Л.С. Королюк, Б.П. Русын. - № 4468868/24; заявл. 01.08.88; опубл. 30.05.91, Бюл. №20.-9 с.

3. Боннер, Р.Э. Некоторые методы классификации/Р.Э. Боннер; под ред. Э.М. Бравермана // Автоматический анализ сложных изображений. — М.: Мир, 1969. - С. 209-234.

4. Гудков, В.Ю. Оценка точности автоматического кодирования особенностей отпечатков пальцев / В.Ю. Гудков; под ред. член-корр. РАН В.Л. Арлазарова и д.т.н. проф. Н.Е. Емельянова // Обработка изображений и анализ данных: Труды ИСА РАН. - М.: Книжный дом «ЛИБРОКОМ», 2008. - Т. 38. - С. 357-363.

5. Гуревич, И.Б. Проблемы распознавания изображений: распознавание, классификация, прогноз: математические методы и их применение / И.Б. Гуревич. - М.: Наука, 1982. - Вып. 1. -237 с.

6. Дактилоскопическая экспертиза: совре-

менное состояние и перспективы развития / В.Е. Корноухое, В.К. Анциферов, Г.П. Морозов и др.; под ред. Г.Л. Грановского. - Красноярск: Изд-во Красноярского университета, 1990. - 416 с.

7. Журавлев, Ю.И. Об алгоритмических методах в задачах распознавания и классификации: распознавание, классификация, прогноз: математические методы и их применение / Ю.И. Журавлев. -М.: Наука, 1989. - Вып. 1. - С. 9—16.

8. Кирилов, С.Н. Оптимизация признакового пространства в задачах распознавания элементов речи / С.Н. Кирилов, А. С. Шелудяков // Автоматика и телемеханика. —1998. —№ 5.— С. 157-162.

9. Орлов, П.Г. Статистический метод оценки идентификационных признаков в дактилоскопической экспертизе: применение теории вероятностей и математической статистики в судебной экспертизе: материалы к теоретической конференции / П.Г. Орлов. — М., 1963. - С. 22—28.

10. Bolle, КМ. Guide to biometrics / R.M. Bolle, J.Y. Connel, S. Pankanti, N.K. Ratha. - New York: Springer-Verlag, 2004. - 368p.

11. Komarinski, P. Automated fingerprint identification systems / P. Komarinski. - New York: Academic Press, 2005. - 295 p.

12. Maltoni, D. Handbook of fingerprint recognition / Davide Maltoni, Dario Maio, Anil K. Jain. -New York: Springer-Verlag, 2003. - 348p.

Поступила e редакцию 27 апреля 2009 г.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.