Оценка качества областей дактилоскопического изображения
М.А. Посыпкин, Институт системного анализа РАН, ведущий научный сотрудник, [email protected];
А.В. Туркин, НИИ ВС и СУ Национального исследовательского университета МИЭТ, инженер-электроник, [email protected].
Предложен алгоритм оценки качества областей изображения отпечатка пальца на основе классификации блоков. Рассмотрены некоторые применяемые на практике подходы, и проведен сравнительный анализ с оценкой надежности классификации и времени работы алгоритмов.
Введение
Большинство автоматических дактилоскопических идентификационных систем используют так называемые особые точки (точки разветвлений и окончаний) изображения отпечатка пальца для вынесения решения о допуске лица, чей отпечаток был получен, на защищаемый этой системой периметр. При таком подходе можно выделить три основных этапа работы этой системы: получение изображения отпечатка пальца, его обработка с построением шаблона отпечатка пальца (который можно представить как список координат особых точек с их возможными атрибутами: тип точки, направление следование гребня и т.д.) и сравнение полученного шаблона с теми, которые хранятся в базе зарегистрированных в системе пользователей. В свою очередь этап обработки отпечатка пальца обычно состоит из следующих двух главных стадий: улучшения качества изображения и выделения локальных особенностей. Для улучшения качества изображения и получения четкой гребневидной структуры отпечатка применяются различные подходы с применением фильтров [1].
На практике возможно получение такого изображения, в некоторых сегментах которого нарушения гребневидной структуры носят необратимый характер, что применение фильтра для них невозможно. В таких областях высок риск выделения ложных точек разветвлений и окончаний, поэтому в этап обработки обычно включают стадию оценки качества отдельных областей изображения, с целью выделения областей с нарушенной гребневидной структурой.
В этой работе рассмотрена только эта стадия и предлагается алгоритм выделения таких областей.
Постановка задачи
Рассмотрим полученное со считывателя отпечатков пальцев изображение I , которое имеет 256 уровней яркости, представляющее собой матрицу размера М на N, I е {о,1,.. .,255},
1 < I < М ,1 < ] < N. Помимо области отпечатка пальца, которая характеризуется наличием структуры (далее определяемая как гребневидная) чередующихся светлых и темных полос с высокой и низкой интенсивностью пикселей соответственно, изображение содержит область фона. Область отпечатка пальца нами будет рассматриваться как объединение двух непересекающихся подобластей: с нарушенной и приемлемой для дальнейшей обработки гребневидной структурой.
Для целей выделения областей с нарушенной гребневидной структурой каждое из изображений разбивается на ряд непересекающихся блоков ю (юря е {0,1,...,255}, 1 < р < 16 ,1 < д < 16). Ставится задача
определения наличия или отсутствия четко выраженной гребневидной структуры в каждом блоке. Размеры блока были выбраны на основе эксперимента так, чтобы:
1) Блок содержал пиксели хотя бы одного гребня и одной бороздки (необходимо для правильного вынесения решения по блоку изображения).
2) Блок имел минимально возможные размеры (необходимо для выделения четкой граница раздела областей с четко выраженной и нарушенной гребневидной структурой).
При проведении данной работы был использован считыватель отпечатков пальцев, основанный на температурном методе получения изображении компании ATMEL [2]. С использованием этого считывателя была сформирована база изображений отпечатков пальцев. На основании анализа большого количества изображений отпечатков пальцев, полученных с помощью указанного датчика, можно определить пять основных классов блоков (Рис. 1). Если рассматривать блок изображения, где присутствует гребневидная структура, гистограмма распределения вероятностей интенсивностей пикселей, построенная по этому блоку, будет выглядеть как два соединенных между собой «колокола» (Рис. 1 (а)). Один из них соответствует области гребней, второй - области бороздок. В области, где гребневидная структура сильно нарушена или отсутствует (область фона) гистограмма блока будет иметь уплощенный (Рис. 1 (б)) или ярко выраженный унимодальный характер (Рис. 1 (в)) соответственно. Также для таких областей возможно получение гистограмм блоков с двумя «колоколами», значения максимумов (мод) которых сильно отличаются друг от друга (Рис. 1(г) или Рис. 1(^)).
На основании приведенных наблюдений предложим следующий алгоритм определения наличия или отсутствия четко выраженной гребневидной структуры, использующий информацию об интенсивностях пикселей в некотором блоке изображения. В качестве критерия для построения решающего правила, по которому будет осуществляться классификация, был использован вид функции плотности распределения вероятностей интенсивностей пикселей отдельно взятого блока. Следовательно, решение задачи классификации того или иного блока изображения подразумевает решение задачи о восстановлении функций плотности, каждая из которых будет определять некоторый класс.
¡1
-шЛ.
(б)
НПНиАп
(г)
(д)
Рис. 1. Классы областей
Общая схема работы алгоритма, в случае применения такого подхода, будет состоять из двух основных частей: обучения и классификации. Этап обучения включает оценку функций плотности каждого
класса исходя из информации о принадлежности к некоторому классу ряда блоков изображения. На этапе классификации эта информация используется для вынесения решения о принадлежности того или иного блока к одному из приведенных выше классов путем применения решающего правила классификации.
Введем ряд понятий, необходимых для формального описания и анализа алгоритмов обучения и классификации. Пусть О - множество блоков изображения. Это множество будем считать разбитым на ряд
непересекающихся областей: О = О ^ — ^О . Каждое О будем
называть классом. Первый класс (О ) будет определять область, дальнейшая обработка которой возможна с целью обнаружения в ней локальных особенностей (Рис. 1 (а)); О2 , О3 , О - области изображения отпечатка пальца с нарушенной гребневидной структурой (Рис. 1(б,
г, д)); последний, ^ 5 - область фона (Рис. 1(в)).
Предполагается, что существует истинный классификатор, который
определяется как функция ¥ : О ^{О ,О2,03,04,05}. На практике, данная функция обычно реализуется как экспертная оценка. Эксперт, определяет набор ее значений {¥и (ю(*))}, : = 1,., — на конечной исследуемой совокупности блоков ) ,: = 1 —,— . Где каждый блок представляется как последовательность интенсивностей пикселей. Вместе с ¥ определим другую функцию
¥ : О ^ {О ,О ,О ,О ,О }, называемую классификатором или решающим правилом. Решается задача о построении в некотором смысле оптимального классификатора ®, а именно такого, чтобы при предъявлении элементов ю е О в процессе классификации на практике равенство ¥ (ю) = ¥и(юа (правильная классификация) выполнялось
всегда.
Этап обучения
Восстановление функции плотности классов
Решается задача определения вида функции плотности для определенных выше пяти классов О,..., О5 исходя из информации о принадлежности к некоторому классу ряда блоков изображения. Пусть в результате анализа совокупности изображений были выделены Т блоков, относящихся к некоторому классу О для некоторого фиксированного ' = I, -,5 . Вектор, содержащий все интенсивности пикселей бло-
ка ^ , 1 < I < Т обозначим через Ю' (). Рассмотрим совокупность следующих векторов для всех Т блоков:
х°' = (<Юд (1)' 1б(!)•••' Юд (Т),юб 1б(Т)). Для целей обучения
необходимо иметь вектор, являющийся реализацией независимых одинаково распределенных случайных величин. Очевидно, что значения интенсивностей соседних пикселей в блоке сильно коррелированы.
а.
Сформируем обучающий вектор х ' путем выбора случайным образом
п элементов из вектора х ' . Значение п было выбрано на основе эксперимента и равняется 640, этого количества элементов в векторе вполне достаточно для задачи обучения. Так как местоположения элементов в векторе х ' , для последующей записи в х ' выбираются случайным образом, можно считать, что в результате описанной операции будет получен вектор с необходимыми свойствами. Следует отме-
—е.
тить, что количество элементов в исходном векторе х ' было 2560, т.е.
—А.
для формирования каждого вектора х ' было использовано по 10 блоков изображения
Определим алгоритм для восстановления функции плотности /^(х)
некоторого ' -го класса с использованием вектора х. Для простоты последующего изложения алгоритма определим вектор х=С*1,- - -т^ПгУ. Из теоремы Винера [3] следует, что плотность случайной величины ^ может быть представлена в виде смеси нормальных распределений с некоторым общим о: к
/в (х) = X рVг(х;а,о), где к > 1 - натуральное число, Щ1 ...щк -
'=1
нормальные плотности. Решается задача нахождения параметров этой смеси по известным реализациям случайной величины ^ - по вектору х. Запишем эти параметры в виде вектора @: в = (Р1 ■■■ Рк а .■■ак,°), где Р1 +р2 +... + Рк= 1, р,> 0, ст > 0 , р,а,о еЯ , ' = 1. к.
Применим подход, известный как метод максимального правдоподобия [4], для оценки параметров смеси. В соответствии с этим методом
оценка неизвестного параметра @ по вектору х - наблюдениям
случайной величины ^, определяется из условия: = max L(x;d), где L - функция правдоподобия,
L(x; в) = f (xj; в)f (x2 ;в)•.. f (хи; в). Таким образом, оценка максимального правдоподобия в параметра @ по независимым наблюдениям Х1, • • •, xn может быть представлена в виде задачи оптимизации
m
^ n
[5]: в = «е £ In// (x ).
'в
1=1
Вместе с определением параметров смеси необходимо оценить количество ее компонентов. Практически, при решении этой задачи, очень важно подойти к ней с точки зрения оценки наименьшего количества компонентов смеси, при которых модель согласуется с данными [6].
Оценка параметров функций плотности классов
Определим процедуру, позволяющую находить максимум (по параметру & и при фиксированном К - количестве компонентов смеси) логарифмической функции правдоподобия.
Для решения поставленной задачи был применен ЕМ-алгоритм [5,6]. Применяя этот алгоритм к рассматриваемой задаче, получим следующие расчетные формулы. Положим, что значение параметра & на т -ой итерации ЕМ-алгоритма извест-
но: в(т) = (р(т) — р(т), а{т) —а{т), а(т)). Обозначим через
_р__ лт)
Ц-1 (Xj - a")2 }
Г^ (т) ^ - .
„ (т) = У2ла_I 2_J , тогда уточненные значения
_ , п(т)
(т)~"*~ I 2 '
параметров р , аг и а на (т +-ой итерации ЕМ-алгоритма имеют вид:
Z 2 (Xj - a")'}
(m+1) = ¿V о(тК r/m+1) - 1 У <»г
Pi n ^ 8iJ a "V n g(m)^ Xj
j=16 ij
1/2
j=i8ij' j=1
a (m+1) =
I K n , v
II I g"(xj - a(m1))
n i=1 j "1
• i " 1,..., K
В результате применения ЕМ-алгоритма вычисляется последовательность значений параметра & . Достижение стационарной точки (локального максимума) алгоритмом определяется исходя из сле-
дующего соотношения: < s. Параметр был
выбран экспериментально, s = 10 6 .
Оценка количества параметров функций плотности классов
Определив процедуру для нахождения параметров смеси нормальных с общим & , оценим оптимальное количество параметров Konm . Предположим, что имеется набор функций плотности
fg (Х),...,fg (Х), каждая из которых представляет собой смесь с
1 Kmax
соответствующими параметрами: K=1,",Kma. Значение Kmax -количество компонентов смеси, которое было выбрано исходя из опыта:
Kmax = 10. Ставится задача определения того оптимального значения количества компонентов смеси, при котором помимо того, что исходные данные согласуются с выбранным видом функции плотности, эта функция имеет наименьшее число параметров.
Выполним последовательный поиск оптимального количества параметров смеси, рассматривая две гипотезы: гипотеза Hi определяет согласие заранее найденной функции плотности c выборкой x при 2K параметрах смеси, а гипотеза H2 определяет согласие с выборкой при 2(k +l) параметрах смеси, где K = 1,. ...K^ — 1. Для
проверки этих гипотез был применен Байесовский информационный критерий, описанный в работе [7]. В соответствии с этим критерием решение задачи об оптимальном значении числа компонент смеси имеет
вид: Konm = argmjn j- 2logl(x;6k )+ (2K)lognj, где вк - оценка
максимального правдоподобия параметра в для некоторого значения K компонентов смеси, построенная с применением вышеописанного
алгоритма по вектору x=C*1-- - ,xn). Схема оценивания неизвестных параметров смеси будет строиться следующим образом: вначале
строится оценка параметра вк и вк+1 для последовательности фиксированных значений K '-.-Aiiax'. Затем, с помощью Байесовского информационного критерия, эти оценки сравниваются с вынесением решения о продолжении или прекращении процесса оценивания
параметров с выбором оптимального значения Konm в качестве оценки для неизвестного числа компонент смеси.
Этап классификации
Как было описано ранее, все изображение было разбито на блоки размера 16 на 16 пикселей. Из каждого блока случайным образом выбираются 128 элементов. Таким образом, мы располагаем исходными статистическими данными - выборкой х = (х1, х2 —х128), где хг независимые и одинаково распределенные случайные величины с функцией
распределения Р£, ) . Стоит отметить, что относительно выборки х будем допускать двойственное толкование этого обозначения и объекта: как случайного вектора и как вектора реальных числовых данных, полученных в фактически осуществленных экспериментах.
Рассмотрим следующую задачу классификации. Выборку х из 128 фиксированных наблюдений, необходимо отнести к одному из классов
, ^ 2 , ^ 3 , ^ 4 или ^ 5 . Данная задача является статистической задачей проверки следующих гипотез: Н1 - когда выборка х принадлежит классу ^ 1, Н2 - когда выборка х принадлежит классу ^ 2 и т.д.
Положим, что гипотезы равновероятны (постулат Байеса-Лапласа), и по формуле Байеса найдем вероятность принадлежности х к классу ^г , 1 = 1, — ,5, т.е. апостериорные вероятности гипотез Н1,..., Н5 , если в результате наблюдения получена выборка х :
/ (х Н)
—;-, где
I (хН) '
плотности, характеризующая класс ^ г [8]. Таким образом, может быть получен оптимальный по критерию максимальной апостериорной вероятности алгоритм принятия некоторой гипотезы. Приведем это решающее правило: принимается гипотеза Нг , если / (х | Нг ) = тах / (х | Н^.) [4]. Таким образом, на этапе классификации решение о принадлежности того или иного блока отпечатка пальца к одному из приведенных выше классов принимается путем вычисления значения функции
ФИ
для некоторого блока ^ : Р И = Я , если / (х 1 Нк ) = т« / (х 1 нк ) .
Оценка надежности алгоритма классификации
Необходимо количественно оценить степень уверенности ^ , которую можно назвать надежностью классификации, в справедливости равенства Р№) = р(юа для произвольного № е О. Очевидно, что ука-
Р(Нг | х) =- 1 ( 1——-, где /(х1Н) - совместная функция
занная оценка напрямую определяет качество решения поставленной задачи, а, следовательно, дает возможность производить сравнение нескольких алгоритмов классификации, результаты которой приведены в следующем пункте. Задача оценки надежности классификации состоит в определении ^ , когда в распоряжении имеются лишь наборы значений на прецедентах истинного и построенного классификаторов.
Как описано в [9], оценками вероятностей вынесения классификатором правильного и ошибочного решения (по методу максимального
правдоподобия) будут относительные частоты числа прецедентов тп
т т
(правильных) и то (ошибочных) соответственно:- и -
тт
по по
(т + т = тпо ). Следует отметить, что элементы в экзаменационной
выборке (которая используется для оценки качества алгоритмов) не присутствуют в обучающей выборке, т.е. в той, что используется для построения решающего правила.
Сравнение предложенного метода с некоторыми, применяемыми на практике
Было проведено сравнение предложенного алгоритма с методами, описание которых приводится в работе [10] и [11]. В основу проведенного сравнительного анализа была положена надежность классификации и время работы алгоритмов.
Из базы отпечатков пальцев были выбраны несколько изображений для этапа обучения, а остальные использовались для классификации. С использованием экспертной оценки был сформирован набор прецедентов истинного классификатора, и произведено обучение. Была осуществлена классификация с определением ее надежности для каждого из отпечатков пальцев, как с применением предложенного метода, так и использованием алгоритмов, представленных в работах [10] и [11]. Результаты такого сравнения представлены в табл. 1.
Табл. 1. Надежность классификации
Надежность классификации Средняя Максимальная Минимальная
Предложенный алгоритм 0.8824 0.9123 0.8264
Алгоритма Хонга 0.8102 0.9185 0.6239
Алгоритма Шена 0.8119 0.9052 0.6939
Из таблицы видно, что предложенный алгоритм более стабильно справляется с задачей классификации, чем алгоритмы Хонга [10] или
алгоритм Шена [11], хотя и имеет чуть меньшее значение надежности классификации на небольшом количестве изображений.
Также было оценено время работы алгоритмов. Результаты такой оценки приводятся в табл. 2, из которой видно, что предложенный алгоритм имеет высокое быстродействие и работает в среднем более чем в 2 раза быстрее, нежели те, с которыми проводилось сравнение.
Табл. 2. Ускорение процесса классификации
Ускорение процесса классификации В сравнении с алгоритмом Хонга В сравнении с алгоритмом Шена
Среднее 2.30 5.96
Максимальное 2.31 6.0
Минимальное 2.27 5.91
Заключение
В результате проведенной работы предложен метод оценки качества областей изображения отпечатка пальца. Алгоритм превосходит по быстродействию методы, с которыми проводился сравнительный анализ, применяемыми на практике, имея при этом высокую надежность классификации.
Литература
9. Maltoni D., Maio D., Jain A.K., Prabhakar S. Handbook of Fingerprint
Recognition 2nd ed., 2009.
10. Atmel FingerChip Thermal Fingerprint Sweep Sensor Hardware Based, Navigation and Click Function, SPI Interface [http://www.atmel.com/dyn/resources/prod_documents/doc5347.pdf], 2008.
11. Винер Н. Интеграл Фурье и некоторые его приложения. М., Физматгиз, 1963.
12. Левин Б.Р. Теоретические основы статистической радиотехники. 3-е изд. - М.: Радио и связь, 1989.
13. Titterington D.M., Smith A.F.M., Makov U.E. Statistical analysis of finite mixture distributions. 1985.
14. McLachlan G. Peel D. Finite Mixture Models. 2000
15. G. Schwartz. Estimating the dimension of a model. - The Annals of Statistics, 1978, vol. 6.
16. Чистяков В.П. Курс теории вероятностей. 5-е изд. - М.: Агар, 2000
17. Гуров С.И. Оценка надежности классифицирующих алгоритмов. Издательский отдел факультета Вычислительной математики и кибернетики МГУ им. М.В. Ломоносова, 2002
18. Hong L., Wan Y., Jain A. Fingerprint Image Enhancement: Algorithm and Performance Evaluation. IEEE Transactions on PAMI, Vol. 20, No. 8, pp.777-789, 1998
19. Shen L., Kot A., Koo W. Quality Measures of Fingerprint Images. 3rd International Conference AVBPA 2001, p182-271, 2001/