Научная статья на тему 'Выбор размера шаблона радужной оболочки глаза для распознавания личности'

Выбор размера шаблона радужной оболочки глаза для распознавания личности Текст научной статьи по специальности «Медицинские технологии»

CC BY
300
59
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
изображение радужной оболочки глаза / распознавание

Аннотация научной статьи по медицинским технологиям, автор научной работы — Ю И. Монич, В В. Старовойтов

Представлены результаты исследования задачи, которая возникает при создании системы распознавания личности по радужной оболочке глаза (РОГ): выбор размера шаблона РОГ. Тестирование выполнялось на изображениях глаз высокого разрешения (радиус РОГ более 500 и 1000 пикселей), а также на общедоступной базе изображений глаз со стандартным разрешением — CASIA-IrisV3-Lamp (радиус РОГ -90-110 пикселей).

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по медицинским технологиям , автор научной работы — Ю И. Монич, В В. Старовойтов

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SIZE SELECTION OF THE IRIS TEMPLATE FOR HUMAN RECOGNITION

The task of template size selection for an iris recognition system design is studied. It was tested on high resolution iris images (with iris radius over 500 and 1000 pixels) and on the public database CASIA version 3 Lamp with iris radii 90–110 pixels

Текст научной работы на тему «Выбор размера шаблона радужной оболочки глаза для распознавания личности»

Доклады БГУИР

2010 № 3 (49)

УДК 629.7

ВЫБОР РАЗМЕРА ШАБЛОНА РАДУЖНОЙ ОБОЛОЧКИ ГЛАЗА ДЛЯ РАСПОЗНАВАНИЯ ЛИЧНОСТИ

Ю.И. МОНИЧ, ВВ. СТАРОВОЙТОВ

Объединенный институт проблем информатики НАН Беларуси Сурганова 6, 220012, Минск, Беларусь

Поступила в редакцию 14 апреля 2010

Представлены результаты исследования задачи, которая возникает при создании системы распознавания личности по радужной оболочке глаза (РОГ): выбор размера шаблона РОГ. Тестирование выполнялось на изображениях глаз высокого разрешения (радиус РОГ более 500 и 1000 пикселей), а также на общедоступной базе изображений глаз со стандартным разрешением — СА81А-Ы8У3-Ьатр (радиус РОГ -90-110 пикселей).

Ключевые слова: изображение радужной оболочки глаза, распознавание.

Введение

В последние годы активно ведутся исследования в области распознавания личности по изображениям радужной оболочки глаза (РОГ) [1]. Рисунок РОГ в большей степени случаен, а чем больше степень случайности, тем больше вероятность того, что рисунок будет уникальным. Уникальность рисунка РОГ позволяет создавать высоконадежные системы биометрического распознавания личности. Создаются новые и все более совершенные системы распознавания по РОГ [2, 3]. Большинство коммерческих систем базируется на технологии, разработанной Даугманом [4], и включает в себя следующие этапы: на исходном полутоновом изображении глаза выделяют внешнюю и внутреннюю границы РОГ, далее выполняется нормализация РОГ (путем геометрических преобразований РОГ в кольцевой шаблон, а затем в прямоугольный шаблон фиксированного размера). На следующем этапе вычисляются признаки с использованием фильтра Габора, и генерируется бинарный код РОГ. Далее полученный бинарный код ставится в соответствие конкретному пользователю и заносится в базу данных (БД) или может использоваться для последующего сравнения в процедуре распознавания личности по РОГ. Данный подход к построению кода РОГ и сам код были запатентованы Даугманом в 1994 г. [5].

Термин "распознавание" объединяет в себе два понятия: верификация и идентификация. Верификация — это подтверждение соответствия представленного изображения глаза определенному идентификатору, указанному пользователем. Процедура выполняется путем сравнения полученного кода РОГ (из представленного изображения глаза) с кодами РОГ, хранящимися в БД, соответствующими предопределенному идентификатору пользователя (фамилия, имя и т.п.). Идентификация — это сравнение вычисленного по изображению кода РОГ с кодами РОГ, хранящимися в БД, с целью авторизации пользователя.

При распознавании личности по РОГ возникает ряд задач, недостаточно исследованных и описанных в литературе, например: выбор размера шаблона РОГ, способ вычисления бинарного кода РОГ, выбор меры близости для сравнения двух кодов РОГ и др. В статье представлены результаты исследования задачи определения размера прямоугольного шаблона РОГ для представления изображения глаза, используемого при распознавании личности.

Построение шаблона радужной оболочки глаза для распознавания личности

Из-за разного разрешения исходных изображений глаз и расширения зрачка размеры РОГ в пикселях могут быть различны. В качестве математической модели РОГ чаще всего используют кольцо, образованное двумя неконцентрическими окружностями [6]. Центры этих окружностей и радиусы имеют разные значения для одинаковых глаз, зарегистрированных в разных условиях. Для распознавания личности по изображению РОГ выполняется его нормализация путем обратного преобразования координат пикселей прямоугольного шаблона фиксированного размера, т.е. выполняется перевод полярных координат в декартовые. При этом, как правило, мотивация выбора размера прямоугольного шаблона не описана. Разные авторы используют различные размеры шаблонов РОГ (табл. 1).

Таблица 1. Примеры размеров нормализованных прямоугольных шаблонов РОГ, используемых различными авторами

Авторы Используемая база изображений глаз Размер шаблона РОГ, пк Размер кода РОГ, пк

Ma и др. [7] CASIA версия 1, 320x280 64x512 48x512

Чанг и др. [8] CASIA, UBIRIS нет данных 32x512

Масек [9] CASIA версия 1 32x240 нет данных

LEI 20x240 нет данных

Холингворс и др. [10] своя БД (1263 изображений глаз) 20x240 20 х240 (используют маску шумов)

Занг и др. [11] CASIA (2156 изображений глаз, 308 классов) 80x512 48x512

Арвачех [12] CASIA версия 1 54x384 нет данных

В работе [12] было исследовано влияние размера прямоугольного шаблона на качество распознавания по РОГ и даже выбран оптимальный размер (54x384 пикселей). Однако сделано это было только для базы изображений глаз CASIA версия 1, которую позже раскритиковали организаторы тестов биометрических систем распознавания из американского института стандартов [13]. В [12] показано, что с удалением от внешней границы РОГ к зрачку точность распознавания повышается, и слегка падает при приближении к зрачку. Кроме того, часто глаз человека при регистрации недостаточно открыт, поэтому часть области РОГ может быть прикрыта веками и ресницами. Исходя из этого, многие исследователи для обеспечения большей точности распознавания при получении кода РОГ используют не весь прямоугольный шаблон РОГ целиком, а его фрагмент (см. табл. 1 и рис. 1).

В ходе экспериментов было установлено, что использование только нижнего полукольца высотой равной три четверти ширины нормализованного прямоугольного шаблона РОГ (рис. 1) не ухудшает результатов распознавания.

Рис. 1. Изображение глаза, белым закрашена та часть кольцевого и прямоугольного шаблонов РОГ,

которая используется для распознавания

При нормализации РОГ высокого разрешения (радиус РОГ более 1000 пикселей) ширина кольца РОГ может равняться 200-800 пикселей. При масштабировании в небольшой шаблон фиксированного размера (шириной 20-80 пикселей) может исказиться представление исходной текстуры РОГ ввиду сильной разреженности точек, отбираемых в шаблон. В свою очередь, при преобразовании РОГ с малой шириной кольца в шаблон большого размера, новые значения яркости вычисляются путем интерполяции, что также может исказить текстуру РОГ.

Вышесказанное требует решения задачи оптимизации выбора размера шаблона и вычисляемого на его базе кода РОГ. Однако такая задача трудно формализуема, так как содержит много неизвестных: координаты центра РОГ и зрачка, их радиусы, нелинейная функция сжатия зрачка, модель шума, форма век, форма и расположение ресниц и др. Поиск оптимального размера прямоугольного шаблона РОГ для представления изображения глаза был выполнен экспериментально в несколько этапов. Были получены и проанализированы шаблоны РОГ различных размеров. Для построения кодов РОГ использовалось наиболее распространенное лог-нормальное преобразование Габора (1), при помощи которого были получены двумерные бинарные коды РОГ разного размера, которые сравнивались между собой при помощи расстояний Хэмминга (2). Была исследована схема построения шаблона и кода РОГ, представленная на рис. 2.

О г =ехр-

1°8 г

21 оё а

(1)

где /О — центр частотного фильтра; а=а1//0 — отношение должно быть константой.

Ш = — X ХОЯ 7,

N ¿-4=1

(2)

где X] и У] — сравниваемые бинарный коды РОГ; N — количество бит, представленных в каждом коде РОГ.

Рис. 2. Схема построения нормализованного шаблона и кода РОГ для изображений разного разрешения и размера

2

2

Выбор размеров шаблона радужной оболочки глаза для изображений высокого разрешения

Целью данных экспериментов было определение наилучших размеров для шаблона и кода РОГ.

Для проведения первого эксперимента было отобрано несколько пар изображений глаз высокого разрешения (2592x3872, 2000x3008, 1250x1051 пикселей), зарегистрированных в красном диапазоне спектра (рис. 3). Для этих изображений были получены шаблоны РОГ разных размеров (рис. 4). Визуально определено, что шаблоны всех размеров сохраняют исходную текстуру РОГ. На рис. 5 приведены фрагменты изображения одного глаза Peter_le (область РОГ), на которых белыми точками отмечены пиксели, использованные для построения прямоугольных шаблонов РОГ (рис. 4). На рис. 6 представлены коды РОГ разных размеров, полученные для указанных шаблонов. Высота матриц кодов равна высоте шаблонов РОГ, но ширина кода РОГ в 2 раза больше, так как код получен путем бинаризации вещественной и мнимой компонент функций Габора, вычисленной в окрестности любого пикселя шаблона.

а б

Рис. 3. Примеры изображений глаз высокого разрешения, использованных в экспериментах (изображения левого глаза одного человека, радиус РОГ — 700-750 пк): а — 2Peter_le.tif (2000x3008 пк); б — Peter_le.tif (2592x3872 пк)

Рис. 4. Примеры прямоугольных шаблонов РОГ разного размера (видно сохранение текстуры) для изображения глаза Ре1ег_1е (рис. 3,6): а — 128x768; б — 64x384; в — 32x192 пикселей

б

Рис. 5. Фрагмент исходного изображения глаза высокого разрешения Peter_le (а); белыми точками показаны пиксели, использованные для построения шаблонов РОГ разных размеров (32x192, 64x384 пикселей) (б), (е)

Рис. 6. Бинарные коды РОГ разных размеров, полученные для изображения глаза высокого разрешения Рйег_1е и шаблонов, показанных на рис. 5: а — 32x192 пикселя; б — 50x300 пикселя; в — 64хх384 пикселя

Для экспериментов было выбрано несколько фиксированных значений высот шаблона РОГ (И), а ширина (Ж) определялась как

в

а

в

в

W=Hk, где k=3, 4, ..., 9.

В первом эксперименте выполнялось сравнение кодов РОГ, построенных по изображениям одного и разных глаз. По результатам эксперимента были построены графики, демонстрирующие изменение расстояния Хэмминга в зависимости от изменения размеров шаблона РОГ (рис. 7).

Из рис. 7 видно, что с увеличением размеров шаблона РОГ увеличивается расстояние Хэмминга между кодами РОГ при сравнении разных и одинаковых глаз. При малом размере шаблона и при большом количестве вариантов узоров РОГ (более 6 млрд населения) уменьшается вариабельность узора РОГ и, как следствие, некоторые коды РОГ могут быть похожи друг на друга, т.е. информация теряется. Поэтому шаблоны РОГ маленьких размеров могут дать ложные результаты при сравнении кодов в процедуре идетификации.

Рис. 7 также показывает, что при высоте шаблона РОГ равной 32, 50 и 64 пикселя расстояние Хэмминга растет медленнее, чем при большей высоте шаблона. Поэтому для дальнейших экспериментов были отобраны шаблоны и коды РОГ высотой 32, 50 и 64 пикселя.

—©— сравнение 2Peter le и Peter le, размер шаблона 10x10*k —О--- сравнение 2Peter le и Peter le, размер шаблона 32x32*k — О— ■ сравнение 2Peter le и Peter le, размер шаблона 50x50*k 0-8 - —©— сравнение 2Peter le и Peter le, размер шаблона 64x64*k

—О--- сравнение 2Peter le и Peter le, размер шаблона 128x128*k сравнение 2Peter le и Peter le, размер шаблона 190x190*k —О— сравнение 2Peter le и Peter le, размер шаблона 400x40CTk —О— сравнение Kate 15age 1 и 2Peter le, размер шаблона 64x64*k —— сравнение Kate 15age 1 и 2Peter le, размер шаблона 190x19CTk О сравнение Kate 15age 1 и 2Peter le, размер шаблона 400х40СГк » Порог для HD = 0,39

3 4 5 В 7 В 9

к

Рис. 7. Графики зависимостей расстояния Хэмминга (НО) от размера шаблона РОГ П/\\' пикселей, где Яравно 10, 32, 50, 64, 128, 190, 400 пикселей, а \¥=Н-к, где А=3, 4, ..., 9

Далее был проведен эксперимент по выбору наилучшей ширины шаблона. Для разных величин высоты и ширины кодов РОГ была вычислена разность между расстояниями Хэмминга (АНП) для одинаковых и разных глаз (рис. 8).

Графики на рис. 8 показывают, что при коэффициенте к=5 усредненное расстояние Хэмминга (при сравнении кодов РОГ разных глаз и при сравнении кодов РОГ одного глаза) меньше, чем для других к. В результате данных экспериментов высоты шаблонов РОГ 32, 50, 64 пикселей и значение к равное 5 были отобраны как лучшие для распознавания личности по изображениям РОГ.

Уточнение размеров шаблона радужной оболочки глаза для изображений стандартного разрешения

Предыдущие эксперименты были выполнены на небольшом количестве (8 шт.) изображений глаз очень качественного и высокого разрешения. Для уточнения и проверки корректности полученных результатов было проведено тестирование на большом количестве изображений глаз. Для этого была использована база СА81А-1п8У3-Ьашр [14]. Были использованы 1000 первых изображениях из этой БД (25 первых человек, по 20 левых и правых изображений глаз каждого). Для этих изображений были получны коды РОГ (высотой (Н) 32, 50 и 64

пикселя, шириной равной И^к пикселей, где к=5). И выполнено по 488566 сравнений кодов РОГ отобранных размеров (из них для изображений одинаковых глаз (называемых далее "свои") — 9237 сравнений, для изображений разных глаз (называемых далее "чужие") — 479329 сравнений). По полученным данным были построены распределения расстояний Хэмминга (рис. 9).

Рис. 8. График зависимости АНБ от размера шаблона РОГ

Рис. 9. Распределения расстояний Хэмминга между кодами разных размеров (для 1000 изображений глаз

БД СЛ81Л-Ы8У3-Ьашр)

В табл. 2 приведены оценки качества распознавания по изображениям РОГ, используемые при разделимости кодов изображений РОГ одинаковых и разных глаз спомощью параметра й [6]:

К -цс

^2 I

/ст„ + ст„

(3)

2

где и |1с — средние значения расстояний Хэмминга между всеми кодами РОГ "своих" и "чужих"; а, и стс — среднеквадратичные отклонения для этих величин.

Таблица 2. Средние, среднеквадратичные значения и параметр й для полученных расстояний Хэмминга при сравнении кодов одного и разных глаз (для 1000 изображений глаз БД CASIA-IrisV3-Lamp)

Высота шаблона (H) Us Vs Цс Ос d ERR

32 0,2164 0,0556 0,4417 0,0245 5,2967 0,006997

50 0,2230 0,0568 0,45 0,0184 5,4306 0,004817

64 0,2309 0,0591 0,4535 0,0163 5,1891 0,006116

Из табл. 2 следует, что параметр d имеет наибольшее, а параметр EER (равная вероятность ошибок I и II рода) имеет наименьшее значение при размерах шаблона РОГ 50x250 пикселей.

Заключение

В результате экспериментальных исследований на 1000 изображений глаз с разным разрешением и с разными диаметрами РОГ можно сделать следующие выводы:

- для распознавания личности по изображениям РОГ целесообразно использовать нижнее полукольцо высотой равной три четверти ширины нормализованного прямоугольного шаблона РОГ (рис. 1);

- для построения бинарного кода РОГ достаточно использовать шаблон размером 50x250 пикселей.

SIZE SELECTION OF THE IRIS TEMPLATE FOR HUMAN RECOGNITION

Y.I. MONICH, V.V. STAROVOITOV Abstract

The task of template size selection for an iris recognition system design is studied. It was tested on high resolution iris images (with iris radius over 500 and 1000 pixels) and on the public database CASIA version 3 Lamp with iris radii 90-110 pixels.

Литература

1. Kumar A., Passi A. // Pattern Recognition. 2010. Vol. 43, №3. P. 1016-1026.

2. Indian Technologies [Электронный ресурс]. 2010. Режим доступа: http://www.iridiantech.com. Дата доступа: 23.04.2010.

3. LG [Электронный ресурс]. 2010. Режим доступа: http://www.lgiris.com. Дата доступа: 23.04.2010

4. Daugman J. // IEEE Transactions on Circuits and Systems for Video Technology. 2004. Vol. 14, № 1. P. 21-30.

5. Пат. США 5291560. Biometric personal identification system based on iris analysis / J.G.Daugman; заявитель и патентообладатель Iri Scan Incorporated (США). № 07/729,638; заявл. 15.07.1991; опубл. 01.03.1994. 24 с.

6. ГОСТ Р ИСО/МЭК 19794-6-2006.Автоматическая идентификация. Идентификация биометрическая. Форматы обмена биометрическими данными. Ч. 6. Данные изображения радужной оболочки глаза, 2007. 28 с.

7. Ma L., Tan T. // IEEE Transaction on pattern analysis and machine intelligence. 2003. Vol. 25, № 12. P. 1519-1533.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8. Chang J., Huang M, Lee J., Chang C., Tu T. // Optical Engineering. 2009. Vol. 48, № 4. P. 047007-047007-15.

9. Masek L. Recognition of Human Iris Patterns for Biometric Identification // The University of Western Australia. 2003.

10. HollingworthK., BowyerK.W., FlynnP.J. // Computer Vision and Image Understanding. 2009. Vol. 113, № 1. P. 150-157.

11. Zhang D., Monro D.M., Rakshit S. // Proc. IEEE Internat. Conf. on Image Processing. P. 285-288.

12. Arvacheh E.H. A study of segmentation and normalization for iris recognition systems // Waterloo, Ontario, Canada. 2006.

13. Phillips P. J. // IEEE Trans. on Pattern Analysis and Machine Intelligence. 2007. Vol .29, № 10. P. 1869-1870.

14. База изображений глаз CASIA [Электронный ресурс]. Институт автоматизации. Китайская академия наук. 2010. Режим доступа: http://www.cbsr.ia.ac.cn/IrisDatabase.htm. Дата доступа: 21.01.2010.

i Надоели баннеры? Вы всегда можете отключить рекламу.