Научная статья на тему 'Аутентификация пользователя в мультимодальном интерфейсе системы контроля доступа'

Аутентификация пользователя в мультимодальном интерфейсе системы контроля доступа Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
214
45
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АУТЕНТИФИКАЦИЯ / МУЛЬТИМОДАЛЬНЫЙ ИНТЕРФЕЙС / РАСПОЗНАВАНИЕ ОБРАЗОВ / СИСТЕМА КОНТРОЛЯ ДОСТУПА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Алфимцев А. Н.

Рассмотрен мулътимодалъный интерфейс системы контроля доступа, обеспечивающий аутентификацию полъзователя по изображению его лица и верхней части тела. Аутентификация базируется на алгоритме распознавания человека с исполъзованием агрегирования несколъких источников информации.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Алфимцев А. Н.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Аутентификация пользователя в мультимодальном интерфейсе системы контроля доступа»

УДК 004.53

А. Н. Алфимцев

АУТЕНТИФИКАЦИЯ ПОЛЬЗОВАТЕЛЯ В МУЛЬТИМОДАЛЬНОМ ИНТЕРФЕЙСЕ СИСТЕМЫ КОНТРОЛЯ ДОСТУПА

Рассмотрен мулътимодалъный интерфейс системы контроля доступа, обеспечивающий аутентификацию полъзователя по изображению его лица и верхней части тела. Аутентификация базируется на алгоритме распознавания человека с исполъзованием агрегирования несколъких источников информации.

E-mail: [email protected]

Ключевые слова: аутентификация, мультимодальиый интерфейс,

распознавание образов, система контроля доступа.

Введение. Система контроля доступа представляет собой совокупность аппаратных и программных средств, направленных на ограничение и регистрацию доступа людей (субъектов доступа) к некоторой информационной системе. При этом аутентификацией называется процесс проверки принадлежности субъекту доступа предъявленного им идентификатора. Для осуществления автоматической проверки широко применяются биометрические методы, основанные на различии параметров человеческого тела: отпечатков пальцев, сетчатки глаза и др. Данные методы обеспечивают высокую точность, но многие из них очень дороги или требуется специальная аппаратура для их применения.

В данной работе для аутентификации пользователя применяется мультимодальный интерфейс системы контроля доступа, который использует методы компьютерного зрения. Предлагаемая система работает на стандартном компьютере и дополнительно требуется лишь наличие бытовой веб-камеры с разрешением не более 320x240 пикселей. Интерфейс системы называется мультимодальным, так как процесс распознавания основан на агрегировании нескольких модальностей пользователя. Слияние, агрегирование или фьюзинг информации — важнейшие аспекты построения современной интеллектуальной системы [1-3]. Эти системы используют агрегирование данных из различных источников информации для правильного принятия решения. Под источником информации понимается некоторый алгоритм распознавания объекта, выдающий данные, позволяющие распознать объект, т. е. отнести его к какому-либо заданному классу объектов. Стремление к объединению нескольких источников информации для получения результирующего решения обусловлено

тем, что каждый источник в отдельности может иметь высокую неопределенность или неточность данных, которая уменьшается при их агрегировании [4]. Поскольку вероятностные методы агрегирования информации не всегда корректно решают поставленную задачу, все большее применение получают методы агрегирования данных, основанные на теории нечетких операторов (интегралов), и в частности на нечетких операторах Шоке и Суджено. В общем, нечеткий оператор это нелинейный функционал определенный в соответствии с некоторой нечеткой мерой [5].

Постановку задачи распознавания в области компьютерного зрения при наличии нескольких источников информации об объекте представим следующим образом. Если Т - tm} — множество

классов, к которым может быть отнесен объект А, найденный на изображении, то задача распознавания заключается в том, чтобы определить, к какому классу tk, 1 < к < т относится объект А и насколько можно быть уверенным в том, что объект А относится к классу tk при наличии некоторых данных об объекте, полученных с

помощью различных алгоритмов распознавания объекта. И если первичный признак — это характерный признак объекта, позволяющий отличить один объект от другого, а вторичный признак — результат работы алгоритма распознавания, основанного на первичных признаках, то задачей нечеткого агрегирования является выбор наилучшего из решений задачи распознавания, получаемых с помощью нечетких операторов Суджено и Шоке.

Решение задачи распознавания с использованием нечетких операторов. Пусть X - {х1, х2,..., хп} — множество алгоритмов распознавания объекта; А — объект распознавания; Нк : X ^ [0,1] — вторичный признак, результат вычисления алгоритма принадлежности объекта А классу tk; кк (х1) — вторичный признак после процесса фаззификации, т. е. перевода в нечеткую форму с помощью некоторой функции принадлежности р.(кк (х1)). Другими словами,

кк (хг-) — показатель принадлежности объекта А к классу tk. Используем алгоритм х1, где 1 — означает абсолютную уверенность, что объект А принадлежит классу tk, 0 — подразумевает абсолютную уверенность, что объект А не принадлежит классу tk. Кроме того, каждому х1 ставится в соответствие степень важности , обозначающая, насколько важен источник информации х1 в распознавании класса tk. Эти значения могут быть установлены экспертом или вычислены в результате обработки обучающих данных.

Таким образом, задачу распознавания с использованием нечетких операторов Sk (h) можно решить с помощью алгоритма, представленного на псевдокоде.

BEGIN

Задать значение g для каждого алгоритма распознавания е X — {xi,%2..^xn};

FOR для каждой записи в базе данных пользователей K = 1, ..., N (где N — общее число записей);

Вычислить значение h^k (xt);

Вычислить Xk е (-1, для нечеткой меры;

IF NOT h$(xi) > h$(x2) > ... > h$(xn);

THEN Упорядочить X — {x1, x2..., xn} в соответствии с условием;

ELSE Вычислить нечеткую меру gk (At);

Вычислить нечеткий оператор Sk (h);

END FOR;

Найти запись с максимальным значением Sk (h);

END.

Необходимо отметить, что для каждого объекта, который система контроля доступа может распознать, в базе данных предварительно создается запись. В данном алгоритме последовательно просматриваются записи в базе данных, для каждой из записей вычисляется нечеткий оператор, затем выбирается запись с максимальным значением оператора. Эта запись и является классом tk, к которому относится распознаваемый объект. Причем в качестве нечеткого оператора может быть использован как нечеткий оператор Суджено, так и нечеткий оператор Шоке. Нечеткая мера вычисляется как ^-нечеткая мера [6].

Описание графической части мультимодального интерфейса.

Система контроля доступа с мультимодальным интерфейсом применена для автоматического преодоления человеческого фактора при проведении группового тестового экзамена на персональных компьютерах. Система решала задачу контроля доступа студента к его экзаменационному тесту, проверяя при этом не только имя и пароль доступа, но и совпадение изображения человека, вводящего данные с изображением человека, занесенного в базу данных. Таким образом исключалась возможность передачи паролей между студентами и преднамеренная сдача экзамена одним студентом за другого.

Система контроля доступа обеспечивает автоматическую аутентификацию пользователя за счет распознавания человека по изображению его лица и верхней части тела. Система работает в реальном времени и обладает следующими характеристиками:

• быстрое распознавание на стандартном персональном компьютере. Система работает на персональном компьютере с характеристиками Pentium 4/2 GHz/ОП 2 Gb/ОС Windows XP/веб-камера Logitech Pro 5000 320x240, 15 кадр/с. Для распознавания человека с помощью нечетких операторов агрегирования системе требуется около 2,5...3 с;

• автоматическое определение области интересов. Система автоматически находит человека в видеопотоке, поступающем от камеры (используя алгоритмы: оптический поток для определения движущегося объекта [7] и каскад обнаружения лиц, основанный на характерных признаках Хаара) и использует полученные данные для распознавания или для обучения. Камера устанавливается один раз на компьютере и не требует калибровки. Система может устойчиво распознавать одного и того же человека под разными углами и на разном расстоянии, не фиксированном освещении, на сложно-текстурном фоне благодаря описанному алгоритму агрегирования нескольких алгоритмов распознавания;

• удобное администрирование. Представлен отдельный графический интерфейс для администратора системы;

• распределенное хранение базы данных. Реализован механизм как единого хранения базы данных пользователей системы на сервере и передачи данных авторизации через сеть, так и распределенное хранение «популярных» частей базы на клиентских машинах.

Взаимодействие студента с системой заключается в следующем. Система находится в спящем режиме и ожидает пользователя, выводя диалог на экран монитора (рис. 1). Студент идентифицирует себя, вводя имя и пароль доступа к системе. Система по введенным данным находит пользователя в базе данных и только тогда включает процесс распознавания человека по его изображению. Финальное решение «Да» или «Нет» зависит только от результата распознавания модуля компьютерного зрения системы. Таким образом, не требуется проводить процесс распознавания пользователя со всей базой данных и достаточно лишь сравнить изображение с заданным числом записей в базе данных. Затем студенту выводится экзаменационный тест, который он может решать в реальном времени. Причем, если время теста превышает 30 мин, то процесс распознавания может включаться несколько раз на протяжении всего тестирования.

Рис. 1. Графическая часть мультимодального интерфейса

Как было отмечено, добавление нового пользователя в базу данных может быть выполнено с помощью администратора или с помощью автоматического обучения системы на новом пользователе. Во втором случае процесс напоминает рассмотренный процесс распознавания, когда студент сначала вводит идентификационные данные, а затем система находит изображение лица в видеопотоке и заносит в базу данных. Процесс занесения пользователя в базу данных обычно выполнялся в течение семестра при проведении лабораторных работ в компьютерном классе (вид оборудованного класса приведен на рис. 2). Необходимо отметить, что на одного пользователя можно собрать несколько десятков признаковых изображений, учитывающих меняющееся освещение и тип одежды.

Рис. 2. Учебный класс, оборудованный веб-камерами

Результаты экспериментов. Для определения точности и устойчивости работы системы контроля доступа проводили следующие эксперименты распознавания пользователя по его изображению. Использовали четыре алгоритма распознавания пользователя: скрытая Марковская модель (СММ), Алгоритм определения цвета (АОС), Алгоритм нахождения соотношений (АНС), Радиальные базисные функции (РБФ) [8]. Для каждого алгоритма требуется обучение на пользователях, которые необходимо распознавать. С этой целью была заполнена база данных, состоящая из записей пользователей, «знакомых» системе.

Для хранимого изображения лица пользователя (представленного в полутоновом цветовом пространстве) создается СММ, а затем на ее вход подается новое изображение. Результатом работы СММ является вероятность, означающая степень схожести входного изображения и изображения, на котором она была обучена. Разность вероятностей ^х^ СММ — это разность вероятности (Рыа), вычисленной СММ для хранимого изображения, и вероятности (Рпт,), вычисленной для входного распознаваемого изображения.

Если эта разность превышает заданный порог (найденный экспериментально и равный 2), то пользователь не принадлежит к данной записи в базе данных. Алгоритм определения цвета находит значение цвета (по трем цветовым каналам: г — красный, g — зеленый, Ь — синий) верхней части тела пользователя. Затем сравнивает это значение со значением цвета распознаваемого пользователя, если евклидово расстояние ^ х2) превышает заданный порог (найденный

экспериментально и равный 40), то пользователь считается не принадлежащим данной записи. Алгоритм нахождения соотношений определяет на лице расстояние между глазами, глазами и носом, носом и ртом, глазами и ртом, глазами и подбородком и на основе соотношений этих расстояний ищет евклидово расстояние ^ х3) для распознаваемого пользователя; если порог превышен (найденный экспериментально и равный 10), то изображение пользователя считается не принадлежащим данной записи. Радиальные базисные функции для сравнения используют найденные значения функций для хранимого РоШ и входного Гпек псевдотрехмерного изображений лица пользователя.

Для вычисления значений (х1), I = 1, 2, 3, 4, значения ^ х1),

которые являются результатами работы алгоритмов, были фаззифи-цированы с помощью функций принадлежности:

СММ: hM( x1) = <

0, h(xi) > 2; 2 - h( x1)

2 -1,5 1, 0 < h(x1) < 1,5;

1,5 < h(x1) < 2;

АОС: hM(x2) =

0, h(x2) > 40; 40 - h(x2)

АНС: hM(x3) =

40

1, h(x2) = 0;

0, h(x3) > 10; 10 - h( x3)

, 0 < h(x2) < 40;

РБФ: hM(x4) =

10

1, h(x3) = 0; 0, h(x4) > 30;

0 < h(x3) < 10;

30 - h( x4)

30

1, h(x4) = 0.

, 0 < h(x4) < 30;

Во многих работах при описании экспериментов определяется только точность распознавания системы. Но немаловажным является вопрос, насколько устойчиво система отвергает пользователей и не распознает их, если их изображение не содержится в базе данных. Поэтому целью проведенных экспериментов являлось определение коэффициентов точности и неустойчивости распознавания системы. Коэффициент точности распознавания — отношение числа правильно распознанных изображений пользователей системы к общему числу изображений пользователей, поданных на вход. Коэффициент неустойчивости распознавания — отношение числа изображений пользователей, не присутствующих в базе данных, которые были распознаны системой как некоторая запись в базе данных к общему числу изображений пользователей, поданных на вход системы.

В первом эксперименте среднее значение коэффициента точности распознавания превысило 95 %. Во втором эксперименте система ни разу не приняла нового пользователя за одного из пользователей системы. Хорошие результаты обоих экспериментов подтверждают высокую эффективность алгоритма агрегирования мультимодальной информации в задачах распознавания, который также позволяет решить одну из основных проблем конструирования систем распознавания и компьютерного зрения: максимальное увеличение коэффи-

циента точности распознавания и максимальное уменьшение коэффициента неустойчивости распознавания.

Заключение. Предлагаемый мультимодальный интерфейс системы контроля доступа позволяет надежно и устойчиво проводить аутентификацию пользователя. Для работы системы контроля доступа требуются лишь персональный компьютер и обычная веб-камера. Результаты экспериментов подтверждают возможность системы устойчиво гарантировать персональное распознавание человека и исключение прецедентов сдачи тестов одними студентами за других во время групповых промежуточных и итоговых экзаменов.

Распознавание системы строится на основе интеллектуальной методологии нечеткого агрегирования данных из разных источников информации. Использование агрегирования позволяет во многом преодолеть проблемы, присущие всем системам компьютерного зрения: калибровку камеры, угол захвата области интереса, неоднородность текстуры фона и динамически меняющееся освещение, соотношение коэффициентов точности и неустойчивости распознавания.

СПИСОК ЛИТЕРАТУРЫ

1. Chen X., J i n g Z., Xiao G. Fuzzy Fusion for Face Recognition // Fuzzy Systems and Knowledge Discovery. 2005. - Vol. 361. - P. 672-675.

2. Kwak K., Pedrycz W. Face recognition: A study in information fusion using fuzzy integral // Patt. Recog. Lett. 2005. - Vol. 26. - P. 719-733.

3. Konen W., Schulze - Kruger E. ZN-face: A system for access control using automated face recognition // Proceedings of the International Workshop on Automated Face- and Gesture-Recognition. Zurich, 1995. - P. 18-23.

4. Grabisch M., Roubens M. Application of the Choquet Integral in Multicriteria Decision Making // In Fuzzy Measures and Integrals. 2000. - P. 415-434.

5. Marichal J. On Choquet and Sugeno Integrals as Aggregation Functions // In Fuzzy Measures and Integrals. 2000. - Vol. 40. - P. 247-272.

6. Popescu M., Keller J. M., Mitchell J. A. Fuzzy Measures on the Gene Ontology for Gene Product Similarity // IEEE/ACM transaction on computational biology and bioinformatics. 2006. - Vol. 3. - P. 74-82.

7. Алфимцев А. H., Лычков И. И. Метод обнаружения объекта в видеопотоке в реальном времени // Вестник ТГТУ. 2011. - Т. 17, № 1. - С. 44-55.

8. Chen Y., Zhao Y. Face Recognition Using DCT and Hierarchical RBF Model // Proc. of IDEAL. Berlin, 2006. - P. 355-362.

Статья поступила в редакцию 19.10.2011

i Надоели баннеры? Вы всегда можете отключить рекламу.