УДК 004.93
Д. Н. Заварикин, А. А. Кадейшвили, С. В. К о р о б к о в а, А. Ю. Соколов, О. В. Степаненко, А. К. Цискаридзе, А. С. Тумачек
БИОМЕТРИЧЕСКИЕ ТЕХНОЛОГИИ КОМПАНИИ "ВОКОРД"
Определены области применения систем некооперативной биометрической идентификации людей (на стадионах, вокзалах, пограничных контрольных пунктах, в аэропортах, общественных учреждениях и пр.), а также выполнена общая постановка задачи создания систем контроля, построенных на принципах биометрии. При данном уровне развития технологий решение этой задачи возможно только на основе принципов биометрической идентификации личности по изображению лица. Приведены параметры разработанных систем распознавания личности на основе изображений лица и его реконструированной 3D-модели.
E-mail: [email protected]; [email protected]; [email protected]; [email protected]; [email protected]; [email protected]
Ключевые слова: биометрические технологии, некооперативное распознавание, распознавание личности, реконструкция, трехмерное распознавание, обеспечение безопасности.
Биометрические технологии активно применяются во многих областях, связанных с обеспечением безопасности различных объектов, доступа к информации и материальным объектам, а также в задачах уникальной идентификации личности.
Среди биометрических методов распознавания личности можно выделить кооперативные методы — методы, требующие взаимодействия системы распознавания и человека (распознавание по радужной оболочке глаза, по отпечаткам пальца и т.д.), а также некооперативные методы. Для систем, использующих некооперативные методы распознавания личности, не требуется взаимодействия системы и человека, что позволяет применять такие системы в достаточно широком круге практических приложений.
Компания "Вокорд" специализируется на разработке и производстве некооперативных систем распознавания личности. Среди областей применения таких систем можно выделить:
• места массового пребывания людей: площади, стадионы, торговые центры, кинотеатры, концертные залы;
• транспортные узлы: аэропорты, вокзалы, автостанции;
• пограничные паспортно-визовые контрольные пункты;
• проходные и контрольно-пропускные пункты;
• общественные учреждения.
Компания "Вокорд" разработала систему для контроля обстановки на транспортном узле, фиксации всех пассажиров, пересекающих рубежи контроля транспортного узла, при этом система практически не влияет на основную функцию транспортного узла — эффективную (комфортную и максимально быструю) перевозку пассажиров.
Разработанная система является системой некооперативной биометрической идентификации пассажиров по изображениям лиц в зонах контроля транспортного узла.
Выделим следующие преимущества идентификации по изображениям лиц: возможность полной некооперативности (не требует никаких специальных действий от пассажиров); высокая достоверность; эффективность работы "в связке с человеком" (так как изображение лица — основной способ бесконтактного узнавания человека человеком).
Используемое оборудование. В биометрических системах используются камеры высокого разрешения, разработанные в компании "Вокорд" (рис. 1). Благодаря высокому разрешению и качеству изображения существенно повышается эффективность работы алгоритмов видеоанализа, а это дает возможность создавать системы безопасности более высокого уровня.
Высокое разрешение камеры УОСОКО №1Саш позволяет одной камерой заменить несколько аналоговых камер (например, модель №1Саш 51С14Ь по разрешению изображения эквивалентна 12 аналоговым камерам). Это особенно актуально при охране больших территорий, где требуется расстановка множества видеокамер, прокладка большого числа кабелей и т.д.
Возможность синхронного получения изображения одновременно с нескольких камер позволяет использовать камеру УОСОКО №Юат в задачах машинного и ЗБ-зрения. Новое поколение камер с высокой точностью синхронизации позволяет достичь высокой точности реконструкции формы объектов в поле зрения камер.
Двумерное распознавание личности. Компанией "Вокорд" был разработан аппаратно-программный комплекс УОСОКО БасеСоПго!,
Рис. 1. Камеры высокого разрешения компании "Вокорд"
предназначенный для автоматического некооперативного выделения изображений лиц из панорамного видеопотока и их последующего распознавания.
Некооперативность распознавания — это отличительная особенность системы VOCORD FaceControl, работающей c использованием камер высокого разрешения VOCORD NetCam. Системе некооперативного распознавания личности для выделения изображения лица не требуется специального позиционирования человека в поле зрения видеокамеры. Более того, человек даже может и не предполагать, что находится в зоне видеонаблюдения.
Система VOCORD FaceControl предназначена для выполнения следующих задач:
• автоматическое выделение и сопровождение лиц в поле зрения видеокамеры;
• автоматическое формирование базы фотографий лиц, попавших в поле зрения камеры;
• обеспечение двух режимов системы выделения изображений лиц: сохранение видеоизображения лица в течение всего времени нахождения в области видимости, сохранение одного наилучшего скриншота для каждого лица;
• автоматическое распознавание личности по результатам сравнения с базой эталонных изображений лиц;
• трансляция видеоизображений по сети.
Основным преимуществом системы является высокое качество регистрируемых изображений лиц. Это достигается за счет использования камер VOCORD NetCam с разрешением от 1,3 до 11 мегапикселей.
В системе VOCORD FaceControl применяются методы распознавания личности по двумерному изображению лица с высоким разрешением, используются серии изображений лиц для распознавания, а также разработаны эффективные методы предварительной обработки полученных изображений лиц (нормализация яркости, контраста, устранение паразитных бликов и контровой засветки), методы использования данных, полученных в инфракрасном диапазоне, и построения трехмерной модели лица человека.
Применение современных компьютерных платформ, технологий многоядерных, многопоточных и кластерных вычислений — все это дает новые возможности для обработки больших массивов видеоинформации. Алгоритмы цифровой обработки видеоданных оптимизируются для высокопроизводительных процессоров: Intel, GPU Nvidia/AMD-ATI.
В результате достигаются уникальные характеристики системы по быстродействию и достоверности получаемых результатов.
Система VOCORD FaceControl имеет открытый программный интерфейс для интеграции с внешними базами данных, а также может работать с различными модулями распознавания личности: "Cognitec", "BARS", "Asia-Soft" и др.
Трехмерное распознавание личности. Исходя из анализа современного состояния в области распознавания личностей, было принято решение использовать алгоритмы распознавания, работающие как с 3D-, так и с 2D-информацией о лице, что обеспечило достаточно высокие проценты распознавания [1-5] (рис.2).
В разработанной системе распознавания личности используется подход, позволяющий анализировать как форму лица, так и текстуру его поверхности. Таким образом, система распознавания личности использует сильные стороны обеих (2D и 3D) систем и позволяет устранить недостатки каждой из них, работающей по отдельности. Это позволяет достигнуть 98,5 % точности распознавания. Результаты по 2D- и 3D-распознаванию личности получаются независимо, после чего объединяются нейронной сетью, выдающей вероятность того, что оба изображения лица принадлежат одному и тому же человеку.
Для распознавания по форме лица изображения, получаемые с помощью четырех камер высокого разрешения, обрабатываются (поиск лица на изображении) и восстанавливается 3D-поверхность лица. Также с использованием восстановленной трехмерной поверхности лица формируется текстура лица для двумерного распознавания. Система распознавания личности включает в себя следующие этапы: реконструкцию 3D-поверхности лица и формирование текстуры;
Синхронные
датчики
изображении
Съюстированная
оптическая
система
Автомат и чести учет геометрии сцены
Рис. 2. Схема работы системы 3D + 2Б-распознавания лиц
3Б-распознавание лица; 2Б-распознавание по текстуре; объединение результатов 3D- и 20-распознавания.
Трехмерная реконструкция поверхности лица. Реконструкция выполняется с помощью четырех синхронизированных по времени камер с разрешением 1280х 1024, частотой кадров 12кад./с. Две пары камер расположены вертикально, что дает возможность размещать их на левой и правой сторонах пропускной системы. Расстояние между двумя камерами в паре составляет 20 см, между вертикальными парами около 1 м.
Для реконструкции используется алгоритм многоуровневого сопоставления корреляции, который позволяет достичь, во-первых, хорошего уровня надежности и инвариантности к несколько различным условиям освещения для каждой отдельной камеры, а во-вторых, благодаря присущему ему параллелизму, позволяет значительно ускорить вычисления при использовании графических процессоров. Особенностью алгоритма также является отсутствие необходимости в структурированном источнике света (например, лазерной подсветке), что позволяет делать реконструкцию на больших расстояниях между камерами и объектами.
Трехмерная реконструкция модели лица осуществляется поэтапно: построение 3D-поля точек по каждой камере и их объединение; предварительная фильтрация точек; построение триангулированной модели лица; совмещение нескольких поверхностей лица человека, полученных в разные моменты времени (видеоряд), в одну общую, объединенную 3D-модель.
Для триангуляции трехмерного поля точек мы используем метод 2.5D-триангуляции. Его идея заключается в проецировании этих точек на (двумерную) плоскость, построении триангуляции на плоскости и затем использовании полученной триангуляции в трехмерном пространстве. Данный метод значительно превышает методы трехмерной триангуляции по соотношению надежности и производительности. Так, в нашем случае на построение триангуляции затрачиваются лишь сотые доли секунды.
Задачу поиска соответствий точек можно решать независимо для разных точек изображений. Такая особенность алгоритма позволила значительно ускорить процесс поиска благодаря применению параллельных вычислений на графическом процессоре. Так, реконструкция области 500x500 пикселей (характерный размер лица в кадре) с шагом 4 пикселя для двух камер на процессоре Intel Core2 Q6600 2,4 ГГц занимает 5,1 с, а на видеокарте NVIDIA GTX260 — 0,17 с. Таким образом, процесс поиска соответствий точек изображений ускорился в 30 раз.
Реконструкция проводится в условиях минимальной освещенности (400-600 лк) на расстоянии до 2,5 м от камер. Используя камеры более высокого разрешения (которые становятся все более доступными), можно выполнять реконструкцию на еще больших расстояниях.
Трехмерное распознавание. Распознавание личности выполняется в два этапа: быстрое сравнение по базе данных с использованием вектора признаков лица небольшой длины; уточнение результата по отобранным нескольким наиболее похожим изображениям лиц из базы данных.
Система 3Б распознавания, разработанная в компании "Вокорд", также может использовать приведение 3Б-поверхности к форме, более устойчивой при мимических искажениях [6, 7].
После получения 3Б-модели лица рассчитывается набор биометрических признаков по его форме.
Двумерное распознавание личности по текстуре лица. Для 2Б-распознавания используется синтетическое изображение лица, полученное путем накладывания текстуры на 3Б-поверхность и довора-чивания лица до фронтального ракурса. Далее выравнивается яркость изображения лица и приводится к уровню, заданному экспериментальным образом на достаточно большой выборке.
Для распознавания полученного изображения используется набор классификаторов:
— РСА;
— основанных на собственных фильтрах;
— использующих фильтры Габора;
— двумерных РСА — 2БРСА;
— использующих самоорганизующиеся карты Кохонена;
— использующих локальные бинарные шаблоны (ЬВР).
Для обработки нейросетевым классификатором генерируются векторы разностных признаков, причем для каждого признака берется абсолютное значение разности для обеспечения симметричности классификаторов. Выход каждого нейросетевого классификатора — значение от 0 до 1 — оценка вероятности совпадения двух лиц для данного классификатора.
Выходы отдельных классификаторов (выдаваемые ими вероятности совпадения двух лиц на входе) поступают на вход интегрального классификатора, который выдает окончательное решение для системы 2Б-классификации.
Обучение отдельных классификаторов и интегрального классификатора проводилось по выборкам из порядка 700 000 разностных признаков, полученных после анализа синтетических изображений лиц базы данных, собранной компанией "Вокорд".
Тестирование проводилось на базе данных лиц (текстуры + трехмерные модели), собранных компанией "Вокорд". Достигнута точность корректного распознавания 98,5% в точке FAR = FRR. График ROC-кривой комбинированного 2D-и SD-распознавания приведен на рис. 3. Разработанная система достаточно устойчива к разным ракурсам (поворотам, наклонам) лица, а также к изменению выражения лица и частичному перекрытию его небольших участков (участок не должен содержать ключевых областей, таких как глаза, рот, иначе не будет найдено лицо на изображении).
Разработанный алгоритм также устойчив к поворотам лица в пределах +50° ... — 30о вверх-вниз, и примерно ±30° влево-вправо.
Разработанный алгоритм распознавания личности устойчив к маскировочной раскраске лица.
На рис.4 приведено лицо без раскраски, которое было использовано в качестве примера базы данных, и лицо с раскраской, используемое в качестве тестового. Данное лицо было использовано в качестве тестового примера. При сравнении тестового изображения лица и изображения лица из базы данных системой Vocord раскрашенное лицо было распознано благодаря использованию информации о 3D-поверхности лица.
Распознавание мимики и психофизического состояния человека. Анализ 3D-формы дает возможность распознавать разные эмоции человека. Была исследована возможность распознавания улыбки (рис. 5). При формировании вектора признаков по форме лица рас-
Рис. 3. ROC кривая системы 2D + 3D-распознавания лиц
Рис. 4. Пример лица с маскировочной раскраской, распознанного системой
Рис. 5. Использование разложения по собственным векторам для анализа мимики
сматривали разложение по собственным векторам. Оказалось, что ряд компонентов такого разложения отвечает за выражение лица [8-10].
Также возможно применение нейро сетевого анализа для распознавания улыбок. При этом возможно распознавание нескольких градаций от легкой улыбки до широкой.
Реконструкция трехмерной формы лица позволяет оценивать и другие важные параметры, среди них такой, как направление зрения человека. Определение направления зрения человека осуществляется путем реконструкции формы зрачков.
Контроль подлинности предъявляемого лица. Биометрическая система должна быть устойчивой к подделке (несанкционированному доступу). Система распознавания по 2Б-изображению лица может быть легко обманута предъявлением фотографии "правильного" человека из числа "знакомых" системе.
Наиболее устойчивой к подделке в настоящее время представляется технология распознавания личности по трехмерному изображению лица. Для того чтобы обмануть такую систему, потребовалось бы изготовить точную твердотельную маску лица, повторяющую во всех деталях его геометрию. Если система трехмерного распознавания работает в реальном времени, то она может легко включать в себя проверку на естественные микродвижения лица, которые имитировать с помощью твердотельной маски крайне трудно.
Для подтверждения виталентности лица на 2Б-изображении используется идентификация по тепловому портрету лица или тела человека в инфракрасном диапазоне.
Предложено также осуществлять термографию идентифицируемого лица для выявления уникальности распределения на лице артерий, снабжающих кожу теплой кровью.
Макет системы распознавания и его применения для обеспечения безопасности. Рассмотрим работу системы в условиях Московского метрополитена (рис. 6, 7). Требуется обеспечить своевременное распознавание личности, представляющей угрозу безопасности населения, а также быстрое реагирование в случае обнаружения такой личности.
При использовании системы идентификации лиц в условиях метрополитена возможно использовать ряд методов инженерии поведения.
Предлагаемая схема расположения видеокамер и проходных пунктов для идентификации личности представлена на рис. 6. На рубежах контроля проводится анализ получаемых данных (детектирование попыток прохода без билета, поиск разыскиваемых личностей, анализ траекторий, детектирование нештатных ситуаций и др.). Также целесообразной является установка наблюдения на эскалаторных лестницах. Это позволит достаточно точно проводить детектирование, анализ и распознавание личности (так как пассажиропоток в данном случае управляем), а также оперативно реагировать на нештатные ситуации на противоположном конце эскалатора. Среднее время прохода человека по эскалатору составляет около 3 мин.
Заключение. Компания "Вокорд" разработала систему УОСОКО БаееСопйО для контроля пассажиропотоков. Система способна автоматически выделять и сопровождать лица в поле зрения камеры, формировать базу данных фотографий пассажиров, распознавать лица по результатам сравнения с базой данных эталонных изображений, транслировать изображения по сети в ситуационные центры. Для получения снимков людей применяются 1Р-камеры высокого разрешения, которые были разработаны компанией "Вокорд" специально для системы УОСОКО БаееСоПтЫ.
Система УОСОЯБ БаееСопйО имеет развитые средства интеллектуального видеоанализа — распознавание пристраивания пассажиров при проходе через турникеты и прохода пассажиров без билетов, сбор статистики о пассажиропотоке, детектирование личностей, находящихся в поиске, фиксация нарушений нормального порядка движения и нештатных ситуаций, например, остановки движения пассажиропотока.
Однако на смену биометрии, основанной на плоских изображениях, приходят биометрические системы нового поколения, выполняющие реконструкцию трехмерных моделей по стереоизображениям. На основе этой технологии разработана система распознавания
Выход из подземного вестибюля направо в подуличный переход к автовокзалу -автобусов пригородного сообщения '
Выход из подземного вестибюля налево к автовокзалу автобусов пригородного сообщения
Рис. 6. Организация биометрической системы контроля в Московском метрополитене
Рис. 7. Макет рубежа контроля для транспортного узла
личности, использующая как ЗБ-информацию, так и 2Б-текстуру лица. Это позволяет существенно повысить точность распознавания личности.
СПИСОК ЛИТЕРАТУРЫ
1. Hesher C., Srivastava A. and Erlebacher G. A novel technique for face recognition using range imaging // International Symposium on Signal Processing and Its Applications, 2003. - P. 201-204.
2. Kim T. and K i 111 e r J. Locally linear discriminant analysis for multimodally distributed classes for face recognition // IEEE Transactions on Pattern Analysis and Machine Intelligence. - 2005. - Vol. 27(3). - P. 318-327.
3. Blanz V., Grother P., Phillips J. and Vetter T. Face recognition based on frontal views generated from non-frontal images // IEEE Conf. on Computer Vision and Pattern Recognition (CVPR). - 2005. - P. 454-461.
4. Moreno A., Sanchez A., Velez J. and Diaz F. Face recognition using 3D surface extracted descriptors // The Irish Machine Vision and Image Processing Conference, 2003.
5. Chang K., Bowyer K. and Flynn P. Face recognition using 2D and 3D facial data // Multimodal User Authentication Workshop. - 2003. - P. 25-32.
6. B r o n s t e i n A., B r o n s t e i n M. and K i m m e l R. Expression-invariant 3D face recognition // International Conf. on Audio- and Video-Based Person Authentication, 2003. - P. 62-70.
7. Bronstein A., Bronstein M. and K i m m e l R. Three-dimensional face recognition // International J. of Computer Vision. - 2005. - Vol. 64. - P . 5-30.
8. Papatheodorou T. and Rueckert D. (2007). 3D face recognition // Face recognition. - Vienna, Austria, 2007. - P. 417-423.
9. http://www.cognitec-systems.de/Face VACS-SDK.19.0.html
10. Кязимов Т. Г., Махмудова Ш. Д. (2009) Об информационной идентификационной системе распознавания лиц по фотопортретам // Информационные технологии. - 2009. № 1. - С. 13-16.
Статья поступила в редакцию 9.08.2011