Научная статья на тему 'Оценка размытия изображения для биометрической идентификации'

Оценка размытия изображения для биометрической идентификации Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
394
37
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АЛГОРИТМ ВИОЛЛА-ДЖОНС / OPENCV / РАЗМЫТИЕ ПО ГАУССУ / ОЦЕНКА УСТОЙЧИВОСТИ И ТОЧНОСТИ ОПРЕДЕЛЕНИЯ СУБЪЕКТА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Романенко Андрей Олегович, Юфряков Александр Владимирович

В статье описывается исследование алгоритма определения и распознавания человеческого лица, а также ставится эксперимент с целью выявить устойчивость указанного алгоритма для определения степени достаточности качества изображений для идентификации субъекта.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Романенко Андрей Олегович, Юфряков Александр Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Оценка размытия изображения для биометрической идентификации»

ТЕХНИЧЕСКИЕ НАУКИ

ОЦЕНКА РАЗМЫТИЯ ИЗОБРАЖЕНИЯ ДЛЯ БИОМЕТРИЧЕСКОЙ

ИДЕНТИФИКАЦИИ

1 2 Романенко А.О. , Юфряков А.В.

1Романенко Андрей Олегович - магистрант, кафедра прикладной математики и высокопроизводительных вычислений, высшая школа информационных технологий и автоматизированных систем;

2Юфряков Александр Владимирович - доцент, кандидат физико-математических наук, Северный (Арктический) федеральный университет, г. Архангельск

Аннотация: в статье описывается исследование алгоритма определения и распознавания человеческого лица, а также ставится эксперимент с целью выявить устойчивость указанного алгоритма для определения степени достаточности качества изображений для идентификации субъекта.

Ключевые слова: алгоритм Виолла-Джонс, ОрепСУ, размытие по Гауссу, оценка устойчивости и точности определения субъекта.

Введение

Задача распознавания лиц — часть практического применения теории распознавания образов. Эта способность считается основным свойством биологических существ, в то время как компьютерные системы этим свойством в полной мере не обладают.

Когда происходит фиксация изображения при помощи видеокамеры, как правило, сохраняется несколько изображений данного объекта. Большинство из них не приспособлены для системы биометрической идентификации, так как часто возникают искажения вида частичного или полного размытия изображения.

Вследствие чего обучение, тестирование и проверка валидации нейронной сети будет происходить совершенно по-разному, так как изображения, полученные с фотокамер с высоким или с низким качеством изображения, различаются, имеют разную степень размытия. Правильная настройка фокуса так же имеет огромную значимость, так как чем точнее обучающая выборка аппроксимирует генеральную совокупность изображений, которые будут поступать на вход вашей системе, тем выше будет предельно достижимое качество результата.

Таким образом, актуальной задачей для идентификации человека является определение степени допущения искажения изображения для обучения нейронной сети.

Целью исследования является оценка устойчивости указанного алгоритма для определения степени достаточности того, чтобы после обучения на заданном датасете происходила идентификация человека.

Подход исследования будет основан на внесении искажения во входные изображения -размытие по Гауссу, а сам алгоритм распознавания будет реализован на комбинации метода Виолы-Джонса, объект распознавания лиц LBPHFaceRecognizer библиотеки ОрепС^ нормализация лица с помощью библиотеки dlib.

1. Принцип работы тестируемого алгоритма

Первоначально происходит быстрое сканирование изображения с помощью детектора лица Виолы-Джонс [1]. Метод хорошо работает при наблюдении объекта под наклоном в 30 С. При угле наклона больше 30 С вероятность обнаружения лица резко падает. Для того, чтобы найти лицо, необходимо выделить его основные компоненты, такие как нос, глаза, губы. Для этого будут использоваться примитивы Хаара подобных характеристик, представляющих собой результат сравнения яркостей в двух прямоугольных областях изображения.

В расширенном методе Виолы-Джонса, представленного в библиотеке OpevCV, используются кроме стандартных признаков рис. 1 ещё дополнительные признаки рис. 2.

Рис. 1 Стандартные признаки Хаара Рис. 2 Дополнительные признаки

Вычисляемое значение такого признака будет:

F = U - V,

где U - сумма значений яркостей точек, закрываемые светлой частью признака, а V -сумма значений яркостей точек, закрываемых темной частью признака.

Для расчета яркости пикселей прямоугольных участков используется интегральное представление [2].

Интегральное представление изображения представляет собой матрицу, совпадающую по размерам с исходным изображением. В каждом ее элементе хранится сумма интенсивностей всех пикселей, находящихся левее и выше данного элемента. Элементы матрицы рассчитываются по следующей формуле:

I (х,у) = Ъ

где 1(х,у) - значение точки (х,у) интегрального изображения; 1(х,у) - значение интенсивности исходного изображения [3].

Каждый элемент матрицы 1(х,у) представляет собой сумму пикселей в прямоугольнике от 1(0,0) до 1(х,у), т. е. значение каждого элемента 1(х,у) равно сумме значений всех пикселей левее и выше данного пикселя 1(х,у). Расчет матрицы занимает линейное время, пропорциональное числу пикселей в изображении и его можно производить по следующей формуле:

1(х,у) = 1(х,у) - 1(х-1,у-1)+1(х,у-1)+1(х-1,у)

Интегральное представление позволяет быстро рассчитывать суммарную яркость произвольного прямоугольника на данном изображении, причем какой бы прямоугольник не был, время расчета неизменно.

Предварительно обученный детерток определения антропометрических точек внутри библиотеки ШШ используется для оценки местоположения 68 точек с координатами (х,у), которые сопоставляются с лицом. Благодаря этому, вращение, масштабируемость и сдвиги изображения оказались отцентрованы лучше.

Одним из видов искажение изображения был было выбрано - размытие по Гассу.

Само размытие по Гауссу — это характерный фильтр размытия изображения, который использует нормальное распределение (также называемое Гауссовым распределением, отсюда название) для вычисления преобразования, применяемого к каждому пикселю изображения. Уравнение распределения Гаусса в N измерениях имеет вид:

где г — это радиус размытия, г 2 = и 2 + V 2, с — стандартное отклонение распределения Гаусса. В случае двух измерений эта формула задает поверхность, имеющей вид концентрических окружностей с распределением Гаусса от центральной точки. Пиксели, где распределение отлично от нуля используются для построения матрицы свертки, которая

17

применяется к исходному изображению. Значение каждого пикселя становится средне взвешенным для окрестности. Исходное значение пикселя принимает наибольший вес (имеет наивысшее Гауссово значение), и соседние пиксели принимают меньшие веса, в зависимости от расстояния до них.

После загрузки данных и их искажения, происходит обучение модели обнаружения лица и создается объект распознавания лиц при помощи LBPHFaceRecognizer.

2. Эксперимент

Для распознавания лиц на изображениях и видеопоследовательностях в реальном времени на языке Python с использованием библиотеки OpenCV разработано программное обеспечение. База содержит 250 изображений лиц различных людей, по 50 изображений каждого лица. При формировании базы данных размер изображений и условия съемки были одинаковы, применялся 24 битный формат jpeg. В базе содержатся снимки людей мужского и женского пола, а также отражены изменения внешности человека: различные прически, присутствие очков.

Все изображения из тестового набора подвергались искажению с определенным значением параметра, определяющего силу воздействия последнего рис. 3.

User.1.12 User.1.13 User.1.14 User.1.15 User.1.16

и Н И а а

User.-I.23 User.-I.24 User.-I.25 User.-I.26 User.-I.27

Рис. 3. Пример искажения изображения

Алгоритм LBPHFaceRecognizer использует параметры 1,8,8,8,120. Первых две характеристики задают окрестности пикселя. Следующие параметры (8,8), характеризуют размеры областей на которые мы разбиваем исходное изображение с лицом. Чем оно меньше, тем больше будет таких областей и тем качественнее распознавание. Пороговое значение переобучения задается 120. Запускается функция тренировки и после проведения обучения модели обнаружения лица получится файл, который будет использоваться для распознавания новых лиц.

Данный алгоритм поддавался распознаванию субъекта до расширения высоты и ширины ядра гаусса <21 пикселя, при этом стандартное отклонение в направлениях sigmaX и были заданы 0 и равнялись значению размеров ядра.

Заключение

Рассматриваемая система распознавания относительно не устойчива к размытию по Гауссу, о чем свидетельствует падение точности определение субъекта. При использовании функции фильтра GaussianBlurO из заданной функции библиотеки ОрепСУ и увеличении ядра больше 21 пикселя заданный алгоритм перестает распознавать образ в видеопотоке.

Важно отметить, что порог является критическим параметром для правильного распознавания и данный эксперимент показывает, что чёткость изображения является одним из важных факторов для распознавания. Для улучшения изображения можно использовать метод от отобратного по методоу Гаусса: использовать в матрице коэффициенты отрицательного значения, равные -1. Эта матрица позволит увеличить разницу значений на границах изображения.

Список литературы

1. Viola P., Jones M.J. Rapid object detection using a boosted cascade of simple features // IEEE Conf. on Computer Vision and Pattern Recognition. Kauai, Hawaii. USA, 2001. V. 1. P. 511-518.

2. Гонсалес P., Вудс Р. Цифровая обработка изображений. 3-е издание, исправленное и дополненное. М.: Техносфера, 2012. 1104 с.

3. Буй Тхи Тху Чанг, Фан Нгок Хоанг, В.Г. Спицын. Распознавание лиц на основе примерения метода Виоллы-Джонса, Вейвлет-преобразования и метода главных компонент // Известия Томского политехнического университета, 2012. Т. 320. № 5. С. 54-59.

4. Adrian Kaehler, Gary Bradski. Learning OpenCV 3 - O'Reilly Media, 2016. 973.

КАКИМ ДОЛЖЕН БЫТЬ «ИДЕАЛЬНЫЙ САЙТ» И С ЧЕГО НАЧАТЬ? Волчков А.Е.

Волчков Андрей Евгеньевич - студент магистратуры, направление: бизнес-информатика, профиль: управление электронным бизнесом и интернет-проектами, факультет математической экономики, статистики и информатики, Российский экономический университет Г.В. Плеханова, г. Москва

Аннотация: в статье рассматриваются основные этапы, которые помогут начинающему или действующему предпринимателю разобраться, из чего должен состоять сайт. Этапы несут рекомендательный характер. Ключевые слова: сайт, дизайн, структура сайта, концепция сайта.

На сегодняшний день иметь сайт у своей компании не то чтобы нужно, это просто необходимо. Ведь ни для кого не секрет, что мы живем в эпоху развивающихся интернет-технологий. И число разработанных, новых сайтов совершенно разных тематик в глобальной сети появляется с каждым днем все больше (если говорить о цифрах, то примерно 1 млн 750 тыс. в день). И каждый сайт строится на основе определенной структуры, с использованием конкретной базы и с необходимыми элементами, и сейчас Мы разберемся, как же должен выглядеть «Идеальный сайт».

На этапах развития собственного (или не очень) бизнеса, каждый предприниматель сталкивается с нуждой создать информационную страницу о своей компании и ее деятельности на рынке предоставления всевозможных услуг, так сказать, чтобы привлечь больше клиентов и не выглядеть глупо и не современно среди своих конкурентов. Для начала, давайте поймем, что же мы подразумеваем под словом «Идеальный».

«Идеальный сайт» - это сайт, на котором грамотно и красиво расположена нужная и полезная информация о виде деятельности компании и ее продуктах. Это сайт, на котором пользователю захочется остаться и прочитать все, что там есть и, возможно, заказать что-либо. Вам нужно понять, что такой сайт, это совокупность хорошо подобранных компонентов, и потеря, хотя бы одного из них грозит полным провалом.

Так что же это такое?

Во-первых, это отличное содержание, над которым трудился коллектив профессиональных копирайтеров, не писателей и журналистов, а именно копирайтеров, которые умеют и могут четко и ясно, с минимальным количеством слов, донести до пользователя главную идею сайта. Тоже самое касается и контент-менеджеров. Стоит отметить, что неуникальный контент (украденный с других сайтов) не даст высоких позиций в поиске, а, вероятнее, напротив создаст проблемы. Более того, это будет выглядеть подозрительным, если потенциальный клиент, перейдя на сайт Вашей компании,

19

i Надоели баннеры? Вы всегда можете отключить рекламу.