Научная статья на тему 'Сравнение алгоритмов обнаружения и локализации лиц на изображении'

Сравнение алгоритмов обнаружения и локализации лиц на изображении Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
672
107
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бузаев Д.В., Носов А.В., Зотин А.Г.

Рассмотрены следующие алгоритмы для нахождения лица на изображении: алгоритм Виолы-Джонса, сегментация изображения на основе кожных участков априорным методом.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Бузаев Д.В., Носов А.В., Зотин А.Г.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Сравнение алгоритмов обнаружения и локализации лиц на изображении»

Секция «Информатика и вычислительная техника»

УДК 004.932

Р. М. Буженко Научный руководитель - А. Г. Зотин Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

МЕТОДИКА И ПРОБЛЕМЫ СОЗДАНИЯ ДОПОЛНЕННОЙ РЕАЛЬНОСТИ

Сегодня технологии позволяют считывать изображение окружающей действительности при помощи камер и понимать его при помощи алгоритмов распознавания образов. Желание людей добавить в этот мир что-то несуществующее или даже невозможное стало предпосылкой для появления технологии дополненной реальности.

Дополненная реальность - область исследований, ориентированная на использование компьютеров для совмещения реального мира и данных, сгенерированных компьютером.

На сегодняшний день, большинство исследований в области дополненной реальности сконцентрировано на использовании живого видео, подвергнутого цифровой обработке и «дополненного» компьютерной графикой. Более серьезные исследования включают использование отслеживания движения объектов, распознавание координатных меток при помощи машинного зрения и конструирование управляемого окружения состоящего из произвольного количества сенсоров и силовых приводов.

Изображение или видеопоследовательность проходит несколько этапов обработки в процессе его дополнения. Поскольку основной задачей дополненной реальности является синтез реальных и виртуальных объектов в пространстве, то первым этапом является предварительная оцифровка данных об окружающем пространстве. Работа здесь ведется по двум направлениям: съемка «карты глубин» (depth sensing) в реальном масштабе времени и предварительный сбор информации о местности [1].

Комбинация гироскопа и компаса дает удовлетворительные результаты, а если добавить к ним распознавание изображений заранее известных элементов ландшафта - точность возрастает до пиксельного уровня.

Следующий этап заключается в построении дополняющих объектов с учетом всех особенностей

сцены. Этот этап не представляет сложности в реализации с учетом того, что на первом этапе было собрано достаточное количество реальной информации об окружающем пространстве [2].

Связующим этапом является отслеживание взаимодействий пользователя с дополняющей реальностью такие как изменение положения объектов в соответствии с изменением позиции наблюдателя, физическое взаимодействие наблюдателя с объектами дополняющей реальности.

Кроме проблем технологического характера при создании дополненной реальности возникает реальная угроза «перегруженности кадра» - угроза слишком большого объема выводимой информации, когда в поле зрения одновременно попадают сотни значащих объектов, наложения виртуальных элементов на важные для пользователя объекты реального мира.

Библиографические ссылки

1. Hayashi T., Uchiyama H., Pilet J., Saito H. An Augmented Reality Setup with an Omni directional Camera Based on Multiple Object Detection / IEEE Computer Society, Washington, DC, USA, 2010. P. 202-215.

2. Zhang D., Ong S.K., Shen Y, Nee A.Y.C. An Affordable Augmented Reality Based Rehabilitation System for Hand Motions / IEEE Computer Society, Washington, DC, USA, 2010. P. 178-190.

© Буженко Р. М., Зотин А. Г., 2011

УДК 004.932.2

Д. В. Бузаев, А. В. Носов Научный руководитель - А. Г. Зотин Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

СРАВНЕНИЕ АЛГОРИТМОВ ОБНАРУЖЕНИЯ И ЛОКАЛИЗАЦИИ ЛИЦ

НА ИЗОБРАЖЕНИИ

Рассмотрены следующие алгоритмы для нахождения лица на изображении: алгоритм Виолы-Джонса, сегментация изображения на основе кожных участков априорным методом.

Если существует задача распознать или узнать лицо на изображении, первым шагом следует обнаружение лица [2]. Количество лиц, информация о присутствии полезны для систем безопасности, систем обнаружения

посторонних лиц. Для решения подобного рода задач (обнаружение лица) будет рассмотрено два алгоритма.

Алгоритм Виолы-Джонса [1; 3]. Данный метод основан на усилении простых классификаторов (кас-

Актуальные проблемы авиации и космонавтики. Информационные технологии

кадов) [2]. Усиление простых классификаторов - подход к решению задачи классификации (распознавания), путем комбинирования примитивных «слабых» классификаторов в один «сильный».

Признак, используемый для анализа изображения можно представить кортежем

РеаШге(оособеннсть) = {T, O, S}

где Т - тип признака; О - координата левого верхнего угла признака; S - размер признака по горизонтали и вертикали в пикселях.

Сегментация изображения на основе кожных участков (априорный метод) [3; 4].

Идея данного подхода заключается в том, что вместо того, чтобы обрабатывать весь кадр целиком, можно определить области, в которых существует вероятность обнаружения лица. При сегментации используют различные цветовые пространства (HSV, HLS, YCbCr). В качестве модели цвета кожи используют явно заданный многоугольник в заданном цветовом пространстве, то есть заранее задается некоторый жесткий набор правил. В последствии исходя из набора правил на изображении выделяется лицо.

Алгоритм Виолы-Джонса достаточно устойчив (около 20 градусов) к поворотам изображения. Слу-

чайные, ложные обнаружения, в отличие от истинных лиц, не обладают такой устойчивостью. Является одним из лучших по соотношению показателей эффективность локализации лица/скорость работы. Алгоритм обладает крайне низкой вероятностью ложного обнаружения лица.

Было реализовано тестовое программное обеспечение, которое показало целесообразность применения применение алгоритма Виолы-Джонса. Так как алгоритм подходит не только для обнаружения лиц, но и для локализации любых объектов.

Библиографические ссылки

1. Viola J. Robust Real-time Object Detection, IJCV 2001 See pages 1,3.

2. Jain A. K., Flynn P. and Ross A. A (2007). Handbook of Biometrics.

3. Гонсалес Р., Вудс Р., Цифровая обработка изображений. М. : Техносфера, 2005, 2006. 1072 с.

4. Понс Д., Форсайт Ж. Компьютерное зрение. Современный подход. М. : Изд. дом «Вильямс», 2004.

© Бузаев Д. В., Носов А. В., Зотин А. Г., 2011

УДК 004.932

В. В. Буряченко Научный руководитель - А. Г. Зотин Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

АЛГОРИТМ СТАБИЛИЗАЦИИ ВИДЕО, ОСНОВАННЫЙ НА БЛОЧНОМ МЕТОДЕ С ПРИМЕНЕНИЕМ МОДЕЛИ ГАУССОВОГО РАСПРЕДЕЛЕНИЯ

Рассмотрены подходы к стабилизации видео, такие как определение глобального движения кадра на основании векторов движения, приведен алгоритм стабилизации видео, относящийся к методам соответствия блоков и использующий модель гауссового распределения, что позволяет находить минимальное расстояние с применением алгоритмов оптимизации математического ожидания.

Методы улучшения качества видео привлекают в последние годы все больший интерес. Неустойчивости и неожиданные колебания в видеопоследовательности, являющиеся неотъемлемой частью ручных и мобильных видеокамер, значительно ослабляют их производительность. Основная цель стабилизации видео заключается в удалении нежелательной вибрации движения, вызванной лицом, держащим камеру, или вследствие механического дрожания, и синтезу новых изображений последовательности, с учетом стабилизации траектории движения камеры. В данной работе представлен алгоритм стабилизации видео.

В различных публикациях предложены подходы для оценки движения, такие как рекурсивные растровые алгоритмы, алгоритмы частотной области, алгоритмы оптического потока, и методы соответствия блоков [1].

Рекурсивные растровые алгоритмы полагаются на итеративное совершенствование оценки движения для отдельных элементов растра градиентными методами, предсказывая рекурсивное смещение каждого элемен-

та растра от его соседних элементов. Частотные методы оценки движения в основном используются для глобальной оценки движения кадра. Наиболее известный из частотных методов, это фазовый метод корреляции, который использует Фурье преобразование. Методы оптического потока гарантируют высокую точность для сцен с маленькими смещениями, но допускают сбои, когда смещения являются большими. Алгоритмы соответствия блоков оценивают движение на основании прямоугольных блоков и производят один вектор движения для каждого блока. Эти алгоритмы являются более подходящими для аппаратной реализации из-за их настраиваемости и простоты.

В ходе исследования было выяснено, что частотные методы и методы оптического потока работают недостаточно точно, а растровые алгоритмы сложны для реализации и неудовлетворительны по скорости расчетов. Наиболее быстрым и приемлемым по качеству функционирования является метод соответствия блоков, в связи с этим он был выбран за основу разрабатываемого алгоритма. Предлагается использова-

i Надоели баннеры? Вы всегда можете отключить рекламу.