Научная статья на тему 'Применение метода Виолы-Джонса для детектирования людей в сложных сценах'

Применение метода Виолы-Джонса для детектирования людей в сложных сценах Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
350
44
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПОЗНАВАНИЕ ОБРАЗОВ / PATTERN RECOGNITION / ПЕШЕХОДЫ / PEDESTRIANS / МЕТОД ВИОЛЫ-ДЖОНСА / VIOLA-JONES OBJECT DETECTION / КАСКАД ПРИЗНАКОВ ХААРА / CASCADE OF HAAR FEATURES / ADABOOST

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Петров А. С.

Представлен пример использования метода Виолы-Джонса для детектирования людей в сложных сценах. Метод обучен с помощью алгоритма AdaBoost, проведено тестирование и представлены результаты тестирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Петров А. С.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

USING VIOLA-JONHES METHOD TO DETECT PEOPLE IN COMPLEX SCENES

This paper presents an example of Viola-Jones method for detecting people in complex scenes. The method was taught by the algorithm AdaBoost, testing is conducted and the results of testing are presented.

Текст научной работы на тему «Применение метода Виолы-Джонса для детектирования людей в сложных сценах»

Прогноз

260

Щ Количество В Пиния тренда

у = Ь0 + Ы*х

Ъ0 = 1 £>4.48484848485

Ы =23356643356643

Коэффициент корреляции г = 0.31152036128067 Значимость F = 1.006789871S111

Пример работы веб-приложения для прогнозирования рынка труда ИТ-специалистов

Данный проект был апробирован для анализа и решения задач прогнозирования спроса и предложения на рынке труда ИТ-специалистов в г. Красноярске (см. рисунок), а также принятия управленческих решений на основе прогнозируемых данных.

Библиографические ссылки

1. Орлов А. И. Эконометрика. 3-е изд. М. : Экзамен, 2004. 576 с.

2. Орлов А. И. Эконометрическая поддержка контроллинга // Контроллинг. 2002. № 1. С. 42-53.

3. Бородюк В. П., Лепцкий Э. К. Статистическое описание промышленных объектов. М. : Энергия, 1971. 156 с.

4. Плотников В. В. Основы эконометрики : учеб. материал. Владивосток : ДВГАЭУ, 2003.

5. Минзов А. С. Эконометрика. М. : Изд-во МФА, 2001. C. 54.

References

1. Orlov A. I. Jekonometrika. 3-e izd. M. : Jekzamen, 2004. 576 s.

2. Orlov A. I. Jekonometricheskaja podderzhka kontrollinga // Kontrolling. 2002. № 1. S. 42-53.

3. Borodjuk V. P., Lepckij E. K. Statisticheskoe opi-sanie promishlennih obektov. M. : Energiya, 1971. 156 s.

4. Plotnikov V. V. Osnovi ekonometriki. Uchebniy material. Vladivostok : DVGAEU, 2003.

5. Minzov A. S. Ekonometrika. M. : Izdatel'stvo MFA, 2001. S. 54.

© Панфилов И. А., Пен Т. В., 2015

УДК 004.93'12

ПРИМЕНЕНИЕ МЕТОДА ВИОЛЫ-ДЖОНСА ДЛЯ ДЕТЕКТИРОВАНИЯ ЛЮДЕЙ

В СЛОЖНЫХ СЦЕНАХ

А. С. Петров

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail: [email protected]

Представлен пример использования метода Виолы-Джонса для детектирования людей в сложных сценах. Метод обучен с помощью алгоритма AdaBoost, проведено тестирование и представлены результаты тестирования.

Ключевые слова: распознавание образов, пешеходы, метод Виолы-Джонса, каскад признаков Хаара, AdaBoost.

Решетнеескцие чтения. 2015 USING VIOLA-JONHES METHOD TO DETECT PEOPLE IN COMPLEX SCENES

A. S. Petrov

Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail: [email protected]

This paper presents an example of Viola-Jones method for detecting people in complex scenes. The method was taught by the algorithm AdaBoost, testing is conducted and the results of testing are presented.

Keywords: pattern recognition, pedestrians, Viola-Jones object detection, cascade of Haar features, AdaBoost.

На текущий момент в мире существует множество задач, в которых требуется обнаруживать людей в сложных сценах. Частным примером такой задачи является обнаружение людей в терминале аэропорта. Разные задачи обладают различными требованиями к быстродействию и вычислительным мощностям. При решении ряда задач можно использовать более ресурсоемкий и медленный алгоритм, дающий при этом повышенную точность, но в ряде задач такая возможность отсутствует, результат нужно получать практически в режиме реального времени и с минимальными затратами. Существующие методы обладают различными требованиями к ресурсам и различной точностью работы [1]. Одним из методов, который обладает низкими требованиям к ресурсам и приемлемой точностью работы, является метод Виолы-Джонса [2; 3]. В данной работе показано применение метода Виолы-Джонса для определения пешеходов на видеопоследовательности.

Для определения пешеходов на видеопоследовательности был реализован и обучен с помощью метода AdaBoost [4; 5] на наборе данных Caltech Pedestrian Detection Dataset [6]. Обучающая выборка содержала 10 тыс. изображений отдельных пешеходов и 5 тыс. изображений, не содержащих пешеходов. Итоговый каскад содержит 15 стадий, каждая из которых со-

держит от 17 до 221 признака, при этом количество признаков равномерно возрастает при увеличении номера стадии. Для тестирования были сформированы четыре тестовые выборки на основе данных, представленных в Caltech Pedestrian Detection Dataset. Описание выборок приведено в табл. 1.

Тестовая конфигурация: ЦП AMD A6 1,5 ГГц, 6 ГБ ОЗУ. Результаты тестирования приведены в табл. 2.

По результатам тестирования можно сделать вывод, что обученный каскад признаков Хаара совершает очень много ошибок при недостаточном освещении. Также много ошибок совершено при большом количестве людей, которые накладываются друг на друга на кадре. Данное поведение вызвано тем, что обучение происходило на выборке данных, состоящей из изображений отдельных пешеходов. Также следует отметить, что использование нескольких потоков для параллельной обработки кадров позволяет существенно увеличить количество кадров в секунду, при этом дополнительные расходы, накладываемые механизмом параллелизма, относительно невелики. Алгоритм показал удовлетворительные результаты обнаружения на видеопоследовательностях с ровным освещением, которые содержат отдельных пешеходов и небольшое количество групп пешеходов.

Таблица 1

Описание тестовых выборок

Номер видео Описание

1 Статическая сцена, ровное дневное освещение, среднее количество людей отдельно и группами, разрешение 640x480

2 Статическая сцена, приглушенное освещение, небольшое количество отдельных людей, разрешение 640x480

3 Статическая сцена, ровное дневное освещение, большое количество людей группами, разрешение 640x480

4 Статическая сцена, ровное дневное освещение, небольшое количество отдельных людей, разрешение 640x480

Таблица 2

Результаты тестирования

Номер выборки Количество кад ров в секунду, к/с Время на кадр, мс Правильно распознанные объекты, % Ошибки второго рода, ед./к

1 поток 2 потока 3 потока 4 потока

1 9,50 17,77 26,66 35,55 105 19 0,01

2 11,12 19,4 30,13 39,6 92 88 0,001

3 10,26 18,84 27,96 38,01 96 76 0,01

4 9,91 18,34 26,93 36,78 109 11 0,01

References

1. Enzweiler M. Monocular Pedestrian Detection: Survey and Experiments. Pattern Analysis and Machine Intelligence. 2009. Pр. 2179-2195.

2. Freund Y. A Short Introduction to Boosting. Shannon Laboratory, USA. 1999. Рp. 771-780.

3. Matas J. AdaBoost. Center for Machine Perception / Czech Technical University. Prague. 2010. Рp. 67-78.

4. Viola P., Jones M. J. Robust real-time face detection // International Journal of Computer Vision. 2004. Vol. 57, no. 2, рp. 137-154.

5. Viola P., Jones M. J. Rapid object detection using a boosted cascade of simple feature // Conference on Computer Vision and Pattern Recognition (CVPR). 2001. Рp. 511-518.

6. Caltech Pedestrian Detection Benchmark. Available at: http://www.vision.caltech.edu/Image_ Datasets (accessed: 10.6.2015).

© Петров А. С., 2015

УДК 004.932

БЫСТРЫЙ ЛОКАЛЬНЫЙ ДЕСКРИПТОР ДЛЯ КАТЕГОРИЗАЦИИ ИЗОБРАЖЕНИЙ

ПО ТИПУ СЦЕНЫ

А. В. Проскурин

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

Е-mail: [email protected]

Предложен метод Fast Dense Gauge Speeded-Up Features, вычисляющий набор локальных дескрипторов для всего изображения. Представлены экспериментальные результаты сравнения предложенного дескриптора с дескрипторами G-SURF и SURF.

Ключевые слова: категоризация сцен, локальные дескрипторы, G-SURF, SURF.

FAST LOCAL DESCRIPTOR FOR SCENE IMAGE CATEGORIZATION

A. V. Proskurin

Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation Е-mail: [email protected]

The author presents the method called Fast Dense Gauge Speeded-Up Features for calculation set of local descriptors for the whole image. The experiments show that the presented method has comparable precision of scene categorization with G-SURF descriptor, while its calculation is several times faster.

Keywords: scene categorization, local descriptors, G-SURF, SURF.

Активное распространение цифровых устройств со встроенными видеокамерами привело к экспоненциальному увеличению количества изображений, доступных пользователям в сети Интернет. Для изучения истории развития летательных аппаратов по снимкам необходимо провести автоматическую категоризацию изображений по типу сцены. Большинство алгоритмов, предложенных для решения данной проблемы, основано на представлении изображений в виде наборов визуальных слов (Bag-of-Visual-Words, BoVWs) [1], для формирования которых требуется вычисление локальных дескрипторов, таких как Speeded-Up Robust Features (SURF) [2]. В работе [3] было показано, что при категоризации изображений по типу сцены вычисление дескрипторов с использованием регулярной сетки эффективнее по сравнению с другими

детекторами. При этом увеличение пересечения областей, на которых вычисляются дескрипторы, повышает точность категоризации. Однако это приводит к значительному увеличению вычислительных затрат. Для решения этой проблемы в данной работе предложен метод Fast Dense Gauge Speeded-Up Features (FDG-SUF), являющийся модификацией дескриптора Gauge Speeded-Up Robust Features (G-SURF) [4] и вычисляющий набор локальных дескрипторов для всего изображения. Рассмотрим его подробнее.

Алгоритм FDG-SUF состоит из двух этапов: вычисление матрицы частей дескрипторов M и построение с ее помощью набора локальных дескрипторов. На первом этапе все изображение I разделяется сеткой на ячейки размером 5s х 5s пикселей, где s - масштаб. После этого в каждой ячейке для 5 х 5 равно-

i Надоели баннеры? Вы всегда можете отключить рекламу.