Научная статья на тему 'АНАЛИЗ И МОДИФИКАЦИЯ АЛГОРИТМОВ ДЕТЕКТИРОВАНИЯ ПЕШЕХОДОВ НА ЦИФРОВЫХ ИЗОБРАЖЕНИЯХ'

АНАЛИЗ И МОДИФИКАЦИЯ АЛГОРИТМОВ ДЕТЕКТИРОВАНИЯ ПЕШЕХОДОВ НА ЦИФРОВЫХ ИЗОБРАЖЕНИЯХ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
60
25
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕХНИЧЕСКОЕ ЗРЕНИЕ / ДЕТЕКТИРОВАНИЕ ПЕШЕХОДОВ / ДЕТЕКТОР ДАЛАЛА-ТРИГГСА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Приоров Андрей Леонидович, Хрящев Владимир Вячеславович, Никитин Анатолий Евгеньевич, Матвеев Дмитрий Вячеславович

Проведён обзор современных алгоритмов детектирования пешеходов на изображениях. Выполнена модификация детектора Далала-Триггса путём замены метода опорных векторов на алгоритм бустинга с начальными весами, инициализированными для усиления влияния сложных примеров. Проведён сравнительный анализ работы алгоритмов на унифицированных тестовых базах в условиях наличия на изображениях аддитивного белого гауссовского шума.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Приоров Андрей Леонидович, Хрящев Владимир Вячеславович, Никитин Анатолий Евгеньевич, Матвеев Дмитрий Вячеславович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ANALISIS AND MODIFICATION OF ALGORITHMS FOR PEDESTRIAN DETECTION IN DIGITAL IMAGES

The algorithms of pedestrian detection in digital images are widely used when developing video observation complexes, systems assisting a driver on the road, algorithms of computer vision and when searching images in the Internet. The existing techniques of pedestrian detection are mainly based on the image description with the help of various features. The algorithm of Dalal-Triggs demonstrates one of the best results among known algorithms of pedestrian demodulation. It uses histograms of oriented gradients as the features and the method of reference vectors as the classifier. Modification of Dalal-Triggs detector is done by substituting the method of reference vectors with the algorithm of boosting with initial weights initialized for increasing influence of complex examples. The modification of Dalal-Triggs algorithm allowed to improve accuracy (from 83 % to 93 % for images from INRIA Person base and from 65 % to 91 % for CVC-02 Pedestrian base) and completeness of detection (from 57 % to 66 % for images from INRIA Person base and from 25 % to 26 % for CVC-02 Pedestrian bases) of the original algorithm. The comparative operational analysis of the algorithms on the uniform test bases in the conditions of presence of additive white Gaussian noise in the images is conducted. The modified algorithm demonstrated larger stability to interferences of this kind.

Текст научной работы на тему «АНАЛИЗ И МОДИФИКАЦИЯ АЛГОРИТМОВ ДЕТЕКТИРОВАНИЯ ПЕШЕХОДОВ НА ЦИФРОВЫХ ИЗОБРАЖЕНИЯХ»

Телевизионные системы, передача и обработка изображений

УДК 621.391

АНАЛИЗ И МОДИФИКАЦИЯ АЛГОРИТМОВ ДЕТЕКТИРОВАНИЯ ПЕШЕХОДОВ НА ЦИФРОВЫХ ИЗОБРАЖЕНИЯХ

Приоров Андрей Леонидович

доктор технических наук, доцент Ярославского государственного университета имени П.Г. Демидова E-mail: andcat@yandex.ru.

Хрящев Владимир Вячеславович

кандидат технических наук, доцент Ярославского государственного университета имени П.Г. Демидова E-mail: vhr@yandex.ru.

Никитин Анатолий Евгеньевич

аспирант Ярославского государственного университета имени П.Г. Демидова E-mail: anatolynikitinyar@gmail.com.

Матвеев Дмитрий Вячеславович

аспирант Ярославского государственного университета имени П.Г. Демидова

E-mail: dcslab@uniyar.ac.ru.

Адрес: 150000, г. Ярославль, ул. Советская, 14.

Аннотация: Проведён обзор современных алгоритмов детектирования пешеходов на изображениях. Выполнена модификация детектора Далала-Триггса путём замены метода опорных векторов на алгоритм бустинга с начальными весами, инициализированными для усиления влияния сложных примеров. Проведён сравнительный анализ работы алгоритмов на унифицированных тестовых базах в условиях наличия на изображениях аддитивного белого гауссовского шума.

Ключевые слова: техническое зрение, детектирование пешеходов, метод опорных векторов, детектор Далала-Триггса.

Введение

При разработке комплексов охранного телевидения, видеонаблюдения, систем помощи водителю на дороге, алгоритмов компьютерного зрения и при поиске изображений в сети Интернет широко применяют алгоритмы детектирования человека (пешехода) на цифровых изображениях [1]. Система автоматического детектирования пешеходов по произвольному изображению на входе системы должна определить, имеются ли на этом изображении пешеходы, и если да, то указать, где они находятся и каков их размер.

Решение этой задачи сопряжено с рядом трудностей. Во-первых, детектору приходится иметь дело с изменением точки наблюдения, различным положением тела пешехода, одеждой, освещением. Во-вторых, неидеальные условия съёмки создают шум на изображении и мешают корректной работе детектора. В-третьих, фигура пешехода часто перекрывается посторонними предметами (другими людьми), и только часть объекта оказывается в окне детектора.

Требования к точности алгоритма поиска пешехода на изображении также могут широко варьироваться. Так алгоритм, разработанный

для работы в условиях неизменного положения камеры и постоянного фона, должен генерировать минимальное количество ошибок детектирования. В то же время для детектора, рассчитанного на широкий класс задач и большое разнообразие сцен, допустимо большее количество ложных срабатываний на областях фона. Настройка алгоритма детектирования применительно к определённой задаче осуществляется за счет обучения классификатора, разделяющего предоставленные ему изображения на два класса: «пешеход» и «не пешеход» [2].

Существующие на данный момент алгоритмы детектирования пешеходов преимущественно опираются на описание изображения через различные системы признаков. Впервые качественно проработанная система признаков для детектирования пешеходов на цифровых изображениях предложена в работе Орена [3] и основывалась на вейвлетах Хаара. В дальнейшем Папагеоргио и Поггио [4] использовали новую систему хааровских признаков для распознавания лиц, машин и фигур людей. Благодаря работам Виолы и Джонса [5] использование хааровских признаков стало де-факто стандартом в задаче распознавания объектов на изображениях, в особенности, в задаче детектирования лиц [6]. В настоящее время для задачи детектирования пешеходов на изображениях помимо хааровских стали использоваться новые наборы признаков, такие как SIFT (Scale-invariant feature transform) [7] и HOG (Histograms of Oriented Gradients) [8].

Ключевой особенностью SIFT-признаков является инвариантность к повороту, масштабированию и отражению изображения вокруг особой точки [1]. Шашуа и его коллеги [9] вручную разделили изображение человека на 13 областей и вычислили SIFT-подобные признаки для каждого выделенного на изображении участка тела человека, а затем, используя эти признаки для обучения классификатора на основе AdaBoost, создали систему обнаружения пешеходов для камеры движущегося автомобиля.

При формировании HOG-признаков вычисляются направления градиента функции интенсивности в областях изображения, предва-

рительно разбитого на блоки. Использование данных признаков в сочетании с классификатором на основе метода опорных векторов (МОВ) предложено Далалом и Триггсом [8] и позволило достичь степени детектирования пешеходов, недоступной более ранним алгоритмам. Позже Далал и Триггс расширили свой подход для обнаружения людей в видеопотоке с помощью вычисления гистограмм перемещения и появления [10]. Чжу и др. [11] построили каскад классификаторов, использующий систему HOG-признаков, для значительного ускорения метода Далала. Для детектирования человека возможен также подход на основе обнаружения отдельных частей тела, который направлен на борьбу со смещением положения тела или частичным закрытием фигуры человека [12].

В данной работе предлагается модифицированный алгоритм детектирования пешеходов на цифровых изображениях, основанный на детекторе Далала-Триггса. Приводится описание оригинального алгоритма и его модификации. Даётся информация о методике тестирования алгоритмов детектирования пешеходов и приводятся данные практического эксперимента по анализу эффективности разработанного детектора.

Алгоритм Далала-Триггса

Рассмотрим работу алгоритма Далала-Триггса [8], который демонстрирует один из лучших результатов среди известных алгоритмов детектирования пешеходов [13, 14]. На первой стадии работы алгоритма нужно сформировать обучающую выборку из изображений «пешеходов» и «не пешеходов» разрешением 64^128 пикселей и вычислить признаки. Каждое изображение в обучающем наборе делится на ячейки размером 8*8 пикселей. Из этих ячеек методом бегущего окна формируются пересекающие блоки размером 2*2 (т. е. 16*16 пикселей). Всего изображение разбивается на 7*15=105 блоков. Каждая ячейка представляется в виде вектора V = (^,у2,...,у9). Внутри ячейки для каждого из 64 пикселей вычисляются модуль и направление градиента.

Найденное значение модуля прибавляется к одной из координат вектора V . К какой именно координате - зависит от найденного направления градиента. Для каждого блока путём конкатенации четырёх векторов, соответствующих четырём входящим в блок ячейкам, формируется вектор размерности 36 и затем нормируется. Соединяя полученные со всех 105 блоков вектора в один длинный вектор, состоящий из 3780 элементов, получим описание изображения через 3780 HOG-признаков. Таким образом, каждому обучающему изображению соответствует точка в 3780-мерном пространстве признаков, которой, в свою очередь, соответствует значение «пешеход» (+1) или «не пешеход» (-1).

На втором этапе работы алгоритма с помощью метода опорных векторов [15] между точками двух классов строится разделяющая гиперплоскость - решающая поверхность. Поиск пешеходов на тестовом изображении с помощью обученного классификатора осуществляется методом бегущего окна, приводимого с помощью масштабирования к стандартному разрешению 64^128, и вычислением HOG-признаков внутри каждого окна. В зависимости от вычисленных признаков классификатор решает, является или нет область, покрываемая окном детектора, изображением пешехода.

Модифицированный алгоритм

Многие исследователи пытаются улучшить качество и скорость работы алгоритма Далала-Триггса путём замены алгоритма классификации на основе МОВ алгоритмом бустинга [16]. При этом подходы к выбору слабых классификаторов, используемых в цепочке формирования сильного, могут значительно отличаться. Так, например, в работе [14] роль слабых классификаторов играли деревья принятия решения. В данной работе в качестве слабых классификаторов выбраны линейные машины опорных векторов, которые переобучались на сложных примерах. Для этого в тестовой выборке отбирались те части изображений, на которых детектор на основе алгоритма Далала-Триггса дал неверные ответы. Эти сложные примеры приводились к стандартному разре-

шению окна детектора 64*128 путём масштабирования. В процессе обучения финального классификатора модифицированного алгоритма акцент делается именно на эти сложные эталоны, которые распознаются хуже.

Рассмотрим подробнее процесс формирования классификатора модифицированного алгоритма. Исходная обучающая выборка, использованная для обучения детектора Далала-Триггса, состояла из М изображений (х7, у7), характеризуемых вектором HOG-признаков xj и принадлежностью к классу «пешеходов» у е {-1; 1}. К обучающей выборке добавлялось N изображений, на которых детектор Далала-Триггса дал некорректные ответы. Выбранные из базы для контрольной выборки изображения в последующем исключались из тестовой выборки. Так формируется новая база из М + N изображений для обучения классификатора с помощью алгоритма на основе бу-стинга [16] с изначальными весами, инициализированными следующим образом:

А (0 = ТГТ^ТГ при 7 = 1.. .М

и А(0 = -

M + kN k

при 7 = М + 1...М + N ,

М + Ш

где к - коэффициент усиления сложных примеров, выбираемый эмпирически.

Затем производится поиск слабого классификатора к (х), разделяющего объекты классов «пешеход» и «не пешеход» согласно минимуму взвешенной ошибки е^:

М+N -,

К(х) = argmin е} = £ А(0|у ф к] (х1)].

к! еН

i =1

Аналогичным образом производится поиск еще Т -1 классификаторов. При этом на каждой стадии t = 1...Т поиска слабого классификатора происходит изменение весов объектов А (7) согласно соотношению

А (7)ехр(-^уА(х))

Dt+i(i) = -

где а( - коэффициент точности слабого классификатора к (х), вычисляемый на основе ошибки, выдаваемой этим классификатором

at = — ln

t 2

'1" О

Jt j

а 2, - нормировочный коэффициент, выбранный таким образом, чтобы совокупность весов А+1(0 удовлетворяла соотношению

M+N

I Dt+i(0 = 1.

i=1

Изменение весов объектов происходит таким образом, что ошибки слабого классификатора предыдущей стадии получают больший вес на новой стадии, правильно обнаруженные объекты - меньший. Изменение весов объектов и процесс формирования новых слабых классификаторов на примере объектов в двумерном пространстве признаков иллюстрируются на рис. 1.

Итоговый сильный классификатор H (х), который будет формировать решающую поверхность в пространстве HOG-признаков, строится в виде линейной комбинации всех слабых классификаторов ht (х):

( t \

H (х) = sign 1atht (х) V t=1 j

Оценка качества работы детектора

Качество работы детектора оценивается на тестовом наборе изображений, который не используется при обучении. Для численной оценки качества работы детекторов вводятся такие характеристики, как полнота и точность [17]. Для некоторой тестовой выборки полнота и точность вычисляются согласно следующим формулам:

ITP

полнота = ^-,

IGT

где IGT - истинное число пешеходов в выборке; I TP - число верно обнаруженных пешеходов;

ITP

точность = -,

IDET

где IDET - общее число срабатываний детектора, определяемое в виде суммы верных и ложных обнаружений I DET = ITP + IFP .

в)

Рис. 1. Формирование слабых классификаторов в процедуре бустинга: а) для объектов с равными весами; б, в) для объектов с увеличенным весом ошибок предыдущего классификатора

Достаточно хорошо качество работы детектора в виде одной величины характеризует среднее гармоническое точности и полноты, или F-мера [17], определяемая как

F - мера = -

2

1

- + -

1

полнота точность

При большом отличии усредняемых значений F-мера приближается к наименьшему из них. Это позволяет избежать необоснованных завышений оценки в ситуациях, когда одна из величин близка к нулю, а другая к единице.

Методика тестирования

Проведём сравнение алгоритма Далала-Триггса и модифицированного алгоритма. В качестве дополнительного участника сравнения возьмём алгоритм Виолы-Джонса [5], использующий хааровские признаки и бустинг. Для анализа работы алгоритмов использовалось две базы изображений:

1. INRIA Person Dataset [18] - набор тестовых изображений со средним разрешением 640x480, снятых статичной камерой (рис. 2);

2. CVC-02 Pedestrian Dataset [19] - набор тестовых изображений, полученных из видеопоследовательности с разрешением 640x480, снятой с помощью видеорегистратора автомобиля (рис. 3).

Из базы INRIA Person для тестирования обученных каскадов было отобрано 200 изображений. На каждом из них вручную подсчи-тывалось количество фигур пешеходов, пригодных для детектирования, количество верных обнаружений каждого детектора и количество ложных срабатываний классификаторов. Аналогичным образом из базы CVC-02

Pedestrian было взято 400 изображений, на которых с помощью исследуемых алгоритмов выделялись и подсчитывались правильно и неправильно выделенные пешеходы. Затем данные по всем изображениям суммировались и обобщались.

После тестирования алгоритмов на незашу-мленных изображениях была смоделирована ситуация их работы в условиях аддитивного белого гауссовского шума (АБГШ) с плотностью вероятности

1 (z-/

p(z) = e 2а ,

-42ла

где y - математическое ожидание случайной величины z, определяющей интенсивность шумового воздействия; а - среднеквадрати-ческое отклонение (СКО).

К тестовым изображениям из базы INRIA Person добавлялся АБГШ с нулевым математическим ожиданием /и = 0 и различными СКО. Значения СКО менялись в интервале от 0 до 50 с шагом 5. Затем на изображениях проводилось детектирование пешеходов с помощью алгоритма Далала-Триггса и модифицированного алгоритма. Детектор Виолы-Джонса был исключён из тестирования, так как показал неудовлетворительные результаты уже на незашумленных изображениях.

Рис. 2. Примеры изображений из базы INRIA Person

Рис. 3. Примеры изображений из базы CVC-02 Pedestrian

Результаты тестирования

Проведённый эксперимент на изображениях из базы INRIA показал значительный перевес алгоритмов, которые используют вектор HOG-признаков для описания изображения, над алгоритмом, использующим хааровские признаки. Модификация алгоритма Далала-Триггса позволила увеличить полноту на 9 %, а точность на 10 % в сравнении с оригинальным алгоритмом. Результаты детектирования, полученные по итогам эксперимента, приведены в таблице 1.

Таблица 1. Сравнительный анализ работы детекторов на изображениях из базы INRIA Person

В случае с видеопоследовательностями алгоритм Виолы-Джонса даёт близкую к нулю степень обнаружения пешеходов (таблица 2), что показывает неэффективность применения системы хааровских признаков в задачах детектирования пешеходов. Столь низкий результат объясняется особенностями базы CVC-02 Pedestrian, на изображениях которой пешеходы редко оказываются обращенными лицом или спиной к камере, а хааровские признаки хорошо подходят только для описания фронтально расположенных к камере пешеходов. Кроме того, качество изображений на кадрах с видеорегистратора оказывается заметно хуже качества изображений, полученных со статичной камеры, что критично сказывается на работе всех рассматриваемых детекторов. Модифицированный алгоритм демонстрирует значительно более высокую точность работы (91 % против 65 %), чем алгоритм Далала-Тригса, за счет переобучения исходного классификатора на ложных отрицательных срабатываниях детектора в области фона, но при

этом требует больше времени для обучения и настройки. Данные по полноте, точности и F-мере исследуемых алгоритмов на изображениях из базы CVC-02 Pedestrian приведены в таблице 2.

Таблица 2. Сравнительный анализ работы детекторов на изображениях из базы CVC-02 Pedestrian

Результаты работы алгоритма Далала-Триггса и модифицированного алгоритма на изображениях базы INRIA Person в условиях наличия АБГШ с нулевым математическим ожиданием / = 0 приведены на рис. 4.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Модифицированный алгоритм на базе бу-стинга оказывается более устойчивым к АБГШ, что особенно заметно на средних степенях зашумления о = 10-20, что соответствует изображениям, получаемым в практических приложениях.

Заключение

Проведённое исследование показало высокую эффективность алгоритмов детектирования, использующих HOG-признаки. На изображениях из тестовой базы INRIA Person полнота обнаружения пешеходов этими алгоритмами составила 55-70 % при точности до 93 %. На изображениях из тестовой базы CVC-02 Pedestrian полнота детектирования оказалась около 25 % при точности 90 %. Модификация алгоритма Далала-Триггса с использованием классификатора на базе бустинга и переобучения на сложных примерах позволила значительно повысить точность детектирования (с 83 % до 93 % для базы INRIA Person и с 65 % до 91 % для базы CVC-02 Pedestrian). Удалось достичь некоторого увеличения полноты детектирования (с 57 % до 67 % для базы INRIA Person и с 25 % до 26 % для базы CVC-02 Pedestrian). Кроме того, модифицированный алгоритм показывает большую устойчивость к искажениям на изображении в виде АБГШ.

Детектор Полнота, % Точность, % F-мера, %

Алгоритм Виолы- 27 62 38

Джонса

Алгоритм Далала- Триггса 57 83 68

Модифицированный 66 93 77

алгоритм

Детектор Полнота, % Точность, % F-мера, %

Алгоритм Виолы-Джонса 3 50 6

Алгоритм Да-лала-Триггса 25 65 36

Модифициро-

ванный алго- 26 91 40

ритм

Г--------------- Г> 1 1 1 Алг. Далала-Триггса —•-- Модифицированный алг.

\ \

N

- V t -- h-f-1

10 20 30 40

о

а) полнота

— Алг. Далала-Триггса 1— Модифицированный алг.

50

40 "50

б) F-мера

Рис. 4. Зависимость уровня детектирования от СКО гауссовского шума для алгоритма Далала-Триггса и модифицированного алгоритма

Литература

1. Лукьяница А.А., Шишкин А.Г. Цифровая обработка видеоизображений. - М.: Ай Эс Эс Пресс,

2009. - 518 с.

2. Geronimo D., Lopez A.M., Sappa A.D., Graf T. Survey of Pedestrian Detection for Advanced Driver Assistance Systems // IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 32, no. 7,

2010. P. 1239-1258.

3.Oren M., Papageorgiou C., Sinha P., Osuna E., Poggio T. Pedestrian detection using wavelet templates // Conference on Computer Vision and Pattern Recognition (CVPR), 1997. P. 193-199.

4. Papageorgiou C, Poggio, T. A trainable system for object detection // International Journal of Computer Vision, 38(1), 2000. P. 15-33.

Поступила 27 июля 2014 г.

5. Viola P., Jones M. Rapid objects detection using a boosted cascade of simple features // Conference on Computer Vision and Pattern Recognition (CVPR), 2001. Р. 511-518.

6. Приоров А.Л., Игнатов И.С., Голубев М.Н., Хрящев В.В. Разработка и анализ алгоритмов выделения лиц на изображениях // Проектирование и технология электронных средств. 2008. № 2. С. 58-62.

7. Lowe D. Distinctive image features from scale invariant keypoints // International Journal of Computer Vision, 60(2), 2004. P. 91-110.

8. Dalal N., Triggs B. Histograms of oriented gradients for human detection // Conference on Computer Vision and Pattern Recognition (CVPR), 2005. P. 886-893.

9. Shashua A., Gdalyahu Y., and Hayon G. Pedestrian detection for driving assistance systems: Singleframe classification and system level performance // IEEE Intelligent Vehicles Symposium, 2004. P. 1-6.

10. Dalal N., Triggs B., Schimid C. Human detection using oriented histograms of flow and appearance// European Conference on Computer Vision (ECCV), 2006. P. 428-441.

11. Zhu Q., Avidan S., Yeh M.C., Cheng K.T. Fast human detection using a cascade of histograms of oriented gradients // Conference on Computer Vision and Pattern Recognition (CVPR), 2006. P. 1491-1498.

12. Mikolajczyk K., Schmid C., and Zisserman A. Human detection based on a probabilistic assembly of robust part detectors // European Conference on Computer Vision (ECCV), 2004. P. 69-82.

13. Dollar P., Wojek C., Schiele B., Perona P. Pedestrian detection: a benchmark // Conference on Computer Vision and Pattern Recognition (CVPR), 2009. Р. 304-311.

14. Казаков А., Бовырин А. Быстрый алгоритм обнаружения пешеходов по видеоданным // International Conference on Computer Graphics and Vision, GraphiCon, 2012. Р. 144-148.

15. Cortes C., Vapnik V. Support-Vector Networks// Machine Learning, 20, 1995. P. 273 297.

16. Freund Y., Schapire R.E. A short introduction to boosting // Journal of Japanese Society for Artificial Intelligence, 14(5):771-780, September, 1999.

17. Olson D.L., Delen D. Advanced data mining techniques. - Berlin: Springer-Verlag, 2008. - 180 p.

18. INRIA Person Dataset (http://pascal.inrialpes.fr/data/human/).

19. Datasets. Advanced Driver Assistance Systems// Computer Vision Center, Universitat Autonoma de Barcelona, Spain (http://www.cvc.uab.es/adas/site/?q=node/7).

=English

Analisis and modification of algorithms for pedestrian detection in digital images

Andrey Leonidovich Priorov - Doctor in Engineering, Associate Professor Yaroslavl State University named after P.P. Demidov. E-mail: andcat@yandex.ru.

0

о

Vladimir Vyacheslavovich Hryashchev - Candate of Engineering, Associate Professor Yaroslavl State University named after P.P. Demidov. E-mail: vhr@yandex.ru.

Anatoly Evgenyevich Nikitin - Post-graduate student Yaroslavl State University named after P.P. Demidov. E-mail: anatolynikitinyar@gmail.com.

Dmitry Vyacheslavovich Matveev - Post-graduate student Yaroslavl State University named after P.P. Demidov. E-mail: dcslab@uniyar.ac.ru.

Address: 150000, Yaroslavl, ulitsa Sovietskaya, 14.

Abstract: The algorithms of pedestrian detection in digital images are widely used when developing video observation complexes, systems assisting a driver on the road, algorithms of computer vision and when searching images in the Internet. The existing techniques of pedestrian detection are mainly based on the image description with the help of various features. The algorithm of Dalal-Triggs demonstrates one of the best results among known algorithms of pedestrian demodulation. It uses histograms of oriented gradients as the features and the method of reference vectors as the classifier. Modification of Dalal-Triggs detector is done by substituting the method of reference vectors with the algorithm of boosting with initial weights initialized for increasing influence of complex examples. The modification of Dalal-Triggs algorithm allowed to improve accuracy (from 83 % to 93 % for images from INRIA Person base and from 65 % to 91 % for CVC-02 Pedestrian base) and completeness of detection (from 57 % to 66 % for images from INRIA Person base and from 25 % to 26 % for CVC-02 Pedestrian bases) of the original algorithm. The comparative operational analysis of the algorithms on the uniform test bases in the conditions of presence of additive white Gaussian noise in the images is conducted. The modified algorithm demonstrated larger stability to interferences of this kind.

Key words: engineering vision, pedestrian detection, method of reference vectors, Dalal-Triggs detector.

References

1. LukyanitsaA.A., ShishkinA.G. Digital processing of video images. M.: Aj Jes Jes Press, 2009. 518 p.

2. Geronimo D., Lopez A.M., Sappa A.D., Graf T. Survey of Pedestrian Detection for Advanced Driver Assistance Systems. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 32, no. 7, 2010. P. 1239-1258.

3.Oren M., Papageorgiou C., Sinha P., Osuna E., Poggio T. Pedestrian detection using wavelet templates. Conference on Computer Vision and Pattern Recognition (CVPR), 1997. P. 193-199.

4. Papageorgiou C., Poggio, T. A trainable system for object detection//International Journal of Computer Vision, 38 (1), 2000. P. 15-33.

5. Viola P., JonesM. Rapid objects detection using a boosted cascade of simple features. Conference on Computer Vision and Pattern Recognition (CVPR), 2001. P. 511-518.

6. Priorov A.L., IgnatovI.S., GolubevM.N., Hrjashhev V.V. Development and analysis of algorithms for recognition of faces in the images. 2008. № 2. P. 58-62.

7. Lowe D. Distinctive image features from scale invariant key points. International Journal of Computer Vision, 60 (2), 2004. P. 91-110.

8. Dalal N., Triggs B. Histograms of oriented gradients for human detection. Conference on Computer Vision and Pattern Recognition (CVPR), 2005. P. 886-893.

9. Shashua A., Gdalyahu Y., and Hayon G. Pedestrian detection for driving assistance systems: Single-frame classification and system level performance. IEEE Intelligent Vehicles Symposium, 2004. P. 1-6.

10. Dalal N., Triggs B., Schimid C. Human detection using oriented histograms of flow and appearance. European Conference on Computer Vision (ECCV), 2006. P. 428-441.

11. Zhu Q., Avidan S., Yeh M.C., Cheng K.T. Fast human detection using a cascade of histograms of oriented gradients. Conference on Computer Vision and Pattern Recognition (CVPR), 2006. P. 1491-1498.

12. Mikolajczyk K., Schmid C., and Zisserman A. Human detection based on a probabilistic assembly of robust part detectors. European Conference on Computer Vision (ECCV), 2004. P. 69-82.

13. Dollar P., Wojek C., Schiele B., Perona P. Pedestrian detection: benchmark. Conference on Computer Vision and Pattern Recognition (CVPR), 2009. P. 304-311.

14. Kazakov A., Bovyrin A. Fast algorithm of pedestrian detection by video data. International Conference on Computer Graphics and Vision, GraphiCon, 2012. P. 144-148.

15. Cortes C., Vapnik V. Support-Vector Networks. Machine Learning, 20, 1995. P. 273 297.

16. Freund Y., Schapire R.E. A short introduction to boosting. Journal of Japanese Society for Artificial Intelligence, 14 (5):771-780, September, 1999.

17. Olson D.L., Delen D. Advanced data mining techniques. Berlin: Springer-Verlag, 2008. 180 p.

18. INRIA Person Dataset (http://pascal.inrialpes.fr/data/human/).

19. Datasets. Advanced Driver Assistance Systems//Computer Vision Center, Universitat Autonoma de Barcelona, Spain (http://www.cvc.uab.es/adas/site/?q=node/7).

i Надоели баннеры? Вы всегда можете отключить рекламу.