Научная статья на тему 'Метод улучшения алгоритма freak: Fast Retina Keypoint'

Метод улучшения алгоритма freak: Fast Retina Keypoint Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
508
104
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АДАПТИВНЫЙ / РАСПОЗНАВАНИЕ ОБРАЗОВ / ЦИФРОВАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ / FREAK / ADAPTIVE / PATTERN RECOGNITION / DIGITAL IMAGE PROCESSING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Нургатин А. Р.

На данный момент существует множество методов обнаружения объектов на изображении, к примеру метод FREAK. Однако практически все эти методы основаны на вычислении свертки с определенным паттерном. Такой подход ведет к существенному возрастанию объема вычислений при увеличении размеров исходной сцены, что делает его малоприменимым в системах реального времени и ограниченных вычислительных мощностях. В статье предлагается метод улучшения алгоритма FREAK, позволяющий снизить вычислительные нагрузки без ущерба точности. Для данного метода также показаны результаты тестирования, демонстрирующие его применимость.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Adaptive method for FREAK : Fast Retina Keypoint

In recent years, have been developed exact algorithms to identify objects in images. These include the scheme offers by Viola and Jones. However, as with all of the algorithms based on window-scanning the size of screen grows computational costs increase too. The paper proposes a method of increasing the speed without sacrificing accuracy. Also this paper demonstrate the effectiveness of the proposed algorithm.is used. Design of hypercubes dimensions and measures are discussed. The approach is illustrated on an example of multidimensional activity model for dissertational councils of scholar institution.

Текст научной работы на тему «Метод улучшения алгоритма freak: Fast Retina Keypoint»

ISSN 1992-6502 (P ri nt)_

2015. Т. 19, № 1 (67). С. 251-253

Ъыьмт QjrAQnQj

ISSN 2225-2789 (Online) http://journal.ugatu.ac.ru

УДК 004.932.2

Метод улучшения алгоритма FREAK: Fast Retina Keypoint

а. р. Нургатин

nurgatin@csu.ru

ФГБОУ ВПО «Челябинский государственный университет» (ЧелГУ) Поступила в редакцию 15 октября 2014 г.

Аннотация. На данный момент существует множество методов обнаружения объектов на изображении, к примеру метод FREAK. Однако практически все эти методы основаны на вычислении свертки с определенным паттерном. Такой подход ведет к существенному возрастанию объема вычислений при увеличении размеров исходной сцены, что делает его малоприменимым в системах реального времени и ограниченных вычислительных мощностях. В статье предлагается метод улучшения алгоритма FREAK, позволяющий снизить вычислительные нагрузки без ущерба точности. Для данного метода также показаны результаты тестирования, демонстрирующие его применимость.

Ключевые слова: FREAK; адаптивный; распознавание образов; цифровая обработка изображений.

На сегодняшний день метод FREAK является одним из самых быстрых алгоритмов решения задачи обнаружения объектов на сцене. Как и большинство алгоритмов в этой области в частности, и в области цифровой обработки изображений он использует сканирующее окно [1, 2]. Это ведет к увеличению объема требуемых вычислений с увеличением размера обрабатываемого изображения, что не хорошо при обработке в реальном времени [3]. В статье предлагается эффективный подход решения данной проблемы без потери точности.

ОПИСАНИЕ АЛГОРИТМА FREAK

В алгоритме FREAK предлагается использовать распределение, аналогичное сетчатке глаза, в которой размер просматриваемого окна увеличивается при удалении от центра. Плотность точек при этом падает экспоненциально при удалении от центра [1]. Для снижения чувствительности к шуму каждая окрестность точки, соответствующей нервной клетке, должна быть сглажена. BRIEF и ORB используют одно ядро сглаживания для разных окрестностей [4, 5]. По аналогии с сетчаткой предлагается использовать разные ядра сглаживания как в алгоритме BRISK. Разница с BRISK в экспоненциальном росте радиусов окрестностей и перекрывании полей [6].

Каждый круг на Рис. 1 представляет собой стандартное отклонение гауссова ядра, применяемого к соответствующим точкам выборки.

Рис. 1. Окрестности и их паросочетания для построения дескриптора

Не трудно заметить, что наличие перекрывающихся окрестностей увеличивает производительность. Стоит также отметить, что избыточность окрестностей приводит к увеличению вероятности верного срабатывания. Для построения бинарных дескрипторов Е используется пороговая разница между парами рецептивного поля с соответствующими им ядрами Гаус-сиан [1]. Другими словами, Е представляет собой двоичные строки, формируемые с помощью последовательности однобитовых разниц по Гауссу

^ 2аТ(Ра),

О <а<ЛГ

где Ра - пары рецептивных полей, N - выбранный размер дескриптора,

где /(Ра^1) - сглаженная яркость поля Р.

252

ИНФОРМАТИКА, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И УПРАВЛЕНИЕ

Авторы алгоритма предлагают некоторые наборы пар, сопоставив средние яркости которых, можно построить бинарный вектор, описывающий особую точку [1]. После чего вопрос поиска соответствий сводится к вопросу поиска минимальных расстояний между векторами признаков.

АДАПТИВНЫЙ МЕТОД СКАНИРОВАНИЯ ДЛЯ АЛГОРИТМА FREAK

В алгоритме FREAK окно двигается c фиксированным шагом А. Предлагается использовать различные размеры шага по оси x и у: АХ AY. В случае АХ = AY, будем по-прежнему использовать обозначение А. Шаг сканирования влияет как на точность обнаружения, так и на пропускную способность. С увеличением шага уменьшается вероятность ложного срабатывания в однородных областях. Также возможно увеличение скорости работы алгоритма за счет увеличения шага сканирования в тех областях, где объект отсутствует. В существующих реализациях размер шага, как правило, выбирается А = 1 или А = 2 [7]. Для примера в качестве объекта возьмем человеческое лицо, как достаточно часто встречающуюся задачу для систем реального времени [8].

Назовем ступенью выхода этап, на котором отвергается данное окно (в частном случае номер классификатора в каскаде). На Рис. 2 представлено графическое представление ступени выхода: чем большее значение она имеет, тем большее значение записывается в синий канал. Легко заметна взаимосвязь наличия лица в области изображения и ступени выхода.

Данный подход позволяет увеличивать размер шага при малых значениях ступени выхода и увеличивать его при приближении к объекту поиска. Также данный подход позволяет избе-

жать дополнительных расходов на нормализацию подокна. Данная нормализация необходима для минимизации влияния различных условий освещения в методе FREAK.

Рис. 3. Различные А

На Рис. 3 рассмотрен постоянный шаг АХ = 2 или АХ = 3. Видно, что детектор не в состоянии разместить окно в локальном максимуме, в отличие от адаптивного шага А.

На каждом шаге свертки запускается классификатор, возвращающий ступень отсечения. Искомый объект считается найденным, в случае если ступень отсечения совпадает с числом классификаторов. Результатом является положение и размер текущего окна.

РЕЗУЛЬТАТЫ

Эксперименты проводились на четырехъя-дерном Intel Core i7 с тактовой частотой 2.2 ГГц. Использовалась база лиц CMU+MIT.

Реализованы статический (АХ и AY постоянны и равны 1, 2 или 3) и динамический (АХ и AY уменьшаются при приближении к локальному максимуму) подходы.

Для сравнения получаемых результатов используются следующие метрики [3]:

TP TP

recall = ———, precision = ———, TP + FN F TP + FP

А. Р. Нургатин • Метод улучшения алгоритма FREAK : Fast Retina Keypoint

253

где ТР - число правильно определенных объектов; БК - число пропущенных объектов; БР - количество ложных срабатываний. Для удобства введем метрику ^ - средневзвешенное отзыва и точности:

F, = 2

precision х recall precision + recall

Полученные результаты сравниваются в па-ретовском смысле [9] (рис. 4).

0.26

0.15

0.1

0.06

+ Adapt + Slate OpenCV 1 • Deiijn point ««ample

fr j

__ T —; § *4"

V, %.......; A. +

О 01 02 03 О* 05 0« 07

HFI-ncmv)

Рис. 4. Результаты сравнения для метрики Fx

ЗАКЛЮЧЕНИЕ

В статье используется адаптивное сканирующее окно для улучшения процесса обнаружения объекта алгоритмом FREAK. Представлены результаты для реализации детектора лиц FREAK, но данная оптимизация может быть применена для любого алгоритма обнаружения объектов, в котором используются сканирующее окно и каскадный классификатор. По сравнению с существующими, адаптивный подход обеспечивает лучшие показатели в пространстве recall / precision, что особенно важно для систем реального времени. При захвате изображения с видео может быть принята во внимание также и временная неоднородность для еще большего снижения объема вычислений.

СПИСОК ЛИТЕРАТУРЫ

1. C. Zhang, Z. Zhang, A survey of recent advances in face detection. Technical report MSR-TR-2010-66, 2010.

2. M. Calonder, at al. "BRIEF: Binary Robust Independent Elementary Features Lausanne," in Pattern Analysis and Machine Intelligence, IEEE Transactions, vol. 34, pp. 12811298, 2011.

3. S. Leutenegger, M. Chli, and R. Y. Siegwart, "BRISK: Binary Robust Invariant Scalable Keypoints," in Proc. Computer Vision (ICCV) IEEE Int. Conf. (Barcelona, Nov. 6-13, 2011), pp. 2548-2555.

4. A. Alahi, R. Ortiz, P. Vandergheyns, "FREAK: Fast Retina Keypoint," in Proc. Computer Vision and Pattern Recognition (CVPR), IEEE Conf. (Providence, June 16-21, 2012), pp. 510-517.

5. E. Rublee, at al., "ORB: an efficient alternative to SIFT or SURF," in Proc. Computer Vision (ICCV) IEEE Int. Conf. (Barcelona, Nov. 6-13, 2011), pp. 2564-2571.

6. J. Cho B. Benson, S. Mirzaei, R. Kastner, "Parallelized architecture of multiple classifiers for face detection," in Proc. Application-specific Systems, Architectures and Processors (ASAP 2009). 20th IEEE Int. Conf. (Boston, Jul. 7-9, 2009), pp. 75-82.

7. T. Phan, S. Sohon, D. M. Chandler. "Performance-Analysis-Based Acceleration of Image Quality Assessment," in Proc. Image Analysis and Interpretation (SSIAI), (Santa FE, April 22-24, 2012), pp 81-84.

8. Кини Р. Л., Райфа Х. Принятие решений при многих критериях: предпочтения и замещения. М.: Радио и связь, 1981. [[ R. L. Kini, H. Raifa, Decision-making in multi-criteria: preferences and substitution, (in Russian). Moscow: Radio i Sviaz, 1981. ]]

9. Гонсалес Р., Вудс Р. Цифровая обработка изображений. М.: Техносфера, 2012. [[ R. Gonzalez, R. Woods. Digital image processing, (in Russian). Moscow: Technosfera, 2012. ]]

ОБ АВТОРЕ

НУРГАТИН Антон Ренатович, асп. каф. информационных технологий. М-р мат. и информ. (ЧелГУ, 2012). Готовит дис. о методах распозн. лиц в условиях помех и искажений.

METADATA

Title: Adaptive method for FREAK: Fast Retina Keypoint Authors: A. R. Nurgatin

Affiliation: Chelyabinsk State University (CSU), Russia. Email: nurgatin@csu.ru Language: Russian.

Source: Vestnik UGATU (scientific journal of Ufa State Aviation Technical University), vol. 19, no. 1 (67), pp. 251-253, 2015. ISSN 2225-2789 (Online), ISSN 1992-6502 (Print). Abstract: In recent years, have been developed exact algorithms to identify objects in images. These include the scheme offers by Viola and Jones. However, as with all of the algorithms based on window-scanning the size of screen grows computational costs increase too. The paper proposes a method of increasing the speed without sacrificing accuracy. Also this paper demonstrate the effectiveness of the proposed algorithm.is used. Design of hypercubes dimensions and measures are discussed. The approach is illustrated on an example of multidimensional activity model for dissertational councils of scholar institution.

Key words: FREAK; adaptive; pattern recognition; digital image processing.

About author:

NURGATIN, Anton Renatovich, Postgrad. (PhD) Student, Dept. of Information Technology. Master of Math & Information technology (CSU, 2012).

i Надоели баннеры? Вы всегда можете отключить рекламу.