УДК 681.326
НОВЫЙ МЕТОД ДЕТЕКТИРОВАНИЯ ОБРАЗОВ
ГРЕБНОВ И.В., асп.
Предлагается новый метод для детектирования образов, протестированный на тестовом наборе CMU/MIT.
Ключевые слова: метод машинного зрения, детектирование образа, анизотропные гауссовые примитивы, классификатор, каскадная модель.
A NEW WAY OF PATTERN DETECTION
I.V. GREBNOV, postgraduate
This paper is devoted to a new way of pattern detection tested at CMU/MIT test vector.
Key words: computer vision means, pattern detection, anisotropic Gaussian primitives, classifier, cascade model.
Введение. Для автоматизации технологических процессов, включая такую богатую приложениями область, как энергетика, в последнее время все шире используются методы машинного зрения. Ключевой при этом является процедура детектирования образов объекта, подлежащего обработке. Цель детектирования образов заключается в обнаружении образа объекта на статическом изображении и расчете его положения (которое, например, может представлять собой ограничивающий прямоугольник). Все последующие этапы обработки, такие как распознавание образа, верификация образа или распознавание формы образа, напрямую зависят от качества работы метода детектирования образов.
В общем случае для детектирования образа исходное изображение просматривается скользящим окном, и для каждой позиции окна метод определяет, является ли этот регион искомым образом или нет. Для детектирования образов разного размера и ориентации такой подход необходимо применять не только к исходному изображению, но и к его измененной копии. В заключительной стадии применяется фильтр, устраняющий множественные и одиночные ложные срабатывания.
Анизотропные гауссовы примитивы. Анизотропные гауссовы примитивы впервые были описаны в работе Реойа[1], где автор предлагает применять их для сжатия изображений и аппроксимации сигналов.
Базовая функция примитивов ф(х,у): Я2 ^ R2 описана в уравнении
ф( х, у) = хе~( Х+у2). (1)
Дополнительно к базовой функции применяются функции преобразования, такие как перенос, поворот, изгиб, сжатие, позволяющие существенно расширить многообразие анизотропных гауссовых примитивов (рис. 1).
с и
Рис. 1. Примеры анизотропных гауссовых примитивов, полученные с помощью разных параметров переноса, поворота, изгиба и сжатия
Данный класс функций имеет ключевую способность хорошо анализировать не только контуры характерных участков образов, но и их градиенты.
Причем, в отличие от прямоугольных примитивов Хора [2], способность к анализу контуров не ограничена только прямыми линиями на изображении.
Простой классификатор на основе анизотропного гауссова примитива строится следующим образом: Г1,Ь(I) <0,,
Ь(I) = Г ЛУ " (2)
Л> 1-1, Ь (I) >0,-,
где I - сигнал анализируемого региона; параметр 0| выбирается исходя из правила Байеса; функция 1(1) представляет собой скалярное произведение классифицируемого региона и функции анизотропного гауссова примитива:
Ь (I) = УФ/ (х, У )1 (х, У )^У. (3)
Конечно, сам по себе такой простой классификатор не может обеспечивать качественного детектирования образов. Назовем такой классификатор слабым. Для достижения более высокого качества детектирования необходимо объединить несколько таких слабых классификаторов в совокупность. Назовем такую совокупность сильным классификатором.
В результате экспериментов с различными вариантами объединения слабых классификаторов в сильный было установлено, что наилучший результат достигается при их линейном объединении с весовыми коэффициентами. В окончательном варианте сильный классификатор, состоящий из анизотропных гауссовых примитивов, предлагаемый как метод детектирования образов, представлен в уравнении м
\Wmhm()
Hm (I ) =
M
m=1
M
M
m=1
(4)
wn
В качестве алгоритма построения такого сильного классификатора предлагается использовать алгоритм AdaBoost [3]. Это итерационный алгоритм, на каждом шаге которого слабый классификатор добавляется в сильный путем взвешенного линейного смешивания. Смешивание классификаторов производится в целях минимизации целевой функции. В нашем случае мы будем использовать функцию ошибки детектирования на некотором тестовом наборе.
Следует заметить, что при детектировании образов возникающие ошибки можно разбить на два класса: ошибки ложного детектирования и ошибки пропуска искомых образов. В зависимости от поставленной задачи по распознаванию образов одна из ошибок мо-
© ГОУВПО «Ивановский государственный энергетический университет имени В.И. Ленина»
жет быть более важной, чем другая. В этом случае в алгоритме AdaBoost [3] следует изменить функцию ошибки, добавив весовые коэффициенты.
Объединение сильных классификаторов в каскадную модель. При объединении слабых анизотропных классификаторов в один большой сильный классификатор детектирующая способность повышается, но при этом повышается и время принятия решения. В некоторых случаях время, помимо качества распознавания, является ключевым фактором. Для этого случая предлагается построить каскадную модель из небольших сильных классификаторов, позволяющую повысить скорость детектирования, не ухудшая качество.
Каскадная модель сильных классификаторов -это вырожденное дерево принятия решений, где каждый узел дерева построен таким образом, чтобы детектировать почти все интересующие образы и отклонять некоторую часть регионов, не являющуюся образами. Помимо этого, узлы дерева размещены таким образом, что чем ближе узел находится к корню дерева, тем из меньшего количества анизотропных гауссовых примитивов он состоит и тем самым требует меньшего времени на принятие решения. Данный вид каскадной модели хорошо подходит для обработки изображений, на которых общее количество детектируемых образов мало. В этом случае метод может быстрее принять решение о том, что данный регион не содержит образ, и перейти к следующему.
Результаты экспериментов. Тестирование производилось на специализированном тестовом наборе CMU/MIT Test sеt [4]. Этот набор состоит из 130 изображений, содержащих в общей сложности 507 образов. В качестве оппонента был выбран алгоритм Viola & Jones [2], построенный на прямоугольных примитивах Хора. Данный алгоритм считается лучшим универсальным алгоритмом детектирования образов.
В первом эксперименте было проанализировано качество детектирования анизотропных гауссовых примитивов и стандартных прямоугольных примитивов Хора в составе одного сильного классификатора (рис. 2).
Рис. 2. Зависимость качества детектирования образов от размера сильного классификатора
Результаты эксперимента показывают, что ошибка детектирования резко уменьшается с увеличением размера сильного классификатора. Но для прямоугольного классификатора Хора ошибка детек-
Гребнов Илья Викторович,
ГОУВПО «Ивановский государственный энергетический
аспирант,
телефон (4932) 26-98-29.
тирования перестает уменьшаться при достижении критического размера в 100 слабых классификаторов.
Дополнительно была проанализирована гибкость метода в зависимости от целевого значения ошибки ложного детектирования (рис. 3).
Ложна в детстнрос анис ; ;,
Рис. 3. Зависимость гибкости метода от целевого значения ошибки ложного детектирования
В заключительном эксперименте было проанализировано качество детектирования анизотропных гауссовых примитивов в составе каскадной модели сильных классификаторов (рис. 4). Результаты экспериментов позволяют сделать вывод о том, что предлагаемый нами метод превосходит метод, построенный на прямоугольных примитивах Хора.
Метод Качество детектирования, %
Мой метод 93,90
Viola & Jones[4] 91,40
Рис. 4. Тестирование методов детектирования образов Заключение
Новый метод детектирования образов объединяет две идеи: использование совокупности анизотропных гауссовых примитивов и объединение полученных совокупностей в каскадную модель для увеличения скорости без ухудшения качества. Предложенный метод был протестирован на стандартном тестовом наборе CMU/MIT Test Бе1 [4] и превзошел по качеству детектирования все известные методы.
Список литературы
1. Peotta L., Granai L., and Vandergheynst P. Very low bit rate image coding using redundant dictionaries // in Proceedings of the SPIE, Wavelets: Applications in Signal and Image Processing X. SPIE, November 2003, vol. 5207, pp. 228-239, SPIE.
2. Paul Viola and Michael J. Jones. Robust real-time face detection // Int. J. Comput.Vision. - 2004. - Vol. 57. - No. 2. -Р. 137-154.
3. Yoav Freund and Robert E. Schapire. A decision-theoretic generalization of on-line learning and an application to boosting // J. Comput. Syst. Sci. - 1997. - Vol. 55. - No. 1. -Р. 119-139.
4. Henry A. Rowley, Shumeet Baluja, and Takeo Kanade. Neural network-based face detection // IEEE Transactions on Pattern Analysis and Machine Intelligence. - 1998. - Vol. 20. - No. 1. -Р. 23-38.
университет имени В.И. Ленина»,
© ГОУВПО «Ивановский государственный энергетический университет имени В.И. Ленина»